< 정리 >
1. 확률이 결정되었을 때(확률추정)
2. 그 확률로 말미암아 어떤 행동을 할 것인지 판단하고(이때, 행동의 결과를 고려 후 손익비 계산)
3. 그 행동에 대한 헷징은 어떻게 할 것인지(큰 손실 회피)
4. 그리고 그 행동을 비슷한 상황에서 반복(이득 실현)
확률론적 사고란 무엇인가.
정확히 말할 수 있는 건,
단순히 정량적으로 생각한다고 해서 그것이 꼭 확률론적 사고라고 할 수는 없다는 것이다.
확률론적 사고는 불확실한 어떤 현상에 대해 어떻게 대비하고 어떤 행동을 할지 결정하는 것이라고 할 수 있다.
그리고 불행히도 확률과 통계를 배우는 학과 심지어, 통계학과를 나온다고 해도 이러한 사고는 자연스럽게 길러지지 않는 것 같다.
확률론적 사고의 과정
확률론적 사고에는 크게
1) 확률 추정
2) 리스크와 손익 인식 및 대응( '그래서 어떻게 할 것인가')
3) 헷징('혹시 모르니')
4) 장기적 관점
이 네 가지로 이루어져 있고 순서대로 프로세스가 진행된다고 볼 수 있다.
현상은 우리가 어찌하지 못하지만 행동은 우리가 어찌할 수 있다.
1) 확률추정
확률 추정은 말 그대로 주어진 데이터를 보고 어떠한 사건이 일어날지에 대한 확률 자체를 추정하는 것이다.
예를 들어 하늘을 보고 오늘 비가 대략 올 것 같은 느낌이 들고 그 느낌의 정도를 수치화한다면 본능적으로 확률 추정을 한 것이다.
여기서 데이터는 '오늘 하늘의 컨디션(?)'이 될 것이다.
추정에는 크게 빈도주의와 베이지안 두 접근법이 있는데,
빈도주의는 확률의 추정값이 정확히 몇이다! 라고 하나의 값으로 추정하고
베이지안은 확률의 분포를 추정하게 된다.
(데이터가 엄청 크다면, 두 접근법의 차이는 대동소이하게 된다.)
새로운 데이터가 계속 등장한다면, 빈도주의는 계속해서 새롭게 확률을 추정할 것이고, 베이지안은 데이터를 고려하여 사후분포를 추정하게 되고, 이 사후분포가 다시 사전분포가 되어 새로운 데이터를 고려하여 또다시 새로운 사후 분포를 추정하게 된다. (쉽게 말해 데이터를 지속적으로 고려해서 분포가 업데이트된다고 보면 된다.)
위의 오늘 비가 올지 말지에 대한 이야기의 예를 계속해서 사용해보자.
(분포 자체를 텍스트로 표현하긴 어려우니 빈도주의처럼 분포를 확률로 표현한 점은 이해해 주실 거라 믿는다.)
1) 아침에 일어나서 하늘을 보니 비가 내릴 확률이 대략 0.2 정도 되는 것 같다.(사전분포, 간단히 가설이라고 봐도 무방)
2) 그런데 뉴스 예보를 보니 비 올 확률이 80%란다.(데이터 등장)
3) 평소에 뉴스 예보를 얼마나 믿는지에 따라 다르겠지만, 새로운 데이터인 뉴스 예보를 고려해서 오늘 비가 내릴 확률을 0.6으로 업데이트한다. (사후분포 추정)
4) 평소에 뉴스 예보보다 더 믿고 있는 기상청 사이트를 들어가서 예보 정보를 본다. 기상청에도 역시 80%라고 한다. 따라서 오늘 비가 내릴 확률을 0.7로 업데이트한다.(사후분포 추정. 이때의 사전분포는 3)에서 결정한 0.6)
대략 이렇게 확률을 추정하게 된다.
2) 리스크와 손익 인식 및 대응
사실 확률 추정은 누구나 할 수 있고 본능적으로 지금도 하고 있다.
그리고 애초에 현실에서 정확한 확률을 추정하는 건 불가능하다는 걸 인정해야 한다.
현상에 대한 확률을 개인이 조절할 수도 없다.
예측은 어떠한가. 불확실성이 존재하는 상황에서 단 하나의 미래를 미리 정해 놓는다는 것은 말이 안 된다.
애초에 그건 난센스이다.
따라서 '리스크 인식 및 대응'부터 시작되는 그다음의 일련의 과정이 매우 매우 매우 중요하다. 매우!
리스크, 손익비란 무엇인가.
리스크는 한 마디로 '행동의 결과로 인해 나에게 미치는 영향'이라고 할 수 있다.
일단 그것이 좋을지 나쁠지는 나중에 생각하도록 하자.
그 행동을 했을 때 어떨지, 하지 않았을 때 어떨지를 상상해 보자.
손익비는 '행동을 했을 때 내가 얻는 이득과 손실'이라고 보면 된다.
이때, 이득과 손실에 대해 개인이 느끼는 정도의 비율을 손익비라고 한다.
비율 생각하지 말고, 이득과 손실에 대해 생각해 보면 된다.
비율은 개인마다 이득과 손실에 대해 느끼는 정도가 다르다.
정해보자면
1) 행동의 결과가 나에게 미치는 영향을 상상해 보고,
2) 그때의 이득과 손실이 뭘지 고려해 보면 된다.
예를 들어보자.
야식을 먹을지에 대한 리스크와 이득, 손실은 무엇인가.
1) 야식을 먹지 않으면 아무 탈 없이 잠을 잘 잘 수 있다(이득). 그러나 배는 고프다(손실).
2) 야식을 먹으면 건강에 매우 해롭다(손실). 그러나 배는 부르다(이득).
이다.
날씨가 안 좋을 때 우산을 들고나갈지에 대한 리스크와 이득, 손실은 무엇인가.
1) 우산을 들고나가면 비를 맞지 않는다(이득). 그러나 손이 무겁다(손실).
2) 우산을 들고나가지 않으면 비를 맞는다(손실). 그러나 손이 가볍다(이득).
이다.
이제 앞서 말했던 확률도 같이 따져보자.
어떤 현상에 대해 확률을 추정하고 그에 따라 행동을 결정해야 하는 경우에는 조금 더 복잡해진다.
(지금 배가 고픈데 아주 가까운 미래(20분 이내)에 배가 고프지 않을 확률 같은 건 없다.)
앞서 언급했던 비에 대한 건을 계속해서 이야기해 보자.
비 올 확률이 0.7이나 되니까 우산을 들고나간다면,
- 비가 온다면 : 비를 피할 수 있다.(이득)
- 비가 오지 않는다면 : 손이 무거울 것이다.(손해)
비가 오지 않을 확률이 0.3이나 되니까(개인에 따라 크게 느껴질 수도 있다..!) 우산을 들고나가지 않는다면,
- 비가 올 경우 : 비는 피하지 못하겠지만(손실)
- 비가 오지 않을 경우 : 손이 가벼울 것이다. (이득)
3) 헷징
헷징은 한마디로 '(어떤 행동의 결과에 대해 예상되는) 손해를 줄이기 위해 취하는 추가적인 행동'이라고 할 수 있다.
만약 비 올 확률이 0.7이라 우산을 들고나갔지만, 비가 오지 않는다면 손이 무거울 것이다.
여기서 취할 수 있는 헷징은 바로 가벼운 우산을 가져나가는 것이다.
그렇다면, 비가 올 경우 비를 피할 수 있고 비가 오지 않는다고 해도 손이 비교적 가벼울 것이다.
따라서 손해를 아예 입지 않을 순 없지만, 손해를 최소화할 수는 있는 것이다.
만약 비가 오지 않을 확률이 0.3이니까 우산을 들고나가지 않았다가 비가 오게 된다면 비를 맞을 것이다.
여기서 취할 수 있는 헷징은 비가 멈출 때까지 실내에 있다거나 우산을 빌린다거나 하는 등의 행동이 있을 것이다.
역시, 비를 완전히 피하지 못하고, 이동에 제약이 있어 손해를 완전히 입지 않을 순 없지만, 손해를 최소화할 수는 있는 것이다.
4) 장기적 관점(대수의 법칙)
개인의 선호도에 따라 위의 행동 중 한 가지를 결정했다고 하자.
이때, 비슷한 상황에서 비슷한 결정을 계속해서 내리게 된다면,
헷징으로 손해를 최소화하면서 최대한의 이익을 낼 수 있게 된다.
"큰 손해를 막고 자잘한 손해로 헷징 하면서 시행을 늘려 이득을 늘려간다."
이 문장에 도달하려면 위의 과정을 전부 거쳐야 하는 것이다.
실제로 프로 포커플레이어, 유능한 주식, 코인 트레이더들은 이러한 사고방식이
깊숙이 자리 잡았다고 생각할 수 있다. 애초에 불확실성을 다루는 분야는
이러한 사고방식이 없으면 실력을 쌓을 수가 없고 이러한 사고방식을 기계처럼
수행하는 것 자체가 실력이다.
총 정리
Double H & HL을 기억해보자.
즉,
1) 확률 (현상에 대한 확률 추정)
2) 행동 (리스크 인식과 손익비)
3) 헷징 (손실 회피)
4) 장기적 관점 (큰 손실을 줄이고 작은 손실을 겪으며 이득 실현)
'Statistics' 카테고리의 다른 글
표본 분산에 대한 분포와 조건 (feat. 카이제곱분포) (1) | 2024.12.15 |
---|---|
Statistics. 대수의 법칙, 수렴속도와 베이지안 (0) | 2024.08.16 |
Statistics. Random Sample, Data Set (0) | 2024.08.15 |