선택지를 바꿔야 할 때를 결정하는 방법

권석준의 테크어댑팅 인증된 계정 · 첨단과학기술의 최전선을 해설합니다.
2023/05/28
슬롯머신은 라스베가스에 있는 호텔의 카지노에 가면 흔히 볼 수 있는 도박기기입니다. 보통 한 사람이 슬롯머신 앞에 앉아 돈을 넣고 머신의 레버를 당기면 화면에서 다영한 숫자와 기호의 조합이 나오고 그 결과에 따라 넣은 돈보다 더 많은 돈을 따기도, 혹은 잃기도 합니다. 보통의 카지노에서는 이러한 슬롯 머신을 한 개만 두지는 않고, 여러 대를 둡니다. 그리고 한 회사의 머신만 두지 않고 여러 회사의 머신을 섞어서 배치합니다. 사실 대부분의 이용자들은 넣은 돈보다 많이 따는 것은 커녕, 본전도 못 찾기 때문에 이런 슬롯머신은 카지노의 주요 수입원 중에 하나이기도 합니다. 오죽하면 슬롯머신을 외팔이 강도 (one-armed bandit)라고 부르는 별칭이 오래전부터 나왔을 정도죠.

카지노에서는 사실 환수율 (즉, 기대이익/본전의 비율)을 100% 이하로 정해두고, 주기적으로 슬롯머신을 재프로그래밍하기 때문에, 슬롯머신은 카지노 측에 유리한 불공평한 게임이라고 볼 수 있습니다. 그럼에도 불구하고 슬롯머신에서 돈을 잃지 않는 혹은 큰 돈을 버는 경우도 꽤 자주 발생합니다. 어떤 경우는 한 슬롯머신을 고집하고 있다가 운이 맞아 잭팟을 터뜨리는 경우도 있겠지만, 사실 대부분의 경우는 슬롯머신을 적당히 바꿔가며 전략적으로 움직이는 경우가 더 확률이 높다고 알려져 있습니다. (물론 이는 카지노마다 정책이 다르기 때문에 절대적인 것은 아닙니다.) 문제는 이 전략을 어떻게 설계할 것이냐는 것입니다.
그림 1. You never know how close you are (출처: pinterest)

이러한 류의 문제는 컴퓨터과학 혹은 통계학에서 다중슬롯머신 문제 혹은 multi-armed bandit (MAB) 문제라고 부르는 문제입니다. 슬롯머신 문제를 다시 예로 든다면 어떤 사람이 특정한 슬롯머신을 플레이하여 돈을 땄다면/잃는다면 그는 그 슬롯머신을 앞으로 몇 번이나 더 이용해야 하는지를 결정하는 ...
권석준의 테크어댑팅 님이 만드는
차별화된 콘텐츠, 지금 바로 만나보세요.
이미 회원이신가요? 로그인
과학적 사고 방법을 토대로 자연과 사회를 해석합니다. 반도체, 첨단기술, 수학 알고리듬, 컴퓨터 시뮬레이션, 공학의 교육, 사회 현상에 대한 수학적 모델 등에 관심이 있습니다. 지은 책으로는 '반도체 삼국지 (2022)', '호기심과 인내 (2022, 전자책)'가 있습니다.
72
팔로워 3.6K
팔로잉 2