フィッシュ&チップス

カモがチップ背負ってくポーカー日記

GTOの射程

こんにちは。こんばんは。フィッシュ&チップスのフィッシュかもです。

 

皆様ご無沙汰しております。

突然ですが、「サンクトペテルブルクパラドックス」はご存知ですか。

 

サンクトペテルブルクパラドックス 

 

①偏りのないコインを表が出るまで投げ続け、表が出たときに、賞金をもらえる

②もらえる賞金は、1回目に表が出たら1円、1回目は裏が出て2回目に表が出たら倍の2円、2回目まで裏が出ていて3回目に初めて表が出たらそのまた倍の4円。3回目まで裏が出ていて4回目に初めて表が出たらそのまた倍の8円、というふうに倍々に増える

③このゲームには参加費が必要であるとしたら、参加費の金額が何円までなら払っても損ではないと言えるか

 

コインを投げる権利を1回まで担保されているとすると、

1/2の確率で1円がもらえて、1/2の確率で0円で終わります。

期待値EVは、1/2×1円+1/2×0円=0.5円

この期待値に従うと、参加費が0.5円未満ならば参加すべきことになります。

 

コインを投げる権利を2回まで担保されているとすると、

1/2の確率で1円がもらえます。

1/4の確率で2円がもらえます。

1/4の確率で0円で終わります。

EV=1/2×1円+1/4×2円+1/4×0円=1円

この期待値に従うと、参加費が1円未満ならば参加すべきことになります。

 

コインを投げる権利を3回まで担保されているとすると、

1/2の確率で1円がもらえます。

1/4の確率で2円がもらえます。

1/8の確率で4円がもらえます。

1/8の確率で0円で終わります。

EV=1/2×1円+1/4×2円+1/8×4円+1/8×0円=1.5円

この期待値に従うと、参加費が1.5円未満ならば参加すべきことになります。

 

コインを投げる権利をn回まで担保されているとすると、

n=1のときEV=0.5円

n=2のときEV=1円

n=3のときEV=1.5円

なので、

n=kのときEV=1/2×k

となります。

 

nを無限大にとると、EVも無限大になります。

そのため期待値に従うと、参加費がいくら大きくても参加すべきことになります。

たとえば、5億円の資産を持っている人は、その財産全てを参加費として投じてでも参加すべきことになります。

しかし、その人が実際に5億円以上を回収するには、29回以上連続で裏を出す必要があります。

その確率Pは、

P<(1/2)^29≒1/5億

果たしてこの人は、本当に全財産を賭けて参加すべきだったのでしょうか。

 

このパラドックスは、期待値に基づいた意思決定の、合理性が担保される前提を明確化してくれます。

 

すなわち、試行回数及び資産が無限であること、言い換えると、不死身の富豪であることが、期待値に基づいた意思決定が合理的となるために必要であることになります。

試行回数又は資産のいずれかが有限である場合には、期待値に従うことでは、又は、期待値に従うことだけでは、損得を正しく見積もり切ることができないことになります。

 

GTOの射程

ところで、

GTOは、期待値に基づいた戦略であるといえます。

このGTOは、期待値という共通の物差しを用いることで、よりよい戦略とは何かについてプレイヤー間で議論することを可能にする点で有益です。

 

そのため、かもがポーカーの講習会を依頼されたときには、期待値に基づく意思決定を紹介します。

 

しかしながら、

かもたちは、現代人である限り、寿命及び資産は有限です。

寿命が短いほど、又は、資産が少ないほど、あるいは、他の仕事、又は、家族や友人との用事など、ポーカー以外のことに時間と金を投じることが多くなるほど、期待値という物差しを用いることの合理性が損なわれていきます。

 

そのため、期待値に基づいた意思決定を模索する場合には、その射程の乏しさについても自覚的であるべきだと思います。

逆に、その限界に無自覚に期待値に基づいた意思決定を絶対視することは、「宗教である」という誹りを受けても仕方ないでしょう。

 

期待値に基づく意思決定は、Bad but Betterな物差しの1つに過ぎません。

その意味で、瞬間瞬間のスリルや、テーブルメンバーとの交流の度合いなど別の物差しを用いるプレイヤーに対しても、リスペクトを忘れないようにしたいものです。