[婆茶留高校数学科☆HP] Top pageに戻る このページを閉じる

どっちの賭けが得か--精神的期待値
Copyright (C) virtual_high_school, 1998-2018

§1.期待値のおかしな問題

§1-1.生徒から「ウッソー」

期待値に関して、次のような例題が教科書に載っていた。

問題 1つのサイコロを何回投げてもよい。出た目の和の数だけの景品がもらえる。ただし目の和が10以上になったら景品はもらえない。いま目の和が4である。次の回も投げた方がよいか、やめた方がよいか。---

これを高校生に説明した。「景品が1個1万円のものとしよう。4万円で満足して降りるか、勝負に出て最高9万円を狙うか。でも失敗して0円ということもあるんだよ。」と。
そして、勝負に出た場合に獲得する景品の個数 $X$の期待値 $E(X)$の計算をする。

$ E(X) = (5 +6+7+ 8+9+0) \times \frac{1}{6} $
$ = \frac{35}{6} \mbox{≒} 5.8 \mbox{(個)} $
だから、打ち止めにしたときの4個と比較すれば、ここは勝負に出た方がよい。■

この説明に対し、生徒から一斉に「ウッソー」。4万円もらえれば十分じゃないか。勝負に出るのは馬鹿だ、と言う。
こちらは一瞬ひるんだが、とっさに「景品1個が10円だったらどうする? 40円で満足するか」と切り返したら、生徒は不承不承了解した。
でも、これって、期待値など計算してもギャンブルの役には立たぬということではないのだろうか。
それにしても、教科書にはいくらの景品かが記されておらず、うまいというか、ずるいというか、感心してしまった。


§1-2.宝クジの逆理

では、次の問題についてはどう思いますか。

問題 クジ$A$には100本中1本だけ当たりが含まれていて、当たれば1万円もらえる。クジ$B$は、100本中50本が当たりだが賞金は300円だ。1本だけクジを引くなら、どちらを選ぶのが得か。---

期待金額を計算すると、それぞれ

$ E_{A} = 10000 \times \frac{1}{100} = 100 \mbox{(円)} $
$ E_{B} = 300 \times \frac{50}{100} = 150 \mbox{(円)} $
だから、クジ$B$の方が期待金額は大きい。■

しかし、クジ$A$を引きたがる人が結構いるのではないだろうか。それは、クジ$A$の方が意外性があるから、クジを引くのが楽しいからと考えていた。
だが、どうも腑に落ちない。意外性が標準偏差 $D(X)=\sqrt{E(X^{2})-E(X)^{2}}$の大きさのことだとすると、両者の標準偏差は
   $ D_{A} = \sqrt{10000^{2} \times \frac{1}{100} - 100^{2}} \mbox{≒} 995 \mbox{(円)} $
   $ D_{B} = \sqrt{300^{2} \times \frac{50}{100} - 150^{2}} = 150 \mbox{(円)} $
で、たしかに前者の方が意外性がある。では、次の問題はどうか。

問題 サイコロで丁半賭博をやる。賭$A$では丁が出れば1000万円もらえるが、半なら1000万円没収だ。賭$B$では、丁なら1000円の得、半なら1000円の損だ。どちらの賭が有利か。---

教科書流に考えるなら、期待金額は等しいからどちらでもよいという答になるのだろう。先のように標準偏差の大きい方がよいのなら、賭$A$となるが、これでは破産するのが恐い。
上のいくつかの問題を解いてみれば、賭けの有利性を考える際に、期待値も標準偏差も必ずしも判断の指標とするに足りないと、誰もが感じるに違いない。


§1-3.ペテルスブルクの逆理

上の疑問は、 ラプラスの本[1]を読むと氷解する。以下の記述は、同書pp.38-44に負う。
ラプラスが期待値のおかしさの例として挙げているのは、次の聖ペテルスブルクのパラドックスだ。

問題 コインを投げて、初めに表が出れば2円、2度目に初めて表が出れば4円、3度目に初めて表が出れば8円、というようにもらえる。期待金額はいくらか。---

期待値を計算してみると、

$ E(X) = 2 \times \frac{1}{2} + 2^{2} \times \frac{1}{2^{2}} +
2^{3} \times \frac{1}{2^{3}} + \cdots $
$ = 1 + 1 + 1 + \cdots = \infty \mbox{(円)} $
だから、このゲームに参加するのにどれだけ高額のテラ銭を払っても得をするはずだ。■

でも、10万円払ってこのゲームに臨んだらどうだろう。
例えば10回連続ウラが出る確率はたったの $1/1024$ で、11回目に表が出てしまったら、わずか 2048円しか戻ってこない。これではかなりの損だ。

この逆理は、期待値が損得の計算に役立たない例と考えてよいだろう。



§2.精神的期待値とは

§2-1.定義

前節で扱った期待値の定義を述べると
   $E(X) = \sum p_{i} \times x_{i}$
である。以下に出てくる精神的期待値と区別する意味で、これを数学的期待値と呼ぶことにする。
ダニエル・ベルヌイの原理によれば、相対的価値(精神的財産) $Y$は絶対的価値(物質的財産) $X$の対数関数になる。すなわち
   $Y = k \log X + C \mbox{ ($k,C$は定数)}$ ……(1)
である。資本は指数関数的に増殖するのであってみれば、納得できる等式である。また、「心理的な感覚量は、刺激の強度の対数に比例して知覚される」というフェヒナーの法則にも合致しているとも言える。だから、例えば財産100万円と1000万円の違いは、1億円と10億円の違いに等しい。

いま $z$円の財産を持った人間が、$x_{1}$円もらえる確率が$p_{1}$で、$x_{2}$円もらえる確率が$p_{2}$の賭けに参加したとする($p_{1}+p_{2}=1$)。
物質的財産は次のように変化する。
   $ z \longrightarrow z+x_{1} \mbox{ (確率$p_{1}$)} $
   $ z \longrightarrow z+x_{2} \mbox{ (確率$p_{2}$)} $
したがって、精神的財産は
   $ k \log z + C \longrightarrow k \log (z+x_{1})+C \mbox{ (確率$p_{1}$)} $
   $ k \log z + C \longrightarrow k \log (z+x_{2})+C \mbox{ (確率$p_{2}$)} $
のように変化する。
賭けが終わった後に、この人間が所有している精神的財産の総量(の数学的期待値)は、
   $ Y = p_{1} \times \{ k \log (z+x_{1})+C \} + p_{2} \times \{ k \log (z+x_{2})+C \} $
   $ = k \log \{ (z+x_{1})^{p_{1}} \times (z+x_{2})^{p_{2}} \} + C $
となる。(1)より、これに相応する物質的財産は
   $ X = (z+x_{1})^{p_{1}} \times (z+x_{2})^{p_{2}} $
である。賭を始める前の物質的財産$z$と比較すれば、その増分は
   $ X - z $
   $= (z+x_{1})^{p_{1}} \times (z+x_{2})^{p_{2}} - z $
   $= z \{ (1+\frac{x_{1}}{z})^{p_{1}} \times (1+\frac{x_{2}}{z})^{p_{2}} -1 \} $ ……(2)
これを精神的期待値と呼ぶ。ここで
   $\left( 1+\frac{x_{1}}{z} \right) ^{p_{1}} \times \left( 1+\frac{x_{2}}{z} \right) ^{p_{2}}$ ……(3)
の値が重要なので、これを精神的期待値の核心部分と呼ぶことにしよう。


§2-2.公平な賭けと精神的期待値

精神的期待値は、配当金の額$x_{i}$とその確率$p_{i}$のみならず、賭けに参加する人の全財産$z$に依存する。
では、精神的期待値の性質を調べてみよう。

定理 公平な賭において、精神的期待値は負である。---

(証明) 確率$p_{1}$で賞金$x_{1}$円を得、確率$p_{2}$で$x_{2}$円を没収されるとする($p_{1}+p_{2}=1$)。公平な賭であるから、数学的確率は$0$円になる。すなわち
   $p_{1}x_{1} - p_{2}x_{2} = 0 $
ここで、
   $ z p_{1}x_{1} = z p_{2}x_{2} = k $
とおく。
さて、このとき精神的期待値の核心部分は
   $ \left( 1+\frac{x_{1}}{z} \right) ^{p_{1}} \times \left( 1-\frac{x_{2}}{z} \right) ^{p_{2}} $
であるが、$x_{i}/z=\xi_{i}$ と置き換えて、$x_{1}x_{2}$乗すると
   $ (1+\xi_{1})^{k x_{2}/z} (1-\xi_{2})^{k x_{1}/z} = \{ (1+\xi_{1})^{\xi_{2}} (1-\xi_{2})^{\xi_{1}} \}^{k} $
となる。
ここで、$\xi_{1} >0$ を固定し、$\xi_{2}$ の関数
   $ f(\xi_{2}) = (1+\xi_{1})^{\xi_{2}}(1-\xi_{2})^{\xi_{1}} $
の挙動を考える。
   $ f(0) = 1 $
であり、$0<\xi_{2}<1$ のとき、
   $ f'(\xi_{2}) =(1+\xi_{1})^{\xi_{2}}\log (1+\xi_{1}) (1-\xi_{2})^{\xi_{1}} - (1+\xi_{1})^{\xi_{2}} \xi_{1} (1-\xi_{2})^{\xi_{1}-1} $
   $=(1+\xi_{1})^{\xi_{2}}(1-\xi_{2})^{\xi_{1}-1} \times \{ (1-\xi_{2})\log (1+\xi_{1})-\xi_{1} \}< 0 $
となる。{  }の中において、$y=\log(1+\xi_{1})(1-x)-\xi_{1}$が$x> 0 $のとき$<0$であることからそれが分かる。したがって、$f(\xi_{2}) < 1$ となり、
   $ z \{ f(\xi_{2})^k -1 \} <0 $
すなわち精神的期待値は負である。■

問題 財産が100万円の人が、丁半賭博に50万円を賭ける。50万得するか損するか半々である。数学的期待値と精神的期待値を求めよ。---

(解) 数学的期待値はもちろん 0円である。精神的期待値は(2)より
   $ 100 \times \{ (1+\frac{50}{100})^{1/2} (1-\frac{50}{100})^{1/2} -1 \} \mbox{≒} -13 \mbox{(万円)} $
と、たしかに負になる。■

精神的期待値だけを考えれば、賭け事はしないのがよいことになる。


§2-3. 2種類の期待値の関係

定理 全財産 $z$ にくらべて、配当金 $x_{i}$ が十分小さいとき、数学的期待値と精神的期待値はほぼ等しい。---

$\xi_{i}=x_{i}/z$が0に近ければ、テイラー展開より
   $ (1+\xi_{i})^{p_{i}} \approx 1 + p_{i} \xi_{i} $
だから、精神的期待値(2)は
   $ z \{ (1+p_{1}\xi_{1})(1+p_{2}\xi_{2}) -1 \} \approx z (p_{1}\xi_{1} + p_{2}\xi_{2}) = p_{1}x_{1} + p_{2}x_{2} $
となるからである。■


§2-4.ペテルスブルクの精神的期待値

ペテルスブルクの問題を精神的期待値を使って解いてみよう。
全財産を仮に200円とする。少なすぎるが、これの方が結果がはっきりする。精神的期待値の核心部分は
   $ ( 1+\frac{1}{100} ) ^{1/2} ( 1+\frac{2}{100} ) ^{1/4} ( 1+\frac{4}{100} ) ^{1/8} \cdots $
だから、無限乗積
   $ \prod_{i=1}^{\infty} \left( 1+\frac{2^{i-1}}{100} \right) ^{1/2^{i}} $
になる。
そこで、$i=1$から$N$までの部分積から 1 を引いた
   $ \prod_{i=1}^{N} \left( 1+\frac{2^{i-1}}{100} \right) ^{1/2^{i}} -1 $
の値を調べると、下表のようになる。

$\begin{array}{rr|rr|rr}
N & \prod-1 & N & \prod-1 & N & \prod-1 \\
\hline
1 & .0050 & 6 & .0290 & 11 & .0420 \\
2 & .0100 & 7 & .0330 & 12 & .0428 \\
3 & .0149 & 8 & .0363 & 13 & .0432 \\
4 & .0198 & 9 & .0389 & 14 & .0435 \\
5 & .0246 & 10 & .0408 & 15 & .0437
\end{array}$

結局、精神的期待値は $ 200 \times 0.044 \mbox{≒} 8.8 \mbox{(円)} $で、9円弱だろうと分かる。実際、この無限乗積は収束する。$N=15$において、
誤差($16 \leq N \leq \infty$の部分の剰余項)を大きめに評価しても、$ \prod - 1 < 0.043917$ である。
数学的期待値と違って、有限な値になる。



§3.結語 --- 損得問題の正解

結論を述べよう。
ある賭けに賭けた方が得か、降りた方が得かという損得問題を、数学的期待値だけで解くのはおかしいということにはうすうす気づいてはいたが、以上でその間違いがはっきりした。
それには賭けに参加する人の持つ全財産が関与する。そこで、ラプラスのいわゆる精神的期待値を導入した。大金持ちによる賭けまたは小銭の賭けであれば、数学的期待値と精神的期待値はほぼ等しいが、一般には違いが生じる。例えば、ペテルスブルクの逆理では、数学的期待値は $\infty$ だが、精神的期待値は有限値である。また、数学的期待値 $=0$ の公平な賭けにおいて、精神的期待値は負になるというギャンブラーにはショッキングな事実も分かった。
では精神的期待値が正でしかも高額なら賭けるべきか、という問題が最後に残される。これはなんとも言えない。例えば、賭博が発覚して逮捕されるのが嫌だったり、損をしたときに電車賃が足りなくなって家に帰れなくなったりするようだったら、やめておいた方がよいということもあろう。
反対に、精神的期待値が負であっても、賭けるのが楽しいなら賭ければよい。宝クジはその典型だ。
つまり、どちらが損か得かという問題は、数学的期待値や精神的期待値を計算しただけでは解けないのだ。それにはいろいろな条件が作用するからだ。期待値は、損得を考える上での一つの指針を与えるだけだ。



§∞.参考文献
[1] ラプラス著、内井惣七訳「確率の哲学的試論」岩波文庫、1997
    


★「婆茶留高校」は架空の存在であり、実在の人物、団体とは関係ありません。
<-- クリックして婆茶留高校へメール送信 mailto: virtual_h_s@yahoo.co.jp 
婆茶留高校数学科HP http://www.virtual-hs.com/ Powered by   Copyright(c) virtual_high_school, 2001-2022