[婆茶留高校数学科☆HP] Top pageに戻る このページを閉じる

公理論に基づく高校確率の展開

Copyright (C) virtual_high_school, 1998-2017

§0.はじめに
現代数学の確率論(公理的確率論)において、高校の確率はどのように展開されるのだろうか。
高校の確率は有限試行が中心だが、大学の教科書はいきなり無限試行(標本点が無限個あるもの)から叙述が始まるものがほとんどで、このことについて触れていない本が多い。
そこで、あえてここで高校確率を現代数学風に展開してみようと思う。


§1.標本空間
§1-1.標本空間は集合
確率の定義に登場するのは、集合(モノ)と関数(ハタラキ)である。この2つは、現代数学における最も重要な基礎概念だろう。

【定義】 試行を行うと結果がえられる。その結果全体の集合を標本空間と呼ぶ。---


【定義】 標本空間の要素を標本点という。---


【定義】 標本空間の要素1個から、標本空間の部分集合(シングルトンとか単位集合と呼ぶ)を根元事象という。---
(シングルトンであるから、その意味では根元事象はこれ以上細かく分けることはできない。)


例えば、1個のサイコロを投げると、赤い目か、黒い目が出る。赤い目というのは1の目のことであり、これだけは赤色に塗られている。
このように考えるときは、標本空間を
   $ \Omega = \{\mbox{赤}, \mbox{黒} \} $
とするのが、自然だろう。



【定義】 有限試行とは、標本点の個数が有限個である試行のことである。---


§1-2.等確率でなくてよい
ここで注意すべきは
   $ \Omega = \{1, 2, 3, 4, 5, 6 \} $
としなくてはいけないという決まりはない、ということだ。
ここらへんのことを高校の教科書では、「事象をなるべく細かく分けて、それを根元事象とする」というように書いてあるものが多い。
それは、サイコロの場合は、そうやると等確率になって計算がしやすいという利便性が生じるというだけであって、そうしなければならない必然性はない。
「ない」というより、このような教え方をすることによって次のようなデメリットが生まれる。


§1-3.「数学的確率」の欠点
   $ \Omega = \{ \mbox{死ぬ}, \mbox{死なない} \} $
を標本空間にとると、私が明日死ぬ確率は $1/2$ になるような錯覚を学習者に与える。
死ぬのと死なないのとが同程度に起こりうるという前提がないと、そんなことは言えないのであるが、こういう確率を数学的確率などというものだから、正しいと思う学習者も出てくるのである。
「死ぬ確率が$1/2$は正しいか」という問を出したところ、半数の生徒は正しいと答えたとかという話がある。ある生徒は答案に「そういう不思議なことが起きるのが数学の特徴だ」と書いていた。だから「数学的」確率という言葉は、本来使うべきではないだろう。使うとすれば、「算術的」確率くらいがよかろう。場合が2通りあって、1を2で割ったというだけだから、数学というより算術(四則演算だけを使う)ではないだろうか。
ちなみに、数学的確率を授業の中心においた場合のデメリットとして、次のことが挙げられる。


といったところだ。


§1-4.同程度に確からしいときの公式
根元事象が$n$個あっていずれもが等確率のとき(事象の起き方が同程度に確からしいとき)、後述する確率の公理を使えば、
   $ P( \{ \omega_{i} \} ) = \frac{1}{n}, \mbox{ } i= 1,2,\cdots,n $
という公式が証明できる。
数学的確率主義者はこの公式を定義とする訳だが、我々公理的立場に立つ者にとっては、これは定理になる。そのとき、これを「同程度に確からしいときの確率の公式」と呼べばよいのであって、ここで「数学的確率」という古くさい言葉を持ち出さなくてよい。
ところで、確率の計算をするには、確率分布が分かっていなくてはならない。確率分布が定義されていないのに、無理に計算しようとするとおかしな確率の値が出てくる。その例として、ベルトランのパラドックス等が有名である。まず初めに確率分布を決めないとならない訳だが、もしどの根元事象が起こるのも同程度に確からしいという仮定があれば、あとは上の公式で計算ができてしまう。


§1-5.同程度に確からしい試行
では、どういう試行を同程度に確からしいと仮定するのだろうか。
高校の教科書には「こういう試行を同程度に確からしいとする」とはっきりと述べられることがないのだが、暗黙のうちに次の試行は同程度に確からしいと仮定されている。


【仮定】 同程度に確からしい試行のリスト


これらは、標本空間をうまく作れば、各根元事象の起こる確率が等しくなる。なにも、実験によって上記の試行が同程度と分かった訳ではない。あくまで仮定である。
もしかしたら、現実はこれとは異なるかもしれない。その可能性も十分ある。例えば、コインの表と裏は模様が違うのでどちらの出る確率も$1/2$ということは考られない。財務省はそこまで考えて硬貨を作っているとはとうてい思えないから。でも、どちらが出やすいと決めつけるのもおかしいので、おのおの$1/2$の確率だと仮定するのはきわめて自然である。


§1-6.仮定がなければ解けない
どういった試行を同程度と仮定するのかを明確にすべきである。そうでないと、「ベルトランの逆理の正解は何ですか」という質問が絶えなくなる。パラドックスなのだから正解はないともいえるし、すべてが正解ともいえるのである。
現実に問題集には、次のようなパラドックスのような問題が出てくることがある。


  1. 「ジャンケンで連続5回グーを出す確率」
  2. 「生徒40人を1列に並ばせるとき、特定の生徒が先頭になる確率」
  3. 「A町からB町を経由して、C町へ行くとき、特定のルートを通る確率(図略)」

などである。これに対して、それぞれ次のような答が予想される。


  1. 「そんなことをしたら、負けてしまう」
  2. 「相川君(出席番号1番)が先頭にきまってる」
  3. 「最短ルートを通るにきまってる」

この種の問題では、確率分布を定義しなくては答は出せないのである。つまり、何が正解とも言えない。


§1-7.標本空間の任意性
ある試行に属する標本空間の作り方は、一通りではない。その作り方は任意だからである。でも、標本点(根元事象)の個数を$n$とするとき、すなわち
   $ \mid \Omega \mid = n $
としたときに、
   $ \omega \in \Omega \Rightarrow P(\{ \omega \} ) = \frac{1}{n} $
というように、各根元事象の確率が等しくなってくれれば、何かと便利である。
計算の利便性を考えて、このように等確率の標本空間を作るのであって、等確率の標本空間が作れない場合だってありうるのである。


例えば、図のようなルーレットを考えると、$ \frac{1}{\sqrt{2}} $が無理数のため、有限($\mid \Omega \mid < \infty$)の標本空間 $\Omega$ で等確率のものは作れない。



うまく標本空間を作れば、等確率のものが作れる場合がある。しかしそれは、教科書が言うように事象を細かく分けたから、ではない。
さきほどの、死についての数学的確率の標本空間を細かく分けて、
   $ \Omega = \{ \mbox{病気で死ぬ}, \mbox{事故で死ぬ}, \mbox{自殺する}, \mbox{他殺される}, \mbox{死なない} \} $
としたら、死ぬ確率が
   $ P( \{ \mbox{死ぬ} \} ) = \frac{4}{5} $
となって、ますます現実離れするだけの話である。


§1-8.確率0は空事象でない
さきに出したサイコロの例だが、標本空間を
   $ \Omega = \{\mbox{赤}, \mbox{黒}, \mbox{黄}\} $
のようにしても構わない。黄色の目が出る確率を 0 とすればよいからである。すなわち
   $ P( \{ \mbox{黄} \} ) = 0 $
である。$\{\mbox{黄} \}$ という集合は空集合ではないが、その確率は0である。
   $ A = \emptyset \Rightarrow P(A) = 0 $
だが、これの逆は言えないのである。
このことは、無限試行では本質的である。例えば、正規分布$N(0,1)$に従う確率変数$X(\omega)$ があったとする。$X<0$となる確率は
   $ P( \{ \omega \mid X( \omega ) < 0 \} ) = 0.5 $
であるが、ちょうど$X=0$となる確率は
   $ P( \{ \omega \mid X( \omega ) = 0 \} ) = 0 $
である。しかし、確率がゼロであってもその事象が起こらないことを意味しない。自動車の衝突は2台の車の間の距離 $X$ がゼロになることであるが、そうなる確率はゼロである。しかし、それは衝突事故が絶対起きないことを意味しない。


§2.確率空間
§2-1.3つの基本性質(公理)
標本空間の作り方を説明したところで、今度は確率分布の決め方を与えよう。


【定義】 標本空間の部分集合を事象と呼ぶ。


【定義】 各事象には確率と呼ばれる実数値が対応する。すなわち、確率 $P$ とは、
   $ \Omega \supset A \mapsto P(A) \in \mbox{R} $
となる、$\Omega$の部分集合から実数への関数(写像)であり、その定義域は$\Omega$のベキ集合$2^{\Omega}$である。


【注意】 有限試行では上の定義でよいのだが、無限試行のときは和が収束するか否かの心配があるので、ベキ集合の代わりにその部分集合である $\sigma$-集合体を使う。(無限試行については今後言及しない。)


上記のの確率の値は任意に与える訳にはいかず、次の3つの公理を満たさなくてはならない。つまり、確率は次の3つの基本的性質をもつ。


【確率の公理】


  1. $P(A) \geq 0$
  2. $P(\Omega ) = 1 $
  3. $A \cap B = \emptyset \Rightarrow P(A \cup B) = P(A)+P(B) $ ---



これらの系として、例えば次の公式が導かれる。


【定理】


などである。


最後の等式は、加法定理である。第3公理から証明できるから、公理でなく定理である。


§2-2.100%を越える確率
上記の公理を天下りだという人がいる。天下りだと言ってしまえば、定義はなんでも天下りだ。天下りだと批判する人は、そのように定義した理由を釈明せよ、と言いたいのだろう。しかし、確率を(降水確率のようにパーセンテージでいえば)0 %から100%までの値しかとらないように決めたことだって、さほど合理的理由はない。


例えば、次のような確率の決め方もある(現に、欧米人は今でもこの流儀の確率を使うことがある)。
(問) ルーレットは、1から36までの36個の数字が均等に出る。このうちのひとつの数字に100フランを賭けたとする。当たる確率はいくらか。
(解) 当たりの数字が1つ、はずれの数字が35個だから、当たる割合は $1 : 35$ だ。
比の値は $1/35$ だから、これを当たる確率としてよい。そうすれば、はずれる確率は $35/1$ である。
確率は 0 から $\infty$ までの値をとりうる訳で100%を越えうるし、両者の確率を足せば1になるという規則も成り立たない。



こんな確率は無意味かというとそうでもない。ひとつの数字に賭けて当たったら、いくら儲かるか。「確率」が $1/35$ だからその逆数で35倍の賞金になる。だから、3500フラン儲かる。
3500フランをどうやって計算したかというと、実は期待値などという概念は使わなかった。36人の賭博者が別々の数字にひとり100フランずつ賭けたとする。1人が当たり、残り35人ははずれるが、はずれた者どもの賭け金が当たった1人のところに行くから、自分の100フランは(戻ってくるので)別にして、3500フランが儲かる、というように考えたのである。
期待金額でやると
   $x \times \frac{1}{36} +(-100) \times \frac{35}{36} = 0$
なる方程式を解く羽目になる。


§2-3.確率空間
【定義】 確率空間(確率分布とも言う)とは、
   標本空間$\Omega$
と、$\Omega$のベキ集合( $2^{\Omega}$ )上の実数値関数
   $ P : 2^{\Omega} \ni A \mapsto P(A) \in \mbox{R} $
との組(ペア)$ ( \Omega, P ) $のことをいう。


あるひとつの試行に属する確率空間は1通りではなく、いろいろな確率空間ができる。実質的には同じ確率空間であっても、ペア$( \Omega, P )$のどちらか片方でも異なれば、それは異なる確率空間と見る。


例えば、コインを2枚同時に投げる試行を考える。少なくとも1枚が表になる確率$p$を求めよう。
A君は、
   $ \Omega_{1} = \{ (\mbox{表}, \mbox{表}), (\mbox{表}, \mbox{ウラ}), (\mbox{ウラ}, \mbox{表}),(\mbox{ウラ}, \mbox{ウラ}) \} $
を標本空間としてとり、確率分布を
   $ P_{1}( (\mbox{表}, \mbox{表}) ) = P_{1}((\mbox{表}, \mbox{ウラ})) = P_{1}((\mbox{ウラ}, \mbox{表})) = P_{1}((\mbox{ウラ}, \mbox{ウラ})) = \frac{1}{4} $
として、
   $ p = 1 - P_{1}((\mbox{ウラ}, \mbox{ウラ})) = \frac{3}{4} $
と正解を出した。---
一方、B君は、
   $ \Omega_{2} = \{ \mbox{2枚表}, \mbox{1枚表}, \mbox{0枚表} \} $
という標本空間を作ってしまった。これでは、正解に到達しないかというとそうではない。確率分布を
   $ P_{2}( \mbox{2枚表} ) = P_{2}( \mbox{0枚表}) = \frac{1}{4} , P_{2}( \mbox{1枚表}) = \frac{1}{2} $
と決めて、正解の$p=3/4$を導いた。---



たしかに解答としては、A君のやり方の方が見やすい。しかし、B君の方も間違いではない。B君がなぜ確率分布をあのように決めたのか分からない、というのであればそれはA君に対してもその言葉をぶつけなくてはならない。A君の確率分布が正しいのは自明だと思う方は、数学的確率主義に毒されているからだ。
いよいよ、コイン2個投げのような複合試行の確率を説明する段になった。


§3.複合試行の確率空間
§3-1.2つの複合試行
複合試行には、


の2つがある。これらは、袋の中の玉の試行で言うとそれぞれ

の問題に対応している。前者の方が簡単だから、簡単な方から説明しよう。


§3-2.直積の確率
例えば、10円玉、50円玉各1枚を同時に投げる試行を考えてみよう。
標本点を
   $ ( \mbox{10円},\mbox{50円} ) = (H, h) $
のようにペア(順序対)で表すと、
   $ \Omega = \{ (H,h), (H,t), (T,h), (T,t) \} $
である。このように、標本空間を直積集合
   $ \Omega = \{ H,T \} \times \{ h,t \} $
にするのだ。(Hはhead, Tはtailの頭文字。外国のコインは表に人物の顔が描かれることが多いため、表がheadと呼ばれる。)

では、確率分布はどう決めたらよいか。コイン1個投げなら、それぞれ
   $ P_{1}(H) = P_{1}(T) = \frac{1}{2} $
   $ P_{2}(h) = P_{2}(t) = \frac{1}{2} $
だ。そこから、例えば
   $ P((H,h)) = P_{1}(H) \times P_{2}(h) = \frac{1}{2} \times \frac{1}{2} =\frac{1}{4} $
を導きたい。
これが計算で出てきそうに思えるのだが、そうではない。やってみると、何かを仮定しないことには$1/4$ は出てこないことに気づく。何かを仮定するなら、最も簡明なものを仮定にするのがよい。そこで、上の掛け算の式そのものを仮定とする。それが次の乗法公理である。


【公理】 (乗法公理) 試行甲と試行乙が独立とする。それぞれに属する確率空間を
   $ (\Omega_{1},P_{1}), (\Omega_{2},P_{2}) $
とするとき、事象$A \subset \Omega_{1}$ と事象$B \subset \Omega_{2}$ がともに起こる確率は
   $ P(A \times B) = P_{1}(A) \times P_{2}(B) $
である。---


乗法公理は公理であるから、証明できない。
試行の独立によく似た概念に、事象の独立がある。こちらは


【定義】 ある試行に属する確率空間$(\Omega,P)$ について、事象$A \subset \Omega$ と事象$B \subset \Omega$ が独立とは、$A$ と$B$ がともに起こる確率が
   $ P(A \cap B) = P(A) \times P(B) $
となることである。---


というものである。独立とはいっても、事象の独立は試行の独立とは違う。
ついでなので、乗法定理を説明しておく。まず、次の定義に注意する。


【定義】 $P(A) \neq 0$ のとき
   $ P_{A}(B) = \frac{P(A \cap B)}{P(A)} $
を、$A$が起こるという条件のもとでの$B$の起こる条件つき確率という。---


すると、


【定理】 $ P(A \cap B) = P(A) \times P_{A}(B) $ ---


という等式が成り立つことが簡単に証明できる。これを乗法定理という。これは$A$と$B$が独立でなくても成り立つ公式である。


§3-3.独立性の確認
2つの試行が独立とは、さきに述べた乗法公理が成り立つことである。では、どういうとき試行が独立かというと、おおざっぱに言えば2つの試行の起こり方が互いに無関係のときである。
2個のコインを同時に投げたとき、独立と見ていいだろう。厳密に言えば、どんな小さな物体の間にも万有引力が働くから、独立でないのかもしれないが、独立と仮定してもそう現実離れしたものではなかろう。
そこで、前に挙げたコイン、サイコロ、等々は独立な試行になると仮定する訳だ。(教科書は、暗黙裡に仮定している。)
コイン甲とコイン乙を投げるという試行が独立であることを数学的に証明することは、それが公理であるがゆえに不可能である。では、実験で簡単にそれを確認することができないだろうか。これが、実はそう単純ではない。
もし独立なら、コインが2個とも表になる確率は$1/4$ となり、2個投げを100回やればそのうちの25回くらいは生起しそうだ。この考えに基づいて実験をすればよいように思える。
ところが、100回同じことを繰り返しやってみようと思うこと自体、100回の2個投げ試行が互いに独立であることを仮定していることを示している。もし、独立でないかもしれないと思っていたら、同じことを100回もやってみるということはない。
この試行の独立性を確認する実験には、事前に、試行の独立性が仮定されているという欠陥があるのである。


§3-4.樹形結合
樹形結合という複合試行の確率空間を考えよう。例を挙げれば、4本のくじから順に2本を(非復元で)引くという複合試行がそうである。
ここでさきの直積の標本空間のように順序対を作ると、今度は
   $ (i,j), \mbox{ } 1 \leq i, j \leq 4, \mbox{ } i \neq j $
となる。$i \neq j $ であるところが、直積試行のときと違う。この形では扱いにくい。
1本目のくじを引く試行と、2本目のくじを引く試行が独立であれば、さきほどの乗法公理が使える。ところが、1本目に何番のくじを引くかによって、2本目のくじ引きの標本空間が変わってしまう。そこで、少し技巧的だが次のように複合試行の確率空間を作る。


まず、くじの集合を
   $ \{ 1, 2, 3, 4 \} $
とし、これを1本目のくじ引きの標本空間とする。すなわち
   $ \Omega_{0} = \{ 1, 2, 3, 4 \} $
確率分布は当然
   $ P_{0} (i) = \frac{1}{4} \mbox{ } (i=1,2,3,4) $
である。次に、4本のうち、1番、2番、3番、4番のくじが抜けているくじの標本空間をそれぞれ
   $ \Omega_{1} = \{ 2, 3, 4 \} $
   $ \Omega_{2} = \{ 1, 3, 4 \} $
   $ \Omega_{3} = \{ 1, 2, 4 \} $
   $ \Omega_{4} = \{ 1, 2, 3 \} $
とする。確率分布は
   $ P_{k} (i) = \frac{1}{3} \mbox{ } (k,i=1,2,3,4; \mbox{ } i \neq k ) $
である。
そして、連続2本引きの標本空間$\Omega$を
   $ \Omega = \Omega_{0} \times \Omega_{1} \times \Omega_{2} \times \Omega_{3} \times \Omega_{4} $
というように、5つの集合の直積とする。乗法公理により、複合事象
   $ A = A_{0} \times A_{1} \times A_{2} \times A_{3} \times A_{4} $
の起こる確率は
   $ P(A) = P_{0}(A_{0})\times P_{1}(A_{1})\times P_{2}(A_{2}) \times P_{3}(A_{3})\times P_{4}(A_{4}) $
となる。


(問) 1本目が3番のくじで、2本目が1番のくじである確率を求めよ。
(解) この事象$E \subset \Omega$は $\{ (3,1) \}$ という順序対で表されるのではなく、
   $ E = \{ 3 \} \times \{ 2,3,4 \} \times \{ 1,3,4 \} \times \{ 1 \} \times \{ 1,2,3 \} = \{ 3 \} \times \Omega_{1} \times \Omega_{2} \times \{1 \} \times \Omega_{4} $
という5次元の直積集合$\Omega$の部分集合(図を書けば5次元直方体になる)で表される。よって、その確率は
   $ P(E) = P_{0}(\{ 3 \}) \times P_{1}(\Omega_{1}) \times P_{2}(\Omega_{2}) \times P_{3}( \{ 1 \} ) \times P_{4}( \Omega_{4} ) $
   $ = \frac{1}{4} \times 1 \times 1 \times \frac{1}{3} \times 1 = \frac{1}{4} \times \frac{1}{3} $
である。■





§3-5.連続くじ引きの確率
上記のことより、帰納的に考えていけば、次の定理が分かる。


【定理】 $n$本のくじから$r (1 \leq r \leq n)$本のくじを引くとき、1番, 2番, 3番, $\cdots$, $r$番のくじがこの順で出る確率$p$ は
   $ p = \frac{1}{n} \times \frac{1}{n-1} \times \frac{1}{n-2} \times \cdots \times \frac{1}{n-r+1} $
   $ = \frac{1}{_{n}P_{r} } $
である。---


最後の式の分母は、順列である。
この等式を利用すれば、教科書の例題によくある次の問題が解ける。


(問) $n$本中に $m$本の当たりがあるくじから、$r$本引いてちょうど $s$本当たる確率$p$を求めよ。
(解) $s$本の当たりくじと$r-s$本のはずれくじを選んできて、それらを1列に並べる方法が何通りあるかを計算し、定理の確率に掛ければよいから、
   $ p = \frac{1}{ _{n}P_{r} } \times ( _{m}C_{s} \times _{n-m}C_{r-s} \times r! ) $
   $ = \frac{_{m}C_{s} \times _{n-m}C_{r-s} }{_{n}C_{r}} $■



最後の式を見ると、分母分子とも組合せである。この手の問題は、順列でなく組合せでやった方が式が簡単になる。しかし、この式を導いた道筋は
   $ \mbox{乗法公理} \rightarrow \mbox{順列} \rightarrow \mbox{組合せ} $
であった。教科書の例題の解法のようにいきなり組合せでやると、なぜ組合せでなければならないのか分かりにくいだろう。


§4.仮説検定
§4-1.実験の方法は正しいか
画鋲を投げて針が上を向く確率はいくらだろうか。よくある方法は、例えば1000回投げて、そのうち893回上を向いたから、確率は
   $ p = \frac{893}{1000} $
とするやり方だ。余りにも単純だ。これで、もしサイコロを振って1の目が600回中 98回出たら、$p=1/6$ ではなくて
   $ p = \frac{98}{600} $
が正しいとするのだろうか。それとも、だいたい$1/6$ に近いから、
   $ p = \frac{1}{6} $
が正しいことが立証されたとするのであろうか。
相対度数が$1/6$ からどの程度離れている場合に、$1/6$ とみなしてよいのかは、正規分布まで学習しないと本来は分からない。
さきに、サイコロは同程度に確からしい試行だと仮定した。それが、得手勝手な現実離れした仮定でないことを確証するには、現実のサイコロを使って実験をすることも必要になってこよう。
それでは、サイコロの確率が$1/6$ であることを実験で確かめるにはどうすればよいのだろうか。それを考えてみよう。


§4-2.仮説検証の方法
数学内部の仮説は、公理・定理から論理の力を駆使して正しいか否かが証明される。では、物理学のように現実界と結びついた仮説を立証するにはどうするのだろうか。例えば、万有引力の法則の正しさとか、6本足でない昆虫はいないということなどはどうやって証明するのだろうか。
反証するのならば、反例をひとつ示せば十分だ。8本足の昆虫を発見すれば、仮説が誤りであったことが証明できる。反証にひきかえ、正しいことを証明するのは大変だ。世の中すべての物体の運動を観測して、万有引力の公式通りになっているなどということは不可能だ。200年後も万有引力の法則が成り立っているなんて、どんなに長生きな人でも観測できぬ。
そこで、万有引力の法則に反する事実がひとつも発見されない間は、この法則は正しいと立証されていることにしようと考えるのだ。これが、数学の定理でなく、現実界に言及する命題を証明する方法だ。確率・統計学の分野でも、この方法が基本になっている。
証明または反証すべき命題のことを、仮説(帰無仮説)という。


§4-3.サイコロの実験
サイコロの1の目の出る確率が$1/6$ であることを実験で確かめてみよう。ほんとは多数回振れればよいのだが、計算が大変なので6回だけ振って実験を終わりにしよう。
まず実験に先だって仮説を立ててみる。仮説がないのに実験を行なうということはありえない。昔の人が言ったように、実験とは自然に対する拷問なのだ。何かを白状させるために行うのであって、虚心坦懐に先入観を持たずに実験をするということは、ありえない。
そこで我々は「$1/6$の確率で1の目が出る」という仮説を設ける。乗法公理より、1の目が$r$回出る確率は
   $ P(X=r) = _{6}C_{r} \times \left( \frac{1}{6} \right)^{r} \times \left( \frac{5}{6} \right)^{6-r} $
である。この確率は、独立試行(ベルヌイ試行列)の確率と呼ばれる。
ところで今出てきた $X$ は1の目の出た回数を表す確率変数である。確率変数とは、標本点$\omega \in \Omega$ に実数を対応させる関数(写像)である。だから、正確には $P(X=r)$ではなく、
   $ P( \{ \omega \in \Omega \mid X( \omega ) = r \} ) $
と書くべきである。この式から、確率を計算すると、
   $ P(X=0) = \frac{15625}{46656} $
   $ P(X=1) = \frac{18750}{46656} $
   $ P(X=2) = \frac{9375}{46656} $
   $ P(X=3) = \frac{2500}{46656} $
   $ P(X=4) = \frac{375}{46656} $
   $ P(X=5) = \frac{30}{46656} $
   $ P(X=6) = \frac{1}{46656} $
である。(ここで、独立試行の公式を使ったということは、6回の試行が互いに独立であることを仮定したことを意味している。)
さて、実験をしてみる。すると、なんと4回も1の目が出てしまった。4回以上 1の目の出る確率は
   $ P(X \geq 4) = P(X=4) + P(X=5) + P(X=6) $
   $ = \frac{375+30+1}{46656} = \frac{406}{46656} = 0.0087 $
で 1%弱である。だから、危険率1%で仮説検定する場合、仮説は棄却される。
すなわち、いま実験に使ったサイコロは歪んでいるのか、あるいは私がイカサマをやったのかは理由はともかくとして、$1/6$ということは立証されなかった。
ただし、ちゃんとしたサイコロであり、私も正直に投げたにしても4回以上1の目が出てしまうこともある。その確率は上に計算したとおりである。だから、$1/6$ではないという判断の間違っている危険性が、1%程度あると明示した次第である。(試行の独立性を仮定してベルヌイ試行列の公式を使ったのだが、その仮定が間違っていたのかもしれない。場合によっては、こちらの仮定が棄却されることもありえよう。)


§4-4.棄却されないとき
では、さきのサイコロ実験で6回中、2回1の目だったらどうだったろうか。このとき、帰無仮説は棄却されない。ということで、「確率は$1/6$」と結論づけることになる。ただし、この判断が誤りである危険がある。その危険率はいくらだろうか。さきほどの正しい仮説を誤って棄却してしまう危険率は1%弱だったのにくらべ、こちらの誤った仮説を正しいとしてしまう危険率は一般に求めるのが難しい。こちらの危険率は第2種の危険率と呼ばれる。
ということで、第2種の危険率がいくらか分からないので、「確率は$1/6$」と断定するには、もう少し回数を増やして投げてみる必要がある。投げる回数が多くなると、ベルヌイ試行列(二項分布)で計算するのは厄介になる、というより正規分布で近似できるようになるので、そちらを使う。
ここから後の話は確率論というより、統計学の分野であろう。


【参考文献】伊藤清「確率論」(岩波基礎数学選書,1991)


★「婆茶留高校」は架空の存在であり、実在の人物、団体とは関係ありません。
<-- クリックして婆茶留高校へメール送信 mailto: virtual_h_s@yahoo.co.jp 
婆茶留高校数学科HP http://www.virtual-hs.com/ Powered by   Copyright(c) virtual_high_school, 2001-2022