[婆茶留高校数学科☆HP] Top pageに戻る このページを閉じる |
Copyright (C) virtual_high_school, 2021
【第01講】 確率変数と確率分布
【第02講】 非復元抽出
【第03講】 復元抽出
【第04講】 2個のサイコロ
【第05講】 期待値と分散
【第06講】 変数変換
【第07講】 確率変数の和
サイコロを1個振れば(「振る」ことを試行と言う)、その結果は1から6までのいずれかの整数値が出る。我々がやっているのは数学だから数値化できるとやりやすい。
「1の目が出る」という根元事象に対し1という数を対応させ、「2の目が出る」という根元事象に対し2という実数を対応させ、……という関数を考える。
これが確率変数である。
確率変数:根元事象 $\mapsto$ 実数値
確率変数は正確に言えば数ではなく、関数である。確率変数には大文字のアルファベットをあてるのがふつうである。だから、「1の目が出る」という根元事象を$\omega_{1}$と表せば
$X(\omega_{1})=1$
というように書き表す。
では、コインを1枚投げるときはどうするか。表とウラでは数値にならないと思われるかも知れない。そこで表が出た枚数を$X$とする、というように決めればよい。
【問題】 トランプのうち、?, ?, ?, ? のカードを各1枚計4枚選んでおく。これらを裏返したままシャッフルした後、1枚を選ぶ。(ここまででは確率変数が出てこない。)赤いカードが出たら100円貰え、?が出たら500円貰えるが、?が出たら1000円取られる。獲得する金額を$X$円とするとき、確率変数$X$の確率分布を求めよ。---
【解】 確率変数が導入されていない場合は、確率分布は以下のように表現するしかない。
今は確率変数が導入されているので、それの確率分布は以下の通り。
玉を複数個取り出す問題で、元に戻さないときのことを「非復元抽出」と言う。
【問題】 白玉3個と黒玉4個が入った袋から4個の玉を同時に取り出すとき、白玉が出る個数を $X$ とする。$X$ の確率分布を求めよ。---
【解】 「同時に」とあるが、時間差をつけて1個ずつ計4個取り出しても同じである。(→その理由は本講座数学A【第2-4節】の【第01講】を参照せよ。)
例えば $P(X=3)$ を求めてみよう。いろいろな出方があり、
〇〇〇● だったら
$\frac{3}{7} \times \frac{2}{6} \times \frac{1}{5} \times \frac{4}{4}=\frac{(3 \cdot 2 \cdot 1) \cdot (4)}{7 \cdot 6 \cdot 5 \cdot 4}$
分母は合計個数$=7$から始まるカウントダウンの4つの数の掛け合わせ、
分子は白が個数$=3$から始まるカウントダウンの3つの数の掛け合わせと、黒が個数$=4$から始まるカウントダウンの1つの数の掛け合わせ との積。
出る順序を変えて
〇●〇〇 だったら
$\frac{3}{7} \times \frac{1}{6} \times \frac{2}{5} \times \frac{1}{4}=\frac{(3 \cdot 2 \cdot 1) \cdot (4)}{7 \cdot 6 \cdot 5 \cdot 4}$
分子は、掛ける順序を変えればさっきと同じになる。
結局、白3個の出る確率は順序を変えてもすべて同じだから、その確率を 「〇3個と●1個の並べ方(同じものを含む順列)」 倍すればよいから、
$P(X=3)=\frac{4!}{3! 1!} \times \frac{(3 \cdot 2 \cdot 1) \cdot (4)}{7 \cdot 6 \cdot 5 \cdot 4}$
他の $X$ の値についてもすべて調べると
$P(X=0)=\frac{4!}{0! 4!} \times \frac{ (4 \cdot 3 \cdot 2 \cdot 1)}{7 \cdot 6 \cdot 5 \cdot 4}=_{4}C_{0} \frac{ (4 \cdot 3 \cdot 2 \cdot 1)}{7 \cdot 6 \cdot 5 \cdot 4}$
$P(X=1)=\frac{4!}{1! 3!} \times \frac{(3) \cdot (4 \cdot 3 \cdot 2) }{7 \cdot 6 \cdot 5 \cdot 4}=_{4}C_{1} \frac{(3) \cdot (4 \cdot 3 \cdot 2) }{7 \cdot 6 \cdot 5 \cdot 4}$
$P(X=2)=\frac{4!}{2! 2!} \times \frac{(3 \cdot 2) \cdot (4 \cdot 3)}{7 \cdot 6 \cdot 5 \cdot 4}=_{4}C_{2} \frac{(3 \cdot 2) \cdot (4 \cdot 3)}{7 \cdot 6 \cdot 5 \cdot 4}$
$P(X=3)=\frac{4!}{3! 1!} \times \frac{(3 \cdot 2 \cdot 1) \cdot (4)}{7 \cdot 6 \cdot 5 \cdot 4}=_{4}C_{3} \frac{(3 \cdot 2 \cdot 1) \cdot (4)}{7 \cdot 6 \cdot 5 \cdot 4}$
$P(X=4)=\frac{4!}{4! 0!} \times \frac{(3 \cdot 2 \cdot 1 \cdot 0) }{7 \cdot 6 \cdot 5 \cdot 4}=_{4}C_{4} \frac{(3 \cdot 2 \cdot 1 \cdot 0) }{7 \cdot 6 \cdot 5 \cdot 4}$
二項係数はパスカルの三角形から、(1,3,3,1) の次で (1,4,6,4,1) と分かる。(階乗でやるより速い。) だから
$P(X=0)= \frac{ 4 \cdot 3 \cdot 2}{7 \cdot 6 \cdot 5 \cdot 4}=\frac{24}{840}$
$P(X=1)= \frac{4 \cdot 3 \cdot 4 \cdot 3 \cdot 2 }{7 \cdot 6 \cdot 5 \cdot 4}=\frac{288}{840}$
$P(X=2)= \frac{6 \cdot 3 \cdot 2 \cdot 4 \cdot 3}{7 \cdot 6 \cdot 5 \cdot 4}=\frac{432}{840}$
$P(X=3)= \frac{4 \cdot 3 \cdot 2 \cdot 4}{7 \cdot 6 \cdot 5 \cdot 4}=\frac{96}{840}$
$P(X=4)= \frac{0 }{7 \cdot 6 \cdot 5 \cdot 4}=\frac{0}{840}$
計$\frac{840}{840}=1$ …(答)
約分したければ、すべてが 4 と 6 で割れるから
$P(X=0)= \frac{ 1}{7 \cdot 5 }=\frac{1}{35}$
$P(X=1)= \frac{ 3 \cdot 4 }{7 \cdot 5 }=\frac{12}{35}$
$P(X=2)= \frac{ 3 \cdot 2 \cdot 3}{7 \cdot 5 }=\frac{18}{35}$
$P(X=3)= \frac{ 4}{7 \cdot 5 }=\frac{4}{35}$
$P(X=4)= \frac{0 }{7 \cdot 5 }=\frac{0}{35}$
計$\frac{35}{35}=1$ …(答)
玉を複数個取り出すのだが、1個ずつ取り出しては元に戻して、また取り出して … を繰り返す方法の場合は「復元抽出」と言われる。
【問題】 白玉3個と黒玉4個が入った袋から玉を1個取り出し、色を確認したら袋に戻す。これを4回繰り返すとき、白玉が出る回数 $X$ の確率分布を求めよ。---
【解】 考え方は非復元抽出の場合とほぼ同様。元に戻すため、白も黒も出る確率は変化しない点が異なる。
$P(X=0)=\frac{4!}{0! 4!} \times (\frac{3}{7})^0 \times (\frac{4}{7})^4=_{4}C_{0} \times (\frac{3}{7})^0 \times (\frac{4}{7})^4=\frac{256}{2401}$
$P(X=1)=\frac{4!}{1! 3!} \times (\frac{3}{7})^1 \times (\frac{4}{7})^3=_{4}C_{1} \times (\frac{3}{7})^1 \times (\frac{4}{7})^3=\frac{768}{2401}$
$P(X=2)=\frac{4!}{2! 2!} \times (\frac{3}{7})^2 \times (\frac{4}{7})^2=_{4}C_{2} \times (\frac{3}{7})^2 \times (\frac{4}{7})^2=\frac{864}{2401}$
$P(X=3)=\frac{4!}{3! 1!} \times (\frac{3}{7})^3\times (\frac{4}{7})^1=_{4}C_{3} \times (\frac{3}{7})^3 \times (\frac{4}{7})^1=\frac{432}{2401}$
$P(X=4)=\frac{4!}{4! 0!} \times (\frac{3}{7})^4 \times (\frac{4}{7})^0=_{4}C_{4} \times (\frac{3}{7})^4 \times (\frac{4}{7})^0=\frac{81}{2401}$ …(答)
次の問題は復元抽出ではないのだが、解き方は同様である。
【問題】 10個のサイコロを同時に投げたとき、1の目が出た個数 $X$ の確率分布を求めよ。---
【解】 「同時」と書いてあるから非復元抽出だと思ってはいけない。それはなんとかの一つ覚えである。$k$ ($0 \leq k \leq 10$)
個1が出る(=1以外が $10-k$ 個出る) 確率は
$P(X=k)=_{10}C_{k} \times (\frac{1}{6})^k \times (\frac{5}{6})^{10-k}=\frac{10!}{k! (10-k)!} \times \frac{5^{10-k}}{6^{10}}$ …(答)
この答は二項定理の $\displaystyle \displaystyle \sum_{k=1}^{n} {_{n}C_{k}} \times x^k \times y^{n-k}(=(x+y)^n)$
に似ている。このため、上の確率分布を二項分布と言い、$B(10,\frac{1}{6})$ のように書く。
【公式】 (二項分布) 1回の試行で事象 A が起こる確率が $p$ で、この試行を $n$ 回繰り返す。ただし、各試行は互いに独立であるとする。事象
A が生起する回数 $X$ の確率分布は
$P(X=k)=_{n}C_{k} p^k \times (1-p)^{n-k}$
2個のサイコロの問題というのがよくある。この場合には $6 \times 6$ 表が使える。
【問題】 2個のサイコロを同時に投げたとき、出た目の積 $X$ の確率分布を求めよ。---【解】 下表が $6 \times 6$ 表である。
36マスあるが、等確率なので1マスの確率は $\frac{1}{36}$ である。該当するマスの数を数えて $36$ で割ればよい。確率分布を表の形にまとめると、下の通り。
…(答)
【問題】 1のカードが1枚、2のカードが2枚、3のカードが3枚、4のカードが4枚ある。ここから同時にカードを2枚無作為に取る。取ったカードの数の和 $X$ の確率分布を求めよ。---
【解】 左手に握ったカードは $1,2,2',3,3',3'',4,4',4'',4'''$ の10通り、右手はそれ以外の9通りで、カードの取り方は全部で $_{10}P_{2}=10 \times 9=90$ 通りで、等確率。下表において1マスの確率はいずれも $\frac{1}{90}$ である。対角線上のマスは消えることに注意。
上の表から確率分布を求めるが、対角線の左下と右上は対称だから半分だけ数えればよい。
…(答)
コインを1個投げて表が出たら100円貰える。この賭けでいくら儲かると期待できるだろうか。当然、表が出る確率が $\frac{1}{2}$ だから、半分の50円だろう。すなわち、期待できる金額は
$100 \times P(\mbox{表}) =100 \times \frac{1}{2}=50$ (円)
これを期待金額とか期待値と言う。
では、次の試行では期待値はどう計算したら、よいだろうか。
【問題】 外れのないくじが10本あり、賞金は次のようになっている。
1等1000円1本、2等500円2本、3等100円3本、4等50円4本
くじを1本引いたときに得る賞金の期待金額を求めよ。---
【解】 もしくじを10本全部買い占めれば、
$1000\times 1+500\times 2+100\times 3+50\times 4=2500$ (円)
だが、実際に引けるくじは1本だから、平均して(だから期待値を平均とも言う)
$\frac{1000\times 1+500\times 2+100\times 3+50\times 4}{10}=250$ (円) …(答)
これを書き直すと
$1000\times \frac{1}{10}+500\times \frac{2}{10}+100\times \frac{3}{10}+50\times \frac{4}{10}=250$ (円)
つまり、1本引いたときに得る賞金(確率変数)を $X$ とすれば、$X$ の期待値 $E(X)$ は
$E(X)=\displaystyle \displaystyle \sum_{k=1}^{4} x_{i} \times P(X=x_{i})$
ただし $x_{1}=1000,x_{2}=500,x_{3}=100,x_{4}=50$ とする。
標語的に書けば、$E(X)=\sum X \times P(X)$
下表を書けば、楽に計算ができる。
数学 I の「データの分析」において分散を学習した。そこでは分散とは、$(\mbox{データ値}-{平均値})^2$ の平均、であった。上の問題で平均が確率に置き換えたように、ここでも置き換えを行えば、確率変数
$X$ の分散 $V(X)$ とは
$V(X)=\sum (X-E(X))^2 \times P(X)$
先の問題で分散を計算すると、下表になる。
"$X-E(X)$" の列は確率変数の値から平均を引いたもので、偏差と呼ばれる。それを2乗して確率を掛けた値が表の最右列である。その列の合計が $91500$ だから、
$V(X)=91500 (\mbox{円}^2)$
単位に注意してほしい。標準偏差 $\sigma(X)$ はこれの正の平方根だから
$\sigma(X)=\sqrt{91500}=10\sqrt{915}=302.5 (\mbox{円})$
分散に関する公式で有名なのが、「分散は2乗の平均がら平均の2乗を引いたもの」という公式だ。
【問題】 確率変数 $X$ について $V(X)=E(X^2)-E(X)^2$ を証明せよ。---
【証明】 $E(X)=\sum x_{i} P(X=x_{i})$ に留意しつつ、$V(X)$ の定義を変形していく。
$V(X)=\sum (x_{i}-E(X))^2 P(X=x_{i})$
$=\sum (x_{i}^2-2 E(X) x_{i} +E(X)^2)P(X=x_{i})$
$=\sum x_{i}^2 P(X=x_{i}) -2 E(X) \sum x_{i} P(X=x_{i}) +E(X)^2 \sum P(X=x_{i})$
$=\sum x_{i}^2 P(X^2=x_{i}^2) -2 E(X) E(X) +E(X)^2 \times 1$
$=E(X^2) -E(X)^2$
計算途中で難しいのは、$\sum x_{i}^2 P(X=x_{i})= \sum x_{i}^2 P(X^2=x_{i}^2) $ のところだろう。具体例を考えてみよう。
左辺$=(-2)^2 P(X=-2)+(-1)^2 P(X=-1)+0^2 P(X=0)+1^2 P(X=1)+2^2 P(X=2)$
$=0 P(X=0)+1 (P(X=-1)+P(X=1))+4 (P(X=-2)+P(X=2))$
$=0^2 P(X^2=0^2) +1^2 P(X^2=1^2)+2^2 P(X^2=2^2)=$右辺
でたしかに成り立っている。■
実はこの公式には実用的な価値がない。$E(X^2)$ も $E(X)^2$ も通常かなり大きな値になる。例えばともに12桁の整数で、上8桁まで同じ数だとしてみよう。それを引き算すると4桁の整数になるはずだが、使った電卓の精度が8桁だとしたら上9桁目以降は四捨五入されてなくなっている。だから12桁から12桁を引くとゼロになってしまうって訳だ。標準偏差を求める問題を出したら、どっちの公式を使うかで、答が2倍以上異なるなんてことはザラだ。
【問題】 袋の中に赤球5個と白球4個が入っている。この袋から球を1個ずつ取り出していき、赤、白どちらかの球が先に3個取り出されたところで終了する。ただし、取り出した球は袋に戻さない。終了時点で取り出されている球の総数を
$X$ とするとき、次の問いに答えよ。
(1) $X=5$ となる確率を求めよ。
(2) $X$ の期待値を求めよ。---(2010学習院大学)
【解】 (1) 5セットマッチの試合で、3セット先取した方が勝ち。フルセットまでもつれるのは
(赤2個、白2個)×赤 + (赤2個、白2個)×白
$(_{4}C_{2}\cdot \frac{5}{9}\cdot \frac{4}{8}\cdot \frac{4}{7}\cdot \frac{3}{6} )\times ( \frac{3}{5}+\frac{2}{5})$
$=6 \cdot \frac{5}{63} \cdot 1=\frac{10}{21}$
(2) 4セットで勝負がつくのが
(赤2個、白1個)×赤 + (赤1個、白2個)×白
$(_{3}C_{2}\cdot \frac{5}{9}\cdot \frac{4}{8}\cdot \frac{4}{7} )\times\frac{3}{6}+(_{3}C_{2}\cdot \frac{5}{9}\cdot \frac{4}{8}\cdot \frac{3}{7} )\times\frac{2}{6}$
$=\frac{240+120}{3 \cdot 8\cdot 7 \cdot 6} $
$=\frac{5}{14}$
3セットのストレート勝ちは
(赤3個) + (白3個)
$ \frac{5}{9}\cdot \frac{4}{8}\cdot \frac{3}{7}+\frac{4}{9}\cdot \frac{3}{8}\cdot \frac{2}{7}$
$=\frac{60+24}{9\cdot 8 \cdot 7}=\frac{1}{6}$
これらより、期待値は
$E(X)=3 \times \frac{1}{6}+4 \times \frac{5}{14}+5 \times \frac{10}{21}$
$=\frac{3\times 7+4\times 15+5\times 20}{42}=\frac{181}{42}$ …(答)
サイコロを1個振って出た目の数だけ賞金 $X$ をあげよう。例えば1の目が出たら 1円あげる。いや、これでは少なすぎる。$X+1000$ 円あげよう。でもこれでは、1の目でも 6の目でも余り変わらない。そこで出た目の数を 100倍してそれに1000円足した金額、すなわち $100X+1000$ (円)が賞金だ。このように 確率変数は $X$ から $100X+1000$ に変換された。もっと一般化して $aX+b$ ($a,b$ は定数) の期待値や分散(こういった量を統計量と呼ぶ)はどうなるだろうか。
平均は、例えばテストの点数を $a$ 倍して、全員に $b$ 点の下駄を履かせれば、平均点も $a$倍プラス$b$ になるだろうし、散らばり具合を表す
$\sigma(X)$ は全体に $b$だけシフトしても影響はなく、ただ $a$ 倍されるだけだろう。
【問題】 確率変数 $Y=aX+b$ の期待値、分散、標準偏差を求めよ。---
【解】 期待値は
$E(Y)=\sum y_{i} P(Y=y_{i})= \sum (a x_{i}+b) P(aX+b=a x_{i}+b)$
$=\sum (a x_{i}+b) P(X= x_{i})$
$=a \sum x_{i} P(X= x_{i})+b \sum P(X= x_{i})$
$=a E(X)+b$
分散は
$V(Y)=\sum (y_{i}-E(Y))^2 P(Y=y_{i})= \sum (a x_{i}+b-aE(X)-b)^2 P(aX+b=a x_{i}+b)$
$=a^2 \sum (x_{i}-E(X))^2 P(X= x_{i})$
$=a^2 V(X)$
これの平方根をとって
$\sigma(Y)=\sqrt{V(Y)}=|a| \sqrt{V(X)}$
$=|a| \sigma(X)$
模擬テストなどの偏差値とは何かと言うと、得点から平均点を引いて(これを偏差と言う)、この値を標準偏差で割って、それを 10倍して 50点を足した点数である。10 倍して50を足すのは値が小さすぎたり、負になっては気持ちが悪いためで、本質的ではない。だから、よく出て来る変数変換は
$Z=\frac{X-E(X)}{\sigma(X)}$
というものである。この値を $X$ の z値と言う。
【問題】 あるテストの平均点は 62.5 点で、標準偏差は 7.2 点であった。得点 $x$ の z値と、それの平均、分散、標準偏差を求めよ。---
【解】 z値は
$z=\frac{x-62.5}{7.2}$
であり、その各種統計量は
$E(Z)=\frac{1}{7.2}(E(X)-62.5)=\frac{0}{7.2}=0$,
$E(Z)=(\frac{1}{7.2})^2 V(X)=\frac{7.2^2}{7.2^2}=1$
$\sigma(Z)=\sqrt{V(Z)}=1$
このように 確率変数 $X$ を正規化すると、平均 0, 分散 1 になる。
【証明】 (1) 左辺$=\displaystyle \displaystyle \sum_{i,j} (a x_{i}+b y_{j})P(X=x_{i},Y=y_{j})$
$=\displaystyle a \displaystyle \sum_{i,j} x_{i} P(X=x_{i},Y=y_{j}) + b \displaystyle \sum_{i,j}
y_{j} P(X=x_{i},Y=y_{j})$
$=\displaystyle a \displaystyle \sum_{i} x_{i} \displaystyle \sum_{j} P(X=x_{i},Y=y_{j}) + b \displaystyle \sum_{j}
y_{j} \displaystyle \sum_{i} P(X=x_{i},Y=y_{j})$
$=\displaystyle a \displaystyle \sum_{i} x_{i} P(X=x_{i},-\infty <Y<\infty) +
b \displaystyle \sum_{j} y_{j} P(-\infty <X<\infty,Y=y_{j})$
$=\displaystyle a \displaystyle \sum_{i} x_{i} P(X=x_{i}) + b \displaystyle \sum_{j} y_{j} P(Y=y_{j})$
$=aE(X)+bE(Y)$
(2) 第1式の左辺$=E((aX+bY)^2)-E(aX+bY)^2$
$=E(a^2X^2+2ab XY+b^2Y^2)-(aE(X)+bE(Y))^2$
$=a^2E(X^2)+2ab E(XY)+b^2E(Y^2)-a^2E(X)^2-2abE(X)E(Y)-b^2E(Y)^2$
$=a^2\{E(X^2)-E(X)^2\}+2ab \{E(XY)-E(X)E(Y)\}+b^2\{E(Y^2)-E(Y)^2\}$
$=a^2V(X)+2ab \{E(XY)-E(X)E(Y)\}+b^2V(Y)$
あとは
$E(XY)=E(X)E(Y)$ $(X,Y$は独立)
を示せばよい。独立だと積の法則が成り立つので
左辺$=\displaystyle \displaystyle \sum_{i,j} x_{i} y_{j}P(X=x_{i},Y=y_{j})$
$=\displaystyle \displaystyle \sum_{i,j} x_{i} y_{j}P(X=x_{i})P(Y=y_{j})$
$=\displaystyle \displaystyle \sum_{i} x_{i} P(X=x_{i}) \displaystyle \sum_{j} y_{j} P(Y=y_{j})$
$=E(X)E(Y)$ ■
【問題】 1個のサイコロを振って出た目 $X$ の100倍の金額と、1組52枚トランプの中からめくった1枚に書かれた数字(A=1,J=11,Q=12,K=13)
$Y$ の50倍の金額を合計したものを賞金としよう。賞金の期待値を求めよ。---
【解】 公式から出てくる $E(100X+50Y)=100E(X)+50E(Y)$ を利用する。
そこで $E(X)=\frac{1+2+3+4+5+6}{6}=\frac{21}{6}=\frac{7}{2}$, $E(Y)=\frac{1+2+3+\cdots+13}{13}=\frac{91}{13}=7$
を当てはめて、
$100 \times \frac{7}{2}+50 \times 7=700$ (円) …(答)
サイコロとトランプの平均を出すところで、等差数列の和の公式から出てくる、
$(1\times \frac{1}{n}+2\times \frac{1}{n}+\cdots+n\times \frac{1}{n}=\frac{n(n+1)}{2} \times \frac{1}{n}=\frac{1+n}{2}$
という公式を使った。例えば、サイコロの最小の目が 1 で最大の目が 6 だから、平均は足して2で割って 3.5 である。
[婆茶留高校数学科☆HP] Top pageに戻る このページを閉じる |