[婆茶留高校数学科☆HP] Top pageに戻る このページを閉じる
探したい言葉はここへ→

誤差の分布と正規分布

Copyright (C) virtual_high_school, 1996-2022


§1.誤差分布に対する勘違い

ガウスは、測定誤差が正規分布に従うことを発見した。そのため、正規分布をガウス分布とも言う。
授業では次のような実験を行なって、ヒストグラムを書くことによって正規分布へとつなぎ、正規分布の確率密度曲線釣鐘状のグラフになることを示すこととしよう。

【実践例】
長さ$15cm$ほどの線分をプリントして生徒に渡す。そして、左端からちょうど$10cm$だと思うところに、印をつけさせる。(線分が約$15cm$だということは伏せておく。)
その後、物差でいまの印がほんとは何$cm$の所なのかを測らせる。
クラス全員のデータを集計して、ヒストグラムを書く。---
(実践結果)
結果は釣鐘でなく、ふたこぶラクダになってしまった。
(受験校だと、生徒は5択問題では正解は4番であることが最も多いことを熟知していて、この場合も正解は真ん中より少し右寄りだろうと見当を付けてしまうかもしれない。)

ふたこぶになった原因を考えてみる。半数くらいの生徒は、正解は真ん中あたりだろうと予想をつけ、$7.5cm$くらいの所に印をつけた。残りの半数は、正解はそのウラをかいて、端の方にあると考え、$13cm$くらいの所に印をつけた。
こうして、受験校でないクラスでは、正解に近い生徒は一人も出なかった。■

結局、この授業は失敗例なのだが、失敗の原因を追求してみよう。

§2.誤差分布とは

誤差は正規分布になると言ったが、精確に言うと誤差は

の2種類の誤差の和である。
前者は、例えば常に長めに見積もる癖があるといったような個人差などが原因である。
正規分布になるのは、偶然誤差
の方である。

【例】の授業では、正解はここらへんだろうという当て推量が系統誤差を生み、それより小さい偶然誤差を打ち消してしまったのである。系統誤差をなくす工夫をしない限り、上の授業は成功しないだろう。
そこで、例えば生徒に$10cm$という長さをよく覚えさせ、

目分量で$10cm$を測りとる練習

を何度かさせる。そうすれば、偶然誤差だけが残る。
これでクラス40人の誤差の集計をすれば、正規分布になるであろうか。もしなるとしたら、なぜだろうか。

練習をしても、目分量が得意の生徒とそうでない生徒はいるだろう。

能力差は生じる。

旋盤工でも熟練者に直径$10cm$の金属棒を作らせると、誤差の絶対値は非熟練工より小さい。
つまり、偶然誤差は全員が平均=0(誤差がマイナスのときもあるから、0になる)だが、分散$\sigma^{2}$は熟練すればするほど値が小さな分布になる。
クラス$n=40$人分を集計すると、独立な確率変数$X_{1},X_{2},\cdots,X_{n}$があって、各$X_{i},1 \leq i \leq n$は分散が$\sigma_{i}^{2}$の正規分布$N(0,\sigma_{i}^{2})$に従う。ここで中心極限定理を使いたいところだが、各$X_{i}$が同一の分布に従っていないので、定理が使えない。
それはそうだ。集計結果は数列$ \sigma_{1}^{2}, \sigma_{2}^{2}, \sigma_{3}^{2}, \cdots $の選び方に依存するわけだが、そうするとクラスが変わると結果も異なる。(熟練工が多いクラスとそうでないクラスとがあるだろう。)
確率密度曲線は左右対称でひとこぶラクダかもしれないが、

釣鐘(正規分布)になるかどうか

は分からない。

大数の法則や中心極限定理において、定理の前提条件の確認を怠ると正しい結論が出ない。確率変数$X_{1},X_{2},\cdots,X_{n}$が独立であるというところまではよいのだが、それらが同一の分布に従うというところの確認を忘れてはいけない。母集団の分散が分からないので、推定・検定もできない。平均が0になるらしいことは分かっても、どの程度の確実さでどの程度の近傍に集まるのかは分からないのである。(同一の分布に従うと見なされるときならば、母分散は標本分散で代用できる。)

§3.正しい実践例

§1.で示した【実践例】には問題があった。正しい形に直すと、次のようになる。

クラスの生徒全員ではなく

1人の生徒について

かなり練習をさせてもうこれ以上上達しないと思われる程度に熟練させておいて、実験をするのである。
こうすれば、確率変数$X_{1},X_{2},\cdots$は同一の分布になると見なしてよいであろう。



[婆茶留高校数学科☆HP] Top pageに戻る このページを閉じる
探したい言葉はここへ→