[婆茶留高校数学科☆HP] Top pageに戻る このページを閉じる 探したい言葉はここへ→

○×テストと相対評価

Copyright (C) virtual_high_school, 1996-2017


§1.○×テストは二項分布か

次の問題に似たような問題は、教科書にも出てくる。

【例1】
生徒全員に二者択一式問題を5問、解答してもらう。例えば、「本校の敷地面積は?」という問に、選択肢を
  1. $39851m^{2}$
  2. $39581m^{2}$
というように2つ用意しておく。こんな問題を5題出題する。解答後、答え合わせをし、クラスの得点分布表およびヒストグラムを作る。このような当てずっぽうの問題では、各問題とも当たる確率は$1/2$だから、全問正解する確率は
   $ (\frac{1}{2})^{5} = \frac{1}{32} $
より、全問正解者は40人のクラスなら1人くらいだろう。---


(実践結果)
$95\%$の信頼区間で何人出るか、計算してみよう。
全問正解の確率は$1/32$だから、$X_{1},X_{2},\cdots,X_{40}$は同一の分布(平均$1/32$,分散$31/32^{2}$)に従い、かつ独立と仮定する。すると、$\overline{X} = (X_{1} + \cdots + X_{40})/40$は
   平均1/32=0.031,分散$0.028^{2}$
の正規分布に従う。$0.031 \pm 1.96 \times 0.028$より、信頼区間は
   $ [-0.024, 0.086] $
である。これを40倍して、全問正解者は、$-1$人から3.4人の間となる。
ところが、実際に教室でやってみると、全問正解者が4人以上出てしまった。「現在の校長は何代目?」という問題を出したのだが、これの答を知っている生徒がいたのだ。それだけでも、1問の正答確率は0.5より大きくなるが、この他に次のような要因もある。二択式問題5問で、正解は全部 a. ということはないのだ。なんとなくテスト問題には、そんな規則があるように誰でも思っている。ますます、正答確率は高くなる。けっして5割を下ることはないのだ。
それなら、このクラスの得点分布は、二項分布$B(5,p)$で$p$を0.5より少し高めに設定すればよいようにも思う。
しかし、$B(5,p)$の$p$の値は、生徒によって異なるからダメである。正解を知っていた生徒は当然$p$が大きくなるし、二択問題が得意な生徒(出題者は正解をこんな配列で並べてくるだろうとか、その種の勘がよく働く生徒)がいるのだ。これらの生徒はそれぞれに$p$が$1/2$より大きくなる。
ということで、$p$の値は生徒により異なるので、クラスの得点分布を作っても二項分布になると結論づけはできないのだ。■

正しい実践例は、例えば次のようなものであろう。

【例2】
今から教師がコインを5回投げる。生徒全員に、1回目から5回目まで表が出るか、ウラが出るかを事前に予想させる。
実際にコイン投げをして、度数分布表を作る。---

これなら、二項分布になるであろう。(賞金でも出なければ面白くもなんともない、ヤラセの予想ではあるが。)

§2.相対評価のウソ

またまた、授業の失敗例だ。

【例3】
○×問題を4問出題し、各問題の正答確率がいずれも$1/2$で、おのおの独立とすると、正答数は二項分布$B(4, 0.5)$に従う。
具体的に、正答数が0問から4問の確率をそれぞれ計算すると、(ベルヌイ試行列の単元で計算したように)
   $ \frac{1}{16}, \frac{4}{16}, \frac{6}{16}, \frac{4}{16}, \frac{1}{16} $
となり、パーセントに直すと、
   $ 6\%, 25\%, 38\%, 25\%, 6\% $
でこれが、中学校の相対評価のバックボーンだ。---


(分析)
上の話はあまりに単純すぎる。このように学力を、当てずっぽうでテストに答えるのと同じととらえることは誤りである。
もしそうだとしたら、1学期に5を取った生徒が2学期に1を取ることが、連続して5を取る生徒と同じくらいにいる筈だ。しかし、実際にはそんなことはない。
もし、相対評価を理論づけるなら、次のようになるだろうか。
人間には、他人より頑張ろうとする面と、努力をせず手抜きをしようという面が半々にある。どちらの面が前面に出るかは等確率とする。そんな正負両面をもった粒子が4つあったとして、4つの粒子がすべて表を向いた生徒は評価5を取る。4個のうち、3個が表を向いた生徒は評価4である、$\cdots$と。
この理屈なら、学期が変わってもそれほど成績が変化しないのはなぜか、数学では5をとるのに、音楽では1を取る生徒がいるのはなぜか(数学と音楽では評価される粒子が違うから)が説明できそうだ。
もっとも今述べた屁理屈は、成績を丁半賭博のように考えるのは間違っていると言いたかったのであって、この屁理屈にもおかしいところはあろう。相対評価に正しい根拠があるかどうかも分からないのだから、これ以上の詮索はやめておく。■

§3.偏差値

テストの話をしたついでに、偏差値と正規分布の話を最後にしよう。
偏差値は正規分布がバックボーンになっている訳だが、正規分布自体が難しいので、いろんな誤解を招いている。

例えば、「偏差値は最高が70点と決まっているんでしょ」というのがある。正規分布の確率密度関数は
   $ f(x) = \frac{1}{\sqrt{2 \pi}} e^{- \frac{x^{2}}{2}} $
で、$- \infty < x < \infty$だから、理論上は偏差値の最高は$\infty$点である。

二項分布$B(n,p)$は有限試行の確率である。標本空間$\Omega$を$(0,0,1,0,\cdots,1)$のような$n$次元ベクトルの集合(成分は0か1の値しかとらない)と考えればよい。こうすると、標本点は全部で$ \sharp(\Omega) = 2^{n} $個だから有限試行である。(ただし、$p \mbox{≒} 0.5$なら同様に確からしくはない。)あとは、ベルヌイ試行列の確率($n$個の確率の積に二項係数を掛ける)が計算できれば、二項分布は理解可能である。従って、二項分布$B(n,p)$において、確率変数$X$は、$0 \leq x \leq n$なる整数$x$、すなわち有限個の値しかとらない。

一方、正規分布の方は無限試行である。確率変数$X$は、$- \infty < x < \infty$なるすべての実数$x$を値として取り得るから、標本空間$\Omega$が無限集合であることが分かる。

確率の基本性質によれば、$ P(\emptyset) = 0 $であった。有限試行ならこれの逆、すなわち$ P(A) = 0 \Rightarrow A = \emptyset $が言える。ところが、無限試行ではそれが言えない。
だから、例えば正規分布において、$X$がちょうど平均値をとる確率が
   $ P(\{ X= \mu \}) = \int_{0}^{0} \frac{1}{\sqrt{2 \pi}} e^{- \frac{x^{2}}{2}} dx = 0 $
となるように、空事象でなくても確率=0となる事象が存在する。この点が無限試行の難しい点だ。

ヒマワリの種子が黄金比と関係していることは教科書にも書かれたりしている。この他にも黄金比に関係した数がいくつかある。これは不思議なことなのだろうか。
黄金比の出現率がふつうの出現確率より大きければ、そう言えるだろう。そこで出現率を計算しようとするが、この世にはいくつもの数がある。それこそ、無数にある。そのうちのいくつかが黄金比に等しくても、$\infty$で割ったら、0 になる。出現確率(理論値)の方も、黄金比を$g$とおいて計算すると、
   $ P(\{ X=g \}) = \int_{g}^{g} f(x) dx = 0 $
である。理論値と実現値がともに0で等しいのだが、これだけからは何も言えない。

PageTopへ



[婆茶留高校数学科☆HP] Top pageに戻る このページを閉じる 探したい言葉はここへ→