分布率(上位累積分布率)

スマホで表を見る場合、画面を横向きにし、必要ならPCビューにしてください。

 最近、このブログで偏差値と正規分布について記事にすることが増えたので、用語を整理しておきます。偏差値というのは単純に次の式で導き出せます。

 平均値と標準偏差は厳密に統計学上の定義で決まっていますが、偏差値になぜ10を掛けたり50を足したりするのか理論的必然性はありません。人間が理解しやすい数値に変換しただけです。100点満点のテストがあって、平均点が50点、上位15%が60点以上を取る難易度のときに偏差値と得点が合致します。
 この指標は、慣例的に使用しているだけで、偏差値50とか60とかいう絶対値に何の意味もありません。まして、「偏差値50が3人=偏差値75が2人」なんて関係は全くなりたちません。本当に意味があるのは偏差値ではなく正規分布表です。偏差値60以上なんかよりも、100人テストを受けて、15番以内のほうがよほど数字として意味をもちます。大学受験も中学受験も偏差値で合格者を絞り込むのではなく、募集定員で合格者を絞り込みます。だから重要なのは偏差値ではなく順位です。
 例えば、東大理一は定員約1000名です。東大受験生の60%が受ける模試で、理一志望者の中で600番以内にいれば、とりあえず、現時点では合格圏にいます。600番以降なら、努力して追い上げなければなりません。確実に合格したいのなら、当日の調子も加味して、300番以内を目指します。本来模試とはそのように活用するものであって、偏差値に一喜一憂する必要はありません。
 正規分布表とは、偏差値を分布で示したものです。理想的な分布をしているときに平均値からずれる確率です。例えば、偏差値40から60の間に全体の68.27%が含まれます。次に、偏差値30から70の間に実に全体の95.45%が含まれます。この範囲外にいる確率は、わずか5%以下ですから、偏差値30以下70以上は、40人のクラスにそれぞれ1人程度しか存在しないことになります。このブログでは発想を変えて、分布率(上位累積分布率)を上位何%にいるかの指標に使います。出現率でもいいのですが、正規分布表からとって、覚えやすいので分布率とします。例えば、偏差値70であれば、上位2.28%以内(40人学級で1番)、偏差値60であれば、上位15.87%以内(40人学級で6番以内)と扱います。そのときの上位XXが分布率です。

  • 分布率=1−NORMDIST(偏差値, 50, 10, TRUE)
  • 分布率から偏差値=50−NORMSINV(分布率) × 10
  • NORMDIST(), NORMSINV() はそれぞれエクセルの関数
偏差値 70 65 60 55 50
分布率 2.28% 6.68% 15.87% 30.85% 50.00%