先日『東大理三級理一志望者』*1で、受験者数の推定はこのブログの本筋ではないので、あくまでも過去の模試から事実の記述のみに留めていました。
ところが、何かコメント欄が紛糾しまして、それが原因ではないのですが、ブログと関係のないコメント投稿も続いているようです。おかげで、はてなの新着ブログ欄に常に登場するようになり、その時間帯はアクセス数も増えたようです。はてなの面白い仕組みですよね。
それはさておき、どのぐらいの人数がいるのか気になったので解いてみました。
問題
2014年度の東京大学理系の入試結果は以下のとおりである。以下の表から、理科一類と理科二類受験者で、理科三類合格点を獲得した受験者数を推定せよ。各受験者の得点の分布は標準正規分布に従うものとする。
科類 | 合格最低点 | 合格者平均点 | 合格者数 | 受験者数 |
---|---|---|---|---|
理科一類 | 307.3556 | 337.6555 | 1128 | 2765 |
理科二類 | 309.7333 | 333.6641 | 547 | 1854 |
理科三類 | 372.3889 | 400.2624 | 100 | 392 |
回答と解説
この問題のポイントは標準偏差なんですね。ところが標準偏差は簡単に出せません。受験者平均点があれば、標準偏差が簡単に出せて、そこでほぼ回答終了です。一方、合格者平均点というのは、一見、使えそうな情報ですが、合格者平均点の偏差値もしくは席次が分からない限り、直接使える数値ではありません。
私は、この「合格者平均点の偏差値」が簡単に出せないからこそ、この問題に深入りすることはやめていました。標準正規分布において、どの領域を切り出しても、「平均値=中央値」が成り立てば、問題は簡単なのですが、統計においてそんな単純な例は少なく、実際、問題を解いている途中で、やはりこの場合も「平均値≠中央値」ということがわかりました。
- 合格最低点の偏差値を求める
これは難しくありません。受験者数に対する合格者数の割合を求めて、標準正規分布表か、エクセルの normsinv() 関数で算出可能です。
科類 | 合格者数 | 受験者数 | 合格者分布率 | 偏差値 |
---|---|---|---|---|
理科一類 | 1128 | 2765 | 40.8% | 52.3 |
理科二類 | 547 | 1854 | 28.5% | 55.0 |
- 合格者平均点の偏差値を求める
この問題の最大難関はこの部分です。「平均値=中央値」が成り立たない以上、偏差値とその偏差値帯の分布率から、合格者の平均偏差値を推定するしかありません。確率密度関数を積分すれば出来るのでしょうが、あんな複雑な関数、手作業で積分なんてできません。
そこで、エクセルを使用して近似値を求めます。理科一類は偏差値52.3 から偏差値100 まで偏差値を1ごとに分割して、分布率の差と偏差値を掛けたものを合計していきます。同様に理科二類は偏差値55.0 からはじめます。もちろん偏差値は100以上も存在していて、偏差値200 でも 300 でも無限大まで計算する必要がありますが、偏差値85 を超えると分布率が1万分の1以下になってほぼ無視可能になります。
開始偏差値(A) | 終了偏差値(B) | 偏差値帯分布率(C) | 偏差値帯得点(D) |
---|---|---|---|
52.3 | 53 | 0.0258 | 1.36 |
53 | 54 | 0.0375 | 2.01 |
54 | 55 | 0.0360 | 1.96 |
55 | 56 | 0.0343 | 1.90 |
… | |||
100 | 101 | 1.17*10^-7 | 1.17*10^-5 |
合計→ | 0.408 | 24.3 |
-
- 偏差値帯分布率=NORMDIST(B2;50;10;1)-NORMDIST(A2;50;10;1)
- 偏差値帯得点=C2*(A2+B2)/2
- 合格者の平均偏差値=偏差値帯得点(D)の合計÷偏差値帯分布率(C)の合計=24.3÷0.408=59.5
科類 | 合格者平均点 | 左の偏差値 |
---|---|---|
理科一類 | 337.6555 | 59.5 |
理科二類 | 333.6641 | 61.4 |
- 標準偏差を求める
「標準偏差=(合格者平均点−合格最低点)÷(合格者平均点偏差値−合格最低点偏差値)×10」で計算可能です。
科類 | 合格最低点 | 左の偏差値 | 合格者平均点 | 左の偏差値 | 標準偏差 |
---|---|---|---|---|---|
理科一類 | 307.3556 | 52.3 | 337.6555 | 59.5 | 42.1 |
理科二類 | 309.7333 | 55.0 | 333.6641 | 61.4 | 37.2 |
- 理三合格最低点偏差値を求める
標準偏差さえ求めてしまえば、理三合格最低点偏差値も計算可能です。「理三合格最低点偏差値=(理三合格最低点−理一合格最低点)÷理一標準偏差×10+理一合格最低点偏差値」の計算式になります。理二も同様の計算式で計算可能です。
科類 | 標準偏差 | 合格最低点 | 左の偏差値 | 理三合格最低点 | 左の偏差値 |
---|---|---|---|---|---|
理科一類 | 42.1 | 307.3556 | 52.3 | 372.3889 | 67.8 |
理科二類 | 37.2 | 309.7333 | 55.0 | 372.3889 | 71.8 |
- 理三合格最低点以上の人数を求める
理三合格最低点偏差値から、標準正規分布表に従って分布率を算出して、それに各科類の受験者数を掛けます。
科類 | 理三合格最低点偏差値 | 分布率 | 受験者数 | 理三合格点以上 |
---|---|---|---|---|
理科一類 | 67.8 | 3.77% | 2765 | 104.5 |
理科二類 | 71.8 | 1.46% | 1854 | 27.3 |
- 回答:理三合格点以上の人数
小数点以下を切り捨てて、答えがでます。
科類 | 理三合格点以上 |
---|---|
理科一類 | 104人 |
理科二類 | 27人 |
理科三類 | 100人 |