以下の表は次の要素を比較したものです。
- 残差 = 予測値 - 実際値
- 誤差 = Σ(残差の絶対値) ÷ Σ(実際値)
また相関関数は次の二次関数です。
- y = a * x^2 + b * x + c
x = 東大 | x = 早大 | x = 慶應 | |
---|---|---|---|
y = 東大 | 0.810744 | 0.595138 | |
y = 早大 | 0.336548 | 0.229777 | |
y = 慶應 | 0.364535 | 0.333491 | |
y = 理科 | 0.472635 | 0.365669 | 0.421138 |
y = 明治 | 0.398164 | 0.280371 | 0.336290 |
y = 立教 | 0.438626 | 0.390092 | 0.410027 |
y = 中央 | 0.439079 | 0.378942 | 0.403673 |
y = 法政 | 0.389736 | 0.412119 | 0.392641 |
y = 学習 | 0.480772 | 0.500085 | 0.499373 |
「x=東大、y=早大」「x=東大、y=慶應」「x=慶應、y=早大」「x=早大、y=慶應」の相関関数は精度がいいのですが、残念ながら『サンデー毎日』も『週刊朝日』もこの3大学は同時発表なので、一方の情報から他方の情報を予測することはできません。理科大、明治大、立教大、中央大、法政大、学習院大は上記の3大学よりも先に週刊誌で合格実数が公表されるので予測情報として使えます。
まず、経験則として「x=東大、y=慶應」の誤差0.36が実用的に使える予測の上限のようです。東大の合格数を予測する場合、理科大〜学習院大の間に直接予測に使えそうな大学はありません。次に、早大の合格数を予測する場合、理科大と明治大が使えそうです。特に「x=早大、y=明治」は誤差0.28と非常に相関関係が高くなっています。慶應の合格数を予測する場合、明治大の数値だけが使えそうです。結果として、東大の合格数を予測する場合、「x=早大、y=明治、誤差0.28」と「x=東大、y=早大、誤差0.33」の組み合わせが一番精度が高そうです。
直感と現実が一致したのか、既に「明大→早大→東大」の予測値は前回紹介しました。ただ、これだけでは消化不良なので、もう一つの方法として、次回は「明大→慶大→東大」の順序で予測します。