順位予想の当たり方の計り方

ドメサカブログさんで順位予想の当たり具合に「予想1位~3位チームの順位差の平均値」という数字を使っていたのですが、もうちょっと良い指標が使えないかな?と気になりました。この指標は、完全的中時にゼロになることは分かりますが、完全にランダムな(J1クラブ名を書いたカードをシャッフルした)時にどの程度の数字になるのか直観的に分からず[1]、どの程度よく当たっているかがつかみにくいという問題があります。また、上位のみの数字を使っているので中位、下位の予想力も反映されていません。

こういった問題を解決するために、統計学では順位相関係数というものを使います。これはドメサカさんが使っていたような「順位間のずれ」の数字を、完全一致時に1、ランダムな時に0、完全逆順時に-1となるように大きさを調整(標準化)したものです。この方法にすれば

  • 当たり具合が分かりにくい→分かりやすい
  • クラブ数によって影響を受ける→受けない
  • 上位の数字だけ使っている→全体の数字で計れる

と、いくつかの問題が解決します。

でも、計算が大変なんでしょう?

とっても簡単。ケンドールの順位相関係数であれば、総当たり表を作り、各マスについて「実際の順位と予想順位が同じなら“当たり”を、違えば“外れ”を書き、当たりのマス数から外れのマス数を引いて、最後にマス数の合計値で割るだけです。

無題

手軽に計算するのであれば、オンラインの順位相関計算サイト[2]に飛んで、順位&予想順位表を張り付けるだけ。あとはボタン一つで相関係数(r)が出てきます。rの横に*印がありますが、これは「ランダムシャッフルではこの的中率はなかなか(少なくとも20回に1回未満しか)出ない」という意味の印です。18クラブ予想の場合にはrが0.4を切ってくるとシャッフルでもたまには出るというレベルの的中率になります。Jの場合は0.5が大まかに凡人予想ラインと置いていいでしょう。

js-starの使い方

js-starの使い方

ドメサカブログさんのところの数字をそのまま使って計算してみたところ、以下のようになりました。
* 平野孝 0.715
* 後藤健生 0.674
* 小村徳男 0.742
* 福田正博 0.657
* 鈴木隆行 0.701
* 山口素弘 0.734

無題

数字の多少の大小は気にしないでね

順位相関係数を算出すると小数点以下細かい数字が出てきて信用できそうに見えますが、いくつか留意点があります。一つは、この数字はシーズンごとにある程度ばらつくということです。同じ人でもシーズンごとに相関係数はばらつきます。個人の「予想力」を語るなら予想10回分くらいは見たほうがよさそうです。二つ目に、これはあくまで予想が難しい「今のJ」に限定した数字です。同じことを海外リーグでやれば恐らくそちらのほうが予想と実績の相関係数は上がるでしょうが、そうなったとしてもそれはJは予想が難しいということを意味しているのであって、Jの解説陣が予想力が低いということを意味するものではありません。

補注

[1] ちなみに(ランダムに選んだ時の)期待値は16クラブで6.67、18クラブで7.65、20クラブで8.63になります。

[2] このサイトではスピアマンの順位相関係数を使っています。ドメサカブログさんの数え方はズレを数え上げているのでケンドールの順位相関係数に近く、私もこちらのほうが適していると思いますが、オンラインで計算できるサイトがないので。