Harvilleモデルとは
単勝オッズと複勝オッズには、それぞれ別々の確率が織り込まれています。
単勝は「1着になる確率」。複勝は「3着以内に入る確率」(中央競馬では7頭以上の場合)です。
この2つを知っていれば、3連単(1着・2着・3着を順番まで当てる)の確率も、ある程度逆算できるはずです。
そこで使っているのが、競馬の予想モデルとして昔から知られている「Harvilleモデル」という考え方です。
Harvilleモデルの発想はシンプルです。
それぞれの馬に「強さ」という数値を与え、1着は強さに比例した確率で決まる、と考えます。
1着が決まったら、その馬を除いた残りの馬の中で、また強さに比例して2着を決めます。
2着まで決まったら、残りの中でまた強さに比例して3着を決めます。
「強い馬ほど、勝ちやすいし、2着にもなりやすいし、3着にもなりやすい」という、ごく自然な仮定を順番に適用していくイメージです。
単勝だけでは足りない理由
ただ、これをそのまま使おうとすると一つ困ったことがあります。
元になる「強さ」を、単勝確率1つだけから作ってしまうと、複勝(3着以内率)の情報が活かせません。
単勝確率が同じでも、複勝確率が高い馬と低い馬がいます。「勝つときは大きく勝つが、外れると着外も多いタイプ」と「1着は少ないが堅実に3着以内に来るタイプ」は、単勝オッズだけでは区別がつきません。
Adjusted Harville Model
そこで、1着用・2着用・3着用に、それぞれ別の「強さ」を計算するようにしました。1着用の強さは単勝確率そのもの。2着用・3着用の強さは、単勝確率と「複勝確率のうち単勝確率を超えた部分」を混ぜ合わせて作ります。
ツール内ではこれを「Adjusted Harville Model」と呼んでいます。
次回は、この計算だけではまだ不十分な理由と、そこにもう一段かけている補正の話を書きます。
SURABAYA LAB.