限定公開( 7 )
競馬予想の世界に、新風が吹き荒れている。主役は、今話題の生成AIだ。ChatGPTやClaude、GeminiといったAIが、ついに競馬予想の世界にまで進出している。従来の予想スタイルから、データに基づいた“生成AI競馬予想”へとシフトするファンもじわじわと増えている。
「生成AIで競馬予想なんてできるの?」と思った方もいるかもしれない。しかし、競馬のレースの裏側には、馬の血統、騎手の実績、過去のレース展開、馬場(レース場の)状態など、途方もない量のデータが隠されている。従来の予想では、競馬新聞記者の直感やベテランファンの経験則に頼りがちだった要素でも、生成AIならより手軽に“勝利の兆し”を数値として見つけ出せるという。
今回は、そんなAI競馬予想の最新状況について、最前線で活躍するプロフェッショナルにインタビュー。相手は、慶應義塾大学大学院で統計解析を学び、20年以上にわたり競馬にAIを活用する他、競馬予想サイト「netkeiba」が主催した「AI競馬マスターズ2023」で3位入賞の実績を持つ「ヤナシ社長」だ。
同氏はAIを活用したマーケティング支援事業を手掛ける企業で社長を務める傍ら、AI競馬予想を楽しむ人物。本業でもデータ活用やAI関連のコンサルティングに携わり、23年ごろから生成AIを活用した競馬予想「生成系競馬予想」にも取り組んでいるという。ヤナシ社長から見た、AI競馬予想の最新トレンドとは。
|
|
●AI競馬予想は「どんなデータを食わせるか」勝負になりつつある
AIを使った競馬予想は「過去の膨大なレースデータから『勝つ馬の特徴』を学習した機械学習モデルを開発し、そのモデルを用いて未来のレースの出走馬の勝率を算出する」といった手法が知られる。ただ、昨今はその“戦い方”に変化が生じているという。
競馬といえば競馬新聞や予想サイトに載っている、前レースの情報や記者の意見などを基に予想するイメージが強い。AIによる予測でもこれらの情報を使う……と思いきや「ああいったところの情報だけだと、情報量が少なくて勝てないのがAI競馬予想の面白いところ」「恐らく回収率は80%を切る」とヤナシ社長。
回収率100%を超すために必要なのは、付けている馬具や放牧先、調教のされ方など、一般的な競馬新聞に載っていない情報から、回収率向上につながる特徴量を集めること。ときには「初心者がどれだけ多いか」につながるデータとして、競馬場への来場者数などが参考になることもあるという。
「競馬のデータ分析をしたいと考える人は、分析手法にこだわる場合が多いが、アルゴリズムの方はあまり勝負に影響しない。LLM(大規模言語モデル)を使おうが、重回帰分析など古典的な手法だろうが、データセットが同じだったらマシンの性能差くらいしか出ない。勝敗は情報量、特徴量で決まる。『何を食わせるか勝負』になりつつある」(ヤナシ社長)
|
|
ただし“おいしいデータ”は、当然他の人も見つける可能性がある。広がれば予想に反映させる人も増え、同じ馬に期待が集中。結果払い戻しが少なくなり、回収率も下がる。つまり情報の陳腐化が起こるわけだ。この陳腐化の速度も、AI競馬予想に参入する人が増えているために加速しているという。
「株に加えて、競馬などギャンブルの領域で統計解析やAI活用をしたいという学生が増えている。2〜3年前は、株に比べて専門家が多くなかったが、最近になって“東大出身”をうたう人など、専門家が増えてきた印象がある」(ヤナシ社長)
データの重要性は、生成AIの登場によってさらに加速したとヤナシ社長。同氏は生成AIの登場を「データセットと分析手法のうち、分析手法における革命」と評する。
「これまでは、仮にデータをたくさん持っていても(モデルが作れず)参入できなかった。しかし今はChatGPTなどに解析させれば、理論的にはこれまでAIで競馬予想をしてきた人たちとほとんど同じことができる。解析するハードルが生成AIですごく下がった」(ヤナシ社長)
生成AIを本格的に競馬予想に活用している人はまだ多くないものの、分析用モデルの自作に生成AIのコーディング支援を役立てる人は増えているとヤナシ社長。では、ヤナシ社長自身はどんなデータに目を付け、生成AIをどんな方法で競馬予想に役立てているのか──次ページからインタビュー形式で紹介する。
|
|
●生成AIでの競馬予想、具体的な手法は
――ヤナシ社長が行う、生成AIを使った予想手法「生成系競馬予想」は、具体的にはどのような手法なのでしょうか?
ヤナシ社長:まず、ネット上にある膨大な競馬情報の中から、回収率の向上に役立つ最新の予想方法や予想トレンドをAIで発掘します。そして、そこから「適切な的中率を実現しつつ、求める期待値を実現させる買い方」を分析して、新たにAIで生成し続ける手法です。
例えば、独自に集めた特徴量をまとめたスプレッドシートをGeminiにアップ。Deep Researchにかけて、指定した条件に当てはまる馬にどんな傾向があるか、シート内の他のセルや外部のデータベースから調べさせます。人力で1つ1つやるのは大変ですが、Deep Researchなら3分くらいで済みます。出たデータをClaudeでまとめて指定のデザイン法則に基づいたインフォグラフィックにまとめもします。
馬券で勝つのに効果的な要素(ファクター)を探すのは大変ですし、そのファクター自体も日々変化します。私は統計解析とアルゴリズム研究を駆使して、ネット上にあふれる膨大な予想を分析していますが、いま注目しているのは「優秀な予想をするプレイヤーの高回収率ファクター」です。それを解析することで、より強力で安定した予想を作り出す手法を取り入れています。
――株式投資の手法に似ていますね。優秀なファンドを分析して、その投資戦略を学ぶような
ヤナシ社長:まさにその通りです。プレイヤーのスコアリングやランク付けって、競馬の世界では意外と行われていないんです。だからこそ勝てる、という側面もあります(笑)
株式投資で言えば、優秀なインデックスファンド=プレイヤーが、どのような予想ファクター、予想方法を重視しているのかをAIで解析する形ですね。
――「プロ予想スコア」という独自指標にも注目しているとうかがいました
ヤナシ社長:これは、本命馬を単勝・複勝で推奨し、対抗馬を2着以下で購入したい馬として◯▲△の3段階で評価する仕組みです。さらに「プロオッズ」という、プロの予想から算出したオッズも考慮しています。
――「プロオッズ」はどう活用するのでしょうか?
ヤナシ社長:実際のオッズとプロオッズを比較することで、期待値の高い馬を見つけられます。例えば、実際のオッズが10倍でプロオッズが8倍なら「お買い得」、実際のオッズが3倍でプロオッズが5倍なら「お買い得ではない」という判断ができます。
プロオッズの算出と並行して、各予想家の予想が取り込めるサイトからデータを取り込んで独自のオッズを算出し、市場のバイアスを探るような分析も行っています。多数の予想家の予想を統合することで、より客観的な「予想家オッズ」を生成できるんです。これにより、競馬初心者から最上級者まで、それぞれのレベルに応じた馬券戦略を提案できるのが特徴です。
●もうかるのか? これからのAI競馬予想
――そもそも、どうすればAIで勝てるのでしょうか? 専門家たちが口をそろえるのが、「AIの手法よりも、何を学習させるか(データ)が重要」という点です、一般には出回らない独自のデータこそが勝負の鍵を握っているそうですが、具体的にどんなデータに注目しているのでしょうか
ヤナシ社長:特徴量は、AIが学習・予測する際の「材料」のようなものです。料理に例えるなら、どんなに優秀なシェフ(AI)でも、質の悪い食材(特徴量)ではおいしい料理(的中予想)は作れません。私の場合、数多くの当たる予想家の予想分析を通して、優秀な予想家がどんな要素を重視しているかを統計的に解析します。
そこから日々最新の有力な予想ファクターを発掘し、より精度の高い予想を提供するための研究を続けています。私が注目している特徴量には、例えば以下のようなものがあります。
・レース直前の馬の状態:パドックでの歩き方(歩様)、イレ込み具合(気合の入り方)、発汗など
・馬具の変更:前走から「ハミ」「ブリンカー」「シャドーロール」などの馬具を変えてきたか
・中間の育成状況:どの育成牧場でどんな調整をされてきたか
・レース展開:1コーナーや3コーナーでの位置取りや、前後の馬との力関係
――これらは競馬新聞の文字情報だけではなかなか読み取れないデータですね
ヤナシ社長:人間が見ても、立ち上がって暴れている馬や、下痢をしている馬は買いたくなくなるでしょう? そうしたパドックでの様子が、大衆心理に影響を与え、結果的にオッズのゆがみを生むと私は考えています。AI競馬予想で勝つためには「まだ誰も気づいていない、結果に影響を与える特徴量を見つけ出し、AIに学習させる」という、地道な探求が必要です。
●難化するAI競馬予想 今度はどうなる
――今後の技術的な挑戦として、どのようなことを考えていますか?
ヤナシ社長:実は音声データの活用にも興味があります。例えば、グリーンチャンネル(JRA関連法人が運営する競馬専門チャンネル)のパドック解説者の音声を取り込んで、解説者の評価傾向やバイアスを分析できれば、新たな特徴量として活用できるのではないかと考えています。
パドック解説者のトーンでオッズが動く可能性がありますから、感情分析やキーワード解析にかければ、数値では表現しきれない馬の状態評価を定量化できるかもしれません。
―― 人間の感性をAIで数値化する取り組みですね
ヤナシ社長:ただ、正直なところリソースが足りないかなぁ……という現実もあります(笑)
音声データの処理は技術的にも計算資源的にもハードルが高いですからね。でも、将来的にはこうした取り組みも重要になってくると思います。
――AI競馬予想の技術は今後どのように発展していくと思いますか?
ヤナシ社長:間違いなくいえるのは「特徴量エンジニアリングの重要性がさらに高まる」ということです。AIモデル自体の性能向上も重要ですが、それ以上に何を学習させるかの設計が勝敗を分けるようになるでしょう。
リアルタイムデータの活用も進むと思います。レース当日の馬場状態、天候、パドックでの馬の様子、馬具変更なども数値化して取り込めれば、予想精度は大幅に向上するはずです。
――AI予想の限界や課題もあるのでしょうか?
ヤナシ社長:実は最近、非常に深刻な問題を感じています。G1レースだけに絞れば回収率120%という結果も出せるのですが、全てのレースを対象にして回収率110%を維持するのは非常に難しくなってきました。
年々AI競馬ユーザーが増えている影響なのか、極端にオッズのブレが大きくなってきているんです。そのため、回収率100%を超える難易度も格段に高くなっています。回収率110%なんて数字も、本来は実現が相当困難です。
AI競馬の黎明(れいめい)期にAIを取り入れたユーザーは、期待値理論を駆使して120%といった高い回収率を実現できていたと思います。しかし現在は、AI予想が一般化したことで市場全体が効率化され、さすがにそこまでの優位性を保つのは困難になってきているのが現実ですね。
――それでも競馬予想にAIを活用する意義はあるのでしょうか?
ヤナシ社長:もちろんです。ただし、ここで重要なのは「利益を出すこと」と「当てること」は全く違うということです。どんな商売でも投資でも同じことなのですが、利益を出すためには、多くのトライと高い再現性を求める必要があります。
一般の競馬ファンは、どうしても目の前のレースを当てたい気持ちが強く出ます。でもそれは、恒常的に利益を出すことと逆の行動になります。恒常的に利益を出すためには、「どう当てるか」よりも「トータルしてどれだけ回収できるか」を追求しなければなりません。
――具体的にはどのような考え方が重要になるのでしょうか?
ヤナシ社長:いろんな戦術はありますが、例えば「レース的中率が20%で回収率が105%にするにはどうするか?」という考え方が重要になるんです。完璧な予想システムは存在しませんが、AIで勝率を上げつつ、最後は人間の直感や経験も大切にする──そのバランスが重要だと思います。
――職人的な感性も取り入れる必要があるわけですね
ヤナシ社長:まさにその通りです。競馬は生き物が走るスポーツなので、どうしても「想定外」が起こります。だからこそ面白いんですよね。
――そういえば先日、久しぶりに馬券の利益を脱税したニュースが飛び込んできましたね
ヤナシ社長:データ解析がコモディティ化したことで、そういう人は増えていくと思いますよ。同時に、現在の市場環境において、利益を出しづらくなっているのも事実です。市場全体の効率化が進み、従来の手法では優位性を保つのが難しくなってきています。
――主催者側には、もっとゲームの難易度を上げたり、馬券の種類を増やしたり、法改正を求めたいところでしょうか
ヤナシ社長:ギャンブル依存症対策の観点でなかなか難しいとは思いますが、今のままでは競馬予想界のいわゆる“アッパーマス層”が増えすぎて、利益が出しづらいのも事実です。悩ましいところですね。
●宝塚記念の結果を受けて――検証と今後の展望
――ところで先日行われた宝塚記念が終わりましたが、今回の結果は?
ヤナシ社長:当たったと思ったのですが、4着-2着でした(笑)。ただ、netkeibaでも指標が見えるように、私のスコアだと勝率が一定を超えているAIで作成したオッズと実際のオッズの差が120%になっているので、11番人気のショウナンラプンタを本命にしていました。
――結果として、ショウナンラプンタは人気以上の結果を残しました。予測そのものは正解だったと思うのですが
ヤナシ社長:その通りです。馬券の的中はいろんな要素が絡み合った結果ですし、妙味を取るこういう戦略は回数を重ねるしかありませんね。個人的には、ドゥレッツァ(4番人気)、アーバンシック(6番人気)、レガレイラ(2番人気)あたりを無印にしている部分は評価いただきたいポイントです!
これらの馬を軽視した(期待値が低いと判断した)点は、AIの分析が機能した証拠だと思います。AI予想の真価は単発の的中よりも、長期的な期待値の精度にあると考えています。当てることに拘り過ぎると回収率は確実に80%未満に収束していきますからね。
――今回の結果から、どのような検証・分析を行う予定ですか?
ヤナシ社長:まず重要なのは「なぜその結果になったのか」を徹底的に分析することです。私の生成系競馬予想で重視していた特徴量が実際のレース結果とどう相関したか、プロオッズと実際のオッズの乖離(かいり)がどう的中に影響したかを数値的に検証します。
特に宝塚記念のような大レースでは「大舞台での経験値」「ファンの心理的要因」といった、数値化しにくい要素も勝敗に大きく影響します。今回の結果を踏まえて、これらの見えない特徴量をどうAIに学習させるかが次の課題ですね。
――最後に、AI競馬予想の未来について一言お願いします
ヤナシ社長:AI技術の進歩は目覚ましく、競馬予想の可能性もまだまだ広がっていくと確信しています。ただし、技術だけでは限界があります。人間の洞察力、競馬への愛情、そしてファンの皆さんとの対話──これらとAIを組み合わせることで、価値のある生成系競馬予想を続けたいですね。
|
|
|
|
Copyright(C) 2025 ITmedia Inc. All rights reserved. 記事・写真の無断転載を禁じます。
掲載情報の著作権は提供元企業に帰属します。