ホーム > mixiニュース > IT・インターネット > IT総合 > 産総研のスパコンで“大規模強化学習” なぜいま「囲碁AI」開発で世界一を目指すのか?

産総研のスパコンで“大規模強化学習” なぜいま「囲碁AI」開発で世界一を目指すのか?

0

2019年04月19日 13:02  ITmedia NEWS

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia NEWS

写真「GLOBISーAQZ」プロジェクトのメンバー
「GLOBISーAQZ」プロジェクトのメンバー

 世界最強の囲碁AI(人工知能)を開発し、若手棋士の育成にも役立てようというプロジェクト「GLOBISーAQZ」が、4月18日に発表された。



【その他の画像】



 Alphabet傘下のDeepMindが開発した囲碁AI「AlphaGo」が次々と世界トップ棋士を破るなど、既にAIの実力は人間を圧倒しているといえる。なぜそのような状況で、わざわざ国産の最強囲碁AIを開発するのか。また、中国テンセントの「絶芸」や、米Facebookの「ELF OpenGo」、ベルギー発の「LeelaZero」など、世界トップレベルの囲碁AIに匹敵するようなものが開発できるのだろうか。



●「これまでと全く違う手法で開発する」 産総研のスパコンを活用



 ビジネススクールを展開するグロービス、囲碁AI「AQ」開発者の山口祐さん、日本のプロ棋士を統括する団体の日本棋院、囲碁AI「Raynz」を開発したベンチャー企業のトリプルアイズによる4者共同のプロジェクト。18日に開催された発表会で、山口さんがGLOBISーAQZの全体像について説明した。



 「AlphaGoは1つのエージェントで強化学習するものでしたが、本プロジェクトではマルチエージェントによる強化学習など、いろいろな学習方法を取り入れながら学習の効率化を図っていきます」と山口さんは説明する。



 米Blizzard Entertainmentのリアルタイムストラテジー(RTS)ゲーム「スタークラフト2」のプロゲーマーに完勝した、DeepMindの「AlphaStar」もマルチエージェントによる強化学習を行っていた。独立した複数のエージェントを競合させ、より強いエージェントを残していく手法だ。山口さんによると、世界でもマルチエージェント学習を採用した囲碁AIはまだなく、差別化するポイントの1つになるという。



 強化学習(reinforcement learning)は、与えられた環境における価値を最大化するようにエージェントを学習させる機械学習のいち手法。またAlphaGoは、行動の選択に「モンテカルロ木探索(MCTS)」と呼ばれる検索アルゴリズムを使う。



 囲碁の強化学習には大規模な計算リソースが必要で、山口さんは「AlphaGoを普通のPC1台で再現しようとすると3000年以上かかります」と苦笑する。



 大規模演算には、産業技術総合研究所(産総研)のスパコン「ABCI」のリソースを活用する。ABCIは産総研が構築・運用する世界最大規模のAI処理向け計算インフラで、AI処理に適した半精度浮動小数点演算性能が550PFLOPS(ペタフロップス)、倍精度浮動小数点演算性能が37PFLOPSで、実運用される計算システムとしては国内最高性能を記録。「ABCIの一部ではありますが、数百台以上のGPUサーバを専有して使えるので、計算資源という意味では世界に負けていないと考えています」(山口さん)



 トリプルアイズは強化学習におけるレーティング(強さの数値化)の計測とグラフによる可視化をし、グロービスは大規模演算のためのインフラ構築と最適化を担うなど、分業して開発する。



 今年2月から学習システムの開発に着手し、4月から囲碁初心者が使う「9路盤」で実験を始めた。5月以降にプロ棋士の対局で使われる「19路盤」での本学習を行う。目標は、8月に中国・山東省で開催される「2019 中信証券杯 第3回世界電脳囲碁オープン戦」で優勝することだ。



 現在トップクラスの囲碁AIは、「シチョウ」や「死活」といった特定の手筋(シチュエーション)の読みが苦手とされている。こうしたコンピュータ特有の弱点に対し、山口さんは「AQではシチョウや基本的な手筋などのベースは読めるようになっています。囲碁のドメイン知識を使った方が当然強くなるので積極的に使っていきたいです」と話す。



 「囲碁は非常に魅力的な深層強化学習(強化学習の一手法)の研究対象です。プロジェクトを通して囲碁の本質に少しでも迫れればと思いますし、若手棋士の育成にも貢献できればこれ以上ない喜びです」(山口さん)



 では、若手棋士の育成にはどう役立てていくのだろうか。



●「新しいAIを使えることがとても楽しみ」 若手棋士の声



 囲碁AIを活用した研究は、既に一部の棋士の間では盛んに行われている。GLOBISーAQZも、日本棋院が運営するネット対局サービス「幽玄の間」に棋士の対戦相手として導入する他、囲碁の研究に活用できるような形での提供も検討しているという。



 普段からAIを使って研究するという上野愛咲美女流棋聖は、「私はAIを使うのが好きで、布石や中盤の感覚などが改善されたと思いますし、成績もちょっとよくなった気がします。新しいAIを使えることをとても楽しみにしています」と期待を寄せる。



 本プロジェクトにテクニカル・アドバイザーとして参画する大橋拓文六段は、「AlphaGoが登場したことで囲碁の世界は180度変わりました。世界と戦うにはAIを活用することが大事だと棋士として痛感しています。AIは強い方が良いと感じていますが、活用の仕方はまだ手探り状態といえます」とコメントした。



 将来的には子供たちでも使えるように、GLOBISーAQZのソフトウェア化も考えているという。日本棋院の理事も務めるグロービスの堀義人社長は、「これからは囲碁AIネイティブの棋士が出てくるでしょう。これまでとは全く違う打ち方をする新たな棋士が出てくることで、中国や韓国との対戦で優位な状況を作れればと思います。10歳以下でも囲碁AIを使えるようにしていきます」と展望を語った。



 8月の世界大会が終わった後は、GLOBISーAQZのプログラムをオープンソース化する予定だ。プロジェクトを終了するわけではなく、適宜アルゴリズムを改善していくという。



 堀社長は「囲碁AI開発を行うことは、自動車メーカーがF1に参戦するようなもの。F1の世界では、世界一を目指すことでエンジンやパーツなどに大きなイノベーションが生まれました。GLOBISーAQZプロジェクトの波及効果で生まれたテクノロジーを教育や経営などにも役立てていきたいと思います」と意気込みを語った。


    あなたにおすすめ

    ニュース設定