Google、イルカのコミュニケーション解読を目指すAIモデル「DolphinGemma」発表

0

2025年04月15日 08:21  ITmedia NEWS

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia NEWS

Wild Dolphin Project(WDP)のWebサイト

 米Googleは4月14日(現地時間)、イルカのコミュニケーションを解読するための新しいLLM「DolphinGemma」を発表した。4月14日はナショナル・ドルフィン・デーだ(世界量子デーでもある)。


【その他の画像】


 DolphinGemmaが目指すのは、科学者たちがイルカのコミュニケーションを研究し、彼らの会話の内容を理解する手助けをすることだ。科学者らは数十年にわたってこの研究を続けている。


 このプロジェクトは、Wild Dolphin Project(WDP)の長年の研究と協力によって実現した。WDPは1985年から、バハマに生息する大西洋マダライルカの特定の群れを対象に、水中イルカ研究プロジェクトを実施してきた。数十年にわたる水中動画と音声データを、個々のイルカの識別情報、生活史、観察された行動と綿密に結びつけて記録しており、DolphinGemmaはこれらのデータセットと、GoogleのオープンなAIモデル「Gemma」を使って開発された。


 WDPの主な焦点は、イルカの自然なコミュニケーションと社会的な相互作用を観察し分析することだ。例えば、母親と子供が再会するために使う独自の音や、争う際の音、求愛で使われる音などを解析している。


 DolphinGemmaは、Googleの独自音声技術「SoundStream tokenizer」を利用してイルカの音を効率的に表現し、複雑なシーケンスに適したモデルアーキテクチャによって処理される。このモデルは約4億のパラメータを持ち、WDPがフィールドで使用するGoogleの「Pixel」スマートフォン上で直接実行できるように最適化されている。


 DolphinGemmaは、同社のAIモデル「Gemini」を支える研究と技術と同じものが用いられている。DolphinGemmaは、音声入力・音声出力モデルとして機能し、自然なイルカの音のシーケンスを処理してパターン、構造を特定し、最終的にはシーケンス内の次の音を予測する。これは、人間の言語のLLMが文中の次の単語やトークンを予測するのと非常によく似た仕組みだ。


 WDPは既にDolphinGemmaを利用し始めている。将来的には、研究者たちがイルカとの間で共通の語彙を確立し、インタラクティブなコミュニケーションが可能になるかもしれないとGoogleは予想している。


 WDPはまた、ジョージア工科大学との共同開発によるCHAT(Cetacean Hearing Augmentation Telemetry:鯨類聴覚増強テレメトリー)システムを通じて、イルカと簡単な言語を用いた意思疎通を試みている。


 CHATは、複雑な自然言語の解読ではなく、より単純な共通語彙の確立を目指している。水中で使えるコンピュータのようなもので、イルカに対して特定の音を発し、イルカが出した音を解析することで、イルカと簡単なコミュニケーションを行うことを目指す。


 CHATには現在、Pixel端末が使われている。「Pixel 9」シリーズでは、スピーカーとマイクの機能が統合され、イルカの音を聞き取るだけでなく、人間が作成した合成音声を水中で再生し、イルカに伝えることもできる。


 GoogleはDolphinGemmaを今夏にオープンモデルとして公開する予定だ。大西洋マダライルカの音声デーでトレーニングされているが、ハンドウイルカやハシナガイルカなど、他の鯨類の研究者にとってもその有用性が期待されているという。



    ランキングIT・インターネット

    前日のランキングへ

    ニュース設定