米Googleは4月14日(現地時間)、イルカのコミュニケーションを解読するための新しいLLM「DolphinGemma」を発表した。4月14日はナショナル・ドルフィン・デーだ(世界量子デーでもある)。
DolphinGemmaが目指すのは、科学者たちがイルカのコミュニケーションを研究し、彼らの会話の内容を理解する手助けをすることだ。科学者らは数十年にわたってこの研究を続けている。
このプロジェクトは、Wild Dolphin Project(WDP)の長年の研究と協力によって実現した。WDPは1985年から、バハマに生息する大西洋マダライルカの特定の群れを対象に、水中イルカ研究プロジェクトを実施してきた。数十年にわたる水中動画と音声データを、個々のイルカの識別情報、生活史、観察された行動と綿密に結びつけて記録しており、DolphinGemmaはこれらのデータセットと、GoogleのオープンなAIモデル「Gemma」を使って開発された。
WDPの主な焦点は、イルカの自然なコミュニケーションと社会的な相互作用を観察し分析することだ。例えば、母親と子供が再会するために使う独自の音や、争う際の音、求愛で使われる音などを解析している。
|
|
DolphinGemmaは、Googleの独自音声技術「SoundStream tokenizer」を利用してイルカの音を効率的に表現し、複雑なシーケンスに適したモデルアーキテクチャによって処理される。このモデルは約4億のパラメータを持ち、WDPがフィールドで使用するGoogleの「Pixel」スマートフォン上で直接実行できるように最適化されている。
DolphinGemmaは、同社のAIモデル「Gemini」を支える研究と技術と同じものが用いられている。DolphinGemmaは、音声入力・音声出力モデルとして機能し、自然なイルカの音のシーケンスを処理してパターン、構造を特定し、最終的にはシーケンス内の次の音を予測する。これは、人間の言語のLLMが文中の次の単語やトークンを予測するのと非常によく似た仕組みだ。
WDPは既にDolphinGemmaを利用し始めている。将来的には、研究者たちがイルカとの間で共通の語彙を確立し、インタラクティブなコミュニケーションが可能になるかもしれないとGoogleは予想している。
WDPはまた、ジョージア工科大学との共同開発によるCHAT(Cetacean Hearing Augmentation Telemetry:鯨類聴覚増強テレメトリー)システムを通じて、イルカと簡単な言語を用いた意思疎通を試みている。
CHATは、複雑な自然言語の解読ではなく、より単純な共通語彙の確立を目指している。水中で使えるコンピュータのようなもので、イルカに対して特定の音を発し、イルカが出した音を解析することで、イルカと簡単なコミュニケーションを行うことを目指す。
|
|
CHATには現在、Pixel端末が使われている。「Pixel 9」シリーズでは、スピーカーとマイクの機能が統合され、イルカの音を聞き取るだけでなく、人間が作成した合成音声を水中で再生し、イルカに伝えることもできる。
GoogleはDolphinGemmaを今夏にオープンモデルとして公開する予定だ。大西洋マダライルカの音声デーでトレーニングされているが、ハンドウイルカやハシナガイルカなど、他の鯨類の研究者にとってもその有用性が期待されているという。
|
|
|
|
Copyright(C) 2025 ITmedia Inc. All rights reserved. 記事・写真の無断転載を禁じます。
掲載情報の著作権は提供元企業に帰属します。