Google翻訳、新たに110言語をサポート LLM「PaLM 2」の貢献で倍増

26

2024年06月28日 07:31  ITmedia NEWS

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia NEWS

英語→マルワディ語翻訳

 米Googleは6月27日(現地時間)、2007年から提供している自動翻訳サービス「Google翻訳」で、新たに110言語をサポートしたと発表した。LLMの「PaLM 2」を使った。これで対応言語数は243になった。


【その他の画像】


 新言語の話者は6億1400万人以上であり、これは世界人の約8%に当たる。新言語の約4分の1はアフリカの言語だ。


 話者が多いがこれまでサポートしてこなかった広東語も追加された。サポートが難しかったのは、書き言葉が北京語と重複することが多く、学習用データを見つけにくかったためとGoogleは説明した。


 「言語には、地域的な変種、方言、異なるスペリングの基準など、膨大なバリエーションがある。また、多くの言語には標準的な形式がないため、“正しい”変種を選ぶことは不可能」とGoogle。Google翻訳ではオンラインでよく使われている変種に最も近いテキストを生成するが、そこには他の変種の要素も混ざっているという。


 PaLM 2により、互いに似ている言語の翻訳を効率的に学習できるようになったという。Googleは1000言語をサポートするAIモデルを構築するイニシアチブを掲げており、今後もさらに多くの言語の変種とスペル規則をサポートしていくとしている。


 サポートする言語のリストはヘルプページで確認できる。


このニュースに関するつぶやき

  • 書き言葉が北京語と重複することが多く、学習用データを見つけにくかった>この説明はおかしい。正確には「広東語はほぼ話しことば専用で、実際に文字にする場合は標準語(普通话)で書かれるから」だろう。
    • イイネ!2
    • コメント 5件

つぶやき一覧へ(14件)

ランキングIT・インターネット

前日のランキングへ

ニュース設定