「GPT-4o」はなんて読む? 女性の声はスカーレット・ヨハンソン(her)似?

2

2024年05月14日 07:31  ITmedia NEWS

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia NEWS

Dreamforce 2023で「好きな映画は何?」と尋ねられ、「herが好き」と語るサム・アルトマンCEO

 米OpenAIは5月13日(現地時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。このモデルの詳細は別記事にゆずり、本稿ではモデル名の読み方とその由来、「声」についてのうわさを紹介しよう。


【その他の画像】


oはomniのo


 GPT-4oは「ジーピーティーフォーオー」と読む。oは「omni」のo。omni(オムニ)は「オムニバス」「オムニチャンネル」などの日本語にもなっているように、すべて、全体、全方位などを表す言葉だ。


 GPT-4oが、テキスト、音声、画像の任意の組み合わせを入力として受け入れ、テキスト、音声、画像の任意の組み合わせの出力を生成するマルチモーダルなAIであることを表している。


女性の声は映画「Her」に似ている?


 GPT-4o発表のライブストリームデモでは、OpenAIのミラ・ムラティCTO(最高技術責任者)とエンジニアがiPhoneに搭載されたGPT-4oと会話する形で機能を紹介した。


 そこで流れたGPT-4oの“声”は女性のもので、2014年のアカデミー賞脚本賞を獲得した映画「her/世界でひとつの彼女」に登場する人工知能OS「サマンサ」の声によく似ている。この声は俳優のスカーレット・ヨハンソンのものだ。以下の「her」の公式トレーラーと聴き比べられたい。


 デモではこの声の由来についての説明はなかったが、ライブ配信終了直後、サム・アルトマンCEOはXに「her」とだけポストした。


 アルトマン氏は以前、イベントに登壇した際、好きな映画は「her」だと語っていた。


 OpenAIは、15秒分の声のデータがあれば本人そっくりな音声を生成できる生成AIモデル「Voice Engine」を発表している。同じ声を複数言語に吹き替える機能もあるので、GPT-4oの日本語音声もスカーレット・ヨハンソン似な声になるのかもしれない。


 この声が実際にスカーレット・ヨハンソンのデータに基づくものなのかも、その場合に同氏の許可を得ているのかも不明だ。


 人気声優や歌手の声を無断で使う「AIカバー」は日本でも問題になっている。


このニュースに関するつぶやき

  • 両津勘吉「新しい生成AIは『GPT-4o』と書いて『おぴょぴょ』と読む」 日暮熟睡男「『おぴょぴょ』か」 中川圭一「『ジーピーティーフォーオー』です」
    • イイネ!0
    • コメント 2件

つぶやき一覧へ(1件)

ランキングIT・インターネット

前日のランキングへ

ニュース設定