こだわるべきは音質ではない!? ヤマハの歌うロボット「Charlie」開発秘話【開発者の矜持 #02】

1

2020年12月04日 12:02  Techable

  • 限定公開( 1 )

  • チェックする
  • つぶやく
  • 日記を書く

Techable

写真
ヤマハ株式会社が開発している、歌って会話するコミュニケーションロボット「Charlie(チャーリー)」。

仕事もプライベートも充実させたい働く女性を対象にしたプロダクトで、今後モニター募集などを行ってさらに開発を進め、2021年春の発売を予定している。紹介動画を見ていただければわかる通り、「Charlie」はユーザーが話しかけるとミュージカルのようにメロディにのせて返答する。また、素直に答えるだけではなく、ユーモアを交えて、ときにはシニカルなことを言ってくるその「性格」にも特徴がある。

そんな「Charlie」の開発をリードしたのが、同社UX企画グループの倉光(くらみつ)氏と柴瀬(しばせ)氏。開発の裏側には、「音」にこだわりを持つヤマハならではの困難もあったようだ。
「人間らしく」ではなく「Charlieらしく」[caption id="attachment_143457" align="aligncenter" width="600"] (左から)ヤマハ株式会社 UX戦略部UX企画グループ 主事 倉光大樹(くらみつだいき)氏、同じく主事 柴瀬頌子(しばせしょうこ)氏[/caption]ーー紹介動画を見るとかなり高度なコミュニケーションをしているように感じましたが、どのような技術が使われているのでしょうか。

倉光:実は、技術的には一般的なAIスピーカーとほとんど変わらないんです。

高度なコミュニケーションのように見えるのは、「音楽」と「キャラクター」の要素が加わっているからだと思います。

ーーどういうことですか?

倉光:世の中には「コミュニケーションロボット」と呼ばれるものがいくつもありますが、実際に話してみると少し気持ち悪さを感じませんか?

何が気持ち悪いかというと、人のマネをしようとしてできていない、という部分だと思うんですよね。アクセントもイントネーションも人のようにはできないのに、無理やり人に合わせて喋ろうとするところに違和感をおぼえるんだと思うんです。

ロボットが人間っぽく話さなければいけないという決まりはないので、心理的距離が近いコミュニケーションのあり方を考えると、現段階では普通に喋るより歌うほうがいいと思っています。音楽には感情を表現できるという特性もありますしね。

柴瀬:直接だと言いづらかったり角が立ったりするけど、歌詞だと伝わりやすいことってありますよね。

そう考えるとむしろ、ロボットだからこそ、歌に乗せるからこそ、実現できるコミュニケーションというのもあるのかなって思います。

ーーなるほど、それが「音楽」の要素ですね。では「キャラクター」の要素とは何でしょうか?

倉光:紹介動画にもありますが……例えば「私、頑張ってるよね」と話しかけたとしますよね。これに対して素直に「頑張ってるね」と返すのではなく、Charlieは「半径2kmで1番頑張ってるのは君さ」という歌で返したりします。

人が話した内容をテキスト化して自然言語処理をするところまでは他のAIスピーカーと同じですが、それに対してどう答えるかという設定をCharlie独自のものにしているんです。この「性格」を決める部分はかなりこだわりました。

ーー性格、ですか?

柴瀬:「Charlieらしさ」ですね。公開していないんですが、この基準をすり合わせるためにCharlieについての小説を作るところから始めたんです。彼の人生経験などが書かれた物語を作り上げることでキャラクター像の認識を合わせ、そこから「彼ならどのようなセリフを言うか」を考えました。

私自身、開発序盤はCharlieをガジェットとして捉えていましたが、次第にキャラクターとして彼を見るようになっていました。機能性を追求するよりもキャラクター性を追求していくほうが、プロダクトの完成度は高くなるんじゃないかなって。
ヤマハのプライド vs ユーザーファーストーー「Charlie」の開発において苦労した点もあったかと思いますが、いかがでしょうか?

柴瀬:そうですね、Charlieをつくるにあたって、部屋に馴染むサイズにするというこだわりがありました。他のインテリアの邪魔をせず、雑貨のように部屋に置けるサイズ感を意識したんです。

ここで問題になったのは、内蔵するスピーカーの大きさや品質について。

ヤマハとして出すのであればスピーカー品質にもこだわるべきだという意見と、今回のターゲットユーザーはそこを求めているわけじゃないんだという意見とでバトルがありました(笑)。

ーーどうやって決着がついたんですか?

柴瀬:スピーカー品質に限らずやはり決め手はユーザーの声です。今回、Charlieの開発にあたってターゲットユーザーの調査を要所要所で行っていて、その意見をかなり大事にしています。

私が一人が言っているだけだと「そうは言ってもな……」ってなるんですよ。でも実際の調査結果を見せると受け入れてくれる。

ユーザーの声を元にプライオリティを決めたことで、その後の議論がスムーズになりました。

倉光:ユーザーファーストも簡単じゃなかったよね(笑)。

あとはやっぱり「どこで折り合いをつけるか」というのは大事だなと思いました。時間とお金をかければいくらでも理想を追求できますが、世の中に出さなければ意味がないわけで。

例えば、歌をつくるという機能をとっても、AIをフル活用した自動作曲システムを作るという方法もあったんですが、それをするには時間とコストがかかります。とはいえ、既存の技術だけだとなかなか満足いくものが作れない。

最終的には自分たちで自動作曲の仕組みを考えたんですが、ものすごくハイテクなものが入っているわけではないんです。ターゲットユーザーから「これならいいね」と言ってもらえるギリギリの割り切りポイントを探しました。

割り切りポイントというとあまり響きは良くありませんが、それを探し切るためにホントのたうち回って、やっと出すことができたのが今のプロダクトなんですよね。

リリースには「ペット以上恋人未満」なんて書きましたが、本音を言うと「ペット以上」というのは謙遜で、恋人のようにユーザーの心のもやもやを取れる存在になってほしいなと思っています。

PR TIMES

    ランキングIT・インターネット

    前日のランキングへ

    ニュース設定