「ついに使えるものが…」テレワーク拡大で「AI文字起こしサービス」が劇的進化

0

2020年11月28日 08:05  AERA dot.

  • チェックする
  • つぶやく
  • 日記を書く

AERA dot.

写真AERA 2020年11月30日号より
AERA 2020年11月30日号より
 テレワークやオンライン会議の広がりを背景に、AI(人工知能)による自動文字起こしサービスが進化している。これまでは精度に不安があったが、ユーザーからは「ついに使えるものが出てきた」との声があがっている。AERA 2020年11月30日号では、進化する文字起こしサービスを取り上げた。

【AIによる音声文字起こしサービスはコチラ】

*  *  *
 新しいテクノロジーはまずは試してみるのがモットーの複業研究家、西村創一朗さん(32)は9月初め、スマホ画面に釘付けになった。

「これはすごい。すごすぎる」

 Zoomで行った60分の講座を収録した音声を、文字起こしサービス「Rimo Voice」で読み込むと、約5分でテキスト化された。速さに加え、驚いたのはその精度だ。「あー」「えー」などを削除する「ケバ取り」も自動で行われ、適度に句読点や行替えも入っていた。

「いろいろな自動文字起こしサービスを試してきましたが、ついに本当に使えるものが出てきたと感動しました」(西村さん)

 主宰するオンラインサロンで、インタビューや講座内容を掲載することも多いため、西村さんにとって文字起こしは日常の作業だ。これまで試したサービスは精度がイマイチで、聞き直して修正するのにかなりの時間を要した。修正作業を依頼したライターから「最初から自分で起こしたほうが早かった」と言われたこともある。

 開発したRimoの相川直視(あいかわ なおよし)社長によれば、精度は、他のサービスと同様に録音環境によって大きく左右されるが、雑音や発話の重なりなどがなければ、9割を超えるという。

■テキスト化で検索可能

 専門業者の精度はお墨付きだが、1分200円前後が相場なので1時間なら1万2千円程度。ケバ取りや特急仕上げなどを頼めば数千円が上乗せされる。一方Rimoは30秒で20円(従量課金の場合)。1時間だと2400円だ。同社によればサービス開始から2カ月あまりで5千ユーザーを突破。11月末には、動画を視聴しながら、そこから書き起こしたテキストも同じ画面で確認できるようになる。

 AIによる文字起こしサービス拡大の背景にあるのはテレワークの拡大だ。新型コロナウイルスの影響でオンライン会議も日常となった。非対面のコミュニケーションで生じる不安・不信を取り除き、効率的に仕事をするために、情報共有は欠かせない。そのため、議事録の自動作成などへの需要が増している。

「音声を文字化するメリットは、検索が可能になることです」

 Rimoの相川社長にそう聞いて、記者も実際に試してみた。まずRimo Voiceで最近のインタビューを文字起こしし、同じ画面上で、Macの「command」+「F」(Windowsでは「Ctrl」+「F」)で検索バーを出す。そこに会話の中で何度も出てきた「ベンチャー」という単語を入れると一瞬で「ベンチャー」が全てハイライトされた。ここまではいつもの検索と同じだが、Rimoが便利なのは、文字と音声がシンクしているため、ハイライト箇所をクリックすれば、前後を含めた音声が再生されることだ。これなら必要な箇所をピンポイントで聞き直せる。(編集部・石臥薫子)

※【議事録はAIにお任せ? 方言に対応、“同時通訳”も…進化した自動文字起こしサービス】へ続く

※AERA 2020年11月30日号より抜粋

    ニュース設定