完全ワイヤレスイヤフォン型のAI文字起こしガジェット「viaim RecDot」と「NoteKit」を試す 600分/月まで無料プランもあり

0

2025年05月20日 12:21  ITmedia PC USER

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia PC USER

完全ワイヤレスイヤフォンタイプの「RecDot」(写真=右)とUSBメモリ型「NoteKit」(写真=左)。デザインもスマートです

 最近はAIを活用したガジェットが次々と登場しています。それらはプライベートで使うというよりは、ビジネスで利用できそうな機能である場合が多いですね。


【その他の画像】


 筆者も徐々にそうした“AIガジェット”に手を伸ばしつつあるのですが、今回は「viaim RecDot」という完全ワイヤレスイヤフォンタイプのリアルタイム録音&文字起こしデバイスを使用する機会を得ました。


 RecDotは、クラウドファンディングのMakuakeで製品を入手できるプロジェクトページが公開されています。一般販売価格は3万4800円(税込み)ですが、数量限定で割り引きプランも用意されています。


 また、ほぼ同じ機能を持っているUSBメモリ型のAIレコーダー「viaim NoteKit」も試すことができたので、こちらも後半で紹介します。


 現在のAIガジェットは、ハードウェアとソフトウェア、クラウドとの合わせ技で価値を作っています。そうした状況の中、ワイヤレスイヤフォンとして高品質でありながら、会議でもしっかりと活用できるRecDotは、ただのイヤフォンに終わらない、高付加価値のある選択肢であると感じました。


 個人的にはイヤフォンは手元にたくさんあるため、会議で活用することを考えると、USBメモリ型のNoteKitの方が使い勝手がよいかもと感じました。


 このガジェットを活用することで、文字起こし、翻訳、要約、ToDo化など、会議に付随する手間を大きく省力化できる可能性があります。そうした使い方にマッチする方には、大いにオススメできる一品です。


 なお、以下は発売前の開発中のソフトウェアにて試用しております。一般発売時には仕様変更の可能性もあるのでご了承ください。


●RecDot、完全ワイヤレスイヤフォンとして高い品質あり


 まずは純粋にイヤフォンとしてRecDotを見た時、3万円超という値段相応の品質を持っているイヤフォンだと感じました。ハイレゾ認証を取得する程度にはこだわられた音質や、単体で9時間、バッテリーケースで充電すれば計36時間再生できるロングバッテリー。高いノイズキャンセリング性能、もちろん周囲の外部音を取りこめます。ノイズキャンセリングの強度も弱/中/強から選択できます。


 バッテリーケースはワイヤレス充電にも対応しています。イヤーピースが耳にフィットしているかを確認できるなど、最近のハイエンドワイヤレスイヤフォンに備わっている機能もあります。私はよくやるのですが、片耳のみで使うことも可能です。


 もちろんiOS、Android、Windows、macOSなど、OS問わずに接続が可能です。後述するAI機能を使うためのアプリも各OSでリリースされる予定です。(記事作成時点においてはiPhoneとWindows版にて試用しています。メーカーによれば、7月末には全てのアプリが出そろう見込みとのこと)。


 私は高品質の音を聞き分ける耳は持ち合わせていないので、音質についてはここでは語りませんが、聞いていて“音が悪い“と感じることは全くありませんでした。専用アプリではエフェクト設定を変更することも可能です。


●イヤフォン単体で録音できる、ユニークな仕様


 RecDotは専用アプリと連動して通話/音声を録音する機能があるのですが、実は、イヤフォン単体でも録音できる機能があります。


 イヤフォン本体にストレージを内蔵しており、直接録音データを保存できます。録音したデータは、専用アプリでイヤフォンからアプリに転送します。転送後、あらためて文字起こしなどの処理を実行できます。


 イヤフォンを装着している場合、棒の部分をつまめば録音が開始されます。実はバッテリーケースに入れたままでも録音ができるのですが、その場合はケースにある録音ボタンを押します。これらの操作にスマホなどとの接続は不要です。


 専用アプリから操作するとリアルタイム文字起こしなどが可能になりますが、ただ録音するだけであれば、上記の通りワンアクションで可能です。「イヤフォン使用中に電話がかかってきて、そのまま録音をスタート」「バッテリーケースに入れたまま、ボイスレコーダー代わりに使用する」──そんな使い方が可能ではないでしょうか。


●真骨頂はアプリとクラウドとの連携


 この製品の本領が発揮されるのは、専用アプリとの連携です。アプリで録音を開始するとviaimクラウドと連動し、リアルタイム文字起こしが可能となります。


 対応言語も多彩です。日本語、英語(米国/イギリス共通)、中国語(簡体字/繁体字)、韓国語、スペイン語、フランス語、ドイツ語、イタリア語、ロシア語、アラビア語、タイ語、ベトナム語、マレー語、ポーランド語、オランダ語、広東語(広東語は文字起こしのみ、翻訳非対応)が利用できます。


 文字起こしは、話者識別も可能です。そして録音終了後、要約したり、ToDoを抽出してリストにできます。もちろん、録音データも再生できます。


これら一連の流れは、対面またはオンラインでの会議を問わず、活用することができるでしょう。もちろん会議だけではなく、ビジネス上で重要となるお客さまへの契約説明など、言った/言わないが問題になるようなシーンでも、録音データは有効です(録音に際しては関係者の合意が必要なのは当然です)。


●そして、リアルタイム翻訳機能


 個人的に一番期待した機能が、リアルタイム翻訳機能です。イヤフォンタイプということもあり、「音声を拾ってリアルタイムに翻訳した音声が耳から聞こえる……」ということかと思いましたが、厳密にはそうではありません。それこそドラえもんの「ほんやくコンニャク」のように、「対面での会話が翻訳されながら会話ができる」という使い方に期待していました。その点では、非常に惜しいとの印象です。


 実際は使い方にややクセがあるのです。まず、専用アプリで録音&リアルタイム文字起こしを開始します。このリアルタイム文字起こしですが、その内容をリアルタイムに共有することができます。「テキストライブ」機能と言って、共有操作をすると、ネット上に専用のURLと4桁のパスワードが発行されます。


 発行されたURLをコピペするか、QRコードで読み取るかをすることで、ブラウザからアクセスします。すると、専用アプリで見る文字起こしと同じように、ブラウザ上にリアルタイムに文字起こしされていきます。そして、このブラウザ側にリアルタイム翻訳機能があります。


 使い手の感覚からすると、専用アプリ内でリアルタイム翻訳を行ってほしいところですが、私が試した時点ではまだ実装されていません。技術的な制約があるのかは分かりませんが、「URLを発行して……」というのは大きな手間ですので、専用アプリ内で完結したいところですね。


 しかし、実はこのブラウザを介してリアルタイム翻訳をする仕組みは、優れている点があります。上記のテキストライブのページですが、最大300人接続できます。そして、このリアルタイム翻訳は、それぞれのブラウザで好きな言語が設定できます。つまり、Bさんは英語に翻訳して聞く。Cさんはアラビア語に翻訳して聞くといった使い方が可能です。


 セミナーなどで、講演者の話を文字起こししながら多国籍の方々にも伝えていく……といった使い方もできるのでは、と感じました。ちなみに、録音を停止すると共有のURLも閉鎖されます。


●AIの精度は?


 リアルタイム翻訳と言っても、タイムラグがないわけではありません。話し手の言語を文字起こしして認識し、ある程度の文節が切れたところで対象の言語に翻訳、そこから音声を生成、という流れになります。そのため、会話の切れ目がないとなかなか翻訳されません。


 こうした「AIを使った文字起こしや翻訳の精度はどうなの?」という点は気になるところだと思います。感覚ではありますが、精度自体は昨今のAIの性能と同等とイメージしていただければよいと思います。


 そして、どちらかというと、話し手の技量が精度に影響するのでは、と感じました。本当にリアルタイムで翻訳させながら伝えようと考えると、話し手が文の切れ目を意識しながら話す必要があります。また、そもそも話し手の滑舌が悪いと、当たり前ですが文字起こし自体がうまくできません。


 これは会議でも同様です。会議の場合、そもそも会話自体が文章を書くように流ちょうには話していません。この辺りはAIで処理するにも限界がありますので、より話し手が明確に話すことが大切になってくるのではないでしょうか。きちんと発音よく、文章として話すと、しっかりと文字起こしできて、それなりに妥当な翻訳となります。


 実際の会議で試してみましたが、正直、文字起こしは内容が分かるような、分からないような、といった文章になっていました。これは、会議の参加者の話し方の問題だと感じます。


 しかし文字起こし内容を要約すると、おおむね内容は合っているという不思議な感じになりました。要約時に(文章の)ノイズがカットされるからでしょうか。


●USBメモリ型の「NoteKit」も実用的


 さて、ここまではイヤフォン型のRecDotについて紹介してきましたが、USBメモリ型AIレコーダー「NoteKit」も発売されます。こちらはイヤフォン機能を省いたモデルで、本体にマイクが搭載されています。専用のアプリケーションで文字起こしやテキストライブなど、同じように使えます。


 最初は専用のアプリケーションをインストールする必要がありますが、以降はUSBポートに挿すだけです。


 便利だと感じたのは、マイクをオン/オフできる物理的なボタンがあることです。そして、その状態が分かるようにLEDが付いていますので、状態も分かりやすいです。まさに、会議で使う人にとって必要な要素が盛り込まれていますね。


 また、本体自体がUSB Type-CとUSB Standard-Aの両方に対応しています、これもまたスマートですね。


 私はオンライン会議の機会が多いですが、誰にも聞かれない場所で行うことがほとんどです。スピーカーから音を出して会話していますので、イヤフォン型のRecDotよりも、NoteKitの方が魅力的に感じました。


●プラットフォームに依存しない柔軟性


 もう1つ、感じたメリットがあります。ZoomやMicrosoft Teams、Google Meetなどにも文字起こしや要約機能は搭載されていますが、基本的にはそれなりのプランを契約しないと使えないようになっています。そして、複数のツールを使う場合は、それぞれ契約する必要があります。


 一方で、RecDotやNoteKitであれば、それらツールの「外」にいます。こうした会議ツールに依存せずに、常に録音や文字起こしができるのは大きな利点だと感じました。


 そして、録音データや文字起こしといった情報はviaimのクラウドに集約されます。自身のアカウントでログインすれば、スマホでもPCでもアクセス可能です。つまり、iPhoneを使おうが、PCを使おうが、「viaimを使う」と決めたら全て1カ所で管理できることになります。これも「外」であるメリットだと感じました。


 なお、AIによる文字起こし/翻訳/要約といった機能はサブスクリプション制になっています。記事執筆時点で600分/月までは無料で使用できます。それ以降は有料プランとなります。


 有料プランは1800分/月で1500円(1万2000円/年)、時間無制限だと月で3000円(2万2000円/年)となります。これはアカウントにひもづく契約となるので、数のデバイスを所有していても、同じアカウントでの利用であれば、無料枠は合計で600分/月となります。


 複数人での会議であっても、1人が契約していれば十分活用できます。使い方によってはコストパフォーマンスも高いかもしれません。会議での利用であれば、法人プランのようなものもニーズとして出てきそうですね。


●データの保管とセキュリティ


 さて、ビジネスで利用するとなると、毎度のことながら壁になってくるのがセキュリティです。


 viaimとして、この点はかなり意識されているようです。ISO27001準拠の管理体制のもと、全ての音声/テキストデータを暗号化、そしていずれは日本国内のサーバで処理を行う(5月下旬予定)とのことです。発売時期には日本国内で完結できる状態となるでしょう。


●会議に付随する作業を省力化


 RecDotはイヤフォンというよりも、ボイスレコーダーにイヤフォンが付いたようなイメージの方が用途としては合っているのかもしれません。そして、専用アプリとクラウドを連携させることにより、文字起こしや翻訳、要約といったサポートを受けることができます。


 録音、文字起こし、翻訳、要約、そして高品質なイヤフォン──これらがパッケージされたものが、viaim RecDotです。購入するだけで、これらが全て手に入ります。


 単なるイヤフォンを購入するのではなく、こうした付加価値のあるイヤフォンを選択する。非常にアリな選択だと感じました。


(製品協力:HONG KONG FUTURE INTELLIGENT TECHNOLOGY)



    ランキングIT・インターネット

    前日のランキングへ

    ニュース設定