東京大学や産業技術総合研究所などに所属する研究者らが発表した論文「ClothTalk: 騒音環境でもGPUなしでリアルタイムに綺麗な声を入力可能な導電布マイクロフォン」は、騒音環境でも高品質な音声入力を実現するハンズフリーで使用可能な導電布マイクロフォンを提案した研究報告である。
このデバイスは、騒がしい街路や飲食店、工場内などに相当する約80dBという高い騒音環境下でも、ささやき声を入力できる性能を持ち、GPUを必要とせずにリアルタイムでクリアな音声入力を実現するものである。
現代社会では、オンライン会議やスマートデバイスへの音声入力など、さまざまな場面で音声コミュニケーションの重要性が高まっている。しかし、背景雑音や周囲の声がある騒がしい環境で使用者の声のみを正確に取得することは、従来のマイクロフォンにとって依然として大きな課題であった。
ClothTalkは導電布のダイヤフラムを用いた耳掛け型のマイクロフォンであり、総重量は20g。構造は2枚の銀メッキ導電布の間にPFAフィルムを挟み込んでコンデンサーを形成している。
|
|
重要なのは、このダイヤフラムを意図的に湾曲させる点であり、実験では曲率半径5cm、長さ10cmのダイヤフラムが最も効果的であることを示している。この湾曲により、マイクロフォンの指向性が強化され、使用者の声を優先的に取得しながら周囲のノイズを抑制できる。
特筆すべき特性は、ノイズの入射角度に依存せず一貫してノイズを低減できる点だ。通常のマイクロフォンは角度によってノイズの受け方が大きく変わるが、ClothTalkは周囲全方向からの騒音に対して一貫して低い感度を示す。
信号処理においては、ダイヤフラムの振動による微小な電圧変動をオペアンプで増幅し、アナログデジタル変換器でデジタル形式に変換する。従来の音声強調技術では深層学習を用いたノイズ除去手法が提案されてきたが、ClothTalkはそれらを上回る実験結果を示している。またGPUなどの特別な計算資源を必要としないため、低消費電力で実現でき、モバイル環境での実装も可能になる。
耳掛け型の設計において、マイクは-5度から+5度の垂直角度の範囲内で効果的に機能し、口元の表情を遮ることなく音声取得も可能。また同一話者による通常発話と囁き声の両方を用いたテストも実施し、騒音環境下での囁き声でも入力できることを示している。
この研究は情報処理学会インタラクション2025で最優秀発表賞、最優秀論文賞、インタラクティブ発表賞(PC推薦)を受賞している。
|
|
Source and Image Credits: 平城裕隆, 金澤周介, 三浦貴大, 吉田学, 持丸正明, 暦本純一. ClothTalk:騒音環境でもGPUなしでリアルタイムに綺麗な声を入力可能な導電布マイクロフォン, 情報処理学会, インタラクション2025
※Innovative Tech:このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。X: @shiropen2
|
|
|
|
Copyright(C) 2025 ITmedia Inc. All rights reserved. 記事・写真の無断転載を禁じます。
掲載情報の著作権は提供元企業に帰属します。