画面の表示内容を文字起こし! 「Microsoft PowerToys」向けOCR機能の開発が進行中

0

2022年08月19日 20:02  ITmedia PC USER

  • チェックする
  • つぶやく
  • 日記を書く

ITmedia PC USER

写真PowerToyの現行バージョンは「0.6.1.1」
PowerToyの現行バージョンは「0.6.1.1」

 MicrosoftがWindows 11向けにリリースしている公式ユーティリティーアプリ「PowerToys」に、画面の表示内容や画像ファイルに含まれる文字を読み取る「OCR機能」が追加される予定だ。現在、実装に向けた作業がGitHub上で進められている。



【その他の画像】



 PowerToysは、ディスプレイの指定した位置にウィンドウをスナップ配置できる「FancyZones」や複数のファイル名を一括で変更できる「PowerRename」、右クリックメニューから画像サイズを変更できる「Image Resizer」など、複数のユーティリティーを内包している。



 開発が進められているOCR機能もユーティリティーの1つとして開発が進んでおり、画面内の指定された領域または画像ファイルに含まれる文字を認識してテキストとして取り込めるという。



 画像ファイルのOCR機能は、GoogleのWebブラウザ「Chrome」でも「Google Lens」として実装されている。それに対して、PowerToysに実装される予定の機能は任意のアプリで利用できることが大きなメリットである。



 なお、現時点ではマルチディスプレイへの対応作業などが残っており、一般公開バージョンへの実装にはしばらく時間がかかるかもしれない。


    ニュース設定