認識精度の高さで定評のあるGoogleの音声認識エンジンを採用した音声認識ソフト。Google Chrome上での音声認識結果をリアルタイムで「Voice Rep PRO」のエディタに転送できるようになった。人気テレビ番組でも紹介され、その実力は折り紙付きだ。
「Voice Rep PRO」は、事前の音声登録不要で、インストール直後からすぐに使いはじめることができる高性能音声認識ソフト。パソコンに接続されたマイクで音声を入力したり、録音された音声ファイルを再生したりすることで音声認識が行われ、漢字かな混じり文に変換される。句読点などの付与も自動で行われる。文書編集を行うためのエディタはMicrosoft Word文書の編集も可能な、高性能なもの。新バージョン「3」では、音声認識結果がリアルタイムでエディタに転送されるようになったほか、音声認識時にタイムラインを付与することも可能になった。音声ファイルの自動的な文字化にも対応した。利用するにはGoogle Chromeがインストールされている必要がある。
使い方は簡単。パソコンに接続されたマイクで音声を入力するか、録音された音声ファイルを指定して実行すればよい。マイクを使用する場合は「マイク音声入力」を、また音声ファイルを使用する場合は「再生して文字化」または「お任せ自動文字化」の各タブパネルを利用する(マイクを使用するか、音声ファイルを使用するかで、オーディオ録音デバイスの「既定のデバイス」を変更する必要があるが、取扱説明書などにしたがって行えばよく、難しくはない。開発元のサイトには設定方法の動画も用意されている)。
例えば「マイク音声入力」を使用する場合は、メイン画面で、
- 「マイク音声入力」タブパネルを選択
- (マイクのアイコンが描かれた)「開始」ボタンをクリック
- 文字認識させたい原稿をマイクに向かって読み上げ
すればよい。音声が認識されると同時に文字化・日本語変換され、あわせてメイン画面のエディタに自動的に転送される。認識精度は高いが、誤認識または誤変換されている場合でも、エディタで簡単に修正することが可能だ。新バージョン「3」では、文字化された認識結果にタイムラインが付与されるようになった(タイムライン付与機能はOFFにすることも可能)。エディタへの転送時には例えば、
- 12:18:23 これは
- 12:18:28 VOICE rep Pro 3の
- 12:18:36 テストです
のような形式で転送される。付与されるタイムラインは、「マイク音声入力」では音声入力を行った時刻、「再生して文字化」「お任せ自動文字化」では認識が行われた録音ファイルのカウンター位置となっており、文章の修正を行う際に便利だ。いずれもソースに音声ファイルを使用する「再生して文字化」と「お任せ自動文字化」との違いは、「お任せ自動文字化」では、音声再生速度に音声認識処理が追いつくなくなることを回避するために、処理中に認識確定待ちの待機時間と、再生再開前のわずかな巻き戻しが挿入されること。
- 再生 → 一時停止 → 認識確定待ち(待機) → (わずかな)巻き戻し → 再生 → ……
の繰り返しで音声認識から文字化・日本語変換までが行われる。音声ファイルはWMA/MP3/WAV形式のものに対応する。エディタに転送された認識結果を、より日本語の文章らしくする機能としては、自動的に句読点を挿入する「句読点付与」、数値部分を速記標準、全角標準、半角標準のいずれかの書式に統一して変換する「数値表記変換」が用意されている。
音声認識可能な言語は、日本語、英語、フランス語、ドイツ語、イタリア語、スペイン語、中国語、韓国語、ロシア語、ポルトガル語の10言語。
「Voice Rep PRO」は「Voice Rep」シリーズの上位版。エントリー版にあたる「Voice Rep」では、「再生して文字化」「お任せ自動文字化」などの機能が割愛され、ワープロ機能も簡易版となる。