テキストを入力するだけで自然な音声で読み上げてくれる音声合成・読み上げソフト。単に読み上げるだけでなく、CGキャラクタの喋るアニメーションも表示される。「Megpoid Talk」は、キーボードから入力したり、クリップボードからコピー&ペーストしたりしたテキストデータを女性の声で読み上げてくれるソフト。メロディと歌詞を入力すると歌を歌ってくれる「VOCALOID」などと同様、実際に存在する人の音声データを加工することにより、自然な音声が合成される仕組み。ベースとなっているのは声優・中島愛(なかじま・めぐみ)さんの声。
音声合成エンジンには「FineSpeech Ver 3」を採用。大量の音声データベース「コーパスベース」による音声合成のほか、外部入力音のイントネーションに合わせた音声合成なども行える。
使い方は簡単。(1)メイン画面上部のテキスト入力エリアに、音声合成させたい文章を入力し、(2)「合成」ボタンをクリックすると音声合成が行われ、自動的にソフトが喋り出す。
画面中段には、「Megpoid Talk」のイメージキャラクタ「GUMI」のアニメーションが表示される。音声合成による発声中は口パクやまばたき、手を動かしたり、首を傾けたりといった動作をするほか、文章入力中などで発声していないときにはあくびをしたり、眠そうな動作をしたりなど、芸が細かい。アニメーションパターンはいくつか用意され、文章入力中、発声中で個別に選択・指定できる。
テキストは、通常の漢字かな混じり文を入力することが可能。漢字の読みが正しくない場合には、ひらがなで入力し直すか、「単語登録」を行えばよい。複数桁の数字を一つひとつ読み上げるか、桁付き数字(何千何百など)で読むかどうかも指定できる。
「制御文字」も指定できる。例えば「強さ」制御文字を入力すると、それ以降の合成はやや強めに発声される。そのほか「非言語音」として、ため息や笑い声、くしゃみ、咳払いなど、50種類以上の「音」を挿入することも可能。これらの非言語音は合成音声ではなく、声優の「演技」が録音された音声そのもの。合成音声にアクセントをつけるのに役立つ。
音声合成結果を調整することも可能。音素ごとの発声の長さ、音の高さを調整できる「ピッチエディット」や、全体の合成イメージに影響を与える「フォルマント」を調整できる。さらにコンプレッサやイコライザなどの設定により、再生音の調整も可能。特に「ピッチ調整」を使えば、話し言葉のイントネーションを調整できる。
マイク入力や既存の音声ファイルからイントネーションだけを抽出し、合成音声に適用できる「旋律抽出」機能もある。実際に人間が読み上げたピッチやタイミングなどの情報がそのまま音声合成に反映されるため、手間をかけずに自然な再生音声が得られる。
合成音声はWAV/MP3形式のファイルに出力でき、ほかのアプリケーションでも利用できる。「VOCALOID3」用のデータ形式「VSQX」で出力することも可能。エンジンが異なるため、「VOCALOID」上で同じ音声合成を行えるわけではないが、「Megpoid Talk」で設定されたイントネーションやピッチなどの情報はそのまま「VOCALOID」でも利用できる。