ソフトを開発しようと思った動機、背景
「CeVIO Creative Studio」は機械学習により、人間らしい自然な歌声や話し声を生成できることが特徴です。話し声を作るトークエディタでは、音の高さ・長さ・大きさを「音素グラフ」で細かく調整することができ、この機能を使ってソングボイスのない「すずきつづみ」を歌わせる方もいるほど自由度が高いです。一方で、ちょっとアクセントを直すだけでも調整が大変という声もいただいていました。以前から、単語登録を使ったアクセントの修正はできたのですが、単語登録を使う方法は直感的ではなく、手間もかかることが弱点でした。そのため、手軽にアクセントを直すことができる新しい調整画面の必要性を感じていました。
また、ソングエディタで歌声を作るときも含め、トラックヘッダにキャラ画像を表示したり、DAWソフトのようにトラック表示を縦方向に縮められると、複数トラックを編集するときの視認性や操作性が高まると考えていました。
開発中に苦労した点
先の二点だけでもリリース以来の大改造になることはわかっていましたが、なんとか開発を進め、新しい音素グラフ、新しいトラックヘッダを実現しました。新しい音素グラフは、カナ単位で簡単にアクセントを調整でき、以前は別々の画面で調整していた音の高さと長さを画面切り替えせずに調整できるようになりました。
これをベータテストで先行公開したところ、概ね好評だったものの、以前の音素グラフの方が使いやすいという意見も寄せられたため、新しい音素グラフのさらなる改善に取り組むことになり、1ヵ月の予定だったベータテストは4ヵ月の長期間に及びました。
結果的に、新しい音素グラフの使い勝手を向上した上で、旧式の音素グラフもオプションで選択可能とし、音素グラフの配置も画面右側と下側を選ぶことができるなど、さまざまな部分を好みでカスタマイズできるようになりました。
こうした作り込みは当初の想定を大きく超えたものでしたが、長期間のベータテスト中、不具合報告や改善提案などにご協力いただいた多くのユーザのみなさまにお応えする想いで完成させることができました。
ユーザにお勧めする使い方
今回の新機能の中には、字幕ファイルの書き出しがあります。例えば、YouTubeに動画を投稿するときに字幕として使うと、自動翻訳されて外国の方もその動画を楽しむことができるようになりますよ。「CeVIO」の音声を使わない動画でも、「CeVIO Creative Studio」が字幕エディタとして活用できるかもしれません。
また、「CeVIO」の外部連携機能を利用して、自分の声を「さとうささら」などに変換してボイスチャットに利用している方もいるようです。バーチャルユーチューバーをはじめ、最近は音声合成の活躍の機会が増えているので、「CeVIO」がみなさんのお役に立てばうれしいです。
今後のバージョンアップ予定
現在、ご要望を多くいただいているライセンス認証の改善に取り組んでいます。インストール先のパソコンを替えることが気軽にできるようになる予定です。また、英語や中国語の新ボイスも進行中で、メニューなどの多言語対応の開発も進めています。ぜひ、今後とも応援よろしくお願いします。
(CeVIOプロジェクト・川出 陽一)