元気、怒り、哀しみの感情を手軽に調整できる
── CeVIO Creative Studioも、MMDAgentと関連しているんですか?
加藤 文章から音声を合成する「Open JTalk」や声に感情を付ける「HTS」といったボイスエンジン部分は共通しています。ものすごく簡単に説明すると、ボーカロイドとボイスロイドを足したようなソフトです。声質やスピード、大きさなどのパラメーターなどを調整することで無限の声質を作り出せます。
── ボーカロイドとの違いは?
加藤 特徴は、感情値がパラメーター化されていていることです。元気/怒り/哀しみという3種類を操作することで、テキストや歌声で感情を表現できます。あとは我々は「音素グラフ」と名付けていますが、母音子音の単位で音量/強さ/トーンをいじることもできます。母音子音を分けて調整できるので、表現の幅がより広い。ひとつの音符に複数の単語を入られるとか、ひらがな/カタカナ/漢字を混ぜて入力してもとりあえず読み上げてくれるとかは、進化している点じゃないでしょうか。
中田 現状は読み上げのみですが、将来的にはひとつのソフトでボーカルとボイスを切り替えながら、ひとつのタイムライン上に並べて操作できるのもユニークなんです。だからミュージカルのように、寸劇の途中から歌に入るみたいな作品も作りやすい。
加藤 名工大で研究されていた、ボーカロイドの延長ではない別の世代の歌声合成ソフトを体現するプロダクトなんです。
── MMDAgent発の第1号という?
加藤 ユーザーインターフェースをともって、簡単に扱えるものとしては初めてだと思います。名工大の徳田先生が研究しているものには、楽譜を投げると歌として返ってくるウェブアプリの「Sinsy」がありますよね。技術的にはあの延長なんですが、Sinsyは楽譜をMusicXMLで書ける人じゃないと使えない。CeVIO Creative Studioなら、ピアノロール画面を備えているので、DTMになじみのあるもう少し多くの人に使ってもらえるんじゃないかという。
── ということはMIDIを読み込ませることもできますよね?
加藤 その辺はボーカロイドと一緒で、MIDIを読み込ませて、とりあえず歌詞を付けて歌わせるという風にできます。
── 小説を朗読させようとしたときには、元原稿をコピー&ペーストすれば、読ませることができるという。
加藤 CSV形式のテキストを読み込めますので、長文でも別のエディタで原稿を書いてインポートすることができます。一部、漢字が正しく発音されない可能性もありますが、再生して微調整していく感じです。フリー版は最長5分という制約ですが、有償版はその制約が外れます。
── フリーの合成歌声ソフト「UTAU」(関連記事)のように、ユーザーが音声データベースを作ることはできないんですか?
加藤 やはり制作費がかかるので、一般の方が作るのは難しいです。Cevioプロジェクト以外のサードパーティーが取り組むのは可能で、有償版に追加できます。
中田 その点ではボーカロイドと一緒で、音声データベースが増えていくのはアリだと思っています。
── MMDAgentで動いてる、ささらの3Dモデルデータを公開する予定は?
中田 もちろんします。あとは公開タイミングで迷ってて、初音ミクがたどってきたように、歌わせられるようになって楽曲が出てきたあとに、振り付けで遊べるようにしてもらうというのがオーソドックスかと思ってます。
加藤 当初やろうとしていたCGMというアプローチがようやくできるようになったので、ぜひ皆さん使ってくださいという。
── ちなみにマシンスペックはどれくらい必要なんでしょうか?
加藤 CPUの最低動作環境は「Core 2 Duo」ですが、快適に動かそうとするとCore i5/i7ですね。メモリーは4GBほしいところです。