株式会社オフショアカンパニーが、新たに動画音声翻訳サービス「AI動画翻訳くん」の提供を開始した。50カ国以上の言語に対応する同サービスは、これからのグローバルコミュニケーションでの活躍が期待されている。
話している声の特徴を保持したまま50カ国以上の言語に翻訳!「AI動画翻訳くん」
動画内で話している内容を、50カ国以上の言語に翻訳してくれる同サービス。その最大の魅力は、話している声の特徴を完全に保持したまま翻訳することにある。感情やニュアンスまで忠実に再現できるため、まるで本人が外国語を流暢に話しているような動画に仕上がるのだ。ちなみに話し手の音声をそのまま合成し、50カ国以上の言語に対応するサービスは日本初となる。
この技術はどのように実現しているのだろうか?代表取締役の野呂氏は次のように話している。「簡単に説明すると、複数のAI技術を組み合わせ+人の力で解決しています。まず、動画から音声を抽出する技術を使用しています。また、OCRなどの画像中のテキストを読み取る技術も活用しています。次に、抽出したテキストを翻訳し、さらにその翻訳されたテキストを音声に変換します。そして、表情と音声を合成し同期させるAI(=話者の感情に合わせてトーンを変えるAI)も使用しています。例えば、気持ちがこもっている声であれば、翻訳後も同じ声色として再現するわけです。これらの技術を組み合わせることで、言語が違ってもニュアンスがほぼ同じ翻訳を実現しています。ただし、全てをAIに任せるのではなく、最終的な品質確認は人間が行っています。いくらAIが優れているからと言っても、翻訳対象の言語によって同じ意味を表現する言語数が異なるためどうしても翻訳後に早いテンポになってしまったりと、完全に自動化して翻訳することが難しいんです」。
なお、翻訳精度は95%超の世界最高水準で、かつ専門用語にも強い。柔軟なカスタマイズ機能は、企業固有の用語辞書やブランドボイス(その企業やブランドらしい語り口調や文体)にも対応している。またプロに依頼して吹き替えを行う従来型の翻訳サービスに比べ、およそ5倍のスピードで高品質な多言語コンテンツの生成が可能だ。野呂氏は次のように説明する。「各言語に対応する業界用語のデータベースを読み込ませていることに加え、HeyGenなどの翻訳サービスでは無く、独自のAIエンジンを構築しており、より自然で正確な翻訳が可能になっています。これにより、ビジネスシーンでも安心して使用していただけるクオリティを実現しています。ちなみに、私もHeyGenなどのAPIの活用を考えていましたが、日本語という複雑な言語の翻訳においては、まだビジネスで使えるレベルでは無いと考えています。我々のサンプルで英語から日本語への翻訳も実施しているのですが、こちらは実は非常に難易度の高い技術となっており、世界中でもこの精度で実現できているサービスはないと自負しています」。
その上、ソフトのダウンロードや分かりづらい操作は一切なし。使用方法は「AI動画翻訳くん」のサイトを開き、動画をアップロードするだけ。日本で作成・運営しているため、細かい設定や操作も分かりやすく安心したサポートが受けられる。
「AI動画翻訳くん」今後の展望
幅広いシーンでの活躍が見込める「AI動画翻訳くん」。例えばグローバル企業において、経営者のメッセージを話し方やトーンをそのままに世界中の従業員に多言語で発信することができれば、社内全体の士気も上がるだろう。
教育機関のグローバル展開としては、世界的な著名講師の講義をリアルな声や表現を保ちながら、多言語で世界中の学生に提供することが可能となる。エンタメ業界での活用も面白いかもしれない。映画やドラマで俳優の声や演技をそのままに、世界中の視聴者が多言語で楽しめるようになる。
他にも国際会議やサミットのスピーチをリアルタイムで多言語に翻訳し、参加者がすぐに理解できる環境の構築や、医療・ヘルスケア分野において専門家の講演や治療説明を、患者が母国語で理解できるような形での提供が可能。また観光業においては、ホテルや旅館の案内動画を多言語でスムーズに制作できれば、世界中の顧客に寄り添ったサービスができるはず。
野呂氏は「私たちの想像を超えた使い方や、思いもよらない分野での活用など、ユーザーの皆さまとともにサービスの可能性を広げていきたい」と語っていたが、近い将来には思いもよらない分野でも活躍してくれるツールとなるのではないだろうか。