More Web Proxy on the site http://driver.im/

このページの本文へ

東大発ベンチャー、超高速「日本語音声生成モデル」を開発グーグルのSoundStormをベースに

2024年08月13日 12時30分更新

文● 田口和裕　編集●ASCII

　東大発ベンチャーのNABLASは8月13日、グーグルが開発した音声生成モデル「SoundStorm」の構造をベースに、数秒のデータを用いて瞬時に日本語の音声生成が可能な「日本語対応音声生成モデル」を開発したことを発表した。

グーグルの音声合成AI「SoundStorm」

　グーグルが開発した最先端の音声生成モデルSoundStormは、わずか3秒程度のオリジナル音声データを元に、テキストプロンプトやサンプル音声データを渡すことで本物のような音声を短時間で生成できるモデルだが、日本語には対応していなかった。

SoundStormをベースに日本語データセットで学習

　上記のSondStormをベースにNABLASが今回開発した日本語対応音声生成モデルは、サンプルとなる数秒の話者Aの日本語音声データと、発話させたい内容を含む話者Bの日本語音声データを基に、話者Aの声質で話者Bの発話内容をわずか0.5秒で生成する「Speech to Speech」型の音声生成が可能となっている。

　同モデルの特徴としては、日本語の音韻体系や韻律パターンを正確に再現し、自然な日本語音声を生成できる点にある。開発にあたっては、SoundStorm内部に構築されているConformerモデルの構造をベースとしつつ、日本語特有の言語構造や音韻規則に対応するよう調整した。

　技術的には、日本語での音声生成に適したオーディオコーデックを用いてモデル開発をしている。その結果、日本語の音声品質や生成音声の類似度スコアにおいて、英語版SoundStormを上回る結果を得たという。

　日本語に特化した音声生成モデルを作るため、学習には独自で処理を行った日本語音声データセットだけを使用されている。このデータセットには、背景の騒音や音を除去する処理を施し、よりクオリティの高い日本語音声の生成を実現しているという。

将来的にはアニメの自動吹き替えも

　現時点での応用範囲としては、医療分野での発話困難者への支援、カスタマーサポートでの感情的な音声の変換、エンターテインメント分野での声質変換などが挙げられる。

　将来的には、アニメやゲームの吹き替え音声などでも、多様な声質や感情表現を持つ日本語音声をリアルタイムに生成できる可能性がある。

　NABLASは今後、SoundStormの他の機能も含め、日本語に特化した音声変換やテキストの読み上げ、リアルタイムでの対話翻訳など、さらなる技術開発を進め、同時に、これらの生成技術の悪用を防ぐための検出技術の開発にも取り組むとしている。

■関連サイト

ツイートする

カテゴリートップへ

AIオススメ記事

2024年12月09日

AI

画像生成AIの進化が早すぎる　2024年に起きたことまとめ
2024年12月02日

AI

イラストに強すぎる画像生成AIモデル　SDXL系「NoobAI-XL」の衝撃
2024年11月25日

AI

3DモデリングにAI革命の兆し　1枚のイラストから3Dデータが完成
2024年11月18日

AI

グーグルのAIがいきなり「死んでください」と言ってきたという報告
2024年12月09日

AI

AI、人間超えた説　OpenAIの従業員が「AGIを達成した」との見方示す
2024年12月09日

AI

人気の画像生成AIツール「ComfyUI」デスクトップアプリがめっちゃラク　初心者にオススメ
2024年12月10日

AI

【速攻解説】OpenAI「Sora」の使い方　月額3000円で出来ること、出来ないこと
2024年11月25日

AI

業界トップ級の画像生成AIツール「Recraft」　Adobeユーザーは体験する価値あり
2024年11月18日

AI

あなたの作業を超効率化する、すごいAIサービス10選【2024年最新版】
2024年12月09日

AI

X、AI「Grok」無料で試せるように　写真みたいな画像も生成できる

ピックアップ

sponsored
基調講演には総務省 CISOの山内智生氏が登壇、サイバー空間をめぐる脅威動向や政策を紹介

ランサム感染の実体験からMDR導入事例までが語られた「Canon Security Days 2024」
sponsored
「LEVEL-15FXA61-R7-RM4X」を試す、重さは2.26kg、144Hzにも対応

実家・ホテル・コタツでゲームしたいなら、Ryzen 7とRTX 4060のLEVEL∞15.6型ノートPC
sponsored
「M75 WIRELESS」「K70 PRO TKL」「VIRTUOSO MAX」を試す

いずちののさんにCORSAIRの白いゲーミングデバイスを試してもらった、淡い光り方に「カワイイ」と太鼓判
sponsored
180Hz駆動でGTG0.5msのRAPID VAパネルを搭載、MSI「MAG 325CQRF QD E2」

ゲームの世界にいるみたい！没入プレイしたいなら大画面の湾曲ゲーミングディスプレーがおすすめ
sponsored
“ツールを入れただけ”じゃ、プロジェクト・タスク管理は回らない！

Backlogの利用をチーム内で定着させたい？初歩のノウハウをまとめます
sponsored
セキュリティログの分析／可視化「FortiAnalyzer」と、高度なAIアシスタント「FortiAI」

“アラート疲れ”で担当者がサイバー攻撃を見落とす！どうやったら防げた？
sponsored

狭い机でも縦置き／横置きどちらもOK！高性能な小型デスクトップパソコンでノートPC以上の作業効率アップを狙う
sponsored
ファーウェイ製スマートウォッチは、家族や知人、自分（!?）へのプレゼントにもピッタリ！

バッテリー長持ちのスマートウォッチで2025年こそ健康的な生活！クリスマスプレゼントに合う製品を紹介！
sponsored
JAPANNEXTの「JN-IB375C144UQR-H」をレビュー

144Hzで21：9の3840×1600ドット37.5型ウルトラワイドディスプレー、ゲームの没入感や仕事の効率アップがスゴイ
sponsored
ポータブルゲーミングスピーカー「TQ-PG300」

パイオニアの小型ゲーミングスピーカー、想像を超える没入感でめちゃくちゃ驚きなんですけど！
sponsored
今回も医療機器認証取得で、かつ前モデルよりも薄く軽いサイズを実現！

スマートウォッチのようでこれは血圧計でもある!? 「HUAWEI WATCH D2 ウェアラブル血圧計」レビュー
sponsored
1本のサウンドバーで360立体音響が実現！

自宅で映画を見るならソニー「HT-A9000」が最高の選択だ
sponsored
「QuTS hero」はランサムウェア対策、安価なSSD／大容量HDDの導入など、中小企業オフィスでも役立つ

NASのデータ保護強化におすすめ！ QNAPのハイエンドOSが中小企業向けモデルにも対応
sponsored

狭い机という課題は「二刀流」で解決、いまあえて選ぶべき一体型パソコンが「IdeaCentre AIO 27IRH9」
sponsored
ゲーマーからクリエイター向けまで、オススメマザーを紹介！

Core Ultra 200Sで自作するならコレ！ASUSのクラス別Z890マザーボード5選
sponsored
自作の煩雑さやトラブルシューティングの手法は軽減！MSI「MAG Z890 TOMAHAWK WIFI」

光らない！ドラゴンなし！ Core Ultra 200S世代の硬派なゲーミングPC向けZ890マザーボードは、自作PC初心者にも簡単で分かりやすくておすすめ
sponsored
Backlogに招待するだけでは「使ってくれない」、ではどうする？

うまくいく！複数人チームでのプロジェクト・タスク管理立ち上げの方法
sponsored

手軽に“壁100インチ”の大画面を楽しもう！自宅が映画館になる「JMGO N1S Ultra 4K」を推す理由
sponsored
JN-38i160U-H-C9をレビュー

PS5 Proの4K/120fpsプレイを大迫力で！38型でKVM機能付きのゲーミング液晶がかなりイイ
sponsored
CyborgやThin、Clawなどが最大25%オフ！

AmazonブラックフライデーでMSIのゲーミングPCが即ポチレベルの格安価格で買えるぞ！
sponsored
リモートワーク環境はまだまだセキュリティ対策が不十分

ハイブリッドワーク中の社員PCがフィッシング詐欺被害！どうやったら防げた？
sponsored
高価格にも納得できるサウンド

7万円の高額ワイヤレスイヤホン「B&W Pi8」の音が、泣けるほど良かった
sponsored
JN-IPS27WQHDR-C65W-FLD-Tをレビュー

27型WQHDディスプレー最強格現る、昇降式・USB給電・KVM・タッチの超多機能で4万円台
sponsored
180Hzで0.5ms（GTG）のRAPID VAバネルを採用した「MAG 275CQRF QD E2」

5万円弱も納得の高速進化したゲーミングディスプレー。27インチならWQHDがおすすめなのにはワケがある
sponsored
UPS搭載で自作派・ゲーマーにも便利、防災の備えこそ、日常的に使いたい

防災用に「ポタ電」を買いたいなら、まずこの１台！　緊急時も日常でもちょうどいい「Jackery ポータブル電源 1000 New」
sponsored
インテル Core Ultra プロセッサー（シリーズ 2）を搭載した最新モデル登場

今後のPCはAI対応が当たり前になる、それならエイサーのCopilot+ PCがいいーー「Swift 14 AI」で生産性アップ
sponsored

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！