音声合成ソフトの開発や販売を手掛けるSSS(仙台市)は3月16日、音声合成ソフト「VOICEVOX」用音源「九州そら」をリリースした。九州そらは、せりふを入力するだけで人間らしい“ささやき声”を出力できるAIだ。 VOICEVOXは、ドワンゴでAIの研究に携わっているヒホ(ヒロシバ)さん(@hiho_karuta)さんが開発した無料の音声合成ソフト。AI技術を活用して、人間らしい話し声を合成できる。イントネーションや話す速さなどの調整も可能。立体音声を制作できるソフトを活用すれば「ASMR動画」の制作にも使える。 九州そらはVOICEVOX用音源として初めてささやき声の合成に対応した。ソフトのダウンロードと利用は無料。「VOICEVOX:九州そら」とクレジットを記入すれば商用利用も無償でできる。 関連記事 「VOICEPEAK」と「CeVIO Pro」、 新しい音声・歌声合成製品はどこがす
著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換
「ガルパンは騒がしい内容なのに全ての音がはっきり聞こえる」──聴覚障がいのアニメファンが語る岩浪音響監督の丁寧すぎる仕事っぷり 2020年3月、あるツイートが話題となった。 聴覚障がい者であるくらはしさんが、アニメ音響監督の岩浪美和さんの手掛けた作品がいかに聞きやすいかを記したものだ。 岩浪音響監督は「サイコパス」シリーズ、『ガールズアンドパンツァー』、『ソードアートオンライン』、「ジョジョ」シリーズなど、数多くの人気作を手掛けている。 聴覚障害者としてアニメの声の聞き取りやすさをメモしているんですが、PSYCHO-PASS 3の聞き取りやすさは神レベルで、無線声、ささやき、室内残響の演出でもほとんどすべて聞き取れる。 音響監督は岩浪美和さんという方で、担当作品を調べてみたら「聞き取りにくかったメモ」に該当なしでした。 — くらはし (@TareObjects) March 27, 202
前日は瀬見川 笑子さんによる「~2019年振り返り的なやつ~」でした。 音楽は、音楽そのものを楽しむもよし、歌詞を考察して自分の感情と向き合うのも良し、聴いてた当時の気持ちや季節を思い出しながら聴くのも良しで楽しいですよね。ちなみに先日好きな音楽を語り散らかす配信をしました。 こんにちは、ナナメです。 フリーランスでイラストレーター兼Live2Dデザイナーをしつつ、『まうちゃん』というキャラクターの身体を借りてVTuber的な活動もしています。 詳しくはTwitterやYoutubeをご覧ください。 今回書くことねおりんの基調エントリで長文が読みたいというお達しがあったため色々考えました。今年はVTuberの活動1周年を迎えたり、夏に会社を辞めてフリーランスになったり、オリジナル同人ゲームを作ったり色んな事があったのでそれらについて振り返ろうかな~と思いましたが、折角なので、好きなASMR
そう、このオーディオ・レコーダーを使うことで、最高で24bit/192kHzのレコーディングができるわけです。また録音したデータは、このアプリ内で再生することができるのはもちろんですが、wavおよびm4aのファイルで保存されるので、これをCubasisやAuriaをはじめとするiOSのDAWなど、別のアプリに持っていって利用することもできるし、MacやWindowsに転送して、PCで利用するということも可能。 オーディオ・レコーダーの設定画面 つまり、いざというときにiPhoneでオーディオ・レコーダーを起動して、録音し、家に持ち帰ってからDAWや波形編集ソフトでじっくり編集……といった使い方ができるわけです。 「でもiPhone単体で24bit/192kHzなんて録音できるんだっけ?」と思った方もいると思います。その通り、iPhoneやiPad本体のマイクから録音する場合は最高で24bi
昨今のVtuber流行に合わせて、まぐろなさんを筆頭に自分も可愛い女の子になりたい(バーチャル美少女受肉したい(通称:バ美肉))男子が急増しております(※当ブログ調べ)。実際に動画をみてみても中身がおじさんとは思えないくらい可愛いですよね。バーチャル受肉に必要なものは体(絵or3D)と声ですが、当ブログは音楽を取り扱ってるということで今回は「声」もとい「ボイスチェンジ」について有識者を交えてガチ検証していきたいと思います。 どのボイスチェンジソフトを使うか ボイチェンの基本になるソフトです。 一番重要ではあるのですが、ボイスチェンジの質に関しては他の要因の方が大きいのがポイントかもしれません。 とりあえず4つほど紹介したいと思います。 恋声 無料のスタンドアロンソフトウェアです。 まぐろなさん(※初期)や兎鞠まりさんなどが使っていて有名ですね。 無料かつソフト1本で完結するということで、音
僕は最近Turing Complete FMというポッドキャストを運営しているのですが、その収録のためにポッドキャスト録音テクニックを結構研究しました。ここではそのノウハウをシェアしようと思います。音がよくて聞きやすいポッドキャストの収録に役立ててもらえると幸いです。 はじめにポッドキャストでは音質は死活的に重要です。音質の大切さは強調してしすぎることはないと思うのですが、この点は甘く見られがちなようです。音の悪い録音を何十分も聞くのは耳が辛くて不必要にストレスがかかります。よいコンテンツを届けたいのなら、音質という、コンテンツ以前の問題は解決しておくべきです。 良い音質のポッドキャストを作成するためには、良い音質で録音する必要があります。良い録音から良い出力を作るのは簡単ですが、悪い録音から良い出力を作るのは、どんなにポストプロダクションを工夫してもほとんど不可能です。悪い音で録音してし
1988年静岡生まれ・静岡在住。平日は制作会社勤務、休日は大体浜名湖にいる。 ダイエット目的でマラソンに挑戦するが、練習後温泉に入り、美味しいものをたらふく食べるというサイクルを繰り返しているため、半年で10kg近く太る。 前の記事:緑色にライトアップされた掛川城がすごい存在感 今回、異例の「本番無しマイクテスト」に付き合ってくれた音響マンは、わたしの父である。 音響マン歴38年。楽器店、レコーディングスタジオ、リゾート施設などさまざまな場所で音響の経験を経て、23年前に独立。音響の会社を立ち上げた。 駆け出しの頃はアマチュアバンドや売り出し中の歌手のライブ音響を、現在はホテルで行われる披露宴などのパーティー、コンサートをはじめとした舞台、企業や地域が主催するイベントの音響を主に行っている。 具体的な数字があった方が読者の皆さんに伝わりやすいと思い、これまで行ったステージの回数を聞いたら「
和歌山県の放送局が、放送業界にちょっとした衝撃を与えている。特定非営利活動法人であるエフエム和歌山が「ナナコ」と名付けたAIアナウンサーの運用を開始したからだ。小規模なコミュニティー放送局では大量のアナウンサーを確保しておく余力はない。だがニュースや天気予報といった番組は、深夜や早朝にも必要とされるものであり、こうした時間帯での運用をどうするのかが課題であった。 音声の読み上げシステムは以前から存在するので、機械が記事を読み上げること自体は、それほど驚くべき出来事ではない。だがエフエム和歌山の事例が画期的なのは、音声読み上げシステムを同局の職員が手作りしてしまったことである。 もちろん職員が音声合成システムまで含めて全てを開発したわけではない。同社が選択したのは、米Amazon.com(以下、アマゾン)がクラウド経由で提供しているAIサービスを利用する手法だった。アマゾンは「AWS(Ama
To understand why WaveNet improves on the current state of the art, it is useful to understand how text-to-speech (TTS) - or speech synthesis - systems work today. The majority of these are based on so-called concatenative TTS, which uses a large database of high-quality recordings, collected from a single voice actor over many hours. These recordings are split into tiny chunks that can then be co
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く