ボーカロイド技術論~歌声合成の基礎とその仕組み~ 単行本 – 2014/9/22

剣持秀紀 (著), 藤本健 (著)

ボーカロイド生みの親による歌声合成に関する唯一の解説書!

歌う技術の基本が丸ごとつまった一冊。
ボーカロイドの開発動機から技術の概要、今後の動向まで、技術と業界を網羅。
ボーカロイドや音声認識技術を勉強する人、そしてソフト開発を行う人たちにとっての教科書となる一冊。

■歌声合成について書かれた唯一の本!
■ボーカロイドの生みの親が初めて、その全貌を解説!
■音声合成や音声認識技術との違いがわかる!

[目次]
■Chapter1   VOCALOID前夜
  1961年、コンピュータが世界で初めて歌った「Daisy Bell」
  1000年の歴史を持つしゃべる技術と歌声合成への転換
  XG音源のオプションとして搭載されたフォルマントシンギング音源、PLG100-SG
  [コラム]フォルマントシンギング音源の音声合成方式
  [コラム]有声音と無声音
  VOCALOID以前に登場したヤマハ以外の歌声合成技術
  合弁会社への出向がVOCALOID開発のきっかけに
  Daisyプロジェクトのスタート
  共同研究のパートナー、スペインのポンペウ・ファブラ大学

■Chapter2   VOCALOID1の開発
  音素片を組み合わせて歌わせるという方法論
  初めて歌った「朝」
  [コラム]なぜ、VOCALOIDには入力禁止区域があるのか?
  開発スタートから1年で、ついに歌った1フレーズ
  歌声ライブラリ、合成エンジン、エディタから構成されるシステムが確立
  最初にプレゼンに行った会社、クリプトン・フューチャー・メディア
  2003年2月26日のプレスリリース
  [コラム]VOCALOIDのネーミング
  研究所で製品開発をする珍しいケース
  賛否両論の展示会場と、反応が薄かった国内
  [コラム]なぜ歌声合成が必要なのか?

■Chapter3   VOCALOID1で培われたVOCALOIDの基本技術
  子音と母音を組み合わせる
  素片結合をどのようにして滑らかにするのか
  声質の特徴を表すスペクトル包絡
  歌声合成の流れと母音に含まれる微妙なピッチの揺らぎ
  表記に用いた発音記号、IPAとX-SAMPA
  [コラム]西洋人にとって発音が難しい日本語の「う」
  [コラム]1516年のなぞなぞ「母には二たびあいたれども父には一度もあわず」
  VOCALOID 1.0から1.1への改良でより滑らかな発音に
  [コラム]滑らかになったことへの不満も飛び出した
  音声合成と歌声合成は似て非なる技術
  歌声合成と音声合成の違い

■Chapter4   VOCALOID2の開発とテクノロジー
  5年後の目標は「商業音楽の半分をVOCALOIDにすること」
  エンジンの作り直しでハスキーな声を可能に
  イギリス人デザイナーによってUIは大きく変更
  苦労したリアルタイム発音機能
  2007年1月のNAMM Showで発表したVOCALOID2
  VOCALOID2だからこそできた初音ミクの歌声
  [コラム]世の中のあまりにも大きな反応は自分のこととは思えなかった
  [コラム]サポートの困難さから断念したVOCALOID2でのMac対応

■Chapter5   VOCALOID3の開発と機能
  VOCALOID2での課題は伴奏機能
  [コラム]ReWireを非サポートにした理由
  「VOCALOID Cubase」開発の経緯
  「Triphone機能」の搭載
  「ピッチ間モーフィング機能」の実装
  [コラム]サンプラーとVOCALOIDのアプローチの違い

■Chapter6   VOCALOID3に搭載された新技術
  オプション的扱いだった「Triphone」
  基本となっているのは「Diphone」
  滑らかな発音を実現するTriphone
  [コラム]学術的には真ん中の音素だけをTriphoneと呼ぶ!?
  Triphoneでもっともはっきり違いが現れる[a-h-o]
  Triphoneがサポートするのは、真ん中が子音となるケース
  [コラム]日本語の子音は大きく6つに分類できる
  子音の長さをコントロールするVELOCITY
  子音を伸ばすことを実現したホワイトノイズの活用
  [コラム]VOCALOID1でのVELOCITYは音の強さだった
  無声化のための隠しコマンド「_0」
  [コラム]VOCALOID2の隠しコマンド[h\]

■Chapter7   歌声ライブラリの制作方法
  歌声ライブラリの制作工程
  レコーディングに向けての準備
  レコーディングのスケジュール立て
  レコーディング時の台本
  [コラム]レコーディングは無意味語で行う!?
  演者やライブラリの特徴で変わる音階数
  [コラム]VOCALOIDのレコーディングに使ったスタジオ
  切り出し処理で音素片を収集
  歌声のトリートメント処理
  ファイルを読みこんだあとは調整の繰り返し
  [コラム]言語で大きく異なる音素の組み合わせ数

■Chapter8   VOCALOID Editor for Cubaseとは
  10年前からの構想がようやく実現
  スタインバーグへの交渉からスタート
  UIと信号処理の2本立ての構造
  [コラム]VSTインストゥルメントとは
  [コラム]MIDIとMIDIコントロールチェンジとは
  ノートエクスプレッションを活用したデータのやりとり
  歌詞の入力にはVOCALOIDエディタが必要
  Elments、AI、LEにもVOCALOID専用接続口を設定
  VOCALOID Editor for Cubaseを構成するモジュール群
  Mac対応を前提として1からの作り直し
  マルチスレッドでの動作に対応
  [コラム]Job  Pluginもハイブリッドに対応

■Chapter9   iOSを用いたiVOCALOID
  高まってきたモバイル機器の存在感
  単純移植では重くて動作せず
  [コラム]移植しやすかったのはAndoridよりもiOS
  課題はGUIの開発とデータのスリム化
  バージョンアップで、iPhoneやRetinaに対応
  [コラム]VocaloWitterも共通のエンジンを使用
  iVOCALOIDに隠されていたVSTi機能
  iVOCALOIDはVOCALOID first、ボカロネットへと採用
  ソフトウェア開発キット

■Chapter10   VOCALOIDの今後と可能性
  時間軸方向の処理で歌わせるeVocaloid
  VOCALOIDとeVocaloidの違い
  VOCALOIDをクラウドとシームレスにつなぐボカロネット
  ボカロネットの目玉機能として打ち出したボカロデューサー
  VOCALOIDの今後の可能性

この商品に関する問題を報告する

本の長さ

212ページ
言語

日本語
出版社

ヤマハミュージックエンタテイメントホールディングス
発売日

2014/9/22
寸法

15 x 1.4 x 21 cm
ISBN-10

4636899962
ISBN-13

978-4636899962
すべての詳細を表示

商品の説明

著者について

■著者について
剣持秀紀(けんもち・ひでき)
1967年生まれ。1993年京都大学大学院工学研究科修士課程修了。在学中は京都大学交響楽団に所属し、数々の演奏会に出演。
1993年ヤマハ株式会社入社。音響関係の研究開発に従事した後、1996年L&Hジャパン株式会社(ベルギーのL&H社とヤマハの合弁会社)に出向。
テキスト音声合成技術の開発に従事。この時にベルギービールに目覚め、その研究成果もまとめられている(kenmochi.com/beer/)。
1999年復職。以降VOCALOIDを含む音楽・音声信号処理技術の開発に従事。現在、ヤマハ株式会社事業開発部yamaha+推進室VOCALOIDプロジェクトリーダー。
趣味はヴァイオリン・ヴィオラの演奏とアナログレコードの鑑賞。ターンテーブルはヤマハの銘器GT-2000、カートリッジはDL-103。
プリアンプはヤマハC-2x。パワーアンプはもちろん真空管(C.E.C Tube53)。

藤本健(ふじもと・けん)
1965年生まれ、1989年横浜国立大学工学部電子情報工学科卒業。リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。
高校時代からシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったきた経験がある。
リクルート在籍時代から社外でDTM、オーディオ、レコーディング関連の記事を中心に執筆しており、これまでも多数の関連書籍がある。
現在はブログ型ニュースサイトDTMステーションを運営するほか、AV Watchの連載記事「藤本健のDigital Audio Laboratory」などを執筆している

登録情報

出版社 ‏ : ‎ ヤマハミュージックエンタテイメントホールディングス (2014/9/22)
発売日 ‏ : ‎ 2014/9/22
言語 ‏ : ‎ 日本語
単行本 ‏ : ‎ 212ページ
ISBN-10 ‏ : ‎ 4636899962
ISBN-13 ‏ : ‎ 978-4636899962
寸法 ‏ : ‎ 15 x 1.4 x 21 cm

Amazon 売れ筋ランキング: - 779,410位本 (本の売れ筋ランキングを見る)
- - 329位デジタル音楽

カスタマーレビュー:
4.1 9個の評価

カスタマーレビュー

9グローバルレーティング

星5つ
42%
星4つ
29%
星3つ
29%
星2つ
0%
星1つ
0%

評価はどのように計算されますか?

この商品をレビュー

カスタマーレビューを書く

上位レビュー、対象国：日本

レビューのフィルタリング中に問題が発生しました。後でもう一度試してください。

Amazon カスタマー
よかったと思う
2021年7月20日に日本でレビュー済み
Amazonで購入
技術的なVOCALOIDの話が載っています。
音声合成又は歌声合成に興味がお有りなら買っても良い様な気がします。私はよかったと思っています。

続きを読む

役に立った

レポート
flare36
技術論というよりは開発の歴史かも
2014年11月24日に日本でレビュー済み
　VOCALOIDプロジェクトリーダーである剣持氏が、VOCALOIDの仕組みについて一般向けに解説している本です。
　「VOCALOIDにおいてどのような技術が使われているのか」ということについて、各バージョンごとに解説がなされています(V1からV3まで)。歌唱合成技術の解説のほか、ボカロエディタのUIデザイン・Cubaseとの連携法など、(歌唱合成とは直接関係ない)ソフトウェア開発的な側面にもかなりのページが割かれています。

　一般向けということもあり、技術の詳細にまでふみこんで解説しているわけではなさそうです(例えば数式の類いは一切出てきません)。純粋に歌唱合成部分を解説しているページは案外多くないので、「技術論」というタイトルから「歌唱合成部分のアルゴリズム的な詳細が知れる」と期待すると肩すかしを食らうかもしれません。
　とはいえ解説はわかりやすく書かれており、VOCALOIDを使用する上で役立つ情報も混じっています。バージョンごとの歌唱合成方法の差異については詳しめに解説されていますし、そのほかにも「指定されたdiphoneが存在しない場合の処理方法」や「無声化コマンドの使い方」あたりの仕様は知っていると利用する場面があるかもしれません。

　ただ、個人的な印象としては、情報量のわりには値段がちょっと高いかなという気がします。

続きを読む

12人のお客様がこれが役に立ったと考えています

役に立った

レポート
Kindleのお客様
定価で買うほどの内容ではなかった
2016年8月26日に日本でレビュー済み
Amazonで購入
読み物としては面白い。技術的なことも優しく書いてある。
だが定価で買うほどの内容ではなかった。

続きを読む

3人のお客様がこれが役に立ったと考えています

役に立った

レポート
高橋翔太
VOCALOIDの仕組み、構造が分かる唯一の資料
2015年1月12日に日本でレビュー済み
VOCALOIDって、いわゆるサンプラー的なものだと思っていましたが、この本を読んで、サンプラーとはかなり構造の違うものであることがよくわかりました。

音声合成やシンセサイザによる音の合成に興味があって、調べると、すぐに複雑な数式などが出てきてしまい、読むのを断念してしまうのですが、この本は、VOCALOIDの開発者が丁寧に、しかも分かりやすく解説してくれていて、本当にわかりやすかったです。どのようにして、音素と音素をつなぎ合わせているのか、なぜ1オクターブ以上、上の音や下の音を出しても声質が破たんしないのかなど、興味深く読ませていただきました。

また、これを読む限り、まだVOCALOIDには発展の余地が数多くありそうなことも分かります。ぜひ、これからのVOCALOIDの進化にも期待したいところですね。

続きを読む

6人のお客様がこれが役に立ったと考えています

役に立った

レポート

ボーカロイド技術論~歌声合成の基礎とその仕組み~ 単行本 – 2014/9/22

商品の説明

著者について

登録情報

カスタマーレビュー

この商品をレビュー

上位レビュー、対象国： 日本

レビューのフィルタリング中に問題が発生しました。後でもう一度試してください。

5つ星のうち5.0 よかったと思う

5つ星のうち3.0 技術論というよりは開発の歴史かも

5つ星のうち4.0 定価で買うほどの内容ではなかった

5つ星のうち5.0 VOCALOIDの仕組み、構造が分かる唯一の資料

上位レビュー、対象国：日本

よかったと思う

技術論というよりは開発の歴史かも

定価で買うほどの内容ではなかった

VOCALOIDの仕組み、構造が分かる唯一の資料