技術的なVOCALOIDの話が載っています。
音声合成又は歌声合成に興味がお有りなら買っても良い様な気がします。私はよかったと思っています。
無料のKindleアプリをダウンロードして、スマートフォン、タブレット、またはコンピューターで今すぐKindle本を読むことができます。Kindleデバイスは必要ありません。
ウェブ版Kindleなら、お使いのブラウザですぐにお読みいただけます。
携帯電話のカメラを使用する - 以下のコードをスキャンし、Kindleアプリをダウンロードしてください。
ボーカロイド技術論~歌声合成の基礎とその仕組み~ 単行本 – 2014/9/22
ボーカロイド生みの親による 歌声合成に関する唯一の解説書!
歌う技術の基本が丸ごとつまった一冊。
ボーカロイドの開発動機から技術の概要、今後の動向まで、技術と業界を網羅。
ボーカロイドや音声認識技術を勉強する人、そしてソフト開発を行う人たちにとっての教科書となる一冊。
■歌声合成について書かれた唯一の本!
■ボーカロイドの生みの親が初めて、その全貌を解説!
■音声合成や音声認識技術との違いがわかる!
[目次]
■Chapter1   VOCALOID前夜
  1961年、コンピュータが世界で初めて歌った「Daisy Bell」
  1000年の歴史を持つしゃべる技術と歌声合成への転換
  XG音源のオプションとして搭載されたフォルマントシンギング音源、PLG100-SG
  [コラム]フォルマントシンギング音源の音声合成方式
  [コラム]有声音と無声音
  VOCALOID以前に登場したヤマハ以外の歌声合成技術
  合弁会社への出向がVOCALOID開発のきっかけに
  Daisyプロジェクトのスタート
  共同研究のパートナー、スペインのポンペウ・ファブラ大学
■Chapter2   VOCALOID1の開発
  音素片を組み合わせて歌わせるという方法論
  初めて歌った「朝」
  [コラム]なぜ、VOCALOIDには入力禁止区域があるのか?
  開発スタートから1年で、ついに歌った1フレーズ
  歌声ライブラリ、合成エンジン、エディタから構成されるシステムが確立
  最初にプレゼンに行った会社、クリプトン・フューチャー・メディア
  2003年2月26日のプレスリリース
  [コラム]VOCALOIDのネーミング
  研究所で製品開発をする珍しいケース
  賛否両論の展示会場と、反応が薄かった国内
  [コラム]なぜ歌声合成が必要なのか?
■Chapter3   VOCALOID1で培われたVOCALOIDの基本技術
  子音と母音を組み合わせる
  素片結合をどのようにして滑らかにするのか
  声質の特徴を表すスペクトル包絡
  歌声合成の流れと母音に含まれる微妙なピッチの揺らぎ
  表記に用いた発音記号、IPAとX-SAMPA
  [コラム]西洋人にとって発音が難しい日本語の「う」
  [コラム]1516年のなぞなぞ「母には二たびあいたれども父には一度もあわず」
  VOCALOID 1.0から1.1への改良でより滑らかな発音に
  [コラム]滑らかになったことへの不満も飛び出した
  音声合成と歌声合成は似て非なる技術
  歌声合成と音声合成の違い
■Chapter4   VOCALOID2の開発とテクノロジー
  5年後の目標は「商業音楽の半分をVOCALOIDにすること」
  エンジンの作り直しでハスキーな声を可能に
  イギリス人デザイナーによってUIは大きく変更
  苦労したリアルタイム発音機能
  2007年1月のNAMM Showで発表したVOCALOID2
  VOCALOID2だからこそできた初音ミクの歌声
  [コラム]世の中のあまりにも大きな反応は自分のこととは思えなかった
  [コラム]サポートの困難さから断念したVOCALOID2でのMac対応
■Chapter5   VOCALOID3の開発と機能
  VOCALOID2での課題は伴奏機能
  [コラム]ReWireを非サポートにした理由
  「VOCALOID Cubase」開発の経緯
  「Triphone機能」の搭載
  「ピッチ間モーフィング機能」の実装
  [コラム]サンプラーとVOCALOIDのアプローチの違い
■Chapter6   VOCALOID3に搭載された新技術
  オプション的扱いだった「Triphone」
  基本となっているのは「Diphone」
  滑らかな発音を実現するTriphone
  [コラム]学術的には真ん中の音素だけをTriphoneと呼ぶ!?
  Triphoneでもっともはっきり違いが現れる[a-h-o]
  Triphoneがサポートするのは、真ん中が子音となるケース
  [コラム]日本語の子音は大きく6つに分類できる
  子音の長さをコントロールするVELOCITY
  子音を伸ばすことを実現したホワイトノイズの活用
  [コラム]VOCALOID1でのVELOCITYは音の強さだった
  無声化のための隠しコマンド「_0」
  [コラム]VOCALOID2の隠しコマンド[h\]
■Chapter7   歌声ライブラリの制作方法
  歌声ライブラリの制作工程
  レコーディングに向けての準備
  レコーディングのスケジュール立て
  レコーディング時の台本
  [コラム]レコーディングは無意味語で行う!?
  演者やライブラリの特徴で変わる音階数
  [コラム]VOCALOIDのレコーディングに使ったスタジオ
  切り出し処理で音素片を収集
  歌声のトリートメント処理
  ファイルを読みこんだあとは調整の繰り返し
  [コラム]言語で大きく異なる音素の組み合わせ数
■Chapter8   VOCALOID Editor for Cubaseとは
  10年前からの構想がようやく実現
  スタインバーグへの交渉からスタート
  UIと信号処理の2本立ての構造
  [コラム]VSTインストゥルメントとは
  [コラム]MIDIとMIDIコントロールチェンジとは
  ノートエクスプレッションを活用したデータのやりとり
  歌詞の入力にはVOCALOIDエディタが必要
  Elments、AI、LEにもVOCALOID専用接続口を設定
  VOCALOID Editor for Cubaseを構成するモジュール群
  Mac対応を前提として1からの作り直し
  マルチスレッドでの動作に対応
  [コラム]Job  Pluginもハイブリッドに対応
■Chapter9   iOSを用いたiVOCALOID
  高まってきたモバイル機器の存在感
  単純移植では重くて動作せず
  [コラム]移植しやすかったのはAndoridよりもiOS
  課題はGUIの開発とデータのスリム化
  バージョンアップで、iPhoneやRetinaに対応
  [コラム]VocaloWitterも共通のエンジンを使用
  iVOCALOIDに隠されていたVSTi機能
  iVOCALOIDはVOCALOID first、ボカロネットへと採用
  ソフトウェア開発キット
■Chapter10   VOCALOIDの今後と可能性
  時間軸方向の処理で歌わせるeVocaloid
  VOCALOIDとeVocaloidの違い
  VOCALOIDをクラウドとシームレスにつなぐボカロネット
  ボカロネットの目玉機能として打ち出したボカロデューサー
  VOCALOIDの今後の可能性
歌う技術の基本が丸ごとつまった一冊。
ボーカロイドの開発動機から技術の概要、今後の動向まで、技術と業界を網羅。
ボーカロイドや音声認識技術を勉強する人、そしてソフト開発を行う人たちにとっての教科書となる一冊。
■歌声合成について書かれた唯一の本!
■ボーカロイドの生みの親が初めて、その全貌を解説!
■音声合成や音声認識技術との違いがわかる!
[目次]
■Chapter1   VOCALOID前夜
  1961年、コンピュータが世界で初めて歌った「Daisy Bell」
  1000年の歴史を持つしゃべる技術と歌声合成への転換
  XG音源のオプションとして搭載されたフォルマントシンギング音源、PLG100-SG
  [コラム]フォルマントシンギング音源の音声合成方式
  [コラム]有声音と無声音
  VOCALOID以前に登場したヤマハ以外の歌声合成技術
  合弁会社への出向がVOCALOID開発のきっかけに
  Daisyプロジェクトのスタート
  共同研究のパートナー、スペインのポンペウ・ファブラ大学
■Chapter2   VOCALOID1の開発
  音素片を組み合わせて歌わせるという方法論
  初めて歌った「朝」
  [コラム]なぜ、VOCALOIDには入力禁止区域があるのか?
  開発スタートから1年で、ついに歌った1フレーズ
  歌声ライブラリ、合成エンジン、エディタから構成されるシステムが確立
  最初にプレゼンに行った会社、クリプトン・フューチャー・メディア
  2003年2月26日のプレスリリース
  [コラム]VOCALOIDのネーミング
  研究所で製品開発をする珍しいケース
  賛否両論の展示会場と、反応が薄かった国内
  [コラム]なぜ歌声合成が必要なのか?
■Chapter3   VOCALOID1で培われたVOCALOIDの基本技術
  子音と母音を組み合わせる
  素片結合をどのようにして滑らかにするのか
  声質の特徴を表すスペクトル包絡
  歌声合成の流れと母音に含まれる微妙なピッチの揺らぎ
  表記に用いた発音記号、IPAとX-SAMPA
  [コラム]西洋人にとって発音が難しい日本語の「う」
  [コラム]1516年のなぞなぞ「母には二たびあいたれども父には一度もあわず」
  VOCALOID 1.0から1.1への改良でより滑らかな発音に
  [コラム]滑らかになったことへの不満も飛び出した
  音声合成と歌声合成は似て非なる技術
  歌声合成と音声合成の違い
■Chapter4   VOCALOID2の開発とテクノロジー
  5年後の目標は「商業音楽の半分をVOCALOIDにすること」
  エンジンの作り直しでハスキーな声を可能に
  イギリス人デザイナーによってUIは大きく変更
  苦労したリアルタイム発音機能
  2007年1月のNAMM Showで発表したVOCALOID2
  VOCALOID2だからこそできた初音ミクの歌声
  [コラム]世の中のあまりにも大きな反応は自分のこととは思えなかった
  [コラム]サポートの困難さから断念したVOCALOID2でのMac対応
■Chapter5   VOCALOID3の開発と機能
  VOCALOID2での課題は伴奏機能
  [コラム]ReWireを非サポートにした理由
  「VOCALOID Cubase」開発の経緯
  「Triphone機能」の搭載
  「ピッチ間モーフィング機能」の実装
  [コラム]サンプラーとVOCALOIDのアプローチの違い
■Chapter6   VOCALOID3に搭載された新技術
  オプション的扱いだった「Triphone」
  基本となっているのは「Diphone」
  滑らかな発音を実現するTriphone
  [コラム]学術的には真ん中の音素だけをTriphoneと呼ぶ!?
  Triphoneでもっともはっきり違いが現れる[a-h-o]
  Triphoneがサポートするのは、真ん中が子音となるケース
  [コラム]日本語の子音は大きく6つに分類できる
  子音の長さをコントロールするVELOCITY
  子音を伸ばすことを実現したホワイトノイズの活用
  [コラム]VOCALOID1でのVELOCITYは音の強さだった
  無声化のための隠しコマンド「_0」
  [コラム]VOCALOID2の隠しコマンド[h\]
■Chapter7   歌声ライブラリの制作方法
  歌声ライブラリの制作工程
  レコーディングに向けての準備
  レコーディングのスケジュール立て
  レコーディング時の台本
  [コラム]レコーディングは無意味語で行う!?
  演者やライブラリの特徴で変わる音階数
  [コラム]VOCALOIDのレコーディングに使ったスタジオ
  切り出し処理で音素片を収集
  歌声のトリートメント処理
  ファイルを読みこんだあとは調整の繰り返し
  [コラム]言語で大きく異なる音素の組み合わせ数
■Chapter8   VOCALOID Editor for Cubaseとは
  10年前からの構想がようやく実現
  スタインバーグへの交渉からスタート
  UIと信号処理の2本立ての構造
  [コラム]VSTインストゥルメントとは
  [コラム]MIDIとMIDIコントロールチェンジとは
  ノートエクスプレッションを活用したデータのやりとり
  歌詞の入力にはVOCALOIDエディタが必要
  Elments、AI、LEにもVOCALOID専用接続口を設定
  VOCALOID Editor for Cubaseを構成するモジュール群
  Mac対応を前提として1からの作り直し
  マルチスレッドでの動作に対応
  [コラム]Job  Pluginもハイブリッドに対応
■Chapter9   iOSを用いたiVOCALOID
  高まってきたモバイル機器の存在感
  単純移植では重くて動作せず
  [コラム]移植しやすかったのはAndoridよりもiOS
  課題はGUIの開発とデータのスリム化
  バージョンアップで、iPhoneやRetinaに対応
  [コラム]VocaloWitterも共通のエンジンを使用
  iVOCALOIDに隠されていたVSTi機能
  iVOCALOIDはVOCALOID first、ボカロネットへと採用
  ソフトウェア開発キット
■Chapter10   VOCALOIDの今後と可能性
  時間軸方向の処理で歌わせるeVocaloid
  VOCALOIDとeVocaloidの違い
  VOCALOIDをクラウドとシームレスにつなぐボカロネット
  ボカロネットの目玉機能として打ち出したボカロデューサー
  VOCALOIDの今後の可能性
- 本の長さ212ページ
- 言語日本語
- 出版社ヤマハミュージックエンタテイメントホールディングス
- 発売日2014/9/22
- 寸法15 x 1.4 x 21 cm
- ISBN-104636899962
- ISBN-13978-4636899962
商品の説明
著者について
■著者について
剣持秀紀(けんもち・ひでき)
1967年生まれ。1993年京都大学大学院工学研究科修士課程修了。在学中は京都大学交響楽団に所属し、数々の演奏会に出演。
1993年ヤマハ株式会社入社。音響関係の研究開発に従事した後、1996年L&Hジャパン株式会社(ベルギーのL&H社とヤマハの合弁会社)に出向。
テキスト音声合成技術の開発に従事。この時にベルギービールに目覚め、その研究成果もまとめられている(kenmochi.com/beer/)。
1999年復職。以降VOCALOIDを含む音楽・音声信号処理技術の開発に従事。現在、ヤマハ株式会社事業開発部yamaha+推進室VOCALOIDプロジェクトリーダー。
趣味はヴァイオリン・ヴィオラの演奏とアナログレコードの鑑賞。ターンテーブルはヤマハの銘器GT-2000、カートリッジはDL-103。
プリアンプはヤマハC-2x。パワーアンプはもちろん真空管(C.E.C Tube53)。
藤本健(ふじもと・けん)
1965年生まれ、1989年横浜国立大学工学部電子情報工学科卒業。リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。
高校時代からシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったきた経験がある。
リクルート在籍時代から社外でDTM、オーディオ、レコーディング関連の記事を中心に執筆しており、これまでも多数の関連書籍がある。
現在はブログ型ニュースサイトDTMステーションを運営するほか、AV Watchの連載記事「藤本健のDigital Audio Laboratory」などを執筆している
剣持秀紀(けんもち・ひでき)
1967年生まれ。1993年京都大学大学院工学研究科修士課程修了。在学中は京都大学交響楽団に所属し、数々の演奏会に出演。
1993年ヤマハ株式会社入社。音響関係の研究開発に従事した後、1996年L&Hジャパン株式会社(ベルギーのL&H社とヤマハの合弁会社)に出向。
テキスト音声合成技術の開発に従事。この時にベルギービールに目覚め、その研究成果もまとめられている(kenmochi.com/beer/)。
1999年復職。以降VOCALOIDを含む音楽・音声信号処理技術の開発に従事。現在、ヤマハ株式会社事業開発部yamaha+推進室VOCALOIDプロジェクトリーダー。
趣味はヴァイオリン・ヴィオラの演奏とアナログレコードの鑑賞。ターンテーブルはヤマハの銘器GT-2000、カートリッジはDL-103。
プリアンプはヤマハC-2x。パワーアンプはもちろん真空管(C.E.C Tube53)。
藤本健(ふじもと・けん)
1965年生まれ、1989年横浜国立大学工学部電子情報工学科卒業。リクルートに15年勤務した後、2004年に有限会社フラクタル・デザインを設立。
高校時代からシーケンスソフトの開発やMIDIインターフェイス、パソコン用音源の開発に携わったきた経験がある。
リクルート在籍時代から社外でDTM、オーディオ、レコーディング関連の記事を中心に執筆しており、これまでも多数の関連書籍がある。
現在はブログ型ニュースサイトDTMステーションを運営するほか、AV Watchの連載記事「藤本健のDigital Audio Laboratory」などを執筆している
登録情報
- 出版社 : ヤマハミュージックエンタテイメントホールディングス (2014/9/22)
- 発売日 : 2014/9/22
- 言語 : 日本語
- 単行本 : 212ページ
- ISBN-10 : 4636899962
- ISBN-13 : 978-4636899962
- 寸法 : 15 x 1.4 x 21 cm
- Amazon 売れ筋ランキング: - 779,410位本 (本の売れ筋ランキングを見る)
- - 329位デジタル音楽
- カスタマーレビュー:
カスタマーレビュー
星5つ中4.1つ
5つのうち4.1つ
9グローバルレーティング
- 星5つ星4つ星3つ星2つ星1つ星5つ42%29%29%0%0%42%
- 星5つ星4つ星3つ星2つ星1つ星4つ42%29%29%0%0%29%
- 星5つ星4つ星3つ星2つ星1つ星3つ42%29%29%0%0%29%
- 星5つ星4つ星3つ星2つ星1つ星2つ42%29%29%0%0%0%
- 星5つ星4つ星3つ星2つ星1つ星1つ42%29%29%0%0%0%
評価はどのように計算されますか?
全体的な星の評価と星ごとの割合の内訳を計算するために、単純な平均は使用されません。その代わり、レビューの日時がどれだけ新しいかや、レビューアーがAmazonで商品を購入したかどうかなどが考慮されます。また、レビューを分析して信頼性が検証されます。
上位レビュー、対象国: 日本
レビューのフィルタリング中に問題が発生しました。後でもう一度試してください。
- 2014年11月24日に日本でレビュー済みVOCALOIDプロジェクトリーダーである剣持氏が、VOCALOIDの仕組みについて一般向けに解説している本です。
「VOCALOIDにおいてどのような技術が使われているのか」ということについて、各バージョンごとに解説がなされています(V1からV3まで)。歌唱合成技術の解説のほか、ボカロエディタのUIデザイン・Cubaseとの連携法など、(歌唱合成とは直接関係ない)ソフトウェア開発的な側面にもかなりのページが割かれています。
一般向けということもあり、技術の詳細にまでふみこんで解説しているわけではなさそうです(例えば数式の類いは一切出てきません)。純粋に歌唱合成部分を解説しているページは案外多くないので、「技術論」というタイトルから「歌唱合成部分のアルゴリズム的な詳細が知れる」と期待すると肩すかしを食らうかもしれません。
とはいえ 解説はわかりやすく書かれており、VOCALOIDを使用する上で役立つ情報も混じっています。バージョンごとの歌唱合成方法の差異については詳しめに解説されていますし、そのほかにも「指定されたdiphoneが存在しない場合の処理方法」や「無声化コマンドの使い方」あたりの仕様は 知っていると利用する場面があるかもしれません。
ただ、個人的な印象としては、情報量のわりには値段がちょっと高いかなという気がします。
- 2016年8月26日に日本でレビュー済みAmazonで購入読み物としては面白い。技術的なことも優しく書いてある。
だが定価で買うほどの内容ではなかった。
- 2015年1月12日に日本でレビュー済みVOCALOIDって、いわゆるサンプラー的なものだと思っていましたが、この本を読んで、サンプラーとはかなり構造の違うものであることがよくわかりました。
音声合成やシンセサイザによる音の合成に興味があって、調べると、すぐに複雑な数式などが出てきてしまい、読むのを断念してしまうのですが、この本は、VOCALOIDの開発者が丁寧に、しかも分かりやすく解説してくれていて、本当にわかりやすかったです。どのようにして、音素と音素をつなぎ合わせているのか、なぜ1オクターブ以上、上の音や下の音を出しても声質が破たんしないのかなど、興味深く読ませていただきました。
また、これを読む限り、まだVOCALOIDには発展の余地が数多くありそうなことも分かります。ぜひ、これからのVOCALOIDの進化にも期待したいところですね。