JP5176981B2 - 音声合成装置、およびプログラム - Google Patents
音声合成装置、およびプログラム Download PDFInfo
- Publication number
- JP5176981B2 JP5176981B2 JP2009012300A JP2009012300A JP5176981B2 JP 5176981 B2 JP5176981 B2 JP 5176981B2 JP 2009012300 A JP2009012300 A JP 2009012300A JP 2009012300 A JP2009012300 A JP 2009012300A JP 5176981 B2 JP5176981 B2 JP 5176981B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- unit
- data
- speech unit
- waveform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
本発明は上記課題に鑑みて為されたものであり、素片接続方式の音声合成において、データベース化する音声素片の数を従来より少なくしても自然な音声を合成できるようにする技術を提供することを目的とする。
図1は、本発明に係る音声合成装置の一実施形態である歌唱合成装置の構成を示すブロック図である。この歌唱合成装置は、例えば携帯電話機や携帯型ゲーム機など音声を出力する機能を備えた携帯端末に音声合成プログラムをインストールしたものである。図1において、CPU(Central Processing Unit)1は、この歌唱合成装置の各部を制御する制御中枢である。ROM(Read Only Memory)2は、ローダなど、この歌唱合成装置の基本的な動作を制御するための制御プログラムを記憶した読み出し専用メモリである。表示部3は、例えば液晶ディスプレイとその駆動回路であり、装置の動作状態や入力データ、利用者に対するメッセージなどを表示する。操作部4は、利用者に各種情報を入力させるための手段であり、複数の操作子(例えば、携帯型ゲーム機であればスタートボタンやカーソルキー、携帯電話であればテンキーなど)やタッチパネルなどで構成されている。インタフェース群5は、ネットワークを介して他の装置との間でデータ通信を行うためのネットワークインタフェースや、UMD(Universal Media Disc)やCD−ROM(Compact Disk-Read
Only Memory)などの外部記録媒体との間でデータの授受を行うためのドライバなどである。フラッシュメモリ6は、各種のプログラムやデータベースなどの情報を記憶するための不揮発性記憶装置(記憶手段)である。RAM7は、CPU1によってワークエリアとして利用される揮発性メモリである。CPU1は、操作部4を介して与えられる指令にしたがいフラッシュメモリ6内のプログラムをRAM7に読み出し実行する。サウンドシステム8は、この歌唱合成装置において合成される音声を出力する手段である。このサウンドシステム8は、合成音声の波形を示すデジタル音声信号(例えば、合成音声の波形を示すサンプリングデータ)をアナログ音声信号に変換するD/A変換器と、このアナログ音声信号を増幅するアンプと、このアンプの出力信号を音として出力するスピーカ等を含んでいる。
図4は、音声合成プログラム65の構成を説明するための図である。この音声合成プログラム65は、所謂素片接続方式の音声合成(本実施形態では、歌唱合成)処理をCPU1に実行させるプログラムであり、図4に示すように、音声合成指示生成手段651、素片選択手段652、ピッチ変換手段653、無声化変換手段654および素片連結手段655を含んでいる。なお、本実施形態では、CPU1が音声合成指示生成手段651等に相当するプログラムを実行することにより歌唱音声の合成を行うが、これらの各プログラムを複数のプロセッサが分担して並列実行するように構成しても良い。また、音声合成指示生成手段651等の各プログラムの一部を電子回路により構成しても良い。
(1)上述した実施形態では、音声合成の対象言語の母音のうちの何れか1つについて無音化テンプレート63をフラッシュメモリ6に格納しておいたが、対象言語の全ての母音についての無音化テンプレートをフラッシュメモリ6に格納しておいても良く、また、それら母音のうちから任意に選択した複数のものについての無音化テンプレートをフラッシュメモリ6に格納しておいても良い。つまり、音声合成の対象言語の母音の一部または全てについて無音化テンプレートがフラッシュメモリ6に格納されていれば良い。このように、音声合成の対象言語の母音の一部または全てについて無音化テンプレートがフラッシュメモリ6に格納されている態様においては、以下の要領でより自然な音声合成を行うことが可能になる。すなわち、無音化変換するべき音声素片に含まれている母音について、該当する無音化テンプレートがフラッシュメモリ6に格納されている場合には、その無音化テンプレートを用いて無音化変換を行い、該当するものがない場合には、フラッシュメモリ6に格納されている無音化テンプレートのうち、音響的な特徴がその無音化対象の母音に最も近い母音のものを用いて無音化変換処理を行うのである。例えば、フラッシュメモリ6に、母音[a]、[i]および[u]についての無音化テンプレートが格納されている場合には、これら3つの母音については各々に対応する無音化テンプレートを用いて無音化変換を行い、母音[e]および[o]については、これら3つの無音化テンプレートのうち音響的な特徴が最も近いものを用いて無音化変換を行えば良い。
Claims (6)
- 各種の音声素片の波形を示す波形データを含む音声素片データが格納されている音声素片データベースと、
音声合成の対象言語の母音の全部または一部について、無声発音の波形を表す無声化テンプレートが母音毎に格納されている記憶手段と、
音声の合成に用いる音声素片に対応する音声素片データを前記音声素片データベースから選択する手段であって、無声化された母音を含む音声素片が音声合成に用いられる場合には、当該母音を有声化した音声素片の音声素片データを前記音声素片データベースから選択する素片選択手段と、
前記素片選択手段により選択される音声素片データが無声化された母音を含む音声素片に対して選択されたものである場合には、何れかの無声化テンプレートが示す波形を当該音声素片データの示す波形のスペクトルエンベロープと同様なスペクトルエンベロープを有する波形に加工し、当該音声素片データを当該加工後の波形を示す音声素片データに変換して出力する一方、他の音声素片に対して選択されたものである場合には、そのまま出力する無声化変換手段と、
前記無声化変換手段から出力される各音声素片データに含まれる波形データを調整しつつ連結して出力する素片連結手段と
を有することを特徴とする音声合成装置。 - 前記無声化変換手段は、無声化母音を含む音声素片と無声化母音を含まない音声素片とが連続して音声合成に用いられる場合には、当該無声化母音を含む音声素片において、前記素片選択手段により選択される音声素片データの示す波形と前記加工後の波形とがクロスフェードするように当該音声素片データを変換することを特徴とする請求項1に記載の音声合成装置。
- 前記無声化変換手段は、前記素片選択手段により選択される音声素片データの示す波形と前記加工後の波形とがクロスフェードするように変換した音声素片データに、そのクロスフェードにおけるミキシング比率に応じた気息音を付与して出力することを特徴とする請求項2に記載の音声合成装置。
- 各種の音声素片の波形を示す波形データを含む音声素片データが格納されている音声素片データベースと、
音声合成の対象言語の母音の全部または一部について、有声発音の波形を示す有声化テンプレートが母音毎に格納されている記憶手段と、
音声の合成に用いる音声素片に対応する音声素片データを前記音声素片データベースから選択する手段であって、有声発音される母音を含む音声素片が音声合成に用いられる場合には、当該母音を無声化した音声素片の音声素片データを前記音声素片データベースから選択する素片選択手段と、
前記素片選択手段により選択される音声素片データが有声発音される母音を含む音声素片に対して選択されたものである場合には、何れかの有声化テンプレートが示す波形を当該音声素片データの示す波形のスペクトルエンベロープと同様なスペクトルエンベロープを有する波形に加工し、当該音声素片データを当該加工後の波形を示す音声素片データに変換して出力する一方、他の音声素片に対して選択されたものである場合には、そのまま出力する有声化変換手段と、
前記有声化変換手段から出力される各音声素片データに含まれる波形データを調整しつつ連結して出力する素片連結手段と
を有することを特徴とする音声合成装置。 - コンピュータ装置を、
各種の音声素片の波形を示す波形データを含む音声素片データが格納されている音声素片データベースから、音声の合成に用いる音声素片に対応する音声素片データを選択する手段であって、無声化された母音を含む音声素片が音声合成に用いられる場合には、当該母音を有声化した音声素片の音声素片データを前記音声素片データベースから選択する素片選択手段と、
前記素片選択手段により選択される音声素片データが無声化された母音を含む音声素片に対して選択されたものである場合には、音声合成の対象言語の母音のうちの何れかの無声発音の波形を当該音声素片データの示す波形のスペクトルエンベロープと同様なスペクトルエンベロープを有する波形に加工し、当該音声素片データを当該加工後の波形を示す音声素片データに変換して出力する一方、他の音声素片に対して選択されたものである場合には、そのまま出力する無声化変換手段と、
前記無声化変換手段から出力される各音声素片データに含まれる波形データを調整しつつ連結して出力する素片連結手段と
として機能させることを特徴とするプログラム。 - コンピュータ装置を、
各種の音声素片の波形を示す波形データを含む音声素片データが格納されている音声素片データベースから、音声の合成に用いる音声素片に対応する音声素片データを選択する手段であって、有声発音される母音を含む音声素片が音声合成に用いられる場合には、当該母音を無声化した音声素片の音声素片データを前記音声素片データベースから選択する素片選択手段と、
前記素片選択手段により選択される音声素片データが有声発音される母音を含む音声素片に対して選択されたものである場合には、音声合成の対象言語の母音のうちの何れかの有声発音の波形を当該音声素片データの示す波形のスペクトルエンベロープと同様なスペクトルエンベロープを有する波形に加工し、当該音声素片データを当該加工後の波形を示す音声素片データに変換して出力する一方、他の音声素片に対して選択されたものである場合には、そのまま出力する有声化変換手段と、
前記有声化変換手段から出力される各音声素片データに含まれる波形データを調整しつつ連結して出力する素片連結手段
として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009012300A JP5176981B2 (ja) | 2009-01-22 | 2009-01-22 | 音声合成装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009012300A JP5176981B2 (ja) | 2009-01-22 | 2009-01-22 | 音声合成装置、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010169889A JP2010169889A (ja) | 2010-08-05 |
JP5176981B2 true JP5176981B2 (ja) | 2013-04-03 |
Family
ID=42702115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009012300A Expired - Fee Related JP5176981B2 (ja) | 2009-01-22 | 2009-01-22 | 音声合成装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5176981B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6024191B2 (ja) | 2011-05-30 | 2016-11-09 | ヤマハ株式会社 | 音声合成装置および音声合成方法 |
JP5895740B2 (ja) | 2012-06-27 | 2016-03-30 | ヤマハ株式会社 | 歌唱合成を行うための装置およびプログラム |
JP6497065B2 (ja) * | 2014-12-22 | 2019-04-10 | ヤマハ株式会社 | 音声合成用ライブラリ生成装置および音声合成装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61270800A (ja) * | 1985-05-27 | 1986-12-01 | 松下電器産業株式会社 | 無声化音声合成方法 |
JP2703253B2 (ja) * | 1988-02-25 | 1998-01-26 | 株式会社東芝 | 音声合成装置 |
JPH09325788A (ja) * | 1996-06-05 | 1997-12-16 | Toshiba Corp | 音声合成装置及び方法 |
JP4654621B2 (ja) * | 2004-06-30 | 2011-03-23 | ヤマハ株式会社 | 音声処理装置およびプログラム |
JP4839891B2 (ja) * | 2006-03-04 | 2011-12-21 | ヤマハ株式会社 | 歌唱合成装置および歌唱合成プログラム |
-
2009
- 2009-01-22 JP JP2009012300A patent/JP5176981B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010169889A (ja) | 2010-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6610715B1 (ja) | 電子楽器、電子楽器の制御方法、及びプログラム | |
CN109584910B (zh) | 歌唱音频的编辑辅助方法以及歌唱音频的编辑辅助装置 | |
JP6610714B1 (ja) | 電子楽器、電子楽器の制御方法、及びプログラム | |
CN110634460A (zh) | 电子乐器、电子乐器的控制方法以及存储介质 | |
JP4839891B2 (ja) | 歌唱合成装置および歌唱合成プログラム | |
JP6729539B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
US12106745B2 (en) | Electronic musical instrument and control method for electronic musical instrument | |
US10354629B2 (en) | Sound control device, sound control method, and sound control program | |
JP6507579B2 (ja) | 音声合成方法 | |
JP2006030575A (ja) | 音声合成装置およびプログラム | |
CN111696498A (zh) | 键盘乐器以及键盘乐器的计算机执行的方法 | |
US20210193098A1 (en) | Electronic musical instruments, method and storage media | |
Bonada et al. | Singing voice synthesis combining excitation plus resonance and sinusoidal plus residual models | |
JP5176981B2 (ja) | 音声合成装置、およびプログラム | |
JP5157922B2 (ja) | 音声合成装置、およびプログラム | |
JP6179221B2 (ja) | 音響処理装置および音響処理方法 | |
JP6255744B2 (ja) | 楽曲表示装置および楽曲表示方法 | |
JP6044284B2 (ja) | 音声合成装置 | |
JP2009157220A (ja) | 音声編集合成システム、音声編集合成プログラム及び音声編集合成方法 | |
WO2019239971A1 (ja) | 情報処理方法、情報処理装置およびプログラム | |
JP5552797B2 (ja) | 音声合成装置および音声合成方法 | |
Bonada et al. | Sample-based singing voice synthesizer using spectral models and source-filter decomposition. | |
JP2020166298A (ja) | 音声合成方法 | |
JP2004004440A (ja) | 歌唱合成装置、歌唱合成用プログラム及び歌唱合成用プログラムを記録したコンピュータで読み取り可能な記録媒体 | |
JP2021149043A (ja) | 電子楽器、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121224 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5176981 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |