JPS58172700A - 音素片編集型音声分析合成方式 - Google Patents
音素片編集型音声分析合成方式Info
- Publication number
- JPS58172700A JPS58172700A JP57055795A JP5579582A JPS58172700A JP S58172700 A JPS58172700 A JP S58172700A JP 57055795 A JP57055795 A JP 57055795A JP 5579582 A JP5579582 A JP 5579582A JP S58172700 A JPS58172700 A JP S58172700A
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- speech
- data
- piece
- phoneme piece
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は、音素片編集型音声分析合成力式に関し、商い
明瞭性、自然性を有する音声合成を可能とするものであ
る。
明瞭性、自然性を有する音声合成を可能とするものであ
る。
音素片編集型音声分析合成方式は、音声特に有声音の瞬
接波形間の強い類似性に基いて、原音声信号から代表的
な音素片データをピッチ周期単位で抽出し、抽出した音
素片データを音声合成制御情報に従って複数回繰り返し
ながら順次接続するこNによって、所望の音声信号を合
成する方式である。
接波形間の強い類似性に基いて、原音声信号から代表的
な音素片データをピッチ周期単位で抽出し、抽出した音
素片データを音声合成制御情報に従って複数回繰り返し
ながら順次接続するこNによって、所望の音声信号を合
成する方式である。
第1図に、音素片編集型音声分析合成方式によって合成
された音声信号波形の一部を示す。第1図は、音素片(
PHA)を3回繰り返し、次いで音素片(PHB)を接
hトシ、この(PHB )を2回繰り返すことによって
得られた音声信号を示している。
された音声信号波形の一部を示す。第1図は、音素片(
PHA)を3回繰り返し、次いで音素片(PHB)を接
hトシ、この(PHB )を2回繰り返すことによって
得られた音声信号を示している。
音素片編集型音声分析合成方式は、音素片データを音声
合成制御情報に従って順次接続していくことにより音声
信号を合成するので、PARCOR方式、LSP方式、
ホルマント合成方式等パラメータ分析合成方式と比較し
て、合成のための手順が簡単で汎用のマイクロプロセッ
サ等を使用して容易に音声合成を実現できるという特長
を有する。
合成制御情報に従って順次接続していくことにより音声
信号を合成するので、PARCOR方式、LSP方式、
ホルマント合成方式等パラメータ分析合成方式と比較し
て、合成のための手順が簡単で汎用のマイクロプロセッ
サ等を使用して容易に音声合成を実現できるという特長
を有する。
しかしながら、この方式では第1図に示すように音素波
形及びピッチ周期が、相異なる音素片の接続点で急激に
変化するために、音素片の繰り返しによる同期的なノイ
ズ音が発声し、清らかな音声信号を得にくいという問題
点があった。
形及びピッチ周期が、相異なる音素片の接続点で急激に
変化するために、音素片の繰り返しによる同期的なノイ
ズ音が発声し、清らかな音声信号を得にくいという問題
点があった。
このような問題点を改善するために、2つの音素片の間
に補間演算により得られる補間音素片を挿入することが
、従来より提案されてきた。
に補間演算により得られる補間音素片を挿入することが
、従来より提案されてきた。
すなわち、音声信号を一定のサンプリング周期でサンプ
リングすることによって和られる音素片データ群の先行
する音素片(PHA )のi番目のデータ値をPHA(
i) (i = 1 、2 、・・・・・・、NA、
たたし、NAはPHAのデータ数)とし、後続する音
素片(PHE’)のi番目のデータ値をPHB(i)(
i =1.2.・・・・−・yN13+ただし、NBは
PHHのデータ数)とする時、先行する音素ハ(PHA
)と後続する音素片(PHB)の補間音素片(P)(
I)・のi番目のデータ値P HI (i)を(1)式
から求めるものである。
リングすることによって和られる音素片データ群の先行
する音素片(PHA )のi番目のデータ値をPHA(
i) (i = 1 、2 、・・・・・・、NA、
たたし、NAはPHAのデータ数)とし、後続する音
素片(PHE’)のi番目のデータ値をPHB(i)(
i =1.2.・・・・−・yN13+ただし、NBは
PHHのデータ数)とする時、先行する音素ハ(PHA
)と後続する音素片(PHB)の補間音素片(P)(
I)・のi番目のデータ値P HI (i)を(1)式
から求めるものである。
PH’(’)”’f f PHA(i)、 PHB(i
) l ・・・・・ (1)ただし、f(A、B)
はA、Bの補間関数を示す。
) l ・・・・・ (1)ただし、f(A、B)
はA、Bの補間関数を示す。
ここで、2つの音素片データの補間は、線形補間により
求まるものとし、ままた2つの音素片の間に挿入すべき
補間音率片の個数をMとすわば、第】番目の補間音素片
の工番目のデータ値PHI (i 、 5 )は(2)
式より求められる。
求まるものとし、ままた2つの音素片の間に挿入すべき
補間音率片の個数をMとすわば、第】番目の補間音素片
の工番目のデータ値PHI (i 、 5 )は(2)
式より求められる。
pH1(i、i )−(1−工)P肪l)十土PHB(
i)・・・・・・(2)M+I M
+1 後続する音素片のデータ値P HB (1)は、(2)
式においてj==M+1と置くことにより求まるので、
PHBを広義の意味での補間音素片と呼ぶことにする。
i)・・・・・・(2)M+I M
+1 後続する音素片のデータ値P HB (1)は、(2)
式においてj==M+1と置くことにより求まるので、
PHBを広義の意味での補間音素片と呼ぶことにする。
また(3)式で定義されるM′を補間繰シ返しと呼ぶこ
とにする。M′を使えば(2)式は(4)式で表わすこ
とができる。
とにする。M′を使えば(2)式は(4)式で表わすこ
とができる。
M’=M+1 ・旧・・ (3)PHI(i
、j)−(1−)PHA(i)+−L PHB (i)
M’ M’ ・・・・・・ (4) ただし、]”’ t 2+・・・・・・、M′である。
、j)−(1−)PHA(i)+−L PHB (i)
M’ M’ ・・・・・・ (4) ただし、]”’ t 2+・・・・・・、M′である。
次に、(4)式において音素片PHA(i)及びPHB
(i)をフーリエ変換して表わした式を(6)式とす
る。
(i)をフーリエ変換して表わした式を(6)式とす
る。
j ■
PHI(i 、 j)−(1−、、)、i弘CAk・・
・・・・ (6) たたし、CAk及びCBkは、音素片PHA及びPHB
のに次高調波の周波数スペクトルである。
・・・・ (6) たたし、CAk及びCBkは、音素片PHA及びPHB
のに次高調波の周波数スペクトルである。
等サンプル数音素片編集方式音声合成による音声分析合
成方式では、最初にその間を補間すべき音素片の音素片
データに関IJのデータ数を所定のデータ数Nに等しく
する。原理的には、異なるピッチ周期をもつ音素片のデ
ータ数を等しくするためにU、音素片をサンプリングす
る時のクロック周期を音素片のデータ数が一定になるよ
うに可変しなかCつサンプリングすれば良い。
成方式では、最初にその間を補間すべき音素片の音素片
データに関IJのデータ数を所定のデータ数Nに等しく
する。原理的には、異なるピッチ周期をもつ音素片のデ
ータ数を等しくするためにU、音素片をサンプリングす
る時のクロック周期を音素片のデータ数が一定になるよ
うに可変しなかCつサンプリングすれば良い。
しかしながら、実際には音素片のサンプリングクロック
周期をピッチ周期に対応して可変することは極めて困難
なので、音素片を一定のサンプリングクロック周期でで
サンプリングした後、例え61、PROCEEDING
S OF THE IEEE誌の第69巻第3号(1
981年3月)の300頁から331 L’JにR,E
、CROCHIEREとり、R,RABINERによっ
て著わされた[INTERPOLATION AND
DECIMATION OF DIGITAL 5I
GNALS−ATUTORIAL REVIEWJとい
う標題の論文の中で詳細に論述されているような方法で
データの補間あるいは間引きを行なってデータ数の増減
を行ない所定のデータ数にする。
周期をピッチ周期に対応して可変することは極めて困難
なので、音素片を一定のサンプリングクロック周期でで
サンプリングした後、例え61、PROCEEDING
S OF THE IEEE誌の第69巻第3号(1
981年3月)の300頁から331 L’JにR,E
、CROCHIEREとり、R,RABINERによっ
て著わされた[INTERPOLATION AND
DECIMATION OF DIGITAL 5I
GNALS−ATUTORIAL REVIEWJとい
う標題の論文の中で詳細に論述されているような方法で
データの補間あるいは間引きを行なってデータ数の増減
を行ない所定のデータ数にする。
このとき、(5)式において音素片PHAのデータ数N
Aと後続する音素片PHHのデータ数NBは、等サンプ
ル数Nとなっているため、(6)式は整理されて次式と
なる。
Aと後続する音素片PHHのデータ数NBは、等サンプ
ル数Nとなっているため、(6)式は整理されて次式と
なる。
PHI (j、 j )−に=X、、 l CAkたた
し、ΔCABk” CBk−CAk である。
し、ΔCABk” CBk−CAk である。
ゆえに、音素片データに関しそのデータ数を所定のデー
タ数Nに等しくすることにより、(4)式において、(
6)式に示すごとくその補間された音素片PHI(i、
j)は、その高調波スペクトルが線形補間されることが
分かる。
タ数Nに等しくすることにより、(4)式において、(
6)式に示すごとくその補間された音素片PHI(i、
j)は、その高調波スペクトルが線形補間されることが
分かる。
ただし、この時のサンプリング時間τjは次式にて求め
られる。
られる。
τi =N I NA ”Mt (NB−NA ) l
・・・・・・(ア)この(7)式より求められたサ
ンプリング時間τjで補間データPHI(i、j)を構
成することにより、周波数軸上においても線形補間がな
されることになる。
・・・・・・(ア)この(7)式より求められたサ
ンプリング時間τjで補間データPHI(i、j)を構
成することにより、周波数軸上においても線形補間がな
されることになる。
本発明は、上記等サンプル数音素片編集方式音声合成方
式において、より明瞭性の高く、かつ自然性をもった合
成音声構成を目的とした音声合成分析法である。
式において、より明瞭性の高く、かつ自然性をもった合
成音声構成を目的とした音声合成分析法である。
以下、本発明の詳細な説明を行なう。
自然音声よりピッチ周期単位で抽出された音素ハデータ
列から、各音素片の高調波スペクトルを求めると第2図
となる。第2図において、横軸は自然音声「お確かめJ
よりピッチ周期単位で抽出した音素片番号、縦軸は、周
波数スペクトルレベル値である。ただし、無声子音(T
、SH)は零としである。
列から、各音素片の高調波スペクトルを求めると第2図
となる。第2図において、横軸は自然音声「お確かめJ
よりピッチ周期単位で抽出した音素片番号、縦軸は、周
波数スペクトルレベル値である。ただし、無声子音(T
、SH)は零としである。
111
1だ、第2図内に示した番号1〜9は高調波の次数を示
す。
す。
第2図より、各高調波は清らかに変化していることが分
かり、このことを考慮すれば各高調波の極値を求めるこ
とにより求める音素片が見い出される。
かり、このことを考慮すれば各高調波の極値を求めるこ
とにより求める音素片が見い出される。
第3図に、第2図の各高調波の極値より選択された音素
片を用いて、音声を合成したときの高調波スペクトルの
例を示す。
片を用いて、音声を合成したときの高調波スペクトルの
例を示す。
ただし、選択音素片番号1〜15は第2図より求めた音
素片の番号である。
素片の番号である。
合成音声から求めた高調波スペクトル図(第3図)は、
自然音声から求めた高調波スペクトル図(第2図)に非
常に類似しており、実際求めた音素片を用いて合成され
た音声音声も、従来の合成音声に比べて非常に明瞭性が
高く、かつ自然性が良い。
自然音声から求めた高調波スペクトル図(第2図)に非
常に類似しており、実際求めた音素片を用いて合成され
た音声音声も、従来の合成音声に比べて非常に明瞭性が
高く、かつ自然性が良い。
ゆえに、等サンプル数音素片編集方式音声合成において
、まず第1に分析される自然音声からピンチ周期単位で
抽出した音素片データを求め、次にこの求められた音素
片データ列より高調波スペクトル図(例えば第2画)を
求め、さらにこの図より、各高調波の極値を求めこの@
!仙に対応する音素片を抽出することにより、従来の音
素片編集型音声合成によって合成された合成音声の音質
(明瞭イ/L及び自然性において)の改善が図れる。
、まず第1に分析される自然音声からピンチ周期単位で
抽出した音素片データを求め、次にこの求められた音素
片データ列より高調波スペクトル図(例えば第2画)を
求め、さらにこの図より、各高調波の極値を求めこの@
!仙に対応する音素片を抽出することにより、従来の音
素片編集型音声合成によって合成された合成音声の音質
(明瞭イ/L及び自然性において)の改善が図れる。
1だ、本発明は音声認識においても自然音ルの持つ個有
な特徴を抽出する大きな要因となり、音11・認識にお
ける特徴抽出という面でも非常に有効である。
な特徴を抽出する大きな要因となり、音11・認識にお
ける特徴抽出という面でも非常に有効である。
本発明は上記のような構成であり、本発明によれば、合
成音声の明瞭性、自然性が改善される利点を有するもの
である。
成音声の明瞭性、自然性が改善される利点を有するもの
である。
第1図は音素片編集型音声分析合成方式における合成音
声信号波形を示す図、第2図は抽出音素片データ列から
求めた高調波スペクトルを示す図、第3図は本発明の音
素片編集型音声分析合成方式により選択した音素片を用
いて合成を合成した場合の高調波スペクトルを示す図で
ある。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名区
t2ch於t
声信号波形を示す図、第2図は抽出音素片データ列から
求めた高調波スペクトルを示す図、第3図は本発明の音
素片編集型音声分析合成方式により選択した音素片を用
いて合成を合成した場合の高調波スペクトルを示す図で
ある。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名区
t2ch於t
Claims (1)
- 自然音声信号のピッチ周期単位で求めた音素片データの
各音゛素片の高調波スペクトルを求めるステップと、音
素片の各次数の高調波スペクトルの極値を求めるステッ
プと、所定の極値に対応する1つ又は複数の音素片を選
択するステップとからなる音素片編集型音声分析合成方
式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57055795A JPS58172700A (ja) | 1982-04-02 | 1982-04-02 | 音素片編集型音声分析合成方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57055795A JPS58172700A (ja) | 1982-04-02 | 1982-04-02 | 音素片編集型音声分析合成方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS58172700A true JPS58172700A (ja) | 1983-10-11 |
Family
ID=13008839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57055795A Pending JPS58172700A (ja) | 1982-04-02 | 1982-04-02 | 音素片編集型音声分析合成方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58172700A (ja) |
-
1982
- 1982-04-02 JP JP57055795A patent/JPS58172700A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhu et al. | Real-time signal estimation from modified short-time Fourier transform magnitude spectra | |
JP3294604B2 (ja) | 波形の加算重畳による音声合成のための処理装置 | |
JP2763322B2 (ja) | 音声処理方法 | |
JPS623439B2 (ja) | ||
Moulines et al. | Time-domain and frequency-domain techniques for prosodic modification of speech | |
CA1065490A (en) | Emphasis controlled speech synthesizer | |
JPS62160495A (ja) | 音声合成装置 | |
JP2000172285A (ja) | フィルタパラメ―タとソ―ス領域において独立にクロスフェ―ドを行う半音節結合型のフォルマントベ―スのスピ―チシンセサイザ | |
JPH06266390A (ja) | 波形編集型音声合成装置 | |
EP0726560A2 (en) | Variable speed playback system | |
US20050131680A1 (en) | Speech synthesis using complex spectral modeling | |
US6950798B1 (en) | Employing speech models in concatenative speech synthesis | |
Bonada et al. | Sample-based singing voice synthesizer by spectral concatenation | |
JP2600384B2 (ja) | 音声合成方法 | |
JPS58172700A (ja) | 音素片編集型音声分析合成方式 | |
US4075424A (en) | Speech synthesizing apparatus | |
JP2612867B2 (ja) | 音声ピッチ変換方法 | |
JP2612869B2 (ja) | 声質変換方法 | |
JPS62102294A (ja) | 音声符号化方式 | |
JPS58216299A (ja) | 音素片編集型音声合成方法 | |
JP2715437B2 (ja) | マルチパルス符号化装置 | |
JPS597996A (ja) | 音素片編集型音声合成方法 | |
JPS6265098A (ja) | 音楽用ボコ−ダ | |
JP3112462B2 (ja) | 音声符号化装置 | |
JP2861005B2 (ja) | 音声蓄積再生装置 |