JPS63264800A - 音声編集合成装置 - Google Patents
音声編集合成装置Info
- Publication number
- JPS63264800A JPS63264800A JP62099407A JP9940787A JPS63264800A JP S63264800 A JPS63264800 A JP S63264800A JP 62099407 A JP62099407 A JP 62099407A JP 9940787 A JP9940787 A JP 9940787A JP S63264800 A JPS63264800 A JP S63264800A
- Authority
- JP
- Japan
- Prior art keywords
- syllable
- speech
- name string
- voice data
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002194 synthesizing effect Effects 0.000 claims description 11
- 238000000034 method Methods 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、音声応答システムに用いる音声11集合成装
置に関する。
置に関する。
(従来の技術)
従来、人間の発声した単語や文章等の音声波形を記憶さ
せておき、これらの音声波形をwi集合成することによ
り音声応答を行う方式が知られている。また、CVやV
C(ここで、Cは子音、■は母音を表す)等の比較的に
短い音声素片を入力として与えられる文字列に従って編
集合成し任意の音声を合成する音声応答システムが19
82年日本音響学会発行の音声研究会資料(資料番号−
882−06(1982−4> ’)中の″cv、vc
波形のピッチ同期的補間による任意語合成方式”と題す
る文献等により知られている。
せておき、これらの音声波形をwi集合成することによ
り音声応答を行う方式が知られている。また、CVやV
C(ここで、Cは子音、■は母音を表す)等の比較的に
短い音声素片を入力として与えられる文字列に従って編
集合成し任意の音声を合成する音声応答システムが19
82年日本音響学会発行の音声研究会資料(資料番号−
882−06(1982−4> ’)中の″cv、vc
波形のピッチ同期的補間による任意語合成方式”と題す
る文献等により知られている。
(発明が解決しようとする問題点)
しかしながら、前記前者の方式は、li集すべき自然音
声の時間長が比較的長いからm集合酸された合成音声の
音質が良いが合成可能な文章の種類が限定されていると
いう欠点を持っている。また、前記後者の方式は、任意
の文章が合成可能であるものの編集ずべき音声素片の時
間長が短く調音結合の影響を充分jtはしていないから
合成音質が比較的劣っている欠点を有している。
声の時間長が比較的長いからm集合酸された合成音声の
音質が良いが合成可能な文章の種類が限定されていると
いう欠点を持っている。また、前記後者の方式は、任意
の文章が合成可能であるものの編集ずべき音声素片の時
間長が短く調音結合の影響を充分jtはしていないから
合成音質が比較的劣っている欠点を有している。
本発明の■的は、調音結合の影響を出来るだけ考慮し比
較的高品質な任意の文章音声が生成可能な音声編集合成
装置を提供することにある。
較的高品質な任意の文章音声が生成可能な音声編集合成
装置を提供することにある。
(問題点を解決するための手段)
本願の発明は、あらかじめ単語等の音声データを前記各
音声データを表す音素名列および音節境界データととも
に記憶する音声データメモリと、入力として与えられる
音節名列と前記単語等に対応する音節名列(但し、部分
列を含む)とのマツチングを行い最長一致する前記音声
データの部分音節名列を選択する手段と、この選択手段
で選択された音節名列に従って前記音節境界データを用
いて前記音声データから必要とする音声データを切り出
し編集合成することにより所望の音声を生成する手段と
から構成されている。
音声データを表す音素名列および音節境界データととも
に記憶する音声データメモリと、入力として与えられる
音節名列と前記単語等に対応する音節名列(但し、部分
列を含む)とのマツチングを行い最長一致する前記音声
データの部分音節名列を選択する手段と、この選択手段
で選択された音節名列に従って前記音節境界データを用
いて前記音声データから必要とする音声データを切り出
し編集合成することにより所望の音声を生成する手段と
から構成されている。
(発明の原理)
連続に発声された単語や文章等の音声内における音節の
周波数スペクトル等の′Pfmパラメータの変化特性は
、単独に発声された音節の特徴パラメータの変化特性と
比散すると前後の音節の影響を受けるから大きな違いが
生じることが知られており、調音結合と呼ばれている。
周波数スペクトル等の′Pfmパラメータの変化特性は
、単独に発声された音節の特徴パラメータの変化特性と
比散すると前後の音節の影響を受けるから大きな違いが
生じることが知られており、調音結合と呼ばれている。
あらかじめ、自然音声から複数個の単位音声を切りだし
て用意しておき、これらの単位音声を編集することによ
り任意の音声を合成する規則型音声合成システムにおい
て、vI記調音結合の影響を充分考慮して合成音質を高
めるなめには前記単位音声として出来るだけ長い(音節
数が多い)ものを用意しておく必要がある。しかしなが
ら、9位音声が長いと′g節の組合せが、膨大となるか
ら、単位音声を自然音声から切り出す作業が困難となる
ばかりでなく音声合成システムの規模が大きくなってし
まう、そこで、音声合成装置の規模のわりに比較的高品
質な合成音声が出力可能な方式として、使用頻度の高い
音節系列を含む単語音声データを音節の境界を表すセグ
メンテーションとともに付は加えて用いる方式が考えら
れる。第2図に一例として単B / y amazak
i/に対する音節名(ここではCV、■cを音節と呼ぶ
、:cは子音、■は母音)列と境界データ(セグメンテ
ーションデータ)を示す。
て用意しておき、これらの単位音声を編集することによ
り任意の音声を合成する規則型音声合成システムにおい
て、vI記調音結合の影響を充分考慮して合成音質を高
めるなめには前記単位音声として出来るだけ長い(音節
数が多い)ものを用意しておく必要がある。しかしなが
ら、9位音声が長いと′g節の組合せが、膨大となるか
ら、単位音声を自然音声から切り出す作業が困難となる
ばかりでなく音声合成システムの規模が大きくなってし
まう、そこで、音声合成装置の規模のわりに比較的高品
質な合成音声が出力可能な方式として、使用頻度の高い
音節系列を含む単語音声データを音節の境界を表すセグ
メンテーションとともに付は加えて用いる方式が考えら
れる。第2図に一例として単B / y amazak
i/に対する音節名(ここではCV、■cを音節と呼ぶ
、:cは子音、■は母音)列と境界データ(セグメンテ
ーションデータ)を示す。
この方式の有効性を高めるためには、合成すべき文章に
含まれる音節系列を前記屯語中に含まれる出来るだけ長
い音節系夕げで表す必要があり、いわゆる最長一致検索
方式と呼ばれる方式により実現することができる。
含まれる音節系列を前記屯語中に含まれる出来るだけ長
い音節系夕げで表す必要があり、いわゆる最長一致検索
方式と呼ばれる方式により実現することができる。
なお、音声データとしては、音声波形あるいは音声波形
から抽出されたホルマントパラメータ等を用いることが
出来る。音n(CV、VC)に対応する音声波形から任
意音声を合成する方式は、例えば、前記文献に、音節に
対応するホルマントパラメータ等から任意音声を合成す
る方式は、例えば、1985年日本音響学会発行の音声
研究会資料(資料番号S 85−31 (1985−7
) )巾の“ホルマント、CV−VC型規則合合成上題
する文献に詳しいので、ここでは説明を省略する。
から抽出されたホルマントパラメータ等を用いることが
出来る。音n(CV、VC)に対応する音声波形から任
意音声を合成する方式は、例えば、前記文献に、音節に
対応するホルマントパラメータ等から任意音声を合成す
る方式は、例えば、1985年日本音響学会発行の音声
研究会資料(資料番号S 85−31 (1985−7
) )巾の“ホルマント、CV−VC型規則合合成上題
する文献に詳しいので、ここでは説明を省略する。
(実施例)
本vA発明の実施例を図面を参照して詳細に説明する。
第1図は本願発明の一実施例を示すブロック図である。
この実施例にはまず、文字列入力端子11を介して合成
すべき文章を表す文字列110が音節名列変換部1に入
力される。音節名列変換部1は前記文字列110を音節
名列101に変換し最適音節系列選択部2に入力する。
すべき文章を表す文字列110が音節名列変換部1に入
力される。音節名列変換部1は前記文字列110を音節
名列101に変換し最適音節系列選択部2に入力する。
R適音部系列選択部2は、記憶部3内の音節名列記憶部
Aに記憶されている単語音声データに対応する音節名列
を参照して、前記音節名列を前記単語音声データの部分
音節名列102に分解し、記憶部3内の音節境界データ
記憶部Bのアドレスデータとして出力する。前記部分音
節名列への分解操作においては、入力文字列から変換さ
れた音節各系列を(Sz 、 S2 。
Aに記憶されている単語音声データに対応する音節名列
を参照して、前記音節名列を前記単語音声データの部分
音節名列102に分解し、記憶部3内の音節境界データ
記憶部Bのアドレスデータとして出力する。前記部分音
節名列への分解操作においては、入力文字列から変換さ
れた音節各系列を(Sz 、 S2 。
”・SL + Sl+1 、”・、Sn + ”・、
SN )とすると(ここで、Sl+・・・Soは音節名
、Nは入力文字列に対する音節数を表す)、まずS、か
ら始めて左から右に前記単語音声データに含まれる最長
の部分音節名列の検索を行う、この結果S1.・・・。
SN )とすると(ここで、Sl+・・・Soは音節名
、Nは入力文字列に対する音節数を表す)、まずS、か
ら始めて左から右に前記単語音声データに含まれる最長
の部分音節名列の検索を行う、この結果S1.・・・。
SIが最長の部分音節名列であったとすると、次に、S
!ヤ1から前記と同様の操作を繰り返して順次最長の部
分音節名列を検索する。記憶部3内の音声データ記憶部
Cからは、前記単語音声データの部分音節名列に従って
該単語音声データ中に含まれる前記部分音節名列に対応
する音声部分の音声データ103Cを順次編集合成回路
4に出力する。
!ヤ1から前記と同様の操作を繰り返して順次最長の部
分音節名列を検索する。記憶部3内の音声データ記憶部
Cからは、前記単語音声データの部分音節名列に従って
該単語音声データ中に含まれる前記部分音節名列に対応
する音声部分の音声データ103Cを順次編集合成回路
4に出力する。
編集合成回路4は前記記憶部3から出力される音声デー
タ103Cを編集合成し合成波形を生成し合成波形出力
端子12を介して出力する。
タ103Cを編集合成し合成波形を生成し合成波形出力
端子12を介して出力する。
なお、以上の説明においては、音節名列のアクセントの
有無を考慮に入れなかったが、アクセントによっても音
節の周波数スペクトルパタンは影響を受けるから、前記
部分音節名列の検索の際にアクセント情報も付加して検
索を行うことにより比教的良い合成音質の得られる音節
系列を取得できることは明らかである。
有無を考慮に入れなかったが、アクセントによっても音
節の周波数スペクトルパタンは影響を受けるから、前記
部分音節名列の検索の際にアクセント情報も付加して検
索を行うことにより比教的良い合成音質の得られる音節
系列を取得できることは明らかである。
(発明の効果)
以上述べたように本発明によれば、比較的長い音節系列
を単位音声として用いることが出来る。
を単位音声として用いることが出来る。
そこで本発明の音声編集合成装置を採用することにより
、調音結合の効果がより多く取り入れられ比軸的高品質
な任意の合成音声が生成できる。
、調音結合の効果がより多く取り入れられ比軸的高品質
な任意の合成音声が生成できる。
第1図は本発明の一実施例を示すブロック図、第2図は
音節名列および境界データの例を示す図である。 第1図において、1は音節名列変換部、2は最適音節系
列選択部、3は記憶部、4は編集合成回路、11は文字
列入力端子、12は合成波形出力端子をそれぞれ表し、
また記憶部3内のAはm語等の音声データに対応する音
節名列の記憶部、Bは前記音声データ内の前記音節名列
に対応する音節境界データの記憶部、Cは前記音声デー
タの記憶部をそれぞれ表す、第2図において、横軸は時
間を表し、縦軸は平均振幅値を表し、()は音節名を表
し、実線は単語音声/yamazaki/の平均振幅パ
タンを表す。
音節名列および境界データの例を示す図である。 第1図において、1は音節名列変換部、2は最適音節系
列選択部、3は記憶部、4は編集合成回路、11は文字
列入力端子、12は合成波形出力端子をそれぞれ表し、
また記憶部3内のAはm語等の音声データに対応する音
節名列の記憶部、Bは前記音声データ内の前記音節名列
に対応する音節境界データの記憶部、Cは前記音声デー
タの記憶部をそれぞれ表す、第2図において、横軸は時
間を表し、縦軸は平均振幅値を表し、()は音節名を表
し、実線は単語音声/yamazaki/の平均振幅パ
タンを表す。
Claims (2)
- (1)あらかじめ単語等の音声データを前記各音声デー
タを表す音素名列および音節境界データとともに記憶す
る音声データメモリと、入力として与えられる音節名列
と前記単語等に対応する音節名列とのマッチングを行い
最長一致する前記音声データの部分音節名列を選択する
手段と、この選択手段で選択された音節名列に従って前
記音節境界データを用いて前記音声データから必要とす
る音声データを切り出し編集合成することにより所望の
音声を生成する手段とを有することを特徴とする音声編
集合成装置。 - (2)前記音声データメモリに記憶される前記音素名列
が部分列を含むことを特徴とする特許請求の範囲第1項
記載の音声編集合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62099407A JP2586040B2 (ja) | 1987-04-21 | 1987-04-21 | 音声編集合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62099407A JP2586040B2 (ja) | 1987-04-21 | 1987-04-21 | 音声編集合成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63264800A true JPS63264800A (ja) | 1988-11-01 |
JP2586040B2 JP2586040B2 (ja) | 1997-02-26 |
Family
ID=14246632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62099407A Expired - Lifetime JP2586040B2 (ja) | 1987-04-21 | 1987-04-21 | 音声編集合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2586040B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006145691A (ja) * | 2004-11-17 | 2006-06-08 | Kenwood Corp | 音声合成装置、音片記憶装置、音片記憶装置製造装置、音声合成方法、音片記憶装置製造方法及びプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60205597A (ja) * | 1984-03-30 | 1985-10-17 | 富士通株式会社 | 音声合成装置 |
-
1987
- 1987-04-21 JP JP62099407A patent/JP2586040B2/ja not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60205597A (ja) * | 1984-03-30 | 1985-10-17 | 富士通株式会社 | 音声合成装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006145691A (ja) * | 2004-11-17 | 2006-06-08 | Kenwood Corp | 音声合成装置、音片記憶装置、音片記憶装置製造装置、音声合成方法、音片記憶装置製造方法及びプログラム |
JP4574333B2 (ja) * | 2004-11-17 | 2010-11-04 | 株式会社ケンウッド | 音声合成装置、音声合成方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2586040B2 (ja) | 1997-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0833744B2 (ja) | 音声合成装置 | |
JP2623586B2 (ja) | 音声合成におけるピッチ制御方式 | |
JP4490818B2 (ja) | 定常音響信号のための合成方法 | |
JPH08335096A (ja) | テキスト音声合成装置 | |
JP5175422B2 (ja) | 音声合成における時間幅を制御する方法 | |
JP3109778B2 (ja) | 音声規則合成装置 | |
JP2586040B2 (ja) | 音声編集合成装置 | |
JP2894447B2 (ja) | 複合音声単位を用いた音声合成装置 | |
JP3081300B2 (ja) | 残差駆動型音声合成装置 | |
JPH0642158B2 (ja) | 音声合成装置 | |
JP2642617B2 (ja) | 音声合成装置 | |
JPH09179576A (ja) | 音声合成方法 | |
JP2577372B2 (ja) | 音声合成装置および方法 | |
JP2880507B2 (ja) | 音声合成方法 | |
JP3310217B2 (ja) | 音声合成方法とその装置 | |
JP2573586B2 (ja) | 規則型音声合成装置 | |
JPH0511794A (ja) | 音声合成装置 | |
JPS58168096A (ja) | 複数言語音声合成装置 | |
JP2573585B2 (ja) | 音声スペクトルパタン生成装置 | |
JP2844588B2 (ja) | 波形編集型音声合成装置 | |
JPH0572599B2 (ja) | ||
JPS63237099A (ja) | 単位音声編集型音声合成装置 | |
JPH09244680A (ja) | 韻律制御装置及び方法 | |
JPS60113299A (ja) | 音声合成装置 | |
JPS63208099A (ja) | 音声合成装置 |