JPS63264800A

JPS63264800A - 音声編集合成装置

Info

Publication number: JPS63264800A
Application number: JP62099407A
Authority: JP
Inventors: 伏木田　勝信
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1987-04-21
Filing date: 1987-04-21
Publication date: 1988-11-01
Anticipated expiration: 2012-02-26
Also published as: JP2586040B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、音声応答システムに用いる音声１１集合成装
置に関する。

（従来の技術）従来、人間の発声した単語や文章等の音声波形を記憶さ
せておき、これらの音声波形をｗｉ集合成することによ
り音声応答を行う方式が知られている。また、ＣＶやＶ
Ｃ（ここで、Ｃは子音、■は母音を表す）等の比較的に
短い音声素片を入力として与えられる文字列に従って編
集合成し任意の音声を合成する音声応答システムが１９
８２年日本音響学会発行の音声研究会資料（資料番号−
８８２−０６（１９８２−４＞　’）中の″ｃｖ、ｖｃ
波形のピッチ同期的補間による任意語合成方式”と題す
る文献等により知られている。

（発明が解決しようとする問題点）しかしながら、前記前者の方式は、ｌｉ集すべき自然音
声の時間長が比較的長いからｍ集合酸された合成音声の
音質が良いが合成可能な文章の種類が限定されていると
いう欠点を持っている。また、前記後者の方式は、任意
の文章が合成可能であるものの編集ずべき音声素片の時
間長が短く調音結合の影響を充分ｊｔはしていないから
合成音質が比較的劣っている欠点を有している。

本発明の■的は、調音結合の影響を出来るだけ考慮し比
較的高品質な任意の文章音声が生成可能な音声編集合成
装置を提供することにある。

（問題点を解決するための手段）本願の発明は、あらかじめ単語等の音声データを前記各
音声データを表す音素名列および音節境界データととも
に記憶する音声データメモリと、入力として与えられる
音節名列と前記単語等に対応する音節名列（但し、部分
列を含む）とのマツチングを行い最長一致する前記音声
データの部分音節名列を選択する手段と、この選択手段
で選択された音節名列に従って前記音節境界データを用
いて前記音声データから必要とする音声データを切り出
し編集合成することにより所望の音声を生成する手段と
から構成されている。

（発明の原理）連続に発声された単語や文章等の音声内における音節の
周波数スペクトル等の′Ｐｆｍパラメータの変化特性は
、単独に発声された音節の特徴パラメータの変化特性と
比散すると前後の音節の影響を受けるから大きな違いが
生じることが知られており、調音結合と呼ばれている。

あらかじめ、自然音声から複数個の単位音声を切りだし
て用意しておき、これらの単位音声を編集することによ
り任意の音声を合成する規則型音声合成システムにおい
て、ｖＩ記調音結合の影響を充分考慮して合成音質を高
めるなめには前記単位音声として出来るだけ長い（音節
数が多い）ものを用意しておく必要がある。しかしなが
ら、９位音声が長いと′ｇ節の組合せが、膨大となるか
ら、単位音声を自然音声から切り出す作業が困難となる
ばかりでなく音声合成システムの規模が大きくなってし
まう、そこで、音声合成装置の規模のわりに比較的高品
質な合成音声が出力可能な方式として、使用頻度の高い
音節系列を含む単語音声データを音節の境界を表すセグ
メンテーションとともに付は加えて用いる方式が考えら
れる。第２図に一例として単Ｂ　／　ｙ　ａｍａｚａｋ
ｉ／に対する音節名（ここではＣＶ、■ｃを音節と呼ぶ
、：ｃは子音、■は母音）列と境界データ（セグメンテ
ーションデータ）を示す。

この方式の有効性を高めるためには、合成すべき文章に
含まれる音節系列を前記屯語中に含まれる出来るだけ長
い音節系夕げで表す必要があり、いわゆる最長一致検索
方式と呼ばれる方式により実現することができる。

なお、音声データとしては、音声波形あるいは音声波形
から抽出されたホルマントパラメータ等を用いることが
出来る。音ｎ（ＣＶ、ＶＣ）に対応する音声波形から任
意音声を合成する方式は、例えば、前記文献に、音節に
対応するホルマントパラメータ等から任意音声を合成す
る方式は、例えば、１９８５年日本音響学会発行の音声
研究会資料（資料番号Ｓ　８５−３１　（１９８５−７
）　）巾の“ホルマント、ＣＶ−ＶＣ型規則合合成上題
する文献に詳しいので、ここでは説明を省略する。

（実施例）本ｖＡ発明の実施例を図面を参照して詳細に説明する。

第１図は本願発明の一実施例を示すブロック図である。

この実施例にはまず、文字列入力端子１１を介して合成
すべき文章を表す文字列１１０が音節名列変換部１に入
力される。音節名列変換部１は前記文字列１１０を音節
名列１０１に変換し最適音節系列選択部２に入力する。

Ｒ適音部系列選択部２は、記憶部３内の音節名列記憶部
Ａに記憶されている単語音声データに対応する音節名列
を参照して、前記音節名列を前記単語音声データの部分
音節名列１０２に分解し、記憶部３内の音節境界データ
記憶部Ｂのアドレスデータとして出力する。前記部分音
節名列への分解操作においては、入力文字列から変換さ
れた音節各系列を（Ｓｚ　、　Ｓ２　。

”・ＳＬ　　＋　Ｓｌ＋１　、”・、Ｓｎ　＋　”・、
ＳＮ　）とすると（ここで、Ｓｌ＋・・・Ｓｏは音節名
、Ｎは入力文字列に対する音節数を表す）、まずＳ、か
ら始めて左から右に前記単語音声データに含まれる最長
の部分音節名列の検索を行う、この結果Ｓ１．・・・。

ＳＩが最長の部分音節名列であったとすると、次に、Ｓ
！ヤ１から前記と同様の操作を繰り返して順次最長の部
分音節名列を検索する。記憶部３内の音声データ記憶部
Ｃからは、前記単語音声データの部分音節名列に従って
該単語音声データ中に含まれる前記部分音節名列に対応
する音声部分の音声データ１０３Ｃを順次編集合成回路
４に出力する。

編集合成回路４は前記記憶部３から出力される音声デー
タ１０３Ｃを編集合成し合成波形を生成し合成波形出力
端子１２を介して出力する。

なお、以上の説明においては、音節名列のアクセントの
有無を考慮に入れなかったが、アクセントによっても音
節の周波数スペクトルパタンは影響を受けるから、前記
部分音節名列の検索の際にアクセント情報も付加して検
索を行うことにより比教的良い合成音質の得られる音節
系列を取得できることは明らかである。

（発明の効果）以上述べたように本発明によれば、比較的長い音節系列
を単位音声として用いることが出来る。

そこで本発明の音声編集合成装置を採用することにより
、調音結合の効果がより多く取り入れられ比軸的高品質
な任意の合成音声が生成できる。

【図面の簡単な説明】

第１図は本発明の一実施例を示すブロック図、第２図は
音節名列および境界データの例を示す図である。第１図において、１は音節名列変換部、２は最適音節系
列選択部、３は記憶部、４は編集合成回路、１１は文字
列入力端子、１２は合成波形出力端子をそれぞれ表し、
また記憶部３内のＡはｍ語等の音声データに対応する音
節名列の記憶部、Ｂは前記音声データ内の前記音節名列
に対応する音節境界データの記憶部、Ｃは前記音声デー
タの記憶部をそれぞれ表す、第２図において、横軸は時
間を表し、縦軸は平均振幅値を表し、（）は音節名を表
し、実線は単語音声／ｙａｍａｚａｋｉ／の平均振幅パ
タンを表す。

Claims

【特許請求の範囲】

（１）あらかじめ単語等の音声データを前記各音声デー
タを表す音素名列および音節境界データとともに記憶す
る音声データメモリと、入力として与えられる音節名列
と前記単語等に対応する音節名列とのマッチングを行い
最長一致する前記音声データの部分音節名列を選択する
手段と、この選択手段で選択された音節名列に従って前
記音節境界データを用いて前記音声データから必要とす
る音声データを切り出し編集合成することにより所望の
音声を生成する手段とを有することを特徴とする音声編
集合成装置。
（２）前記音声データメモリに記憶される前記音素名列
が部分列を含むことを特徴とする特許請求の範囲第１項
記載の音声編集合成装置。