[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPS6060079B2 - アナログ信号合成装置 - Google Patents

アナログ信号合成装置

Info

Publication number
JPS6060079B2
JPS6060079B2 JP53048872A JP4887278A JPS6060079B2 JP S6060079 B2 JPS6060079 B2 JP S6060079B2 JP 53048872 A JP53048872 A JP 53048872A JP 4887278 A JP4887278 A JP 4887278A JP S6060079 B2 JPS6060079 B2 JP S6060079B2
Authority
JP
Japan
Prior art keywords
sample
analog signal
sampling
phoneme
signal element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53048872A
Other languages
English (en)
Other versions
JPS54139308A (en
Inventor
賢 西村
洋治 杉浦
憲一 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP53048872A priority Critical patent/JPS6060079B2/ja
Priority to US05/967,717 priority patent/US4210781A/en
Priority to IT7830905A priority patent/IT1192605B/it
Priority to GB7848761A priority patent/GB2013453B/en
Priority to FR7835365A priority patent/FR2434451B1/fr
Priority to CA000318058A priority patent/CA1118897A/en
Priority to DE2854601A priority patent/DE2854601C2/de
Publication of JPS54139308A publication Critical patent/JPS54139308A/ja
Priority to US06/297,831 priority patent/USRE31172E/en
Publication of JPS6060079B2 publication Critical patent/JPS6060079B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】 本発明は音声等のアナログ信号の合成装置に関し、合成
アナログ信号の品質を高めることを目的とするものであ
る。
一般に音素片即ち単語、音節、あるいはこれより更に短
い音声セグメントを結合編集して合成された音声信号(
単語、句、話声)の品質は音声の構成単位である音素片
の接続部の処理によつて決まると言える。
例えば接続部に発生する波形の急激な変化、即ち波形の
不連続性は高調波ノイズの原因となり、合成音のS/N
を低下させ、明瞭度を落す。又、声帯振動の基本周波数
であるピッチ周波数の変動は合成音声の自然性を劣化さ
せることも知られている。ピッチ周波数の変化に対して
人間の聴覚はきわめて敏感であり(検知限は0.1%と
言われる)、結合された音素片のピッチ周波数が不連続
な場合、合成音声は聞きづらい不自然なものとなる。本
発明は、音素片波形のパターンを認識して自然な形で各
音声片を結合することにより高品質の合成音を得ること
を可能とするものである。
音素片波形としては、自然音声からたとえばピッチ区間
毎に切り出したものを用いたり、別の音声合成装置で一
素片分を合成したものを取り出したりして用いる方法が
あるが、本発明は比較的短時間の、具体的には数拾〜数
百ミリ秒の音素片を、接続部に於ける波形の不連続及び
ピッチ周波数の変動なしに結合する方法を明らかにする
。即ち、かかる短時間の音素片は、相隣る音素片の少な
くとも結合部については波形が類似しているはずであり
、従つて、各音素片の時間軸をそれぞれ若干修正するこ
とにより、接続部はなめらかに結合して行くことが出来
る。本発明は結合される音素片の接続部について、波形
の類似度を信号のレベルの形で把握し、これにもとづき
音素片の時間軸に適当な時間的修正を施こすものである
。本発明の詳細な説明について、以下音声の時間軸変換
装置をその具体的実施例として説明する。
第1図は従来の時間軸伸長装置を例示するブロック図で
ある。同図に於て端子1は音声入力端子、2は出力端子
、3及び4はいずれもNビットの例えばBBDなどのア
ナログシフトレジスタ、5は低域通過フィルタ(LPF
)である。6,7,8及び9はアナログスイッチであり
、入力端子1からアナログシフトレジスタ3或いは牡L
PF5を経て出力端子2に至る音声信号をスイッチ制御
する。
かつ、これらアナログスイッチは、アナログシフトレジ
スタ3,4の書込クロック回路10をMN(但しMNは
整数、mについては後述する)分周する分周回路11の
Q及びO出力によつて図示の如く開閉制御される。アナ
ログシフトレジスタ3及び4はクロック回路10及び分
周回路11のQ,′Q出力のANDゲート12及び13
により0Rゲート14及び15を介して交互に書込みク
ロック制御され、又、読出しクロック回路16及び分周
回路11のQ,′Q出力のANDゲート17及び18に
より同じく0Rゲート14及び15を介して交互に読出
しクロック制御される。即ち、例えば入力端子に与えら
れた時間軸がm倍(m〉1)に圧縮された音声信号(か
かる圧縮信号は、例えばテープレコーダの再生速度を録
音速度のm倍にすることにより得られる)は、分周回路
11のQ出力が1のとき、アナログスイッチ8を経てア
ナログシフトレジスタ4に書込まれる。該シフトレジス
タのビット数はNであり、これに対しMN個のサンプリ
ング列が入力音声信号として順次入力を完了したとき、
分周回路11のQ出力は反転してOとなり、スイッチ8
を閉じる。同時に該分周回路のO出力は1となり、スイ
ッチ6を開いて、同様にアナログシフトレジスタ3に書
行みを行なう。このとき図の構成から明らかなように、
アナログシフトレジスタ4は読出しクロック回路16に
よりクロックされて、同様にO出力により制御されてい
るスイッチ9を経て読み出される。アナログシフトレジ
スタ3への書き込み期間中、別のアナログシフトレジス
タ4はこのように読み出しを行ない、続いて分周回路1
1のQ,O出力が反転すると、再びアナログシフトレジ
スタ4が書込み、3が読出しを行なう。ここで書込みク
ロック回路10のクロック周波数をf1、読出しクロッ
ク回路16のクロック周波数をF2としたとき、となる
ように、各クロック周波数を決めれば、時間軸はm倍に
伸長され、音声入力端子1に入力した圧縮音声は、出力
端子2に時間軸が復元されてあられれる。
読出しクロック周波数F2は、当然、必要な出力音声周
波数帯域に対しナイキストのサンプリング定理を満たす
ように決められる。上述の如き従来装置に於ては、アナ
ログシフトレジスタ3及び4を交互に出力する音素片の
接続タイミングは、書き込みクロック10をMN分周す
る分周回路11の出力によりMN/f1秒毎に自動的に
決められるため、従つて第5図に図示するように音素片
の接続部に不連続な波形変化とピッチ周波数の変動とが
発生する。尚、第4図aは先行音素片の後端を示す図面
、第4図bは後続音素片の先端を示す図面である。前記
の如く、このような音素片の接続部に於ける波形やピッ
チの不連続は音質や明瞭度をいちじるしく低下させる。
次にこのような従来装置の欠点を改良できる本発明の内
容について第2図のブロック図と共に説明する。同図に
於いて、103及び104はアナログスイッチ106,
107,108及び109によつて開閉制御されるアナ
ログシフトレジスタ、110及び116はそれぞれ周波
数f1および・F2のクロック回路、111はMN分周
回路であり、これらの構成は第1図の従来装置と同じで
ある。本発明は、前述の如く接続する音素片の接続部に
ついて時間的修正を加えるのであるが、これをROMl
2Oによりプログラムされたコンピユータ(演算処理装
置)CPUl2lにより行なう。計数回路(カウンター
)122は各周期毎に音素片の先端及び後端を計数し、
I/0ボート123を経てCPUl2lにタイミング指
示する回路、A/D変換器124はクロック回路110
からのコンバートコマンド信号に従つて入力信号をディ
ジタル変換する回路、及びCPUl2lに縦続するする
記憶回路125はこれらA/D変換されたディジタルコ
ード信号を記憶すると同時に、CPUl2lの演算処理
結果を一時保存する機能をあわせ有している。126は
コンパレータである。
127はANDゲートであり、コンパレータ126の出
力と、クロック回路110からのコンバートコマンド信
号との論理積出力を作り出す。
まず、CPUl2lは計数回路122の出力にもとづき
、入力クロックの最後部よりM個のサンプルをA/D変
換器124によりディジタル化して■/0ボート123
から読み込み、記憶回路125に保存する。次に分周回
路111の出力が反転すると、CPUl2lは同様に計
数回路122の出力にもとづき、入力クロックの前端か
ら(M+r)個のサンプルを読みこむ。引き続きCPU
l2lはROMl2Oのプログラムにもとづき、入力さ
れた音素片の後端と、その後に続く音素片の類似性を演
算するのであるが、これには各サンプリング列の二乗誤
差を計算するのが良い。−音素片の後端のサンプリング
数列をXp(p=1,2,3,・・M)、後続の音素片
の前端サンプリング数列をY,(p=1,2,3,・・
,M+r)としたとき、2つの波形間の二乗誤差はであ
られされる!″こTLはサンプリング波形X2に対して
YpをK個だけずらせて重ね合わせたときの類似度をあ
られすものである。
しかしながら、(2)式にもとづく演算処理は実際には
膨大な計算ステップ数となり、短時間で(少なくとも数
10ミリ秒の間で)計算するには、高性能のコンピュー
タによらねばならない。
もともと(2)式は振巾やレベルの異なる2つの波形の
相関をしらべるものであつて、その為標準偏差σX,σ
Yで波形を正規化し、更に平均レベルX,Yとの差につ
いて二乗和をとることにより誤差を計算している。とこ
ろで本発明の音声の合成装置の場合、取扱う音素片は時
間的に近似した波形であり、従つて、振巾、レベル共あ
る程度類似しているとみて良い。この場合2つの波形間
の差は(2)式にかわつて !5 − を計算しても良い。
しかも本発明の場合は2つの波形の類似度が最大のタイ
ミングを把握すれば良いのであり、従つて、(3)式は
更に次の(4)式に換えられる。即ち、これは各対応す
るサンプリング値の差の絶対値を積分したものであり、
これが極小となるKを知ることにより接続タイミングが
決定される。
即ち演算処理装置121はEKをK=0,1,・・rに
ついてそれぞれ計算し、これが最も小さくなるKを決定
する。さて、先行音素片と後続音素片は既述の如く時間
的に近接した波形であり、振巾およびレベルとも極めて
類似した場合について第3図に音素片接続部近傍の波形
を示す。
尚、第3図aは先行音素片の後端を示す図面、第3図b
は後続音素片の先端を示す図面、第3図cはタイミング
チャートを示す図面である。第3図に示すように、先行
音素片の後端M個のサンプル列は後続音素片の先頭より
k個ずれた部分から重ね合せるのが最も誤差が小いと言
う事になる。即ち、先行音素片の後端部M個のサンプル
列が再生出力されたあと、続いて後続音素片の先頭より
(k+M+2)番目のサンプルが再成出力されれば、本
音声合成装置は理想的に作用する事となる。しかし実際
の音声の入力″信号は時々刻々と変化しくおり、先行音
素片と後続音素片は時間的に近接した波形ではあるが、
全く同じ波形ではない。この場合の一例として先行音素
片の後端部波形に較べて、後続音素片の先端部の波形が
わずかにピッチ周波数が高い場合を第4図に図示する。
(4)式で与えられるEkの最小となるkを第4図bに
示したが、図から明らかな通り、先行音素片の後端M個
のサンプルと後続音素片の先頭より(k+1)個目から
M個のサンプルは、わずかにピッチ周波数が異るため、
先行音素片最後端のサンプリング値XMと後続音素片の
先頭から(K+M+1)番目のサンプリング値(Y8+
M+1)は電圧レベルが異なる。このようにレベル差の
ある部分で先行音素片と後続音素片を接続することは避
けた方がよい。そのため、本発明においては、先づ(4
)式で与えられるEKが最小となるKを算出し、後続音
素片の先頭から(K+M+1)番目付近の若干個数のサ
ンプルのサンプリング値(例えばYK,M..YK+M
+1、YK+M+2の3つのサンプリング値)と先行音
素片最後端のサンプリング値XMを比較し、XMの値に
最も近い値のサンプリング値に対応する後続音素片の先
頭からの番号を(K″+M+1)番目としたときのK″
を求める。即ち第4図においては、Kを算出して与えら
れる後続音素片の先頭から(K+M)、(K+M+1)
、(K+M+2)番目のサンプリング値(YA−1)、
(YA)、(YA+1)(但しA=K+M+1)の中で
(XM)に最も近い値、即ちY^−1の先頭からの番号
(K+M)を(K″+M+1)番目としたときのk″を
求めると、k+M=k″+M+1となり、従つて、k″
=k−1となる。このような処理により求められたk″
を用いると、先行音素片の後端M個のサンプル列は後続
音素片の先頭からk″個ずれた部分から重ね合わせる.
のが最も誤差が少いということになる。
そこで演算処理装置121は後続音素片の先頭より(k
″+M+N)をとり込み、I/Oボートを通じてAND
ゲート112あるいは113を制御し、書き込みクロッ
クを停止する。アナログシフトレジ.スタ103あるい
は104の容量はNであるから従つて該アナログシフト
レジスタには、図示の如く(k″+M+1)番目からN
ビットが記憶され、次の読み出しタイミングに順次読み
出されるのであるが、以上の説明から明らかな通り、先
行音素一片の最後端Mサンプルと後続音素片のk″+1
番目からのMサンプルとが最も誤差が少なく重なるので
、従つて音素片はまつたく自然な形で音素片が引き続き
出力される。前述の通り後続音素片は(k″+M+N)
サンプルがアナログメモリーに取り込まれるのであるが
、このうちの最後尾からMサンプルが同様にA/D変換
器12牡1/Oボート123を経てCPUl2lの記憶
装置125に保存される。これは更に続く音素片の先頭
から(M+r)個のサンプルとの類似性を調べて接続す
る為に必要である。以上の処理のタイムチャートを第3
図Cに図示する。ここで重要なことはアナログシフトレ
ジスタ103あるいは104はN・ビットであり、従つ
て、これ以上のビット(M+k″+N)のサンプルが読
み込まれても、記憶されるのはうしろからNビットだけ
であるということである。音素片の時間長は少なくとも
数10ミリ秒であるが、(4)式で示したEKの計算は
きわめて少ないステップで処理でき、低速のいわゆるマ
イクロコンピュータが利用できる。
尚、第5図には第1図の従来方式による時間軸伸長装置
の再生音声波形を、第6図には本発明方式(第2図およ
び第4図)による同再生音声波形を200Hzの正弦波
単一信号について実際に処理したデータを示してある。
これら両データはm=2、f1=40KHz.,f2=
20KHz..N=768なる条件で測定したものであ
る。上述においては音声の時間軸伸長装置を具体例とし
て説明したが、記憶手段として前述の如きアナログシフ
トレジスタを使用する代りにRAMを使用してもよく、
その際にはアナログの音声波形をA/D変換器でディジ
タル信号に変換してからRAMに入力し、RAM出力は
D/A変換器でアナログ信号に変換するという慣用技術
を使用することは言うまでもない。
このように本発明の技術は各種の音声や音響等のアナロ
グ信号の合成装置に利用可能であることは言うまでもな
い。このように本発明の装置は先行および後続アナログ
信号素片の接続部について、先行アナログ信号素片の後
端部のサンプリング値と後続アナログ信号素片のサンプ
リング値との差の絶対値の積分値が最小となり、更に接
続部について波形の連続性が保たれるよう重ね合わせる
べく時間軸の修正を行なうものである。
更に詳説すると、本発明は記憶手段に記憶された先行ア
ナログ信号素片の後端部近傍と後続アナログ信号素片の
先端部近傍の波形の類似性を比較し、先行アナログ信号
素片と後続アナログ信号素片が最も滑めらかに接続され
るよう後続アナログ信号素片をクロック出力することで
ある。即ち、先行アナログ信号素片の後端部近傍のデー
タと後続アナログ信号素片の先端部近傍のデータとを相
対的にシフトさせて比較し、先行アナログ信号素片に後
続アナログ信号素片が最も滑めらかに接続されるよう後
続アナログ信号素片のデータを記憶手段からクロック出
力する。従つて従来装置の如き接続部のアナログ信号波
形の不連続やピッチ周波数の変動等の無い合成アナログ
信号を得ることができる。
【図面の簡単な説明】
第1図は従来のアナログ信号合成装置を示すブロック・
ダイヤグラム、第2図は本発明のアナログ信号合成装置
を示すブロック・ダイアグラム、第3図および第4図は
本発明を説明するための図面、第5図は従来の装置の特
性を示す図面、第6図は本発明の装置の特性を示す図面
である。 103,104・・・アナログ信号の記憶装置、121
・・・演算処理装置。

Claims (1)

    【特許請求の範囲】
  1. 1 アナログ信号波形から抽出されたアナログ信号素片
    波形を用いて編集合成するアナログ信号合成装置であつ
    て、(a)クロックに従つてアナログ入力信号をサンプ
    リングして記憶する記憶装置と、(b)前記入力信号の
    サンプリングにより得られた先行アナログ信号素片の後
    端部近傍のサンプリング値と後続アナログ信号素片の先
    端部近傍のサンプリング値とに基づき順次両サンプリン
    グ値のレベル差を演算して該レベル差の絶対値の合計を
    計算し、且つ対応サンプリングデータを順次シフトさせ
    て前記レベル差の絶対値の合計の計算操作をそのシフト
    の都度行ない、該計算操作による計算値のうち計算値が
    最小となるサンプリングデータのシフト量を選定し、而
    して該シフト量により前記先行アナログ信号素片の最後
    端に続いて出力される前記後続アナログ信号素片のサン
    プルを前記シフト量計算による第1サンプルとし、後続
    アナログ信号素片の前記第1サンプルを含む該第1サン
    プル近傍の若干個のサンプリング値と前記先行アナログ
    信号素片の最後端のサンプリング値とを比較し、前記先
    行アナログ信号素片の最後端のサンプリング値に最も近
    い値の前記後続アナログ信号素片のサンプルを第2サン
    プルとして選定し、該第2サンプルが先行アナログ信号
    素片の最後端のサンプルに続いて出力されるよう後続の
    接続アナログ信号素片の時間軸を調整すべく前記記憶装
    置をクロック制御するようプログラムされた演算処理装
    置とを備えることを特徴とするアナログ信号素片編集型
    のアナログ信号合成装置。
JP53048872A 1977-12-16 1978-04-20 アナログ信号合成装置 Expired JPS6060079B2 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP53048872A JPS6060079B2 (ja) 1978-04-20 1978-04-20 アナログ信号合成装置
US05/967,717 US4210781A (en) 1977-12-16 1978-12-08 Sound synthesizing apparatus
IT7830905A IT1192605B (it) 1977-12-16 1978-12-15 Apparecchiatura e metodo di sintetizzazione per la riproduzione del suono
GB7848761A GB2013453B (en) 1977-12-16 1978-12-15 Sound synthesizing apparatus
FR7835365A FR2434451B1 (fr) 1977-12-16 1978-12-15 Appareil synthetiseur de sons
CA000318058A CA1118897A (en) 1977-12-16 1978-12-15 Sound synthesizing apparatus
DE2854601A DE2854601C2 (de) 1977-12-16 1978-12-18 Verfahren zur Tonaufbereitung und Ton-Synthesator zu seiner Durchführung
US06/297,831 USRE31172E (en) 1977-12-16 1981-08-31 Sound synthesizing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP53048872A JPS6060079B2 (ja) 1978-04-20 1978-04-20 アナログ信号合成装置

Publications (2)

Publication Number Publication Date
JPS54139308A JPS54139308A (en) 1979-10-29
JPS6060079B2 true JPS6060079B2 (ja) 1985-12-27

Family

ID=12815370

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53048872A Expired JPS6060079B2 (ja) 1977-12-16 1978-04-20 アナログ信号合成装置

Country Status (1)

Country Link
JP (1) JPS6060079B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108550363B (zh) * 2018-06-04 2019-08-27 百度在线网络技术(北京)有限公司 语音合成方法及装置、计算机设备及可读介质

Also Published As

Publication number Publication date
JPS54139308A (en) 1979-10-29

Similar Documents

Publication Publication Date Title
US4591928A (en) Method and apparatus for use in processing signals
US4214125A (en) Method and apparatus for speech synthesizing
JPS623439B2 (ja)
US5842172A (en) Method and apparatus for modifying the play time of digital audio tracks
JP2636685B2 (ja) 音楽イベントインデックス作成装置
KR100327969B1 (ko) 음성재생속도변환장치및음성재생속도변환방법
CN113178183A (zh) 音效处理方法、装置、存储介质和计算设备
EP0081595B1 (en) Voice synthesizer
JPH11259066A (ja) 音楽音響信号分離方法、その装置およびそのプログラム記録媒体
JP2001296883A (ja) 音声認識方法および装置、音声合成方法および装置、記録媒体
JPS6060079B2 (ja) アナログ信号合成装置
JPS6042959B2 (ja) アナログ信号合成装置
JPS6042960B2 (ja) アナログ信号合成装置
JPS6060077B2 (ja) アナログ信号合成装置
JPS6060078B2 (ja) アナログ信号合成装置
JPS6036598B2 (ja) 音声合成装置
JPH035599B2 (ja)
JPH0125080B2 (ja)
Bloom Use of dynamic programming for automatic synchronization of two similar speech signals
JPH0358518B2 (ja)
JPS60216393A (ja) 情報処理装置
JPS62102294A (ja) 音声符号化方式
唐博文 Energy-Efficient Real-Time Pitch Correction System via FPGA
JPS6265098A (ja) 音楽用ボコ−ダ
JPS5968793A (ja) 音声合成装置