[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPH10135839A - 音声符号化方法およびその装置 - Google Patents

音声符号化方法およびその装置

Info

Publication number
JPH10135839A
JPH10135839A JP9240923A JP24092397A JPH10135839A JP H10135839 A JPH10135839 A JP H10135839A JP 9240923 A JP9240923 A JP 9240923A JP 24092397 A JP24092397 A JP 24092397A JP H10135839 A JPH10135839 A JP H10135839A
Authority
JP
Japan
Prior art keywords
pulse
main
main pulse
estimating
estimated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9240923A
Other languages
English (en)
Inventor
Mitsuhiro Inazumi
満広 稲積
Sunao Aizawa
直 相澤
Yasunaga Miyazawa
康永 宮沢
Hiroshi Hasegawa
浩 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP9240923A priority Critical patent/JPH10135839A/ja
Publication of JPH10135839A publication Critical patent/JPH10135839A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Analogue/Digital Conversion (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 少ない計算量で効率的に音声データを符号化
し、かつ、データ欠落の影響を受けないようにする。 【解決手段】 入力音声データから所定の長さのフレー
ムデータ区間を切り出して、スペクトル包絡パラメータ
を抽出し(ステップs1〜s3)、このスペクトル包絡
パラメータから主パルスの位置と強度を推定し(ステッ
プs4)、この主パルスに対して時間的に先行する所定
区間において前記主パルスに対する先行パルスの位置と
強度を推定するとともに、前記主パルスに対して時間的
に後続する所定区間において前記主パルスに対する後続
パルスの位置と強度を推定し(ステップs5〜s6)、
これら主パルス、先行パルス、後続パルスを1つの組と
して、この1つの組のパルス群を用いて1フレーム内の
合成パルス列を作成し、この合成パルス列と前記スペク
トル包絡パラメータとをそれぞれ符号化する(ステップ
s7〜s14)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を少ない
計算量で効率的に符号化する音声符号化方法および装置
に関する。
【0002】
【従来の技術】音声信号を符号化する方法として、従来
より様々な方法が提案されている。その1つとして、特
開昭59−116973(以下、第1の従来技術とい
う)がある。
【0003】この第1の従来技術は、入力音声データを
短時間毎に分割して短時間音声信号系列を求める手段、
この短時間音声信号系列からスペクトル包絡パラメータ
を抽出するスペクトル包絡パラメータ抽出手段、このス
ペクトル包絡パラメータをもとにインパルス応答系列を
計算するするインパルス応答系列計算手段、このインパ
ルス応答系列を用いて自己相関関数列を計算する手段、
前記インパルス応答系列と短時間音声信号系列を用いて
相互相関関数列を計算する手段、前記自己相関関数列と
相互相関関数列を用いて駆動音源信号系列計算して符号
化する手段、スペクトル包絡符号と駆動音源信号とを組
み合わせて出力する手段とを有し、さらに、前記短時間
音声信号に対して予め定められた補正を加える目標信号
計算手段を有している。
【0004】この第1の従来技術によれば、音声の符号
化を行うに際して、効率的に駆動音源パルスの位置とゲ
インを決定することができ、また、計算量、使用メモリ
量の削減にもある程度の効果は得られる。
【0005】しかし、この第1の従来技術は、女性の声
のような音声信号を符号化したのち、音声合成を行う場
合、高品質な音声合成を得るには、駆動音源パルスをた
くさん抽出する必要があるため、圧縮率が悪くなるとい
う問題点があった。
【0006】すなわち、女性の声は、男性の声に比べる
と複雑で、高精度な合成音を得るには、駆動音源パルス
をたくさん抽出する必要があり、結局は、圧縮率が悪い
ものとなってしまう。
【0007】一方、高い圧縮率を得るための技術とし
て、特開昭63−37399(以下、第2の従来技術と
いう)、特開平3−4300(以下、第3の従来技術と
いう)がある。
【0008】第2の従来技術は、音声信号からピッチ推
定を行い、過去のパルス列からの推定値と実際の信号と
の残差を求め、この残差により駆動音源パルスを計算し
ようとするものである。
【0009】また、第3の従来技術は、ピッチ推定を行
い、その1ピッチ区間分の駆動音源(マルチパルス)を
推定する。そして、そのマルチパルスのゲインと位相を
補正することによって、他のピッチ区間を補正すること
により他のピッチ区間を近似する。さらに、推定された
値と実際の値との残差より、第2のマルチパルスを推定
する。なお、マルチパルス信号の他に雑音コードブック
を用いる場合もある。
【0010】
【発明が解決しようとする課題】前記した第2、第3の
従来技術は、同じ波形を繰り返す周期を求め、1つ前の
周期から次の周期を推定し、その推定した部分と現実の
音声波形との差分を計算して、その差分により駆動音源
を計算するため、高い圧縮率が実現できる。
【0011】しかし、ピッチを求めたり差分を求めたり
する必要があるため計算量が多く、また、それらのデー
タを蓄えるために大きな容量のメモリが必要になるとい
う問題点がある。
【0012】また、残差を求め、この残差により駆動音
源パルスを計算するため、データの一部が失われた場
合、失われたデータ部分がそれ以降の計算に大きき影響
を与えることになり、高精度な音声合成が行えなくなる
という大きな問題点がある。
【0013】このように、従来の技術は、それぞれにお
いて種々の問題点がある。たとえば、第1の従来技術
は、駆動音源パルスを求めるための基本的な技術ではあ
るが、合成音の品質を上げようとすると、多くの駆動音
源パルスを立てる必要があり、女性の声のような音声デ
ータに対しては特に圧縮率が悪くなるという問題があ
る。また、第2の従来技術と、第3の従来技術は高圧縮
率が得られるが、計算量が多く、使用メモリ量も多いと
いう問題があり、さらに、差分情報を用いるためデータ
欠落に弱いという問題がある。
【0014】最近では音声データを扱う携帯用の情報機
器が広い分野で用いられるようになってきている。この
種の携帯用情報機器は、CPUの計算速度やメモリ容量
には大きな制約があるため、計算量や使用メモリ量が多
いということは重大な問題である。また、差分情報を用
いる方法は、データの欠落を考慮する必要のある情報機
器においては製品の性能向上の面で問題が多く、携帯機
器に限らず、コンピュータネットワーク上のリアルタイ
ム伝送などにおいても、データの欠落が、伝送されるデ
ータに大きな影響を与えることにもなる。
【0015】そこで、本発明は、計算量および使用メモ
リ量の削減を図り、データ欠落に対して大きな影響を受
けることなく、比較的高い圧縮率での音声データ圧縮を
可能とする音声符号化方法およびその装置を実現するこ
とを目的とする。
【0016】
【課題を解決するための手段】本発明の音声合成方法
は、請求項1に記載されるように、入力された音声デー
タから所定の長さのフレームデータ区間を切り出して、
スペクトル包絡パラメータを抽出し、このスペクトル包
絡パラメータから主パルスの位置と強度を推定し、この
主パルスに対して時間的に先行する所定区間において前
記主パルスに対する先行パルスの位置と強度を推定する
とともに、前記主パルスに対して時間的に後続する所定
区間において前記主パルスに対する後続パルスの位置と
強度を推定し、これら主パルス、先行パルス、後続パル
スを1つの組として、この1つの組のパルス群を用いて
前記切り出されたフレーム内の合成パルス列を作成し、
この合成パルス列と前記スペクトル包絡パラメータとを
それぞれ符号化することを特徴としている。
【0017】また、前記請求項1における主パルス、先
行パルス、後続パルスからなる1つの組のパルス群を用
いて前記フレーム内の合成パルス列を作成する処理は、
この1つの組のパルス群を基に、所定数の組のパルス群
を決定し、それぞれの組のパルス群から合成パルス列を
作成するようにしている。
【0018】そして、前記1つの組のパルス群を基に、
所定数の組のパルス群を決定する処理は、前記1つの組
のパルス群の近似部分を検索し、その近似部分における
主パルスを第2以降の主パルスとして推定し、その位置
を基にその先行パルスと後続パルスを決定し、これを所
定の組数を得るまで行う。
【0019】また、本発明の音声符号化方法は、請求項
4に記載されるように、入力された音声データから主パ
ルスを推定し、この主パルスに対して時間的に先行する
所定区間において前記主パルスに対する先行パルスのを
推定するとともに、前記主パルスに対して時間的に後続
する所定区間において前記主パルスに対する後続パルス
を推定し、これら主パルス、先行パルス、後続パルスを
1つの組として、この1つの組のパルス群を用いて合成
パルス列を作成して、符号化することを特徴としてい
る。
【0020】また、本発明の音声符号化装置は、請求項
5に記載されるように、入力された音声データより所定
の長さのフレームデータ区間を切り出すフレームデータ
切り出し手段と、前記切り出されたフレームデータ区間
について、スペクトル包絡パラメータを抽出するスペク
トル包絡パラメータ抽出手段と、このスペクトル包絡パ
ラメータにより、前記切り出されたフレームから主パル
スの位置と強度を推定する主パルス推定手段と、この主
パルスに対して時間的に先行する所定区間において、前
記主パルスに対する先行パルスの位置と強度を推定する
先行パルス推定手段と、前記主パルスに対して時間的に
後続する所定区間において前記主パルスに対する後続パ
ルスの位置と強度を推定する後続パルス推定手段と、こ
れら主パルス、先行パルス、後続パルスを1つの組とし
て、この1つの組のパルス群を用いて前記1フレーム内
の合成パルス列を作成する駆動音源信号生成手段と、こ
の駆動音源信号生成手段により作成された合成パルス列
と前記スペクトル包絡パラメータとをそれぞれ符号化す
る符号化手段とを有することを特徴としている。
【0021】前記請求項5における駆動音源信号生成手
段は、前記1つの組のパルス群を基に、所定数の組のパ
ルス群を決定し、それぞれの組のパルス群から合成パル
ス列を作成する。
【0022】そして、前記1つの組のパルス群を基に、
所定数の組のパルス群を決定する処理は、前記1つの組
のパルス群の近似部分を検索し、その近似部分における
主パルスを第2以降の主パルスとして推定し、その位置
を基にその先行パルスと後続パルスを決定し、これを所
定の組数を得るまで行うようにしている。
【0023】また、本発明の音声符号化装置は、請求項
8に記載されるように、入力された音声データから主パ
ルスの位置と強度を推定する主パルス推定手段と、この
主パルスに対して時間的に先行する所定区間において、
前記主パルスに対する先行パルスを推定する先行パルス
推定手段と、前記主パルスに対して時間的に後続する所
定区間において前記主パルスに対する後続パルスを推定
する後続パルス推定手段と、これら主パルス、先行パル
ス、後続パルスを1つの組として、この1つの組のパル
ス群を用いて合成パルス列を作成して符号化する手段と
を有することを特徴としている。
【0024】このように、本発明では、 主パルス、先
行パルス、後続パルスを1つの組として、この1つの組
のパルス群を用いて合成パルス列を作成するようにして
いるため、ピッチを求めたり差分を求めたりする必要が
なく、そのための計算量や使用メモリ量を大幅に削減す
ることができる。
【0025】また、残差により駆動音源パルスを計算す
る方法ではなく、1つのフレーム毎に独立して駆動音源
パルスを求めるようにしているので、データの欠落の影
響をそれ以降のフレームにまで及ぼすことがなくなる。
【0026】
【発明の実施の形態】以下、本発明の実施の形態につい
て図1〜図3を参照しながら説明する。
【0027】まず、本発明の音声符号化方法について、
図1のフローチャートおよび図2のパルス推定処理を説
明する図を参照しながら説明する。
【0028】まず、入力された音声から処理対象のフレ
ームを切り出す(ステップs1)。このフレームの切り
出しは、図2(a)のような入力音声信号から同図
(b)のような所定のフレーム区間を切り出す。そし
て、切り出したフレームが最初のフレームであるか否か
を判定し(ステップs2)、最初のフレームであれば、
そのままそのフレームからスペクトル包絡パラメータの
抽出を行う(ステップs3)。
【0029】次に、抽出されたスペクトル包絡パラメー
タにおいて、第1番目の主パルスを推定する(ステップ
s4)。この第1番目の主パルス(第1主パルスとい
う)の推定は、切り出されたフレームデータ区間におけ
るスペクトル包絡パラメータから最も強度の大きいパル
スを第1主パルスとして、その位置と強度を推定する。
図2(c)はこれにより推定された第1主パルスp11
を示す。
【0030】このようにして第1主パルスp11が推定
されると、この第1主パルスp11を基準に、第1主パ
ルスp11に対して、時間的に先行する位置に存在する
先行パルスの位置と強度を推定する(ステップs5)。
【0031】この先行パルスの推定は、第1主パルスp
11を基準に、この第1主パルスp11から予め定めら
れた時間だけさかのぼった時間内(指定区間t1とい
う)において最も強度の大きいパルスを先行パルスと
し、その位置と強度を推定する。図2(d)はこれによ
り推定された先行パルスp12を示す。
【0032】ところで、前記指定区間t1は一例とし
て、たとえば、スペクトル包絡パラメータの持つ分析次
数程度の幅とする。この分析次数とは、音声のサンプリ
ング周波数を基に経験に基づいて決定される。仮に音声
のサンプリング周波数が8KHzであるとすれば、8K
Hzの8に2をプラスして得られた10を分析次数とす
る。したがって、たとえば、音声のサンプリング周波数
が20KHzであるとすれば、20に2をプラスして得
られた22を分析次数としている。
【0033】そして、この分析次数を表す数値をサンプ
ル数に対応させ、そのサンプル数に相当する時間を指定
区間とする。たとえば今、音声のサンプリング周波数が
8KHzであるとし、切り出した1フレームの長さが1
6msecであるとすれば、1フレーム内には128サ
ンプルが存在することになる。この場合の分析次数は、
8+2=10となり、その分析次数10をサンプル数と
して、10サンプルに相当する時間(1.25msec)を指定
区間として設定する。
【0034】なお、この指定区間の求め方は一例であっ
て、このような方法に限られるものではなく、他の方法
も考えられる。
【0035】以上のようにして、先行パルスp12が決
まると、次に、前記第1主パルスp11を基準に、第1
主パルスp11に対して、時間的に後方の位置に存在す
る後続パルスの位置と強度を推定する(ステップs
6)。
【0036】この後続パルスの推定は、第1主パルスp
11を基準に、第1主パルスp11から予め定められた
時間後の所定の時間内(前記同様、指定区間といい、こ
の指定区間をt2で表す)において最も強度の大きいパ
ルスを後続パルスとし、その位置と強度を推定する。図
2(e)はこれにより推定された後続パルスp13を示
す。なお、ここでは、指定時間t1とt2を等しく設定
している。
【0037】このようにして、まず、第1主パルスp1
1の位置と強度を推定し、この第1主パルスp11を基
準にして、第1主パルスに対する先行パルスp12と後
続パルスp13の位置と強度を推定する。
【0038】そして、次に、パルスの推定終了条件を満
たしたか否かの判断を行う(ステップs7)。このパル
スの推定終了条件というのは、たとえば、前記した3つ
で1組のパルス(主パルス、先行パルス、後続パルス)
を予め設定した組数だけ推定したか否かにより判断す
る。この実施の形態では、前記した3つで1組のパルス
を3組推定するものとする。ここでは、前記した第1主
パルスp11とその先行パルスp12、後続パルスp1
3(この第1主パルスp11とその先行パルスp12、
後続パルスp13の組を、1組目のパルス群A1とい
う)の他に、あと2組の主パルス、先行パルス、後続パ
ルスを推定することになる。
【0039】したがって、この場合、次の主パルス(第
2主パルスという)を推定する処理を行うが、その前
に、推定済みパルス群(第1主パルスp11とその先行
パルスp12、後続パルスp13)の影響を補正(ステ
ップs8)したのち、第2主パルスの推定を行う(ステ
ップs9)。
【0040】この第2主パルスの推定は、既に求められ
た1組目のパルス群A1(第1主パルスp11とその先
行パルスp12、後続パルスp13)を用いて、この1
組目のパルス群A1の位置をずらしながら近似的部分に
合わせ込むことで、第2主パルスp21を推定する。こ
のようにして推定された第2主パルスp21を図2
(f)に示す。
【0041】この第2主パルスp21が推定されると、
自動的に第2主パルスp21に対する先行パルスp22
と後続パルスp23が決定される(ステップs10)。
【0042】以上の処理により、第1主パルスp11と
その先行パルスp12、後続パルスp13と、第2主パ
ルスp21とその先行パルスp22,後続パルスp23
が決まる。これを図2(g)に示す。この第2主パルス
p21とその先行パルスp22、後続パルスp23の組
を、2組目のパルス群A2という。
【0043】そして、再び、ステップs7に処理が戻っ
て、パルス推定条件に達していなければ、今度は第3主
パルスの推定を行う。この第3主パルスも前記同様、既
に推定されたパルス群の影響を補正した後、既に求めら
れた1組目のパルス群A1(第1主パルスp11とその
先行パルスp12、後続パルスp13)を用いて、この
パルス群の位置をずらしながら近似的部分に合わせ込む
ことで、第3主パルスp31を推定する。このようにし
て推定された第3主パルスp31を図2(h)に示す。
【0044】この第3主パルスp31が推定されると、
自動的に第3主パルスp31に対する先行パルスp32
と後続パルスp33が決定される(ステップs10)。
この第3主パルスp31とその先行パルスp32、後続
パルスp33の組を、3組目のパルス群A3という。。
【0045】以上のようにして、まず、第1主パルスp
11の位置と強度を推定し、この第1主パルスp11を
基にその先行パルスp12と後続パルスp13のそれぞ
れの位置と強度を推定することで、1組目のパルス群A
1が求められる。そして、この1組目のパルス群A1の
位置をずらして合わせ込むことにより、第2主パルスp
21の位置と強度を推定し、これにより、この第2主パ
ルスp21の先行パルスp22と後続パルスp23で構
成される2組目のパルス群A2を求め、さらに、第3主
パルスp31の位置の位置と強度を推定し、これによ
り、この第3主パルスp31の先行パルスp32と後続
パルスp33で構成される3組目のパルス群A3を求め
るというような処理を行う。
【0046】図2(i)は、1組目のパルス群A1、2
組目のパルス群A2、3組目のパルス群A3を示す。
【0047】なお、図2からもわかるように、主パルス
(この場合、第1、第2、第3の主パルスp11,p2
1,p31)は、処理対象のフレーム内から決定される
が、それぞれの主パルスに対する先行パルス、後続パル
スは、隣接するフレーム内から決定される場合もある。
たとえば、図2の例では、先行パルスp12,後続パル
スp23は隣接するフレーム内から決定されている。
【0048】そして、前記図1のフローチャートにおい
て、パルスの推定終了条件を満たしたと判断された場合
は(ステップs7)、ステップs3で抽出されたスペク
トル包絡パラメータを符号化する(ステップs11)。
【0049】さらに、以上の処理によって求められた3
組のパルス群A1,A2,A3のそれぞれのパルスパラ
メータを符号化する(ステップs12)。
【0050】この3組のパルス群のパルスパラメータ
は、第1主パルスp11の位置データとその強度を表す
データ、その先行パルスp12の位置データとその強度
を表すデータ、後続パルスp13の位置データとその強
度を表すデータと、この1組目のパルス群A1のそれぞ
れのパルスデータを基準にして得られた2組目と3組目
のパルス群A2,A3のそれぞれの位置データとそれぞ
れの強度を表すデータである。
【0051】そして、このステップs12で符号化され
たデータと前記ステップs11で符号化されたデータ
を、その処理対象フレームの符号化データとして出力
(あるいは、記憶手段に記憶)する(ステップs1
3)。
【0052】そして、すべてのフレームについて処理が
終了したか否かを判断して(ステップs14)、すべて
のフレームについて処理が終了していれば、処理終了と
なり、終了していなければ、ステップs1に処理が戻
り、新たなフレームの切り出しを行い、以下、前記同様
の処理を行う。
【0053】ところで、前記ステップs2において、処
理対象のフレームが最初のフレームでないときは、前フ
レームの影響を補正(ステップs15)した後、ステッ
プs3以降の処理に入る。この前フレームの影響補正と
は、前記したように、前フレームで次フレーム(処理対
象フレーム)内で後続パルスを立てた場合など、そのパ
ルスを除いて、パルス推定を行うことを意味している。
【0054】図3は本発明の音声符号化装置の構成を説
明する図であり、フレームデータ記憶部1、スペクトル
包絡パラメータ抽出部2、主パルス推定部3、先行パル
ス推定部4、後続パルス推定部5、駆動音源信号生成部
6、符号化部7から構成されている。
【0055】フレームデータ記憶部1は、処理対象の音
声信号から抽出された1フレーム分のデータを記憶す
る。スペクトル包絡パラメータ抽出部2は、フレームデ
ータ記憶部1に記憶されているフレームデータからスペ
クトルパラメータを抽出する。そして、主パルス推定部
3は、スペクトル包絡パラメータ抽出部2で抽出された
スペクトル包絡パラメータを基に、まず第1主パルスp
11の位置と強度を推定する。先行パルス推定部4は、
主パルス推定部3で推定された第1主パルスp11の位
置を基準に、この第1主パルスp11から予め定められ
た時間だけさかのぼった時間内(指定区間t1)におい
て最も強度の大きいパルスを先行パルスp12とし、そ
の位置と強度を推定する。
【0056】さらに、後続パルス推定部5は、主パルス
推定部3で推定された第1主パルスp11の位置を基準
に、この第1主パルスp11から予め定められた時間だ
け後方の時間内(指定区間t2)において最も強度の大
きいパルスを後続パルスp13とし、その位置と強度を
推定する。このようにして、1組目のパルス群A1が決
定されると、この1組目のパルス群A1は駆動音源信号
生成部6に送られる。この駆動音源信号生成部6は、こ
の1組目のパルス群A1のそれぞれのパルスデータを用
いて、前記図1および図2を参照して説明したように、
2組目、3組目のパルス群A2,A3を決定し、駆動音
源パルス信号として生成する。そして、この駆動音源パ
ルス信号と前記スペクトル包絡パラメータは共に、符号
化部7に送られ、それぞれ符号化されて出力される。
【0057】このように、この実施の形態では、第1主
パルスp11とその先行パルスp12、後続パルスp1
3の位置と強度を推定し、これらで構成される1組目の
パルス群A1を基に、2組目のパルス群A2、3組目の
パルス群A3を得て、これらの3組のパルス群A1,A
2,A3を用いて合成パルスを作るようにしている。な
お、以上の説明では、パルスの推定終了条件としては、
予め設定された組数を推定条件とした。つまり、前記実
施の形態ではパルス群が3組得られることを推定終了条
件としたが、この組数は3組に限られるものではない。
また、推定条件は組数ではなく、たとえば、第1主パル
スp11とその先行パルスp12、後続パルスp13を
決めた後、以降の主パルスの強度が第1主パルスの大き
さに対してどのくらいの大きさになったかを判断するた
めのしきい値を定め、第2主パルス以降の主パルスがそ
のしきい値以下になったときをパルスの推定条件終了と
するようにしてもよい。
【0058】このように、本発明では、主パルスとその
先行パルス、後続パルスの3つを1組とし、その1組の
パルス群を基にして合成パルス列を作るようにしてい
る。したがって、ピッチ周期そのものを計算していない
ので、計算量の削減が図れ、また、1フレームずつ独立
して合成パルス列を作成するので、従来の差分情報を用
いる方法に比べて、データの一部が失われた場合にもそ
の影響を殆ど受けることがない。
【0059】たとえば、1フレーム内で、12個のパル
スを立てようとする場合、位置計算を例に取れば、従来
では、12個分の位置計算が必要となるが、本発明で
は、まず、最初に、第1主パルスを求め、その先行パル
スと後続パルスを求め、以降は、この第1主パルス、先
行パルス、後続パルスで構成される1組目のパルス群A
1を用いて、第2主パルス、第3主パルス、第4主パル
スの位置を求めるだけであるので(なお、これら第2主
パルス、第3主パルス、第4主パルスに対するそれぞれ
の先行パルス、後続パルスの位置は自動的に決まる)、
1組目のパルス群の計算が3回であり、この1組目のパ
ルス群を用いて、第2主パルス、第3主パルス、第4主
パルスの位置を求める計算が3回の合計6回の位置計算
で済み、従来の半分の計算量で済むことになる。
【0060】なお、以上説明した本発明の処理を行う処
理プログラムは、フロッピィディスク、光ディスク、ハ
ードディスクなどの記憶媒体に記憶させておくことがで
き、本発明は、それらの記憶媒体をも含むものであり、
また、ネットワークからデータを得る形式でもよい。
【0061】
【発明の効果】本発明によれば、入力音声データから所
定の長さのフレームデータ区間を切り出して、スペクト
ル包絡パラメータを抽出し、このスペクトル包絡パラメ
ータから、まず、主パルスの位置と強度を推定し、この
主パルスに対して時間的に先行する所定区間において前
記主パルスに対する先行パルスの位置と強度を推定する
とともに、前記主パルスに対して時間的に後続する所定
区間において前記主パルスに対する後続パルスの位置と
強度を推定し、これら主パルス、先行パルス、後続パル
スを1つの組として、この1つの組のパルス群を用いて
前記1フレーム内の合成パルス列を作成し、この合成パ
ルス列と前記スペクトル包絡パラメータとをそれぞれ符
号化するようにしている。これにより、計算量や使用メ
モリ量を大幅に削減することができ、また、1つのフレ
ーム毎に独立して符号化しているので、データの欠落の
影響を殆ど受けることがない。
【0062】このように、本発明は、CPUの計算速度
やメモリ容量に大きな制約のある小型の情報機器や、デ
ータ欠落の可能性を否定できない情報機器などに適用さ
れることにより、特に大きな効果を奏するものとなる
【図面の簡単な説明】
【図1】本発明の実施の形態の処理手順を説明するフロ
ーチャート。
【図2】図1のフローチャートにおけるフレーム切り出
しから主パルス、先行パルス、後続パルスを推定する処
理を説明する図。
【図3】本発明の実施の形態の構成を説明するブロック
図。
【符号の説明】
1 フレームデータ記憶部 2 スペクトル包絡パラメータ抽出部 3 主パルス推定部 4 先行パルス推定部 5 後続パルス推定部 6 駆動音源信号生成部 7 符号化部 p1 1組目のパルス群 p2 2組目のパルス群 p3 3組目のパルス群 p11 第1主パルス p12 第1主パルスに対する先行パルス p13 第1主パルスに対する後続パルス p21 第2主パルス p22 第2主パルスに対する先行パルス p23 第2主パルスに対する後続パルス p31 第3主パルス p32 第3主パルスに対する先行パルス p33 第3主パルスに対する後続パルス
───────────────────────────────────────────────────── フロントページの続き (72)発明者 長谷川 浩 長野県諏訪市大和3丁目3番5号 セイコ ーエプソン株式会社内

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声データから所定の長さの
    フレームデータ区間を切り出して、スペクトル包絡パラ
    メータを抽出し、このスペクトル包絡パラメータから主
    パルスの位置と強度を推定し、この主パルスに対して時
    間的に先行する所定区間において前記主パルスに対する
    先行パルスの位置と強度を推定するとともに、前記主パ
    ルスに対して時間的に後続する所定区間において前記主
    パルスに対する後続パルスの位置と強度を推定し、これ
    ら主パルス、先行パルス、後続パルスを1つの組とし
    て、この1つの組のパルス群を用いて前記切り出された
    フレーム内の合成パルス列を作成し、この合成パルス列
    と前記スペクトル包絡パラメータとをそれぞれ符号化す
    ることを特徴とする音声符号化方法。
  2. 【請求項2】 前記主パルス、先行パルス、後続パルス
    からなる1つの組のパルス群を用いて前記フレーム内の
    合成パルス列を作成する処理は、この1つの組のパルス
    群を基に、所定数の組のパルス群を決定し、それぞれの
    組のパルス群から合成パルス列を作成することを特徴と
    する請求項1記載の音声符号化方法。
  3. 【請求項3】 前記1つの組のパルス群を基に、所定数
    の組のパルス群を決定する処理は、前記1つの組のパル
    ス群の近似部分を検索し、その近似部分における主パル
    スを第2以降の主パルスとして推定し、その位置を基に
    その先行パルスと後続パルスを決定し、これを所定の組
    数を得るまで行うことを特徴とする請求項2記載の音声
    符号化方法。
  4. 【請求項4】 入力された音声データから主パルスを推
    定し、この主パルスに対して時間的に先行する所定区間
    において前記主パルスに対する先行パルスのを推定する
    とともに、前記主パルスに対して時間的に後続する所定
    区間において前記主パルスに対する後続パルスを推定
    し、これら主パルス、先行パルス、後続パルスを1つの
    組として、この1つの組のパルス群を用いて合成パルス
    列を作成して、符号化することを特徴とする音声符号化
    方法。
  5. 【請求項5】 入力された音声データより所定の長さの
    フレームデータ区間を切り出すフレームデータ切り出し
    手段と、 前記切り出されたフレームデータ区間について、スペク
    トル包絡パラメータを抽出するスペクトル包絡パラメー
    タ抽出手段と、 このスペクトル包絡パラメータにより、前記切り出され
    たフレームから主パルスの位置と強度を推定する主パル
    ス推定手段と、 この主パルスに対して時間的に先行する所定区間におい
    て、前記主パルスに対する先行パルスの位置と強度を推
    定する先行パルス推定手段と、 前記主パルスに対して時間的に後続する所定区間におい
    て前記主パルスに対する後続パルスの位置と強度を推定
    する後続パルス推定手段と、 これら主パルス、先行パルス、後続パルスを1つの組と
    して、この1つの組のパルス群を用いて前記1フレーム
    内の合成パルス列を作成する駆動音源信号生成手段と、 この駆動音源信号生成手段により作成された合成パルス
    列と前記スペクトル包絡パラメータとをそれぞれ符号化
    する符号化手段と、 を有することを特徴とする音声符号化装置。
  6. 【請求項6】 前記駆動音源信号生成手段は、前記1つ
    の組のパルス群を基に、所定数の組のパルス群を決定
    し、それぞれの組のパルス群から合成パルス列を作成す
    ることを特徴とする請求項5記載の音声符号化装置。
  7. 【請求項7】 前記1つの組のパルス群を基に、所定数
    の組のパルス群を決定する処理は、前記1つの組のパル
    ス群の近似部分を検索し、その近似部分における主パル
    スを第2以降の主パルスとして推定し、その位置を基に
    その先行パルスと後続パルスを決定し、これを所定の組
    数を得るまで行うことを特徴とする請求項6記載の音声
    符号化装置。
  8. 【請求項8】 入力された音声データから主パルスの位
    置と強度を推定する主パルス推定手段と、 この主パルスに対して時間的に先行する所定区間におい
    て、前記主パルスに対する先行パルスを推定する先行パ
    ルス推定手段と、 前記主パルスに対して時間的に後続する所定区間におい
    て前記主パルスに対する後続パルスを推定する後続パル
    ス推定手段と、 これら主パルス、先行パルス、後続パルスを1つの組と
    して、この1つの組のパルス群を用いて合成パルス列を
    作成して符号化する手段と、 を有することを特徴とする音声符号化装置。
JP9240923A 1996-09-05 1997-09-05 音声符号化方法およびその装置 Withdrawn JPH10135839A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9240923A JPH10135839A (ja) 1996-09-05 1997-09-05 音声符号化方法およびその装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP23561096 1996-09-05
JP8-235610 1996-09-05
JP9240923A JPH10135839A (ja) 1996-09-05 1997-09-05 音声符号化方法およびその装置

Publications (1)

Publication Number Publication Date
JPH10135839A true JPH10135839A (ja) 1998-05-22

Family

ID=26532231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9240923A Withdrawn JPH10135839A (ja) 1996-09-05 1997-09-05 音声符号化方法およびその装置

Country Status (1)

Country Link
JP (1) JPH10135839A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002222998A (ja) * 2001-01-29 2002-08-09 Nichia Chem Ind Ltd 光半導体素子

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002222998A (ja) * 2001-01-29 2002-08-09 Nichia Chem Ind Ltd 光半導体素子

Similar Documents

Publication Publication Date Title
CN111816158B (zh) 一种语音合成方法及装置、存储介质
JPH0946233A (ja) 音声符号化方法とその装置、音声復号方法とその装置
JP2798003B2 (ja) 音声帯域拡大装置および音声帯域拡大方法
JPH10135839A (ja) 音声符号化方法およびその装置
US20060087464A1 (en) Digital signal processing method, processing thereof, and recording medium containing the program
JP2905191B1 (ja) 信号処理装置、信号処理方法および信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP3255190B2 (ja) 音声符号化装置並びにその分析器及び合成器
EP4198972B1 (en) Stereo signal processing
US7580833B2 (en) Constant pitch variable speed audio decoding
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPS63239500A (ja) マルチパルス符号化方法および装置
JPS61148500A (ja) 音声信号符号化方法とその装置
JP3515216B2 (ja) 音声符号化装置
JP3515215B2 (ja) 音声符号化装置
JP3661363B2 (ja) 音声圧縮伸張方法および装置並びに音声圧縮伸張処理プログラムを記憶した記憶媒体
JP2947012B2 (ja) 音声符号化装置並びにその分析器及び合成器
JPS6162100A (ja) マルチパルス型符号化復号化装置
JP3754819B2 (ja) 音声通信方法及び音声通信装置
JPS5961891A (ja) 残差信号符号化方法
JP4461985B2 (ja) 音声波形伸張装置、波形伸張方法、音声波形縮小装置、波形縮小方法、プログラム、並びに音声処理装置
JPS60239800A (ja) 残差励振型ボコ−ダ
JP2658438B2 (ja) 音声符号化方法とその装置
JP3233543B2 (ja) インパルス駆動点抽出方法およびピッチ波形抽出方法とその装置
JP3576794B2 (ja) 音声符号化/復号化方法
JPS63127299A (ja) 音声信号符号化・復号化方式およびその装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20041207