[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2002023800A - マルチモード音声符号化装置及び復号化装置 - Google Patents

マルチモード音声符号化装置及び復号化装置

Info

Publication number
JP2002023800A
JP2002023800A JP26688398A JP26688398A JP2002023800A JP 2002023800 A JP2002023800 A JP 2002023800A JP 26688398 A JP26688398 A JP 26688398A JP 26688398 A JP26688398 A JP 26688398A JP 2002023800 A JP2002023800 A JP 2002023800A
Authority
JP
Japan
Prior art keywords
mode
decoding
speech
encoding
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP26688398A
Other languages
English (en)
Other versions
JP4308345B2 (ja
Inventor
Hiroyuki Ebara
宏幸 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP26688398A priority Critical patent/JP4308345B2/ja
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to AU54428/99A priority patent/AU748597B2/en
Priority to CA002306098A priority patent/CA2306098C/en
Priority to SG200107213A priority patent/SG101517A1/en
Priority to EP99940456.9A priority patent/EP1024477B1/en
Priority to PCT/JP1999/004468 priority patent/WO2000011646A1/ja
Priority to BRPI9906706-4A priority patent/BR9906706B1/pt
Priority to KR10-2000-7004235A priority patent/KR100367267B1/ko
Priority to CNB998013730A priority patent/CN1236420C/zh
Priority to US09/529,660 priority patent/US6334105B1/en
Publication of JP2002023800A publication Critical patent/JP2002023800A/ja
Application granted granted Critical
Publication of JP4308345B2 publication Critical patent/JP4308345B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

(57)【要約】 【課題】 声道情報と音源情報とに分離して音声信号
を符号化する低ビットレート音声符号化において背景雑
音等の非音声信号に対する品質を確保すること。 【解決手段】 量子化した声道パラメータの静的および
動的特徴を用いて音源情報をマルチモードで符号化し、
復号器側においてもマルチモードの後処理を行うことに
よって、無声音声区間および定常雑音区間の品質を改善
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を符号化
して伝送する移動通信システム等における低ビットレー
ト音声符号化装置、特に音声信号を声道情報と音源情報
とに分離して表現するようなCELP(Code Excited L
inear Prediction)型音声符号化装置等に関するもので
ある。
【0002】
【従来の技術】ディジタル移動通信や音声蓄積の分野に
おいては、電波や記憶媒体の有効利用のために音声情報
を圧縮し、高能率で符号化するための音声符号化装置が
用いられている。中でもCELP(Code Excited Linea
r Prediction:符号励振線形予測符号化)方式をベース
にした方式が中・低ビットレートにおいて広く実用化さ
れている。CELPの技術については、M.R.Schroeder
and B.S.Atal:"Code-Excited Linear Prediction (CEL
P):High-quality Speech at Very Low Bit Rates",Pr
oc.ICASSP-85, 25.1.1, pp.937-940, 1985" に示され
ている。
【0003】CELP型音声符号化方式は、音声をある
一定のフレーム長(5ms〜50ms程度)に区切り、
各フレーム毎に音声の線形予測を行い、フレーム毎の線
形予測による予測残差(励振信号)を既知の波形からな
る適応符号ベクトルと雑音符号ベクトルを用いて符号化
するものである。適応符号ベクトルは過去に生成した駆
動音源ベクトルを格納している適応符号帳から、雑音符
号ベクトルは予め用意された定められた数の定められた
形状を有するベクトルを格納している雑音符号帳から選
択されて使用される。雑音符号帳に格納される雑音符号
ベクトルには、ランダムな雑音系列のベクトルや何本か
のパルスを異なる位置に配置することによって生成され
るベクトルなどが用いられる。
【0004】図13に従来のCELP符号化装置の基本
ブロックの構成例を示す。このCELP符号化装置で
は、入力されたディジタル信号を用いてLPCの分析・
量子化とピッチ探索と雑音符号帳探索と利得符号帳探索
とが行われ、量子化LPC符号(L)とピッチ周期
(P)と雑音符号帳インデックス(S)と利得符号帳イ
ンデックス(G)とが復号器に伝送される。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来の音声符号化装置においては、1種類の雑音符号帳で
有声音声や無声音声さらには背景雑音等についても対応
しなければならず、これら全ての入力信号を高品質で符
号化することは困難であった。
【0006】本発明は、以上のような実情に鑑みてなさ
れたものであり、モード情報を新たに伝送することなし
に音源符号化のマルチモード化を図ることができ、特に
有声区間/無声区間の判定に加えて音声区間/非音声区
間の判定を行うことも可能で、マルチモード化による符
号化/復号化性能の改善度をより高めることを可能とし
たマルチモード音声符号化装置および音声復号化装置を
提供することを目的とする。
【0007】
【課題を解決するための手段】本発明は、スペクトル特
性を表す量子化パラメータの静的/動的特徴を用いたモ
ード判定を行い、音声区間/非音声区間、有声区間/無
声区間を示すモード判定結果に基づいて駆動音源の符号
化に用いる各種符号帳のモードを切替えるようにした。
また符号化の際に使用したモード情報を復号化時に用い
て復号化に用いる各種符号帳のモードを切替えるように
した。
【0008】
【発明の実施の形態】本発明の第1の態様は、音声信号
に含まれる声道情報を表す少なくとも1種類以上のパラ
メータを符号化する第1符号化手段と、前記音声信号に
含まれる音源情報を表す少なくとも1種類以上のパラメ
ータを幾つかのモードで符号化可能な第2符号化手段
と、前記第1符号化手段で符号化された特定パラメータ
の動的特徴に基づいて前記第2符号化手段のモード切替
を行うモード切替手段と、前記第1、第2符号化手段に
よって符号化された複数種類のパラメータ情報によって
入力音声信号を合成する合成手段と、を具備する構成を
採る。
【0009】この構成によれば、第1符号化手段の符号
化結果を用いて、第2符号化手段の符号化モードを決定
するため、モードを示すための新たな情報を付加するこ
となく第2符号化手段のマルチモード化ができ、符号化
性能を向上できる。
【0010】本発明の第2の態様は、第1の態様におい
て、モード切替手段が、音声のスペクトル特性を表す量
子化パラメータを用いて、駆動音源を符号化する第2符
号化手段のモード切替を行う構成を採る。
【0011】この構成によれば、スペクトル特性を表す
パラメータと駆動音源を表すパラメータとを独立的に符
号化する形態の音声符号化装置において、新たな伝送情
報を増やすことなく駆動音源の符号化をマルチモード化
ができ、符号化性能を向上できる。
【0012】本発明の第3の態様は、第2の態様におい
て、モード切替手段が、音声のスペクトル特性を表す量
子化パラメータの静的および動的特徴を用いて、駆動音
源を符号化する手段のモード切替を行う構成を採る。
【0013】この構成によれば、動的特徴を用いること
によって定常雑音部の検出ができるようになるので、駆
動音源符号化のマルチモード化によって定常雑音部に対
する符号化性能を改善できる。
【0014】本発明の第4の態様は、第2,3の態様に
おいて、モード切替手段が、量子化LSPパラメータを
用いて駆動音源を符号化する手段のモード切替を行う構
成を採る。
【0015】この構成によれば、スペクトル特性を表す
パラメータとしてLSPパラメータを用いているCEL
P方式に容易に適用できる。
【0016】本発明の第5の態様は、第4の態様におい
て、モード切替手段が、量子化LSPパラメータの静的
および動的特徴を用いて、駆動音源を符号化する手段の
モード切替を行う構成を採る。
【0017】この構成によれば、スペクトル特性を表す
パラメータとしてLSPパラメータを用いているCEL
P方式に簡単に適用でき、また、周波数領域のパラメー
タであるLSPパラメータを用いるためスペクトルの定
常性の判定が良好に行うことができ、定常雑音に対する
符号化性能を改善できる。
【0018】本発明の第6の態様は、第4,5の態様に
おいて、モード切替手段が、量子化LSPの定常性を過
去および現在の量子化LSPパラメータを用いて判定す
る手段と、現在の量子化LSPを用いて有声性を判定す
る手段と、を備え、判定結果に基づいて駆動音源を符号
化する手段のモード切替を行う構成を採る。
【0019】この構成によれば、駆動音源の符号化を定
常雑音部と無声音声部と有声音声部とで切替えて行うこ
とができるので、各部に対応した駆動音源の符号化モー
ドを準備することによって符号化性能を改善できる。
【0020】本発明の第7の態様は、音声信号に含まれ
る声道情報を表す少なくとも1種類以上のパラメータを
復号化する手段と、前記音声信号に含まれる音源情報を
表す少なくとも1種類以上のパラメータを復号化する第
2復号化手段と、前記第1復号化手段で復号化された特
定パラメータの動的特徴に基づいて前記第2復号化手段
のモード切替を行うモード切替手段と、前記第1、第2
復号化手段によって復号化された複数種類のパラメータ
情報によって音声信号を音声信号を復号する合成手段
と、を具備する構成をとる。
【0021】この構成によれば、第1の態様の音声符号
化装置で符号化された信号を復号できる。
【0022】本発明の第8の態様は、第7の態様におい
て、モード切替手段が、音声のスペクトル特性を表す量
子化パラメータを用いて、駆動音源を復号化する第2復
号化手段のモード切替を行う構成を採る。
【0023】この構成によれば、第2の態様の音声符号
化装置で符号化された信号を復号できる。
【0024】本発明の第9の態様は、第7の態様におい
て、モード切替手段が、音声のスペクトル特性を表す量
子化パラメータの静的および動的特徴を用いて、駆動音
源を復号化する手段のモード切替を行う構成をとる。
【0025】この構成によれば、第3の態様の音声符号
化装置で符号化された信号を復号できる。
【0026】本発明の第10の態様は、第7の態様にお
いて、モード切替手段が、量子化LSPパラメータを用
いて、駆動音源を復号化する手段のモード切替を行う構
成を採る。
【0027】この構成によれば、第4の態様の音声符号
化装置で符号化された信号を復号できる。
【0028】本発明の第11の態様は、第7の態様にお
いて、モード切替手段が、量子化LSPパラメータの静
的および動的特徴を用いて、駆動音源を復号化する手段
のモード切替を行う構成を採る。
【0029】この構成によれば、第5の態様の音声符号
化装置で符号化された信号を復号できる。
【0030】本発明の第12の態様は、第7の態様にお
いて、モード切替手段が、量子化LSPの定常性を過去
および現在の量子化LSPパラメータを用いて判定する
手段と、現在の量子化LSPを用いて有声性を判定する
手段とを備え、判定結果に基づいて駆動音源を復号化す
る手段のモード切替を行う構成を採る。
【0031】この構成によれば、第6の態様の音声符号
化装置で符号化された信号を復号できる。
【0032】本発明の第13の態様は、第7〜第12の
態様のいずれかにおいて、判定手段の判定結果に基づい
て復号信号に対する後処理の切替えを行う構成を採る。
【0033】この構成によれば、第1〜第6の態様のい
ずれかのマルチモード音声符号化装置で符号化された信
号を復号でき、さらに後処理によって定常的な背景雑音
環境下の音声信号に対する符号化性能を改善できる。
【0034】本発明の第14の態様は、量子化LSPパ
ラメータのフレーム間変化を算出する手段と、量子化L
SPパラメータが定常的であるフレームにおける平均的
量子化LSPパラメータを算出する手段と、前記平均的
量子化LSPパラメータと現在の量子化LSPパラメー
タとの距離を算出する手段と、を備える構成を採る。
【0035】この構成によれば、入力信号の音声区間検
出を精度良く行うための動的特徴を抽出することができ
る。
【0036】本発明の第15の態様は、量子化LSPパ
ラメータから線形予測残差パワを算出する手段と、隣接
する次数の量子化LSPパラメータの間隔を算出する手
段と、を備える構成を採る。
【0037】この構成によれば、入力信号のスペクトル
包絡の山谷の特徴を抽出することができ、音声区間であ
る可能性が高い区間を検出するための静的特徴を抽出す
ることができる。
【0038】本発明の第16の態様は、第14の態様の
動的特徴抽出器と、第15の態様の静的特徴抽出器とを
備え、前記動的特徴抽出器によって抽出された量子化L
SPパラメータの動的特徴と、前記静的特徴抽出器によ
って抽出された量子化LSPパラメータの静的特徴との
少なくとも一方を用いて音声区間の検出を行う構成を採
る。
【0039】この構成によれば、精度良く音声区間と定
常雑音区間との切り分けを行うことができる。
【0040】本発明の第17の態様は、第16の態様の
音声区間検出器と、有声無声判定手段とを備え、前記音
声区間検出器の検出結果と、前記有声無声判定手段の判
定結果との少なくとも一方の情報を用いてモード判定を
行う構成を採る。
【0041】この構成によれば、音声区間/雑音区間と
有声区間/無声区間との切り分け情報を用いたマルチモ
ード構成を実現することができる。
【0042】本発明の第18の態様は、前記有声無声判
定手段が、量子化LSPパラメータから反射係数を算出
する手段と、量子化LSPパラメータから線形予測残差
パワを算出する手段と、を備える量子化LSPパラメー
タの静的特徴抽出器によって抽出される情報を利用する
構成を採る。
【0043】この構成によれば、有声/無声の判定を精
度よく行うことができる。
【0044】本発明の第19の態様は、第1の態様にお
いて、前記モード選択器によりモード切替手段を構成す
る。
【0045】この構成によれば、入力音声の特徴に応じ
て音源符号化をマルチモードで行うことができる。
【0046】本発明の第20の態様は、第7の態様にお
いて、前記モード選択器によりモード切替手段を構成す
る。
【0047】この構成によれば、第19の態様の符号化
装置を用いて符号化された音声信号を復号できる。
【0048】本発明の第21の態様は、復号LSPパラ
メータを用いて音声区間か否かの判定を行う判定手段
と、信号のFFT処理を行うFFT処理手段と、前記F
FT処理によって得られた位相スペクトルを前記判定手
段の判定結果に応じてランダム化する位相スペクトルラ
ンダム化手段と、前記FFT処理によって得られた振幅ス
ペクトルを前記判定結果に応じて平滑化する振幅スペク
トル平滑化手段と、前記位相スペクトルランダム化手段
によってランダム化された位相スペクトルと前記振幅ス
ペクトル平滑化手段によって平滑化された位相スペクト
ルとの逆FFT処理を行うIFFT処理手段と、を備え
る構成を採る。
【0049】この構成によれば、マルチモードで後処理
を行うことができ、特に定常雑音区間の主観品質を改善
できる。
【0050】本発明の第22の態様は、第21の態様に
おいて、音声区間においては過去の非音声区間における
平均的振幅スペクトルを用いてランダム化する位相スペ
クトルの周波数を決定し、非音声区間においては聴覚重
みづけ領域における全周波数の振幅スペクトルの平均値
を用いてランダム化する位相スペクトルと平滑化する振
幅スペクトルの周波数を決定する構成を採る。
【0051】この構成によれば、音声区間と雑音区間の
後処理を適応的に行うことができる。
【0052】本発明の第23の態様は、第21の態様に
おいて、音声区間においては過去の非音声区間における
平均的振幅スペクトルを用いて生成した雑音を重畳する
構成を採るこの構成によれば、定常的な背景雑音のある
復号音声信号の聴感的品質を改善できる。
【0053】本発明の第24の態様は、第21の態様に
おいて、前記音声区間か否かの判定を第16の態様にお
ける音声区間検出手段と、過去の非音声区間における平
均的振幅スペクトルと現在の振幅スペクトルとの差の大
きさと、を用いて行う構成を採る。
【0054】この構成によれば、復号信号のパワが急に
大きくなるような場合を検出できるので、第16の態様
における音声区間検出手段による検出誤りが生じた場合
に対応することができる。
【0055】本発明の第25の態様は、第13の態様に
おいて、後処理を第21の態様におけるマルチモード後
処理器を用いて行う構成を採る。
【0056】この構成によれば、マルチモードで後処理
を行うことによって特に定常雑音区間の主観品質を改善
できる音声復号化装置を実現できる。
【0057】本発明の第26の態様は、第1の態様の音
声符号化装置と、第7の態様の音声復号化装置と、を備
える構成を採る。
【0058】この構成によれば、第1の態様の音声符号
化装置と第7の態様の音声復号化装置とを備え音声符号
化復号化装置を実現できる。
【0059】本発明の第27の態様は、音声信号を電気
的信号に変換する音声入力装置と、この音声入力装置か
ら出力される信号をディジタル信号に変換するA/D変
換器と、このA/D変換器から出力されるディジタル信
号の符号化を行う第1〜第6の態様のいずれかの音声符
号化装置と、この音声符号化装置から出力される符号化
情報に対して変調処理等を行うRF変調器と、このRF
変調器から出力された信号を電波に変換して送信する送
信アンテナと、を具備する構成を採る。
【0060】この構成によれば、第1〜第6の態様のい
ずれかの音声符号化装置を備えた音声信号送信装置を実
現でき、品質の高い低ビットレート音声符号化が可能と
なる。
【0061】本発明の第28の態様は、受信電波を受信
する受信アンテナと、この受信アンテナで受信した信号
の復調処理を行うRF復調器と、このRF復調器によっ
て得られた情報の復号化を行う第7〜第13の態様のい
ずれかの音声復号化装置と、この音声復号化装置によっ
て復号されたディジタル音声信号をD/A変換するD/
A変換器と、このD/A変換器によって出力される電気
的信号を音声信号に変換する音声出力装置と、を具備す
る構成をとる。
【0062】この構成によれば、第7〜第13の態様の
いずれかの音声復号化装置を備えた音声信号受信装置を
実現でき、第27の態様の音声信号送信装置から送信さ
れた信号を受信し復号化できる。
【0063】本発明の第29の態様は、第27の態様の
音声信号送信装置および第28の態様の音声信号受信装
置の少なくとも一方を備える構成を採る。
【0064】この構成によれば、第27の態様の音声信
号送信装置および/または第28の態様の音声信号受信
装置を備えた移動局装置を実現でき、高音質の移動局装
置を実現できる。
【0065】本発明の第30の態様は、第27の態様の
音声信号送信装置および第28の態様の音声信号受信装
置の少なくとも一方を備える構成を採る。
【0066】この構成によれば、第27の態様の音声信
号送信装置および/または第28の態様の音声信号受信
装置を備えた基地局装置を実現でき、高音質の基地局装
置を実現できる。
【0067】本発明の第31の態様は、コンピュータ
に、量子化LSPの定常性を過去および現在の量子化L
SPパラメータを用いて判定する手順と、現在の量子化
LSPを用いて有声性を判定する手順と、前記手順によ
って判定された結果に基づいて駆動音源を符号化する手
順のモード切替を行う手順と、を実行させるためのプロ
グラムを記録した機械読み取り可能な記録媒体である。
【0068】この記録媒体によれば、記録されたプログ
ラムをコンピュータにインストールすることにより第6
の態様の音声符号化装置と同等の機能を持たせることが
できる。
【0069】本発明の第32の態様は、コンピュータ
に、量子化LSPの定常性を過去および現在の量子化L
SPパラメータを用いて判定する手順と、現在の量子化
LSPを用いて有声性を判定する手順と、前記手順によ
って判定された結果に基づいて駆動音源を復号化する手
順のモード切替を行う手順と、前記手順によって判定さ
れた結果に基づいて復号信号に対する後処理手順の切替
えを行う手順と、を実行させるためのプログラムを記録
した機械読み取り可能な記録媒体である。
【0070】この記録媒体によれば、記録されたプログ
ラムをコンピュータにインストールすることにより第1
3の態様の音声復号化装置と同等の機能を持たせること
ができる。
【0071】本発明の第33の態様は、音声のスペクト
ル特性を表す量子化パラメータの静的および動的特徴を
用いて駆動音源を符号化するモードのモード切替を行う
構成を採る。
【0072】この構成によれば、動的特徴を用いること
によって定常雑音部の検出ができるようになるので、駆
動音源符号化のマルチモード化によって定常雑音部に対
する符号化性能を改善できる。
【0073】本発明の第34の態様は、音声のスペクト
ル特性を表す量子化パラメータの静的および動的特徴を
用いて駆動音源を復号化するモードのモード切替を行う
構成を採る。
【0074】この構成によれば、第33の態様の音声符
号化方法によって符号化した信号を復号可能な復号化方
法を提供できる。
【0075】本発明の第35の態様は、第34の態様の
音声復号化方法において、復号信号に対する後処理を行
う工程と、モード情報に基づいて前記後処理工程の切替
えを行う工程と、を具備する構成を採る。
【0076】この構成によれば、第34の態様の音声復
号化方法を用いて復号化した信号の定常雑音品質をさら
に改善できる音声復号化方法を提供できる。
【0077】本発明の第36の態様は、量子化LSPパ
ラメータのフレーム間変化を算出する工程と、量子化L
SPパラメータが定常的であるフレームにおける平均的
量子化LSPパラメータを算出する工程と、前記平均的
量子化LSPパラメータと現在の量子化LSPパラメー
タとの距離を算出する工程と、を具備する構成を採る。
【0078】この構成によれば、入力信号の音声区間検
出を精度良く行うための動的特徴を抽出することができ
る。
【0079】本発明の第37の態様は、量子化LSPパ
ラメータから線形予測残差パワを算出する工程と、隣接
する次数の量子化LSPパラメータの間隔を算出する工
程と、を具備する構成を採る。
【0080】この構成によれば、入力信号のスペクトル
包絡の山谷の特徴を抽出することができ、音声区間であ
る可能性が高い区間を検出するための静的特徴を抽出す
ることができる。
【0081】本発明の第38の態様は、第36の態様に
おける動的特徴抽出工程と、第37の態様における静的
特徴抽出工程と、を具備し、前記動的特徴抽出工程にお
いて抽出された量子化LSPパラメータの動的特徴と、
前記静的特徴抽出工程において抽出された量子化LSP
パラメータの静的特徴と、の少なくとも一方を用いて音
声区間の検出を行う構成を採る。
【0082】この構成によれば、精度良く音声区間と定
常雑音区間との切り分けを行うことができる。
【0083】本発明の第39の態様は、第38の態様に
おける音声区間検出方法によって得られる音声検出結果
を用いてモード判定を行う構成を採る。
【0084】この構成によれば、音声区間/雑音区間と
有声区間/無声区間との切り分け情報を用いたマルチモ
ード構成を実現することができる。
【0085】本発明の第40の態様は、復号LSPパラ
メータを用いて音声区間か否かの判定を行う判定工程
と、信号のFFT処理を行うFFT処理工程と、前記F
FT処理によって得られた位相スペクトルを前記判定工
程における判定結果に応じてランダム化する位相スペク
トルランダム化工程と、前記FFT処理によって得られた
振幅スペクトルを前記判定結果に応じて平滑化する振幅
スペクトル平滑化工程と、前記位相スペクトルランダム
化工程においてランダム化された位相スペクトルと前記
振幅スペクトル平滑化工程において平滑化された位相ス
ペクトルとの逆FFT処理を行うIFFT処理工程と、
を具備する構成を採る。
【0086】この構成によれば、マルチモードで後処理
を行うことができ、特に定常雑音区間の主観品質を改善
できる。
【0087】以下、本発明の実施の形態における音声符
号化装置等について、図1から図9を用いて説明する。
【0088】(実施の形態1)図1に本発明の実施の形
態1にかかる音声符号化装置の構成を示す。
【0089】ディジタル化された音声信号等からなる入
力データが前処理器101に入力される。前処理器10
1は、ハイパスフィルタやバンドパスフィルタ等を用い
て直流成分のカットや入力データの帯域制限等を行って
LPC分析器102と加算器105とに出力する。な
お、この前処理器101において何も処理を行わなくて
も後続する符号化処理は可能であるが、前述したような
処理を行った方が符号化性能は向上する。
【0090】LPC分析器102は、線形予測分析を行
って線形予測係数(LPC)を算出してLPC量子化器
103へ出力する。
【0091】LPC量子化器103は、入力したLPC
を量子化し、量子化後のLPCを合成フィルタ104と
モード選択器105に、また、量子化LPCを表現する
符号Lを復号器に夫々出力する。なお、LPCの量子化
は補間特性の良いLSP(Line Spectrum Pair:線スペ
クトル対)に変換して行うのが一般的である。
【0092】合成フィルタ104は、入力した量子化L
PCを用いてLPC合成フィルタを構築する。この合成
フィルタに対して加算器114から出力される駆動音源
信号を入力としてフィルタ処理を行って合成信号を加算
器106に出力する。
【0093】モード選択器105は、LPC量子化器1
03から入力した量子化LPCを用いて雑音符号帳10
9のモードを決定する。
【0094】ここで、モード選択器105は、過去に入
力した量子化LPCの情報も蓄積しており、フレーム間
における量子化LPCの変動の特徴と現フレームにおけ
る量子化LPCの特徴の双方を用いてモードの選択を行
う。このモードは少なくとも2種類以上あり、例えば有
声音声部に対応するモードと無声音声部および定常雑音
部等に対応するモードから成る。また、モードの選択に
用いる情報は量子化LPCそのものである必要はなく、
量子化LSPや反射係数や線形予測残差パワなどのパラ
メータに変換したものを用いた方が効果的である。
【0095】加算器106は、前処理器101から入力
される前処理後の入力データと合成信号との誤差を算出
し、聴覚重みづけフィルタ107へ出力する。
【0096】聴覚重み付けフィルタ107は、加算器1
06において算出された誤差に対して聴覚的な重み付け
を行って誤差最小化器108へ出力する。
【0097】誤差最小化器108は、雑音符号帳インデ
ックスSiと適応符号帳インデックス(ピッチ周期)P
iとゲイン符号帳インデックスGiとを調整しながら夫
々雑音符号帳109と適応符号帳110とゲイン符号帳
111とに出力し、聴覚重み付けフィルタ107から入
力される聴覚的重み付けされた誤差が最小となるように
雑音符号帳109と適応符号帳110とゲイン符号帳1
11とが生成する雑音符号ベクトルと適応符号ベクトル
と雑音符号帳利得および適応符号帳利得とを夫々決定
し、雑音符号ベクトルを表現する符号Sと適応符号ベク
トルを表現するPとゲイン情報を表現する符号Gを夫々
復号器に出力する。
【0098】雑音符号帳109は、予め定められた個数
の形状の異なる雑音符号ベクトルが格納されており、誤
差最小化器108から入力される雑音符号ベクトルのイ
ンデックスSiによって指定される雑音符号ベクトルを
出力する。また、この雑音符号帳109は少なくとも2
種類以上のモードを有しており、例えば有声音声部に対
応するモードではよりパルス的な雑音符号ベクトルを生
成し、無声音声部や定常雑音部等に対応するモードでは
より雑音的な雑音符号ベクトルを生成するような構造と
なっている。雑音符号帳109から出力される雑音符号
ベクトルは前記2種類以上のモードのうちモード選択器
105で選択された1つのモードから生成され、乗算器
112で雑音符号帳利得Gsが乗じられた後に加算器1
14に出力される。
【0099】適応符号帳110は、過去に生成した駆動
音源信号を逐次更新しながらバッファリングしており、
誤差最小化器108から入力される適応符号帳インデッ
クス(ピッチ周期(ピッチラグ))Piを用いて適応符
号ベクトルを生成する。適応符号帳110にて生成され
た適応符号ベクトルは乗算器113で適応符号帳利得G
aが乗じられた後に加算器114に出力される。
【0100】ゲイン符号帳111は、適応符号帳利得G
aと雑音符号帳利得Gsのセット(ゲインベクトル)を
予め定められた個数だけ格納しており、誤差最小化器1
08から入力されるゲイン符号帳インデックスGiによ
って指定されるゲインベクトルの適応符号帳利得成分G
aを乗算器113に、雑音符号帳利得成分Gsを乗算器
112に夫々出力する。なお、ゲイン符号帳は多段構成
とすればゲイン符号帳に要するメモリ量やゲイン符号帳
探索に要する演算量の削減が可能である。また、ゲイン
符号帳に割り当てられるビット数が十分であれば、適応
符号帳利得と雑音符号帳利得とを独立してスカラ量子化
することもできる。
【0101】加算器114は、乗算器112および11
3から入力される雑音符号ベクトルと適応符号ベクトル
の加算を行って駆動音源信号を生成し、合成フィルタ1
04および適応符号帳110に出力する。
【0102】なお、本実施の形態においては、マルチモ
ード化されているのは雑音符号帳109のみであるが、
適応符号帳110およびゲイン符号帳111をマルチモ
ード化することによってさらに品質改善を行うことも可
能である。
【0103】次に図3を参照して上記実施の形態におけ
る音声符号化方法の処理の流れを示す。本説明において
は、音声符号化処理を予め定められた時間長の処理単位
(フレーム:時間長にして数十ミリ秒程度)毎に処理を
行い、1フレームをさら整数個の短い処理単位(サブフ
レーム)毎に処理を行う例を示す。
【0104】ステップ301において、適応符号帳の内
容、合成フィルタメモリ、入力バッファ等の全てのメモ
リをクリアする。
【0105】次に、ステップ302においてディジタル
化された音声信号等の入力データを1フレーム分入力
し、ハイパスフィルタまたはバンドパスフィルタ等をか
けることによって入力データのオフセット除去や帯域制
限を行う。前処理後の入力データは入力バッファにバッ
ファリングされ、以降の符号化処理に用いられる。
【0106】次に、ステップ303において、LPC分
析(線形予測分析)が行われ、LPC係数(線形予測係
数)が算出される。
【0107】次に、ステップ304において、ステップ
303にて算出されたLPC係数の量子化が行われる。
LPC係数の量子化方法は種々提案されているが、補間
特性の良いLSPパラメータに変換して多段ベクトル量
子化やフレーム間相関を利用した予測量子化を適用する
と効率的に量子化できる。また、例えば1フレームが2
つのサブフレームに分割されて処理される場合には、第
2サブフレームのLPC係数を量子化して、第1サブフ
レームのLPC係数は直前フレームにおける第2サブフ
レームの量子化LPC係数と現フレームにおける第2サ
ブフレームの量子化LPC係数とを用いて補間処理によ
って決定する。
【0108】次に、ステップ305において、前処理後
の入力データに聴覚重みづけを行う聴覚重みづけフィル
タを構築する。
【0109】次に、ステップ306において、駆動音源
信号から聴覚重み付け領域の合成信号を生成する聴覚重
み付け合成フィルタを構築する。このフィルタは、合成
フィルタと聴覚重み付けフィルタとを従属接続したフィ
ルタであり、合成フィルタはステップ304にて量子化
された量子化LPC係数を用いて構築され、聴覚重み付
けフィルタはステップ303において算出されたLPC
係数を用いて構築される。
【0110】次に、ステップ307において、モードの
選択が行われる。モードの選択はステップ304におい
て量子化された量子化LPC係数の動的および静的特徴
を用いて行われる。具体的には、量子化LSPの変動や
量子化LPC係数から算出される反射係数や予測残差パ
ワ等を用いる。本ステップにおいて選択されたモードに
従って雑音符号帳の探索が行われる。本ステップにおい
て選択されるモードは少なくとも2種類以上あり、例え
ば有声音声モードと無声音声および定常雑音モードの2
モード構成等が考えられる。
【0111】次に、ステップ308において、適応符号
帳の探索が行われる。適応符号帳の探索は、前処理後の
入力データに聴覚重みづけを行った波形に最も近くなる
ような聴覚重みづけ合成波形が生成される適応符号ベク
トルを探索することであり、前処理後の入力データをス
テップ305で構築された聴覚重み付けフィルタでフィ
ルタリングした信号と適応符号帳から切り出した適応符
号ベクトルを駆動音源信号としてステップ306で構築
された聴覚重み付け合成フィルタでフィルタリングした
信号との誤差が最小となるように、適応符号ベクトルを
切り出す位置を決定する。次に、ステップ309におい
て、雑音符号帳の探索が行われる。雑音符号帳の探索
は、前処理後の入力データに聴覚重みづけを行った波形
に最も近くなるような聴覚重みづけ合成波形が生成され
る駆動音源信号を生成する雑音符号ベクトルを選択する
ことであり、駆動音源信号が適応符号ベクトルと雑音符
号ベクトルとを加算して生成されることを考慮した探索
が行われる。したがって、既にステップ308にて決定
された適応符号ベクトルと雑音符号帳に格納されている
雑音符号ベクトルとを加算して駆動音源信号を生成し、
生成された駆動音源信号をステップ306で構築された
聴覚重みづけ合成フィルタでフィルタリングした信号と
前処理後の入力データをステップ305で構築された聴
覚重みづけフィルタでフィルタリングした信号との誤差
が最小となるように、雑音符号帳の中から雑音符号ベク
トルを選択する。なお、雑音符号ベクトルに対してピッ
チ周期化等の処理を行う場合は、その処理も考慮した探
索が行われる。また、この雑音符号帳は少なくとも2種
類以上のモードを有しており、例えば有声音声部に対応
するモードではよりパルス的な雑音符号ベクトルを格納
している雑音符号帳を用いて探索が行われ、無声音声部
や定常雑音部等に対応するモードではより雑音的な雑音
符号ベクトルを格納している雑音符号帳を用いて探索が
行われる。探索時にどのモードの雑音符号帳を用いるか
は、ステップ307にて選択される。
【0112】次に、ステップ310において、ゲイン符
号帳の探索が行われる。ゲイン符号帳の探索は、既にス
テップ308にて決定された適応符号ベクトルとステッ
プ309にて決定された雑音符号ベクトルのそれぞれに
対して乗じる適応符号帳利得と雑音符号帳利得の組をゲ
イン符号帳の中から選択することであり、適応符号帳利
得乗算後の適応符号ベクトルと雑音符号利得乗算後の雑
音符号ベクトルとを加算して駆動音源信号を生成し、生
成した駆動音源信号をステップ306にて構築された聴
覚重みづけ合成フィルタでフィルタリングした信号と前
処理後の入力データをステップ305で構築された聴覚
重みづけフィルタでフィルタリングした信号との誤差が
最小となるような適応符号帳利得と雑音符号帳利得の組
をゲイン符号帳の中から選択する。
【0113】次に、ステップ311において、駆動音源
信号が生成される。駆動音源信号は、ステップ308に
て選択された適応符号ベクトルにステップ310にて選
択された適応符号帳利得を乗じたベクトルと、ステップ
309にて選択された雑音符号ベクトルにステップ31
0において選択された雑音符号帳利得を乗じたベクトル
と、を加算して生成される。
【0114】次に、ステップ312において、サブフレ
ーム処理のループで用いられるメモリの更新が行われ
る。具体的には、適応符号帳の更新や聴覚重みづけフィ
ルタおよび聴覚重みづけ合成フィルタの状態更新等が行
われる。
【0115】上記ステップ305〜312はサブフレー
ム単位の処理である。
【0116】次に、ステップ313において、フレーム
処理のループで用いられるメモリの更新が行われる。具
体的には、前処理器で用いられるフィルタの状態更新や
量子化LPC係数バッファの更新や入力データバッファ
の更新等が行われる。
【0117】次に、ステップ314において、符号化デ
ータの出力が行われる。符号化データは伝送される形態
に応じてビットストリーム化や多重化処理等が行われて
伝送路に送出される。
【0118】上記ステップ302〜304および313
〜314がフレーム単位の処理である。また、フレーム
単位およびサブフレーム単位の処理は入力データがなく
なるまで繰り返し行われる。
【0119】(実施の形態2)図2に本発明の実施の形
態2にかかる音声復号化装置の構成を示す。
【0120】符号器から伝送された、量子化LPCを表
現する符号Lと雑音符号ベクトルを表現する符号Sと適
応符号ベクトルを表現する符号Pとゲイン情報を表現す
る符号Gとが、それぞれLPC復号器201と雑音符号
帳203と適応符号帳204とゲイン符号帳205とに
入力される。
【0121】LPC復号器201は、符号Lから量子化
LPCを復号し、モード選択器202と合成フィルタ2
09に夫々出力する。
【0122】モード選択器202は、LPC復号器20
1から入力した量子化LPCを用いて雑音符号帳203
および後処理器211のモードを決定し、モード情報M
を雑音符号帳203および後処理器211とに夫々出力
する。なお、モード選択器202は過去に入力した量子
化LPCの情報も蓄積しており、フレーム間における量
子化LPCの変動の特徴と現フレームにおける量子化L
PCの特徴の双方を用いてモードの選択を行う。このモ
ードは少なくとも2種類以上あり、例えば有声音声部に
対応するモードと無声音声部に対応するモードと定常雑
音部等に対応するモードから成る。また、モードの選択
に用いる情報は量子化LPCそのものである必要はな
く、量子化LSPや反射係数や線形予測残差パワなどの
パラメータに変換したものを用いた方が効果的である。
【0123】雑音符号帳203は、予め定められた個数
の形状の異なる雑音符号ベクトルが格納されており、入
力した符号Sを復号して得られる雑音符号帳インデック
スによって指定される雑音符号ベクトルを出力する。ま
た、この雑音符号帳203は少なくとも2種類以上のモ
ードを有しており、例えば有声音声部に対応するモード
ではよりパルス的な雑音符号ベクトルを生成し、無声音
声部や定常雑音部等に対応するモードではより雑音的な
雑音符号ベクトルを生成するような構造となっている。
雑音符号帳203から出力される雑音符号ベクトルは前
記2種類以上のモードのうちモード選択器202で選択
された1つのモードから生成され、乗算器206で雑音
符号帳利得Gsが乗じられた後に加算器208に出力さ
れる。
【0124】適応符号帳204は、過去に生成した駆動
音源信号を逐次更新しながらバッファリングしており、
入力した符号Pを復号して得られる適応符号帳インデッ
クス(ピッチ周期(ピッチラグ))を用いて適応符号ベ
クトルを生成する。適応符号帳204にて生成された適
応符号ベクトルは乗算器207で適応符号帳利得Gaが
乗じられた後に加算器208に出力される。
【0125】ゲイン符号帳205は、適応符号帳利得G
aと雑音符号帳利得Gsのセット(ゲインベクトル)を
予め定められた個数だけ格納しており、入力した符号G
を復号して得られるゲイン符号帳インデックスによって
指定されるゲインベクトルの適応符号帳利得成分Gaを
乗算器207に、雑音符号帳利得成分Gsを乗算器20
6に夫々出力する。
【0126】加算器208は、乗算器206および20
7から入力される雑音符号ベクトルと適応符号ベクトル
の加算を行って駆動音源信号を生成し、合成フィルタ2
09および適応符号帳204に出力する。
【0127】合成フィルタ209は、入力した量子化L
PCを用いてLPC合成フィルタを構築する。この合成
フィルタに対して加算器208から出力される駆動音源
信号を入力としてフィルタ処理を行って合成信号をポス
トフィルタ210に出力する。
【0128】ポストフィルタ210は、合成フィルタ2
09から入力した合成信号に対して、ピッチ強調、ホル
マント強調、スペクトル傾斜補正、利得調整等の音声信
号の主観的品質を改善させるための処理を行い、後処理
器211に出力する。
【0129】後処理器211は、ポストフィルタ210
から入力した信号に対して、振幅スペクトルのフレーム
間平滑化処理、位相スペクトルのランダマイズ処理等の
定常雑音部の主観品質の改善させるための処理を、モー
ド選択器202から入力されるモード情報Mを利用して
適応的に行う。例えば有声音声部や無声音声部に対応す
るモードでは前記平滑化処理やランダマイズ処理はほと
んど行わず、定常雑音部等に対応するモードでは前記平
滑化処理やランダマイズ処理を適応的に行う。後処理後
の信号はディジタル化された復号音声信号等の出力デー
タとして出力される。
【0130】なお、本実施の形態においては、モード選
択器202から出力されるモード情報Mは、雑音符号帳
203のモード切替と後処理器211のモード切替の双
方で用いられる構成としたが、どちらか一方のみのモー
ド切替に用いても効果が得られる。この場合、どちらか
一方のみがマルチモード処理となる。
【0131】次に図4を参照して上記実施の形態におけ
る音声復号化方法の処理の流れを示す。本説明において
は、音声符号化処理を予め定められた時間長の処理単位
(フレーム:時間長にして数十ミリ秒程度)毎に処理を
行い、1フレームをさら整数個の短い処理単位(サブフ
レーム)毎に処理を行う例を示す。
【0132】ステップ401において、適応符号帳の内
容、合成フィルタメモリ、出力バッファ等の全てのメモ
リをクリアする。
【0133】次に、ステップ402において、符号化デ
ータが復号される。具体的には、多重化されている受信
信号の分離化やビットストリーム化されている受信信号
を量子化LPC係数と適応符号ベクトルと雑音符号ベク
トルとゲイン情報とを夫々表現する符号に夫々変換す
る。
【0134】次に、ステップ403において、LPC係
数を復号する。LPC係数は、ステップ402にて得ら
れた量子化LPC係数を表現する符号から、実施の形態
1に示したLPC係数の量子化方法の逆の手順によって
復号される。
【0135】次に、ステップ404において、ステップ
403にて復号されたLPC係数を用いて合成フィルタ
が構築される。
【0136】次に、ステップ405において、ステップ
403にて復号されたLPC係数の静的および動的特徴
を用いて、雑音符号帳および後処理のモード選択が行わ
れる。具体的には、量子化LSPの変動や量子化LPC
係数から算出される反射係数や予測残差パワ等を用い
る。本ステップにおいて選択されたモードに従って雑音
符号帳の復号および後処理が行われる。このモードは少
なくとも2種類以上あり、例えば有声音声部に対応する
モードと無声音声部に対応するモードと定常雑音部等に
対応するモードとから成る。
【0137】次に、ステップ406において、適応符号
ベクトルが復号される。適応符号ベクトルは、適応符号
ベクトルを表現する符号から適応符号ベクトルを適応符
号帳から切り出す位置を復号してその位置から適応符号
ベクトルを切り出すことによって、復号される。
【0138】次に、ステップ407において、雑音符号
ベクトルが復号される。雑音符号ベクトルは、雑音符号
ベクトルを表現する符号から雑音符号帳インデックスを
復号してそのインデックスに対応する雑音符号ベクトル
を雑音符号帳から取り出すことによって、復号される。
雑音符号ベクトルのピッチ周期化等を適用する際は、さ
らにピッチ周期化等を行った後のものが復号雑音符号ベ
クトルとなる。また、この雑音符号帳は少なくとも2種
類以上のモードを有しており、例えば有声音声部に対応
するモードではよりパルス的な雑音符号ベクトルを生成
し、無声音声部や定常雑音部等に対応するモードではよ
り雑音的な雑音符号ベクトルを生成するようになってい
る。
【0139】次に、ステップ408において、適応符号
帳利得と雑音符号帳利得が復号される。ゲイン情報を表
す符号からゲイン符号帳インデックスを復号してこのイ
ンデックスで示される適応符号帳利得と雑音符号帳利得
の組をゲイン符号帳の中から取り出すことによって、ゲ
イン情報が復号される。
【0140】次に、ステップ409において、駆動音源
信号が生成される。駆動音源信号は、ステップ406に
て選択された適応符号ベクトルにステップ408にて選
択された適応符号帳利得を乗じたベクトルと、ステップ
407にて選択された雑音符号ベクトルにステップ40
8において選択された雑音符号帳利得を乗じたベクトル
と、を加算して生成される。
【0141】次に、ステップ410において、復号信号
が合成される。ステップ409にて生成された駆動音源
信号を、ステップ404にて構築された合成フィルタで
フィルタリングすることによって、復号信号が合成され
る。
【0142】次に、ステップ411において、復号信号
に対してポストフィルタ処理が行われる。ポストフィル
タ処理は、ピッチ強調処理やホルマント強調処理やスペ
クトル傾斜補正処理や利得調整処理等の復号信号特に復
号音声信号の主観的品質を改善するための処理から成っ
ている。
【0143】次に、ステップ412において、ポストフ
ィルタ処理後の復号信号に対して最終的な後処理が行わ
れる。この後処理は、主に振幅スペクトルの(サブ)フ
レーム間平滑化処理や位相スペクトルのランダマイズ処
理等の復号信号における定常雑音部分の主観的品質を改
善するための処理から成っており、ステップ405にて
選択されたモードに対応した処理を行う。例えば有声音
声部や無声音声部に対応するモードでは前記平滑化処理
やランダマイズ処理はほとんど行われず、定常雑音部等
に対応するモードでは前記平滑化処理やランダマイズ処
理が適応的に行われるようになっている。本ステップで
生成される信号が出力データとなる。
【0144】次に、ステップ413において、サブフレ
ーム処理のループで用いられるメモリの更新が行われ
る。具体的には、適応符号帳の更新やポストフィルタ処
理に含まれる各フィルタの状態更新等が行われる。
【0145】上記ステップ404〜413はサブフレー
ム単位の処理である。
【0146】次に、ステップ414において、フレーム
処理のループで用いられるメモリの更新が行われる。具
体的には、量子化(復号)LPC係数バッファの更新や
出力データバッファの更新等が行われる。
【0147】上記ステップ402〜403および414
はフレーム単位の処理である。また、フレーム単位の処
理は符号化データがなくなるまで繰り返し行われる。
【0148】(実施の形態3)図5は実施の形態1の音
声符号化装置または実施の形態2の音声復号化装置を備
えた音声信号送信機および受信機を示したブロック図で
ある。図5(a)は送信機、図5(b)は受信機を示
す。
【0149】図5(a)の音声信号送信機では、音声が
音声入力装置501によって電気的アナログ信号に変換
され、A/D変換器502に出力される。アナログ音声
信号はA/D変換器502によってディジタル音声信号
に変換され、音声符号化器503に出力される。音声符
号化器503は音声符号化処理を行い、符号化した情報
をRF変調器504に出力する。RF変調器は符号化さ
れた音声信号の情報を変調・増幅・符号拡散等の電波と
して送出するための操作を行い、送信アンテナ505に
出力する。最後に送信アンテナ505から電波(RF信
号)506が送出される。
【0150】一方、図5(b)の受信機においては、電
波(RF信号)506を受信アンテナ507で受信し、
受信信号はRF復調器508に送られる。RF復調器5
08は符号逆拡散・復調等電波信号を符号化情報に変換
するための処理を行い、符号化情報を音声復号化器50
9に出力する。音声復号化器509は、符号化情報の復
号処理を行ってディジタル復号音声信号をD/A変換器
510へ出力する。D/A変換器510は音声復号化器
509から出力されたディジタル復号音声信号をアナロ
グ復号音声信号に変換して音声出力装置511に出力す
る。最後に音声出力装置511が電気的アナログ復号音
声信号を復号音声に変換して出力する。
【0151】上記送信装置および受信装置は携帯電話等
の移動通信機器の移動機または基地局装置として利用す
ることが可能である。なお、情報を伝送する媒体は本実
施の形態に示したような電波に限らず、光信号などを利
用することも可能であり、さらには有線の伝送路を使用
することも可能である。
【0152】なお、上記実施の形態1に示した音声符号
化装置および上記実施の形態2に示した音声復号化装置
および上記実施の形態3に示した送信装置および送受信
装置は、磁気ディスク、光磁気ディスク、ROMカート
リッジ等の記録媒体にソフトウェアとして記録して実現
することも可能であり、その記録媒体を使用することに
より、このような記録媒体を使用するパーソナルコンピ
ュータ等により音声符号化装置/復号化装置および送信
装置/受信装置を実現するとができる。 (実施の形態4)実施の形態4は、上述した実施の形態
1、2におけるモード選択器105、202の構成例を
示した例である。
【0153】図6に実施の形態4にかかるモード選択器
の構成を示す。
【0154】本実施の形態にかかるモード選択器は、量
子化LSPパラメータの動的特徴を抽出する動的特徴抽
出部601と、量子化LSPパラメータの静的特徴を抽
出する第1、第2の静的特徴抽出部602、603とを
備える。
【0155】動的特徴抽出部601は、AR型平滑化手
段604に量子化LSPパラメータを入力して平滑化処
理を行う。AR型平滑化手段604では、処理単位時間
毎に入力される各次の量子化LSPパラメータを時系列
データとして(1)式に示す平滑化処理を行う。
【0156】 Ls[i]=(1-α)×Ls[i]+α×L[i], i=1,2,…,M、 0<α<1 …(1) Ls[i]:i次の平滑化量子化LSPパラメータ L[i]:i次の量子化LSPパラメータ α:平滑化係数 M:LSP分析次数 なお、(1)式において、αの値は0.7程度に設定し、
それほど強い平滑化にならないようにする。上記(1)
式で求めた平滑化した量子化LSPパラメータは遅延手
段605を経由して加算器606へ入力されるものと直
接加算器606へ入力されるものとに分岐される。
【0157】遅延手段605は、入力した平滑化した量
子化LSPパラメータを1処理単位時間だけ遅延させて
加算器606に出力する。
【0158】加算器606は、現在の処理単位時間にお
ける平滑化された量子化LSPパラメータと1つ前の処
理単位時間における平滑化された量子化LSPパラメー
タとが入力される。この加算器606において、現在の
処理単位時間における平滑化量子化LSPパラメータと
1つ前の処理単位時間における平滑化量子化LSPパラ
メータとの差を算出する。この差はLSPパラメータの
各次数毎に算出される。加算器606による算出結果は
2乗和算出手段607に出力する。
【0159】2乗和算出手段607は、現在の処理単位
時間における平滑化された量子化LSPパラメータと1
つ前の処理単位時間における平滑化された量子化LSP
パラメータとの次数毎の差の2乗和を計算する。
【0160】動的特徴抽出部601では、AR型平滑化
手段604と並列に遅延手段608にも量子化LSPパ
ラメータを入力している。遅延手段608では、1処理
単位時間だけ遅延させて、スイッチ609を介してAR
型平均値算出手段611に出力する。
【0161】スイッチ609は、遅延手段610から出
力されるモード情報が雑音モードであった場合に閉じ
て、遅延手段608から出力される量子化LSPパラメ
ータをAR型平均値算出手段611へ入力するように動
作する。
【0162】遅延手段610は、モード判定手段621
から出力されるモード情報を入力し、1処理単位時間だ
け遅延させて、スイッチ609へ出力する。
【0163】AR型平均値算出手段611は、AR型平
滑化手段604と同様に(1)式に基づいて雑音区間に
おける平均的LSPパラメータを算出し、加算器612
に出力する。ただし、(1)式におけるαの値は、0.05
程度とし、極めて強い平滑化処理を行うことによって、
平均的なLSPパラメータを算出する。
【0164】加算器612は、現在の処理単位時間にお
ける量子化LSPパラメータと、AR型平均値算出手段
611によって算出された雑音区間における平均的量子
化LSPパラメータとの差を各次数毎に算出し、2乗和
算出手段613に出力する。
【0165】2乗和算出手段613は、加算器612か
ら出力された量子化LSPパラメータの差分情報を入力
し、各次数の2乗和を算出して、音声区間検出手段61
9に出力する。
【0166】以上の604から613までの要素によっ
て、量子化LSPパラメータの動的特徴抽出部601が
構成される。
【0167】第1の静的特徴抽出部602は、線形予測
残差パワ算出手段614において量子化LSPパラメー
タから線形予測残差パワを算出する。また、隣接LSP
間隔算出手段615において、(2)式に示すように量
子化LSPパラメータの隣接する次数毎に間隔を算出す
る。
【0168】 Ld[i]=L[i+1]-L[i], i=1,2,…M-1 …(2) L[i]:i次の量子化LSPパラメータ 隣接LSP間隔算出手段615の算出値は分散値算出手
段616へ与えられる。分散値算出手段616は、隣接
LSP間隔算出手段615から出力された量子化LSP
パラメータ間隔の分散値をする。分散値を算出する際、
全てのLSPパラメータ間隔データを用いずに、低域端
(Ld[1])のデータを除くことによって、最低域以外の
部分に存在するスペクトルの山谷の特徴を反映すること
ができる。低域が持ち上がっているような特性をもつ定
常雑音に対して、ハイパスフィルタを通した場合、フィ
ルタの遮断周波数付近にスペクトルの山が常にできるの
で、この様なスペクトルの山の情報を取り除く効果があ
る。
【0169】以上の614、615、616の要素によ
って、量子化LSPパラメータの第1の静的特徴抽出部
602が構成される。
【0170】また、第2の静的特徴抽出部603では、
反射係数算出手段617が量子化LSPパラメータを反
射係数に変換して、有声/無声判定手段620に出力す
る。これとともに線形予測残差パワ算出手段618が、
量子化LSPパラメータから線形予測残差パワを算出し
て、有声/無声判定手段620に出力する。
【0171】なお、線形予測残差パワ算出手段618
は、線形予測残差パワ算出手段614と同じものなの
で、614と618は共用させることが可能である。
【0172】以上の617と618の要素によって、量
子化LSPパラメータの第2の静的特徴抽出部603が
構成される。
【0173】動的特徴抽出部601及び第1の静的特徴
抽出部602の出力は音声区間検出手段619へ与えら
れる。音声区間検出手段619は、2乗和算出手段60
7から平滑化量子化LSPパラメータの変動量を入力
し、2乗和算出手段613から雑音区間の平均的量子化
LSPパラメータと現在の量子化LSPパラメータとの
距離を入力し、線形予測残差パワ算出手段614から量
子化線形予測残差パワを入力し、分散値算出手段616
から隣接LSP間隔データの分散情報を入力する。そし
て、これらの情報を用いて、現在の処理単位時間におけ
る入力信号(または復号信号)が音声区間であるか否か
の判定を行い、判定結果をモード判定手段621に出力
する。より具体的な音声区間か否かの判定方法は、図8
を用いて後述する。
【0174】一方、第2の静的特徴抽出部603の出力
は有声/無声判定手段620へ与えられる。有声/無声
判定手段620は、反射係数算出手段617から入力し
た反射係数と、線形予測残差パワ算出手段618から入
力した量子化線形予測残差パワとをそれぞれ入力する。
そして、これらの情報を用いて、現在の処理単位時間に
おける入力信号(または復号信号)が有声区間であるか
無声区間であるかの判定を行い、判定結果をモード判定
手段621に出力する。より具体的な有音/無音判定方
法は、図9を用いて後述する。
【0175】モード判定手段621は、音声区間検出手
段619から出力される判定結果と、有声/無声判定手
段620から出力される判定結果とをそれぞれ入力し、
これらの情報を用いて現在の処理単位時間における入力
信号(または復号信号)のモードを決定して出力する。
より具体的なモードの分類方法は図10を用いて後述す
る。
【0176】なお、本実施の形態においては、平滑化手
段や平均値算出手段にAR型のものを用いたが、それ以
外の方法を用いて平滑化や平均値算出を行うことも可能
である。
【0177】次に、図8を参照して、上記実施の形態に
おける音声区間判定方法の詳細について説明する。
【0178】まず、ステップ801において、第1の動
的パラメータ(Para1)を算出する。第1の動的パラメ
ータの具体的内容は、処理単位時間毎の量子化LSPパ
ラメータの変動量であり、(3)式に示されるものであ
る。
【0179】
【数1】 次に、ステップ802において、第1の動的パラメータ
が予め定めてある閾値Th1より大きいかどうかをチェ
ックする。閾値Th1を越えている場合は、量子化LS
Pパラメータの変動量が大きいので、音声区間であると
判定する。一方、閾値Th1以下の場合は、量子化LS
Pパラメータの変動量が小さいので、ステップ803に
進み、さらに別のパラメータを用いた判定処理のステッ
プに進んでゆく。
【0180】ステップ802において、第1の動的パラ
メータが閾値Th1以下の場合は、ステップ803に進
んで、過去にどれだけ定常雑音区間と判定されたかを示
すカウンターの数をチェックする。カウンターは初期値
が0で、本モード判定方法によって定常雑音区間である
と判定された処理単位時間毎に1ずつインクリメントさ
れる。ステップ803において、カウンターの数が、予
め設定されている閾値ThC以下の場合は、ステップ8
04に進み、静的パラメータを用いて音声区間か否かの
判定を行う。一方、閾値ThCを越えている場合は、ス
テップ806に進み、第2の動的パラメータを用いて音
声区間か否かの判定を行う。
【0181】ステップ804では2種類のパラメータを
算出する。一つは量子化LSPパラメータから算出され
る線形予測残差パワであり(Para3)、もう一つは量子
化LSPパラメータの隣接次数の差分情報の分散である
(Para4)。線形予測残差パワは、量子化LSPパラメ
ータを線形予測係数に変換し、Levinson-Durbinのアル
ゴリズムにある関係式を用いることにより、求めること
ができる。線形予測残差パワは有声部より無声部の方が
大きくなる傾向が知られているので、有声/無声の判定
基準として利用できる。量子化LSPパラメータの隣接
次数の差分情報は(2)式に示したもので、これらのデ
ータの分散を求める。ただし、雑音の種類や帯域制限の
かけかたによっては、低域にスペクトルの山(ピーク)
が存在するので、低域端の隣接次数の差分情報((2)
式において、i=1)は用いずに、(2)式において、
i=2からM−1(Mは分析次数)までのデータを用い
て分散を求める方が良い。音声信号においては、電話帯
域(200Hz〜3.4kHz)内に3つ程度のホルマ
ントを持つため、LSPの間隔が狭い部分と広い部分が
いくつかあり、間隔のデータの分散が大きくなる傾向が
ある。一方、定常ノイズでは、ホルマント構造を持たな
いため、LSPの間隔は比較的等間隔であることが多
く、前記分散は小さくなる傾向がある。この性質を利用
して、音声区間か否かの判定を行うことが可能である。
ただし、前述のように雑音の種類等によっては、低域に
スペクトルの山(ピーク)をもつ場合があり、この様な
場合は最も低域側のLSP間隔が狭くなるので、全ての
隣接LSP差分データを用いて分散を求めると、ホルマ
ント構造の有無による差が小さくなり、判定精度が低く
なる。したがって、低域端の隣接LSP差分情報を除い
て分散を求めることによって、この様な精度劣化を回避
する。ただし、この様な静的パラメータは、動的パラメ
ータに比べると判定能力が低いので、補助的な情報とし
て用いるのが良い。ステップ804にて算出された2種
類のパラメータはステップ805で用いられる。
【0182】次に、ステップ805において、ステップ
804にて算出された2種類のパラメータを用いた閾値
処理が行われる。具体的には線形予測残差パワ(Para
3)が閾値Th3より小さく、かつ、隣接LSP間隔データ
の分散(Para4)が閾値Th4より大きい場合に、音声区間
と判定する。それ以外の場合は、定常雑音区間(非音声
区間)と判定する。定常雑音区間と判定された場合は、
カウンターの値を1増やす。
【0183】ステップ806においては、第2の動的パ
ラメータ(Para2)が算出される。第2の動的パラメー
タは過去の定常雑音区間における平均的な量子化LSP
パラメータと現在の処理単位時間における量子化LSP
パラメータとの類似度を示すパラメータであり、具体的
には(4)式に示したように、前記2種類の量子化LS
Pパラメータを用いて各次数毎に差分値を求め、2乗和
を求めたものである。求められた第2の動的パラメータ
は、ステップ807にて閾値処理に用いられる。
【0184】
【数2】 次に、ステップ807において、第2の動的パラメータ
が閾値Th2を越えているかどうかの判定が行われる。閾
値Th2を越えていれば、過去の定常雑音区間における平
均的な量子化LSPパラメータとの類似度が低いので、
音声区間と判定し、閾値Th2以下であれば、過去の定常
雑音区間における平均的な量子化LSPパラメータとの
類似度が高いので、定常雑音区間と判定する。定常雑音
区間と判定された場合は、カウンターの値を1増やす。
【0185】次に、図9を参照して上記実施の形態にお
ける有声無声区間判定方法の詳細について説明する。
【0186】まず、ステップ901において、現在の処
理単位時間における量子化LSPパラメータから1次の
反射係数を算出する。反射係数は、LSPパラメータを
線形予測係数に変換して算出される。
【0187】次に、ステップ902において、前記反射
係数が第1の閾値Th1を越えているかどうかの判定が行
われる。閾値Th1を越えていれば、現在の処理単位時間
は無声区間であると判定して有声無声判定処理を終了
し、閾値Th1以下であれば、さらに有声無声判定の処理
を続ける。
【0188】ステップ902において無声と判定されな
かった場合は、ステップ903において、前記反射係数
が第2の閾値Th2を越えているかどうかの判定が行われ
る。閾値Th2を越えていれば、ステップ905に進み、
閾値Th2以下であれば、ステップ904に進む。
【0189】ステップ903において、前記反射係数が
第2の閾値Th2以下だった場合は、ステップ904にお
いて、前記反射係数が第3の閾値Th3を越えているかど
うかの判定が行われる。閾値Th3を越えていれば、ステ
ップ907に進み、閾値Th3以下であれば、有声区間と
判定して有声無声判定処理を終了する。
【0190】ステップ903において、前記反射係数が
第2の閾値Th2を越えた場合は、ステップ905におい
て、線形予測残差パワが算出される。線形予測残差パワ
は、量子化LSPを線形予測係数に変換してから算出さ
れる。
【0191】ステップ905に続いて、ステップ906
において、前記線形予測残差パワが閾値Th4を越えてい
るかどうかの判定が行われる。閾値Th4を越えていれ
ば、無声区間と判定して有声無声判定処理を終了し、閾
値Th4以下であれば、有声区間と判定して有声無声判定
処理を終了する。
【0192】ステップ904において、前記反射係数が
第3の閾値Th3を越えた場合は、ステップ907におい
て、線形予測残差パワが算出される。
【0193】ステップ907に続いて、ステップ908
において、前記線形予測残差パワが閾値Th5を越えてい
るかどうかの判定が行われる。閾値Th5を越えていれ
ば、無声区間と判定して有声無声判定処理を終了し、閾
値Th5以下であれば、有声区間と判定して有声無声判定
処理を終了する。
【0194】次に図10を参照して、モード判定手段6
21に用いられる、モード判定方法について説明する。
【0195】まず、ステップ1001において、音声区
間検出結果が入力される。本ステップは音声区間検出処
理を行うブロックそのものであっても良い。
【0196】次に、ステップ1002において、音声区
間であるか否かの判定結果に基づいて定常雑音モードと
判定するか否かが決定される。音声区間である場合は、
ステップ1003に進み、音声区間でない(定常雑音区
間である)場合には、定常雑音モードであるというモー
ド判定結果を出力して、モード判定処理を終了する。
【0197】ステップ1002において、定常雑音区間
モードではないと判定された場合は、続いてステップ1
003において、有声無声判定結果の入力が行われる。
本ステップは有声無声判定処理を行うブロックそのもの
であっても良い。
【0198】ステップ1003に続いて、ステップ10
04において、有声無声判定結果に基づいて有声区間モ
ードであるか、無声区間モードであるか、のモード判定
が行われる。有声区間である場合には、有声区間モード
であるというモード判定結果を出力してモード判定処理
を終了し、無声区間である場合には、無声区間モードで
あるというモード判定結果を出力してモード判定処理を
終了する。以上のように、音声区間検出結果と有声無声
判定結果とを用いて、現在の処理単位ブロックにおける
入力信号(または復号信号)のモードを3つのモードに
分類する。
【0199】(実施の形態5)図7に本発明の実施の形
態5にかかる後処理器の構成を示す。本後処理器は、実
施の形態4に示したモード判定器と組合わせて、実施の
形態2に示した音声信号復号装置にて使用するものであ
る。同図に示す後処理器は、モード切替スイッチ70
5、708、707、711、振幅スペクトル平滑化手
段706、位相スペクトルランダム化手段709、71
0、閾値設定手段703、716をそれぞれ備える。
【0200】重み付け合成フィルタ701は、前記音声
復号装置のLPC復号器201から出力される復号LP
Cを入力して聴覚重み付け合成フィルタを構築し、を前
記音声復号装置の合成フィルタ209またはポストフィ
ルタ210から出力される合成音声信号に対して重み付
けフィルタ処理を行い、FFT処理手段702に出力す
る。
【0201】FFT処理手段702は、重み付け合成フ
ィルタ701から出力された重み付け処理後の復号信号
のFFT処理を行い、振幅スペクトルWSAiを第1の閾値
設定手段703と第1の振幅スペクトル平滑化手段70
6と第1の位相スペクトルランダム化手段709とに、
それぞれ出力する。
【0202】第1の閾値設定手段703は、FFT処理
手段702にて算出された振幅スペクトルの平均値を全
周波数成分を用いて算出し、この平均値を基準として閾
値Th1を、第1の振幅スペクトル平滑化手段706と第1
の位相スペクトルランダム化手段709とに、それぞれ
出力する。
【0203】FFT処理手段704は、前記音声復号装
置の合成フィルタ209またはポストフィルタ210か
ら出力される合成音声信号のFFT処理を行い、振幅ス
ペクトルを、モード切換スイッチ705、712、加算
器715、第2の位相スペクトルランダム化手段710
に、位相スペクトルを、モード切換スイッチ708に、
それぞれ出力する。
【0204】モード切替スイッチ705は、前記音声復
号装置のモード選択器202から出力されるモード情報
(Mode)と、前記加算器715から出力される差分情報
(Diff)と、を入力して、現在の処理単位時間における
復号信号が音声区間か定常雑音区間かの判定を行い、音
声区間と判定した場合は、モード切換スイッチ707に
接続し、定常雑音区間と判定した場合は、第1の振幅ス
ペクトル平滑化手段706に接続する。
【0205】第1の振幅スペクトル平滑化手段706
は、モード切換スイッチ705を介して、FFT処理手
段704から振幅スペクトルSAiを入力し、別途入力し
た第1の閾値Th1と重み付け振幅スペクトルWSAiとによ
って決定される周波数成分に対して平滑化処理を行い、
モード切換スイッチ707に出力する。平滑化する周波
数成分の決定方法は、重み付け振幅スペクトルWSAiが第
1の閾値Th1以下であるかどうかによって、決定され
る。即ち、WSAiがTh1以下である周波数成分iに対しての
み平滑化処理が行われる。この平滑化処理によって、定
常雑音区間における、符号化歪みに起因する振幅スペク
トルの時間的不連続性が緩和される。この平滑化処理
を、例えば(1)式の様なAR型で行った場合の係数α
は、FFT点数128点、処理単位時間10msの場合
で、0.1程度に設定できる。
【0206】モード切換スイッチ707は、モード切換
スイッチ705と同様にして、前記音声復号装置のモー
ド選択器202から出力されるモード情報(Mode)と、
前記加算器715から出力される差分情報(Diff)と、
を入力して、現在の処理単位時間における復号信号が音
声区間か定常雑音区間かの判定を行い、音声区間と判定
した場合は、モード切換スイッチ705に接続し、定常
雑音区間と判定した場合は、第1の振幅スペクトル平滑
化手段706に接続する。前記判定結果は、モード切換
スイッチ705の判定結果と同一である。モード切換ス
イッチ707の他端はIFFT処理手段720に接続さ
れている。
【0207】モード切換スイッチ708は、モード切換
スイッチ705と連動して切り替わるスイッチであり、
前記音声復号装置のモード選択器202から出力される
モード情報(Mode)と、前記加算器715から出力され
る差分情報(Diff)と、を入力して、現在の処理単位時
間における復号信号が音声区間か定常雑音区間かの判定
を行い、音声区間と判定した場合は、第2の位相スペク
トルランダム化手段710に接続し、定常雑音区間と判
定した場合は、第1の位相スペクトルランダム化手段7
09に接続する。前記判定結果は、モード切換スイッチ
705の判定結果と同一である。即ち、モード切換スイ
ッチ705が第1の振幅スペクトル平滑化手段706に
接続されている場合は、モード切換スイッチ708は第
1の位相スペクトルランダム化手段709に接続されて
おり、モード切換スイッチ705がモード切換スイッチ
707に接続されている場合は、モード切換スイッチ7
08は第2の位相スペクトルランダム化手段710に接
続されている。
【0208】第1の位相ランダム化手段709は、モー
ド切換スイッチ708を介して、FFT処理手段704
から出力される位相スペクトルSPiを入力し、別途入力
した第1の閾値Th1と重み付け振幅スペクトルWSAiとに
よって決定される周波数成分に対してランダム化処理を
行い、モード切換スイッチ711に出力する。ランダム
化する周波数成分の決定方法は、前記第1の振幅スペク
トルの平滑化手段706において平滑化を行う周波数成
分を決定する方法と同一である。即ち、WSAiがTh1以下
である周波数成分iに対してのみ位相スペクトルSPiのラ
ンダム化処理が行われる。
【0209】第2の位相スペクトルランダム化手段71
0は、モード切換スイッチ708を介して、FFT処理
手段704から出力される位相スペクトルSPiを入力
し、別途入力した第2の閾値Th2iと振幅スペクトルSAi
とによって決定される周波数成分に対してランダム化処
理を行い、モード切換スイッチ711に出力する。ラン
ダム化する周波数成分の決定方法は、前記第1の位相ス
ペクトルランダム化手段709と同様である。即ち、SA
iがTh2i以下である周波数成分iに対してのみ位相スペク
トルSPiのランダム化処理が行われる。
【0210】モード切換スイッチ711は、モード切換
スイッチ707と連動しており、モード切換スイッチ7
07と同様にして、前記音声復号装置のモード選択器2
02から出力されるモード情報(Mode)と、前記加算器
715から出力される差分情報(Diff)と、を入力し
て、現在の処理単位時間における復号信号が音声区間か
定常雑音区間かの判定を行い、音声区間と判定した場合
は、第2の位相スペクトルランダム化手段710に接続
し、定常雑音区間と判定した場合は、第1の位相スペク
トルランダム化手段709に接続する。前記判定結果
は、モード切換スイッチ708の判定結果と同一であ
る。モード切換スイッチ711の他端はIFFT処理手
段720に接続されている。
【0211】モード切換スイッチ712は、モード切換
スイッチ705と同様にして、前記音声復号装置のモー
ド選択器202から出力されるモード情報(Mode)と、
前記加算器715から出力される差分情報(Diff)と、
を入力して、現在の処理単位時間における復号信号が音
声区間か定常雑音区間かの判定を行い、音声区間でない
(定常雑音区間である)と判定した場合は、スイッチを
接続して、第2の振幅スペクトル平滑化手段713に、
FFT処理手段704から出力される振幅スペクトルSA
iを出力する。音声区間と判定した場合は、モード切換
スイッチ712は、開放され、第2の振幅スペクトル平
滑化手段713に、振幅スペクトルSAiは出力されな
い。
【0212】第2の振幅スペクトル平滑化手段713
は、モード切替スイッチ712を介して、FFT処理手
段704から出力される振幅スペクトルSAiを入力し、
全周波数帯域成分について平滑化処理を行う。この平滑
化処理によって、定常雑音区間における平均的な振幅ス
ペクトルが得られる。この平滑化処理は、第1の振幅ス
ペクトル平滑化手段706で行われる処理と同様であ
る。また、モード切換スイッチ712が開放されている
時は、本手段において処理は行われず、最後に処理が行
われたときの定常雑音区間の平滑化振幅スペクトルSSAi
が出力される。第2の振幅スペクトル平滑化処理手段7
13によって平滑化された振幅スペクトルSSAiは遅延手
段714、第2の閾値設定手段716、モード切換スイ
ッチ718、にそれぞれ出力される。
【0213】遅延手段714は、第2の振幅スペクトル
平滑化手段713から出力されるSSAiを入力し、1処理
単位時間だけ遅延させて、加算器715に出力する。
【0214】加算器715は、1処理単位時間前の定常
雑音区間平滑化振幅スペクトルSSAiと現在の処理単位時
間における振幅スペクトルSAiとの距離Diffを算出し、
モード切換スイッチ705、707、708、711、
712、718、719、にそれぞれ出力する。
【0215】第2の閾値設定手段716は、第2の振幅
スペクトル平滑化手段713から出力される、定常雑音
区間平滑化振幅スペクトルSSAiを基準として閾値Th2iを
設定して、第2の位相スペクトルランダム化手段710
に出力する。
【0216】ランダム位相スペクトル生成手段717
は、ランダムに生成した位相スペクトルを、モード切換
スイッチ719に出力する。
【0217】モード切換スイッチ718は、モード切換
スイッチ712と同様にして、前記音声復号装置のモー
ド選択器202から出力されるモード情報(Mode)と、
前記加算器715から出力される差分情報(Diff)と、
を入力して、現在の処理単位時間における復号信号が音
声区間か定常雑音区間かの判定を行い、音声区間である
と判定した場合は、スイッチを接続して、第2の振幅ス
ペクトル平滑化手段713の出力を、IFFT処理手段
720に出力する。音声区間でない(定常雑音区間であ
る)と判定した場合は、モード切換スイッチ718は、
開放され、第2の振幅スペクトル平滑化手段713の出
力は、IFFT処理手段720に出力されない。
【0218】モード切換スイッチ719は、モード切換
スイッチ718と連動して切り替わり、モード切換スイ
ッチ718と同様にして、前記音声復号装置のモード選
択器202から出力されるモード情報(Mode)と、前記
加算器715から出力される差分情報(Diff)と、を入
力して、現在の処理単位時間における復号信号が音声区
間か定常雑音区間かの判定を行い、音声区間であると判
定した場合は、スイッチを接続して、ランダム位相生成
手段717の出力を、IFFT処理手段720に出力す
る。音声区間でない(定常雑音区間である)と判定した
場合は、モード切換スイッチ719は、開放され、ラン
ダム位相生成手段717の出力は、IFFT処理手段7
20に出力されない。
【0219】IFFT処理手段720は、モード切換ス
イッチ707から出力される振幅スペクトルと、モード
切換スイッチ711から出力される位相スペクトルと、
モード切換スイッチ718から出力される振幅スペクト
ルと、モード切換スイッチ719から出力される位相ス
ペクトルと、を夫々入力して、逆FFT処理を行い、後
処理後の信号を出力する。モード切換スイッチ718、
719が開放されている場合は、モード切換スイッチ7
07から入力される振幅スペクトルと、モード切換スイ
ッチ711から入力される位相スペクトルとを、FFT
の実部スペクトルと虚部スペクトルとに変換し、逆FFT
処理を行い、結果の実部を時間信号として出力する。一
方、モード切換スイッチ718、717が接続されてい
る場合は、モード切換スイッチ707から入力される振
幅スペクトルと、モード切換スイッチ711から入力さ
れる位相スペクトルとを、第1の実部スペクトルと第1
の虚部スペクトルに変換したものに加えて、モード切換
スイッチ718から入力される振幅スペクトルと、モー
ド切換スイッチ719から入力される位相スペクトルと
を、第2の実部スペクトルと第2の虚部スペクトルとに
変換したものを加算して、逆FFT処理を行う。即ち、第
1の実部スペクトルと第2の実部スペクトルとを加算し
たものを第3の実部スペクトルとし、第1の虚部スペク
トルと第2の虚部スペクトルとを加算したものを第3の
虚部スペクトルとすると、第3の実部スペクトルと第3
の虚部スペクトルとを用いて逆FFT処理を行う。前記
スペクトルの加算時には、第2の実部スペクトルおよび
第2の虚部スペクトルは、定数倍あるいは適応的に制御
される変数によって減衰される。例えば、前記スペクト
ルの加算において、第2の実部スペクトルは0.25倍され
た後に、第1の実部スペクトルと加算され、第2の虚部
スペクトルは0.25倍された後に、第1の虚部スペクトル
と加算されて、第3の実部スペクトルおよび第3の虚部
スペクトルが夫々得られる。
【0220】次に、図11及び図12を用いて前記後処
理方法について説明する。図11は本実施の形態におけ
る後処理方法の具体的処理を示した流れ図を示してい
る。
【0221】まず、ステップ1101において、聴覚重
み付けをした入力信号(復号音声信号)のFFT対数振
幅スペクトル(WSAi)を計算する。
【0222】次に、ステップ1102において、第1の
閾値Th1を計算する。Th1は、WSAiの平均値に
定数k1を加えたものである。k1の値は経験的に決定
し、例えば、常用対数領域で0.4程度である。FFT点
数をNとし、FFT振幅スペクトルをWSAi(i=1,
2,...N)とすると、WSAiはi=N/2とi=N/
2+1を境に対称となるので、N/2本のWSAiの平
均値を計算すれば、WSAiの平均値を求められる。
【0223】次に、ステップ1103において、聴覚重
み付けをしない入力信号(復号音声信号)のFFT対数
振幅スペクトル(SAi)とFFT位相スペクトル(S
Pi)を計算する。
【0224】次に、ステップ1104において、スペク
トル変動(Diff)を計算する。スペクトル変動は、
過去に定常雑音区間と判定された区間における平均的な
FFT対数振幅スペクトル(SSAi)を現在のFFT
対数振幅スペクトル(SAi)から減じて、得られた残
差スペクトルの総和である。本ステップにおいて求めら
れるスペクトル変動Diffは、現在のパワが定常雑音
区間の平均的なパワと比較して大きくなっていないかど
うかを判定するためのパラメータで、大きくなっていれ
ば、定常雑音成分とは異なる信号が存在する区間であ
り、定常雑音区間ではないと判断できる。
【0225】次に、ステップ1105において、過去に
定常雑音区間と判定された回数を示すカウンタをチェッ
クする。カウンタの数が、一定値以上、即ち過去にある
程度安定して定常雑音区間であると判定されている場合
は、ステップ1107に進み、そうでない場合、即ち過
去に定常雑音区間であると判定されたことがあまりない
場合は、ステップ1106に進む。ステップ1106と
ステップ1107との違いは、スペクトル変動(Dif
f)を判定基準に用いるか用いないかの違いである。ス
ペクトル変動(Diff)は過去に定常雑音区間と判定
された区間における平均的なFFT対数振幅スペクトル
(SSAi)を用いて算出される。この様な平均的なF
FT対数振幅スペクトル(SSAi)を求めるには、過
去にある程度十分な時間長の定常的雑音区間が必要とな
るため、ステップ1105を設けて、過去に十分な時間
長の定常的雑音区間がない場合は、雑音区間の平均的F
FT対数振幅スペクトル(SSAi)が十分平均化され
ていないと考えられるため、スペクトル変動(Dif
f)を用いないステップ1106に進むようにしてい
る。カウンタの初期値は0である。
【0226】次に、ステップ1106またはステップ1
107において、定常雑音区間か否かの判定が行われ
る。ステップ1106では、音声復号装置においてすで
に決定されている音源モードが定常雑音区間モードであ
る場合を定常雑音区間と判定し、ステップ1107で
は、音声復号装置において既に決定されている音源モー
ドが定常雑音区間モードでかつ、ステップ1104で計
算された振幅スペクトル変動(Diff)が閾値k3以
下である場合を定常雑音区間と判定する。ステップ11
06またはステップ1107において、定常雑音区間で
あると判定された場合は、ステップ1108へ進み、定
常雑音区間でない、即ち音声区間であると判定された場
合は、ステップ1113へ進む。
【0227】定常雑音区間であると判定された場合は、
次に、ステップ1108において、定常雑音区間の平均
的FFT対数スペクトル(SSAi)を求めるための平
滑化処理が行われる。ステップ1108の式において、
βは0.0〜1.0の範囲の平滑化の強さを示す定数で、FF
T点数128点、処理単位時間10ms(8kHzサン
プリングで80点)の場合には、β=0.1程度で良い。こ
の平滑化処理は、全ての対数振幅スペクトル(SAi,
i=1,…N,NはFFT点数)について行われる。
【0228】次に、ステップ1109において、定常雑
音区間の振幅スペクトルの変動を滑らかにするためのF
FT対数振幅スペクトルの平滑化処理が行われる。この
平滑化処理は、ステップ1108の平滑化処理と同様だ
が、全ての対数振幅スペクトル(SAi)について行う
のではなく、聴覚重み付け対数振幅スペクトル(WSA
i)が閾値Th1より小さい周波数成分iについてのみ
行われる。ステップ1109の式におけるγは、ステッ
プ1108におけるβと同様であり、同じ値でも良い。
ステップ1109にて、部分的に平滑化された対数振幅
スペクトルSSA2iが得られる。
【0229】次に、ステップ1110おいて、FFT位
相スペクトルのランダム化処理が行われる。このランダ
ム化処理は、ステップ1109の平滑化処理と同様に、
周波数選択的に行われる。即ち、ステップ1109と同
様に、聴覚重み付け対数振幅スペクトル(WSAi)が
閾値Th1より小さい周波数成分iについてのみ行われ
る。ここで、Th1はステップ1109と同じ値で良い
が、より良い主観品質が得られるように調整された異な
る値に設定しても良い。また、ステップ1110におけ
るrandom(i)は乱数的に生成した−2π〜+2πの範囲
の数値である。random(i)の生成は、毎回新たに乱数を
生成しても良いが、演算量を節約する場合は、予め生成
した乱数をテーブルに保持しておき、処理単位時間毎
に、テーブルの内容を巡回させて利用することも可能で
ある。この場合、テーブルの内容をそのまま利用する場
合と、テーブルの内容をオリジナルのFFT位相スペク
トルに加算して用いる場合とが考えられる。
【0230】次に、ステップ1111において、FFT
対数振幅スペクトルとFFT位相スペクトルとから、複
素FFTスペクトルを生成する。実部はFFT対数振幅
スペクトルSSA2iを対数領域から線形領域に戻した
後に、位相スペクトルRSP2iの余弦を乗じて求めら
れる。虚部はFFT対数振幅スペクトルSSA2iを対
数領域から線形領域に戻した後に、位相スペクトルRS
P2iの正弦を乗じて求められる。
【0231】次に、ステップ1112において、定常雑
音区間と判定された区間のカウンタを1増やす。
【0232】一方、ステップ1106または1107に
おいて、音声区間(定常雑音区間ではない)と判定され
た場合は、次に、ステップ1113において、FFT対
数振幅スペクトルSAiが平滑化対数スペクトルSSA
2iにコピーされる。即ち、対数振幅スペクトルの平滑
化処理は行わない。
【0233】次に、ステップ1114において、FFT
位相スペクトルのランダム化処理が行われる。このラン
ダム化処理は、ステップ1110の場合と同様にして、
周波数選択的に行われる。ただし、周波数選択に用いる
閾値はTh1ではなく、過去にステップ1108で求め
られているSSAiに定数k4を加えたものを用いる。
この閾値は図7における第2の閾値Th2iに相当す
る。即ち、定常雑音区間における平均的な振幅スペクト
ルより小さい振幅スペクトルになっている周波数成分の
み、位相スペクトルのランダム化を行う。
【0234】次に、ステップ1115において、FFT
対数振幅スペクトルとFFT位相スペクトルとから、複
素FFTスペクトルを生成する。実部はFFT対数振幅
スペクトルSSA2iを対数領域から線形領域に戻した
後に、位相スペクトルRSP2iの余弦を乗じたもの
と、FFT対数振幅スペクトルSSAiを対数領域から
線形領域に戻した後に、位相スペクトルrandom2(i)の余
弦を乗じたものに、定数k5を乗じたものと、を加算し
て求められる。虚部はFFT対数振幅スペクトルSSA
2iを対数領域から線形領域に戻した後に、位相スペク
トルRSP2iの正弦を乗じたものと、FFT対数振幅
スペクトルSSAiを対数領域から線形領域に戻した後
に、位相スペクトルrandom2(i)の正弦を乗じたものに、
定数k5を乗じたものと、を加算して求められる。定数
k5は0.0〜1.0の範囲で、より具体的には、0.25程度に
設定される。なお、k5は適応的に制御された変数でも
良い。k5倍した、平均的な定常雑音を重畳することに
よって、音声区間における背景定常雑音の主観的品質が
向上できる。random2(i)は、random(i)と同様の乱数で
ある。
【0235】次に、ステップ1116において、ステッ
プ1111または1115にて生成された複素FFTス
ペクトル(Re(S2)i、Im(S2)i)の逆FFTを行い、複素
数(Re(s2)i、Im(s2)i)を得る。
【0236】最後に、ステップ1117において、逆F
FTによって得られた複素数の実部Re(s2)iを出力信号
として出力する。
【0237】
【発明の効果】以上詳記したように、本発明によればス
ペクトル特性を表すパラメータの量子化データにおける
静的および動的特徴を用いて音源符号化および/または
復号後処理のモード切替を行う構成なので、モード情報
を新たに伝送することなしに音源符号化のマルチモード
化が図れる。特に有声区間/無声区間の判定に加えて音
声区間/非音声区間の判定を行うことも可能なので、マ
ルチモード化による符号化性能の改善度をより高めるこ
とを可能とした音声符号化装置および音声復号化装置を
提供できる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における音声符号化装置
の構成を示すブロック図
【図2】本発明の実施の形態2における音声復号化装置
の構成を示すブロック図
【図3】本発明の実施の形態1における音声符号化処理
の流れを示す流れ図
【図4】本発明の実施の形態2における音声復号化処理
の流れを示す流れ図
【図5】本発明の実施の形態3における音声信号送信装
置および受信装置の構成を示すブロック図
【図6】本発明の実施の形態4におけるモード選択器の
構成を示すブロック図
【図7】本発明の実施の形態5におけるマルチモード後
処理器の構成を示すブロック図
【図8】本発明の実施の形態4における前段のモード選
択処理の流れを示す流れ図
【図9】本発明の実施の形態4における後段のモード選
択処理の流れを示す流れ図
【図10】本発明の実施の形態4におけるモード選択処
理の全体の流れを示す流れ図
【図11】本発明の実施の形態5における前段のモード
選択処理の流れを示す流れ図
【図12】本発明の実施の形態5における後段のモード
選択処理の流れを示す流れ図
【図13】従来の音声符号化装置の構成を示すブロック
【符号の説明】
103 LPC量子化器 104 合成フィルタ 105 モード選択器 109 雑音符号帳 110 適応符号帳 111 ゲイン符号帳 201 LPC復号器 202 モード選択器 209 合成フィルタ 210 ポストフィルタ 501 音声入力装置 503 音声符号化器 509 音声復号化器 511 音声出力装置 601 動的特徴抽出部 602 静的特徴抽出部 604 AR型平滑化手段 609 スイッチ 611 AR型平均値算出手段 614 線形予測残差パワ算出手段 615 隣接LSP間隔算出手段 616 分散値算出手段 617 反射係数算出手段 618 線形予測残差パワ算出手段 619 音声区間検出手段 620 有声/無声判定手段 621 モード判定手段 702 FFT処理手段 703 第1の閾値設定手段 705 モード切換スイッチ 706 第1の振幅スペクトル平滑化手段 707、708 モード切換スイッチ 709 第1の位相スペクトルランダム化手段 710 第2の位相スペクトルランダム化手段 711、712 モード切換スイッチ 713 第2の振幅スペクトル平滑化手段 716 第2の閾値設定手段 717 ランダム位相スペクトル生成手段 718、719 モード切換スイッチ 720 逆FFT処理手段

Claims (40)

    【特許請求の範囲】
  1. 【請求項1】 音声信号に含まれる声道情報を表す少な
    くとも1種類以上のパラメータを符号化する第1符号化
    手段と、前記音声信号に含まれる音源情報を表す少なく
    とも1種類以上のパラメータを幾つかのモードで符号化
    可能な第2符号化手段と、前記第1符号化手段で符号化
    された特定パラメータの動的特徴に基づいて前記第2符
    号化手段のモード切替えを行うモード切替手段と、前記
    第1、第2符号化手段によって符号化された複数種類の
    パラメータ情報によって入力音声信号を合成する合成手
    段と、を具備するマルチモード音声符号化装置。
  2. 【請求項2】 前記第2符号化手段は、駆動音源を幾つ
    かの符号化モードで符号化可能な符号化手段で構成さ
    れ、前記モード切替手段は、音声のスペクトル特性を表
    す量子化パラメータを用いて前記第2符号化手段の符号
    化モードを切替えることを特徴とする請求項1記載のマ
    ルチモード音声符号化装置。
  3. 【請求項3】 前記モード切替手段は、音声のスペクト
    ル特性を表す量子化パラメータの静的および動的特徴を
    用いて前記第2符号化手段の符号化モードを切替えるこ
    とを特徴とする請求項2記載のマルチモード音声符号化
    装置。
  4. 【請求項4】 前記モード切替手段は、量子化LSPパ
    ラメータを用いて、前記第2符号化手段の符号化モード
    を切替えることを特徴とする請求項2又は請求項3に記
    載のマルチモード音声符号化装置。
  5. 【請求項5】 前記モード切替手段は、量子化LSPパ
    ラメータの静的および動的特徴を用いて、前記第2符号
    化手段の符号化モードを切替えることを特徴とする請求
    項4記載のマルチモード音声符号化装置。
  6. 【請求項6】 前記モード切替手段は、量子化LSPパ
    ラメータの定常性を過去および現在の量子化LSPパラ
    メータを用いて判定する手段と、現在の量子化LSPパ
    ラメータを用いて有声性を判定する手段とを備え、前記
    判定結果に基づいて前記第2符号化手段の符号化モード
    を切替えることを特徴とする請求項4又は請求項5に記
    載のマルチモード音声符号化装置。
  7. 【請求項7】 音声信号に含まれる声道情報を表す少な
    くとも1種類以上のパラメータを復号化する第1復号化
    手段と、前記音声信号に含まれる音源情報を表す少なく
    とも1種類以上のパラメータを幾つかの符号化モードで
    復号化可能な第2復号化手段と、前記第1復号化手段で
    復号化された特定パラメータの動的特徴に基づいて前記
    第2復号化手段の符号化モードの切替えを行うモード切
    替手段と、前記第1、第2復号化手段によって復号化さ
    れた複数種類のパラメータ情報によって音声信号を復号
    する合成手段と、を具備するマルチモード音声復号化装
    置。
  8. 【請求項8】 前記第2復号化手段は、駆動音源を幾つ
    かの復号化モードで復号化可能な復号化手段で構成さ
    れ、前記モード切替手段は、音声のスペクトル特性を表
    す量子化パラメータを用いて前記第2復号化手段の復号
    化モードを切替えることを特徴とする請求項7記載のマ
    ルチモード音声復号化装置。
  9. 【請求項9】 前記モード切替手段は、音声のスペクト
    ル特性を表す量子化パラメータの静的および動的特徴を
    用いて、前記第2復号化手段の復号化モードを切替える
    ことを特徴とする請求項8記載のマルチモード音声復号
    化装置。
  10. 【請求項10】 前記モード切替手段は、量子化LSP
    パラメータを用いて、前記第2復号化手段の復号化モー
    ドを切替えることを特徴とする請求項8又は請求項9に
    記載のマルチモード音声復号化装置。
  11. 【請求項11】 前記モード切替手段は、量子化LSP
    パラメータの静的および動的特徴を用いて、前記第2復
    号化手段の復号化モードを切替えることを特徴とする請
    求項10記載のマルチモード音声復号化装置。
  12. 【請求項12】 前記モード切替手段は、量子化LSP
    パラメータの定常性を過去および現在の量子化LSPパ
    ラメータを用いて判定する手段と、現在の量子化LSP
    パラメータを用いて有声性を判定する手段とを備え、前
    記判定結果に基づいて前記第2復号化手段の復号化モー
    ドを切替えることを特徴とする請求項10又は請求項1
    1に記載のマルチモード音声復号化装置。
  13. 【請求項13】 前記判定結果に基づいて復号信号に対
    する後処理の切替えを行うことを特徴とする請求項7か
    ら請求項12のいずれかに記載のマルチモード音声復号
    化装置。
  14. 【請求項14】 量子化LSPパラメータのフレーム間
    変化を算出する手段と、量子化LSPパラメータが定常
    的であるフレームにおける平均的量子化LSPパラメー
    タを算出する手段と、前記平均的量子化LSPパラメー
    タと現在の量子化LSPパラメータとの距離を算出する
    手段とを具備した量子化LSPパラメータの動的特徴抽
    出器。
  15. 【請求項15】 量子化LSPパラメータから線形予測
    残差パワを算出する手段と、隣接する次数の量子化LS
    Pパラメータの間隔を算出する手段とを具備した量子化
    LSPパラメータの静的特徴抽出器。
  16. 【請求項16】 請求項14記載の動的特徴抽出器と、
    請求項15記載の静的特徴抽出器とを備え、前記動的特
    徴抽出器によって抽出された量子化LSPパラメータの
    動的特徴と前記静的特徴抽出器によって抽出された量子
    化LSPパラメータの静的特徴との少なくとも一方を用
    いて音声区間の検出を行う音声区間検出器。
  17. 【請求項17】 請求項16記載の音声区間検出器と、
    音声区間における有声区間と無声区間とを切り分ける有
    声無声判定手段とを備え、前記音声区間検出器の検出結
    果と前記有声無声判定手段の判定結果との少なくとも一
    方の情報を用いてモード判定を行うモード判定手段とを
    備えるモード選択器。
  18. 【請求項18】 量子化LSPパラメータから反射係数
    を算出する手段と、量子化LSPパラメータから線形予
    測残差パワを算出する手段とを備える量子化LSPパラ
    メータの静的特徴抽出器によって抽出される情報を前記
    有声無声判定手段に与えて、有声区間と無声区間との切
    り分けを行わせることを特徴とする請求項17記載のモ
    ード選択器。
  19. 【請求項19】 前記モード切替手段を、請求項17又
    は請求項18に記載のモード選択器で構成したことを特
    徴とする請求項1記載の音声符号化装置。
  20. 【請求項20】 前記モード切替手段を、請求項17又
    は請求項18に記載のモード選択器で構成したことを特
    徴とする請求項7記載の音声復号化装置。
  21. 【請求項21】 復号LSPパラメータを用いて音声区
    間か否かの判定を行う判定手段と、信号の高速フーリエ
    変換処理を行うFFT処理手段と、前記高速フーリエ変
    換処理によって得られた位相スペクトルを前記判定手段
    の判定結果に応じてランダム化する位相スペクトルラン
    ダム化手段と、前記高速フーリエ変換処理によって得ら
    れた振幅スペクトルを前記判定結果に応じて平滑化する
    振幅スペクトル平滑化手段と、前記位相スペクトルラン
    ダム化手段によってランダム化された位相スペクトルと
    前記振幅スペクトル平滑化手段によって平滑化された位
    相スペクトルとの逆高速フーリエ変換処理を行うIFF
    T処理手段とを具備するマルチモード後処理器。
  22. 【請求項22】 音声区間においては過去の非音声区間
    における平均的振幅スペクトルを用いてランダム化する
    位相スペクトルの周波数を決定し、非音声区間において
    は聴覚重みづけ領域における全周波数の振幅スペクトル
    の平均値を用いてランダム化する位相スペクトルと平滑
    化する振幅スペクトルとの周波数を決定する請求項21
    記載のマルチモード後処理器。
  23. 【請求項23】 音声区間においては過去の非音声区間
    における平均的振幅スペクトルを用いて生成した雑音を
    重畳することを特徴とする請求項21又は請求項22に
    記載のマルチモード後処理器。
  24. 【請求項24】 請求項16記載の音声区間検出器を備
    え、前記音声区間検出器の検出結果と、過去の非音声区
    間における平均的振幅スペクトルと現在の振幅スペクト
    ルとの差の大きさとを用いて、音声区間か否かの判定を
    行うことを特徴とする請求項21から請求項23のいず
    れかに記載のマルチモード後処理器。
  25. 【請求項25】 請求項21から請求項24のいずれか
    に記載のマルチモード後処理器を用いて、後処理を行う
    ことを特徴とする請求項13記載のマルチモード音声復
    号化装置。
  26. 【請求項26】 請求項1記載のマルチモード音声符号
    化装置と、請求項7記載のマルチモード音声復号化装置
    とから成る音声符号化復号化装置。
  27. 【請求項27】 音声信号を電気的信号に変換する音声
    入力装置と、この音声入力装置から出力される信号をデ
    ィジタル信号に変換するA/D変換器と、このA/D変
    換器から出力されるディジタル信号の符号化を行う請求
    項1から請求項6のいずれかに記載のマルチモード音声
    符号化装置と、このマルチモード音声符号化装置から出
    力される符号化情報に対して変調処理等を行うRF変調
    器と、このRF変調器から出力された信号を電波に変換
    して送信する送信アンテナとを具備する音声信号送信装
    置。
  28. 【請求項28】 受信電波を受信する受信アンテナと、
    この受信アンテナで受信した信号の復調処理を行うRF
    復調器と、このRF復調器によって得られた情報の復号
    化を行う請求項7から請求項13のいずれかに記載のマ
    ルチモード音声復号化装置と、このマルチモード音声復
    号化装置によって復号されたディジタル音声信号をD/
    A変換するD/A変換器と、このD/A変換器によって
    出力される電気的信号を音声信号に変換する音声出力装
    置とを具備する音声信号受信装置。
  29. 【請求項29】 請求項27記載の音声信号送信装置お
    よび請求項28記載の音声信号受信装置の少なくとも一
    方を備え、基地局装置との間で無線通信を行う移動局装
    置。
  30. 【請求項30】 請求項27記載の音声信号送信装置お
    よび請求項28記載の音声信号受信装置の少なくとも一
    方を備え、移動局装置との間で無線通信を行う基地局装
    置。
  31. 【請求項31】 コンピュータに、 量子化LSPパラメータの定常性を過去および現在の量
    子化LSPパラメータを用いて判定する手順と、現在の
    量子化LSPパラメータを用いて有声性を判定する手順
    と、前記手順によって判定された結果に基づいて駆動音
    源を符号化する手順のモード切替を行う手順と、を実行
    させるためのプログラムを記録した機械読み取り可能な
    記憶媒体。
  32. 【請求項32】 コンピュータに、 量子化LSPパラメータの定常性を過去および現在の量
    子化LSPパラメータを用いて判定する手順と、現在の
    量子化LSPを用いて有声性を判定する手順と、前記手
    順によって判定された結果に基づいて駆動音源を復号化
    する手順のモード切替を行う手順と、前記手順によって
    判定された結果に基づいて復号信号に対する後処理手順
    の切替えを行う手順と、を実行させるためのプログラム
    を記録した機械読み取り可能な記憶媒体。
  33. 【請求項33】 音声のスペクトル特性を表す量子化パ
    ラメータの静的および動的特徴を用いて駆動音源を符号
    化するモードのモード切替を行うことを特徴とするマル
    チモード音声符号化方法。
  34. 【請求項34】 音声のスペクトル特性を表す量子化パ
    ラメータの静的および動的特徴を用いて駆動音源を復号
    化するモードのモード切替を行うことを特徴とするマル
    チモード音声復号化方法。
  35. 【請求項35】 復号信号に対する後処理を行う工程
    と、モード情報に基づいて前記後処理工程の切替えを行
    う工程とを具備した請求項34記載のマルチモード音声
    復号化方法。
  36. 【請求項36】 量子化LSPパラメータのフレーム間
    変化を算出する工程と、量子化LSPパラメータが定常
    的であるフレームにおける平均的量子化LSPパラメー
    タを算出する工程と、前記平均的量子化LSPパラメー
    タと現在の量子化LSPパラメータとの距離を算出する
    工程とを具備した量子化LSPパラメータの動的特徴抽
    出方法。
  37. 【請求項37】 量子化LSPパラメータから線形予測
    残差パワを算出する工程と、隣接する次数の量子化LS
    Pパラメータの間隔を算出する工程とを具備する量子化
    LSPパラメータの静的特徴抽出手段。
  38. 【請求項38】 請求項36記載の動的特徴抽出方法に
    よって抽出された量子化LSPパラメータの動的特徴
    と、請求項37記載の静的特徴抽出方法によって抽出さ
    れた量子化LSPパラメータの静的特徴との少なくとも
    一方を用いて音声区間の検出を行う音声区間検出方法。
  39. 【請求項39】 請求項38記載の音声区間検出方法に
    よって得られる音声検出結果を用いてモード判定を行う
    モード判定方法。
  40. 【請求項40】 復号LSPパラメータを用いて音声区
    間か否かの判定を行う判定工程と、信号の高速フーリエ
    変換処理を行うFFT処理工程と、前記高速フーリエ変
    換処理によって得られた位相スペクトルを前記判定工程
    における判定結果に応じてランダム化する位相スペクト
    ルランダム化工程と、前記FFT処理によって得られた振
    幅スペクトルを前記判定結果に応じて平滑化する振幅ス
    ペクトル平滑化工程と、前記位相スペクトルランダム化
    工程においてランダム化された位相スペクトルと前記振
    幅スペクトル平滑化工程において平滑化された位相スペ
    クトルとの逆FFT処理を行うIFFT処理工程とを具
    備するマルチモード後処理方法。
JP26688398A 1998-08-21 1998-09-21 マルチモード音声符号化装置及び復号化装置 Expired - Lifetime JP4308345B2 (ja)

Priority Applications (10)

Application Number Priority Date Filing Date Title
JP26688398A JP4308345B2 (ja) 1998-08-21 1998-09-21 マルチモード音声符号化装置及び復号化装置
CNB998013730A CN1236420C (zh) 1998-08-21 1999-08-20 量化线谱对参数特征提取器及其特征提取方法
SG200107213A SG101517A1 (en) 1998-08-21 1999-08-20 Multimode speech coding apparatus and decoding apparatus
EP99940456.9A EP1024477B1 (en) 1998-08-21 1999-08-20 Multimode speech encoder and decoder
PCT/JP1999/004468 WO2000011646A1 (fr) 1998-08-21 1999-08-20 Codeur et decodeur de la parole multimodes
BRPI9906706-4A BR9906706B1 (pt) 1998-08-21 1999-08-20 Aparelho e método de codificação de voz de modo múltiplo
AU54428/99A AU748597B2 (en) 1998-08-21 1999-08-20 Multimode speech encoder and decoder
CA002306098A CA2306098C (en) 1998-08-21 1999-08-20 Multimode speech coding apparatus and decoding apparatus
US09/529,660 US6334105B1 (en) 1998-08-21 1999-08-20 Multimode speech encoder and decoder apparatuses
KR10-2000-7004235A KR100367267B1 (ko) 1998-08-21 1999-08-20 멀티모드 음성 부호화 장치 및 복호화 장치

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10-236147 1998-08-21
JP23614798 1998-08-21
JP26688398A JP4308345B2 (ja) 1998-08-21 1998-09-21 マルチモード音声符号化装置及び復号化装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2009055573A Division JP4527175B2 (ja) 1998-08-21 2009-03-09 スペクトルパラメータ平滑化装置及びスペクトルパラメータ平滑化方法

Publications (2)

Publication Number Publication Date
JP2002023800A true JP2002023800A (ja) 2002-01-25
JP4308345B2 JP4308345B2 (ja) 2009-08-05

Family

ID=26532515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26688398A Expired - Lifetime JP4308345B2 (ja) 1998-08-21 1998-09-21 マルチモード音声符号化装置及び復号化装置

Country Status (10)

Country Link
US (1) US6334105B1 (ja)
EP (1) EP1024477B1 (ja)
JP (1) JP4308345B2 (ja)
KR (1) KR100367267B1 (ja)
CN (1) CN1236420C (ja)
AU (1) AU748597B2 (ja)
BR (1) BR9906706B1 (ja)
CA (1) CA2306098C (ja)
SG (1) SG101517A1 (ja)
WO (1) WO2000011646A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005157363A (ja) * 2003-11-21 2005-06-16 Samsung Electronics Co Ltd フォルマント帯域を利用したダイアログエンハンシング方法及び装置
WO2007029536A1 (ja) * 2005-09-02 2007-03-15 Nec Corporation 雑音抑圧の方法及び装置並びにコンピュータプログラム
JP2009020460A (ja) * 2007-07-13 2009-01-29 Yamaha Corp 音声処理装置およびプログラム
WO2012114628A1 (ja) * 2011-02-26 2012-08-30 日本電気株式会社 信号処理装置、信号処理方法、及び記憶媒体
WO2014084000A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
WO2014083999A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
JP2016504637A (ja) * 2013-01-29 2016-02-12 クゥアルコム・インコーポレイテッドQualcomm Incorporated 線形予測コーディングにおける適応型フォルマントシャープニングのためのシステム、方法、装置、及びコンピュータによって読み取り可能な媒体
JP2018063457A (ja) * 2014-05-01 2018-04-19 日本電信電話株式会社 復号装置、及びその方法、プログラム、記録媒体

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US7167828B2 (en) 2000-01-11 2007-01-23 Matsushita Electric Industrial Co., Ltd. Multimode speech coding apparatus and decoding apparatus
DE10026872A1 (de) * 2000-04-28 2001-10-31 Deutsche Telekom Ag Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector)
US6728669B1 (en) * 2000-08-07 2004-04-27 Lucent Technologies Inc. Relative pulse position in celp vocoding
JP3467469B2 (ja) 2000-10-31 2003-11-17 Necエレクトロニクス株式会社 音声復号装置および音声復号プログラムを記録した記録媒体
JP3558031B2 (ja) * 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
KR100566163B1 (ko) * 2000-11-30 2006-03-29 마츠시타 덴끼 산교 가부시키가이샤 음성 복호화 장치, 음성 복호화 방법 및 프로그램을기록한 기록 매체
JP3566220B2 (ja) 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US20020147585A1 (en) * 2001-04-06 2002-10-10 Poulsen Steven P. Voice activity detection
JP4231987B2 (ja) * 2001-06-15 2009-03-04 日本電気株式会社 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
KR20050025583A (ko) * 2002-07-08 2005-03-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 처리
US7658816B2 (en) * 2003-09-05 2010-02-09 Tokyo Electron Limited Focus ring and plasma processing apparatus
JP4698593B2 (ja) * 2004-07-20 2011-06-08 パナソニック株式会社 音声復号化装置および音声復号化方法
KR100677126B1 (ko) * 2004-07-27 2007-02-02 삼성전자주식회사 레코더 기기의 잡음 제거 장치 및 그 방법
US8265929B2 (en) * 2004-12-08 2012-09-11 Electronics And Telecommunications Research Institute Embedded code-excited linear prediction speech coding and decoding apparatus and method
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
US8352254B2 (en) * 2005-12-09 2013-01-08 Panasonic Corporation Fixed code book search device and fixed code book search method
CN101145345B (zh) * 2006-09-13 2011-02-09 华为技术有限公司 音频分类方法
CN101145343B (zh) * 2006-09-15 2011-07-20 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
EP3288029A1 (en) * 2008-01-16 2018-02-28 III Holdings 12, LLC Vector quantizer, vector inverse quantizer, and methods therefor
EP2109096B1 (en) * 2008-09-03 2009-11-18 Svox AG Speech synthesis with dynamic constraints
WO2010032405A1 (ja) * 2008-09-16 2010-03-25 パナソニック株式会社 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム
KR102296955B1 (ko) * 2010-07-02 2021-09-01 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터
WO2012005211A1 (ja) * 2010-07-05 2012-01-12 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体
ES2575693T3 (es) 2011-11-10 2016-06-30 Nokia Technologies Oy Un método y un aparato para detectar tasa de muestreo de audio
AU2014211520B2 (en) * 2013-01-29 2017-04-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-frequency emphasis for LPC-based coding in frequency domain
TWI615834B (zh) * 2013-05-31 2018-02-21 Sony Corp 編碼裝置及方法、解碼裝置及方法、以及程式
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
CN108028045A (zh) 2015-07-06 2018-05-11 诺基亚技术有限公司 用于音频信号解码器的位错误检测器
JP6803241B2 (ja) * 2017-01-13 2020-12-23 アズビル株式会社 時系列データ処理装置および処理方法
CN109887519B (zh) * 2019-03-14 2021-05-11 北京芯盾集团有限公司 提高语音信道数据传输准确性的方法
CN116806000B (zh) * 2023-08-18 2024-01-30 广东保伦电子股份有限公司 一种多通道任意扩展的分布式音频矩阵

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4802221A (en) * 1986-07-21 1989-01-31 Ncr Corporation Digital system and method for compressing speech signals for storage and transmission
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
JPH0398318A (ja) * 1989-09-11 1991-04-23 Fujitsu Ltd 音声符号化方式
EP1239456A1 (en) * 1991-06-11 2002-09-11 QUALCOMM Incorporated Variable rate vocoder
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
JPH06118993A (ja) 1992-10-08 1994-04-28 Kokusai Electric Co Ltd 有声/無声判定回路
JPH06180948A (ja) * 1992-12-11 1994-06-28 Sony Corp ディジタル信号処理装置又は方法、及び記録媒体
JPH08506434A (ja) * 1993-11-30 1996-07-09 エイ・ティ・アンド・ティ・コーポレーション 通信システムにおける伝送ノイズ低減
US5602961A (en) * 1994-05-31 1997-02-11 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding
GB2290201B (en) 1994-06-09 1998-03-04 Motorola Ltd Communications system
TW271524B (ja) * 1994-08-05 1996-03-01 Qualcomm Inc
JPH08179796A (ja) * 1994-12-21 1996-07-12 Sony Corp 音声符号化方法
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JPH10143195A (ja) 1996-11-14 1998-05-29 Olympus Optical Co Ltd ポストフィルタ
US6055619A (en) * 1997-02-07 2000-04-25 Cirrus Logic, Inc. Circuits, system, and methods for processing multiple data streams

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005157363A (ja) * 2003-11-21 2005-06-16 Samsung Electronics Co Ltd フォルマント帯域を利用したダイアログエンハンシング方法及び装置
US8489394B2 (en) 2005-09-02 2013-07-16 Nec Corporation Method, apparatus, and computer program for suppressing noise
WO2007029536A1 (ja) * 2005-09-02 2007-03-15 Nec Corporation 雑音抑圧の方法及び装置並びにコンピュータプログラム
US8233636B2 (en) 2005-09-02 2012-07-31 Nec Corporation Method, apparatus, and computer program for suppressing noise
US8477963B2 (en) 2005-09-02 2013-07-02 Nec Corporation Method, apparatus, and computer program for suppressing noise
JP2009020460A (ja) * 2007-07-13 2009-01-29 Yamaha Corp 音声処理装置およびプログラム
US9531344B2 (en) 2011-02-26 2016-12-27 Nec Corporation Signal processing apparatus, signal processing method, storage medium
WO2012114628A1 (ja) * 2011-02-26 2012-08-30 日本電気株式会社 信号処理装置、信号処理方法、及び記憶媒体
WO2014084000A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
WO2014083999A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
US9401746B2 (en) 2012-11-27 2016-07-26 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
US10447516B2 (en) 2012-11-27 2019-10-15 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
JP2016504637A (ja) * 2013-01-29 2016-02-12 クゥアルコム・インコーポレイテッドQualcomm Incorporated 線形予測コーディングにおける適応型フォルマントシャープニングのためのシステム、方法、装置、及びコンピュータによって読み取り可能な媒体
US10141001B2 (en) 2013-01-29 2018-11-27 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
JP2018063457A (ja) * 2014-05-01 2018-04-19 日本電信電話株式会社 復号装置、及びその方法、プログラム、記録媒体

Also Published As

Publication number Publication date
US6334105B1 (en) 2001-12-25
EP1024477B1 (en) 2017-03-15
AU748597B2 (en) 2002-06-06
WO2000011646A1 (fr) 2000-03-02
SG101517A1 (en) 2004-01-30
AU5442899A (en) 2000-03-14
BR9906706B1 (pt) 2015-02-10
KR100367267B1 (ko) 2003-01-14
BR9906706A (pt) 2000-08-08
KR20010031251A (ko) 2001-04-16
CA2306098A1 (en) 2000-03-02
CN1275228A (zh) 2000-11-29
JP4308345B2 (ja) 2009-08-05
CN1236420C (zh) 2006-01-11
CA2306098C (en) 2005-07-12
EP1024477A4 (en) 2002-04-24
EP1024477A1 (en) 2000-08-02

Similar Documents

Publication Publication Date Title
JP4308345B2 (ja) マルチモード音声符号化装置及び復号化装置
KR100487136B1 (ko) 음성복호화방법및장치
EP0770987B1 (en) Method and apparatus for reproducing speech signals, method and apparatus for decoding the speech, method and apparatus for synthesizing the speech and portable radio terminal apparatus
JP3557662B2 (ja) 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
JP3653826B2 (ja) 音声復号化方法及び装置
CN105825861B (zh) 确定加权函数的设备和方法以及量化设备和方法
JP3840684B2 (ja) ピッチ抽出装置及びピッチ抽出方法
JP4270866B2 (ja) 非音声のスピーチの高性能の低ビット速度コード化方法および装置
EP0837453B1 (en) Speech analysis method and speech encoding method and apparatus
KR100452955B1 (ko) 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체
US6047253A (en) Method and apparatus for encoding/decoding voiced speech based on pitch intensity of input speech signal
JPH08179796A (ja) 音声符号化方法
EP0843302A2 (en) Voice coder using sinusoidal analysis and pitch control
JP2003044099A (ja) ピッチ周期探索範囲設定装置及びピッチ周期探索装置
JP4954310B2 (ja) モード判定装置及びモード判定方法
KR101857799B1 (ko) 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
JP2001242899A (ja) 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP3785363B2 (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
KR100757366B1 (ko) Zinc 함수를 이용한 음성 부호화기 및 그의 표준파형추출 방법
KR100421816B1 (ko) 음성복호화방법 및 휴대용 단말장치
Saranya et al. Design of a VOCODER using instants of significant excitation
EP1164577A2 (en) Method and apparatus for reproducing speech signals

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090407

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090501

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130515

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130515

Year of fee payment: 4

EXPY Cancellation because of completion of term