JP5098458B2 - 音声符号化装置、音声符号化方法、及び、プログラム - Google Patents
音声符号化装置、音声符号化方法、及び、プログラム Download PDFInfo
- Publication number
- JP5098458B2 JP5098458B2 JP2007162359A JP2007162359A JP5098458B2 JP 5098458 B2 JP5098458 B2 JP 5098458B2 JP 2007162359 A JP2007162359 A JP 2007162359A JP 2007162359 A JP2007162359 A JP 2007162359A JP 5098458 B2 JP5098458 B2 JP 5098458B2
- Authority
- JP
- Japan
- Prior art keywords
- index
- unit
- vector
- vector quantization
- code length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
デジタル音声信号を、所定の時間区間であるフレーム毎のデジタル音声信号であるフレーム化デジタル音声信号に分割するフレーム化部と、
前記フレーム化デジタル音声信号を周波数変換して、前記フレーム毎にデジタルスペクトルを生成する周波数変換部と、
エネルギーの大きさの順に代表ベクトルにインデックスが付され、かつ、エネルギーが等しい代表ベクトルについては、ベクトルの成分を番号で示す場合に、絶対値が最大の成分を示す番号が番号の大きさ順に並ぶようにソートされてインデックスが付されたベクトル量子化テーブルと、
前記ベクトル量子化テーブルを用いて前記デジタルスペクトルをベクトル量子化することにより、該デジタルスペクトルに対応する前記インデックスを求めるベクトル量子化部と、
前記ベクトル量子化部により求められたインデックスを、該インデックスに対応する前記フレームに関連付けて記憶するインデックス記憶部と、
前記ベクトル量子化部により求められたインデックスを前記ベクトル量子化部から取得するとともに、該インデックスに対応する前記フレームよりも時間的に過去の前記フレームに関連付けられて前記インデックス記憶部に記憶されているインデックスを前記インデックス記憶部から取得し、取得した両インデックスの差分を算出するインデックス差分算出部と、
前記インデックス差分算出部により算出された差分をエントロピ符号化することにより符号を生成する符号化部と、
を備える。
まず、時間領域の信号としての音声信号と、周波数領域の信号としての音声信号すなわちスペクトルと、の対応関係について説明する。なお、以下では原則として、単に音声信号というときは実時間領域の信号としての音声信号を指すものとする。
shift_bit=0(n≦Nの場合)、shift_bit=n-N(n>Nの場合)
ei=(Xt、j、0- vi、0)^2+(Xt、j、1- vi、1)^2+・・・+(Xt、j、k- vi、k)^2
ただし、記号「^」は、累乗を表す。
E(V1)≦E(V2)≦・・・≦E(ViMAX)
である。ここで、エネルギーE(Vi)は、
E(Vi)=|Vi|^2=vi、0 ^2+vi、1 ^2+・・・+vi、L-1 ^2
のように定義する。本実施形態においては、このようにソート済の代表ベクトルを格納したVQテーブルを用いることにする。
Δi(t、j)=i(t、j)-i(t-Δt、j)
により求める。そして、インデックス差分算出部45は、図6(e)に示すように、求めたインデックス差分Δi(t、j)を出力する。出力先は、図4及び図5に示すとおり、エントロピ符号化部35である。
E(Ft、j)=|Ft、j|^2=Xt、j、0 ^2+Xt、j、1 ^2+・・・+Xt、j、L-1 ^2
のように定義し、エネルギーE(Ft、j)が小さい周波数jに対応する帯域を優先して削除することにする。なお、周波数jに対応する帯域の削除は、具体的には、例えば、ベクトルFt、jの全ての成分を0に置換することによって行う。
以下では、本発明の実施形態2に係る音声符号化兼復号装置について述べる。本実施形態は、実施形態1に係る音声符号化兼復号装置3のROM123にデータベースとして格納されている低域用ソート済VQテーブル41及び高域用ソート済VQテーブル43を、符号化の効率がさらに向上するよう改良した他は、実施形態1と同じである。
E(V1)≦E(V2)≦・・・≦E(ViMAX)
という関係が成立することが課されていた。しかし、複数の代表ベクトルがたまたま同じエネルギーを有している場合に、かかる複数の代表ベクトルにそれぞれどのようにインデックスを付すかについては、特に制限は存在しなかった。
Vi1={vi1、0、vi1、1、・・・、vi1、k[i1、MAX]、・・・、vi1、L-1}、
Vi2={vi2、0、vi2、1、・・・、vi2、k[i2、MAX]、・・・、vi2、L-1}、
・・・、
Vip={vip、0、vip、1、・・・、vip、k[ip、MAX]、・・・、vip、L-1}
(ただし、vi、k[i、MAX]は、Viの成分のうちの、絶対値が最大の成分を表す。)
に、i1<i2<・・・<ipとなるようなインデックスを付す場合は、
k[i1、MAX]≦k[i2、MAX]≦・・・≦k[ip、MAX]
が成立するようにする。
E(V1)<E(V2)<・・・<E(V14)
かつ、E(V14)がV1、V2、・・・、V14以外のどの代表ベクトルのエネルギーよりも小さい、とする。さらに、同じくエネルギーの昇順に19番目の代表ベクトルから最大のエネルギーを有する代表ベクトルまでについても、前記制約に基づき、付すべきインデックスが確定したとする。すなわち、
E(V19)<E(V20)<・・・<E(ViMAX)
かつ、E(V19)がV19、V20、・・・、ViMAX以外のどの代表ベクトルのエネルギーよりも大きい、とする。さらに、全ての代表ベクトルからV1、V2、・・・、V14、V19、V20、・・・、ViMAXを除いた場合に残る4個の代表ベクトルが、等しいエネルギーを有するものとする。すると、該4個の代表ベクトルには、15から18までの4個のインデックスを付すべきことは確定するものの、どの代表ベクトルにインデックスとして15を付し、どの代表ベクトルに16を付し、・・・、どの代表ベクトルに18を付すかについては、実施形態1においては、任意であった。前記制約が不等号による制約であるために、該4個の代表ベクトルにどのようにインデックスを付しても、E(V15)=E(V16)=E(V17)=E(V18)となって前記制約を満たすからである。
Claims (11)
- デジタル音声信号を、所定の時間区間であるフレーム毎のデジタル音声信号であるフレーム化デジタル音声信号に分割するフレーム化部と、
前記フレーム化デジタル音声信号を周波数変換して、前記フレーム毎にデジタルスペクトルを生成する周波数変換部と、
エネルギーの大きさの順に代表ベクトルにインデックスが付され、かつ、エネルギーが等しい代表ベクトルについては、ベクトルの成分を番号で示す場合に、絶対値が最大の成分を示す番号が番号の大きさ順に並ぶようにソートされてインデックスが付されたベクトル量子化テーブルと、
前記ベクトル量子化テーブルを用いて前記デジタルスペクトルをベクトル量子化することにより、該デジタルスペクトルに対応する前記インデックスを求めるベクトル量子化部と、
前記ベクトル量子化部により求められたインデックスを、該インデックスに対応する前記フレームに関連付けて記憶するインデックス記憶部と、
前記ベクトル量子化部により求められたインデックスを前記ベクトル量子化部から取得するとともに、該インデックスに対応する前記フレームよりも時間的に過去の前記フレームに関連付けられて前記インデックス記憶部に記憶されているインデックスを前記インデックス記憶部から取得し、取得した両インデックスの差分を算出するインデックス差分算出部と、
前記インデックス差分算出部により算出された差分をエントロピ符号化することにより符号を生成する符号化部と、
を備える音声符号化装置。 - 前記インデックス差分算出部は、
前記ベクトル量子化部により求められたインデックスを前記ベクトル量子化部から取得するとともに、該インデックスに対応する前記フレームの時間的に直前の前記フレームに関連付けられて前記インデックス記憶部に記憶されているインデックスを前記インデックス記憶部から取得し、取得した両インデックスの差分を算出する、
ことを特徴とする請求項1に記載の音声符号化装置。 - 前記ベクトル量子化テーブルは、
複数の帯域別テーブルを備え、
前記帯域別テーブルは、
それぞれが特定の帯域であるテーブル用帯域に関連付けられるとともに該テーブル用帯域における典型的な音声スペクトルパターンと整合する代表ベクトルから構成される、
ことを特徴とし、
前記ベクトル量子化部は、
前記デジタルスペクトルを前記テーブル用帯域と同じ又はより細分された帯域である量子化用帯域毎にベクトル量子化するとともに、前記量子化用帯域毎にベクトル量子化するに際して該量子化帯域が含まれる前記テーブル用帯域に対応する前記帯域別テーブルを用いる、
ことを特徴とする請求項1又は2に記載の音声符号化装置。 - 前記符号化部が生成した符号の符号長を求め、該符号長が予め設定された目標符号長以下であるか否かを判別する符号長監視部をさらに備え、
前記符号化部は、
前記符号長監視部により前記符号長が前記目標符号長より長いと判別された場合には、所定の削除用帯域に区分された前記デジタルスペクトルのうち相対的にエネルギーの低い削除用帯域に対応する部分をエントロピ符号化の対象から除外した後に再びエントロピ符号化する、
ことを特徴とする請求項1乃至3の何れか1項に記載の音声符号化装置。 - 前記周波数変換部は、
前記フレーム化デジタル音声信号を変形離散コサイン変換して、前記フレーム毎に前記デジタルスペクトルを生成する、
ことを特徴とする請求項1乃至4の何れか1項に記載の音声符号化装置。 - デジタル音声信号を、所定の時間区間であるフレーム毎のデジタル音声信号であるフレーム化デジタル音声信号に分割するフレーム化ステップと、
前記フレーム化デジタル音声信号を周波数変換して、前記フレーム毎にデジタルスペクトルを生成する周波数変換ステップと、
エネルギーの大きさの順に代表ベクトルにインデックスが付され、かつ、エネルギーが等しい代表ベクトルについては、ベクトルの成分を番号で示す場合に、絶対値が最大の成分を示す番号が番号の大きさ順に並ぶようにソートされてインデックスが付されたベクトル量子化テーブルを用いて前記デジタルスペクトルをベクトル量子化することにより、該デジタルスペクトルに対応する前記インデックスを求めるベクトル量子化ステップと、
前記ベクトル量子化ステップにより求められたインデックスを、該インデックスに対応する前記フレームに関連付けて記憶するインデックス記憶ステップと、
前記ベクトル量子化ステップにより求められたインデックスを前記ベクトル量子化ステップから取得するとともに、該インデックスに対応する前記フレームよりも時間的に過去の前記フレームに関連付けられて過去の前記インデックス記憶ステップで記憶したインデックスを取得し、取得した両インデックスの差分を算出するインデックス差分算出ステップと、
前記インデックス差分算出ステップにより算出された差分をエントロピ符号化することにより符号を生成する符号化ステップと、
から構成される音声符号化方法。 - 前記インデックス差分算出ステップは、
前記ベクトル量子化ステップにより求められたインデックスを取得するとともに、該インデックスに対応する前記フレームの時間的に直前の前記フレームに関連付けられて前記インデックス記憶ステップで記憶されたインデックスを取得し、取得した両インデックスの差分を算出する、
ことを特徴とする請求項6に記載の音声符号化方法。 - 前記符号化ステップが生成した符号の符号長を求め、該符号長が予め設定された目標符号長以下であるか否かを判別する符号長監視ステップをさらに備え、
前記符号化ステップは、
前記符号長監視ステップにより前記符号長が前記目標符号長より長いと判別された場合には、所定の削除用帯域に区分された前記デジタルスペクトルのうち相対的にエネルギーの低い削除用帯域に対応する部分をエントロピ符号化の対象から除外した後に再びエントロピ符号化する、
ことを特徴とする請求項6又は7に記載の音声符号化方法。 - コンピュータに、
デジタル音声信号を、所定の時間区間であるフレーム毎のデジタル音声信号であるフレーム化デジタル音声信号に分割するフレーム化ステップと、
前記フレーム化デジタル音声信号を周波数変換して、前記フレーム毎にデジタルスペクトルを生成する周波数変換ステップと、
エネルギーの大きさの順に代表ベクトルにインデックスが付され、かつ、エネルギーが等しい代表ベクトルについては、ベクトルの成分を番号で示す場合に、絶対値が最大の成分を示す番号が番号の大きさ順に並ぶようにソートされてインデックスが付されたベクトル量子化テーブルを用いて前記デジタルスペクトルをベクトル量子化することにより、該デジタルスペクトルに対応する前記インデックスを求めるベクトル量子化ステップと、
前記ベクトル量子化ステップにより求められたインデックスを、該インデックスに対応する前記フレームに関連付けて記憶するインデックス記憶ステップと、
前記ベクトル量子化ステップにより求められたインデックスを前記ベクトル量子化ステップから取得するとともに、該インデックスに対応する前記フレームよりも時間的に過去の前記フレームに関連付けられて過去の前記インデックス記憶ステップで記憶したインデックスを取得し、取得した両インデックスの差分を算出するインデックス差分算出ステップと、
前記インデックス差分算出ステップにより算出された差分をエントロピ符号化することにより符号を生成する符号化ステップと、
を実行させるプログラム。 - 前記インデックス差分算出ステップは、
前記ベクトル量子化ステップにより求められたインデックスを取得するとともに、該インデックスに対応する前記フレームの時間的に直前の前記フレームに関連付けられて前記インデックス記憶ステップで記憶されたインデックスを取得し、取得した両インデックスの差分を算出する、
ことを特徴とする請求項9に記載のプログラム。 - 前記符号化ステップが生成した符号の符号長を求め、該符号長が予め設定された目標符号長以下であるか否かを判別する符号長監視ステップをさらに備え、
前記符号化ステップは、
前記符号長監視ステップにより前記符号長が前記目標符号長より長いと判別された場合には、所定の削除用帯域に区分された前記デジタルスペクトルのうち相対的にエネルギーの低い削除用帯域に対応する部分をエントロピ符号化の対象から除外した後に再びエントロピ符号化する、
ことを特徴とする請求項9又は10に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007162359A JP5098458B2 (ja) | 2007-06-20 | 2007-06-20 | 音声符号化装置、音声符号化方法、及び、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007162359A JP5098458B2 (ja) | 2007-06-20 | 2007-06-20 | 音声符号化装置、音声符号化方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009003078A JP2009003078A (ja) | 2009-01-08 |
JP5098458B2 true JP5098458B2 (ja) | 2012-12-12 |
Family
ID=40319556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007162359A Expired - Fee Related JP5098458B2 (ja) | 2007-06-20 | 2007-06-20 | 音声符号化装置、音声符号化方法、及び、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5098458B2 (ja) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3159012B2 (ja) * | 1995-10-26 | 2001-04-23 | 日本ビクター株式会社 | 音響信号の符号化装置及び復号化装置 |
JPH10200890A (ja) * | 1997-01-09 | 1998-07-31 | Matsushita Electric Ind Co Ltd | 画像符号化方法 |
JP3483513B2 (ja) * | 2000-03-02 | 2004-01-06 | 沖電気工業株式会社 | 音声録音再生装置 |
KR100844810B1 (ko) * | 2000-12-22 | 2008-07-09 | 소니 가부시끼 가이샤 | 부호화 장치 및 복호 장치 |
JP4009781B2 (ja) * | 2003-10-27 | 2007-11-21 | カシオ計算機株式会社 | 音声処理装置及び音声符号化方法 |
KR100755471B1 (ko) * | 2005-07-19 | 2007-09-05 | 한국전자통신연구원 | 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법 |
WO2007011157A1 (en) * | 2005-07-19 | 2007-01-25 | Electronics And Telecommunications Research Institute | Virtual source location information based channel level difference quantization and dequantization method |
-
2007
- 2007-06-20 JP JP2007162359A patent/JP5098458B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009003078A (ja) | 2009-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1942928B (zh) | 用于处理音频信号的模块和方法 | |
JP4731775B2 (ja) | スーパーフレーム構造のlpcハーモニックボコーダ | |
EP2272062B1 (en) | An audio signal classifier | |
US7599833B2 (en) | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same | |
US9741352B2 (en) | Method and apparatus for processing an audio signal | |
MXPA05006664A (es) | Metodo y dispositivo para la cuantizacion robusta de vector predictivo de parametros de prediccion lineal en la codificacion de conversacion a velocidad variable de bits. | |
JP6204501B2 (ja) | 高周波帯域信号を予測するための方法、符号化デバイス、および復号デバイス | |
JP4978539B2 (ja) | 符号化装置、符号化方法及びプログラム。 | |
KR20070070189A (ko) | 음성 부호화 장치 및 음성 부호화 방법 | |
JP4800645B2 (ja) | 音声符号化装置、及び音声符号化方法 | |
JPWO2006041055A1 (ja) | スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法 | |
JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
US20090210219A1 (en) | Apparatus and method for coding and decoding residual signal | |
JP2001507822A (ja) | スピーチ信号のエンコード方法 | |
EP1121686B1 (en) | Speech parameter compression | |
KR101804922B1 (ko) | 오디오 신호 처리 방법 및 장치 | |
JP3297749B2 (ja) | 符号化方法 | |
Raad et al. | Scalable to lossless audio compression based on perceptual set partitioning in hierarchical trees (PSPIHT) | |
JP5098458B2 (ja) | 音声符号化装置、音声符号化方法、及び、プログラム | |
JP4009781B2 (ja) | 音声処理装置及び音声符号化方法 | |
JP4091506B2 (ja) | 2段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体 | |
JPH05265487A (ja) | 高能率符号化方法 | |
JP2002091497A (ja) | オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体 | |
JP2712925B2 (ja) | 音声処理装置 | |
JP3453116B2 (ja) | 音声符号化方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100521 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120828 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120910 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151005 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5098458 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |