JP4009781B2 - 音声処理装置及び音声符号化方法 - Google Patents
音声処理装置及び音声符号化方法 Download PDFInfo
- Publication number
- JP4009781B2 JP4009781B2 JP2003365983A JP2003365983A JP4009781B2 JP 4009781 B2 JP4009781 B2 JP 4009781B2 JP 2003365983 A JP2003365983 A JP 2003365983A JP 2003365983 A JP2003365983 A JP 2003365983A JP 4009781 B2 JP4009781 B2 JP 4009781B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- audio signal
- signal
- frequency
- entropy encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000012545 processing Methods 0.000 title claims description 36
- 238000000034 method Methods 0.000 title claims description 25
- 239000013598 vector Substances 0.000 claims description 83
- 230000005236 sound signal Effects 0.000 claims description 51
- 238000013139 quantization Methods 0.000 claims description 40
- 238000006243 chemical reaction Methods 0.000 claims description 28
- 238000012217 deletion Methods 0.000 claims description 9
- 230000037430 deletion Effects 0.000 claims description 9
- 238000009432 framing Methods 0.000 claims description 9
- 238000007906 compression Methods 0.000 description 18
- 230000006835 compression Effects 0.000 description 16
- 230000008569 process Effects 0.000 description 13
- 230000008707 rearrangement Effects 0.000 description 10
- 238000005070 sampling Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
前記エントロピー符号化により得られた音声信号のデータ量が、予め設定された目標データ量より大きいか否かを判定し、前記エントロピー符号化により得られた音声信号のデータ量が前記目標データ量より大きいと判定された場合、前記ベクトル量子化により得られた音声信号のうち、エネルギーが所定値以下の周波数帯域の音声信号を削除して、削除されなかった音声信号を再度符号化することを特徴とする。
まず、本実施形態における構成について説明する。
Fj={0,0,…,0}; |Fj|2<t (6)
以下では、本実施形態で適用されるエントロピー符号化の例として、ハフマン符号化、レンジコーダによる符号化について説明する。
ハフマン符号化とは、出現頻度の高い記号には短い符号を割り当て、出現頻度の低い記号には長い符号を割り当てることで、全体のデータ量を圧縮する方式である。例えば、4つの記号{a、b、c、d}からなる100文字のデータがあったとする。全ての記号に同じ長さの2進数の符号(固定長符号)を割り当てる場合、4つの記号を表すには2ビットが必要であるため、100文字のデータ量は、2[bit]×100=200[bit]となる。
符号化前の元信号に含まれる記号の集合をS={si|i=1,…,n}とし、各記号siの出現確率をpiとする。また、元信号に含まれる各記号siを予め決められた順番に並べ替えた記号列{s1、s2、…、sn}において、記号sk(k≧2)より前に並んでいる各記号の出現確率の合計をFkとする。即ち、Fkは、式(7)のように表される。
range'=range×pk (8)
low'=low+range×Fk (9)
式(8)及び式(9)で算出されたrange'、low'が、次の信号が入力されたときのrange、lowとなる。
fk’=fk+1 (14)
エントロピー符号化部8は、出現頻度fkの加算に伴い、cum、出現確率pi、Fiを再計算し、生起確率テーブル81を更新する。エントロピー符号化部8は、これらの処理を、入力信号がなくなるまで行い、最後の信号が入力されたときに算出されたrange、lowに基づいて決定される範囲low〜low+rangeの間の値を符号値として出力する。
まず、図10のフローチャートを参照して、音声処理装置100において実行される音声圧縮処理について説明する。以下のフローチャートでは、エントロピー符号化として、レンジコーダによる符号化が用いられる場合を示す。
2 DC除去部
3 フレーム化部
4 レベル調整部
5 周波数変化部
6 周波数並べ替え部
7 ベクトル量子化部
7a 高域用VQテーブル(第1のテーブル)
7b 低域用VQテーブル(第2のテーブル)
8 エントロピー符号化部
81 生起確率テーブル
9 レートコントローラ(判定部)
10 データ削除部
100 音声処理装置
Claims (8)
- 入力された音声信号をフレームに分割するフレーム化部と、
前記フレーム化部により得られたフレーム毎に、フレームに含まれる音声信号の振幅の最大値に基づいて音声信号のレベルを調整するレベル調整部と、
前記レベル調整部によりレベルが調整された音声信号に対し、1フレームの信号について複数のブロックに分けて周波数変換を施す周波数変換部と、
前記周波数変換により各ブロックから得られた1フレーム分の周波数変換係数について、同一周波数帯域の係数をまとめてベクトル化して、ベクトル量子化を施すベクトル量子化部と、
前記ベクトル量子化により得られた音声信号に対し、エントロピー符号化を施すエントロピー符号化部と、
前記エントロピー符号化により得られた音声信号のデータ量が、予め設定された目標データ量より大きいか否かを判定する判定部と、
前記判定部により、前記エントロピー符号化により得られた音声信号のデータ量が前記目標データ量より大きいと判定された場合、前記ベクトル量子化により得られた音声信号のうち、エネルギーが所定値以下の周波数帯域の音声信号を削除するデータ削除部と、
を備え、
前記エントロピー符号化部は前記データ削除部で削除されなかった音声信号を再度符号化することを特徴とする音声処理装置。 - 前記周波数変換部は、周波数変換として変形離散コサイン変換を用いることを特徴とする請求項1に記載の音声処理装置。
- 高域周波数用の音声パターンを示すベクトルを格納した第1のテーブルと、
低域周波数用の音声パターンを示すベクトルを格納した第2のテーブルと、を備え、
前記ベクトル量子化部は、前記第1のテーブルと前記第2のテーブルを用いてベクトル量子化を行うことを特徴とする請求項1又は2に記載の音声処理装置。 - 周波数帯域別に、音声パターンを示すベクトルを格納したテーブルを備え、
前記ベクトル量子化部は、前記テーブルを用いてベクトル量子化を行うことを特徴とする請求項1又は2に記載の音声処理装置。 - 前記エントロピー符号化部は、エントロピー符号化としてハフマン符号化を用いることを特徴とする請求項1〜4の何れか一項に記載の音声処理装置。
- 前記エントロピー符号化部は、エントロピー符号化としてレンジコーダによる符号化を用いることを特徴とする請求項1〜4の何れか一項に記載の音声処理装置。
- 前記エントロピー符号化部は、入力信号を示す各記号の出現確率を格納した生起確率テーブルを有し、記号の入力に伴って前記生起確率テーブルを更新することを特徴とする請求項6に記載の音声処理装置。
- 入力された音声信号をフレームに分割し、
フレーム毎に、フレームに含まれる音声信号の振幅の最大値に基づいて音声信号のレベルを調整し、
レベルが調整された音声信号に対し、1フレームの信号について複数のブロックに分けて周波数変換を施し、
前記周波数変換により各ブロックから得られた1フレーム分の周波数変換係数について、同一周波数帯域の係数をまとめてベクトル化して、ベクトル量子化を施し、
前記ベクトル量子化により得られた音声信号に対し、エントロピー符号化を施し、
前記エントロピー符号化により得られた音声信号のデータ量が、予め設定された目標データ量より大きいか否かを判定し、前記エントロピー符号化により得られた音声信号のデータ量が前記目標データ量より大きいと判定された場合、前記ベクトル量子化により得られた音声信号のうち、エネルギーが所定値以下の周波数帯域の音声信号を削除して、削除されなかった音声信号を再度符号化することを特徴とする音声符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003365983A JP4009781B2 (ja) | 2003-10-27 | 2003-10-27 | 音声処理装置及び音声符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003365983A JP4009781B2 (ja) | 2003-10-27 | 2003-10-27 | 音声処理装置及び音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005128404A JP2005128404A (ja) | 2005-05-19 |
JP4009781B2 true JP4009781B2 (ja) | 2007-11-21 |
Family
ID=34644473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003365983A Expired - Lifetime JP4009781B2 (ja) | 2003-10-27 | 2003-10-27 | 音声処理装置及び音声符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4009781B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
JP4548348B2 (ja) * | 2006-01-18 | 2010-09-22 | カシオ計算機株式会社 | 音声符号化装置及び音声符号化方法 |
JP5098458B2 (ja) * | 2007-06-20 | 2012-12-12 | カシオ計算機株式会社 | 音声符号化装置、音声符号化方法、及び、プログラム |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
JP4978539B2 (ja) * | 2008-04-07 | 2012-07-18 | カシオ計算機株式会社 | 符号化装置、符号化方法及びプログラム。 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2914974B2 (ja) * | 1987-02-27 | 1999-07-05 | 株式会社日立製作所 | 可変レート音声信号伝送方法および伝送システム |
JPH0365822A (ja) * | 1989-08-04 | 1991-03-20 | Fujitsu Ltd | ベクトル量子化符号器及びベクトル量子化復号器 |
JP2811810B2 (ja) * | 1989-10-05 | 1998-10-15 | ソニー株式会社 | 信号符号化装置 |
JP3193515B2 (ja) * | 1993-03-11 | 2001-07-30 | 株式会社日立国際電気 | 音声符号化通信方式及びその装置 |
JP3131542B2 (ja) * | 1993-11-25 | 2001-02-05 | シャープ株式会社 | 符号化復号化装置 |
JPH07183854A (ja) * | 1993-12-24 | 1995-07-21 | Matsushita Electric Ind Co Ltd | 音声圧縮データ編集装置 |
JP3159012B2 (ja) * | 1995-10-26 | 2001-04-23 | 日本ビクター株式会社 | 音響信号の符号化装置及び復号化装置 |
JP3132456B2 (ja) * | 1998-03-05 | 2001-02-05 | 日本電気株式会社 | 階層的画像符号化方式、及び階層的画像復号方式 |
JP4618823B2 (ja) * | 1998-10-22 | 2011-01-26 | ソニー株式会社 | 信号符号化装置及び方法 |
JP3557164B2 (ja) * | 2000-09-18 | 2004-08-25 | 日本電信電話株式会社 | オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体 |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
-
2003
- 2003-10-27 JP JP2003365983A patent/JP4009781B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005128404A (ja) | 2005-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5048697B2 (ja) | 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体 | |
CN1905010B (zh) | 编码音频数据的设备和方法及解码音频数据的设备和方法 | |
US7599833B2 (en) | Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same | |
KR100840439B1 (ko) | 음성부호화장치 및 음성복호장치 | |
KR100904605B1 (ko) | 음성부호화장치, 음성복호장치, 음성부호화방법 및음성복호방법 | |
JP3636094B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP4978539B2 (ja) | 符号化装置、符号化方法及びプログラム。 | |
JP4009781B2 (ja) | 音声処理装置及び音声符号化方法 | |
JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
US20090210219A1 (en) | Apparatus and method for coding and decoding residual signal | |
JP4259401B2 (ja) | 音声処理装置及び音声符号化方法 | |
JP5539992B2 (ja) | レート制御装置、レート制御方法及びレート制御プログラム | |
JP4626261B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP4054919B2 (ja) | 音声処理装置及び音声符号化方法 | |
JP2005128401A (ja) | 音声処理装置及び音声符号化方法 | |
JP4373693B2 (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JPH05265487A (ja) | 高能率符号化方法 | |
JP2002091497A (ja) | オーディオ信号符号化方法、復号化方法及びそれらの方法を実行するプログラム記憶媒体 | |
JP2712925B2 (ja) | 音声処理装置 | |
JP3453116B2 (ja) | 音声符号化方法及び装置 | |
JP4024185B2 (ja) | デジタルデータ符号化装置 | |
JP2006126592A (ja) | 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法 | |
JP2010532489A (ja) | デジタルオーディオ信号の符号化 | |
JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
JP5098458B2 (ja) | 音声符号化装置、音声符号化方法、及び、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070807 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070820 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4009781 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100914 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100914 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110914 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120914 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130914 Year of fee payment: 6 |
|
EXPY | Cancellation because of completion of term |