JP5224666B2 - オーディオ符号化装置 - Google Patents
オーディオ符号化装置 Download PDFInfo
- Publication number
- JP5224666B2 JP5224666B2 JP2006244578A JP2006244578A JP5224666B2 JP 5224666 B2 JP5224666 B2 JP 5224666B2 JP 2006244578 A JP2006244578 A JP 2006244578A JP 2006244578 A JP2006244578 A JP 2006244578A JP 5224666 B2 JP5224666 B2 JP 5224666B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- code amount
- unit
- loop
- loop control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013139 quantization Methods 0.000 claims description 107
- 238000001228 spectrum Methods 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 10
- 230000005236 sound signal Effects 0.000 claims description 4
- 238000000034 method Methods 0.000 description 23
- 238000012545 processing Methods 0.000 description 18
- 230000003044 adaptive effect Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 8
- 239000000470 constituent Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
この発明は上記の問題を解決すべくなされたもので、量子化ステップサイズの探索回数を削減して平均処理量を軽減するとともに、探索精度を向上させたオーディオ符号化装置を提供することを目的とする。
図1は、この発明の一実施形態に係わるオーディオ符号化装置の構成を示すものである。この例では、AAC(Advanced Audio Coding)エンコーダを例に挙げて説明する。このオーディオ符号化装置は、ブロック切替判定部10と、時間/周波数変換部20と、許容誤差算出部30と、レート制御部40と、スケールファクタ決定部50と、量子化制御部60と、フォーマット部70とを備えている。
まず、ステップ3aでは、量子化ループ制御部64において、初期設定として、ループ回数を示すパラメータnum_loopに初期値「1」を設定し、ステップ3bに移行する。
その他、この発明の要旨を逸脱しない範囲で種々の変形を施しても同様に実施可能であることはいうまでもない。
Claims (5)
- オーディオ信号を時間領域の信号から周波数領域の周波数スペクトラムに変換する変換手段と、
前記周波数スペクトラムに基づいてターゲット符号量を求める第1検出手段と、
前記周波数スペクトラムに基づいてスケールファクタを求める第2検出手段と、
量子化手段と、第3検出手段と、補正手段とを備え、これらがループを形成してループ制御を行うループ制御手段と、
を具備し、
前記量子化手段は、前記補正手段で補正された量子化ステップサイズと前記スケールファクタとに基づいて、前記周波数スペクトラムを量子化して量子化データを得て、
前記第3検出手段は、前記ループ制御毎に前記量子化手段によって得られる量子化データに基づいて、このデータの符号量の変化量を求め、
前記補正手段は、前記量子化データの符号量と前記ターゲット符号量との差分を前記第3検出手段が求めた変化量で除して補正値を得て、前記量子化手段で用いる量子化ステップサイズを補正する
オーディオ符号化装置。 - さらに、前記ループ制御毎に、前記量子化データの符号量と前記ターゲット符号量の大小関係を検出する第4検出手段を備え、
前記補正手段は、前記大小関係が逆転した場合に、この逆転の基となったループ制御で用いた量子化ステップサイズの補正値の2分値と、前記量子化データの符号量と前記ターゲット符号量との差分を前記第3検出手段が求めた変化量で除して得た補正値とのうち、その大きさが小さい方の値に基づいて、前記量子化手段で用いる量子化ステップサイズを補正する
請求項1に記載のオーディオ符号化装置。 - さらに、前記ループ制御毎に、前記量子化データの符号量と前記ターゲット符号量の大小関係を検出する第4検出手段と、
前記大小関係が逆転する前の量子化データを求めるのに用いた量子化ステップサイズと、前記大小関係が逆転した後の量子化データを求めるのに用いた量子化ステップサイズとを記憶する記憶手段と、
前記ループ制御の実施回数を検出する第5検出手段と、
前記実施回数が予め設定した値を超えた場合に、前記記憶手段が記憶する量子化ステップサイズに基づく値を両端点とした2分探索により、量子化ステップサイズを決定する2分探索手段と、
を備える請求項1に記載のオーディオ符号化装置。 - 前記ループ制御手段は、前記量子化データの符号量と前記ターゲット符号量との差分が予め設定した値よりも大きい場合に、前記ループ制御を実施し、一方、前記差分が予め設定した値以下の場合には、前記ループ制御を終了する
請求項1に記載のオーディオ符号化装置。 - さらに、前記周波数スペクトラムと前記スケールファクタとに基づいて、前記量子化ステップサイズの稼働範囲を限定する限定手段を備え、
前記補正手段は、前記限定手段が限定した可動範囲内で、前記量子化ステップサイズを補正する
請求項1に記載のオーディオ符号化装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006244578A JP5224666B2 (ja) | 2006-09-08 | 2006-09-08 | オーディオ符号化装置 |
US11/647,972 US20080065376A1 (en) | 2006-09-08 | 2007-01-02 | Audio encoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006244578A JP5224666B2 (ja) | 2006-09-08 | 2006-09-08 | オーディオ符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008065162A JP2008065162A (ja) | 2008-03-21 |
JP5224666B2 true JP5224666B2 (ja) | 2013-07-03 |
Family
ID=39170860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006244578A Expired - Fee Related JP5224666B2 (ja) | 2006-09-08 | 2006-09-08 | オーディオ符号化装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20080065376A1 (ja) |
JP (1) | JP5224666B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101078378B1 (ko) * | 2009-03-04 | 2011-10-31 | 주식회사 코아로직 | 오디오 부호화기의 양자화 방법 및 장치 |
JP2010281965A (ja) * | 2009-06-03 | 2010-12-16 | Sony Corp | 量子化装置、再生装置、量子化方法およびプログラム |
JP5942463B2 (ja) | 2012-02-17 | 2016-06-29 | 株式会社ソシオネクスト | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
JP5635213B2 (ja) * | 2012-03-28 | 2014-12-03 | 日本電信電話株式会社 | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
KR101762210B1 (ko) * | 2012-05-30 | 2017-07-27 | 니폰 덴신 덴와 가부시끼가이샤 | 부호화 방법, 부호화 장치, 프로그램 및 기록 매체 |
WO2013187498A1 (ja) * | 2012-06-15 | 2013-12-19 | 日本電信電話株式会社 | 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体 |
CN104301064B (zh) | 2013-07-16 | 2018-05-04 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
CN105225666B (zh) * | 2014-06-25 | 2016-12-28 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
EP3770823A4 (en) * | 2019-06-12 | 2021-01-27 | Shanghai Cambricon Information Technology Co., Ltd | QUANTIFICATION PARAMETER DETERMINATION PROCESS FOR NEURONAL NETWORK, AND RELATED PRODUCT |
CN111951815B (zh) * | 2020-08-08 | 2023-10-10 | 北京百瑞互联技术有限公司 | 一种优化lc3编码器的量化全局增益序号搜索方法和系统 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3784993B2 (ja) * | 1998-06-26 | 2006-06-14 | 株式会社リコー | 音響信号の符号化・量子化方法 |
JP2001306095A (ja) * | 2000-04-18 | 2001-11-02 | Mitsubishi Electric Corp | オーディオ符号化装置及びオーディオ符号化方法 |
US6678648B1 (en) * | 2000-06-14 | 2004-01-13 | Intervideo, Inc. | Fast loop iteration and bitstream formatting method for MPEG audio encoding |
JP2002311993A (ja) * | 2001-04-17 | 2002-10-25 | Mitsubishi Electric Corp | オーディオ符号化装置 |
JP4528924B2 (ja) * | 2001-09-26 | 2010-08-25 | 学校法人東海大学 | 量子化ステップパラメータ初期値決定装置および量子化ステップパラメータ初期値決定方法、並びに量子化ステップパラメータ初期値決定プログラム |
US6950794B1 (en) * | 2001-11-20 | 2005-09-27 | Cirrus Logic, Inc. | Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7027982B2 (en) * | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
JP2004021153A (ja) * | 2002-06-20 | 2004-01-22 | Toshiba Corp | オーディオ信号符号化装置 |
US20040002859A1 (en) * | 2002-06-26 | 2004-01-01 | Chi-Min Liu | Method and architecture of digital conding for transmitting and packing audio signals |
US20040230425A1 (en) * | 2003-05-16 | 2004-11-18 | Divio, Inc. | Rate control for coding audio frames |
JP4639073B2 (ja) * | 2004-11-18 | 2011-02-23 | キヤノン株式会社 | オーディオ信号符号化装置および方法 |
-
2006
- 2006-09-08 JP JP2006244578A patent/JP5224666B2/ja not_active Expired - Fee Related
-
2007
- 2007-01-02 US US11/647,972 patent/US20080065376A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2008065162A (ja) | 2008-03-21 |
US20080065376A1 (en) | 2008-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5224666B2 (ja) | オーディオ符号化装置 | |
JP4548348B2 (ja) | 音声符号化装置及び音声符号化方法 | |
AU2018260836B2 (en) | Encoder, decoder, system and methods for encoding and decoding | |
EP3924963B1 (en) | Decoder and decoding method for lc3 concealment including partial frame loss concealment | |
KR102069493B1 (ko) | 고급 양자화기 | |
US11386909B2 (en) | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits | |
EP2012306A1 (en) | Encoding method and encoding device | |
US10756755B2 (en) | Adaptive audio codec system, method and article | |
US10699725B2 (en) | Adaptive audio encoder system, method and article | |
JP2010145593A (ja) | 情報符号化装置 | |
JP5045295B2 (ja) | 信号処理装置及び方法、並びにプログラム | |
US20170330575A1 (en) | Adaptive audio codec system, method and article | |
CN101226744B (zh) | 语音解码器中实现语音解码的方法及装置 | |
US8331437B2 (en) | Coding apparatus, coding method, coding program and recording medium | |
JP7005036B2 (ja) | 適応オーディオコーデックシステム、方法および媒体 | |
US10504531B2 (en) | Audio parameter quantization | |
JP3630082B2 (ja) | オーディオ信号符号化方法及びその装置 | |
JP6079230B2 (ja) | 付加情報挿入装置、付加情報挿入方法、付加情報挿入プログラム、付加情報抽出装置、付加情報抽出方法、及び付加情報抽出プログラム | |
JP6629256B2 (ja) | 符号化装置、方法及びプログラム | |
JP2008203739A (ja) | オーディオビットレート変換方法および装置 | |
JP2006080927A (ja) | 符号化方法、符号化装置、復号化方法及び復号化装置 | |
JP2007017659A (ja) | オーディオ符号化方法及び装置 | |
US20090326963A1 (en) | Audio encoding device, audio encoding method, and program thereof | |
JPH05113798A (ja) | 音声復号方法 | |
JP2007219438A (ja) | 符号本選択方法及び符号本選択装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090325 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110318 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120529 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120727 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130312 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160322 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |