JP4639966B2 - オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路 - Google Patents
オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路 Download PDFInfo
- Publication number
- JP4639966B2 JP4639966B2 JP2005159484A JP2005159484A JP4639966B2 JP 4639966 B2 JP4639966 B2 JP 4639966B2 JP 2005159484 A JP2005159484 A JP 2005159484A JP 2005159484 A JP2005159484 A JP 2005159484A JP 4639966 B2 JP4639966 B2 JP 4639966B2
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- data
- frame
- circuit
- compression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 25
- 238000013144 data compression Methods 0.000 title claims description 23
- 238000013139 quantization Methods 0.000 claims description 20
- 238000007906 compression Methods 0.000 claims description 19
- 230000006835 compression Effects 0.000 claims description 19
- 230000006837 decompression Effects 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000000630 rising effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明は上記事情を考慮してなされたもので、その目的は、圧縮率が大きく、しかも、発音レイテンシーが小さいデータ圧縮方法およびデータ圧縮回路並びにデータ伸張回路を提供することにある。
16、32、64、128、256、・・・・、1024、1024、・・・
となっており、サンプル数が16から徐々に増加し、1024に達した後は、1フレーム=1024サンプルで圧縮処理が行われる。
図において、符号1は圧縮前のディジタルオーディオデータ(PCMデータ)が記憶されたメモリである。2はフレーム分割部であり、制御部3からフレームサイズを受け、そのフレームサイズが示すサンプル数のオーディオデータをメモリ1から順次読み出し、サブバンド変換部4および心理聴覚分析部5へ出力する。すなわち、まず、メモリ1から16サンプル読み出してサブバンド変換部4および心理聴覚分析部5へ出力し、次いで、32サンプル読み出して出力し、以下、64サンプル、128サンプル、・・・と読み出し、順次、出力する。
図2はデータ伸張回路の構成を示すブロック図である。この図において、ROM10から読み出されたビットストリームBSのヘッダは制御回路14へ出力され、サブバンドサンプルおよびサイドデータはビットストリーム解析部12へ出力される。ビットストリーム解析部12はROM10から読み出されたビットストリームBSから量子化されたサブバンドサンプルおよびサイドデータを分離し、サブバンドサンプルを逆量子化回路13へ出力し、サイドデータを制御回路14へ出力する。逆量子化回路13は、サブバンドサンプルの逆量子化を行い、さらに、スケールファクタを乗算してサブバンドデータとし、各サブバンドに対応した32サンプル毎にサブバンド合成回路16へ出力する。
制御回路14は、CPUからスタート指示を受けると、まず、各部の初期化を行うと共に、FIFO・17をクリアする(ステップS1)。次に、ROM10へ第1フレームを読み出すためのアドレスを出力する。これにより、ROM10から第1フレームのビットストリームBSが読み出され、そのヘッダが制御回路14へ入力され(ステップS2)、サブバンドサンプルおよびサイドデータがビットストリーム解析部12へ入力される。ビットストリーム解析部12は、ビットストリームBSから量子化されたサブバンドサンプルおよびサイドデータを分離し、サブバンドサンプルを逆量子化回路13へ出力し、サイドデータを制御回路14へ出力する。
この第1フレームは、フレームサイズが16サンプルとされているので、デコード処理(ステップS4)に要する時間が短く、遅れがほとんどない発音が行われる。
16、16、32、32、64、64、・・・
のごとき数列でもよく、あるいは他の数列でもよい。要は、FIFO・17の読み出しスピードより早くFIFO・17の書き込みを行うことができる数列であればよく、デコード処理のスピードによって決まる。但し、この数列は2のべき乗である方がデータ圧縮回路が簡単になって好ましい。
また、この発明は、楽曲のデータ圧縮に限らず、他の種のディジタルデータの圧縮にも適用可能である。
Claims (3)
- 圧縮前の複数のオーディオデータからなるデータ集合体を第1〜第nのフレームに分割し、各フレーム内のオーディオデータを複数のサブバンド信号に分割し、該サブバンド信号を心理聴覚分析に基づいて量子化して圧縮済データを生成するオーディオデータ圧縮方法において、
前記第1フレームから予め決められた第k(2<k<nなる整数)フレームまで順次フレームデータ数が増大するように前記データ集合体をフレーム分割することを特徴とするオーディオデータ圧縮方法。 - 圧縮前の複数のオーディオデータからなるデータ集合体を第1〜第nのフレームに分割する分割手段と、
前記分割手段によって生成された各フレーム内のオーディオデータを複数のサブバンド信号に分割し、該サブバンド信号を心理聴覚分析に基づいて量子化して圧縮済データを生成する圧縮手段とを具備し、
前記分割手段は、第1フレームから予め決められた第k(2<k<nなる整数)フレームまで順次フレームデータ数が増大するように前記データ集合体を分割することを特徴とするオーディオデータ圧縮回路。 - 請求項2に記載されるデータ圧縮装置によって圧縮されたオーディオデータを伸張するオーディオデータ伸張装置において、
前記圧縮されたオーディオデータをフレーム単位でデコードするデコード手段と、
前記デコード手段によってデコードされたオーディオデータが順次書き込まれるメモリと、
前記メモリの空き容量に基づいて前記デコード手段におけるデコード処理をオン/オフ制御する制御手段と、
を具備することを特徴とするオーディオデータ伸張回路。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005159484A JP4639966B2 (ja) | 2005-05-31 | 2005-05-31 | オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路 |
CN2006100899342A CN1874163B (zh) | 2005-05-31 | 2006-05-26 | 数字音频数据的压缩与解压缩的方法 |
US11/420,780 US7711555B2 (en) | 2005-05-31 | 2006-05-29 | Method for compression and expansion of digital audio data |
KR1020060048065A KR100851715B1 (ko) | 2005-05-31 | 2006-05-29 | 데이터의 압축 및 압축해제를 위한 방법, 장치 및 회로 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005159484A JP4639966B2 (ja) | 2005-05-31 | 2005-05-31 | オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006337508A JP2006337508A (ja) | 2006-12-14 |
JP4639966B2 true JP4639966B2 (ja) | 2011-02-23 |
Family
ID=37464584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005159484A Expired - Fee Related JP4639966B2 (ja) | 2005-05-31 | 2005-05-31 | オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7711555B2 (ja) |
JP (1) | JP4639966B2 (ja) |
KR (1) | KR100851715B1 (ja) |
CN (1) | CN1874163B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009010831A1 (en) * | 2007-07-18 | 2009-01-22 | Nokia Corporation | Flexible parameter update in audio/speech coded signals |
CN102063906B (zh) * | 2010-09-19 | 2012-05-23 | 北京航空航天大学 | 一种aac音频实时解码容错控制方法 |
JP6146686B2 (ja) * | 2015-09-15 | 2017-06-14 | カシオ計算機株式会社 | データ構造、データ格納装置、データ取り出し装置および電子楽器 |
CN111384963B (zh) * | 2018-12-28 | 2022-07-12 | 上海寒武纪信息科技有限公司 | 数据压缩解压装置和数据解压方法 |
CN116884437B (zh) * | 2023-09-07 | 2023-11-17 | 北京惠朗时代科技有限公司 | 基于人工智能的语音识别处理器 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06232825A (ja) * | 1993-01-29 | 1994-08-19 | Sony Corp | オーディオ信号符号化装置 |
WO2005059899A1 (en) * | 2003-12-19 | 2005-06-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimised variable frame length encoding |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5040217A (en) * | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
TW235392B (ja) | 1992-06-02 | 1994-12-01 | Philips Electronics Nv | |
US5408580A (en) * | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
JP2734323B2 (ja) | 1992-11-30 | 1998-03-30 | ヤマハ株式会社 | 電子楽器の音源装置 |
JPH08186502A (ja) * | 1995-01-05 | 1996-07-16 | Matsushita Electric Ind Co Ltd | 符号化信号再生装置 |
KR100377394B1 (ko) | 1997-12-04 | 2003-06-11 | 삼성전자주식회사 | 이동통신시스템의핸드오프수행장치및방법 |
US6180861B1 (en) | 1998-05-14 | 2001-01-30 | Sony Computer Entertainment Inc. | Tone generation device and method, distribution medium, and data recording medium |
JP2000134105A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法 |
US6226608B1 (en) * | 1999-01-28 | 2001-05-01 | Dolby Laboratories Licensing Corporation | Data framing for adaptive-block-length coding system |
JP4081994B2 (ja) * | 2000-05-26 | 2008-04-30 | ヤマハ株式会社 | ディジタルオーディオデコーダ |
EP1215663A1 (en) * | 2000-12-15 | 2002-06-19 | BRITISH TELECOMMUNICATIONS public limited company | Encoding audio signals |
JP3601473B2 (ja) | 2001-05-11 | 2004-12-15 | ヤマハ株式会社 | ディジタルオーディオ圧縮回路および伸長回路 |
US20040088161A1 (en) * | 2002-10-30 | 2004-05-06 | Gerald Corrigan | Method and apparatus to prevent speech dropout in a low-latency text-to-speech system |
JP4403721B2 (ja) * | 2003-05-26 | 2010-01-27 | ヤマハ株式会社 | ディジタルオーディオデコーダ |
CN1461112A (zh) * | 2003-07-04 | 2003-12-10 | 北京阜国数字技术有限公司 | 一种基于极小化全局噪声掩蔽比准则和熵编码的量化的音频编码方法 |
US20050143979A1 (en) * | 2003-12-26 | 2005-06-30 | Lee Mi S. | Variable-frame speech coding/decoding apparatus and method |
KR100827097B1 (ko) * | 2004-04-22 | 2008-05-02 | 삼성전자주식회사 | 음성신호 전처리를 위한 가변 길이의 프레임 결정 방법과이를 이용한 음성신호 전처리 방법 및 장치 |
-
2005
- 2005-05-31 JP JP2005159484A patent/JP4639966B2/ja not_active Expired - Fee Related
-
2006
- 2006-05-26 CN CN2006100899342A patent/CN1874163B/zh not_active Expired - Fee Related
- 2006-05-29 KR KR1020060048065A patent/KR100851715B1/ko not_active IP Right Cessation
- 2006-05-29 US US11/420,780 patent/US7711555B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06232825A (ja) * | 1993-01-29 | 1994-08-19 | Sony Corp | オーディオ信号符号化装置 |
WO2005059899A1 (en) * | 2003-12-19 | 2005-06-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimised variable frame length encoding |
Also Published As
Publication number | Publication date |
---|---|
KR100851715B1 (ko) | 2008-08-11 |
CN1874163A (zh) | 2006-12-06 |
CN1874163B (zh) | 2011-07-13 |
KR20060125484A (ko) | 2006-12-06 |
US7711555B2 (en) | 2010-05-04 |
JP2006337508A (ja) | 2006-12-14 |
US20060271374A1 (en) | 2006-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6531649B2 (ja) | 符号化装置および方法、復号化装置および方法、並びにプログラム | |
US8010348B2 (en) | Adaptive encoding and decoding with forward linear prediction | |
TWI474316B (zh) | 使用具隨機存取點及多重預測參數集合能力的適應性分段技術之無損多聲道音訊編解碼器 | |
JP5058152B2 (ja) | 符号化装置および符号化方法 | |
RU2751150C1 (ru) | Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования | |
KR20100086000A (ko) | 오디오 신호 처리 방법 및 장치 | |
JP2007003682A (ja) | 話速変換装置 | |
US20020169601A1 (en) | Encoding device, decoding device, and broadcast system | |
KR100851715B1 (ko) | 데이터의 압축 및 압축해제를 위한 방법, 장치 및 회로 | |
JP4399185B2 (ja) | 符号化装置および復号化装置 | |
KR100750115B1 (ko) | 오디오 신호 부호화 및 복호화 방법 및 그 장치 | |
JP4317355B2 (ja) | 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム | |
JP4256189B2 (ja) | 音声信号圧縮装置、音声信号圧縮方法及びプログラム | |
JP4618634B2 (ja) | 圧縮オーディオデータ処理方法 | |
CN101740075B (zh) | 音频信号播放装置、音频信号播放方法和程序 | |
JP4222250B2 (ja) | 圧縮楽音データ再生装置 | |
CN108292506B (zh) | 使用视频信息的音频编码 | |
JP5724338B2 (ja) | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム | |
JP4159927B2 (ja) | ディジタルオーディオデコーダ | |
JP3918826B2 (ja) | 楽音データ再生装置 | |
JP2003271198A (ja) | 圧縮データ処理装置、方法および圧縮データ処理プログラム | |
JPH10333698A (ja) | 音声符号化方法、音声復号化方法、音声符号化装置、及び記録媒体 | |
JP2007108440A (ja) | 音声信号圧縮装置、音声信号復元装置、音声信号圧縮方法、音声信号復元方法及びプログラム | |
JP2004029377A (ja) | 圧縮データ処理装置、方法および圧縮データ処理プログラム | |
JP2007178529A (ja) | 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080321 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100629 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4639966 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |