[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR20070003545A - 멀티채널 오디오 코딩에서 클리핑 복원방법 - Google Patents

멀티채널 오디오 코딩에서 클리핑 복원방법 Download PDF

Info

Publication number
KR20070003545A
KR20070003545A KR1020060030671A KR20060030671A KR20070003545A KR 20070003545 A KR20070003545 A KR 20070003545A KR 1020060030671 A KR1020060030671 A KR 1020060030671A KR 20060030671 A KR20060030671 A KR 20060030671A KR 20070003545 A KR20070003545 A KR 20070003545A
Authority
KR
South Korea
Prior art keywords
audio signal
downmix
gain
clipping
bitstream
Prior art date
Application number
KR1020060030671A
Other languages
English (en)
Inventor
방희석
오현오
김동수
임재현
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to CN2006800292910A priority Critical patent/CN101297352B/zh
Priority to MYPI20063144 priority patent/MY145249A/en
Priority to EP06757752.8A priority patent/EP1913577B1/en
Priority to JP2008519178A priority patent/JP2009500656A/ja
Priority to MYPI20063145A priority patent/MY157901A/en
Priority to EP06757748A priority patent/EP1946294A2/en
Priority to TW098105155A priority patent/TWI409803B/zh
Priority to US11/994,317 priority patent/US8082157B2/en
Priority to US11/994,311 priority patent/US8073702B2/en
Priority to PCT/KR2006/002579 priority patent/WO2007004830A1/en
Priority to MYPI20063141 priority patent/MY149615A/en
Priority to TW95124112A priority patent/TWI314722B/zh
Priority to CN200680029607.6A priority patent/CN101243491B/zh
Priority to EP06757751A priority patent/EP1913576A2/en
Priority to US11/994,315 priority patent/US8494667B2/en
Priority to PCT/KR2006/002575 priority patent/WO2007004828A2/en
Priority to JP2008519180A priority patent/JP5227794B2/ja
Priority to CA2613731A priority patent/CA2613731C/en
Priority to AU2006266655A priority patent/AU2006266655B2/en
Priority to TW95124111A priority patent/TWI376107B/zh
Priority to TW95124113A priority patent/TWI319868B/zh
Priority to PCT/KR2006/002578 priority patent/WO2007004829A2/en
Priority to JP2008519179A priority patent/JP2009500657A/ja
Priority to CN2006800293985A priority patent/CN101243488B/zh
Publication of KR20070003545A publication Critical patent/KR20070003545A/ko
Priority to HK09101392.3A priority patent/HK1123623A1/xx
Priority to HK09103907.7A priority patent/HK1127664A1/xx

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)

Abstract

본 발명은 멀티채널 오디오 신호의 공간 정보에 대한 부호-복호화(encoding-decoding)방법에 관한 것으로서, 더욱 상세하게는 클리핑 복원방법을 갖는 멀티채널 오디오 신호의 부호화-복호화 방법에 대한 것이다.
상기와 같은 공간 정보를 부호-복호화하는 방법을 제공하기 위해, 본 발명은 멀티채널 오디오 신호에 클리핑방지게인을 적용한 후에 다운믹스하여 비트스트림을 구성하거나, 또는 멀티채널 오디오 신호를 다운믹스한 후에 클리핑방지게인을 적용하여 비트스트림을 구성하고, 디코딩 과정에서 멀티채널 오디오 신호 또는 다운믹스 신호에 다운믹스게인을 적용함으로써, 멀티채널 오디오 신호를 다운믹스하는 과정에서 발생되는 클리핑을 방지하는 방법 및 장치를 제공한다.
또한, 본 발명은 상기 클리핑방지게인 및 다운믹스게인을 전체 비트스트림, 일정한 구간, 또는 프레임별로 사용하거나, 클리핑복구정보와 함께 사용함으로써 멀티채널 오디오 신호를 다운믹스하는 과정에서 발생되는 클리핑을 효과적으로 방지하는 방법 및 장치를 제공한다.
멀티채널 오디오 신호, 클리핑, 다운믹스 신호.

Description

멀티채널 오디오 코딩에서 클리핑 복원방법{CLIPPING RESTORATION FOR MULTI-CHANNEL AUDIO CODING}
도 1은 본 발명에서의 오디오 신호에 대한 공간 정보를 인간이 인식하는 방법을 나타내는 도면.
도 2는 클리핑 발생과정을 나타내는 도면.
도 3은 본 발명에 따른 클리핑방지게인 및 다운믹스게인을 적용하여 클리핑을 방지하기 위한 제1 방법에 대한 도면.
도 4는 본 발명에 따른 클리핑방지게인 및 다운믹스게인을 적용하여 클리핑을 방지하기 위한 제2 방법에 대한 도면.
도 5a 및 5b는 본 발명에 따른 클리핑방지게인 값에 대한 다양한 실시예를 도시하는 테이블.
도 6은 본 발명에 따른 클리핑방지게인, 다운믹스게인 및 클리핑복구정보를 사용하여 클리핑을 방지하기 위한 방법에 대한 도면.
도 7은 본 발명에 따른 프레임 주위에서 음질저하를 방지하는 클리핑방지게인 이용원리를 도시하는 그래프.
도 8은 본 발명에 따른 클리핑을 방지하기 위한 제1 방법을 이용하는 멀티채널 오디오 신호의 인코딩 방법에 대한 흐름도.
도 9는 본 발명에 따른 클리핑을 방지하기 위한 제2 방법을 이용하는 멀티채널 오디오 신호의 인코딩 방법에 대한 흐름도.
도 10은 본 발명에 따른 클리핑을 방지하기 위한 제1 방법을 이용하는 멀티채널 오디오 신호의 디코딩 방법에 대한 흐름도.
도 11은 본 발명에 따른 클리핑을 방지하기 위한 제2 방법을 이용하는 멀티채널 오디오 신호의 디코딩 방법에 대한 흐름도.
*도면의 주요부분에 대한 부호의 설명
101.원거리 음원 102.직접적인 음파
104.반사된 음파 301.멀티채널 오디오 신호
303.다운믹스부 304.공간정보발생부
305.비트스트림포맷터 306.전체 비트스트림
307.비트스트림파서 308.오디오디코딩 및 멀티채널생성부
311.공간 인코더 312.공간 디코더
본 발명은 멀티채널 오디오 신호의 공간 정보에 대한 부호-복호화(encoding-decoding)방법에 관한 것으로서, 더욱 상세하게는 클리핑 복원방법을 갖는 멀티채널 오디오 신호의 부호화-복호화 방법에 대한 것이다.
최근에 디지털 오디오 신호에 대한 다양한 코딩기술 및 방법들이 개발되고 있으며, 이와 관련된 제품들이 생산되고 있다. 또한 심리음향 모델(Psychoacoustic model)을 이용한 멀티채널 오디오 신호(multi-channel audio signal)의 코딩방법들이 개발되고 있으며, 이에 대한 표준화 작업이 진행되고 있다. 상기 심리음향 모델은 인간이 소리를 인식하는 방식, 예를 들면 큰 소리 다음에 오는 작은 소리는 들리지 않으며, 20Hz 내지 20000Hz의 주파수에 해당되는 소리만 들을 수 있다는 사실을 이용하여, 코딩과정에서 불필요한 부분에 대한 오디오 신호를 제거함으로써 필요한 데이터의 양을 효과적으로 줄일 수 있는 것이다.
현재 MPEG-1 오디오(MEPG-1 레이어 Ⅲ), MPEG-4 AAC(Advanced Audio Coding) 및 MPEG-4 HE-AAC(High-Efficiency AAC)와 같은 오디오 표준 기술이 개발되어 상용화되고 있다. 또한 공간 정보를 이용하는 멀티채널 오디오 신호의 코딩방법이 개발되고 있다. 상기 멀티채널 오디오 신호의 코딩방법은 압축된 오디오 신호(예를 들면, 모노 또는 스테레오 오디오 신호) 및 낮은 비트-레이트의 부가정보(low-rate side information)(예를 들면, 공간 정보) 채널을 이용하여 멀티채널 오디오 신호의 전송 효율을 매우 효과적으로 향상시키는 것이다.
그러나, 상기 멀티채널 오디오 신호의 비트스트림을 구성하는데 있어서, 종래에는 멀티채널을 모노 또는 스테레오 오디오 신호로 다운믹스하면 클리핑(Clipping) 문제가 발생하였었다. 특히 부호화된 신호는 16비트 등으로 크기가 제한되어야하므로, 상기 부호화된 신호는 코어 코덱 인코딩 이후에도 클리핑이 지속된다. 상기 클리핑은 오디오 신호의 출력에도 영향을 주며, 음질 저하의 원인이 되었었다.
따라서 상기와 같은 문제점을 해결하기 위해 제안된 본 발명은, 멀티채널 오디오 신호를 코딩하는데 있어서, 다운믹스 오디오 신호에 클리핑방지게인을 적용하거나, 또는 다운믹스하기 전의 멀티채널에 클리핑방지게인을 적용하여 비트스트림을 구성함으로써, 멀티채널 오디오 신호에서 일어나는 클리핑 문제를 해결하는 방법 및 장치를 제공하는데 그 목적이 있다.
상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호에 클리핑방지게인을 적용한 후에, 다운믹스 과정을 진행하여 다운믹스 오디오 신호를 생성하는 단계와; 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 단계와; 상기 다운믹스오디오신호 및 공간 정보를 이용하여 전체 비트스트림을 생성하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하여 다운믹스 오디오 신호를 생성하고, 상기 다운믹스 오디오 신호에 클리핑방지게인을 적용하는 단계와; 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 단계와; 상기 클리핑방지게인이 적용된 다운믹스오디오신호 및 공간 정보를 포함하는 전체 비트스트림을 생성하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신 호를 다운믹스하는 과정에서 클리핑방지게인을 적용하는 단계와; 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 단계와; 상기 클리핑방지게인이 적용된 다운믹스오디오신호 및 공간 정보를 포함하는 전체 비트스트림을 생성하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 방법을 제공한다.
상기 인코딩 방법들은 상기 멀티채널 오디오 신호의 하나 이상의 채널에 각 채널별 게인을 적용하는 단계를 더 포함할 수 있으며, 상기 클리핑방지게인은 ⅰ)전체적으로 적용되거나, ⅱ)일정한 간격마다 가변적으로 적용되거나, ⅲ)프레임마다 가변적으로 적용되거나, 또는 ⅳ) 상기 ⅰ),ⅱ),ⅲ)을 조합하여 적용될 수 있다. 또한, 상기 클리핑방지게인은 프레임마다 미리 정해진 1단계 값을 초과하지 못하거나, 또는 특정한 수의 프레임마다 1단계 변화만이 가능하도록 적용될 수 있다. 그리고 상기 인코딩 방법들은 프레임별로 클리핑복구정보(Clipping Restoration Information)를 상기 전체 비트스트림에 삽입하는 단계를 더 포함할 수 있다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신하는 단계와; 상기 비트스트림을 디코딩하여 공간 정보를 추출하고, 추출된 상기 공간 정보를 이용하여 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환하는 단계와; 상기 멀티채널 오디오 신호에 다운믹스게인을 적용하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호로 디코딩하는 방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신하는 단계와; 상기 비트스트림으로부터 다 운믹스 오디오 신호를 추출하고, 추출된 상기 다운믹스 오디오 신호에 다운믹스게인(Downmix Gain)을 적용하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호로 디코딩하는 방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신하는 단계와; 상기 비트스트림으로부터 다운믹스 오디오 신호를 추출하고, 추출된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 바꾸는 과정에서 다운믹스게인(Downmix Gain)을 적용하는 단계;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호로 디코딩하는 방법을 제공한다.
상기 디코딩 방법들은 상기 멀티채널 오디오 신호의 하나 이상의 채널에 각 채널별 다운믹스게인을 적용하는 단계를 더 포함할 수 있으며, 상기 다운믹스게인은 ⅰ)전체적으로 적용되거나, ⅱ)일정한 간격마다 가변적으로 적용되거나, ⅲ)프레임마다 가변적으로 적용되거나, 또는 ⅳ) 상기 ⅰ),ⅱ),ⅲ)을 조합하여 적용될 수 있다. 또한, 상기 다운믹스게인은 프레임마다 미리 정해진 1단계 값을 초과하지 못하거나, 또는 특정한 수의 프레임마다 1단계 변화만이 가능하도록 적용될 수 있다. 그리고 상기 디코딩 방법들은 비트스트림에 포함된 프레임별로 클리핑복구정보(Clipping Restoration Gain)를 추출하고, 추출된 상기 클리핑복구정보를 이용하여 상기 다운믹스게인이 적용된 멀티채널 오디오 신호에 클리핑복구를 수행하는 단계;를 더 포함할 수 있다. 상기 다운믹스 오디오 신호를 멀태채널로 바꾸는 과정 중에 다운믹스게인을 적용하는 디코딩 방법은 상기 다운믹스게인을 QMF도메인(domain) 단계에서 적용할 수 있다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 오디오 신호가 다운믹스 오디오 신호를 포함하도록 생성하되, 상기 다운믹스 오디오 신호는 클리핑방지게인을 적용한 후에 다운믹스되어 생성되는 것을 특징으로 하는 오디오 신호의 생성방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 오디오 신호가 다운믹스 오디오 신호를 포함하도록 생성하되, 상기 다운믹스 오디오 신호는 다운믹스 된 후에 클리핑방지게인이 적용되도록 생성되는 것을 특징으로 하는 오디오 신호의 생성방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 오디오 신호가 다운믹스 오디오 신호를 포함하도록 생성하되, 상기 다운믹스 오디오 신호는 다운믹스하는 과정에서 클리핑방지게인이 적용되도록 생성되는 것을 특징으로 하는 오디오 신호의 생성방법을 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호에 클리핑방지게인을 적용한 후에, 다운믹스 과정을 진행하여 다운믹스 오디오 신호를 생성하는 다운믹스부; 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 공간정보발생부; 및 상기 다운믹스오디오신호 및 공간 정보를 이용하여 전체 비트스트림을 생성하는 비트스트림 포맷터;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 장치를 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하여 다운믹스 오디오 신호를 생성하고, 상기 다운믹스 오디오 신호 에 클리핑방지게인을 적용하는 다운믹스부; 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 공간정보발생부; 및 상기 클리핑방지게인이 적용된 다운믹스오디오신호 및 공간 정보를 포함하는 전체 비트스트림을 생성하는 비트스트림 포맷터;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 장치를 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 상기 멀티채널 오디오 신호를 다운믹스하는 과정에서 클리핑방지게인을 적용하는 다운믹스부; 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 공간정보발생부; 및 상기 클리핑방지게인이 적용된 다운믹스오디오신호 및 공간 정보를 포함하는 전체 비트스트림을 생성하는 비트스트림 포맷터;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 인코딩 장치를 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신하는 비트스트림수신부; 상기 비트스트림을 디코딩하여 공간 정보를 추출하고, 추출된 상기 공간 정보를 이용하여 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환하는 오디오디코딩 및 멀티채널생성부; 및 상기 멀티채널 오디오 신호에 다운믹스게인을 적용하는 다운믹스게인적용부;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 장치를 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신하는 비트스트림수신부; 및 상기 비트스트림으로부터 다운믹스 오디오 신호를 추출하고, 추출된 상기 다운믹스 오디오 신호 에 다운믹스게인(Downmix Gain)을 적용하는 다운믹스게인적용부;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 디코딩 장치를 제공한다.
또한, 상기의 목적을 달성하기 위하여, 본 발명은 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신하는 비트스트림수신부; 및 상기 비트스트림으로부터 다운믹스 오디오 신호를 추출하고, 추출된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 바꾸는 과정에서 다운믹스게인(Downmix Gain)을 적용하는 다운믹스게인적용부;를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호의 디코딩 장치를 제공한다.
이하 상기의 목적을 구체적으로 실현할 수 있는 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 설명한다.
도 1 은 본 발명에서의 오디오 신호에 대한 공간 정보를 인간이 인식하는 방법을 도시한다. 멀티채널 오디오 신호에 대한 코딩방법은 인간이 오디오 신호를 3차원적 공간으로 인지한다는 사실을 바탕으로, 복수의 파라미터 세트(parameter sets)를 통하여 상기 오디오 신호를 3차원적 공간 정보로 표현할 수 있다는 것을 이용한다. 멀티채널 오디오 신호의 공간 정보를 표시하기 위한 "공간 파라미터"라고 불리는 상기 파라미터에는 ICLD(Inter Channel level differences), ICC(Inter Channel Coherences) 및 ICTD(Inter Channel Time Difference)등이 있다. 상기 ICLD는 두 채널간의 에너지 차이를 의미하고, 상기 ICC는 두 채널 간의 상관관계(correlation)를 의미하며, ICTD는 두 채널간의 시간 차이를 의미한다.
인간이 오디오 신호를 어떻게 공간적으로 인식하며, 상기 공간 파라미터의 개념이 어떻게 생성되는지가 도 1에 도시된다. 원거리에 있는 음원(105)으로부터의 직접적인 음파(direct sound wave)(103)가 인간의 왼쪽 귀(107)에 도달하고, 또 다른 직접적인 음파(102)는 머리 주위에서 회절되어 오른쪽 귀(106)에 도달하게 된다. 상기 두 음파(102 및 103)는 도달시간 및 에너지 레벨에서 차이를 보이게 되며, 이와 같은 차이가 상기 CLD, CPC 및 CTD 파라미터를 생성하게 된다.
또한 만일 반사된 음파(104 및 105)가 양 귀에 도달되거나, 또는 상기 음원(105)이 분산되어 있다면, 서로 상관관계가 없는 음파가 양 귀에 도달될 것이고, 이것이 상기 ICC 파라미터를 생성하게 된다. 상기와 같이 원리로 생성된 공간 파라미터들은 멀티채널 오디오 신호를 모노 또는 스테레오 신호로 전송한 후 다시 멀티채널로 출력하는데 있어서, 강력한 비트 수 감소를 가능하게 한다는 것이 알려져 있다. 본 발명은 상기 공간 정보를 이용하는 멀티채널 오디오 신호에 있어서, 멀티채널을 다운믹스하여 코딩하는 과정에서 발생할 수 있는 클리핑(Clipping) 현상을 방지하기 위한 방법을 제시한다.
도 2는 클리핑 발생과정을 도시한다. 클리핑은 주로 두 가지 원인으로 발생한다. 첫 번째는 원래 신호(original signal)의 음량(sound level)이 높은 경우에 발생한다. 두 번째는 다운믹스 과정 중에 입력 채널(input channel)의 수가 많은 경우에 발생한다. 예를 들면, 3개의 채널을 1개의 채널도 다운믹스하는 경우보다, 7개의 채널을 1개의 채널도 다운믹스하는 경우에 클리핑이 더 자주 발생한다. 도 2의 클리핑 발생과정은 5개 채널을 1개의 채널로 다운믹스하는 경우를 도시하나, 본 발명은 이 경우에만 한정되지는 않는다. 도 2의 (a)는 5개의 채널로 구성된 원래 신호의 음량을 도시한다. 각각의 채널은 제한된 크기(예를 들면, 16비트)의 거의 전 범위를 사용할 수 있다. 도 2의 (b)는 상기 5개의 채널을 다운믹스하여 생성된 다운믹스 오디오 신호를 도시한다. 도시된 것처럼, 상기 다운믹스 오디오 신호는 많은 클리핑 지점들을 가질 수 있다. 도 2의 (c)는 상기 다운믹스 오디오 신호를 코어 코덱(예를 들면, AAC 코덱)을 이용하여 인코딩/디코딩한 오디오 신호를 도시한다. 상기 코어 코덱을 이용하여 인코딩/디코딩된 오디오 신호도 제한된 크기(예를 들면, 16비트)로 표현되므로, 클리핑이 지속될 수 있다. 상기 클리핑은 멀티채널 오디오 신호의 재생부에서의 출력에도 영향을 주며, 음질 저하의 원인이 될 수 있다.
도 3은 본 발명에 따른 클리핑방지게인 및 다운믹스게인을 적용하여 클리핑을 방지하기 위한 제1 방법을 도시한다. 도시된 것처럼, 먼저 공간 인코더(311)에 멀티채널 오디오 신호(301)가 입력되기 전에, 상기 멀티채널 오디오 신호(301)에 클리핑방지게인(Clipping Prevention Gain, C, )이 적용(302)된다. 여기서 n은 입력 채널의 수를 의미하고, 상기 클리핑방지게인 값은 1보다 작은 값(즉, C<1)에 해당된다. 상기 멀티채널 오디오 신호(301)의 하나 이상의 채널에는 각 채널별 게인(예를 들면, LFE게인 또는 서라운드(Surround)게인)이 적용될 수 있다. 그 다음에 클리핑방지게인이 적용된 상기 멀티채널 오디오 신호(301)는 다운믹스(down-mix)부(303)에서 다운믹스되어 다운믹스 신호로 된다.
또한 상기 멀티채널 오디오 신호의 공간 정보, 즉 공간 파라미터가 공간정보발생부(Spatial informatin genenerator, 203)에서 상기 멀티채널 오디오 신 호(301)로부터 추출된다. 여기서 공간 정보(spatial information)란 멀티채널(예를 들면, Left, Right, Center, Left surround, Right surround 등) 오디오 신호를 다운믹스하고, 상기 다운믹스 신호를 전송하며, 상기 전송된 다운믹스 신호를 다시 멀티채널로 업믹스 할 때 사용되는 오디오 신호 채널에 대한 정보를 말한다.
상기 다운믹스 신호는 코어 코덱 코딩방법을 이용하여 인코딩되어 코어 코덱 비트스트림을 형성하고, 상기 공간 정보, 즉 공간 파라미터는 공간 정보 비트스트림을 형성한다. 상기 코어 코덱은 공간 정보, 즉 공간 파라미터가 아닌 오디오 신호를 코딩 또는 인코딩하는 코덱을 지칭하며, 상기 코어 코덱에는 MP3, AC-3, DTS 또는 AAC가 포함될 수 있으며, 오디오 신호에 대하여 코덱 기능을 수행한다면 기존에 개발된 코덱뿐만 아니라 향후 개발될 코덱을 포함할 수 있다. 비트스트림포맷터(Bitstream Formatter, 305)에서 상기 코어 코덱 비트스트림 및 공간 정보 비트스트림을 포함하는 전체 비트스트림(306)이 생성되고, 생성된 상기 전체 비트스트림(306)은 공간 디코더(312)로 전송된다. 상기 전체 비트스트림(306)에는 클리핑방지정보(Clipping Prevention Information)가 포함될 수 있다. 전송된 전체 비트스트림(306)은 비트스트림파서(Bitstream Parser, 307)를 거쳐 오디오디코딩 및 멀티채널생성부(308)에서 멀티채널 오디오 신호(308)로 변환될 수 있다. 상기 비트스트림파서(307)에서 공간 정보 비트스트림과 코어 코덱 비트스트림이 분리될 수 있다. 상기 오디오디코딩 및 멀티채널생성부(308)에서 상기 공간 정보 비트스트림과 코어 코덱 비트스트림을 디코딩하여, 각각 다운믹스 오디오 신호 및 공간 정보를 추출하고, 추출된 상기 공간 정보를 이용하여 상기 다운믹스 오디오 신호를 멀티채널 오 디오 신호(310)로 변환할 수 있다. 그 다음에 변환된 멀티채널 오디오 신호에 다운믹스게인(Down-mix gain, 1/C)을 적용(310)할 수 있다. 상기 다운믹스게인은 상기 클리핑방지게인의 역수가 될 수 있다. 여기서, 상기 클리핑방지게인 및 다운믹스게인은 전체 신호에 대해서 적용되므로, 클리핑이 일어나는 신호의 크기가 큰 구간에 대해서는 좋은 방법이지만, 원래 신호의 크기가 작은 구간에서는 신호의 SNR(signal-to-noise ratio)을 떨어뜨리는 등의 부작용을 발생시킬 수 있다. 따라서, 상기 클리핑방지게인 및 다운믹스게인은 일정한 시간 간격마다 다른 값을 사용할 수 있다.
또한 상기 클리핑방지게인 및 다운믹스게인은 전체 신호 또는 1~2초 단위로 갱신되는 구간 전체에 대하여 적용될 수 있을 뿐만 아니라, 프레임별로 상기 클리핑방지게인 및 다운믹스게인을 적용할 수 있는 신택스를 비트스트림내에 정의하고, 상기 신택스에 의해 매 프레임별로 다운믹스 신호의 게인 조절을 선택적으로 할 수 있다. 프레임별로 적용되는 클리핑방지게인 및 다운믹스게인을 각각 FCPG(Frame Clipping Prevention Gain) 및 FDG(Frame Down-mix Gain)라고 할 때, 상기 FCPG는 ⅰ)FCPG를 헤더에 정의하고, 전체 신호 또는 일정한 주기로 상기 헤더가 갱신될 경우, 상기 헤더에 의해 영향을 받는 구간에 대하여 동일하게 적용하거나, ⅱ) 별도로 정의된 신택스에 의해 매 프레임별로 FCPG를 적용하여 프레임별로 다른 게인을 사용하거나, 또는 ⅲ) 상기 ⅰ) 과 ⅱ)의 방법을 조합하여 전체적으로 적용되는 CPG를 정하고, 상기 CPG를 전체 범위 또는 1~2초 범위의 큰 범위에 대해 사용하고, 이와 별도로 프레임별로 FCPG를 적용하여 상기 CPG가 커버하지 못하는 범위에 대해 게인 조절(gain control)을 하게 할 수 있다. 상기와 같은 신호의 디코딩에서는, 모노 또는 스테레오 신호와 같은 다운믹스 신호에 대해서 CPG 또는 DG를 고려하지 않고 즉시 디코딩하여 재생할 수 있다. 멀티채널 오디오 신호로 재생하는 경우에는, ⅰ)전체 프레임 또는 헤더가 적용되는 범위에 대해서 DG를 적용하거나, ⅱ)프레임별 또는 ⅰ)의 범위보다 작은 범위(group of frames, GOF)에 대해서는 FDG 또는 GOFDG(Group of Frame Down-mix Gain)을 적용하거나, 또는 ⅲ) 상기 ⅰ)과 ⅱ)의 방법을 조합하여 사용할 수 있다.
상기와 같은 CPG(또는 FCPG) 및 DG(또는 FDG)를 비트스트림에 표현하기 위해, 우선 전체 헤더에 대하여 상기 CPG(또는 FCPG) 및 DG(또는 FDG)의 사용여부에 관한 신택스를 가지고, 상기 신택스에 의해 상기 CPG(또는 FCPG) 및 DG(또는 FDG)의 사용여부를 결정한다. 만약 사용하기로 결정되는 경우, 프레임별로 상기 CPG(또는 FCPG) 및 DG(또는 FDG)의 사용여부에 관한 신택스를 갖는다. 만약 사용하기로 결정되는 경우에는, 해당 프레임에 대해 상기 CPG(또는 FCPG) 및 DG(또는 FDG)의 값을 표현한다.
도 4는 본 발명에 따른 클리핑방지게인 및 다운믹스게인을 적용하여 클리핑을 방지하기 위한 제2 방법을 도시한다. 상기 제2 방법은 도 3에서 도시된 제1 방법과 유사하나, 차이점은 클리핑방지게인 및 다운믹스게인의 적용 시점이 다르다는 것이다. 상기 제2 방법에서는 공간 인코더(411)에 입력된 멀티채널 오디오 신호(401)가 다운믹스부(403)에서 다운믹스된 후 클리핑방지게인이 적용(402)되거나, 또는 다운믹스과정 중에 클리핑방지게인이 적용(402)될 수 있다. 또한, 공간 디코 더(412)에서의 차이점은 오디오디코딩 및 멀티채널생성부(408)에서 추출된 다운믹스 오디오 신호에 다운믹스게인을 적용(409)한 후, 또는 상기 다운믹스 오디오 신호를 멀티채널로 변환하는 과정 중에 상기 다운믹스게인을 적용(409)한 후, 공간 정보를 이용하여 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호(410)로 변환할 수 있다는 점이다. 여기서도 상기 멀티채널 오디오 신호의 하나 이상의 채널에 각 채널별 다운믹스게인을 적용할 수 있다. 특히, 다운믹스 과정중 또는 다운믹스 오디오 신호를 멀티채널로 변환하는 과정 중에 클리핑방지게인 또는 다운믹스게인을 적용하는 것은, 상기 오디오 신호를 처리하는 여러 도메인 중 QMF도메인 단계에서 적용될 수 있다.
도 5a 및 5b는 본 발명에 따른 클리핑방지게인 값의 다양한 실시예에 관한 테이블을 도시한다. 상기 클리핑방지게인 값은 다양한 값을 가지도록 표현될 수 있다. 예를 들면, 비트스트림내에 bsFixedGains라는 신택스(syntax)를 두고, 상기 신택스 값에 의해 각 채널별 게인(예를 들면, 서라운드게인(Surround Gain) 및 LFE 게인 등) 및 클리핑방지게인을 표시하고자 할 때, 도시된 테이블처럼 다양한 실시예를 가질 수 있다. 제1 실시예에서는 서라운드게인 값 및 LFE게인 값은 각각 1/sqrt(2) 및 1/sqrt(10)을 사용하고, 클리핑방지게인 값은 1 또는 1/2를 사용할 수 있다. 제2 실시예에서는 서라운드게인 값 및 LFE게인 값은 각각 1/sqrt(2) 및 1/sqrt(10)을 사용하고, 클리핑방지게인 값은 1, 1/2 또는 1/4를 사용할 수 있다. 제3 실시예에서는 서라운드게인 값 및 LFE게인 값은 각각 1/sqrt(2) 및 1/sqrt(10)을 사용하고, 클리핑방지게인 값은 1, 1/sqrt(2) 또는 1/2를 사용할 수 있다. 제4 실시예에서는 서라운드게인 값 및 LFE게인 값은 각각 1/sqrt(2) 및 1/sqrt(10)을 사용하고, 클리핑방지게인 값은 1, 1/sqrt(2), 1/2, 1/(2xsqrt(2)) 또는 1/4를 사용할 수 있다. 제5 실시예에서는 서라운드게인 값 및 LFE게인 값은 각각 1/sqrt(2) 및 1/sqrt(10)을 사용하고, 클리핑방지게인 값은 1, 3/4, 2/3, 또는 1/2를 사용할 수 있다. 제6 실시예에서는 서라운드게인 값 및 LFE게인 값은 각각 1/sqrt(2) 및 1/sqrt(10)을 사용하고, 클리핑방지게인 값은 1, 3/4, 2/4, 또는 1/4를 사용할 수 있다.
도 5a 및 5b에서는 서라운드게인 값 및 LFE게인 값이 특정한 값(예를 들면, 1/sqrt(2) 및 1/sqrt(10))으로 고정된 경우만을 도시하고 있으나, 본 발명은 상기 실시예에 한정되지 않는다. 본 발명은 상기 서라운드게인 값 및 LFE게인 값도 상기 클리핑방지게인 값처럼 복수의 값 중에서 선택되는 경우를 포함할 수 있다. 또한, 본 발명은 상기 서라운드게인 및 LFE게인 이외에 다른 채널에 대한 게인 값을 가지는 경우도 포함할 수 있다.
도 6은 본 발명에 따른 클리핑방지게인, 다운믹스게인 및 클리핑복구정보를 사용하여 클리핑을 방지하기 위한 방법을 도시한다. 상기 클리핑복구정보(Clipping Restoration Information, CRI)는 클리핑 발생여부 및 클리핑 위치 등에 관한 정보를 포함하는 클리핑에 관한 정보를 말하며, 상기 클리핑복구정보는 프레임별로 비트스트림내에 포함될 수 있다. 도시된 것처럼, 상기 클리핑복구정보는 다운믹스 오디오 신호 또는 멀티채널 오디오 신호에 적용(602 또는 609)되는 상기 클리핑방지게인 및 다운믹스게인과 함께 사용될 수 있다. 즉, 클리핑방지게인이 적용(602)된 멀티채널 오디오 신호(601)를 다운믹스하여 생성된 다운믹스 오디오 신호를 포함하는 전체 비트스트림에 프레임 단위로 상기 클리핑복구정보를 포함시킬 수 있다. 또한, 다운믹스 오디오 신호에 클리핑방지게인을 적용(602)하고, 상기 클리핑방지게인이 적용된 다운믹스 오디오 신호를 포함하는 전체 비트스트림에 프레임 단위로 상기 클리핑복구정보를 포함시킬 수 있다. 또한, 다운믹스과정 중에 클리핑방지게인을 적용(602)하고, 상기 클리핑방지게인이 적용된 다운믹스 오디오 신호를 포함하는 전체 비트스트림에 프레임 단위로 상기 클리핑복구정보를 포함시킬 수 있다. 공간 디코더(612)에서는 다운믹스게인과 상기 클리핑복구정보를 모두 이용하여 멀티채널 오디오 신호로 디코딩할 수 있다.
도 7은 본 발명에 따른 프레임 주위에서 음질저하를 방지하는 클리핑방지게인의 이용원리를 도시한다. 클리핑방지게인에 의해 음량이 변할 경우, 상기 클리핑방지게인 값이 변하는 프레임 주위에서 음질 저하가 이루어질 수 있다. 따라서 상기 클리핑방지게인 값의 변화에 의한 효과가 서서히 나타나도록 변이 구간을 정할 필요가 있다. 이때, 다음과 같은 수식을 사용하여 스무딩(smoothing) 과정을 수행할 수 있다.
CPG(n)=a(n)CPGt-1(n-1) + (1-a(n))CPGt(n), n=0,1,2,...,N
여기서, a(n)은 1차 직선이 될 수도 있고, 일반적인 n차의 다항함수가 될 수도 있다. 또한, 가우스(gaussian) 함수, 해닝(hanning), 해밍(hamming) 함수 등의 비-다항(non-polynomial) 함수로서, 상기 CPG 값이 바뀔 때의 부드러운 변화를 위 해 사용되는 것이면 상관없다. 한편, 급격한 CPG의 변화는 상기와 같은 스무딩 과정을 거치더라도 부정적인 효과를 일으킬 수 있다. 따라서, 인코딩 과정에서 급격한 변화를 가지지 못하게 제한할 수 있다. 또는, 인코더에서 아무렇게나 넣더라도 디코더에서 급격하게 변화하지 못하도록 강제적으로 해석할 수 있다. 예를 들면, 상기 CPG의 값이 여러 단계의 값을 갖는 경우, 매 프레임마다 1단계 초과의 변화를 가지지 못하게 한다거나, 특정 수의 프레임(n 프레임)마다 1단계의 변화만 가능하게 할 수 있다.
도 8은 본 발명에 따른 클리핑을 방지하기 위한 제1 방법을 이용하는 멀티채널 오디오 신호의 인코딩 방법에 대한 흐름도이다. 먼저 멀티채널 오디오 신호(801)에 클링방지게인을 적용(802)한다. 상기 클리핑방지게인이 적용된 멀티채널 오디오 신호를 다운믹스(803)하여 다운믹스 신호를 생성하고, 상기 멀티채널 오디오 신호로부터 공간 정보를 추출(804)한다. 그 다음에 상기 다운믹스 오디오 신호 및 공간 정보를 포함하는 전체 비트스트림을 전송(805)한다.
도 9는 본 발명에 따른 클리핑을 방지하기 위한 제2 방법을 이용하는 멀티채널 오디오 신호의 인코딩 방법에 대한 흐름도이다. 먼저 멀티채널 오디오 신호(901)를 다운믹스(902)하여 다운믹스 오디오 신호를 생성하고, 상기 멀티채널 오디오 신호로부터 공간 정보를 추출(904)한다. 그 다음에 상기 다운믹스 오디오 신호에 클리핑방지게인을 적용(904)한다. 그 다음에 상기 클리핑방지게인을 적용한 다운믹스 오디오 신호 및 공간 정보를 포함하는 전체 비트스트림을 전송(905)한다.
도 10은 본 발명에 따른 클리핑을 방지하기 위한 제1 방법을 이용하는 멀티 채널 오디오 신호의 디코딩 방법에 대한 흐름도이다. 먼저 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신(1001)하고, 상기 비트스트림으로부터 다운믹스 오디오 신호 및 공간 정보를 추출(1002 및 1003)한다. 그 다음에 상기 공간 정보를 이용하여 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환(1004)하고, 상기 멀티채널 오디오 신호에 다운믹스게인을 적용(1005)한다.
도 11은 본 발명에 따른 클리핑을 방지하기 위한 제2 방법을 이용하는 멀티채널 오디오 신호의 디코딩 방법에 대한 흐름도이다. 먼저 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신(1101)하고, 상기 비트스트림으로부터 다운믹스 오디오 신호 및 공간 정보를 추출(1102 및 1103)한다. 그 다음에 상기 다운믹스 오디오 신호에 다운믹스게인을 적용(1104)하고, 상기 공간 정보를 이용하여 상기 다운믹스게인이 적용된 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환(1105)한다.
지금까지 본 발명에 대하여 몇몇 실시예들을 들어 구체적으로 설명하였으나, 상기 실시예들은 본 발명을 이해하기 위한 설명을 위해 제시된 것이며, 본 발명의 범위가 상기 실시예에 제한되는 것은 아니다. 당업자라면 본 발명의 기술적 사상의 범위를 벗어나지 않고도 다양한 변형이 가능함을 이해할 수 있을 것이며, 본 발명의 범위는 첨부된 특허청구범위에 의해서 해석되어야 할 것이다.
이상에서 기술된 것과 같이, 본 발명에 따른 멀티채널 오디오 신호를 코딩하는데 있어서, 멀티채널 오디오 신호에 클리핑방지게인을 적용한 후에 다운믹스하여 비트스트림을 구성하거나, 또는 멀티채널 오디오 신호를 다운믹스한 후에 클리핑방지게인을 적용하여 비트스트림을 구성하고, 디코딩 과정에서 멀티채널 오디오 신호 또는 다운믹스 신호에 다운믹스게인을 적용함으로써, 멀티채널 오디오 신호를 다운믹스하는 과정에서 발생되는 클리핑 문제를 효과적으로 방지할 수 있다.
또한, 상기 클리핑방지게인 및 다운믹스게인을 전체 비트스트림, 일정한 구간, 또는 프레임별로 사용하거나, 클리핑복구정보와 함께 사용함으로써 멀티채널 오디오 신호를 다운믹스하는 과정에서 발생되는 클리핑 문제를 효과적으로 방지할 수 있다.

Claims (28)

  1. 멀티채널 오디오 신호를 인코딩하는 방법에 있어서,
    (a) 상기 멀티채널 오디오 신호에 클리핑방지게인을 적용한 후에, 다운믹스 과정을 진행하여 다운믹스 오디오 신호를 생성하는 단계;
    (b) 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 단계; 및
    (c) 상기 다운믹스오디오신호 및 공간 정보를 이용하여 전체 비트스트림을 생성하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  2. 멀티채널 오디오 신호를 인코딩하는 방법에 있어서,
    (a) 상기 멀티채널 오디오 신호를 다운믹스하여 다운믹스 오디오 신호를 생성하고, 상기 다운믹스 오디오 신호에 클리핑방지게인을 적용하는 단계;
    (b) 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 단계; 및
    (c) 상기 클리핑방지게인이 적용된 다운믹스오디오신호 및 공간 정보를 포함하는 전체 비트스트림을 생성하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  3. 멀티채널 오디오 신호를 인코딩하는 방법에 있어서,
    (a) 상기 멀티채널 오디오 신호를 다운믹스하는 과정에서 클리핑방지게인을 적용하는 단계;
    (b) 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 단계; 및
    (c) 상기 클리핑방지게인이 적용된 다운믹스오디오신호 및 공간 정보를 포함하는 전체 비트스트림을 생성하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  4. 제 1 항 내지 제 3 항 중 어느 하나의 항에 있어서,
    상기 인코딩 방법은,
    상기 (a)단계에 앞서, 상기 멀티채널 오디오 신호의 하나 이상의 채널에 각 채널별 게인을 적용하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  5. 제 1 항 내지 제 3 항 중 어느 하나의 항에 있어서,
    상기 클리핑방지게인은 ⅰ)전체적으로 적용되거나, ⅱ)일정한 간격마다 가변적으로 적용되거나, ⅲ)프레임마다 가변적으로 적용되거나, 또는 ⅳ) 상기 ⅰ),ⅱ),ⅲ)을 조합하여 적용되는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  6. 제 5 항에 있어서,
    상기 클리핑방지게인은 프레임마다 미리 정해진 1단계 값을 초과하지 못하거 나, 또는 특정한 수의 프레임마다 1단계 변화만이 가능한 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  7. 제 1 항 내지 제 3 항 중 어느 하나의 항에 있어서,
    상기 (c)단계는,
    프레임별로 클리핑복구정보(Clipping Restoration Information)를 상기 전체 비트스트림에 삽입하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  8. 제 3 항에 있어서,
    상기 클리핑방지게인은 다운믹스과정 중 QMF도메인(domain) 단계에서 적용되는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  9. 멀티채널 오디오 신호로 디코딩하는 방법에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신하는 단계;
    (b) 상기 비트스트림을 디코딩하여 공간 정보를 추출하고, 추출된 상기 공간 정보를 이용하여 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환하는 단계; 및
    (c) 상기 멀티채널 오디오 신호에 다운믹스게인을 적용하는 단계;를 포함하 는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  10. 멀티채널 오디오 신호로 디코딩하는 방법에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신하는 단계; 및
    (b) 상기 비트스트림으로부터 다운믹스 오디오 신호를 추출하고, 추출된 상기 다운믹스 오디오 신호에 다운믹스게인(Downmix Gain)을 적용하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  11. 멀티채널 오디오 신호로 디코딩하는 방법에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신하는 단계; 및
    (b) 상기 비트스트림으로부터 다운믹스 오디오 신호를 추출하고, 추출된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 바꾸는 과정에서 다운믹스게인(Downmix Gain)을 적용하는 단계;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  12. 제 9 항에 있어서,
    상기 (c)단계는,
    상기 멀티채널 오디오 신호의 하나 이상의 채널에 각 채널별 다운믹스게인을 적용하는 단계를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  13. 제 9 항 내지 제 11 항 중 어느 하나의 항에 있어서,
    상기 다운믹스게인은 ⅰ)전체적으로 적용되거나, ⅱ)일정한 간격마다 가변적으로 적용되거나, ⅲ)프레임마다 가변적으로 적용되거나, 또는 ⅳ) 상기 ⅰ),ⅱ),ⅲ)을 조합하여 적용되는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  14. 제 12 항에 있어서,
    상기 다운믹스게인은 프레임마다 미리 정해진 1단계 값을 초과하지 못하거나, 또는 일정한 수의 프레임마다 1단계 변화만이 가능한 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  15. 제 9 항에 있어서,
    상기 (c)단계는,
    상기 비트스트림에 포함된 프레임별로 클리핑복구정보(Clipping Restoration Gain)를 추출하는 단계; 및
    추출된 상기 클리핑복구정보를 이용하여 상기 다운믹스게인이 적용된 멀티채널 오디오 신호에 클리핑복구를 수행하는 단계;를 더 포함하는 것을 특징으로 하 는, 멀티채널 오디오 신호로 디코딩하는 방법.
  16. 제 10 항 또는 제 11 항에 있어서,
    상기 (b)단계는,
    상기 비트스트림에 포함된 프레임별로 클리핑복구정보(Clipping Restoration Gain)를 추출하는 단계; 및
    추출된 상기 클리핑복구정보를 이용하여 상기 다운믹스게인이 적용된 멀티채널 오디오 신호에 클리핑복구를 수행하는 단계;를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  17. 제 10 항 또는 제 11 항에 있어서,
    상기 디코딩 방법은
    상기 비트스트림을 디코딩하여 공간정보를 추출하는 단계; 및
    추출된 상기 공간 정보를 이용하여 상기 다운믹스게인이 적용된 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환하는 단계;를 더 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  18. 제 17 항에 있어서,
    상기 디코딩 방법은,
    상기 멀티채널 오디오 신호의 하나 이상의 채널에 각 채널별 다운믹스게인을 적용하는 것을 특징으로 하는, 멀티채널 오디오 신호로 디코딩하는 방법.
  19. 제 11 항에 있어서,
    상기 다운믹스게인은 다운믹스 신호를 멀티채널로 바꾸는 과정 중 QMF도메인(domain) 단계에서 적용되는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 방법.
  20. 오디오 신호를 생성함에 있어서,
    상기 오디오 신호는 다운믹스 오디오 신호를 포함하도록 생성하되,
    상기 다운믹스 오디오 신호는 클리핑방지게인을 적용한 후에 다운믹스되어 생성되는 것을 특징으로 하는, 오디오 신호의 생성방법.
  21. 오디오 신호를 생성함에 있어서,
    상기 오디오 신호는 다운믹스 오디오 신호를 포함하도록 생성하되,
    상기 다운믹스 오디오 신호는 다운믹스 된 후에 클리핑방지게인이 적용되도록 생성되는 것을 특징으로 하는, 오디오 신호의 생성방법.
  22. 오디오 신호를 생성함에 있어서,
    상기 오디오 신호는 다운믹스 오디오 신호를 포함하도록 생성하되,
    상기 다운믹스 오디오 신호는 다운믹스하는 과정에서 클리핑방지게인이 적용 되도록 생성되는 것을 특징으로 하는, 오디오 신호의 생성방법.
  23. 멀티채널 오디오 신호의 인코딩 장치에 있어서,
    (a) 상기 멀티채널 오디오 신호에 클리핑방지게인을 적용한 후에, 다운믹스 과정을 진행하여 다운믹스 오디오 신호를 생성하는 다운믹스부;
    (b) 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 공간정보발생부; 및
    (c) 상기 다운믹스오디오신호 및 공간 정보를 이용하여 전체 비트스트림을 생성하는 비트스트림 포맷터;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 장치.
  24. 멀티채널 오디오 신호의 인코딩 장치에 있어서,
    (a) 상기 멀티채널 오디오 신호를 다운믹스하여 다운믹스 오디오 신호를 생성하고, 상기 다운믹스 오디오 신호에 클리핑방지게인을 적용하는 다운믹스부;
    (b) 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 공간정보발생부; 및
    (c) 상기 클리핑방지게인이 적용된 다운믹스오디오신호 및 공간 정보를 포함하는 전체 비트스트림을 생성하는 비트스트림 포맷터;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 장치.
  25. 멀티채널 오디오 신호의 인코딩 장치에 있어서,
    (a) 상기 멀티채널 오디오 신호를 다운믹스하는 과정에서 클리핑방지게인을 적용하는 다운믹스부;
    (b) 상기 멀티채널 오디오 신호로부터 공간 정보를 추출하는 공간정보발생부; 및
    (c) 상기 클리핑방지게인이 적용된 다운믹스오디오신호 및 공간 정보를 포함하는 전체 비트스트림을 생성하는 비트스트림 포맷터;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 인코딩 장치.
  26. 멀티채널 오디오 신호의 디코딩 장치에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신하는 비트스트림수신부;
    (b) 상기 비트스트림을 디코딩하여 공간 정보를 추출하고, 추출된 상기 공간 정보를 이용하여 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 변환하는 오디오디코딩 및 멀티채널생성부; 및
    (c) 상기 멀티채널 오디오 신호에 다운믹스게인을 적용하는 다운믹스게인적용부;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 장치.
  27. 멀티채널 오디오 신호의 디코딩 장치에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신하는 비트스트림수신부; 및
    (b) 상기 비트스트림으로부터 다운믹스 오디오 신호를 추출하고, 추출된 상기 다운믹스 오디오 신호에 다운믹스게인(Downmix Gain)을 적용하는 다운믹스게인적용부;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 장치.
  28. 멀티채널 오디오 신호의 디코딩 장치에 있어서,
    (a) 다운믹스 오디오 신호 및 공간 정보를 포함하는 비트스트림을 수신하는 비트스트림수신부; 및
    (b) 상기 비트스트림으로부터 다운믹스 오디오 신호를 추출하고, 추출된 상기 다운믹스 오디오 신호를 멀티채널 오디오 신호로 바꾸는 과정에서 다운믹스게인(Downmix Gain)을 적용하는 다운믹스게인적용부;를 포함하는 것을 특징으로 하는, 멀티채널 오디오 신호의 디코딩 장치.
KR1020060030671A 2005-06-30 2006-04-04 멀티채널 오디오 코딩에서 클리핑 복원방법 KR20070003545A (ko)

Priority Applications (26)

Application Number Priority Date Filing Date Title
EP06757751A EP1913576A2 (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
TW95124111A TWI376107B (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
CN200680029607.6A CN101243491B (zh) 2005-06-30 2006-06-30 用于编码和解码音频信号的装置及其方法
JP2008519178A JP2009500656A (ja) 2005-06-30 2006-06-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
MYPI20063145A MY157901A (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
EP06757748A EP1946294A2 (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
TW098105155A TWI409803B (zh) 2005-06-30 2006-06-30 音頻訊號之編碼及解碼方法及其裝置
US11/994,317 US8082157B2 (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
US11/994,311 US8073702B2 (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
PCT/KR2006/002579 WO2007004830A1 (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
MYPI20063141 MY149615A (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
TW95124112A TWI314722B (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
EP06757752.8A EP1913577B1 (en) 2005-06-30 2006-06-30 Apparatus for encoding an audio signal and method thereof
CN2006800292910A CN101297352B (zh) 2005-06-30 2006-06-30 用于编码和解码音频信号的装置及其方法
PCT/KR2006/002578 WO2007004829A2 (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
PCT/KR2006/002575 WO2007004828A2 (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
JP2008519180A JP5227794B2 (ja) 2005-06-30 2006-06-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
CA2613731A CA2613731C (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
AU2006266655A AU2006266655B2 (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
MYPI20063144 MY145249A (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
TW95124113A TWI319868B (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
US11/994,315 US8494667B2 (en) 2005-06-30 2006-06-30 Apparatus for encoding and decoding audio signal and method thereof
JP2008519179A JP2009500657A (ja) 2005-06-30 2006-06-30 オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
CN2006800293985A CN101243488B (zh) 2005-06-30 2006-06-30 用于编码和解码音频信号的装置及其方法
HK09101392.3A HK1123623A1 (en) 2005-06-30 2009-02-13 Apparatus for encoding and decoding audio signal and method thereof
HK09103907.7A HK1127664A1 (en) 2005-06-30 2009-04-28 Apparatus for encoding and decoding audio signal and method thereof

Applications Claiming Priority (14)

Application Number Priority Date Filing Date Title
US69500705P 2005-06-30 2005-06-30
US60/695,007 2005-06-30
US74860805P 2005-12-09 2005-12-09
US60/748,608 2005-12-09
US75700406P 2006-01-09 2006-01-09
US60/757,004 2006-01-09
US75823606P 2006-01-12 2006-01-12
US60/758,236 2006-01-12
US75860906P 2006-01-13 2006-01-13
US60/758,609 2006-01-13
US75962306P 2006-01-18 2006-01-18
US60/759,623 2006-01-18
US76035906P 2006-01-20 2006-01-20
US60/760,359 2006-01-20

Publications (1)

Publication Number Publication Date
KR20070003545A true KR20070003545A (ko) 2007-01-05

Family

ID=37870364

Family Applications (5)

Application Number Title Priority Date Filing Date
KR1020060030673A KR20070003547A (ko) 2005-06-30 2006-04-04 소프트클리핑에 의한 멀티채널 오디오 코딩에서의 클리핑복원방법
KR1020060030653A KR20070003544A (ko) 2005-06-30 2006-04-04 아비트러리다운믹스게인을 이용한 클리핑복원
KR1020060030652A KR20070003543A (ko) 2005-06-30 2006-04-04 레지듀얼 코딩에 의한 클리핑복원
KR1020060030672A KR20070003546A (ko) 2005-06-30 2006-04-04 멀티채널 오디오 코딩에서 클리핑복원정보를 이용한 클리핑복원방법
KR1020060030671A KR20070003545A (ko) 2005-06-30 2006-04-04 멀티채널 오디오 코딩에서 클리핑 복원방법

Family Applications Before (4)

Application Number Title Priority Date Filing Date
KR1020060030673A KR20070003547A (ko) 2005-06-30 2006-04-04 소프트클리핑에 의한 멀티채널 오디오 코딩에서의 클리핑복원방법
KR1020060030653A KR20070003544A (ko) 2005-06-30 2006-04-04 아비트러리다운믹스게인을 이용한 클리핑복원
KR1020060030652A KR20070003543A (ko) 2005-06-30 2006-04-04 레지듀얼 코딩에 의한 클리핑복원
KR1020060030672A KR20070003546A (ko) 2005-06-30 2006-04-04 멀티채널 오디오 코딩에서 클리핑복원정보를 이용한 클리핑복원방법

Country Status (1)

Country Link
KR (5) KR20070003547A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101388540B1 (ko) * 2009-06-25 2014-04-23 후아웨이 테크놀러지 컴퍼니 리미티드 클리핑 제어를 위한 방법 및 장치
EP3582218A1 (en) * 2013-02-21 2019-12-18 Dolby International AB Methods for parametric multi-channel encoding

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
KR100936126B1 (ko) * 2009-05-25 2010-01-12 주식회사 이머시스 휴대기기의 음향 퀄리티를 향상시키는 장치 및 방법
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
CN103795448B (zh) * 2012-10-31 2017-09-08 中国移动通信集团公司 接口速率的调整方法、数据处理方法、基站设备与系统
CN104267257B (zh) * 2014-09-30 2017-02-01 广东电网有限责任公司电力科学研究院 基于点频滤波器的信号幅频谱检测方法和系统
CN104267259B (zh) * 2014-09-30 2017-01-18 广东电网有限责任公司电力科学研究院 电力谐波测量方法和系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101388540B1 (ko) * 2009-06-25 2014-04-23 후아웨이 테크놀러지 컴퍼니 리미티드 클리핑 제어를 위한 방법 및 장치
US8862257B2 (en) 2009-06-25 2014-10-14 Huawei Technologies Co., Ltd. Method and device for clipping control
EP3582218A1 (en) * 2013-02-21 2019-12-18 Dolby International AB Methods for parametric multi-channel encoding
US10643626B2 (en) 2013-02-21 2020-05-05 Dolby International Ab Methods for parametric multi-channel encoding
US10930291B2 (en) 2013-02-21 2021-02-23 Dolby International Ab Methods for parametric multi-channel encoding
US11488611B2 (en) 2013-02-21 2022-11-01 Dolby International Ab Methods for parametric multi-channel encoding
US11817108B2 (en) 2013-02-21 2023-11-14 Dolby International Ab Methods for parametric multi-channel encoding
US12100404B2 (en) 2013-02-21 2024-09-24 Dolby International Ab Methods for parametric multi-channel encoding

Also Published As

Publication number Publication date
KR20070003543A (ko) 2007-01-05
KR20070003544A (ko) 2007-01-05
KR20070003546A (ko) 2007-01-05
KR20070003547A (ko) 2007-01-05

Similar Documents

Publication Publication Date Title
RU2406166C2 (ru) Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов
CA2645915C (en) Methods and apparatuses for encoding and decoding object-based audio signals
JP5081838B2 (ja) オーディオ符号化及び復号
US8917874B2 (en) Method and apparatus for decoding an audio signal
EP2320414B1 (en) Parametric joint-coding of audio sources
KR101218776B1 (ko) 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
US8073702B2 (en) Apparatus for encoding and decoding audio signal and method thereof
US20080212803A1 (en) Apparatus For Encoding and Decoding Audio Signal and Method Thereof
KR20070003545A (ko) 멀티채널 오디오 코딩에서 클리핑 복원방법
EP4036914A1 (en) Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering
KR20070003593A (ko) 멀티채널 오디오 신호의 인코딩 및 디코딩 방법
KR20060109297A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20070075237A (ko) 멀티채널 오디오 신호의 인코딩 및 디코딩 방법
KR20070025903A (ko) 멀티채널 오디오 코딩에서 효과적인 레지듀얼 신호의파라미터 밴드 수 비트스트림 구성방법
KR20070076363A (ko) 오디오 신호의 인코딩 및 디코딩 방법
WO2006011367A1 (ja) オーディオ信号符号化装置および復号化装置
KR20070037974A (ko) 멀티채널 오디오 코딩에서 효과적인 넌가이디드 코딩의파라미터 밴드 수 비트스트림 구성방법