[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR100923156B1 - 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법 - Google Patents

멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법 Download PDF

Info

Publication number
KR100923156B1
KR100923156B1 KR1020070042787A KR20070042787A KR100923156B1 KR 100923156 B1 KR100923156 B1 KR 100923156B1 KR 1020070042787 A KR1020070042787 A KR 1020070042787A KR 20070042787 A KR20070042787 A KR 20070042787A KR 100923156 B1 KR100923156 B1 KR 100923156B1
Authority
KR
South Korea
Prior art keywords
multichannel audio
bitstream
signal
channel
decoding
Prior art date
Application number
KR1020070042787A
Other languages
English (en)
Other versions
KR20070107615A (ko
Inventor
서정일
백승권
장인선
장대영
홍진우
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20070107615A publication Critical patent/KR20070107615A/ko
Application granted granted Critical
Publication of KR100923156B1 publication Critical patent/KR100923156B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Stereophonic System (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법에 관한 것임.
2. 발명이 해결하고자 하는 기술적 과제
멀티채널 오디오 신호를 디코딩하면서 동시에 음질을 향상시키는 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법을 제공함.
3. 발명의 해결방법의 요지
입력 신호인 다중화된 비트스트림을 낮은 샘플링 주파수의 멀티채널 오디오 비트스트림 및 SAC(Spatial Audio Coding) 비트스트림 및 SBR(Spectral Band Replication) 비트스트림으로 역다중화하는 비트스트림 역다중화부; 상기 멀티채널 오디오 비트스트림을 디코딩하여 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 멀티채널 오디오 디코딩부; 상기 다운믹스 신호 및 상기 SBR 비트스트림을 SBR 방식으로 디코딩하여 고주파 영역이 복원된 다운믹스 신호를 출력하는 SBR 디코딩부; 및 상기 SAC 비트스트림에 포함된 공간큐 및 상기 고주파 영역이 복원된 다운믹스 신호를 이용하여 상기 멀티채널 오디오 신호를 SAC 방식으로 디코딩하여 높은 샘플링 주파수의 멀티채널 오디오 신호를 출력하는 SAC 디코딩부를 포함함.
4. 발명의 중요한 용도
멀티채널 오디오 신호의 인코딩 및 디코딩에 이용됨.
멀티채널, 오디오, 인코딩, 디코딩, SAC, SBR

Description

멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법{System and Method for Encoding and Decoding for multi-channel audio}
도 1은 종래의 스테레오 오디오 신호 디코더부의 일실시예 구성도,
도 2는 종래의 멀티채널 오디오 신호 디코더부의 일실시예 구성도,
도 3은 본 발명의 일실시예에 따른 멀티채널 오디오 디코딩 시스템의 구성도,
도 4는 상기 도 3의 멀티채널 오디오 디코딩부에 AAC 기술이 적용된 경우의 상세 구성도,
도 5는 본 발명의 일실시예에 따른 멀티채널 오디오 인코딩 시스템의 구성도,
도 6은 상기 도 5의 멀티채널 오디오 인코딩부에 AAC 기술이 적용된 경우의 상세 구성도.
도 7은 본 발명에 따른 멀티채널 오디오 비트스트림의 일실시예 구성도.
도 8은 도 3의 멀티채널 오디오 디코딩 시스템에서 수행되는 디코딩 과정을 나타내는 흐름도.
도 9는 도 5의 멀티채널 오디오 인코딩 시스템에서 수행되는 인코딩 과정을 나타내는 흐름도.
본 발명은 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법에 관한 것으로, 보다 상세하게는 SAC(Spatial Audio Coding)와 SBR(Spectral Band Replication)을 이용함으로써 기존의 멀티채널 오디오 수신기와 호환성을 유지하면서 고품질의 멀티채널 오디오 신호를 인코딩 및 디코딩하는 방법에 관한 것이다.
도 1은 종래의 스테레오 오디오 신호 디코더의 일실시예 구성도이다.
도 1에 도시된 바와 같이, MPEG-1 Audio Layer II 디코더(101)는 입력신호인 MPEG-2 Layer II 비트스트림으로부터 MPEG-1 Layer II 비트스트림만을 디코딩하여 스테레오 오디오 신호를 출력한다. 종래의 스테레오 오디오 신호 디코더는 24kHz, 32kHz, 44.1kHz, 48kHz의 다양한 샘플링 주파수를 지원하면서 고품질의 오디오 신호을 제공할 수 있으나 멀티채널 신호를 디코딩 할 수 없다는 단점이 있다.
도 2는 종래의 멀티채널 DAB 수신기에서 오디오 신호 디코더의 일실시예 구성도이다.
도 2에 도시된 바와 같이, MPEG-2 Audio Layer II 디코더(201)는 입력 신호인 MPEG-2 Layer II 비트스트림으로부터 멀티채널 오디오 신호를 출력한다.
한편, DAB 표준에 따르면 멀티채널 오디오 신호는 스테레오 오디오 신호에 대한 샘플링 주파수의 1/2로 샘플링된다. 따라서 도 2의 멀티채널 오디오 신호 디코더(201)로 DAB 표준에 따른 오디오 신호가 입력되는 경우, 스테레오 신호에 비하여 1/2로 다운샘플링 되어 음질이 열화된 멀티채널 오디오 신호 및 스테레오 오디오 신호가 출력된다는 단점이 있다.
본 발명은, 상기 문제점을 해결하기 위하여 제안된 것으로, 멀티채널 오디오 신호를 디코딩하면서 동시에 음질을 향상시키는 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법을 제공하는데 그 목적이 있다.
상기 목적을 달성하기 위한 본 발명은, 멀티채널 오디오 디코딩 시스템에 있어서, 입력 신호인 다중화된 비트스트림을 낮은 샘플링 주파수의 멀티채널 오디오 비트스트림 및 SAC(Spatial Audio Coding) 비트스트림 및 SBR(Spectral Band Replication) 비트스트림으로 역다중화하는 비트스트림 역다중화부; 상기 멀티채널 오디오 비트스트림을 디코딩하여 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 멀티채널 오디오 디코딩부; 상기 다운믹스 신호 및 상기 SBR 비트스트림을 SBR 방식으로 디코딩하여 고주파 영역이 복원된 다운믹스 신호를 출력하는 SBR 디코딩부; 및 상기 SAC 비트스트림에 포함된 공간큐 및 상기 고주파 영역이 복원된 다운믹스 신호를 이용하여 상기 멀티채널 오디오 신호를 SAC 방식으로 디코딩하여 높은 샘플링 주파수의 멀티채널 오디오 신호를 출력하는 SAC 디코딩부를 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명은, 멀티채널 오디오 인코딩 시스템 에 있어서, 입력 신호인 높은 샘플링 주파수의 멀티채널 오디오 신호의 샘플링 주파수를 다운샘플링하는 다운샘플링부; 상기 다운샘플링된 멀티채널 오디오 신호를 인코딩하여 멀티채널 오디오 비트스트림으로 출력하는 멀티채널 오디오 인코딩부; 상기 입력 신호인 멀티채널 오디오 신호를 SAC 방식으로 인코딩하여 SAC 비트스트림 및 다운믹스 신호를 출력하는 SAC 인코딩부; 상기 SAC 인코딩부로부터 출력되는 다운믹스 신호를 이용하여 상기 입력 신호인 멀티채널 오디오 신호를 SBR 방식으로 인코딩하여 SBR 비트스트림을 출력하는 SBR 인코딩부; 및 상기 멀티채널 오디오 비트스트림 및 상기 SAC 비트스트림 및 상기 SBR 비트스트림을 다중화하는 비트스트림 다중화부를 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명은, 멀티채널 오디오 디코딩 방법에 있어서, 입력 신호인 다중화된 비트스트림을 낮은 샘플링 주파수의 멀티채널 오디오 비트스트림 및 SAC(Spatial Audio Coding) 비트스트림 및 SBR(Spectral Band Replication) 비트스트림으로 역다중화하는 비트스트림 역다중화단계; 상기 멀티채널 오디오 비트스트림을 디코딩하여 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 멀티채널 오디오 디코딩단계; 상기 다운믹스 신호 및 상기 SBR 비트스트림을 SBR 방식으로 디코딩하여 고주파 영역이 복원된 다운믹스 신호를 출력하는 SBR 디코딩단계; 및 상기 SAC 비트스트림에 포함된 공간큐 및 상기 고주파 영역이 복원된 다운믹스 신호를 이용하여 상기 멀티채널 오디오 신호를 SAC 방식으로 디코딩하여 높은 샘플링 주파수의 멀티채널 오디오 신호를 출력하는 SAC 디코딩단계를 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명은, 멀티채널 오디오 인코딩 방법에 있어서, 입력 신호인 높은 샘플링 주파수의 멀티채널 오디오 신호의 샘플링 주파수를 다운샘플링하는 다운샘플링단계; 상기 다운샘플링된 멀티채널 오디오 신호를 인코딩하여 멀티채널 오디오 비트스트림으로 출력하는 멀티채널 오디오 인코딩단계; 상기 입력 신호인 멀티채널 오디오 신호를 SAC 방식으로 인코딩하여 SAC 비트스트림 및 다운믹스 신호를 출력하는 SAC 인코딩단계; 상기 SAC 인코딩단계에 의해 출력되는 다운믹스 신호를 이용하여 상기 입력 신호인 멀티채널 오디오 신호를 SBR 방식으로 인코딩하여 SBR 비트스트림을 출력하는 SBR 인코딩단계; 및 상기 멀티채널 오디오 비트스트림 및 상기 SAC 비트스트림 및 상기 SBR 비트스트림을 다중화하는 비트스트림 다중화단계를 포함한다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 3은 본 발명의 일실시예에 따른 멀티채널 오디오 디코딩 시스템의 구성도이다.
도 3에 도시된 바와 같이, 본 발명에 따른 멀티채널 오디오 디코딩 시스템은 비트스트림 역다중화부(Bitstream De-Multiplexer, 301), 멀티채널 오디오 디코딩부(303), SBR 디코딩부(305), SAC 디코딩부(307)를 포함한다.
본 발명에 따른 디코딩 시스템의 입력 신호인 다중화된 비트스트림은 낮은 샘플링 주파수(Fs, 예를 들어, 24kHz)의 멀티채널 오디오 비트스트림, SBR 비트스트 림 및 SAC 비트스트림이 멀티플렉싱된 비트스트림이다. 이러한 다중화된 비트스트림의 생성에 대해서는 본 발명에 따른 멀티채널 오디오 인코딩 시스템에서 설명된다. 상기 다중화된 비트스트림은 DAB 오디오 신호가 될 수 있다.
상기 비트스트림 역다중화부(301)는 상기 입력 신호인 다중화된 비트스트림으로부터 SAC 비트스트림 및 SBR 비트스트림을 추출한다.
상기 멀티채널 오디오 디코딩부(303)는 상기 입력 신호인 다중화된 비트스트림을 디코딩하여 낮은 샘플링 주파수(예를 들어, 24kHz)를 갖는 스테레오 또는 모노 다운믹스 신호 및 멀티채널 오디오 신호를 출력한다.
상기 멀티채널 오디오 비트스트림이 MPEG-2 Layer II 비트스트림 또는 AAC 비트스트림인 경우, 상기 멀티채널 오디오 디코딩부(303)에는 MPEG-2 Audio Layer II 디코딩 기술 또는 AAC(Advanced Audio Coding) 디코딩 기술이 이용될 수 있다.
상기 SBR 디코딩부(305)는 상기 멀티채널 오디오 디코딩부(303)로부터 출력된 스테레오 또는 모노 다운믹스 신호 및 상기 비트스트림 역다중화부(301)로부터 추출된 SBR 비트스트림을 이용하여 고주파 영역이 복원된 다운믹스 스테레오 또는 모노 신호(예를 들면, Fs = 48kHz)를 디코딩한다.
SBR(Spectral Band Replication)는 오디오 신호의 저주파 대역 성분을 분석하여 고주파 대역 성분을 복원하는 기술이다. SBR에 대해서는 국제 표준[ISO/IEC 14496-3 AMENDMENT 1: Bandwidth Extension]에 개시되어 있다.
상기 SAC 디코딩부(307)는 상기 비트스트림 역다중화부(301)로부터 추출된 SAC 비트스트림에 포함된 공간큐(spatial cue) 및 상기 SBR 디코딩부(305)로부터 출력된 다운믹스 스테레오 또는 모노 신호를 이용하여 오디오 신호에 대한 정보를 추출하고 제어함으로써, 상기 멀티채널 오디오 디코딩부(303)로부터 출력된 낮은 샘플링 주파수(예를 들어, 24kHz)를 갖는 멀티채널 오디오 신호를 높은 샘플링 주파수(예를 들어, 48kHz)를 갖는 멀티채널 오디오 신호로 디코딩한다.
SAC(Spatial Audio Coding)는 멀티채널 오디오 신호를 다운믹스된 모노 또는 스테레오 신호 및 공간큐 정보로 표현, 전송 및 복원하는 방법으로 낮은 비트율에서도 고품질의 멀티채널 오디오 신호를 전송할 수 있다.
상기 스테레오 또는 모노 다운믹스 신호 및 SAC 비트스트림에 포함된 공간큐(spatial cue) 파라미터를 이용하여 멀티채널 오디오 신호를 디코딩하는 방법은 Baumgarte와 Faller의 논문(C. Faller and F. Baumgarte, “Binaural Cue Coding applied to stereo and multi-channel audio compression,” 112th AES Convention, Munich, prepreint 5574, May 3002) 이나 MPEG Surround 표준 (ISO/IEC JTC1/SC29/WG11, N7947, ISO/IEC 23003-1:3006/FCD, MPEG Surround, Jan., 3006) 에 개시되어 있는 방법을 적용할 수 있으며, 이에 따라 청각적으로 원음과 차이가 없는 멀티채널 오디오 신호를 디코딩할 수 있다.
도 4는 상기 도 3의 멀티채널 오디오 디코딩부(303)에 AAC 기술이 적용된 경우의 상세 구성도이다.
AAC(Advanced Audio Coding)는 MPEG-2 또는 MPEG-4에서 사용되는 오디오 신호 압축 방식으로, MPEG-1에 비해 압축률이 높으면서도 음질이 열화되지 않으며, 다양한 대역과 많은 채널에 대응할 수 있는 특징이 있다.
도 4에 도시된 바와 같이, 상기 멀티채널 오디오 디코딩부(303)는 AAC 디코더(401), 채널 리믹서(403)를 포함한다.
상기 AAC 디코더(401)는 상기 비트스트림 역다중화부(301)으로부터 출력된 멀티채널 오디오 비트스트림(AAC 비트스트림)으로부터 낮은 샘플링 주파수(예를 들어, 24kHz)를 갖는 스테레오 또는 모노 다운믹스 신호 및 멀티채널(LO, RO, T, Q1, Q2) 오디오 신호를 디코딩한다.
상기 채널 리믹서(403)는 상기 AAC 디코더(401)로부터 디코딩된 멀티채널(LO, RO, T, Q1, Q2) 오디오 신호를 멀티채널(L, R, C, Ls, Rs) 오디오 신호로 리믹싱하여 상기 SAC 디코딩부(307)에 전달한다.
상기 도 3의 멀티채널 오디오 디코딩 시스템으로 입력되는 다중화된 비트스트림은 후술되는 바와 같이 본 발명에 따른 멀티채널 오디오 인코딩 시스템에 의해 생성된다.
도 5는 본 발명의 일실시예에 따른 멀티채널 오디오 인코딩 시스템의 구성도이다.
도 5에 도시된 바와 같이, 본 발명에 따른 멀티채널 오디오 인코더 시스템은 다운샘플링부(501), 멀티채널 오디오 인코딩부(503), SAC 인코딩부(505), SBR 인코딩부(507), 비트스트림 다중화부(509)를 포함한다.
상기 다운샘플링부(501)는 입력 신호인 멀티채널 오디오 신호(예를 들면, Fs = 48kHz)의 샘플링 주파수를 1/2배로 다운샘플링하여 멀티채널 오디오 신호(예를 들면, Fs = 24kHz)를 출력한다.
상기 멀티채널 오디오 인코딩부(503)는 상기 다운샘플링부(501)로부터 출력되는 멀티채널 오디오 신호(예를 들면, Fs = 24kHz)를 멀티채널 오디오 비트스트림으로 인코딩하고, 상기 인코딩 과정에서 스테레오(또는 모노) 다운믹스 신호(예를 들면, Fs = 24kHz)를 생성한다.
상기 멀티채널 오디오 인코딩부(303)에는 MPEG-2 Audio Layer II 인코딩 기술 또는 AAC 인코딩 기술이 이용될 수 있으며, 이 경우, 상기 멀티채널 오디오 비트스트림은 MPEG-2 Layer II 비트스트림 또는 AAC 비트스트림이다.
상기 SAC 인코딩부(505)는 입력 신호인 멀티채널 오디오 신호로부터 공간큐(spatial cue) 파라미터를 추출하고 인코딩함으로써 SAC 부가정보 비트스트림을 생성하고, 상기 멀티채널 오디오 신호로부터 스테레오(또는 모노) 다운믹스 신호를 생성한다. 이때 SAC 부가정보 비트스트림을 구성하는 공간큐 파라미터는 상기 다운샘플링부(501)의 다운샘플링 과정에서 상쇄된 고주파수 성분만으로 구성된다.
상기 멀티채널 오디오 인코딩부(503) 및 상기 SAC 인코딩부(505)가 멀티채널(예를 들어 5.1채널) 신호(L, R, C, Ls, Rs, Lfe)를 스테레오(또는 모노)로 다운믹스하는 방법은 ITU-R BS. 775-1에서 정의된 방법과 동일하며 아래 [수학식 1]에 기초하여 다운믹스한다.
Figure 112007033094033-pat00001
이때, L0와 R0는 스테레오 다운믹스 신호, L과 R은 좌우 메인채널, C(center)는 중앙 채널, Ls(left surround)는 좌측 서라운드 채널, Rs(right surround)는 우측 서라운드 채널이다. (5.1채널)
상기 SBR 인코딩부(507)는 상기 SAC 인코딩부(505)로부터 출력되는 스테레오(또는 모노) 다운믹스 신호 및 상기 멀티채널 오디오 인코딩부(503)로부터 출력되는 스테레오(또는 모노) 다운믹스 신호를 이용하여 SBR 비트스트림을 생성한다.
상기 비트스트림 다중화부(509)는 상기 멀티채널 오디오 인코딩부(503)로부터 출력되는 멀티채널 오디오 비트스트림 및 상기 SAC 인코딩부(505)로부터 출력되는 SAC 부가정보 비트스트림 및 상기 SBR 인코딩부(507)로부터 출력되는 SBR 비트스트림을 멀티플렉싱하여 다중화된 비트스트림을 생성한다.
상기 다중화된 비트스트림은 DAB 오디오 신호가 될 수 있다.
도 6은 상기 도 5의 멀티채널 오디오 인코딩부(503)에 AAC 기술이 적용된 경우의 상세 구성도이다.
도 6에 도시된 바와 같이, 상기 멀티채널 오디오 인코딩부(503)는 채널 믹서(601) 및 AAC 인코더(603)를 포함한다.
상기 채널 믹서(601)는 상기 다운샘플링부(501)로부터 출력된 멀티채널 오디 오 신호(L, R, C, Ls, Rs)를 상기 [수학식 1] 및 다음의 [수학식 2]에 따라 멀티채널 오디오 신호(LO, RO, T, Q1, Q2)로 믹싱하여 출력한다.
Figure 112007033094033-pat00002
이때, C(center)는 중앙 채널, Ls(left surround)는 좌측 서라운드 채널, Rs(right surround)는 우측 서라운드 채널, T, Q1, Q2는 스테레오 다운믹스 신호를 제외한 나머지 멀티채널 신호이다. (5.1채널)
상기 AAC 인코더(603)는 상기 채널 믹서(601)로부터 출력된 멀티채널 오디오 신호를 AAC 비트스트림으로 인코딩하고, 상기 인코딩 과정에서 스테레오 또는 모노 다운믹스 신호를 생성한다.
도 7은 본 발명에 따른 멀티채널 오디오 비트스트림의 일실시예 구성도로서, 1/2 다운샘플링된 후 MPEG-2 Layer II 표준으로 부호화된 멀티채널 오디오 신호, SBR 비트스트림 및 SAC 비트스트림을 부가데이터 영역(Ancillary Data)에 다중화한 경우의 비트스트림 구성도이다.
도 7에 도시된 바와 같이, 1/2 다운샘플링된 후 MPEG-2 Layer II로 부호화된 멀티채널 오디오 신호(T, Q1, Q2)는 Ancillary Data 1 영역에 다중화되고, 다운믹스 스테레오 신호의 고주파수 영역을 부호화한 SBR 비트스트림은 Ancillary Data 2 영역에 다중화되고, 멀티채널 부호화 정보인 SAC 비트스트림은 Ancillary Data 3 영역에 다중화된다.
도 8은 도 3의 멀티채널 오디오 디코딩 시스템에서 수행되는 디코딩 과정을 나타내는 흐름도이다.
도 8에 도시된 바와 같이, 상기 비트스트림 역다중화부(301)는 상기 입력 신호인 다중화된 비트스트림으로부터 SAC 비트스트림 및 SBR 비트스트림을 추출한다(801).
상기 멀티채널 오디오 디코딩부(303)는 상기 입력 신호인 다중화된 비트스트림을 디코딩하여 낮은 샘플링 주파수를 갖는 스테레오 또는 모노 다운믹스 신호 및 멀티채널 오디오 신호를 출력한다(803).
상기 SBR 디코딩부(305)는 상기 멀티채널 오디오 디코딩부(303)로부터 출력된 스테레오 또는 모노 다운믹스 신호 및 상기 비트스트림 역다중화부(301)로부터 추출된 SBR 비트스트림을 이용하여 고주파 영역이 복원된 다운믹스 스테레오 또는 모노 신호를 디코딩한다(805).
상기 SAC 디코딩부(307)는 상기 비트스트림 역다중화부(301)로부터 추출된 SAC 비트스트림에 포함된 공간큐(spatial cue) 및 상기 SBR 디코딩부(305)로부터 출력된 다운믹스 스테레오 또는 모노 신호를 이용하여 오디오 신호에 대한 정보를 추출하고 제어함으로써, 상기 멀티채널 오디오 디코딩부(303)로부터 출력된 낮은 샘플링 주파수를 갖는 멀티채널 오디오 신호를 높은 샘플링 주파수를 갖는 멀티채널 오디오 신호로 디코딩한다(807).
도 9는 도 5의 멀티채널 오디오 인코딩 시스템에서 수행되는 인코딩 과정을 나타내는 흐름도이다.
도 9에 도시된 바와 같이, 상기 다운샘플링부(501)는 입력 신호인 멀티채널 오디오 신호의 샘플링 주파수를 1/2배로 다운샘플링하여 멀티채널 오디오 신호를 출력한다(901).
상기 SAC 인코딩부(505)는 입력 신호인 멀티채널 오디오 신호로부터 공간큐(spatial cue) 파라미터를 추출하고 인코딩함으로써 SAC 부가정보 비트스트림을 생성하고, 상기 멀티채널 오디오 신호로부터 스테레오(또는 모노) 다운믹스 신호를 생성한다(903).
상기 멀티채널 오디오 인코딩부(503)는 상기 다운샘플링부(501)로부터 출력되는 멀티채널 오디오 신호를 멀티채널 오디오 비트스트림으로 인코딩하고, 상기 인코딩 과정에서 스테레오(또는 모노) 다운믹스 신호를 생성한다(905).
상기 SBR 인코딩부(507)는 상기 SAC 인코딩부(505)로부터 출력되는 스테레오(또는 모노) 다운믹스 신호 및 상기 멀티채널 오디오 인코딩부(503)로부터 출력되는 스테레오(또는 모노) 다운믹스 신호를 이용하여 SBR 비트스트림을 생성한다(907).
상기 비트스트림 다중화부(509)는 상기 멀티채널 오디오 인코딩부(503)로부터 출력되는 멀티채널 오디오 비트스트림 및 상기 SAC 인코딩부(505)로부터 출력되는 SAC 부가정보 비트스트림 및 상기 SBR 인코딩부(507)로부터 출력되는 SBR 비트스트림를 멀티플렉싱하여 다중화된 비트스트림을 생성한다(909).
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
상기와 같은 본 발명은, 모노 또는 스테레오 다운믹스 신호를 제공하므로 종래의 모노, 스테레오 및 멀티채널 오디오 수신기와 호환성을 유지하면서 48kHz의 샘플링 주파수를 지원하는 고품질의 멀티채널 오디오 서비스를 제공할 수 있다. 또한, SBR과 SAC기술을 이용하므로 비트레이트를 줄이면서 음질이 향상된 멀티채널 오디오 신호로 인코딩 및 디코딩할 수 있다.

Claims (22)

  1. 멀티채널 오디오 디코딩 시스템에 있어서,
    입력 신호인 DAB 방식의 다중화된 비트스트림을 SAC(Spatial Audio Coding) 비트스트림 및 SBR(Spectral Band Replication) 비트스트림으로 역다중화하는 비트스트림 역다중화부;
    상기 다중화된 비트스트림을 디코딩하여 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 멀티채널 오디오 디코딩부;
    상기 다운믹스 신호 및 상기 SBR 비트스트림을 SBR 방식으로 디코딩하여 고주파 영역이 복원된 다운믹스 신호를 출력하는 SBR 디코딩부; 및
    상기 SAC 비트스트림에 포함된 공간큐 및 상기 고주파 영역이 복원된 다운믹스 신호를 이용하여 상기 멀티채널 오디오 신호를 SAC 방식으로 디코딩하여 높은 샘플링 주파수의 멀티채널 오디오 신호를 출력하는 SAC 디코딩부
    를 포함하는 멀티채널 오디오 디코딩 시스템.
  2. 삭제
  3. 제1항에 있어서,
    상기 멀티채널 오디오 디코딩부는
    상기 멀티채널 오디오 비트스트림을 디코딩하여 상기 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 AAC 디코더; 및
    상기 AAC 디코더로부터 디코딩된 멀티채널 오디오 신호의 채널을 리믹스하여 상기 SAC 디코딩부로 출력하는 상기 채널 리믹서
    를 포함하는 멀티채널 오디오 디코딩 시스템.
  4. 제1항에 있어서,
    상기 다운믹스 신호는
    스테레오 신호 및 모노 신호 중 어느 하나인
    멀티채널 오디오 디코딩 시스템.
  5. 멀티채널 오디오 인코딩 시스템에 있어서,
    입력 신호인 높은 샘플링 주파수의 멀티채널 오디오 신호의 샘플링 주파수를 다운샘플링하는 다운샘플링부;
    상기 다운샘플링된 멀티채널 오디오 신호를 인코딩하여 멀티채널 오디오 비트스트림으로 출력하는 멀티채널 오디오 인코딩부;
    상기 입력 신호인 멀티채널 오디오 신호를 SAC 방식으로 인코딩하여 SAC 비트스트림 및 다운믹스 신호를 출력하는 SAC 인코딩부;
    상기 SAC 인코딩부로부터 출력되는 다운믹스 신호를 이용하여 상기 입력 신호인 멀티채널 오디오 신호를 SBR 방식으로 인코딩하여 SBR 비트스트림을 출력하는 SBR 인코딩부; 및
    상기 멀티채널 오디오 비트스트림 및 상기 SAC 비트스트림 및 상기 SBR 비트스트림을 다중화하는 DAB 방식의 다중화된 비트스트림을 출력하는 비트스트림 다중화부
    를 포함하는 멀티채널 오디오 인코딩 시스템.
  6. 제5항에 있어서,
    상기 멀티채널 오디오 인코딩부는
    상기 다운샘플링된 멀티채널 오디오 신호의 채널을 믹스하는 채널 믹서; 및
    상기 채널 믹서로부터 출력된 멀티채널 오디오 신호를 디코딩하여 상기 멀티채널 오디오 비트스트림으로 출력하는 AAC 인코더
    를 포함하는 멀티채널 오디오 인코딩 시스템.
  7. 제5항에 있어서,
    상기 멀티채널 오디오 인코딩부는
    상기 다운샘플링된 멀티채널 오디오 신호를 인코딩하여 다운믹스 신호를 더 출력하고,
    상기 SBR 인코딩부는
    상기 멀티채널 오디오 인코딩부로부터 출력되는 다운믹스 신호를 더 이용하여 상기 입력 신호인 멀티채널 오디오 신호를 인코딩하는
    멀티채널 오디오 인코딩 시스템.
  8. 제5항 또는 제7항에 있어서,
    상기 다운믹스 신호는
    스테레오 신호 및 모노 신호 중 어느 하나인
    멀티채널 오디오 인코딩 시스템.
  9. 제5항 또는 제7항에 있어서,
    상기 다운믹스 신호는
    하기 [수학식 1]에 의해 생성되는
    멀티채널 오디오 인코딩 시스템.
    [수학식 1]
    Figure 112007033094033-pat00003
    이때, L0와 R0는 스테레오 다운믹스 신호, L과 R은 좌우 메인채널, C(center)는 중앙 채널, Ls(left surround)는 좌측 서라운드 채널, Rs(right surround)는 우측 서라운드 채널임.
  10. 제6항에 있어서,
    상기 채널 믹서는
    하기 [수학식 2]에 의해 상기 멀티채널 오디오 신호의 채널을 믹스하는
    멀티채널 오디오 인코딩 시스템.
    [수학식 2]
    Figure 112007033094033-pat00004
    Figure 112007033094033-pat00005
    이때, C(center)는 중앙 채널, Ls(left surround)는 좌측 서라운드 채널, Rs(right surround)는 우측 서라운드 채널, T, Q1, Q2는 스테레오 다운믹스 신호를 제외한 나머지 멀티채널 신호임.
  11. 삭제
  12. 멀티채널 오디오 디코딩 방법에 있어서,
    입력 신호인 DAB 방식의 다중화된 비트스트림을 SAC(Spatial Audio Coding) 비트스트림 및 SBR(Spectral Band Replication) 비트스트림으로 역다중화하는 비트스트림 역다중화단계;
    상기 다중화된 멀티채널 오디오 비트스트림을 디코딩하여 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 멀티채널 오디오 디코딩단계;
    상기 다운믹스 신호 및 상기 SBR 비트스트림을 SBR 방식으로 디코딩하여 고주파 영역이 복원된 다운믹스 신호를 출력하는 SBR 디코딩단계; 및
    상기 SAC 비트스트림에 포함된 공간큐 및 상기 고주파 영역이 복원된 다운믹스 신호를 이용하여 상기 멀티채널 오디오 신호를 SAC 방식으로 디코딩하여 높은 샘플링 주파수의 멀티채널 오디오 신호를 출력하는 SAC 디코딩단계
    를 포함하는 멀티채널 오디오 디코딩 방법.
  13. 삭제
  14. 제12항에 있어서,
    상기 멀티채널 오디오 디코딩단계는
    상기 멀티채널 오디오 비트스트림을 디코딩하여 상기 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 AAC 디코딩단계; 및
    상기 AAC 디코딩단계에 의해 디코딩된 멀티채널 오디오 신호의 채널을 리믹스 하여 상기 SAC 디코딩단계로 출력하는 상기 채널 리믹싱단계
    를 포함하는 멀티채널 오디오 디코딩 방법.
  15. 제12항에 있어서,
    상기 다운믹스 신호는
    스테레오 신호 및 모노 신호 중 어느 하나인
    멀티채널 오디오 디코딩 방법.
  16. 멀티채널 오디오 인코딩 방법에 있어서,
    입력 신호인 높은 샘플링 주파수의 멀티채널 오디오 신호의 샘플링 주파수를 다운샘플링하는 다운샘플링단계;
    상기 다운샘플링된 멀티채널 오디오 신호를 인코딩하여 멀티채널 오디오 비트스트림으로 출력하는 멀티채널 오디오 인코딩단계;
    상기 입력 신호인 멀티채널 오디오 신호를 SAC 방식으로 인코딩하여 SAC 비트스트림 및 다운믹스 신호를 출력하는 SAC 인코딩단계;
    상기 SAC 인코딩단계에 의해 출력되는 다운믹스 신호를 이용하여 상기 입력 신호인 멀티채널 오디오 신호를 SBR 방식으로 인코딩하여 SBR 비트스트림을 출력하는 SBR 인코딩단계; 및
    상기 멀티채널 오디오 비트스트림 및 상기 SAC 비트스트림 및 상기 SBR 비트스트림을 다중화하여 DAB 방식의 다중화된 비트스트림을 출력하는 비트스트림 다중화단계
    를 포함하는 멀티채널 오디오 인코딩 방법.
  17. 제16항에 있어서,
    상기 멀티채널 오디오 인코딩단계는
    상기 다운샘플링된 멀티채널 오디오 신호의 채널을 믹스하는 채널 믹싱단계; 및
    상기 채널 믹싱단계에 의해 출력된 멀티채널 오디오 신호를 디코딩하여 상기 멀티채널 오디오 비트스트림으로 출력하는 AAC 인코더
    를 포함하는 멀티채널 오디오 인코딩 방법.
  18. 제16항에 있어서,
    상기 멀티채널 오디오 인코딩단계는
    상기 다운샘플링된 멀티채널 오디오 신호를 인코딩하여 다운믹스 신호를 더 출력하고,
    상기 SBR 인코딩단계는
    상기 멀티채널 오디오 인코딩단계에 의해 출력되는 다운믹스 신호를 더 이용 하여 상기 입력 신호인 멀티채널 오디오 신호를 인코딩하는
    멀티채널 오디오 인코딩 방법.
  19. 제16항 또는 제18항에 있어서,
    상기 다운믹스 신호는
    스테레오 신호 및 모노 신호 중 어느 하나인
    멀티채널 오디오 인코딩 방법.
  20. 제16항 또는 제18항에 있어서,
    상기 다운믹스 신호는
    하기 [수학식 1]에 의해 생성되는
    멀티채널 오디오 인코딩 방법.
    [수학식 1]
    Figure 112007033094033-pat00006
    이때, L0와 R0는 스테레오 다운믹스 신호, L과 R은 좌우 메인채널, C(center)는 중앙 채널, Ls(left surround)는 좌측 서라운드 채널, Rs(right surround)는 우측 서라운드 채널임.
  21. 제17항에 있어서,
    상기 채널 믹싱단계는
    하기 [수학식 2]에 의해 상기 다운샘플링된 멀티채널 오디오 신호의 채널을 믹스하는
    멀티채널 오디오 인코딩 방법.
    [수학식 2]
    Figure 112007033094033-pat00007
    Figure 112007033094033-pat00008
    이때, C(center)는 중앙 채널, Ls(left surround)는 좌측 서라운드 채널, Rs(right surround)는 우측 서라운드 채널, T, Q1, Q2는 스테레오 다운믹스 신호를 제외한 나머지 멀티채널 신호임.
  22. 삭제
KR1020070042787A 2006-05-02 2007-05-02 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법 KR100923156B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20060039671 2006-05-02
KR1020060039671 2006-05-02

Publications (2)

Publication Number Publication Date
KR20070107615A KR20070107615A (ko) 2007-11-07
KR100923156B1 true KR100923156B1 (ko) 2009-10-23

Family

ID=39062909

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070042787A KR100923156B1 (ko) 2006-05-02 2007-05-02 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR100923156B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011078417A1 (ko) * 2009-12-21 2011-06-30 주식회사 인코렙 미디어 편집 장치, 미디어 편집 서비스 제공 방법, 및 이에 사용되는 웹서버

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102037507B (zh) 2008-05-23 2013-02-06 皇家飞利浦电子股份有限公司 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器
BR122021023896B1 (pt) * 2009-10-08 2023-01-10 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Decodificador de sinal de áudio multimodal, codificador de sinal de áudio multimodal e métodos usando uma configuração de ruído com base em codificação de previsão linear
WO2011048094A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio codec and celp coding adapted therefore
KR101697550B1 (ko) 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
KR101641645B1 (ko) 2014-06-11 2016-07-22 전자부품연구원 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템
EP4243015A4 (en) 2021-01-27 2024-04-17 Samsung Electronics Co., Ltd. AUDIO PROCESSING APPARATUS AND METHOD

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005078707A1 (en) * 2004-02-16 2005-08-25 Koninklijke Philips Electronics N.V. A transcoder and method of transcoding therefore
KR20060108520A (ko) * 2005-04-14 2006-10-18 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
KR20070043651A (ko) * 2005-10-20 2007-04-25 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005078707A1 (en) * 2004-02-16 2005-08-25 Koninklijke Philips Electronics N.V. A transcoder and method of transcoding therefore
KR20060108520A (ko) * 2005-04-14 2006-10-18 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
KR20070043651A (ko) * 2005-10-20 2007-04-25 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
AES Convention Paper 'A closer look into MPEG-4 High Efficiency AAC' (2003.10.10-13)*

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011078417A1 (ko) * 2009-12-21 2011-06-30 주식회사 인코렙 미디어 편집 장치, 미디어 편집 서비스 제공 방법, 및 이에 사용되는 웹서버

Also Published As

Publication number Publication date
KR20070107615A (ko) 2007-11-07

Similar Documents

Publication Publication Date Title
EP3503096B1 (en) Apparatus for decoding audio signals and method for decoding audio signals
KR101283783B1 (ko) 고품질 다채널 오디오 부호화 및 복호화 장치
JP5719372B2 (ja) アップミックス信号表現を生成する装置及び方法、ビットストリームを生成する装置及び方法、並びにコンピュータプログラム
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
KR101506837B1 (ko) 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
KR100923156B1 (ko) 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법
TWI544479B (zh) 音訊解碼器、音訊編碼器、用以基於已編碼表示型態提供至少四音訊聲道信號的方法、用以基於至少四音訊聲道信號提供已編碼表示型態的方法、及使用頻寬擴展的電腦程式
RU2355046C2 (ru) Устройство и способ для формирования многоканального сигнала или набора параметрических данных
KR101117336B1 (ko) 오디오 신호 부호화 장치 및 오디오 신호 복호화 장치
KR100931309B1 (ko) He-aac 디코더와 mpeg 서라운드 디코더를이용하여 멀티채널 오디오 신호를 복원하는 장치 및 방법
JP2010515099A5 (ko)
JP2007528025A (ja) オーディオ配信システム、オーディオエンコーダ、オーディオデコーダ、及びそれらの動作方法
US20110311063A1 (en) Embedding and extracting ancillary data
KR20090039642A (ko) Dmb 신호의 디코딩 방법 및 이의 디코딩 장치
KR20080035448A (ko) 다채널 오디오 신호의 부호화/복호화 방법 및 장치
JP2006259291A (ja) オーディオエンコーダ
KR102191260B1 (ko) 다채널 오디오 코덱과 다객체 오디오 코덱을 이용한 오디오 부호화/복호화 장치 및 방법
Komori Trends in Standardization of Audio Coding Technologies
WO2006011367A1 (ja) オーディオ信号符号化装置および復号化装置
Li et al. Efficient stereo bitrate allocation for fully scalable audio codec
Rumsey Data reduction for high quality digital audio storage and transmission
Quackenbush et al. Digital Audio Compression Technologies
Breebaart et al. 19th INTERNATIONAL CONGRESS ON ACOUSTICS MADRID, 2-7 SEPTEMBER 2007
JP2003099095A (ja) オーディオ符号化装置、方法、記録媒体及びプログラム
KR20070108313A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121011

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130905

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140901

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150915

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20181001

Year of fee payment: 10