KR100923156B1

KR100923156B1 - 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법

Info

Publication number: KR100923156B1
Application number: KR1020070042787A
Authority: KR
Inventors: 서정일; 백승권; 장인선; 장대영; 홍진우
Original assignee: 한국전자통신연구원
Priority date: 2006-05-02
Filing date: 2007-05-02
Publication date: 2009-10-23
Also published as: KR20070107615A

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야

멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법에 관한 것임.

2. 발명이 해결하고자 하는 기술적 과제

멀티채널 오디오 신호를 디코딩하면서 동시에 음질을 향상시키는 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법을 제공함.

3. 발명의 해결방법의 요지

입력 신호인 다중화된 비트스트림을 낮은 샘플링 주파수의 멀티채널 오디오 비트스트림 및 SAC(Spatial Audio Coding) 비트스트림 및 SBR(Spectral Band Replication) 비트스트림으로 역다중화하는 비트스트림 역다중화부; 상기 멀티채널 오디오 비트스트림을 디코딩하여 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 멀티채널 오디오 디코딩부; 상기 다운믹스 신호 및 상기 SBR 비트스트림을 SBR 방식으로 디코딩하여 고주파 영역이 복원된 다운믹스 신호를 출력하는 SBR 디코딩부; 및 상기 SAC 비트스트림에 포함된 공간큐 및 상기 고주파 영역이 복원된 다운믹스 신호를 이용하여 상기 멀티채널 오디오 신호를 SAC 방식으로 디코딩하여 높은 샘플링 주파수의 멀티채널 오디오 신호를 출력하는 SAC 디코딩부를 포함함.

4. 발명의 중요한 용도

멀티채널 오디오 신호의 인코딩 및 디코딩에 이용됨.

멀티채널, 오디오, 인코딩, 디코딩, SAC, SBR

Description

멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법{System and Method for Encoding and Decoding for multi-channel audio}

도 1은 종래의 스테레오 오디오 신호 디코더부의 일실시예 구성도,

도 2는 종래의 멀티채널 오디오 신호 디코더부의 일실시예 구성도,

도 3은 본 발명의 일실시예에 따른 멀티채널 오디오 디코딩 시스템의 구성도,

도 4는 상기 도 3의 멀티채널 오디오 디코딩부에 AAC 기술이 적용된 경우의 상세 구성도,

도 5는 본 발명의 일실시예에 따른 멀티채널 오디오 인코딩 시스템의 구성도,

도 6은 상기 도 5의 멀티채널 오디오 인코딩부에 AAC 기술이 적용된 경우의 상세 구성도.

도 7은 본 발명에 따른 멀티채널 오디오 비트스트림의 일실시예 구성도.

도 8은 도 3의 멀티채널 오디오 디코딩 시스템에서 수행되는 디코딩 과정을 나타내는 흐름도.

도 9는 도 5의 멀티채널 오디오 인코딩 시스템에서 수행되는 인코딩 과정을 나타내는 흐름도.

본 발명은 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법에 관한 것으로, 보다 상세하게는 SAC(Spatial Audio Coding)와 SBR(Spectral Band Replication)을 이용함으로써 기존의 멀티채널 오디오 수신기와 호환성을 유지하면서 고품질의 멀티채널 오디오 신호를 인코딩 및 디코딩하는 방법에 관한 것이다.

도 1은 종래의 스테레오 오디오 신호 디코더의 일실시예 구성도이다.

도 1에 도시된 바와 같이, MPEG-1 Audio Layer II 디코더(101)는 입력신호인 MPEG-2 Layer II 비트스트림으로부터 MPEG-1 Layer II 비트스트림만을 디코딩하여 스테레오 오디오 신호를 출력한다. 종래의 스테레오 오디오 신호 디코더는 24kHz, 32kHz, 44.1kHz, 48kHz의 다양한 샘플링 주파수를 지원하면서 고품질의 오디오 신호을 제공할 수 있으나 멀티채널 신호를 디코딩 할 수 없다는 단점이 있다.

도 2는 종래의 멀티채널 DAB 수신기에서 오디오 신호 디코더의 일실시예 구성도이다.

도 2에 도시된 바와 같이, MPEG-2 Audio Layer II 디코더(201)는 입력 신호인 MPEG-2 Layer II 비트스트림으로부터 멀티채널 오디오 신호를 출력한다.

한편, DAB 표준에 따르면 멀티채널 오디오 신호는 스테레오 오디오 신호에 대한 샘플링 주파수의 1/2로 샘플링된다. 따라서 도 2의 멀티채널 오디오 신호 디코더(201)로 DAB 표준에 따른 오디오 신호가 입력되는 경우, 스테레오 신호에 비하여 1/2로 다운샘플링 되어 음질이 열화된 멀티채널 오디오 신호 및 스테레오 오디오 신호가 출력된다는 단점이 있다.

본 발명은, 상기 문제점을 해결하기 위하여 제안된 것으로, 멀티채널 오디오 신호를 디코딩하면서 동시에 음질을 향상시키는 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법을 제공하는데 그 목적이 있다.

상기 목적을 달성하기 위한 본 발명은, 멀티채널 오디오 디코딩 시스템에 있어서, 입력 신호인 다중화된 비트스트림을 낮은 샘플링 주파수의 멀티채널 오디오 비트스트림 및 SAC(Spatial Audio Coding) 비트스트림 및 SBR(Spectral Band Replication) 비트스트림으로 역다중화하는 비트스트림 역다중화부; 상기 멀티채널 오디오 비트스트림을 디코딩하여 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 멀티채널 오디오 디코딩부; 상기 다운믹스 신호 및 상기 SBR 비트스트림을 SBR 방식으로 디코딩하여 고주파 영역이 복원된 다운믹스 신호를 출력하는 SBR 디코딩부; 및 상기 SAC 비트스트림에 포함된 공간큐 및 상기 고주파 영역이 복원된 다운믹스 신호를 이용하여 상기 멀티채널 오디오 신호를 SAC 방식으로 디코딩하여 높은 샘플링 주파수의 멀티채널 오디오 신호를 출력하는 SAC 디코딩부를 포함한다.

또한, 상기 목적을 달성하기 위한 본 발명은, 멀티채널 오디오 인코딩 시스템 에 있어서, 입력 신호인 높은 샘플링 주파수의 멀티채널 오디오 신호의 샘플링 주파수를 다운샘플링하는 다운샘플링부; 상기 다운샘플링된 멀티채널 오디오 신호를 인코딩하여 멀티채널 오디오 비트스트림으로 출력하는 멀티채널 오디오 인코딩부; 상기 입력 신호인 멀티채널 오디오 신호를 SAC 방식으로 인코딩하여 SAC 비트스트림 및 다운믹스 신호를 출력하는 SAC 인코딩부; 상기 SAC 인코딩부로부터 출력되는 다운믹스 신호를 이용하여 상기 입력 신호인 멀티채널 오디오 신호를 SBR 방식으로 인코딩하여 SBR 비트스트림을 출력하는 SBR 인코딩부; 및 상기 멀티채널 오디오 비트스트림 및 상기 SAC 비트스트림 및 상기 SBR 비트스트림을 다중화하는 비트스트림 다중화부를 포함한다.

또한, 상기 목적을 달성하기 위한 본 발명은, 멀티채널 오디오 디코딩 방법에 있어서, 입력 신호인 다중화된 비트스트림을 낮은 샘플링 주파수의 멀티채널 오디오 비트스트림 및 SAC(Spatial Audio Coding) 비트스트림 및 SBR(Spectral Band Replication) 비트스트림으로 역다중화하는 비트스트림 역다중화단계; 상기 멀티채널 오디오 비트스트림을 디코딩하여 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 멀티채널 오디오 디코딩단계; 상기 다운믹스 신호 및 상기 SBR 비트스트림을 SBR 방식으로 디코딩하여 고주파 영역이 복원된 다운믹스 신호를 출력하는 SBR 디코딩단계; 및 상기 SAC 비트스트림에 포함된 공간큐 및 상기 고주파 영역이 복원된 다운믹스 신호를 이용하여 상기 멀티채널 오디오 신호를 SAC 방식으로 디코딩하여 높은 샘플링 주파수의 멀티채널 오디오 신호를 출력하는 SAC 디코딩단계를 포함한다.

또한, 상기 목적을 달성하기 위한 본 발명은, 멀티채널 오디오 인코딩 방법에 있어서, 입력 신호인 높은 샘플링 주파수의 멀티채널 오디오 신호의 샘플링 주파수를 다운샘플링하는 다운샘플링단계; 상기 다운샘플링된 멀티채널 오디오 신호를 인코딩하여 멀티채널 오디오 비트스트림으로 출력하는 멀티채널 오디오 인코딩단계; 상기 입력 신호인 멀티채널 오디오 신호를 SAC 방식으로 인코딩하여 SAC 비트스트림 및 다운믹스 신호를 출력하는 SAC 인코딩단계; 상기 SAC 인코딩단계에 의해 출력되는 다운믹스 신호를 이용하여 상기 입력 신호인 멀티채널 오디오 신호를 SBR 방식으로 인코딩하여 SBR 비트스트림을 출력하는 SBR 인코딩단계; 및 상기 멀티채널 오디오 비트스트림 및 상기 SAC 비트스트림 및 상기 SBR 비트스트림을 다중화하는 비트스트림 다중화단계를 포함한다.

상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.

도 3은 본 발명의 일실시예에 따른 멀티채널 오디오 디코딩 시스템의 구성도이다.

도 3에 도시된 바와 같이, 본 발명에 따른 멀티채널 오디오 디코딩 시스템은 비트스트림 역다중화부(Bitstream De-Multiplexer, 301), 멀티채널 오디오 디코딩부(303), SBR 디코딩부(305), SAC 디코딩부(307)를 포함한다.

본 발명에 따른 디코딩 시스템의 입력 신호인 다중화된 비트스트림은 낮은 샘플링 주파수(Fs, 예를 들어, 24kHz)의 멀티채널 오디오 비트스트림, SBR 비트스트 림 및 SAC 비트스트림이 멀티플렉싱된 비트스트림이다. 이러한 다중화된 비트스트림의 생성에 대해서는 본 발명에 따른 멀티채널 오디오 인코딩 시스템에서 설명된다. 상기 다중화된 비트스트림은 DAB 오디오 신호가 될 수 있다.

상기 비트스트림 역다중화부(301)는 상기 입력 신호인 다중화된 비트스트림으로부터 SAC 비트스트림 및 SBR 비트스트림을 추출한다.

상기 멀티채널 오디오 디코딩부(303)는 상기 입력 신호인 다중화된 비트스트림을 디코딩하여 낮은 샘플링 주파수(예를 들어, 24kHz)를 갖는 스테레오 또는 모노 다운믹스 신호 및 멀티채널 오디오 신호를 출력한다.

상기 멀티채널 오디오 비트스트림이 MPEG-2 Layer II 비트스트림 또는 AAC 비트스트림인 경우, 상기 멀티채널 오디오 디코딩부(303)에는 MPEG-2 Audio Layer II 디코딩 기술 또는 AAC(Advanced Audio Coding) 디코딩 기술이 이용될 수 있다.

상기 SBR 디코딩부(305)는 상기 멀티채널 오디오 디코딩부(303)로부터 출력된 스테레오 또는 모노 다운믹스 신호 및 상기 비트스트림 역다중화부(301)로부터 추출된 SBR 비트스트림을 이용하여 고주파 영역이 복원된 다운믹스 스테레오 또는 모노 신호(예를 들면, Fs = 48kHz)를 디코딩한다.

SBR(Spectral Band Replication)는 오디오 신호의 저주파 대역 성분을 분석하여 고주파 대역 성분을 복원하는 기술이다. SBR에 대해서는 국제 표준[ISO/IEC 14496-3 AMENDMENT 1: Bandwidth Extension]에 개시되어 있다.

상기 SAC 디코딩부(307)는 상기 비트스트림 역다중화부(301)로부터 추출된 SAC 비트스트림에 포함된 공간큐(spatial cue) 및 상기 SBR 디코딩부(305)로부터 출력된 다운믹스 스테레오 또는 모노 신호를 이용하여 오디오 신호에 대한 정보를 추출하고 제어함으로써, 상기 멀티채널 오디오 디코딩부(303)로부터 출력된 낮은 샘플링 주파수(예를 들어, 24kHz)를 갖는 멀티채널 오디오 신호를 높은 샘플링 주파수(예를 들어, 48kHz)를 갖는 멀티채널 오디오 신호로 디코딩한다.

SAC(Spatial Audio Coding)는 멀티채널 오디오 신호를 다운믹스된 모노 또는 스테레오 신호 및 공간큐 정보로 표현, 전송 및 복원하는 방법으로 낮은 비트율에서도 고품질의 멀티채널 오디오 신호를 전송할 수 있다.

상기 스테레오 또는 모노 다운믹스 신호 및 SAC 비트스트림에 포함된 공간큐(spatial cue) 파라미터를 이용하여 멀티채널 오디오 신호를 디코딩하는 방법은 Baumgarte와 Faller의 논문(C. Faller and F. Baumgarte, “Binaural Cue Coding applied to stereo and multi-channel audio compression,” 112th AES Convention, Munich, prepreint 5574, May 3002) 이나 MPEG Surround 표준 (ISO/IEC JTC1/SC29/WG11, N7947, ISO/IEC 23003-1:3006/FCD, MPEG Surround, Jan., 3006) 에 개시되어 있는 방법을 적용할 수 있으며, 이에 따라 청각적으로 원음과 차이가 없는 멀티채널 오디오 신호를 디코딩할 수 있다.

도 4는 상기 도 3의 멀티채널 오디오 디코딩부(303)에 AAC 기술이 적용된 경우의 상세 구성도이다.

AAC(Advanced Audio Coding)는 MPEG-2 또는 MPEG-4에서 사용되는 오디오 신호 압축 방식으로, MPEG-1에 비해 압축률이 높으면서도 음질이 열화되지 않으며, 다양한 대역과 많은 채널에 대응할 수 있는 특징이 있다.

도 4에 도시된 바와 같이, 상기 멀티채널 오디오 디코딩부(303)는 AAC 디코더(401), 채널 리믹서(403)를 포함한다.

상기 AAC 디코더(401)는 상기 비트스트림 역다중화부(301)으로부터 출력된 멀티채널 오디오 비트스트림(AAC 비트스트림)으로부터 낮은 샘플링 주파수(예를 들어, 24kHz)를 갖는 스테레오 또는 모노 다운믹스 신호 및 멀티채널(LO, RO, T, Q1, Q2) 오디오 신호를 디코딩한다.

상기 채널 리믹서(403)는 상기 AAC 디코더(401)로부터 디코딩된 멀티채널(LO, RO, T, Q1, Q2) 오디오 신호를 멀티채널(L, R, C, Ls, Rs) 오디오 신호로 리믹싱하여 상기 SAC 디코딩부(307)에 전달한다.

상기 도 3의 멀티채널 오디오 디코딩 시스템으로 입력되는 다중화된 비트스트림은 후술되는 바와 같이 본 발명에 따른 멀티채널 오디오 인코딩 시스템에 의해 생성된다.

도 5는 본 발명의 일실시예에 따른 멀티채널 오디오 인코딩 시스템의 구성도이다.

도 5에 도시된 바와 같이, 본 발명에 따른 멀티채널 오디오 인코더 시스템은 다운샘플링부(501), 멀티채널 오디오 인코딩부(503), SAC 인코딩부(505), SBR 인코딩부(507), 비트스트림 다중화부(509)를 포함한다.

상기 다운샘플링부(501)는 입력 신호인 멀티채널 오디오 신호(예를 들면, Fs = 48kHz)의 샘플링 주파수를 1/2배로 다운샘플링하여 멀티채널 오디오 신호(예를 들면, Fs = 24kHz)를 출력한다.

상기 멀티채널 오디오 인코딩부(503)는 상기 다운샘플링부(501)로부터 출력되는 멀티채널 오디오 신호(예를 들면, Fs = 24kHz)를 멀티채널 오디오 비트스트림으로 인코딩하고, 상기 인코딩 과정에서 스테레오(또는 모노) 다운믹스 신호(예를 들면, Fs = 24kHz)를 생성한다.

상기 멀티채널 오디오 인코딩부(303)에는 MPEG-2 Audio Layer II 인코딩 기술 또는 AAC 인코딩 기술이 이용될 수 있으며, 이 경우, 상기 멀티채널 오디오 비트스트림은 MPEG-2 Layer II 비트스트림 또는 AAC 비트스트림이다.

상기 SAC 인코딩부(505)는 입력 신호인 멀티채널 오디오 신호로부터 공간큐(spatial cue) 파라미터를 추출하고 인코딩함으로써 SAC 부가정보 비트스트림을 생성하고, 상기 멀티채널 오디오 신호로부터 스테레오(또는 모노) 다운믹스 신호를 생성한다. 이때 SAC 부가정보 비트스트림을 구성하는 공간큐 파라미터는 상기 다운샘플링부(501)의 다운샘플링 과정에서 상쇄된 고주파수 성분만으로 구성된다.

상기 멀티채널 오디오 인코딩부(503) 및 상기 SAC 인코딩부(505)가 멀티채널(예를 들어 5.1채널) 신호(L, R, C, Ls, Rs, Lfe)를 스테레오(또는 모노)로 다운믹스하는 방법은 ITU-R BS. 775-1에서 정의된 방법과 동일하며 아래 [수학식 1]에 기초하여 다운믹스한다.

이때, L0와 R0는 스테레오 다운믹스 신호, L과 R은 좌우 메인채널, C(center)는 중앙 채널, Ls(left surround)는 좌측 서라운드 채널, Rs(right surround)는 우측 서라운드 채널이다. (5.1채널)

상기 SBR 인코딩부(507)는 상기 SAC 인코딩부(505)로부터 출력되는 스테레오(또는 모노) 다운믹스 신호 및 상기 멀티채널 오디오 인코딩부(503)로부터 출력되는 스테레오(또는 모노) 다운믹스 신호를 이용하여 SBR 비트스트림을 생성한다.

상기 비트스트림 다중화부(509)는 상기 멀티채널 오디오 인코딩부(503)로부터 출력되는 멀티채널 오디오 비트스트림 및 상기 SAC 인코딩부(505)로부터 출력되는 SAC 부가정보 비트스트림 및 상기 SBR 인코딩부(507)로부터 출력되는 SBR 비트스트림을 멀티플렉싱하여 다중화된 비트스트림을 생성한다.

상기 다중화된 비트스트림은 DAB 오디오 신호가 될 수 있다.

도 6은 상기 도 5의 멀티채널 오디오 인코딩부(503)에 AAC 기술이 적용된 경우의 상세 구성도이다.

도 6에 도시된 바와 같이, 상기 멀티채널 오디오 인코딩부(503)는 채널 믹서(601) 및 AAC 인코더(603)를 포함한다.

상기 채널 믹서(601)는 상기 다운샘플링부(501)로부터 출력된 멀티채널 오디 오 신호(L, R, C, Ls, Rs)를 상기 [수학식 1] 및 다음의 [수학식 2]에 따라 멀티채널 오디오 신호(LO, RO, T, Q1, Q2)로 믹싱하여 출력한다.

이때, C(center)는 중앙 채널, Ls(left surround)는 좌측 서라운드 채널, Rs(right surround)는 우측 서라운드 채널, T, Q1, Q2는 스테레오 다운믹스 신호를 제외한 나머지 멀티채널 신호이다. (5.1채널)

상기 AAC 인코더(603)는 상기 채널 믹서(601)로부터 출력된 멀티채널 오디오 신호를 AAC 비트스트림으로 인코딩하고, 상기 인코딩 과정에서 스테레오 또는 모노 다운믹스 신호를 생성한다.

도 7은 본 발명에 따른 멀티채널 오디오 비트스트림의 일실시예 구성도로서, 1/2 다운샘플링된 후 MPEG-2 Layer II 표준으로 부호화된 멀티채널 오디오 신호, SBR 비트스트림 및 SAC 비트스트림을 부가데이터 영역(Ancillary Data)에 다중화한 경우의 비트스트림 구성도이다.

도 7에 도시된 바와 같이, 1/2 다운샘플링된 후 MPEG-2 Layer II로 부호화된 멀티채널 오디오 신호(T, Q1, Q2)는 Ancillary Data 1 영역에 다중화되고, 다운믹스 스테레오 신호의 고주파수 영역을 부호화한 SBR 비트스트림은 Ancillary Data 2 영역에 다중화되고, 멀티채널 부호화 정보인 SAC 비트스트림은 Ancillary Data 3 영역에 다중화된다.

도 8은 도 3의 멀티채널 오디오 디코딩 시스템에서 수행되는 디코딩 과정을 나타내는 흐름도이다.

도 8에 도시된 바와 같이, 상기 비트스트림 역다중화부(301)는 상기 입력 신호인 다중화된 비트스트림으로부터 SAC 비트스트림 및 SBR 비트스트림을 추출한다(801).

상기 멀티채널 오디오 디코딩부(303)는 상기 입력 신호인 다중화된 비트스트림을 디코딩하여 낮은 샘플링 주파수를 갖는 스테레오 또는 모노 다운믹스 신호 및 멀티채널 오디오 신호를 출력한다(803).

상기 SBR 디코딩부(305)는 상기 멀티채널 오디오 디코딩부(303)로부터 출력된 스테레오 또는 모노 다운믹스 신호 및 상기 비트스트림 역다중화부(301)로부터 추출된 SBR 비트스트림을 이용하여 고주파 영역이 복원된 다운믹스 스테레오 또는 모노 신호를 디코딩한다(805).

상기 SAC 디코딩부(307)는 상기 비트스트림 역다중화부(301)로부터 추출된 SAC 비트스트림에 포함된 공간큐(spatial cue) 및 상기 SBR 디코딩부(305)로부터 출력된 다운믹스 스테레오 또는 모노 신호를 이용하여 오디오 신호에 대한 정보를 추출하고 제어함으로써, 상기 멀티채널 오디오 디코딩부(303)로부터 출력된 낮은 샘플링 주파수를 갖는 멀티채널 오디오 신호를 높은 샘플링 주파수를 갖는 멀티채널 오디오 신호로 디코딩한다(807).

도 9는 도 5의 멀티채널 오디오 인코딩 시스템에서 수행되는 인코딩 과정을 나타내는 흐름도이다.

도 9에 도시된 바와 같이, 상기 다운샘플링부(501)는 입력 신호인 멀티채널 오디오 신호의 샘플링 주파수를 1/2배로 다운샘플링하여 멀티채널 오디오 신호를 출력한다(901).

상기 SAC 인코딩부(505)는 입력 신호인 멀티채널 오디오 신호로부터 공간큐(spatial cue) 파라미터를 추출하고 인코딩함으로써 SAC 부가정보 비트스트림을 생성하고, 상기 멀티채널 오디오 신호로부터 스테레오(또는 모노) 다운믹스 신호를 생성한다(903).

상기 멀티채널 오디오 인코딩부(503)는 상기 다운샘플링부(501)로부터 출력되는 멀티채널 오디오 신호를 멀티채널 오디오 비트스트림으로 인코딩하고, 상기 인코딩 과정에서 스테레오(또는 모노) 다운믹스 신호를 생성한다(905).

상기 SBR 인코딩부(507)는 상기 SAC 인코딩부(505)로부터 출력되는 스테레오(또는 모노) 다운믹스 신호 및 상기 멀티채널 오디오 인코딩부(503)로부터 출력되는 스테레오(또는 모노) 다운믹스 신호를 이용하여 SBR 비트스트림을 생성한다(907).

상기 비트스트림 다중화부(509)는 상기 멀티채널 오디오 인코딩부(503)로부터 출력되는 멀티채널 오디오 비트스트림 및 상기 SAC 인코딩부(505)로부터 출력되는 SAC 부가정보 비트스트림 및 상기 SBR 인코딩부(507)로부터 출력되는 SBR 비트스트림를 멀티플렉싱하여 다중화된 비트스트림을 생성한다(909).

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.

이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.

상기와 같은 본 발명은, 모노 또는 스테레오 다운믹스 신호를 제공하므로 종래의 모노, 스테레오 및 멀티채널 오디오 수신기와 호환성을 유지하면서 48kHz의 샘플링 주파수를 지원하는 고품질의 멀티채널 오디오 서비스를 제공할 수 있다. 또한, SBR과 SAC기술을 이용하므로 비트레이트를 줄이면서 음질이 향상된 멀티채널 오디오 신호로 인코딩 및 디코딩할 수 있다.

Claims

멀티채널 오디오 디코딩 시스템에 있어서,

입력 신호인 DAB 방식의 다중화된 비트스트림을 SAC(Spatial Audio Coding) 비트스트림 및 SBR(Spectral Band Replication) 비트스트림으로 역다중화하는 비트스트림 역다중화부;

상기 다중화된 비트스트림을 디코딩하여 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 멀티채널 오디오 디코딩부;

상기 다운믹스 신호 및 상기 SBR 비트스트림을 SBR 방식으로 디코딩하여 고주파 영역이 복원된 다운믹스 신호를 출력하는 SBR 디코딩부; 및

상기 SAC 비트스트림에 포함된 공간큐 및 상기 고주파 영역이 복원된 다운믹스 신호를 이용하여 상기 멀티채널 오디오 신호를 SAC 방식으로 디코딩하여 높은 샘플링 주파수의 멀티채널 오디오 신호를 출력하는 SAC 디코딩부

를 포함하는 멀티채널 오디오 디코딩 시스템.
삭제
제1항에 있어서,

상기 멀티채널 오디오 디코딩부는

상기 멀티채널 오디오 비트스트림을 디코딩하여 상기 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 AAC 디코더; 및

상기 AAC 디코더로부터 디코딩된 멀티채널 오디오 신호의 채널을 리믹스하여 상기 SAC 디코딩부로 출력하는 상기 채널 리믹서

를 포함하는 멀티채널 오디오 디코딩 시스템.
제1항에 있어서,

상기 다운믹스 신호는

스테레오 신호 및 모노 신호 중 어느 하나인

멀티채널 오디오 디코딩 시스템.
멀티채널 오디오 인코딩 시스템에 있어서,

입력 신호인 높은 샘플링 주파수의 멀티채널 오디오 신호의 샘플링 주파수를 다운샘플링하는 다운샘플링부;

상기 다운샘플링된 멀티채널 오디오 신호를 인코딩하여 멀티채널 오디오 비트스트림으로 출력하는 멀티채널 오디오 인코딩부;

상기 입력 신호인 멀티채널 오디오 신호를 SAC 방식으로 인코딩하여 SAC 비트스트림 및 다운믹스 신호를 출력하는 SAC 인코딩부;

상기 SAC 인코딩부로부터 출력되는 다운믹스 신호를 이용하여 상기 입력 신호인 멀티채널 오디오 신호를 SBR 방식으로 인코딩하여 SBR 비트스트림을 출력하는 SBR 인코딩부; 및

상기 멀티채널 오디오 비트스트림 및 상기 SAC 비트스트림 및 상기 SBR 비트스트림을 다중화하는 DAB 방식의 다중화된 비트스트림을 출력하는 비트스트림 다중화부

를 포함하는 멀티채널 오디오 인코딩 시스템.
제5항에 있어서,

상기 멀티채널 오디오 인코딩부는

상기 다운샘플링된 멀티채널 오디오 신호의 채널을 믹스하는 채널 믹서; 및

상기 채널 믹서로부터 출력된 멀티채널 오디오 신호를 디코딩하여 상기 멀티채널 오디오 비트스트림으로 출력하는 AAC 인코더

를 포함하는 멀티채널 오디오 인코딩 시스템.
제5항에 있어서,

상기 멀티채널 오디오 인코딩부는

상기 다운샘플링된 멀티채널 오디오 신호를 인코딩하여 다운믹스 신호를 더 출력하고,

상기 SBR 인코딩부는

상기 멀티채널 오디오 인코딩부로부터 출력되는 다운믹스 신호를 더 이용하여 상기 입력 신호인 멀티채널 오디오 신호를 인코딩하는

멀티채널 오디오 인코딩 시스템.
제5항 또는 제7항에 있어서,

상기 다운믹스 신호는

스테레오 신호 및 모노 신호 중 어느 하나인

멀티채널 오디오 인코딩 시스템.
제5항 또는 제7항에 있어서,

상기 다운믹스 신호는

하기 [수학식 1]에 의해 생성되는

멀티채널 오디오 인코딩 시스템.

[수학식 1]

이때, L0와 R0는 스테레오 다운믹스 신호, L과 R은 좌우 메인채널, C(center)는 중앙 채널, Ls(left surround)는 좌측 서라운드 채널, Rs(right surround)는 우측 서라운드 채널임.
제6항에 있어서,

상기 채널 믹서는

하기 [수학식 2]에 의해 상기 멀티채널 오디오 신호의 채널을 믹스하는

멀티채널 오디오 인코딩 시스템.

[수학식 2]

이때, C(center)는 중앙 채널, Ls(left surround)는 좌측 서라운드 채널, Rs(right surround)는 우측 서라운드 채널, T, Q1, Q2는 스테레오 다운믹스 신호를 제외한 나머지 멀티채널 신호임.
삭제
멀티채널 오디오 디코딩 방법에 있어서,

입력 신호인 DAB 방식의 다중화된 비트스트림을 SAC(Spatial Audio Coding) 비트스트림 및 SBR(Spectral Band Replication) 비트스트림으로 역다중화하는 비트스트림 역다중화단계;

상기 다중화된 멀티채널 오디오 비트스트림을 디코딩하여 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 멀티채널 오디오 디코딩단계;

상기 다운믹스 신호 및 상기 SBR 비트스트림을 SBR 방식으로 디코딩하여 고주파 영역이 복원된 다운믹스 신호를 출력하는 SBR 디코딩단계; 및

상기 SAC 비트스트림에 포함된 공간큐 및 상기 고주파 영역이 복원된 다운믹스 신호를 이용하여 상기 멀티채널 오디오 신호를 SAC 방식으로 디코딩하여 높은 샘플링 주파수의 멀티채널 오디오 신호를 출력하는 SAC 디코딩단계

를 포함하는 멀티채널 오디오 디코딩 방법.
삭제
제12항에 있어서,

상기 멀티채널 오디오 디코딩단계는

상기 멀티채널 오디오 비트스트림을 디코딩하여 상기 다운믹스 신호 및 멀티채널 오디오 신호를 출력하는 AAC 디코딩단계; 및

상기 AAC 디코딩단계에 의해 디코딩된 멀티채널 오디오 신호의 채널을 리믹스 하여 상기 SAC 디코딩단계로 출력하는 상기 채널 리믹싱단계

를 포함하는 멀티채널 오디오 디코딩 방법.
제12항에 있어서,

상기 다운믹스 신호는

스테레오 신호 및 모노 신호 중 어느 하나인

멀티채널 오디오 디코딩 방법.
멀티채널 오디오 인코딩 방법에 있어서,

입력 신호인 높은 샘플링 주파수의 멀티채널 오디오 신호의 샘플링 주파수를 다운샘플링하는 다운샘플링단계;

상기 다운샘플링된 멀티채널 오디오 신호를 인코딩하여 멀티채널 오디오 비트스트림으로 출력하는 멀티채널 오디오 인코딩단계;

상기 입력 신호인 멀티채널 오디오 신호를 SAC 방식으로 인코딩하여 SAC 비트스트림 및 다운믹스 신호를 출력하는 SAC 인코딩단계;

상기 SAC 인코딩단계에 의해 출력되는 다운믹스 신호를 이용하여 상기 입력 신호인 멀티채널 오디오 신호를 SBR 방식으로 인코딩하여 SBR 비트스트림을 출력하는 SBR 인코딩단계; 및

상기 멀티채널 오디오 비트스트림 및 상기 SAC 비트스트림 및 상기 SBR 비트스트림을 다중화하여 DAB 방식의 다중화된 비트스트림을 출력하는 비트스트림 다중화단계

를 포함하는 멀티채널 오디오 인코딩 방법.
제16항에 있어서,

상기 멀티채널 오디오 인코딩단계는

상기 다운샘플링된 멀티채널 오디오 신호의 채널을 믹스하는 채널 믹싱단계; 및

상기 채널 믹싱단계에 의해 출력된 멀티채널 오디오 신호를 디코딩하여 상기 멀티채널 오디오 비트스트림으로 출력하는 AAC 인코더

를 포함하는 멀티채널 오디오 인코딩 방법.
제16항에 있어서,

상기 멀티채널 오디오 인코딩단계는

상기 다운샘플링된 멀티채널 오디오 신호를 인코딩하여 다운믹스 신호를 더 출력하고,

상기 SBR 인코딩단계는

상기 멀티채널 오디오 인코딩단계에 의해 출력되는 다운믹스 신호를 더 이용 하여 상기 입력 신호인 멀티채널 오디오 신호를 인코딩하는

멀티채널 오디오 인코딩 방법.
제16항 또는 제18항에 있어서,

상기 다운믹스 신호는

스테레오 신호 및 모노 신호 중 어느 하나인

멀티채널 오디오 인코딩 방법.
제16항 또는 제18항에 있어서,

상기 다운믹스 신호는

하기 [수학식 1]에 의해 생성되는

멀티채널 오디오 인코딩 방법.

[수학식 1]

이때, L0와 R0는 스테레오 다운믹스 신호, L과 R은 좌우 메인채널, C(center)는 중앙 채널, Ls(left surround)는 좌측 서라운드 채널, Rs(right surround)는 우측 서라운드 채널임.
제17항에 있어서,

상기 채널 믹싱단계는

하기 [수학식 2]에 의해 상기 다운샘플링된 멀티채널 오디오 신호의 채널을 믹스하는

멀티채널 오디오 인코딩 방법.

[수학식 2]

이때, C(center)는 중앙 채널, Ls(left surround)는 좌측 서라운드 채널, Rs(right surround)는 우측 서라운드 채널, T, Q1, Q2는 스테레오 다운믹스 신호를 제외한 나머지 멀티채널 신호임.
삭제