KR100745688B1

KR100745688B1 - 다채널 오디오 신호 부호화/복호화 방법 및 장치

Info

Publication number: KR100745688B1
Application number: KR1020050061655A
Authority: KR
Inventors: 백승권; 서정일; 박기윤; 이병화; 강경옥; 홍진우; 한민수
Original assignee: 한국전자통신연구원
Priority date: 2004-07-09
Filing date: 2005-07-08
Publication date: 2007-08-03
Anticipated expiration: 2025-07-08
Also published as: KR20060049980A

Abstract

본 발명은 다채널 오디오 신호를 부호화/복호화 하는 방법 및 장치에 관한 것으로, 보다 상세하게는, 채널 상관성에 기반하여 다채널 오디오 신호를 부호화 및 복호화하는 다채널 파라메트릭 부호화/복호화 방법 및 장치에 관한 것이다.

본 발명에 따른 다채널 오디오 신호 부호화 장치는 다채널 오디오 신호를 주파수 영역에서 분할하는 신호 분할 수단; 상기 분할된 신호를 단일채널로 다운믹스(dowm-mix)하여 부호화하는 다운믹스 수단; 및 상기 분할된 신호에 대해 프레임 단위의 채널 상관도를 측정하고, 상기 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할하는 파라메터 분석 수단을 포함하며, 상기 파라메터 분석 수단은, 상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 복호화를 위한 큐 파라메터로서, 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 것을 특징으로 한다.

본 발명은 다채널 오디오 신호의 복호화에 필요한 큐 파라메터를 최적화함으로써 적은 대역폭이 할당되는 환경에서도 단일채널 오디오 신호로부터 다채널 오디오 신호를 복원하여 재생할 수 있는 효과를 제공한다.

오디오 코딩, 큐 파라메터, 다채널, 채널 상관성

Description

다채널 오디오 신호 부호화/복호화 방법 및 장치{Apparatus for encoding and decoding multichannel audio signal and method thereof}

도 1은 본 발명에 따른 다채널 오디오 신호 부/복호화 장치의 블럭 구성도;

도 2는 도 1의 다채널 파라메트릭 부호화부의 세부 블럭 구성도;

도 3은 도 2의 파라메터 분석부의 세부 블럭 구성도;

도 4는 도 1의 다채널 파라메트릭 복호화부의 세부 블럭 구성도;

도 5는 도 4의 파라메터 기반 다채널 생성부의 세부 블럭 구성도;

도 6은 본 발명에 따른 다채널 오디오 신호를 부호화하는 과정을 도시한 흐름도; 및

도 7은 본 발명에 따른 다채널 오디오 신호를 복호화하는 과정을 도시한 흐름도이다.

광대역 오디오 신호의 부호화 기술은 최근 수년 동안 놀라운 성장을 거듭하고 있다. 이러한 부호화 기술의 발전에 따라, 가정에서나 이동중인 차량 안에서 다채널 오디오를 재생할 수 있는 다채널 오디오 시스템이 상용화 되고 있다. 그러나 다채널 오디오 신호의 전송과정에서 소요되는 대역폭의 문제로 인하여 아직까지 보다 폭넓은 상용화 단계에는 이르지 못하고 있다.

최근들어 공간정보 기반 오디오 코딩(SAC: Spatial audio coding) 기술의 소개는 한정된 대역폭에서 효과적으로 다채널 오디오 신호를 전송 및 표현 가능하도록 하고 있다. 특히 바이노럴 큐 코딩(BCC: Binaural cue coding) 방식의 SAC는 적은 대역폭에서도 고품질의 다채널 오디오 신호를 재생할 수 있는 알고리즘으로서 최근 크게 주목 받고 있는 기술이다.

BCC의 기본 개념은, 사람이 느낄 수 있는 음향에 대한 공간감이 두 귀로 인하여 발생한다는 사실에 근거하여 이를 표현할 수 있는 큐 파라메터를 이용하여 오디오 신호를 생성하는 것이다. BCC는 사람이 주로 인지하는 큐 파라메터로서 소리 크기의 차와 소리 지연의 차를 이용하여 다운믹스된 단일 채널 오디오 신호로부터 다채널 오디오 신호를 복원한다. BCC에 관한 보다 자세한 내용은 논문 "Binaural Cue Coding-partII: schemes and application"(IEEE Trans. on speech and audio Proc. Vol. 11. No.6. Nov. 2003)에 기재되어 있다.

그러나, BCC 방식은 추출된 큐 파라메터를 전송하기 위한 대역폭도 채널 수 가 증가함에 따라 선형적으로 증가한다는 문제점을 가지고 있다. 예를들어 스테레오 신호를 표현하기 위해 필요한 큐 파라메터가 4 kbps 소요된다고 가정할 경우, 5 채널에 대하여 20 kbps 소요됨으로써 상당량의 대역폭을 차지하게 된다.

본 발명은 전술한 문제점을 해결하기 위한 것으로, 채널 상관도에 따라 최적의 큐 파라메터를 추출함으로써, 작은량의 큐 파라메터를 이용하며 BCC와 동일한 오디오 재생 품질을 제공하는 것을 그 목적으로 한다.

본 발명이 속한 기술 분야에서 통상의 지식을 가진 자는 본 명세서의 도면, 발명의 상세한 설명 및 특허청구범위로부터 본 발명의 다른 목적 및 장점을 쉽게 인식할 수 있을 것이다.

상기 파라메터 분석 수단은 상기 프레임 단위 채널 상관도가 감소함에 따라 증가하는 개수의 서브밴드로 상기 분할된 신호를 재분할한다. 상기 프레임 단위 채널 상관도는 상기 분할된 신호에 대한 서브밴드 단위의 채널 상관도로부터 획득된다. 상기 프레임 단위 채널 상관도는 고주파 대역의 서브밴드 단위 채널 상관도 보다 저주파 대역의 서브밴드 단위 채널 상관도에 의해 결정된다. 상기 재분할된 서브밴드 b에 대한 채널 ID는 재분할된 서브밴드 b의 전력이 최대가 되는 채널의 인덱스이다.

상기 파라메터 분석 수단은 상기 프레임 단위 채널 상관도가 상기 제1기준값 이상인 경우 상기 큐 파라메터로서, 상기 재분할된 신호의 서브밴드별로 채널간 주파수 크기차(Inter-Channel Level Difference)와 서브밴드 단위 채널 상관도를 추출하여 부호화한다. 상기 파라메터 분석 수단은 상기 큐 파라메터로서, 상기 재분할된 신호의 서브밴드별로 채널간 시간 지연차(Inter-Channel Level Difference)를 부가적으로 추출한다.

상기 파라메터 분석 수단은 상기 프레임 단위 채널 상관도가 상기 제1기준값 이하인 경우, 상기 분할된 신호의 서브밴드 개수 보다 많은 개수로 상기 분할된 신호를 재분할하고, 상기 프레임 단위 채널 상관도가 상기 제1기준값보다 큰 제2기준값 이상인 경우, 상기 분할된 신호의 서브밴드 개수 보다 적은 개수로 상기 분할된 신호를 재분할하고, 상기 프레임 단위 채널 상관도가 상기 제1기준값과 상기 제2기준값 사이인 경우, 재분할을 하지 않는다.

상기 파라메터 분석 수단은 상기 프레임 단위 채널 상관도가 상기 제1기준값과 상기 제2기준값 사이인 경우 상기 큐 파라메터로서, 상기 분할된 신호의 서브밴드별로 채널간 주파수 크기차(Inter-Channel Level Difference)와 서브밴드 단위 채널 상관도를 추출하여 부호화한다.

본 발명에 따른 다채널 오디오 신호 복호화 장치는 주파수 영역에서 분할된 다채널 오디오 신호를 단일채널로 다운믹스하여 부호화하고, 상기 분할된 다채널 오디오 신호에 대한 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할함으로써 부호화된 오디오 신호를 다채널 오디오 신호로 복호화하는 다채널 오디오 신호 복호화 장치에 있어서, 상기 부호화된 단일채널 오디오 신호를 복호화하는 단일채널 복호화 수단; 및 상기 프레임 단위 채널 상관도에 따라, 상기 재분할시에 사용된 서브밴드 구간과 동일하게 상기 복호화된 단일채널 오디오 신호를 주파수 영역에서 분할하는 파라메터 기반 다채널 생성 수단을 포함하며, 상기 파라메터 기반 다채널 생성 수단은, 상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 이용하여 상기 단일채널 오디오 신호로 복호화하는 것을 특징으로 한다.

상기 파라메터 기반 채널 생성 수단은 상기 프레임 단위 채널 상관도가 상기 제1기준값 이상인 경우, 상기 재분할된 신호의 서브밴드별 채널간 주파수 크기차와 서브밴드 단위 채널 상관도를 이용하여 복호화한다. 상기 파라메터 기반 채널 생성 수단은 상기 재분할된 신호의 서브밴드별 채널간 시간 지연차를 추가적으로 이용하여 복호화한다.

상기 파라메터 기반 채널 생성 수단은 서브 밴드 b에 대한 채널 ID가 c'(1≤ c'≤C, C는 채널수)일 경우, c' 채널의 서브밴드 b 신호는 단일채널 오디오 신호의 서브밴드 b 신호로 할당한다. 또한, 상기 파라메터 기반 채널 생성 수단은 상기 단일채널 오디오 신호에 채널간에서 발생하는 음원의 공간감에 관한 성분을 반영하여 나머지 서브밴드 신호로 할당한다.

본 발명에 따른 다채널 오디오 신호 부호화 방법은 다채널 오디오 신호를 주파수 영역에서 분할하는 단계; 상기 분할된 신호를 단일채널로 다운믹스(dowm-mix)하여 부호화하는 단계; 상기 분할된 신호에 대해 프레임 단위의 채널 상관도를 측정하는 단계; 상기 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할하는 단계; 및 상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우, 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 단계를 포함하는 것을 특징으로 한다.

본 발명에 따른 다채널 오디오 신호 복호화 방법은, 주파수 영역에서 분할된 다채널 오디오 신호를 단일채널로 다운믹스하여 부호화하고, 상기 분할된 다채널 오디오 신호에 대한 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할함으로써 부호화된 오디오 신호를 다채널 오디오 신호로 복호화하는 다채널 오디오 신호 복호화 방법에 있어서, 상기 부호화된 단일채널 오디오 신호를 복호화하는 단계; 상기 프레임 단위 채널 상관도에 따라, 상기 재분할시에 사용된 서브밴드 구간과 동일하게 상기 복호화된 단일채널 오디오 신호를 주파수 영역에서 분할하는 단계; 및 상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 이용하여 상기 단일채널 오디오 신호로 복호화하는 단계를 포함하는 것을 특징으로 한다.

상술한 목적 및 특징은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한 본 발명을 설명함에 있어서 본발명과 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일 실시예를 상세히 설명하기로 한다.

도 1은 본 발명에 따른 다채널 오디오 신호 부/복호화 장치의 블럭 구성도이다. C개의 채널을 갖는 다채널 오디오 신호는 다채널 파라메트릭 부호화부(101)에 입력된다. 다채널 파라메트릭 부호화부(101)는 입력된 다채널 오디오 신호를 다운믹스(down-mix)하여 로(raw) 데이터 형태의 단일 채널 오디오 신호를 출력한다. 또한, 다채널 파라메트릭 부호화부(101)는 채널 상관성에 기반하여 다채널 신호로 복호화하기 위한 큐 파라메터(cue parameter) 정보를 추출하여 출력한다.

큐 파라메터 정보에는 채널 상관성에 따라 채널간 주파수 크기차(Inter-Channel Level Difference; ICLD) 또는 채널 ID(IDentification)가 포함된다. 보다 구체적으로, 채널 상관도(Inter-Chanenel Correalation; ICC)가 소정의 값 이상인 경우 ICLD가 사용된다. 이 때, 채널간 시간차(Inter-Channel Time Difference; ICTD)가 부가적으로 사용될 수 있다. 또한, 채널 상관도가 소정의 값 이하인 경우 채널 ID가 사용된다. 이 때, ICTD가 부가적으로 사용될 수 있다.

다채널 파라메트릭 부호화부(101)로부터 출력된 단일 채널 오디오 신호는 일반 오디오 부호화부(103)에 의해 특정 파일 포맷으로 부호화된다. 일반 오디오 부호화부(103)는 mp3 인코더와 같이 일반적으로 알려진 통상의 오디오 부호화기이다.

일반 오디오 복호화부(105)는 일반 오디오 부호화부(103)에 대응되며, 특정 파일 포맷의 음성 파일을 복호화하여 로 데이터 형태의 단일 채널 오디오 신호를 출력한다. 다채널 파라메트릭 복호화부(107)는 다채널 파라메트릭 부호화부(101)에 의해서 생성된 큐 파라메터 정보를 이용하여 입력된 단일 채널 오디오 신호를 다채널 오디오 신호로 복원하여 출력한다. 보다 구체적으로, 채널 상관성이 소정의 값 이하인 경우, ICLD를 이용하여 단일 채널 오디오 신호를 다채널 오디오 신호로 복원한다. 또한, 채널 상관성이 소정의 값 이상인 경우, 채널 ID를 이용하여 단일 채널 오디오 신호를 다채널 오디오 신호를 복원한다.

도 2는 도 1의 다채널 파라메트릭 부호화부(101)의 세부 블럭 구성도이다. 각 채널 신호는 TF(Time Frequency) 변환부(201)에서 프레임 단위로 주파수 변환 예를 들어, 고속 푸리에 변환(Fast Fourier Transform; FFT)된다. FFT 변환된 각 채널 신호는 신호 분할부(203)에서 B개의 서브밴드로 분할된다. b(1≤b≤B)번째 서브밴드는 분할 경계값, A_b-1과 A_b-1 사이의 FFT 주파수 계수(spectral coefficient)로 이루어진다.

예를 들어, 1024 포인트의 FFT 변환된 각 채널 신호는 신호 분할부(203)에서 표1에 의해 19개의 서브밴드로 분할될 수 있다. 이 경우, 첫번째 서브밴드는 0,1,2 번째 주파수 계수로 이루어지고, 두번째 서브밴드는 3,4,5번째 주파수 계수로 이루어질 것이다. 여기서, 주파수 계수의 대칭성으로 인해 513번째 주파수 계수까지만 고려된다.

서브밴드 분할 방법으로 청각특성이 반영되도록 임계밴드(critical band) 분할과 유사하게 등량의 사각 밴드(Equivalent Rectangular Band: ERB)가 사용된다. 분할된 주파수 영역 서브밴드 신호들은 다운믹스부(205)에서 서브밴드 단위로 혼합하여 다운믹스됨으로써, 주파수 영역의 단일 채널 프레임 신호가 생성된다.

다운믹스된 단일 채널 프레임 신호는 역 TF(Inverse Time Frequency) 변환부(207)에서 역 고속 퓨리에 변환(Inverse FFT)됨으로써, 일반 오디오 디코더의 입력 웨이브 신호로 사용될 수 있는 단일 채널 오디오 신호가 생성된다.

한편, 19밴드로 분할된 주파수 영역 서브밴드 신호들은 파라메터 분석부(209)에도 입력된다. 파라메터 분석부(209)에서는 채널 상관도를 측정한다. 또한, 파라메터 분석부(209)는 측정된 채널 상관도에 기초하여 단일 채널 오디오 신호로부터 다채널 오디오 신호를 복원하는 데 필요한 큐 파라메터 정보를 추출한다. 파라메터 분석부(209)에 대한 보다 상세한 설명은 도 3을 참조하여 이루어질 것이다.

도 3은 도 2의 파라메터 분석부(209)의 상세 블럭 구성도이다. 채널 상관도 측정부(301)는 분할된 주파수 영역 서브밴드 신호들을 대상으로 서브밴드 단위 채널 상관도를 측정한다. 서브밴드 단위 채널 상관도는 수학식 1과 같이 정규화된 상호 상관함수(coherence function)를 이용하여 구해진다.

여기서,

는 i번째 채널 신호의 b번째 서브밴드 신호와 j번째 채널 신호의 b번째 서브밴드 신호간의 상관도이다. x^f _i,b는 i번째 채널 신호의 b번째 서브밴드의 주파수 계수이다. 위첨자 f는 주파수 영역임을 표현한 것이며 *는 해당 복소수의 공액복소수 변환을 나타낸다. i는 기준채널로서 고정되어 있는 것으로 간주한다. 그러므로 채널 수가 C개일 때, 각 서브밴드별로 C-1개의 상관도가 측정된다. 기준채널로 1번째 채널 신호가 사용되는 경우, 서브밴드 b에 대한 채널 상관도 계수 Γ_b는 수학식 2로 표현된다. 기준채널로서는 오디오 신호의 주요 전력을 제 공하는 센터(cneter) 채널 신호가 사용된다.

한 프레임에 대한 채널 상관도 계수 Γ는 수학식 3으로부터 구해질 수 있다.

N≒M/2로서, M이 19인 경우 N은 10으로 결정된다. α는 스무딩 인자(smoothing factor)로서 초기 N개의 저역 신호가 프레임 단위 채널 상관도 계수에 주로 영향을 미치도록 0.5 이하의 작은 값을 가지는 것이 바람직하다.

채널 상관도 측정부(301)는 프레임 단위 채널 상관도 계수 Γ를 큐 파라메터로서 다채널 파라메트릭 복호화부(107)에 전송한다.

채널 상관도 계수 Γ에 따라, 다채널 오디오 신호를 복원하기 위해 필요한 큐파라메터의 종류가 달리 결정된다. 또한, 채널 상관도 계수 Γ에 따라, 큐파라메터를 추출하는 서브밴드의 개수가 상이하게 결정된다.

채널 상관도 계수 Γ와 큐파라메터를 추출하는 서브밴드 개수와의 관계는 표2와 같이 결정될 수 있다.

즉, 채널 상관도 계수 Γ가 크면 소수개로 분할된 서브밴드 분할 신호의 각 서브밴드로부터 큐 파라메터를 추출하고, 반대로 채널 상관도 계수 Γ가 작으면 다수개로 분할된 서브밴드 신호의 각 서브밴드로부터 큐 파라메터를 추출한다.

예를 들어, 채널 상관도 계수 Γ가 0.9인 경우, 10 서브밴드 파라메터 분석부(303)는 입력된 19 서브밴드 분할 신호들에 대해 주파수 계수들을 표 3에 따라 재분할한다. 즉, 19개의 서브밴드를 갖는 분할 신호는 10 서브밴드 파라메터 분석부(303)에 의해 10개의 서브밴드를 갖는 분할 신호로 변형된다.

이후, 10 서브밴드 파라메터 분석부(303)는 10개의 서브밴드 별로 다채널 파라메트릭 복호화부(107)에 전송해야 할 큐 파라메터를 추출한다. 큐 파라메터로는 채널간 주파수 크기차(ICLD)가 사용된다. ICLD는 일반적으로 센터 채널인 기준채널에 대한 서브밴드의 전력비를 나타내는 파라메터이다. 또한, 채널간 시간차(ICTD)가 추가적으로 큐 파라메터로서 사용될 수 있다. ICTD는 각 서브 밴드에서 기준채널과의 시간 지연차를 나타내는 파라메터로서, 기준채널과 다른 채널간의 상관함수로부터 신호간의 최대 상관성이 제공되도록 구해진다. ICTD는 오디오 음질에 크게 영향을 미치지 않으므로 큐 파라메터로서 선택적으로 사용될 수 있다.

ICLD는 수학식 4와 5에 의해서 구해진다.

여기서, △L_c _-1,b는 c번째 채널에서 b번째 서브밴드에 대한 ICLD 값이며, 1번째 채널이 기준채널로 사용된 것이다. S_c,n는 c번째 채널에서 n-포인트 주파수 계수이고, P_c _,b는 c번째 채널에서 b번째 서브밴드의 전력이다. 채널수가 C 개이면, 한 서브밴드에 대하여 C-1개의 ICLD가 추출된다.

ICLD와 ICTD의 추출과정은 논문 "Binaural Cue Coding-partII: schemes and application"(IEEE Trans. on speech and audio Proc. Vol. 11. No.6. Nov. 2003)에 게재된 바와 같이 잘 알려져 있으므로 자세한 설명은 생략한다.

10 서브밴드 파라메터 분석부(303)는 표3의 서브밴드 구간에 따라 10개의 서브밴드에 대해 채널 상관도 계수 Γ_b를 다시 추출하여 큐파라메터로서 다채널 파라메트릭 복호화부(107)에 전송한다.

채널 상관도 계수 Γ가 0.5와 0.8 사이인 경우, 19 서브밴드 파라메터 분석부(305)는 입력된 19 서브밴드 분할 신호들에 대해 19개의 서브밴드별로 큐 파라메터를 추출한다. 채널 상관도 계수 Γ가 0.8과 1.0 사이인 경우와 같이, 큐 파라메터로는 채널간 주파수 크기차(ICLD)가 사용된다. 또한, 채널간 시간차(ICTD)가 추가적으로 큐 파라메터로서 사용될 수 있다. 이 경우, 채널 상관도 측정부(301)에서 계산된 서브밴드 단위 채널 상관도 계수와 동일한 서브밴드 단위 채널 상관도 계수가 다채널 파라메트릭 복호화부(107)에 전송된다.

채널 상관도 계수 Γ가 0과 0.5 사이인 경우, 32 서브밴드 파라메터 분석부(303)는 입력된 19 서브밴드 분할 신호들에 대해 주파수 계수들을 표 4에 따라 재분할한다. 즉, 19개의 서브밴드를 갖는 분할 신호는 32 서브밴드 파라메터 분석부(303)에 의해 32개의 서브밴드를 갖는 분할 신호로 변형된다.

이후, 32 서브밴드 파라메터 분석부(307)는 32개의 서브밴드 별로 다채널 파라메트릭 복호화부(107)에 전송하여야 할 큐 파라메터를 추출한다. 큐 파라메터로는 ICLD 대신에 각 서브밴드에 대하여 부여된 채널 ID(Identification)가 사용된다. 여기서, 서브밴드에 대한 채널 ID( I_b)는 임의의 서브밴드 b에 대하여 최대 전력을 갖는 채널의 인덱스를 의미한다. 이를 수식으로 표현하면 수학식 6과 같다.

다채널 파라메트릭 복호화부(107)에 전송할 큐 파라메터로서 ICLD 대신에 채널 ID를 사용함으로써 큐 파라메터 전송량이 획기적으로 감소화게 된다. 예를 들어, 5채널의 신호인 경우, 필요한 큐 파라메터는 각 서브밴드당 1개씩 총 32개가 소요된다. 만약 ICLD가 사용된다면 각 서브밴드당 4개의 ICLD가 소요되므로 총 128개(= 4 x 32)가 소요될 것이다. 단, 서브밴드 개수가 작은 경우에도 큐 파라메터로서 채널 ID를 사용하면 신호의 열화가 크게 되므로, 서브밴드 개수가 32개와 같이 충분히 큰 경우에 다채널 파라메트릭 복호화부(107)에 전송할 큐 파라메터로서 채널 ID를 사용하는 것이 바람직하다.

물론, 채널간 시간차(ICTD)가 추가적으로 큐 파라메터로서 사용될 수 있다.

32 서브밴드 파라메터 분석부(307)는 표4의 서브밴드 구간에 따라 32개의 서브밴드에 대해 채널 상관도 계수 Γ_b를 다시 추출하여 큐파라메터로서 다채널 파라메트릭 복호화부(107)에 전송한다.

도 4는 도 1의 다채널 파라메트릭 복호화부(107)의 세부 블럭 구성도이다.

로 데이터 형태의 단일 채널 오디오 신호는 TF 변환부(401)에서 FFT 변환되어 주파수 영역의 단일 채널 오디오 신호로 된다. 파라메터 기반 다채널 생성부(403)는 파라메터 분석부(209)로부터 전송된 큐 파라메터 정보를 이용하여 주파수 영역의 단일 채널 오디오 신호로부터 주파수 영역의 다채널 오디오 신호를 생성한다. 주파수 영역의 다채널 오디오 신호는 채널별로 역 TF 변환부(405)에서 역 FFT 변환됨으로써 시간 영역의 다채널 오디오 신호가 생성된다.

도 5는 도4의 파라메터 기반 다채널 생성부(403)의 세부 블럭 구성도이다.

상관도 관측부(501)는 파라메터 분석부(209)로부터 전송된 프레임 단위 채널 상관도 계수 Γ를 표1과 비교하여 대응되는 서브밴드 파라메터 기반 생성부(503,505,507)을 선택한다.

예를 들어, 채널 상관도 계수 Γ가 0.9인 경우, 10 서브밴드 파라메터 생성부(503)는 입력된 단일 채널 오디오 신호를 표3에 따라 10 서브밴드로 분할한다. 10 서브밴드 파라메터 생성부(503)는 분할된 신호에 대해, 10 서브밴드 파라메터 분석부(303)로부터 전송된 ICLD와 서브밴드 단위 채널 상관도 계수 Γ_b를 이용하여 다채널 오디오 신호를 생성한다. 이 때, 수학식 7,8,9가 사용될 수 있다.

여기서 S_n ^b은 다운믹스된 단일채널 오디오 신호의 b번째 서브밴드의 n 포인트 주파수 계수이고,

는 c번째 채널 b번째 서브밴드의 n포인트 주파수 계수이다.

는 전력 이득 인자(power gain factor)로서 수학식 8로 표현된다.

r_i,n은 채널간에서 발생하는 음원의 공간감을 반영하기 위한 랜덤 변수이다. 즉, 복원되는 채널 신호는 상호간의 공간감을 유지하여야 하나, 모든 채널 신호는 다운믹스 신호로부터 복원됨으로써 공간감이 줄어드는 현상이 발생한다. 이러한 공간감을 살리기 위하여 랜덤한 변수 값을 전력 이득 인자를 계산하는 과정에 삽입시켜서, 복원 채널 신호에 무작위성을 가미함으로써 보다 넓은 공간감을 얻을 수 있다.

r_i,n은 수학식 9와 같이 표현될 수 있다.

여기서,

은 ±5 dB의 크기변화를 갖는 랜덤신호이다.

은 모든 채널과 서브밴드에 적용되며 동일한 분산과 제로 평균을 갖는다.

전술한 수학식 7, 8, 9를 통해 다채널 오디오 신호를 생성하는 방법은 상기 논문에 기재된 바와 같이 잘 알려져 있으므로 더 이상의 상세한 설명은 생략한다.

19 서브밴드 파라메터 기반 생성부(505)는 프레임 단위 채널 상관도 계수 Γ가 0.5와 0.8 사이인 경우에 동작하며, 10 서브밴드 파라메터 기반 생성부(503)와 동일한 방법으로 다채널 오디오 신호를 생성한다.

32 서브밴드 파라메터 기반 생성부(507)는 프레임 단위 채널 상관도 계수 Γ가 0과 0.5 사이인 경우에 동작한다. 32 서브밴드 파라메터 기반 생성부(507)는 단일 채널 오디오 신호를 표4에 따라 32 서브밴드로 분할한다. 32 서브밴드 파라메터 생성부(507)는 분할된 신호에 대해, 32 서브밴드 파라메터 분석부(307)로부터 전송된 채널 ID와 서브밴드 단위 채널 상관도 계수 Γ_b를 이용하여 다채널 오디오 신호를 생성한다.

서브 밴드 b에 대한 채널 ID가 c'(1≤c'≤C)일 경우 c' 채널의 서브밴드 b 신호는 수학식 10에 의해 할당된다.

S^b _c',n=S^b _n

그 밖의 서브밴드 신호들은 수학식 7, 11, 12에 의해 생성된다.

여기서, r_i,n은 채널간에서 발생하는 음원의 공간감을 반영하기 위한 랜덤 변수이다.

여기서,

은 ±5 dB의 크기변화를 갖는 랜덤신호이다.

여기서 은 r_i,n은 다음과 같이 정의 한다.

서브밴드 파라메터 기반 생성기(503,505,507)에 의해 생성된 주파수 영역의 다채널 오디오 신호는 채널별로 역 TF 변환부(405)에 의해 역 FFT 변환됨으로써 시간영역의 다채널 오디오 신호가 복원된다.

전술한 본 발명에 따른 다채널 파라메트릭 부복호화 과정을 도6 및 도7을 참조하여 정리하면 다음과 같다. 도6은 본 발명에 따른 다채널 파라메트릭 부호화 절 차를 도시한 흐름도이다.

다채널 오디오 신호는 FFT 변환된 후 표1에 따라 19개의 서브밴드로 분할된다(S601). 19 서브밴드 분할 신호에 대해 서브밴드 단위의 채널 상관도 계수 Γ_b가 측정되고, 이를 기초로 프레임 단위의 채널 상관도 계수 Γ가 측정된다(S603).

프레임 단위 채널 상관도 계수 Γ가 0.8보다 큰 경우, 19 서브밴드 분할 신호는 표3에 의해 10 서브밴드 신호로 재분할되고, 10개의 서브밴드에 대해 ICLD와 서브밴드 단위의 채널 상관도 계수 Γ_b가 추출된다(S605, S607, S609). 이후, S609단계에서 추출된 ICLD 및 서브밴드 단위 채널 상관도 계수Γ_b와, S603 단계에서 측정된 프레임 단위 채널 상관도 계수 Γ로 이루어진 큐 파라메터는 다채널 파라메트릭 복호화부에 전송된다(S611).

프레임 단위 채널 상관도 계수 Γ가 0.5와 0.8 사이인 경우, 19 서브밴드 분할 신호의 19개의 서브밴드에 대해 ICLD가 추출된다(S605, S607, S613). 이후, S613단계에서 추출된 ICLD와, S603 단계에서 측정된 서브밴드 단위 채널 상관도 계수Γ_b 및 프레임 단위 채널 상관도 계수 Γ로 이루어진 큐 파라메터는 다채널 파라메트릭 복호화부에 전송된다(S615).

프레임 단위 채널 상관도 계수 Γ가 0과 0.5 사이인 경우, 19 서브밴드 분할 신호는 표4에 의해 32 서브밴드 신호로 재분할되고, 32개의 서브밴드에 대해 채널 ID와 서브밴드 단위의 채널 상관도 계수 Γ_b가 추출된다(S605, S617). 이후, S617단 계에서 추출된 채널 ID 및 서브밴드 단위 채널 상관도 계수Γ_b와, S603 단계에서 측정된 프레임 단위 채널 상관도 계수 Γ로 이루어진 큐 파라메터는 다채널 파라메트릭 복호화부에 전송된다(S619).

도7은 본 발명에 따른 다채널 파라메트릭 복호화 절차를 도시한 흐름도이다.

단일채널 오디오 신호는 FFT 변환된다(S701). 다채널 파라메트릭 부호화부(101)로부터 전송된 프레임 단위 채널 상관도 계수 Γ가 관측된다(S703).

프레임 단위 채널 상관도 계수 Γ가 0.8보다 큰 경우, FFT 변환된 신호는 표3에 의해 10 서브밴드 신호로 분할되고, 전송된 ICLD와 서브밴드 단위 채널 상관도 계수 Γ_b에 의해 서브밴드 단위별로 신호가 복호화된다(S705, S707, S709).

프레임 단위 채널 상관도 계수 Γ가 0.5와 0.8 사이인 경우, FFT 변환된 신호는 표1에 의해 19 서브밴드 신호로 분할되고, 전송된 ICLD와 서브밴드 단위 채널 상관도 계수 Γ_b에 의해 서브밴드 단위별로 신호가 복호화된다(S705, S707, S711).

프레임 단위 채널 상관도 계수 Γ가 0과 0.5 사이인 경우, FFT 변환된 신호는 표4에 의해 32 서브밴드 신호로 분할되고, 전송된 채널 ID와 서브밴드 단위 채널 상관도 계수 Γ_b에 의해 서브밴드 단위별로 신호가 복호화된다(S705, S713).

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체에 저장될 수 있다.

이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지 식을 가진 자에 의해 본 발명의 기술 사상과 아래에 기재될 특허청구범위의 균등 범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.

Claims

다채널 오디오 신호를 주파수 영역에서 분할하는 신호 분할 수단;

상기 분할된 신호를 단일채널로 다운믹스(dowm-mix)하여 부호화하는 다운믹스 수단; 및

상기 분할된 신호에 대해 프레임 단위의 채널 상관도를 측정하고, 상기 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할하는 파라메터 분석 수단을 포함하며,

상기 파라메터 분석 수단은,

상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 복호화를 위한 큐 파라메터로서, 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 추출하여 부호화하는

다채널 오디오 신호 부호화 장치.
제1항에 있어서,

상기 제1기준값은

0.5인

다채널 오디오 신호 부호화 장치.
제 1항에 있어서,

상기 파라메터 분석 수단은

상기 프레임 단위 채널 상관도가 감소함에 따라 증가하는 개수의 서브밴드로 상기 분할된 신호를 재분할하는

다채널 오디오 신호 부호화 장치.
제 1항에 있어서,

상기 프레임 단위 채널 상관도는

상기 분할된 신호에 대한 서브밴드 단위의 채널 상관도로부터 획득되는

다채널 오디오 신호 부호화 장치.
제4항에 있어서,

상기 프레임 단위 채널 상관도는

고주파 대역의 서브밴드 단위 채널 상관도 보다 저주파 대역의 서브밴드 단위 채널 상관도에 의해 결정되는

다채널 오디오 신호 부호화 장치.
제1항에 있어서,

상기 재분할된 서브밴드 b에 대한 채널 ID는

재분할된 서브밴드 b의 전력이 최대가 되는 채널의 인덱스인

다채널 오디오 신호 부호화 장치.
제 1항에 있어서,

상기 파라메터 분석 수단은

상기 프레임 단위 채널 상관도가 상기 제1기준값 이상인 경우 상기 큐 파라메터로서, 상기 재분할된 신호의 서브밴드별로 채널간 주파수 크기차(Inter-Channel Level Difference)와 서브밴드 단위 채널 상관도를 추출하여 부호화하는

다채널 오디오 신호 부호화 장치.
제1항 또는 제7항에 있어서,

상기 파라메터 분석 수단은

상기 큐 파라메터로서, 상기 재분할된 신호의 서브밴드별로 채널간 시간 지연차(Inter-Channel Level Difference)를 부가적으로 추출하는

다채널 오디오 신호 부호화 장치.
제 1항에 있어서,

상기 파라메터 분석 수단은

상기 프레임 단위 채널 상관도가 상기 제1기준값 이하인 경우, 상기 분할된 신호의 서브밴드 개수 보다 많은 개수로 상기 분할된 신호를 재분할하고,

상기 프레임 단위 채널 상관도가 상기 제1기준값보다 큰 제2기준값 이상인 경우, 상기 분할된 신호의 서브밴드 개수 보다 적은 개수로 상기 분할된 신호를 재분할하고,

상기 프레임 단위 채널 상관도가 상기 제1기준값과 상기 제2기준값 사이인 경우, 재분할을 하지 않는

다채널 오디오 신호 부호화 장치.
제9항에 있어서,

상기 제2기준값은

0.8인

다채널 오디오 신호 부호화 장치.
제9항에 있어서,

상기 파라메터 분석 수단은

상기 프레임 단위 채널 상관도가 상기 제1기준값과 상기 제2기준값 사이인 경우 상기 큐 파라메터로서, 상기 분할된 신호의 서브밴드별로 채널간 주파수 크기차(Inter-Channel Level Difference)와 서브밴드 단위 채널 상관도를 추출하여 부호화하는

다채널 오디오 신호 부호화 장치.
주파수 영역에서 분할된 다채널 오디오 신호를 단일채널로 다운믹스하여 부호화하고, 상기 분할된 다채널 오디오 신호에 대한 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할함으로써 부호화된 오디오 신호를 다채널 오디오 신호로 복호화하는 다채널 오디오 신호 복호화 장치에 있어서,

상기 부호화된 단일채널 오디오 신호를 복호화하는 단일채널 복호화 수단; 및

상기 프레임 단위 채널 상관도에 따라, 상기 재분할시에 사용된 서브밴드 구간과 동일하게 상기 복호화된 단일채널 오디오 신호를 주파수 영역에서 분할하는 파라메터 기반 다채널 생성 수단을 포함하며,

상기 파라메터 기반 다채널 생성 수단은,

상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 이용하여 상기 단일채널 오디오 신호로 복호화하는

다채널 오디오 신호 복호화 장치.
제12항에 있어서,

상기 제1기준값은

0.5인

다채널 오디오 신호 복호화 장치.
제12항에 있어서,

상기 파라메터 기반 채널 생성 수단은

상기 프레임 단위 채널 상관도가 감소함에 따라 증가하는 개수의 서브밴드로 상기 복호화된 단일채널 오디오 신호를 분할하는

다채널 오디오 신호 복호화 장치.
제12항에 있어서,

상기 재분할된 서브밴드 b에 대한 채널 ID는

재분할된 서브밴드 b의 전력이 최대가 되는 채널의 인덱스인

다채널 오디오 신호 복호화 장치.
제12항에 있어서,

상기 파라메터 기반 채널 생성 수단은

상기 프레임 단위 채널 상관도가 상기 제1기준값 이상인 경우, 상기 재분할된 신호의 서브밴드별 채널간 주파수 크기차와 서브밴드 단위 채널 상관도를 이용하여 복호화하는

다채널 오디오 신호 복호화 장치.
제12항 또는 제16항에 있어서,

상기 파라메터 기반 채널 생성 수단은

상기 재분할된 신호의 서브밴드별 채널간 시간 지연차를 추가적으로 이용하여 복호화하는

다채널 오디오 신호 복호화 장치.
제15항에 있어서,

상기 파라메터 기반 채널 생성 수단은

서브 밴드 b에 대한 채널 ID가 c'(1≤c'≤C, C는 채널수)일 경우, c' 채널의 서브밴드 b 신호는 단일채널 오디오 신호의 서브밴드 b 신호로 할당하는

다채널 오디오 신호 복호화 장치.
제18항에 있어서,

상기 파라메터 기반 채널 생성 수단은

상기 단일채널 오디오 신호에 채널간에서 발생하는 음원의 공간감에 관한 성분을 반영하여 나머지 서브밴드 신호로 할당하는

다채널 오디오 신호 복호화 장치.
다채널 오디오 신호를 주파수 영역에서 분할하는 단계;

상기 분할된 신호를 단일채널로 다운믹스(dowm-mix)하여 부호화하는 단계;

상기 분할된 신호에 대해 프레임 단위의 채널 상관도를 측정하는 단계;

상기 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할하는 단계; 및

상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우, 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 단계를 포함하는

다채널 오디오 신호 부호화 방법.
제20항에 있어서,

상기 제1기준값은

0.5인

다채널 오디오 신호 부호화 방법.
제20항에 있어서,

재분할 단계는

상기 프레임 단위 채널 상관도가 감소함에 따라 증가하는 개수의 서브밴드로 상기 분할된 신호를 재분할하는

다채널 오디오 신호 부호화 방법.
제20항에 있어서,

상기 프레임 단위 채널 상관도는 상기 분할된 신호에 대한 서브밴드 단위의 채널 상관도로부터 획득되는

다채널 오디오 신호 부호화 방법.
제23항에 있어서,

상기 프레임 단위 채널 상관도는 고주파 대역의 서브밴드 단위 채널 상관도 보다 저주파 대역의 서브밴드 단위 채널 상관도에 의해 결정되는

다채널 오디오 신호 부호화 방법.
제20항에 있어서,

상기 재분할된 서브밴드 b에 대한 채널 ID는

재분할된 서브밴드 b의 전력이 최대가 되는 채널의 인덱스인

다채널 오디오 신호 부호화 방법.
제20항에 있어서,

상기 프레임 단위 채널 상관도가 상기 제1기준값 이상인 경우, 상기 재분할된 신호의 서브밴드별로 채널간 주파수 크기차(Inter-Channel Level Difference)와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 단계를 더 포함하는

다채널 오디오 신호 부호화 방법.
제20항 또는 제26항에 있어서,

상기 재분할된 신호의 서브밴드별로 채널간 시간 지연차(Inter-Channel Level Difference)를 추출하는 단계를 더 포함하는

다채널 오디오 신호 부호화 방법.
제20항에 있어서,

상기 재분할 단계는

상기 프레임 단위 채널 상관도가 상기 제1기준값 이하인 경우, 상기 분할된 신호의 서브밴드 개수 보다 많은 개수로 상기 분할된 신호를 재분할하는 단계;

상기 프레임 단위 채널 상관도가 상기 제1기준값보다 큰 제2기준값 이상인 경우, 상기 분할된 신호의 서브밴드 개수 보다 적은 개수로 상기 분할된 신호를 재분할하는 단계; 및

상기 프레임 단위 채널 상관도가 상기 제1기준값과 상기 제2기준값 사이인 경우, 재분할을 하지 않는 단계를 포함하는

다채널 오디오 신호 부호화 방법.
제28항에 있어서,

상기 제2기준값은

0.8인

다채널 오디오 신호 부호화 방법.
제28항에 있어서,

상기 프레임 단위 채널 상관도가 상기 제1기준값과 상기 제2기준값 사이인 경우, 상기 분할된 신호의 서브밴드별로 채널간 주파수 크기차와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 단계를 더 포함하는

다채널 오디오 신호 부호화 방법.
주파수 영역에서 분할된 다채널 오디오 신호를 단일채널로 다운믹스하여 부호화하고, 상기 분할된 다채널 오디오 신호에 대한 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할함으로써 부호화된 오디오 신호를 다채널 오디오 신호로 복호화하는 다채널 오디오 신호 복호화 방법에 있어서,

상기 부호화된 단일채널 오디오 신호를 복호화하는 단계;

상기 프레임 단위 채널 상관도에 따라, 상기 재분할시에 사용된 서브밴드 구간과 동일하게 상기 복호화된 단일채널 오디오 신호를 주파수 영역에서 분할하는 단계; 및

상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 이용하여 상기 단일채널 오디오 신호로 복호화하는 단계를 포함하는

다채널 오디오 신호 복호화 방법.
제30항에 있어서,

상기 제1기준값은

0.5인

다채널 오디오 신호 복호화 방법.
제31항에 있어서,

상기 분할 단계는

상기 프레임 단위 채널 상관도가 감소함에 따라 증가하는 개수의 서브밴드로 상기 복호화된 단일채널 오디오 신호를 분할하는

다채널 오디오 신호 복호화 방법.
제31항에 있어서,

상기 재분할된 서브밴드 b에 대한 채널 ID는

재분할된 서브밴드 b의 전력이 최대가 되는 채널의 인덱스인

다채널 오디오 신호 복호화 방법.
제31항에 있어서,

상기 프레임 단위 채널 상관도가 상기 제1기준값 이상인 경우, 상기 재분할된 신호의 서브밴드별 채널간 주파수 크기차와 서브밴드 단위 채널 상관도를 이용하여 복호화하는 단계를 더 포함하는

다채널 오디오 신호 복호화 방법.
제31항 또는 제35항에 있어서,

상기 재분할된 신호의 서브밴드별 채널간 시간 지연차를 추가적으로 이용하여 복호화하는 단계를 더 포함하는

다채널 오디오 신호 복호화 방법.
제34항에 있어서,

서브 밴드 b에 대한 채널 ID가 c'(1≤c'≤C, C는 채널수)일 경우, c' 채널의 서브밴드 b 신호는 단일채널 오디오 신호의 서브밴드 b 신호로 할당되는

다채널 오디오 신호 복호화 방법.
제37항에 있어서,

나머지 서브밴드 신호는 상기 단일채널 오디오 신호에 채널간에서 발생하는 음원의 공간감에 관한 성분을 반영한 신호로 할당되는

다채널 오디오 신호 복호화 방법.