[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR100745688B1 - 다채널 오디오 신호 부호화/복호화 방법 및 장치 - Google Patents

다채널 오디오 신호 부호화/복호화 방법 및 장치 Download PDF

Info

Publication number
KR100745688B1
KR100745688B1 KR1020050061655A KR20050061655A KR100745688B1 KR 100745688 B1 KR100745688 B1 KR 100745688B1 KR 1020050061655 A KR1020050061655 A KR 1020050061655A KR 20050061655 A KR20050061655 A KR 20050061655A KR 100745688 B1 KR100745688 B1 KR 100745688B1
Authority
KR
South Korea
Prior art keywords
channel
audio signal
subband
signal
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020050061655A
Other languages
English (en)
Other versions
KR20060049980A (ko
Inventor
백승권
서정일
박기윤
이병화
강경옥
홍진우
한민수
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20060049980A publication Critical patent/KR20060049980A/ko
Application granted granted Critical
Publication of KR100745688B1 publication Critical patent/KR100745688B1/ko
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 다채널 오디오 신호를 부호화/복호화 하는 방법 및 장치에 관한 것으로, 보다 상세하게는, 채널 상관성에 기반하여 다채널 오디오 신호를 부호화 및 복호화하는 다채널 파라메트릭 부호화/복호화 방법 및 장치에 관한 것이다.
본 발명에 따른 다채널 오디오 신호 부호화 장치는 다채널 오디오 신호를 주파수 영역에서 분할하는 신호 분할 수단; 상기 분할된 신호를 단일채널로 다운믹스(dowm-mix)하여 부호화하는 다운믹스 수단; 및 상기 분할된 신호에 대해 프레임 단위의 채널 상관도를 측정하고, 상기 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할하는 파라메터 분석 수단을 포함하며, 상기 파라메터 분석 수단은, 상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 복호화를 위한 큐 파라메터로서, 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 것을 특징으로 한다.
본 발명은 다채널 오디오 신호의 복호화에 필요한 큐 파라메터를 최적화함으로써 적은 대역폭이 할당되는 환경에서도 단일채널 오디오 신호로부터 다채널 오디오 신호를 복원하여 재생할 수 있는 효과를 제공한다.
오디오 코딩, 큐 파라메터, 다채널, 채널 상관성

Description

다채널 오디오 신호 부호화/복호화 방법 및 장치{Apparatus for encoding and decoding multichannel audio signal and method thereof}
도 1은 본 발명에 따른 다채널 오디오 신호 부/복호화 장치의 블럭 구성도;
도 2는 도 1의 다채널 파라메트릭 부호화부의 세부 블럭 구성도;
도 3은 도 2의 파라메터 분석부의 세부 블럭 구성도;
도 4는 도 1의 다채널 파라메트릭 복호화부의 세부 블럭 구성도;
도 5는 도 4의 파라메터 기반 다채널 생성부의 세부 블럭 구성도;
도 6은 본 발명에 따른 다채널 오디오 신호를 부호화하는 과정을 도시한 흐름도; 및
도 7은 본 발명에 따른 다채널 오디오 신호를 복호화하는 과정을 도시한 흐름도이다.
본 발명은 다채널 오디오 신호를 부호화/복호화 하는 방법 및 장치에 관한 것으로, 보다 상세하게는, 채널 상관성에 기반하여 다채널 오디오 신호를 부호화 및 복호화하는 다채널 파라메트릭 부호화/복호화 방법 및 장치에 관한 것이다.
광대역 오디오 신호의 부호화 기술은 최근 수년 동안 놀라운 성장을 거듭하고 있다. 이러한 부호화 기술의 발전에 따라, 가정에서나 이동중인 차량 안에서 다채널 오디오를 재생할 수 있는 다채널 오디오 시스템이 상용화 되고 있다. 그러나 다채널 오디오 신호의 전송과정에서 소요되는 대역폭의 문제로 인하여 아직까지 보다 폭넓은 상용화 단계에는 이르지 못하고 있다.
최근들어 공간정보 기반 오디오 코딩(SAC: Spatial audio coding) 기술의 소개는 한정된 대역폭에서 효과적으로 다채널 오디오 신호를 전송 및 표현 가능하도록 하고 있다. 특히 바이노럴 큐 코딩(BCC: Binaural cue coding) 방식의 SAC는 적은 대역폭에서도 고품질의 다채널 오디오 신호를 재생할 수 있는 알고리즘으로서 최근 크게 주목 받고 있는 기술이다.
BCC의 기본 개념은, 사람이 느낄 수 있는 음향에 대한 공간감이 두 귀로 인하여 발생한다는 사실에 근거하여 이를 표현할 수 있는 큐 파라메터를 이용하여 오디오 신호를 생성하는 것이다. BCC는 사람이 주로 인지하는 큐 파라메터로서 소리 크기의 차와 소리 지연의 차를 이용하여 다운믹스된 단일 채널 오디오 신호로부터 다채널 오디오 신호를 복원한다. BCC에 관한 보다 자세한 내용은 논문 "Binaural Cue Coding-partII: schemes and application"(IEEE Trans. on speech and audio Proc. Vol. 11. No.6. Nov. 2003)에 기재되어 있다.
그러나, BCC 방식은 추출된 큐 파라메터를 전송하기 위한 대역폭도 채널 수 가 증가함에 따라 선형적으로 증가한다는 문제점을 가지고 있다. 예를들어 스테레오 신호를 표현하기 위해 필요한 큐 파라메터가 4 kbps 소요된다고 가정할 경우, 5 채널에 대하여 20 kbps 소요됨으로써 상당량의 대역폭을 차지하게 된다.
본 발명은 전술한 문제점을 해결하기 위한 것으로, 채널 상관도에 따라 최적의 큐 파라메터를 추출함으로써, 작은량의 큐 파라메터를 이용하며 BCC와 동일한 오디오 재생 품질을 제공하는 것을 그 목적으로 한다.
본 발명이 속한 기술 분야에서 통상의 지식을 가진 자는 본 명세서의 도면, 발명의 상세한 설명 및 특허청구범위로부터 본 발명의 다른 목적 및 장점을 쉽게 인식할 수 있을 것이다.
본 발명에 따른 다채널 오디오 신호 부호화 장치는 다채널 오디오 신호를 주파수 영역에서 분할하는 신호 분할 수단; 상기 분할된 신호를 단일채널로 다운믹스(dowm-mix)하여 부호화하는 다운믹스 수단; 및 상기 분할된 신호에 대해 프레임 단위의 채널 상관도를 측정하고, 상기 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할하는 파라메터 분석 수단을 포함하며, 상기 파라메터 분석 수단은, 상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 복호화를 위한 큐 파라메터로서, 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 것을 특징으로 한다.
상기 파라메터 분석 수단은 상기 프레임 단위 채널 상관도가 감소함에 따라 증가하는 개수의 서브밴드로 상기 분할된 신호를 재분할한다. 상기 프레임 단위 채널 상관도는 상기 분할된 신호에 대한 서브밴드 단위의 채널 상관도로부터 획득된다. 상기 프레임 단위 채널 상관도는 고주파 대역의 서브밴드 단위 채널 상관도 보다 저주파 대역의 서브밴드 단위 채널 상관도에 의해 결정된다. 상기 재분할된 서브밴드 b에 대한 채널 ID는 재분할된 서브밴드 b의 전력이 최대가 되는 채널의 인덱스이다.
상기 파라메터 분석 수단은 상기 프레임 단위 채널 상관도가 상기 제1기준값 이상인 경우 상기 큐 파라메터로서, 상기 재분할된 신호의 서브밴드별로 채널간 주파수 크기차(Inter-Channel Level Difference)와 서브밴드 단위 채널 상관도를 추출하여 부호화한다. 상기 파라메터 분석 수단은 상기 큐 파라메터로서, 상기 재분할된 신호의 서브밴드별로 채널간 시간 지연차(Inter-Channel Level Difference)를 부가적으로 추출한다.
상기 파라메터 분석 수단은 상기 프레임 단위 채널 상관도가 상기 제1기준값 이하인 경우, 상기 분할된 신호의 서브밴드 개수 보다 많은 개수로 상기 분할된 신호를 재분할하고, 상기 프레임 단위 채널 상관도가 상기 제1기준값보다 큰 제2기준값 이상인 경우, 상기 분할된 신호의 서브밴드 개수 보다 적은 개수로 상기 분할된 신호를 재분할하고, 상기 프레임 단위 채널 상관도가 상기 제1기준값과 상기 제2기준값 사이인 경우, 재분할을 하지 않는다.
상기 파라메터 분석 수단은 상기 프레임 단위 채널 상관도가 상기 제1기준값과 상기 제2기준값 사이인 경우 상기 큐 파라메터로서, 상기 분할된 신호의 서브밴드별로 채널간 주파수 크기차(Inter-Channel Level Difference)와 서브밴드 단위 채널 상관도를 추출하여 부호화한다.
본 발명에 따른 다채널 오디오 신호 복호화 장치는 주파수 영역에서 분할된 다채널 오디오 신호를 단일채널로 다운믹스하여 부호화하고, 상기 분할된 다채널 오디오 신호에 대한 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할함으로써 부호화된 오디오 신호를 다채널 오디오 신호로 복호화하는 다채널 오디오 신호 복호화 장치에 있어서, 상기 부호화된 단일채널 오디오 신호를 복호화하는 단일채널 복호화 수단; 및 상기 프레임 단위 채널 상관도에 따라, 상기 재분할시에 사용된 서브밴드 구간과 동일하게 상기 복호화된 단일채널 오디오 신호를 주파수 영역에서 분할하는 파라메터 기반 다채널 생성 수단을 포함하며, 상기 파라메터 기반 다채널 생성 수단은, 상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 이용하여 상기 단일채널 오디오 신호로 복호화하는 것을 특징으로 한다.
상기 파라메터 기반 채널 생성 수단은 상기 프레임 단위 채널 상관도가 상기 제1기준값 이상인 경우, 상기 재분할된 신호의 서브밴드별 채널간 주파수 크기차와 서브밴드 단위 채널 상관도를 이용하여 복호화한다. 상기 파라메터 기반 채널 생성 수단은 상기 재분할된 신호의 서브밴드별 채널간 시간 지연차를 추가적으로 이용하여 복호화한다.
상기 파라메터 기반 채널 생성 수단은 서브 밴드 b에 대한 채널 ID가 c'(1≤ c'≤C, C는 채널수)일 경우, c' 채널의 서브밴드 b 신호는 단일채널 오디오 신호의 서브밴드 b 신호로 할당한다. 또한, 상기 파라메터 기반 채널 생성 수단은 상기 단일채널 오디오 신호에 채널간에서 발생하는 음원의 공간감에 관한 성분을 반영하여 나머지 서브밴드 신호로 할당한다.
본 발명에 따른 다채널 오디오 신호 부호화 방법은 다채널 오디오 신호를 주파수 영역에서 분할하는 단계; 상기 분할된 신호를 단일채널로 다운믹스(dowm-mix)하여 부호화하는 단계; 상기 분할된 신호에 대해 프레임 단위의 채널 상관도를 측정하는 단계; 상기 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할하는 단계; 및 상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우, 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 따른 다채널 오디오 신호 복호화 방법은, 주파수 영역에서 분할된 다채널 오디오 신호를 단일채널로 다운믹스하여 부호화하고, 상기 분할된 다채널 오디오 신호에 대한 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할함으로써 부호화된 오디오 신호를 다채널 오디오 신호로 복호화하는 다채널 오디오 신호 복호화 방법에 있어서, 상기 부호화된 단일채널 오디오 신호를 복호화하는 단계; 상기 프레임 단위 채널 상관도에 따라, 상기 재분할시에 사용된 서브밴드 구간과 동일하게 상기 복호화된 단일채널 오디오 신호를 주파수 영역에서 분할하는 단계; 및 상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 이용하여 상기 단일채널 오디오 신호로 복호화하는 단계를 포함하는 것을 특징으로 한다.
상술한 목적 및 특징은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한 본 발명을 설명함에 있어서 본발명과 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일 실시예를 상세히 설명하기로 한다.
도 1은 본 발명에 따른 다채널 오디오 신호 부/복호화 장치의 블럭 구성도이다. C개의 채널을 갖는 다채널 오디오 신호는 다채널 파라메트릭 부호화부(101)에 입력된다. 다채널 파라메트릭 부호화부(101)는 입력된 다채널 오디오 신호를 다운믹스(down-mix)하여 로(raw) 데이터 형태의 단일 채널 오디오 신호를 출력한다. 또한, 다채널 파라메트릭 부호화부(101)는 채널 상관성에 기반하여 다채널 신호로 복호화하기 위한 큐 파라메터(cue parameter) 정보를 추출하여 출력한다.
큐 파라메터 정보에는 채널 상관성에 따라 채널간 주파수 크기차(Inter-Channel Level Difference; ICLD) 또는 채널 ID(IDentification)가 포함된다. 보다 구체적으로, 채널 상관도(Inter-Chanenel Correalation; ICC)가 소정의 값 이상인 경우 ICLD가 사용된다. 이 때, 채널간 시간차(Inter-Channel Time Difference; ICTD)가 부가적으로 사용될 수 있다. 또한, 채널 상관도가 소정의 값 이하인 경우 채널 ID가 사용된다. 이 때, ICTD가 부가적으로 사용될 수 있다.
다채널 파라메트릭 부호화부(101)로부터 출력된 단일 채널 오디오 신호는 일반 오디오 부호화부(103)에 의해 특정 파일 포맷으로 부호화된다. 일반 오디오 부호화부(103)는 mp3 인코더와 같이 일반적으로 알려진 통상의 오디오 부호화기이다.
일반 오디오 복호화부(105)는 일반 오디오 부호화부(103)에 대응되며, 특정 파일 포맷의 음성 파일을 복호화하여 로 데이터 형태의 단일 채널 오디오 신호를 출력한다. 다채널 파라메트릭 복호화부(107)는 다채널 파라메트릭 부호화부(101)에 의해서 생성된 큐 파라메터 정보를 이용하여 입력된 단일 채널 오디오 신호를 다채널 오디오 신호로 복원하여 출력한다. 보다 구체적으로, 채널 상관성이 소정의 값 이하인 경우, ICLD를 이용하여 단일 채널 오디오 신호를 다채널 오디오 신호로 복원한다. 또한, 채널 상관성이 소정의 값 이상인 경우, 채널 ID를 이용하여 단일 채널 오디오 신호를 다채널 오디오 신호를 복원한다.
도 2는 도 1의 다채널 파라메트릭 부호화부(101)의 세부 블럭 구성도이다. 각 채널 신호는 TF(Time Frequency) 변환부(201)에서 프레임 단위로 주파수 변환 예를 들어, 고속 푸리에 변환(Fast Fourier Transform; FFT)된다. FFT 변환된 각 채널 신호는 신호 분할부(203)에서 B개의 서브밴드로 분할된다. b(1≤b≤B)번째 서브밴드는 분할 경계값, Ab-1과 Ab-1 사이의 FFT 주파수 계수(spectral coefficient)로 이루어진다.
예를 들어, 1024 포인트의 FFT 변환된 각 채널 신호는 신호 분할부(203)에서 표1에 의해 19개의 서브밴드로 분할될 수 있다. 이 경우, 첫번째 서브밴드는 0,1,2 번째 주파수 계수로 이루어지고, 두번째 서브밴드는 3,4,5번째 주파수 계수로 이루어질 것이다. 여기서, 주파수 계수의 대칭성으로 인해 513번째 주파수 계수까지만 고려된다.
Figure 112005037063233-pat00001
서브밴드 분할 방법으로 청각특성이 반영되도록 임계밴드(critical band) 분할과 유사하게 등량의 사각 밴드(Equivalent Rectangular Band: ERB)가 사용된다. 분할된 주파수 영역 서브밴드 신호들은 다운믹스부(205)에서 서브밴드 단위로 혼합하여 다운믹스됨으로써, 주파수 영역의 단일 채널 프레임 신호가 생성된다.
다운믹스된 단일 채널 프레임 신호는 역 TF(Inverse Time Frequency) 변환부(207)에서 역 고속 퓨리에 변환(Inverse FFT)됨으로써, 일반 오디오 디코더의 입력 웨이브 신호로 사용될 수 있는 단일 채널 오디오 신호가 생성된다.
한편, 19밴드로 분할된 주파수 영역 서브밴드 신호들은 파라메터 분석부(209)에도 입력된다. 파라메터 분석부(209)에서는 채널 상관도를 측정한다. 또한, 파라메터 분석부(209)는 측정된 채널 상관도에 기초하여 단일 채널 오디오 신호로부터 다채널 오디오 신호를 복원하는 데 필요한 큐 파라메터 정보를 추출한다. 파라메터 분석부(209)에 대한 보다 상세한 설명은 도 3을 참조하여 이루어질 것이다.
도 3은 도 2의 파라메터 분석부(209)의 상세 블럭 구성도이다. 채널 상관도 측정부(301)는 분할된 주파수 영역 서브밴드 신호들을 대상으로 서브밴드 단위 채널 상관도를 측정한다. 서브밴드 단위 채널 상관도는 수학식 1과 같이 정규화된 상호 상관함수(coherence function)를 이용하여 구해진다.
Figure 112005037063233-pat00002
여기서,
Figure 112005037063233-pat00003
는 i번째 채널 신호의 b번째 서브밴드 신호와 j번째 채널 신호의 b번째 서브밴드 신호간의 상관도이다. xf i,b는 i번째 채널 신호의 b번째 서브밴드의 주파수 계수이다. 위첨자 f는 주파수 영역임을 표현한 것이며 *는 해당 복소수의 공액복소수 변환을 나타낸다. i는 기준채널로서 고정되어 있는 것으로 간주한다. 그러므로 채널 수가 C개일 때, 각 서브밴드별로 C-1개의 상관도가 측정된다. 기준채널로 1번째 채널 신호가 사용되는 경우, 서브밴드 b에 대한 채널 상관도 계수 Γb는 수학식 2로 표현된다. 기준채널로서는 오디오 신호의 주요 전력을 제 공하는 센터(cneter) 채널 신호가 사용된다.
Figure 112005037063233-pat00004
한 프레임에 대한 채널 상관도 계수 Γ는 수학식 3으로부터 구해질 수 있다.
Figure 112005037063233-pat00005
N≒M/2로서, M이 19인 경우 N은 10으로 결정된다. α는 스무딩 인자(smoothing factor)로서 초기 N개의 저역 신호가 프레임 단위 채널 상관도 계수에 주로 영향을 미치도록 0.5 이하의 작은 값을 가지는 것이 바람직하다.
채널 상관도 측정부(301)는 프레임 단위 채널 상관도 계수 Γ를 큐 파라메터로서 다채널 파라메트릭 복호화부(107)에 전송한다.
채널 상관도 계수 Γ에 따라, 다채널 오디오 신호를 복원하기 위해 필요한 큐파라메터의 종류가 달리 결정된다. 또한, 채널 상관도 계수 Γ에 따라, 큐파라메터를 추출하는 서브밴드의 개수가 상이하게 결정된다.
채널 상관도 계수 Γ와 큐파라메터를 추출하는 서브밴드 개수와의 관계는 표2와 같이 결정될 수 있다.
Figure 112005037063233-pat00006
즉, 채널 상관도 계수 Γ가 크면 소수개로 분할된 서브밴드 분할 신호의 각 서브밴드로부터 큐 파라메터를 추출하고, 반대로 채널 상관도 계수 Γ가 작으면 다수개로 분할된 서브밴드 신호의 각 서브밴드로부터 큐 파라메터를 추출한다.
예를 들어, 채널 상관도 계수 Γ가 0.9인 경우, 10 서브밴드 파라메터 분석부(303)는 입력된 19 서브밴드 분할 신호들에 대해 주파수 계수들을 표 3에 따라 재분할한다. 즉, 19개의 서브밴드를 갖는 분할 신호는 10 서브밴드 파라메터 분석부(303)에 의해 10개의 서브밴드를 갖는 분할 신호로 변형된다.
Figure 112005037063233-pat00007
이후, 10 서브밴드 파라메터 분석부(303)는 10개의 서브밴드 별로 다채널 파라메트릭 복호화부(107)에 전송해야 할 큐 파라메터를 추출한다. 큐 파라메터로는 채널간 주파수 크기차(ICLD)가 사용된다. ICLD는 일반적으로 센터 채널인 기준채널에 대한 서브밴드의 전력비를 나타내는 파라메터이다. 또한, 채널간 시간차(ICTD)가 추가적으로 큐 파라메터로서 사용될 수 있다. ICTD는 각 서브 밴드에서 기준채널과의 시간 지연차를 나타내는 파라메터로서, 기준채널과 다른 채널간의 상관함수로부터 신호간의 최대 상관성이 제공되도록 구해진다. ICTD는 오디오 음질에 크게 영향을 미치지 않으므로 큐 파라메터로서 선택적으로 사용될 수 있다.
ICLD는 수학식 4와 5에 의해서 구해진다.
Figure 112005037063233-pat00008
Figure 112005037063233-pat00009
여기서, △Lc -1,b는 c번째 채널에서 b번째 서브밴드에 대한 ICLD 값이며, 1번째 채널이 기준채널로 사용된 것이다. Sc,n는 c번째 채널에서 n-포인트 주파수 계수이고, Pc ,b는 c번째 채널에서 b번째 서브밴드의 전력이다. 채널수가 C 개이면, 한 서브밴드에 대하여 C-1개의 ICLD가 추출된다.
ICLD와 ICTD의 추출과정은 논문 "Binaural Cue Coding-partII: schemes and application"(IEEE Trans. on speech and audio Proc. Vol. 11. No.6. Nov. 2003)에 게재된 바와 같이 잘 알려져 있으므로 자세한 설명은 생략한다.
10 서브밴드 파라메터 분석부(303)는 표3의 서브밴드 구간에 따라 10개의 서브밴드에 대해 채널 상관도 계수 Γb를 다시 추출하여 큐파라메터로서 다채널 파라메트릭 복호화부(107)에 전송한다.
채널 상관도 계수 Γ가 0.5와 0.8 사이인 경우, 19 서브밴드 파라메터 분석부(305)는 입력된 19 서브밴드 분할 신호들에 대해 19개의 서브밴드별로 큐 파라메터를 추출한다. 채널 상관도 계수 Γ가 0.8과 1.0 사이인 경우와 같이, 큐 파라메터로는 채널간 주파수 크기차(ICLD)가 사용된다. 또한, 채널간 시간차(ICTD)가 추가적으로 큐 파라메터로서 사용될 수 있다. 이 경우, 채널 상관도 측정부(301)에서 계산된 서브밴드 단위 채널 상관도 계수와 동일한 서브밴드 단위 채널 상관도 계수가 다채널 파라메트릭 복호화부(107)에 전송된다.
채널 상관도 계수 Γ가 0과 0.5 사이인 경우, 32 서브밴드 파라메터 분석부(303)는 입력된 19 서브밴드 분할 신호들에 대해 주파수 계수들을 표 4에 따라 재분할한다. 즉, 19개의 서브밴드를 갖는 분할 신호는 32 서브밴드 파라메터 분석부(303)에 의해 32개의 서브밴드를 갖는 분할 신호로 변형된다.
Figure 112005037063233-pat00010
이후, 32 서브밴드 파라메터 분석부(307)는 32개의 서브밴드 별로 다채널 파라메트릭 복호화부(107)에 전송하여야 할 큐 파라메터를 추출한다. 큐 파라메터로는 ICLD 대신에 각 서브밴드에 대하여 부여된 채널 ID(Identification)가 사용된다. 여기서, 서브밴드에 대한 채널 ID( Ib)는 임의의 서브밴드 b에 대하여 최대 전력을 갖는 채널의 인덱스를 의미한다. 이를 수식으로 표현하면 수학식 6과 같다.
Figure 112005037063233-pat00011
다채널 파라메트릭 복호화부(107)에 전송할 큐 파라메터로서 ICLD 대신에 채널 ID를 사용함으로써 큐 파라메터 전송량이 획기적으로 감소화게 된다. 예를 들어, 5채널의 신호인 경우, 필요한 큐 파라메터는 각 서브밴드당 1개씩 총 32개가 소요된다. 만약 ICLD가 사용된다면 각 서브밴드당 4개의 ICLD가 소요되므로 총 128개(= 4 x 32)가 소요될 것이다. 단, 서브밴드 개수가 작은 경우에도 큐 파라메터로서 채널 ID를 사용하면 신호의 열화가 크게 되므로, 서브밴드 개수가 32개와 같이 충분히 큰 경우에 다채널 파라메트릭 복호화부(107)에 전송할 큐 파라메터로서 채널 ID를 사용하는 것이 바람직하다.
물론, 채널간 시간차(ICTD)가 추가적으로 큐 파라메터로서 사용될 수 있다.
32 서브밴드 파라메터 분석부(307)는 표4의 서브밴드 구간에 따라 32개의 서브밴드에 대해 채널 상관도 계수 Γb를 다시 추출하여 큐파라메터로서 다채널 파라메트릭 복호화부(107)에 전송한다.
도 4는 도 1의 다채널 파라메트릭 복호화부(107)의 세부 블럭 구성도이다.
로 데이터 형태의 단일 채널 오디오 신호는 TF 변환부(401)에서 FFT 변환되어 주파수 영역의 단일 채널 오디오 신호로 된다. 파라메터 기반 다채널 생성부(403)는 파라메터 분석부(209)로부터 전송된 큐 파라메터 정보를 이용하여 주파수 영역의 단일 채널 오디오 신호로부터 주파수 영역의 다채널 오디오 신호를 생성한다. 주파수 영역의 다채널 오디오 신호는 채널별로 역 TF 변환부(405)에서 역 FFT 변환됨으로써 시간 영역의 다채널 오디오 신호가 생성된다.
도 5는 도4의 파라메터 기반 다채널 생성부(403)의 세부 블럭 구성도이다.
상관도 관측부(501)는 파라메터 분석부(209)로부터 전송된 프레임 단위 채널 상관도 계수 Γ를 표1과 비교하여 대응되는 서브밴드 파라메터 기반 생성부(503,505,507)을 선택한다.
예를 들어, 채널 상관도 계수 Γ가 0.9인 경우, 10 서브밴드 파라메터 생성부(503)는 입력된 단일 채널 오디오 신호를 표3에 따라 10 서브밴드로 분할한다. 10 서브밴드 파라메터 생성부(503)는 분할된 신호에 대해, 10 서브밴드 파라메터 분석부(303)로부터 전송된 ICLD와 서브밴드 단위 채널 상관도 계수 Γb를 이용하여 다채널 오디오 신호를 생성한다. 이 때, 수학식 7,8,9가 사용될 수 있다.
Figure 112005037063233-pat00012
여기서 Sn b은 다운믹스된 단일채널 오디오 신호의 b번째 서브밴드의 n 포인트 주파수 계수이고,
Figure 112005037063233-pat00013
는 c번째 채널 b번째 서브밴드의 n포인트 주파수 계수이다.
Figure 112005037063233-pat00014
는 전력 이득 인자(power gain factor)로서 수학식 8로 표현된다.
Figure 112005037063233-pat00015
ri,n은 채널간에서 발생하는 음원의 공간감을 반영하기 위한 랜덤 변수이다. 즉, 복원되는 채널 신호는 상호간의 공간감을 유지하여야 하나, 모든 채널 신호는 다운믹스 신호로부터 복원됨으로써 공간감이 줄어드는 현상이 발생한다. 이러한 공간감을 살리기 위하여 랜덤한 변수 값을 전력 이득 인자를 계산하는 과정에 삽입시켜서, 복원 채널 신호에 무작위성을 가미함으로써 보다 넓은 공간감을 얻을 수 있다.
ri,n은 수학식 9와 같이 표현될 수 있다.
Figure 112005037063233-pat00016
여기서,
Figure 112005037063233-pat00017
은 ±5 dB의 크기변화를 갖는 랜덤신호이다.
Figure 112005037063233-pat00018
은 모든 채널과 서브밴드에 적용되며 동일한 분산과 제로 평균을 갖는다.
전술한 수학식 7, 8, 9를 통해 다채널 오디오 신호를 생성하는 방법은 상기 논문에 기재된 바와 같이 잘 알려져 있으므로 더 이상의 상세한 설명은 생략한다.
19 서브밴드 파라메터 기반 생성부(505)는 프레임 단위 채널 상관도 계수 Γ가 0.5와 0.8 사이인 경우에 동작하며, 10 서브밴드 파라메터 기반 생성부(503)와 동일한 방법으로 다채널 오디오 신호를 생성한다.
32 서브밴드 파라메터 기반 생성부(507)는 프레임 단위 채널 상관도 계수 Γ가 0과 0.5 사이인 경우에 동작한다. 32 서브밴드 파라메터 기반 생성부(507)는 단일 채널 오디오 신호를 표4에 따라 32 서브밴드로 분할한다. 32 서브밴드 파라메터 생성부(507)는 분할된 신호에 대해, 32 서브밴드 파라메터 분석부(307)로부터 전송된 채널 ID와 서브밴드 단위 채널 상관도 계수 Γb를 이용하여 다채널 오디오 신호를 생성한다.
서브 밴드 b에 대한 채널 ID가 c'(1≤c'≤C)일 경우 c' 채널의 서브밴드 b 신호는 수학식 10에 의해 할당된다.
Sb c',n=Sb n
그 밖의 서브밴드 신호들은 수학식 7, 11, 12에 의해 생성된다.
Figure 112005037063233-pat00019
여기서, ri,n은 채널간에서 발생하는 음원의 공간감을 반영하기 위한 랜덤 변수이다.
Figure 112005037063233-pat00020
여기서,
Figure 112005037063233-pat00021
은 ±5 dB의 크기변화를 갖는 랜덤신호이다.
Figure 112005037063233-pat00022
은 모든 채널과 서브밴드에 적용되며 동일한 분산과 제로 평균을 갖는다.
Figure 112005037063233-pat00023
여기서 은 ri,n 은 다음과 같이 정의 한다.
서브밴드 파라메터 기반 생성기(503,505,507)에 의해 생성된 주파수 영역의 다채널 오디오 신호는 채널별로 역 TF 변환부(405)에 의해 역 FFT 변환됨으로써 시간영역의 다채널 오디오 신호가 복원된다.
전술한 본 발명에 따른 다채널 파라메트릭 부복호화 과정을 도6 및 도7을 참조하여 정리하면 다음과 같다. 도6은 본 발명에 따른 다채널 파라메트릭 부호화 절 차를 도시한 흐름도이다.
다채널 오디오 신호는 FFT 변환된 후 표1에 따라 19개의 서브밴드로 분할된다(S601). 19 서브밴드 분할 신호에 대해 서브밴드 단위의 채널 상관도 계수 Γb가 측정되고, 이를 기초로 프레임 단위의 채널 상관도 계수 Γ가 측정된다(S603).
프레임 단위 채널 상관도 계수 Γ가 0.8보다 큰 경우, 19 서브밴드 분할 신호는 표3에 의해 10 서브밴드 신호로 재분할되고, 10개의 서브밴드에 대해 ICLD와 서브밴드 단위의 채널 상관도 계수 Γb가 추출된다(S605, S607, S609). 이후, S609단계에서 추출된 ICLD 및 서브밴드 단위 채널 상관도 계수Γb와, S603 단계에서 측정된 프레임 단위 채널 상관도 계수 Γ로 이루어진 큐 파라메터는 다채널 파라메트릭 복호화부에 전송된다(S611).
프레임 단위 채널 상관도 계수 Γ가 0.5와 0.8 사이인 경우, 19 서브밴드 분할 신호의 19개의 서브밴드에 대해 ICLD가 추출된다(S605, S607, S613). 이후, S613단계에서 추출된 ICLD와, S603 단계에서 측정된 서브밴드 단위 채널 상관도 계수Γb 및 프레임 단위 채널 상관도 계수 Γ로 이루어진 큐 파라메터는 다채널 파라메트릭 복호화부에 전송된다(S615).
프레임 단위 채널 상관도 계수 Γ가 0과 0.5 사이인 경우, 19 서브밴드 분할 신호는 표4에 의해 32 서브밴드 신호로 재분할되고, 32개의 서브밴드에 대해 채널 ID와 서브밴드 단위의 채널 상관도 계수 Γb가 추출된다(S605, S617). 이후, S617단 계에서 추출된 채널 ID 및 서브밴드 단위 채널 상관도 계수Γb와, S603 단계에서 측정된 프레임 단위 채널 상관도 계수 Γ로 이루어진 큐 파라메터는 다채널 파라메트릭 복호화부에 전송된다(S619).
도7은 본 발명에 따른 다채널 파라메트릭 복호화 절차를 도시한 흐름도이다.
단일채널 오디오 신호는 FFT 변환된다(S701). 다채널 파라메트릭 부호화부(101)로부터 전송된 프레임 단위 채널 상관도 계수 Γ가 관측된다(S703).
프레임 단위 채널 상관도 계수 Γ가 0.8보다 큰 경우, FFT 변환된 신호는 표3에 의해 10 서브밴드 신호로 분할되고, 전송된 ICLD와 서브밴드 단위 채널 상관도 계수 Γb에 의해 서브밴드 단위별로 신호가 복호화된다(S705, S707, S709).
프레임 단위 채널 상관도 계수 Γ가 0.5와 0.8 사이인 경우, FFT 변환된 신호는 표1에 의해 19 서브밴드 신호로 분할되고, 전송된 ICLD와 서브밴드 단위 채널 상관도 계수 Γb에 의해 서브밴드 단위별로 신호가 복호화된다(S705, S707, S711).
프레임 단위 채널 상관도 계수 Γ가 0과 0.5 사이인 경우, FFT 변환된 신호는 표4에 의해 32 서브밴드 신호로 분할되고, 전송된 채널 ID와 서브밴드 단위 채널 상관도 계수 Γb에 의해 서브밴드 단위별로 신호가 복호화된다(S705, S713).
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체에 저장될 수 있다.
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지 식을 가진 자에 의해 본 발명의 기술 사상과 아래에 기재될 특허청구범위의 균등 범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
본 발명은 다채널 오디오 신호의 복호화에 필요한 큐 파라메터를 최적화함으로써 적은 대역폭이 할당되는 환경에서도 단일채널 오디오 신호로부터 다채널 오디오 신호를 복원하여 재생할 수 있는 효과를 제공한다.

Claims (38)

  1. 다채널 오디오 신호를 주파수 영역에서 분할하는 신호 분할 수단;
    상기 분할된 신호를 단일채널로 다운믹스(dowm-mix)하여 부호화하는 다운믹스 수단; 및
    상기 분할된 신호에 대해 프레임 단위의 채널 상관도를 측정하고, 상기 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할하는 파라메터 분석 수단을 포함하며,
    상기 파라메터 분석 수단은,
    상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 복호화를 위한 큐 파라메터로서, 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 추출하여 부호화하는
    다채널 오디오 신호 부호화 장치.
  2. 제1항에 있어서,
    상기 제1기준값은
    0.5인
    다채널 오디오 신호 부호화 장치.
  3. 제 1항에 있어서,
    상기 파라메터 분석 수단은
    상기 프레임 단위 채널 상관도가 감소함에 따라 증가하는 개수의 서브밴드로 상기 분할된 신호를 재분할하는
    다채널 오디오 신호 부호화 장치.
  4. 제 1항에 있어서,
    상기 프레임 단위 채널 상관도는
    상기 분할된 신호에 대한 서브밴드 단위의 채널 상관도로부터 획득되는
    다채널 오디오 신호 부호화 장치.
  5. 제4항에 있어서,
    상기 프레임 단위 채널 상관도는
    고주파 대역의 서브밴드 단위 채널 상관도 보다 저주파 대역의 서브밴드 단위 채널 상관도에 의해 결정되는
    다채널 오디오 신호 부호화 장치.
  6. 제1항에 있어서,
    상기 재분할된 서브밴드 b에 대한 채널 ID는
    재분할된 서브밴드 b의 전력이 최대가 되는 채널의 인덱스인
    다채널 오디오 신호 부호화 장치.
  7. 제 1항에 있어서,
    상기 파라메터 분석 수단은
    상기 프레임 단위 채널 상관도가 상기 제1기준값 이상인 경우 상기 큐 파라메터로서, 상기 재분할된 신호의 서브밴드별로 채널간 주파수 크기차(Inter-Channel Level Difference)와 서브밴드 단위 채널 상관도를 추출하여 부호화하는
    다채널 오디오 신호 부호화 장치.
  8. 제1항 또는 제7항에 있어서,
    상기 파라메터 분석 수단은
    상기 큐 파라메터로서, 상기 재분할된 신호의 서브밴드별로 채널간 시간 지연차(Inter-Channel Level Difference)를 부가적으로 추출하는
    다채널 오디오 신호 부호화 장치.
  9. 제 1항에 있어서,
    상기 파라메터 분석 수단은
    상기 프레임 단위 채널 상관도가 상기 제1기준값 이하인 경우, 상기 분할된 신호의 서브밴드 개수 보다 많은 개수로 상기 분할된 신호를 재분할하고,
    상기 프레임 단위 채널 상관도가 상기 제1기준값보다 큰 제2기준값 이상인 경우, 상기 분할된 신호의 서브밴드 개수 보다 적은 개수로 상기 분할된 신호를 재분할하고,
    상기 프레임 단위 채널 상관도가 상기 제1기준값과 상기 제2기준값 사이인 경우, 재분할을 하지 않는
    다채널 오디오 신호 부호화 장치.
  10. 제9항에 있어서,
    상기 제2기준값은
    0.8인
    다채널 오디오 신호 부호화 장치.
  11. 제9항에 있어서,
    상기 파라메터 분석 수단은
    상기 프레임 단위 채널 상관도가 상기 제1기준값과 상기 제2기준값 사이인 경우 상기 큐 파라메터로서, 상기 분할된 신호의 서브밴드별로 채널간 주파수 크기차(Inter-Channel Level Difference)와 서브밴드 단위 채널 상관도를 추출하여 부호화하는
    다채널 오디오 신호 부호화 장치.
  12. 주파수 영역에서 분할된 다채널 오디오 신호를 단일채널로 다운믹스하여 부호화하고, 상기 분할된 다채널 오디오 신호에 대한 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할함으로써 부호화된 오디오 신호를 다채널 오디오 신호로 복호화하는 다채널 오디오 신호 복호화 장치에 있어서,
    상기 부호화된 단일채널 오디오 신호를 복호화하는 단일채널 복호화 수단; 및
    상기 프레임 단위 채널 상관도에 따라, 상기 재분할시에 사용된 서브밴드 구간과 동일하게 상기 복호화된 단일채널 오디오 신호를 주파수 영역에서 분할하는 파라메터 기반 다채널 생성 수단을 포함하며,
    상기 파라메터 기반 다채널 생성 수단은,
    상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 이용하여 상기 단일채널 오디오 신호로 복호화하는
    다채널 오디오 신호 복호화 장치.
  13. 제12항에 있어서,
    상기 제1기준값은
    0.5인
    다채널 오디오 신호 복호화 장치.
  14. 제12항에 있어서,
    상기 파라메터 기반 채널 생성 수단은
    상기 프레임 단위 채널 상관도가 감소함에 따라 증가하는 개수의 서브밴드로 상기 복호화된 단일채널 오디오 신호를 분할하는
    다채널 오디오 신호 복호화 장치.
  15. 제12항에 있어서,
    상기 재분할된 서브밴드 b에 대한 채널 ID는
    재분할된 서브밴드 b의 전력이 최대가 되는 채널의 인덱스인
    다채널 오디오 신호 복호화 장치.
  16. 제12항에 있어서,
    상기 파라메터 기반 채널 생성 수단은
    상기 프레임 단위 채널 상관도가 상기 제1기준값 이상인 경우, 상기 재분할된 신호의 서브밴드별 채널간 주파수 크기차와 서브밴드 단위 채널 상관도를 이용하여 복호화하는
    다채널 오디오 신호 복호화 장치.
  17. 제12항 또는 제16항에 있어서,
    상기 파라메터 기반 채널 생성 수단은
    상기 재분할된 신호의 서브밴드별 채널간 시간 지연차를 추가적으로 이용하여 복호화하는
    다채널 오디오 신호 복호화 장치.
  18. 제15항에 있어서,
    상기 파라메터 기반 채널 생성 수단은
    서브 밴드 b에 대한 채널 ID가 c'(1≤c'≤C, C는 채널수)일 경우, c' 채널의 서브밴드 b 신호는 단일채널 오디오 신호의 서브밴드 b 신호로 할당하는
    다채널 오디오 신호 복호화 장치.
  19. 제18항에 있어서,
    상기 파라메터 기반 채널 생성 수단은
    상기 단일채널 오디오 신호에 채널간에서 발생하는 음원의 공간감에 관한 성분을 반영하여 나머지 서브밴드 신호로 할당하는
    다채널 오디오 신호 복호화 장치.
  20. 다채널 오디오 신호를 주파수 영역에서 분할하는 단계;
    상기 분할된 신호를 단일채널로 다운믹스(dowm-mix)하여 부호화하는 단계;
    상기 분할된 신호에 대해 프레임 단위의 채널 상관도를 측정하는 단계;
    상기 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할하는 단계; 및
    상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우, 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 단계를 포함하는
    다채널 오디오 신호 부호화 방법.
  21. 제20항에 있어서,
    상기 제1기준값은
    0.5인
    다채널 오디오 신호 부호화 방법.
  22. 제20항에 있어서,
    재분할 단계는
    상기 프레임 단위 채널 상관도가 감소함에 따라 증가하는 개수의 서브밴드로 상기 분할된 신호를 재분할하는
    다채널 오디오 신호 부호화 방법.
  23. 제20항에 있어서,
    상기 프레임 단위 채널 상관도는 상기 분할된 신호에 대한 서브밴드 단위의 채널 상관도로부터 획득되는
    다채널 오디오 신호 부호화 방법.
  24. 제23항에 있어서,
    상기 프레임 단위 채널 상관도는 고주파 대역의 서브밴드 단위 채널 상관도 보다 저주파 대역의 서브밴드 단위 채널 상관도에 의해 결정되는
    다채널 오디오 신호 부호화 방법.
  25. 제20항에 있어서,
    상기 재분할된 서브밴드 b에 대한 채널 ID는
    재분할된 서브밴드 b의 전력이 최대가 되는 채널의 인덱스인
    다채널 오디오 신호 부호화 방법.
  26. 제20항에 있어서,
    상기 프레임 단위 채널 상관도가 상기 제1기준값 이상인 경우, 상기 재분할된 신호의 서브밴드별로 채널간 주파수 크기차(Inter-Channel Level Difference)와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 단계를 더 포함하는
    다채널 오디오 신호 부호화 방법.
  27. 제20항 또는 제26항에 있어서,
    상기 재분할된 신호의 서브밴드별로 채널간 시간 지연차(Inter-Channel Level Difference)를 추출하는 단계를 더 포함하는
    다채널 오디오 신호 부호화 방법.
  28. 제20항에 있어서,
    상기 재분할 단계는
    상기 프레임 단위 채널 상관도가 상기 제1기준값 이하인 경우, 상기 분할된 신호의 서브밴드 개수 보다 많은 개수로 상기 분할된 신호를 재분할하는 단계;
    상기 프레임 단위 채널 상관도가 상기 제1기준값보다 큰 제2기준값 이상인 경우, 상기 분할된 신호의 서브밴드 개수 보다 적은 개수로 상기 분할된 신호를 재분할하는 단계; 및
    상기 프레임 단위 채널 상관도가 상기 제1기준값과 상기 제2기준값 사이인 경우, 재분할을 하지 않는 단계를 포함하는
    다채널 오디오 신호 부호화 방법.
  29. 제28항에 있어서,
    상기 제2기준값은
    0.8인
    다채널 오디오 신호 부호화 방법.
  30. 제28항에 있어서,
    상기 프레임 단위 채널 상관도가 상기 제1기준값과 상기 제2기준값 사이인 경우, 상기 분할된 신호의 서브밴드별로 채널간 주파수 크기차와 서브밴드 단위 채널 상관도를 추출하여 부호화하는 단계를 더 포함하는
    다채널 오디오 신호 부호화 방법.
  31. 주파수 영역에서 분할된 다채널 오디오 신호를 단일채널로 다운믹스하여 부호화하고, 상기 분할된 다채널 오디오 신호에 대한 프레임 단위의 채널 상관도에 따라 상기 분할된 신호를 재분할함으로써 부호화된 오디오 신호를 다채널 오디오 신호로 복호화하는 다채널 오디오 신호 복호화 방법에 있어서,
    상기 부호화된 단일채널 오디오 신호를 복호화하는 단계;
    상기 프레임 단위 채널 상관도에 따라, 상기 재분할시에 사용된 서브밴드 구간과 동일하게 상기 복호화된 단일채널 오디오 신호를 주파수 영역에서 분할하는 단계; 및
    상기 프레임 단위 채널 상관도가 제1기준값 이하인 경우 상기 재분할된 신호의 서브밴드에 대한 채널 ID와 서브밴드 단위 채널 상관도를 이용하여 상기 단일채널 오디오 신호로 복호화하는 단계를 포함하는
    다채널 오디오 신호 복호화 방법.
  32. 제30항에 있어서,
    상기 제1기준값은
    0.5인
    다채널 오디오 신호 복호화 방법.
  33. 제31항에 있어서,
    상기 분할 단계는
    상기 프레임 단위 채널 상관도가 감소함에 따라 증가하는 개수의 서브밴드로 상기 복호화된 단일채널 오디오 신호를 분할하는
    다채널 오디오 신호 복호화 방법.
  34. 제31항에 있어서,
    상기 재분할된 서브밴드 b에 대한 채널 ID는
    재분할된 서브밴드 b의 전력이 최대가 되는 채널의 인덱스인
    다채널 오디오 신호 복호화 방법.
  35. 제31항에 있어서,
    상기 프레임 단위 채널 상관도가 상기 제1기준값 이상인 경우, 상기 재분할된 신호의 서브밴드별 채널간 주파수 크기차와 서브밴드 단위 채널 상관도를 이용하여 복호화하는 단계를 더 포함하는
    다채널 오디오 신호 복호화 방법.
  36. 제31항 또는 제35항에 있어서,
    상기 재분할된 신호의 서브밴드별 채널간 시간 지연차를 추가적으로 이용하여 복호화하는 단계를 더 포함하는
    다채널 오디오 신호 복호화 방법.
  37. 제34항에 있어서,
    서브 밴드 b에 대한 채널 ID가 c'(1≤c'≤C, C는 채널수)일 경우, c' 채널의 서브밴드 b 신호는 단일채널 오디오 신호의 서브밴드 b 신호로 할당되는
    다채널 오디오 신호 복호화 방법.
  38. 제37항에 있어서,
    나머지 서브밴드 신호는 상기 단일채널 오디오 신호에 채널간에서 발생하는 음원의 공간감에 관한 성분을 반영한 신호로 할당되는
    다채널 오디오 신호 복호화 방법.
KR1020050061655A 2004-07-09 2005-07-08 다채널 오디오 신호 부호화/복호화 방법 및 장치 Expired - Fee Related KR100745688B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020040053653 2004-07-09
KR20040053653 2004-07-09

Publications (2)

Publication Number Publication Date
KR20060049980A KR20060049980A (ko) 2006-05-19
KR100745688B1 true KR100745688B1 (ko) 2007-08-03

Family

ID=37149979

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050061655A Expired - Fee Related KR100745688B1 (ko) 2004-07-09 2005-07-08 다채널 오디오 신호 부호화/복호화 방법 및 장치

Country Status (1)

Country Link
KR (1) KR100745688B1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
EP2084901B1 (en) 2006-10-12 2015-12-09 LG Electronics Inc. Apparatus for processing a mix signal and method thereof
JP4838361B2 (ja) 2006-11-15 2011-12-14 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
KR100891671B1 (ko) * 2006-12-01 2009-04-03 엘지전자 주식회사 믹스신호 제어 방법 및 장치
EP2102858A4 (en) 2006-12-07 2010-01-20 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL
EP2102855A4 (en) 2006-12-07 2010-07-28 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL
KR20080052813A (ko) 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
KR101903429B1 (ko) * 2012-08-07 2018-10-02 삼성전자주식회사 절대 편차를 이용한 수신 신호 검출 방법 및 장치
CN107731238B (zh) * 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
CN114303392B (zh) * 2019-08-30 2024-12-31 杜比实验室特许公司 多声道音频信号的声道标识

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010025817A (ko) * 1999-09-01 2001-04-06 박종섭 씨디엠에이 시스템의 역방향 링크에서의 채널 추정장치
JP2001324999A (ja) 2001-03-19 2001-11-22 Victor Co Of Japan Ltd 音声信号伝送方法
KR20030078658A (ko) * 2002-03-29 2003-10-08 루센트 테크놀러지스 인크 2개의 송신 n개의 수신 안테나 시스템에서 폐루프서브스페이스 송신 및 수신을 위한 방법
WO2003090206A1 (en) 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Signal synthesizing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010025817A (ko) * 1999-09-01 2001-04-06 박종섭 씨디엠에이 시스템의 역방향 링크에서의 채널 추정장치
JP2001324999A (ja) 2001-03-19 2001-11-22 Victor Co Of Japan Ltd 音声信号伝送方法
KR20030078658A (ko) * 2002-03-29 2003-10-08 루센트 테크놀러지스 인크 2개의 송신 n개의 수신 안테나 시스템에서 폐루프서브스페이스 송신 및 수신을 위한 방법
WO2003090206A1 (en) 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Signal synthesizing

Also Published As

Publication number Publication date
KR20060049980A (ko) 2006-05-19

Similar Documents

Publication Publication Date Title
JP7615193B2 (ja) オーディオ信号を処理するための方法、信号処理ユニット、バイノーラルレンダラ、オーディオエンコーダおよびオーディオデコーダ
CN1910655B (zh) 构造多通道输出信号或生成下混信号的设备和方法
JP5498525B2 (ja) 空間的オーディオのパラメータ表示
JP5625032B2 (ja) マルチチャネルシンセサイザ制御信号を発生するための装置および方法並びにマルチチャネル合成のための装置および方法
CN101044551B (zh) 用于双声道提示编码方案和类似方案的单通道整形
CN110047496B (zh) 立体声音频编码器和解码器
KR101236259B1 (ko) 오디오 채널들을 인코딩하는 방법 및 장치
CN109448741B (zh) 一种3d音频编码、解码方法及装置
US11074920B2 (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
US11830510B2 (en) Audio decoder for interleaving signals
US20130144630A1 (en) Multi-channel audio encoding and decoding
US20080201152A1 (en) Apparatus for Encoding and Decoding Audio Signal and Method Thereof
US20080208600A1 (en) Apparatus for Encoding and Decoding Audio Signal and Method Thereof
US20110206223A1 (en) Apparatus for Binaural Audio Coding
KR101666465B1 (ko) 다채널 오디오 신호 부호화/복호화 장치 및 방법
CN102737647A (zh) 双声道音频音质增强编解码方法及装置
KR100745688B1 (ko) 다채널 오디오 신호 부호화/복호화 방법 및 장치
EP2489036B1 (en) Method, apparatus and computer program for processing multi-channel audio signals
JP6299202B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム及びオーディオ復号装置
US9837085B2 (en) Audio encoding device and audio coding method
JP2006325162A (ja) バイノーラルキューを用いてマルチチャネル空間音声符号化を行うための装置
Suresh et al. MDCT domain analysis and synthesis of reverberation for parametric stereo audio
HK40026196B (en) Audio encoder and decoder
HK1213360B (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding

Legal Events

Date Code Title Description
A201 Request for examination
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20050708

PA0201 Request for examination
PG1501 Laying open of application
E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20061011

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20070716

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20070727

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20070730

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PR1001 Payment of annual fee

Payment date: 20100701

Start annual number: 4

End annual number: 4

PR1001 Payment of annual fee

Payment date: 20110711

Start annual number: 5

End annual number: 5

FPAY Annual fee payment

Payment date: 20120710

Year of fee payment: 6

PR1001 Payment of annual fee

Payment date: 20120710

Start annual number: 6

End annual number: 6

FPAY Annual fee payment

Payment date: 20130624

Year of fee payment: 7

PR1001 Payment of annual fee

Payment date: 20130624

Start annual number: 7

End annual number: 7

LAPS Lapse due to unpaid annual fee
PC1903 Unpaid annual fee

Termination category: Default of registration fee

Termination date: 20150609