[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR100857105B1 - 오디오 신호의 디코딩 방법 및 장치 - Google Patents

오디오 신호의 디코딩 방법 및 장치 Download PDF

Info

Publication number
KR100857105B1
KR100857105B1 KR1020087005384A KR20087005384A KR100857105B1 KR 100857105 B1 KR100857105 B1 KR 100857105B1 KR 1020087005384 A KR1020087005384 A KR 1020087005384A KR 20087005384 A KR20087005384 A KR 20087005384A KR 100857105 B1 KR100857105 B1 KR 100857105B1
Authority
KR
South Korea
Prior art keywords
channel
audio signal
spatial information
spatial
information
Prior art date
Application number
KR1020087005384A
Other languages
English (en)
Other versions
KR20080039474A (ko
Inventor
방희석
오현오
임재현
김동수
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20080039474A publication Critical patent/KR20080039474A/ko
Application granted granted Critical
Publication of KR100857105B1 publication Critical patent/KR100857105B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Stereophonic System (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)

Abstract

본 발명은 오디오 신호를 디코딩하는 오디오 신호의 디코딩 방법 및 장치에 관한 것으로서, 오디오 신호 및 공간정보를 수신하는 단계; 변형 공간정보의 타입을 식별하는 단계; 공간정보를 이용하여 변형 공간정보를 생성하는 단계; 및, 변형 공간정보를 이용하여 오디오 신호를 디코딩하는 단계를 포함하고, 변형 공간정보의 타입은 부분 공간정보, 조합 공간정보, 및 확대 공간정보 중 하나 이상를 포함한다.
본 발명에 따르면, 인코딩 장치에서 결정된 구조 이외의 구조로 오디오 신호를 디코딩할 수 있고, 다운믹스되기 전의 멀티채널의 개수보다 스피커의 개수가 적거나 많다고 하더라도, 다운믹스 오디오 신호로부터 스피커의 개수와 동일한 개수의 출력채널을 생성할 수 있다.

Description

오디오 신호의 디코딩 방법 및 장치{METHOD AND APPARATUS FOR DECODING AN AUDIO SIGNAL}
본 발명은 오디오 신호의 처리에 관한 것으로, 보다 상세하게는 오디오 신호를 디코딩하는 오디오 신호의 디코딩 방법 및 장치에 관한 것이다.
일반적으로, 인코딩 장치가 오디오 신호를 인코딩하는 데 있어서, 인코딩할 오디오 신호가 멀티채널 오디오 신호인 경우, 멀티채널 오디오 신호를 2개 채널이나 1개 채널로 다운믹스하여 다운믹스 오디오 신호를 생성하고, 멀티채널 오디오 신호로부터 공간 정보를 추출한다. 이 공간 정보는 다운믹스 오디오 신호로부터 멀티채널 오디오 신호로 업믹싱하는 데 사용될 수 있는 정보이다. 한편, 인코딩 장치는 정해진 트리구조에 따라 멀티채널 오디오 신호를 다운믹스한다. 여기서, 정해진 트리구조란, 오디오 신호의 디코딩 장치와 오디오 신호의 인코딩 장치간에 약속된 구조(들)일 수 있다. 즉, 정해진 트리구조들 중 어떤 것인지를 나타내는 식별정보만 존재하면, 디코딩 장치는 업믹싱된 후의 오디오 신호의 구조, 예를 들어 채널의 개수가 몇 개인지, 채널의 위치가 각각 어떤 것인지를 알 수 있다.
이와 같이 인코딩 장치가 정해진 트리구조에 따라 멀티채널 오디오 신호를 다운믹스하면, 이 과정에서 추출된 공간 정보 또한 그 구조에 종속된다. 따라서, 디코딩 장치가 구조에 종속된 공간 정보를 이용하여 다운믹스 오디오 신호를 업믹스할 경우에는, 그 구조에 따른 멀티채널 오디오 신호가 생성된다.
즉, 디코딩 장치가 인코딩 장치에 의해 생성된 공간 정보를 그대로 이용할 경우, 인코딩 장치와 디코딩 장치에 의해 약속된 구조로만 업믹스되기 때문에, 약속된 구조 이외의 출력채널 오디오 신호가 생성될 수 없는 문제점이 있었다. 예를 들어, 약속된 구조에 의해 결정되는 채널의 개수와는 다른(적거나 많은) 채널 수의 오디오 신호로 업믹스될 수 없었다.
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 인코딩 장치에서 결정된 구조 이외의 구조로 오디오 신호를 디코딩할 수 있는 오디오 신호의 디코딩 방법 및 장치를 제공하는 데 그 목적이 있다.
본 발명의 또 다른 목적은, 인코딩에서 생성된 공간정보를 변형한 후, 변형된 공간정보를 이용하여 오디오 신호를 디코딩할 수 있는 오디오 신호의 디코딩 방법 및 장치를 제공하는 데 있다.
상기와 같은 목적을 달성하기 위하여 본 발명에 따른 오디오 신호의 디코딩 방법은, 오디오 신호 및 공간정보를 수신하는 단계; 변형 공간정보의 타입을 식별하는 단계; 상기 공간정보를 이용하여 상기 변형 공간정보를 생성하는 단계; 및, 상기 변형 공간정보를 이용하여 상기 오디오 신호를 디코딩하는 단계를 포함하고, 상기 변형 공간정보의 타입은 부분 공간정보, 조합 공간정보, 및 확대 공간정보 중 하나 이상을 포함한다.
본 발명의 또 다른 측면에 따르면, 공간정보를 수신하는 단계; 상기 공간정보를 이용하여 조합 공간정보를 생성하는 단계; 및, 상기 조합 공간정보를 이용하여 오디오 신호를 디코딩하는 단계를 포함하고, 상기 조합 공간정보는, 상기 공간정보에 포함되는 공간 파라미터를 조합하여 생성된 것을 특징으로 하는 오디오 신호의 디코딩 방법이 제공된다.
본 발명의 또 다른 측면에 따르면, 하나 이상의 공간 파라미터를 포함하는 공간정보, 및 하나 이상의 필터 파라미터를 포함하는 공간필터정보를 수신하는 단계; 상기 공간 파라미터 및 상기 필터 파라미터를 조합하여 서라운드 효과를 가지는 조합 공간정보를 생성하는 단계; 및, 상기 조합공간정보를 이용하여 오디오 신호를 가상 서라운드 신호로 변환하는 단계를 포함하는 오디오 신호의 디코딩 방법이 제공된다.
본 발명의 또 다른 측면에 따르면, 오디오 신호를 수신하는 단계; 트리구조정보 및 공간 파라미터를 포함하는 공간정보를 수신하는 단계; 상기 공간정보에 확장 공간정보를 추가하여 변형 공간정보를 생성하는 단계; 및, 상기 변형 공간정보를 이용하여 오디오 신호를 업믹싱하는 단계를 포함하되, 상기 업믹싱하는 단계는, 상기 공간정보에 근거하여 상기 오디오 신호를 1차 업믹싱 신호로 변환하는 단계; 및, 상기 확장 공간정보에 근거하여, 상기 1차 업믹싱 오디오 신호를 2차 업믹싱 오디오 신호로 변환하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 디코딩 방법이 제공된다.
도 1은 본 발명에 따른 오디오 신호의 인코딩 장치 및 디코딩 장치의 구성도.
도 2는 부분 공간정보를 적용하는 일 예를 개략적으로 나타낸 도면.
도 3은 부분 공간정보를 적용하는 다른 예를 개략적으로 나타낸 도면.
도 4는 부분 공간정보를 적용하는 또 다른 예를 개략적으로 나타낸 도면.
도 5는 조합 공간정보를 적용하는 일 예를 개략적으로 나타낸 도면.
도 6은 조합 공간정보를 적용하는 다른 예를 개략적으로 나타낸 도면.
도 7은 3채널 스피커의 위치 및, 스피커에서 청자까지의 음향경로를 나타낸 도면.
도 8은 서라운드 효과를 위해 스피커 각 위치에서 출력되는 신호를 나타낸 도면.
도 9는 5 채널 신호를 이용하여 3 채널 신호를 생성하는 방법을 개념적으로 나타낸 도면.
도 10은 확장채널 구성정보를 근거로 확장 채널이 구성되는 일 예를 나타낸 도면.
도 11은 도 10에 도시된 확장 채널의 구성, 및 확장 공간 파라미터와의 관계를 나타낸 도면.
도 12은 5.1 채널의 멀티채널 오디오 신호의 위치와 6.1 채널의 출력채널 오디오 신호의 위치를 나타낸 도면.
도 13는 두 채널간의 레벨 차이 및 가상 음원의 위치와의 관계를 나타내는 도면.
도 14은 두 후방 채널들의 레벨, 및 후방 센터 채널의 레벨을 나타내는 도면.
도 15는 5.1 채널의 멀티채널 오디오 신호의 위치와 7.1 채널의 출력채널 오디오 신호의 위치.
도 16은 두 왼쪽 채널들의 레벨, 및 왼쪽 프론트 사이드 채널(Lfs)의 레벨을 나타내는 도면.
도 17은 세 전방(font) 채널들의 레벨, 및 왼쪽 프론트 사이드 채널(Lfs)의 레벨을 나타내는 도면.
Best Mode for Carrying Out the Invention
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
아울러, 본 발명에서 사용되는 용어는 가능한 한 현재 널리 사용되는 일반적 인 용어를 선택하였으나, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우는 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재하였으므로, 단순한 용어의 명칭이 아닌 용어가 가지는 의미로서 본 발명을 파악하여야 함을 밝혀두고자 한다.
본 발명은 공간정보를 이용하여 변형 공간정보를 생성한 후, 생성된 변형 공간정보를 이용하여 오디오 신호를 디코딩한다. 공간정보란, 정해진 트리구조에 따라 다운믹스되는 과정에서 추출된 공간정보이고, 변형공간정보란, 공간정보를 이용하여 새롭게 생성된 공간정보이다.
이하, 도 1을 참조하면서, 본 발명에 관해서 구체적으로 설명하고자 한다. 도 1은 본 발명의 실시예에 따른 오디오 신호의 인코딩 장치 및 디코딩 장치의 구성을 나타내는 도면이다. 도 1을 참조하면, 오디오 신호의 인코딩 장치(100)(이하, 인코딩 장치(100))는 다운믹스부(110) 및 공간정보 추출부(120)를 포함하고, 오디오 신호의 디코딩 장치(200)(이하, 디코딩 장치(200))는 출력채널 생성부(210) 및 변형 공간정보 생성부(220)를 포함한다.
인코딩 장치(100)의 다운믹스부(110)는 멀티채널 오디오 신호(IN_M)를 다운믹스하여 다운믹스 오디오 신호(d)를 생성한다. 다운믹스 오디오 신호(d)는 멀티채널 오디오 신호(IN_M)가 다운믹스부(110)에 의해 다운믹스된 것일 수도 있지만, 멀티채널 오디오 신호(IN_M)가 사용자에 의해 임의적으로 다운믹스된 임의적 다운믹스 오디오 신호일 수도 있다.
인코딩 장치(100)의 공간정보 추출부(120)는 멀티채널 오디오 신호(IN_M)로 부터 공간정보(s)를 추출한다. 여기서 공간정보는 다운믹스 오디오 신호(s)를 멀티채널 오디오 신호(IN_M)로 업믹스하기 위해 필요한 정보이다. 한편, 공간정보는 멀티채널 오디오 신호(IN_M)가 정해진 트리구조에 따라 다운믹스되는 과정에서 추출된 정보일 수 있는 데, 여기서 정해진 트리구조란, 오디오 신호의 디코딩 장치와 오디오 신호의 인코딩 장치간에 약속된 트리구조(들)일 수 있으나, 본 발명은 이에 한정되지 아니한다. 한편, 공간정보(spatial information)는, 트리구조정보, 지시자, 공간 파라미터 등을 포함할 수 있는데, 트리구조정보란, 트리구조의 유형에 관한 정보인데, 이 트리구조의 유형에 따라 멀티채널의 개수, 채널별 다운믹스 순서 등이 달라진다. 지시자는 확장 공간정보가 존재하는지 여부 등을 나타내는 정보이다. 공간 파라미터에는 두개 이상의 채널이 두개 이하의 채널로 다운믹스되는 과정에서의 채널간 레벨 차이(channel level difference)(이하, CLD), 채널간 상관관계(inter channel coherences)(이하, ICC), 채널 예측 계수(channel prediction coefficients)(이하, CPC) 등이 있을 수 있다. 한편, 공간정보 추출부(120)는 공간정보 이외에 확장 공간정보를 더 추출할 수 있는데, 확장 공간정보란 다운믹스 오디오 신호(d)가 공간 파라미터에 의해 업믹스된 이후에, 추가적으로 확장될 경우에 필요한 정보로서, 확장채널 구성정보 및 확장 공간 파라미터를 포함될 수 있다. 추후에 설명될 확장 공간정보는 공간정보 추출부(120)에 의해 추출된 것에 한정되지 아니한다.
한편, 인코딩 장치(100)는 다운믹스 오디오 신호(d)를 디코딩하여 다운믹스 오디오 비트스트림을 생성하는 코어코덱 인코딩부(미도시), 공간정보(s)를 인코딩 하여 공간정보 비트스트림을 생성하는 공간정도 인코딩부(미도시), 및 다운믹스 오디오 비트스트림 및 공간정보 비트스트림을 다중화하여 오디오 신호에 관한 비트스트림을 생성하는 다중화부(미도시)를 더 구비할 수 있으나, 본 발명은 이에 한정되지 아니한다.
디코딩 장치(200)는 오디오 신호에 관한 비트스트림을 다운믹스 오디오 비트스트림 및 공간정보 비트스트림으로 분리하는 역다중화부(미도시), 다운믹스 오디오 비트스트림을 디코딩하는 코어코덱 디코딩부(미도시), 공간정보 비트스트림을 디코딩하는 공간정보 디코딩부(미도시)를 더 포함할 수 있으나, 본 발명은 이에 한정되지 아니한다.
디코딩 장치(200)의 변형 공간정보 생성부(220)는 공간정보를 이용하여 변형 공간정보의 타입을 식별하고, 공간정보를 근거로 식별된 타입의 변형 공간정보(s')(modified spatial information)를 생성한다. 여기서 공간정보는 인코딩 장치(100)로부터 전달된 공간정보(s)일 수 있다. 변형 공간정보(modified spatial information)란, 공간정보를 이용하여 새롭게 생성된 공간정보를 일컫는 것으로서, 한편, 변형 공간정보의 타입(type)은 여러 가지가 있을 수 있는 데, 변형 공간정보의 타입은 a) 부분 공간정보, b) 조합 공간정보, c) 확대 공간정보 중 하나 이상을 포함할 수 있으나, 본 발명은 이에 한정되지 아니한다. 부분 공간정보는, 공간 파라미터의 일부를 포함하는 것이고, 조합 공간정보는 공간 파라미터를 조합하여 생성한 것이고, 확대 공간정보는 공간정보 및 확장 공간정보를 이용하여 생성한 것이다. 변형공간정보 생성부(220)가 변형 공간정보를 생성하는 방법은, 위와 같이 변 형공간정보의 타입에 따라 달라질 수 있는 데, 각 변형 공간정보의 타입별로 변형 공간정보를 생성하는 방법에 관한 설명은 추후 구체적으로 설명하고자 한다.
한편, 변형 공간정보의 유형을 결정하는 기준은 공간정보 중 트리구조정보, 공간정보 중 지시자, 출력채널 정보 등이 될 수 있다. 트리구조정보 및 지시자는 인코딩 장치로부터의 공간정보(s)에 포함되어 있는 것일 수 있다. 출력채널 정보는 디코딩 장치(200)와 연계되어 있는 스피커에 관한 정보로서, 출력채널의 수, 출력채널 각각의 위치 정보 등을 포함할 수 있다. 출력채널 정보는 제작자에 의해 기 입력되어 있는 것이거나, 사용자에 의해 입력되는 것일 수 있다. 이러한 정보들을 이용하여 변형 공간정보의 유형을 결정하는 방법에 관해서는, 추후 더욱 구체적으로 설명하고자 한다.
디코딩 장치(200)의 출력채널 생성부(210)는 변형 공간정보(s')를 이용하여 다운믹스 오디오 신호(d)로부터 출력채널 오디오 신호(OUT_N)를 생성한다.
디코딩 장치(200)의 공간필터정보(230)는 음향경로에 관한 정보로서, 변형 공간정보 생성부(220)에 제공된다. 변형 공간정보 생성부(220)가 서라운드 효과를 가지는 조합 공간정보를 생성할 경우, 상기 공간필터정보를 이용할 수 있다.
이하, 변형 공간정보의 유형별로 변형 공간정보를 생성하여 오디오 신호를 디코딩하는 방법에 관하여 (1) 부분 공간정보, (2) 조합 공간정보, (3) 확대 공간정보 순서대로 설명하고자 한다.
(1) 부분 공간정보
공간 파라미터는 멀티채널 오디오 신호가 정해진 트리구조대로 다운믹스되는 과정에서 계산된 것이기 때문에, 다운믹스 오디오 신호를 공간 파라미터를 그대로 이용하여 디코딩하면, 다운믹스되기 전인 원래의 멀티채널 오디오 신호로 복원된다. 만약, 멀티채널 오디오 신호의 채널 개수(M)보다 출력채널 오디오 신호의 채널 개수(N)를 적게 하고자 할 경우, 공간 파라미터의 일부만을 적용하여 다운믹스 오디오 신호를 디코딩할 수 있다.
이와 같은 방법은 인코딩 장치에서 멀티채널 오디오 신호가 다운믹스되는 순서와 방법, 즉 트리구조의 유형에 따라 달라질 수 있는데, 트리구조의 유형은 공간정보의 트리구조정보를 이용하여 조회할 수 있다. 또한, 이와 같은 방법은 출력채널의 개수가 몇 개인지에 따라 달라질 수 있는 데, 출력채널의 개수 등은 출력채널 정보를 이용하여 조회할 수 있다.
이하, 멀티채널 오디오 신호의 채널 개수보다 출력채널 오디오 신호의 채널 개수가 작은 경우, 공간 파라미터 중 일부를 포함하는 부분 공간정보를 적용하여 오디오 신호를 디코딩하는 방법에 관해서, 여러 가지 트리 구조의 예를 들어 설명하고자 한다.
(1)-1. 트리 구조의 제1예(5-2-5 트리 구조)
도 2는 부분 공간정보를 적용하는 일 예를 개략적으로 나타낸 도면이다. 도 2의 좌측을 참조하면, 채널 개수가 6개인 멀티채널 오디오 신호(왼쪽 앞 채널(Left Front)(L), 왼쪽 서라운드 채널(Left Surround)(Ls), 센터 채널(C), 저주파 채널(LFE), 오른쪽 앞 채널(Right Front)(R), 오른쪽 서라운드 채널(Right Surround)(Rs))가 스테레오 다운믹스 채널(Lo, Ro)로 다운믹스되는 순서 및 공간 파라미터와의 관계가 도시되어 있다.
우선, 왼쪽 채널(L)과 왼쪽 서라운드 채널(LS)간의 다운믹스와, 센터 채널(C) 및 저주파 채널(LFE)간의 다운믹스, 오른쪽 채널(R) 및 오른쪽 서라운드 채널(RS)간의 다운믹스가 수행된다. 이러한 제1차 다운믹스 과정에서, 왼쪽 토탈 채널(Lt), 센터 토탈 채널(Ct), 오른쪽 토탈 채널(Rt)이 생성되고, 이 제1차 다운믹스 과정에서 산출되는 공간 파라미터는 CLD2(ICC2 포함), CLD1(ICC1 포함), CLD0(ICC0 포함)등 이다. 1차 다운믹스 과정 이후의 2차 다운믹스 과정에서는, 왼쪽 토탈 채널(Lt), 센터 토탈 채널(Ct), 오른쪽 토탈 채널(Rt)이 다운믹스되어 왼쪽 채널(Lo) 및 오른쪽 채널(Ro)이 생성되고, 2차 다운믹스 과정에서 산출되는 공간 파라미터는 CLDTTT, CPCTTT, ICCTTT 등이 포함될 수 있다. 다시 말해서, 총 6개 채널의 멀티채널 오디오 신호가 위와 같은 순서를 통해 다운믹스되어 스테레오 다운믹스 오디오 신호(Lo, Ro)를 생성한다. 만약, 이와 같은 순서를 통해 산출된 공간 파라미터(CLD2, CLD1, CLD0, CLDTTT 등)을 그대로 이용할 경우, 다운믹스된 순서의 역순으로 업믹스되어 채널 개수가 6개인 멀티채널 오디오 신호(왼쪽 앞 채널(L), 왼쪽 서라운드 채널(LS), 센터 채널(C), 저주파 채널(LFE), 오른쪽 앞 채널(R), 오른쪽 서라운드 채 널(RS))가 생성된다.
도 2의 우측에 도시된 바와 같이, 부분 공간정보가 공간 파라미터(CLD2, CLD1, CLD0, CLDTTT 등) 중 CLDTTT 인 경우, 왼쪽 토탈 채널(Lt), 센터 토탈 채널(Ct), 및 오른쪽 토탈 채널(Rt)으로 업믹스한 다음, 출력채널 오디오 신호로서 왼쪽 토탈 채널(Lt), 오른쪽 토탈 채널(Rt)만을 선택하면, 2개 채널의 출력채널 오디오 신호(Lt, Rt)를 생성할 수 있고, 출력채널 오디오 신호로서 왼쪽 토탈 채널(Lt), 센터 토탈 채널(Ct), 및 오른쪽 토탈 채널(Rt)를 선택하면, 3개 채널의 출력채널 오디오 신호(Lt, Ct, Rt)를 생성할 수 있다. 또한, 추가적으로 CLD1를 사용하여 업믹스한 다음, 출력채널 오디오 신호로서 왼쪽 토탈 채널(Lt, 오른쪽 토탈 채널(Rt), 센터 채널(C) 및 저주파 채널(LFE)를 선택하면, 4개 채널의 출력채널 오디오 신호(Lt, Rt, C, LFE)를 생성할 수 있다.
(1)-2. 트리 구조의 제2예(5-1-5 트리 구조)
도 3은 부분 공간정보를 적용하는 다른 예를 개략적으로 나타낸 도면이다. 도 3의 좌측을 참조하면, 채널 개수가 6개인 멀티채널 오디오 신호(왼쪽 앞 채널(L), 왼쪽 서라운드 채널(LS), 센터 채널(C), 저주파 채널(LFE), 오른쪽 앞 채널(R), 오른쪽 서라운드 채널(RS))가 모노 다운믹스 오디오 신호(M)로 다운믹스되는 순서 및 공간 파라미터와의 관계가 도시되어 있다.
트리 구조의 제1예와 마찬가지로, 왼쪽 채널(L)과 왼쪽 서라운드 채널(LS)간의 다운믹스와, 센터 채널(C) 및 저주파 채널(LFE)간의 다운믹스, 오른쪽 채널(R) 및 오른쪽 서라운드 채널(RS)간의 다운믹스가 수행된다. 이러한 제1차 다운믹스 과정에서, 왼쪽 토탈 채널(Lt), 센터 토탈 채널(Ct), 오른쪽 토탈 채널(Rt)이 생성되고, 제1차 다운믹스 과정에서 산출되는 공간 파라미터는 CLD3(ICC3 포함), CLD4(ICC4 포함), CLD5(ICC5 포함)(여기서의 CLDx, ICCx는 트리 구조의 제1예에서의 CLDx와는 구별됨)등 이다. 1차 다운믹스 과정 이후의 2차 다운믹스 과정에서는, 왼쪽 토탈 채널(Lt)과 센터 토탈 채널(Ct)이 다운믹스되어 왼쪽 센터 채널(LC)이 생성되고, 센터 토탈 채널(Ct)과 오른쪽 토탈 채널(Rt)이 다운믹스되어 오른쪽 센터 채널(RC)이 생성되고, 제2차 다운믹스 과정에서 산출되는 공간 파라미터는 CLD2(ICC2 포함), CLD1(ICC1 포함)등 이다. 그런 다음 제3차 다운믹스 과정에서 왼쪽 센터 채널(LC)와 오른쪽 센터 채널(RC)가 다운믹스되어 모노 다운믹스 채널(M)이 생성되고, 제2차 다운믹스 과정에서 산출되는 공간 파라미터는 CLD0(ICC0 포함)등 이다.
도 3의 우측에 도시된 바와 같이, 부분 공간정보가 공간 파라미터(CLD3, CLD4, CLD5, CLD1, CLD2, CLD0 등) 중 CLD0 인 경우, 왼쪽 센터 채널(LC) 및 오른쪽 센터 채널(RC)을 생성한 후, 출력채널 오디오 신호로서 왼쪽 센터 채널(LC) 및 오른쪽 센터 채널(RC)를 선택하면, 2개 채널의 출력채널 오디오 신호(LC, RC)를 생성할 수 있다. 한편, 부분 공간정보가 공간 파라미터(CLD3, CLD4, CLD5, CLD1, CLD2, CLD0 등) 중 CLD0, CLD1, CLD2 인 경우, 왼쪽 토탈 채널(Lt), 센터 토탈 채널(Ct), 오른쪽 토탈 채널(Rt)를 생성한 후, 출력채널 오디오 신호로서 왼쪽 토탈 채널(Lt) 및 오른쪽 토탈 채널(Rt)를 선택하면, 2개 채널의 출력채널 오디오 신호(Lt, Rt)를 생성할 수 있고, 출력채널 오디오 신호로서 왼쪽 토탈 채널(Lt), 센터 토탈 채널(Ct) 및 오른쪽 토탈 채널(Rt)를 선택하면, 3개 채널의 출력채널 오디오 신호(Lt, Ct, Rt)을 생성할 수 있다. 또한, 부분 공간정보가 추가적으로 CLD4를 포함하는 경우, 센터 채널(C) 및 저주파 채널(LFE)까지 업믹스한 다음, 출력채널 오디오 신호로서 왼쪽 토탈 채널(Lt), 오른쪽 토탈 채널(Rt), 센터 채널(C) 및 저주파 채널(LFE)를 선택하면, 4개 채널의 출력채널 오디오 신호(L t, Rt, C, LFE)를 생성할 수 있다.
(1)-3. 트리 구조의 제3예(5-1-5 트리 구조)
도 4는 부분 공간정보를 적용하는 또 다른 예를 개략적으로 나타낸 도면이다. 도 4의 좌측을 참조하면, 채널 개수가 6개인 멀티채널 오디오 신호(왼쪽 앞 채널(L), 왼쪽 서라운드 채널(LS), 센터 채널(C), 저주파 채널(LFE), 오른쪽 앞 채널(R), 오른쪽 서라운드 채널(RS))가 모노 다운믹스 오디오 신호(M)로 다운믹스되는 순서 및 공간 파라미터와의 관계가 도시되어 있다.
트리 구조의 제1예 및 제2예에서와 마찬가지로, 왼쪽 채널(L)과 왼쪽 서라운드 채널(LS)간의 다운믹스와, 센터 채널(C) 및 저주파 채널(LFE)간의 다운믹스, 오른쪽 채널(R) 및 오른쪽 서라운드 채널(RS)간의 다운믹스가 수행된다. 이러한 제1차 다운믹스 과정에서, 왼쪽 토탈 채널(Lt), 센터 토탈 채널(Ct), 오른쪽 토탈 채널(Rt)이 생성되고, 공간 파라미터는 CLD1(ICC1 포함), CLD2(ICC2 포함), CLD3(ICC3 포함) 등(여기서의 CLDx, ICCX는 트리 구조의 제1예 및 제2예에서의 CLDx, ICCx와는 구별됨)이 산출된다. 1차 다운믹스 과정 이후의 2차 다운믹스 과정에서는, 왼쪽 토탈 채널(Lt)과 센터 토탈 채널(Ct), 및 오른쪽 토탈 채널(Rt)이 다운믹스되어 왼쪽 센터 채널(LC) 및 오른쪽 채널(R)이 생성되고, 공간 파라미터는 CLDTTT(ICCTTT 포함)가 산출된다. 그런 다음 제3차 다운믹스 과정에서 왼쪽 센터 채널(LC)와 오른쪽 채널(R)이 다운믹스되어 모노 다운믹스 채널(M)이 생성되고, 공간 파라미터는 CLD0(ICC0 포함)가 산출된다.
도 4의 우측에 도시된 바와 같이, 부분 공간정보가 공간 파라미터(CLD1, CLD2, CLD3, CLDTTT, CLD0 등) 중 CLD0, 및 CLDTTT 인 경우, 왼쪽 토탈 채널(Lt), 센터 토탈 채널(Ct), 오른쪽 토탈 채널(Rt)을 생성한 후, 출력채널 오디오 신호로서 왼쪽 토탈 채널(Lt) 및 오른쪽 토탈 채널(Rt)를 선택하면, 2개 채널의 출력채널 오디오 신호(Lt, Rt)를 생성할 수 있고, 출력채널 오디오 신호로서 왼쪽 토탈 채널(Lt), 센터 토탈 채널(Ct) 및 오른쪽 토탈 채널(Rt)를 선택하면, 3개 채널의 출력채널 오디오 신호(L t, Ct, R,)을 생성할 수 있다. 또한, 부분 공간정보가 추가적으로 CLD2를 포함하는 경우, 센터 채널(C) 및 저주파 채널(LFE)까지 업믹스한 다음, 출력채널 오디오 신호로서 왼쪽 토탈 채널(L t), 오른쪽 토탈 채널(Rt), 센터 채널(C) 및 저주파 채널(LFE)를 선택하면, 4개 채널의 출력채널 오디오 신호(Lt, Rt, C, LFE)를 생성할 수 있다.
이상 세 가지 트리구조를 예를 들어 공간 파라미터의 일부만을 적용하여 출력채널 오디오 신호를 생성하는 과정을 설명하였는 바, 위와 같이 부분 공간정보를 적용하는 데 그치는 것뿐만 아니라, 그 이후에 추가적으로, 조합 공간정보를 적용하거나 확대 공간정보를 적용할 수도 있다. 이와 같이 오디오 신호에 변형 공간정보를 적용하는 과정은 순차적, 계층적으로 수행될 수도 있지만, 일괄적이고 통합적으로도 처리될 수 있다.
(2) 조합 공간정보
공간정보는 멀티채널 오디오 신호가 정해진 트리구조대로 다운믹스되는 과정에서 계산된 것이기 때문에, 다운믹스 오디오 신호를 공간정보의 공간 파라미터를 그대로 이용하여 디코딩하면, 다운믹스되기 전인 원래의 멀티채널 오디오 신호로 복원된다. 만약, 멀티채널 오디오 신호의 채널 개수(M)가 출력채널 오디오 신호의 채널 개수(N)와 다를 경우, 공간정보를 조합하여 새로운 조합 공간정보를 생성한 후, 이를 이용하여 다운믹스 오디오 신호를 업믹스할 수 있다. 구체적으로, 공간 파라미터를 변환 공식에 대입하여 조합공간 파라미터를 생성할 수 있다.
이와 같은 방법은 인코딩 장치에서 멀티채널 오디오 신호가 다운믹스되는 순서와 방법에 따라 달라질 수 있는데, 이 다운믹스되는 순서와 방법은 공간정보의 트리구조정보를 이용하여 조회할 수 있다. 또한, 이와 같은 방법은 출력채널의 개수가 몇 개인지에 따라 달라질 수 있는 데, 출력채널의 개수 등은 출력채널 정보를 이용하여 조회할 수 있다.
이하에서는, 공간정보를 변형하는 방법의 구체적인 실시예에 관해서 설명한 후, 가상 3D 효과를 주기 위한 실시예에 관해서도 설명하고자 한다.
(2)-1. 일반적인 조합 공간정보
공간정보의 공간 파라미터를 조합하여 조합 공간 파라미터를 생성하는 방법은, 다운믹스 과정에서의 트리구조와는 다른 트리구조에 따라 업믹스하기 위한 것이기 때문에, 트리구조정보에 따른 트리 구조가 어떤 것이든 상판없이, 모든 다운믹스 오디오 신호에 적용할 수 있다.
멀티채널 오디오 신호가 5.1채널이고, 다운믹스 오디오 신호가 1채널(모노채널)일 경우, 2채널의 출력채널 오디오 신호를 생성하는 과정에 관해서, 다음 2가지의 예를 들어 설명하고자 한다.
(2)-1-1. 트리구조의 제4예(5-1-51 트리 구조)
도 5는 조합 공간정보를 적용하는 일 예를 개략적으로 나타낸 도면이다. 도 5의 좌측에 나타난 바와 같이, 5.1채널의 멀티채널 오디오 신호가 다운믹스되는 과정에서 산출될 수 있는 공간 파라미터는 각각 CLD0 내지 CLD4, 및 ICC0 내지 ICC4(미도시)라고 할 수 있다. 예컨대, 공간 파라미터 중에서, 왼쪽 채널 신호(L)와 오른쪽 채널 신호(R)의 채널간 레벨차이는 CLD3 이고 채널간 상관관계는 ICC3이며, 왼쪽 서라운드 채널(LS) 및 오른쪽 서라운드 채널(RS)의 채널간 레벨차이는 CLD2이고 채널간 상관관계는 ICC2이다.
반면, 도 5의 우측을 참조하면, 모노 다운믹스 오디오 신호(m)에 조합 공간 파라미터(CLDα, ICCα)를 적용함으로써 왼쪽 채널 신호(Lt) 및 오른쪽 채널 신호(Rt)를 생성하면, 모노 채널 오디오 신호(m)로부터 직접 스테레오 출력채널 오디오 신호(Lt, Rt)를 생성할 수 있다. 여기서의 조합 공간 파라미터(CLDα, ICCα)는 공간 파라미터(CLD0 내지 CLD4, 및 ICC0 내지 ICC4)를 조합하여 계산할 수 있다. 우선, 공간 파라미터 중 CLD0 내지 CLD4를 조합하여 조합 공간 파라미터 중 CLDα를 계산하는 과정을 설명한 후, 공간 파라미터 중 CLD0 내지 CLD4 및 ICC0 내지 ICC4를 조합하여 조합 공간 파라미터 중 ICCα를 계산하는 과정을 설명하고자 한다.
(2)-1-1-a. CLDα 유도
우선, CLDα는 왼쪽 출력 신호(Lt) 및 오른쪽 출력 신호(Rt)간의 레벨 차이이므로, CLD의 정의식에 왼쪽 출력 신호(Lt) 및 오른쪽 출력 신호(Rt)를 대입하면 다음과 같다.
[수학식 1]
Figure 112008015968843-pct00001
PLt는 Lt의 파워(power), PRt는 Rt의 파워(power).
[수학식 2]
Figure 112008015968843-pct00002
PLt는 Lt의 파워(power), PRt는 Rt의 파워(power), a는 매우 작은 상수.
CLDα는 상기 수학식 1 또는 수학식 2와 같이 정의된다.
한편, PLt 및 PRt를 공간 파라미터(CLD0 내지 CLD4)을 이용하여 표현하기 위해서는, 출력채널 오디오 신호의 왼쪽 출력 신호(L t), 오른쪽 출력 신호(Rt) 및 멀티채널 신호(L, Ls, R, Rs, C, LFE)과의 관계식이 필요한 바, 그 관계식은 다음과 같이 정의될 수 있다.
[수학식 3]
Figure 112008015968843-pct00003
수학식 3과 같은 관계식은 출력채널 오디오 신호를 어떻게 정의할지에 따라 달라질 수 있는 것이기 때문에, 수학식3과 다른 식으로도 정의될 수 있음은 당연하다. 예를 들어, 수학식 3에서 C/√2 또는 LFE/√2에서의 1/√2 인자가 0이 될 수도 있고 1이 될 수도 있다.
수학식 3에 의해 다음 수학식 4와 같은 관계식이 유도될 수 있다.
[수학식 4]
Figure 112008015968843-pct00004
CLDα가 수학식 1(또는 수학식 2)에 의해 PLt 및 PRt를 이용하여 표현될 수 있고, 이러한 PLt 및 PRt는 수학식 4에 의해 PL, PLs, Pc, PLFE, PR, PRs를 이용하여 표현될 수 있으므로, PL, PLs, Pc, PLFE, PR, PRs가 공간 파라미터(CLD0 내지 CLD4)를 이용하여 표현될 수 있는 관계식을 구하는 것이 필요하다.
한편, 도 5와 같은 트리 구조일 경우, 멀티채널 오디오 신호(L, R, C, LFE, Ls, Rs) 및 모노 다운믹스 채널 신호(m)의 관계는 다음과 같다.
[수학식 5]
Figure 112008015968843-pct00005
여기서,
Figure 112008015968843-pct00006
,
Figure 112008015968843-pct00007
수학식 5에 의해 다음 수학식 6과 같은 관계식이 유도될 수 있다.
[수학식 6]
Figure 112008015968843-pct00008
여기서,
Figure 112008015968843-pct00009
,
Figure 112008015968843-pct00010
즉, 수학식 6을 수학식 4에 대입하고, 수학식 4를 수학식 1(또는 수학식 2)에 대입함으로써, 조합 공간 파라미터인 CLDα는 공간 파라미터인 CLD0 내지 CLD4를 조합하여 표현될 수 있다.
한편, 수학식 4에서의 Pc/2 + PLFE/2에 수학식 6을 대입한 전개식은 다음과 같다.
[수학식 7]
Figure 112008015968843-pct00011
여기서, c1 및 c2 의 정의에 따르면(수학식 5 참조), (C1,x)2 + (C2,x)2 =1 이므로 (c1,OTT4)2+ (c2,OTT4)2=1이다.
따라서 수학식 7은 다음과 같이 간단하게 정리될 수 있다.
[수학식 8]
Figure 112008015968843-pct00012
결론적으로, 수학식 8 및 수학식 6을 수학식 4에 대입하고, 수학식 4를 수학식 1에 대입함으로써, 조합 공간 파라미터인 CLDα는 공간 파라미터인 CLD0 내지 CLD4를 조합하여 표현될 수 있다.
(2)-1-1-b. ICCα 유도
우선, ICCα는 왼쪽 출력 신호(Lt) 및 오른쪽 출력 신호(Rt)간의 상관관계이므로, 그 정의식에 왼쪽 출력 신호(Lt) 및 오른쪽 출력 신호(Rt)를 대입하면 다음과 같다.
[수학식 9]
Figure 112008015968843-pct00013
여기서,
Figure 112008015968843-pct00014
수학식 9에서 PLt, PRt는 수학식 4, 수학식 6, 및 수학식 8에 의해 CLD0 내지 CLD4를 이용하여 표현될 수 있고, PLtPRt는 다음 수학식 10과 같이 전개될 수 있다.
[수학식 10]
Figure 112008015968843-pct00015
수학식 10에서 Pc/2 + PLFE/2은 수학식 6에 의해 CLD0 내지 CLD4로 표현될 수 있고, PLR과 PLsRs는 ICC 정의에 의해 다음과 같이 전개될 수 있다.
[수학식 11]
Figure 112008015968843-pct00016
수학식 11에서 √(PLPR)(또는 √PLsPRs))를 이항하면, 다음 수학식 12이 된다.
[수학식 12]
Figure 112008015968843-pct00017
수학식 12에서 PL, PR, PLs, PRs는 각각 수학식 6에 의해 CLD0 내지 CLD4로 표현될 수 있다. 수학식 6을 수학식 12에 대입한 식은 다음 수학식 13과 같다.
[수학식 13]
Figure 112008015968843-pct00018
정리하면, 수학식 6 및 수학식 13을 수학식 10에 대입하고, 수학식 10 및 수학식 4를 수학식 9에 대입함으로써, 조합 공간 파라미터인 ICCα는 공간 파라미터인 CLD0 내지 CLD3 및, ICC2, ICC3를 이용하여 표현될 수 있다.
(2)-1-2. 트리구조의 제5예(5-1-52 트리 구조)
도 6은 조합 공간정보를 적용하는 다른 예를 개략적으로 나타낸 도면이다. 도 6의 좌측에 나타난 바와 같이, 5.1채널의 멀티채널 오디오 신호가 다운믹스되는 과정에서 산출될 수 있는 공간 파라미터는 각각 CLD0 내지 CLD4, 및 ICC0 내지 ICC4(미도시)라고 할 수 있다. 공간 파라미터 중에서, 왼쪽 채널 신호(L)와 왼쪽 서라운드 채널 신호(Ls)의 채널간 레벨차이를 CLD3 이고 채널간 상관관계는 ICC3이며, 오 른쪽 채널(R) 및 오른쪽 서라운드 채널(RS)의 채널간 레벨차이는 CLD4이고 채널간 상관관계는 ICC4이다.
반면, 도 6의 우측을 참조하면, 모노 다운믹스 오디오 신호(m)에 조합 공간 파라미터(CLDβ, ICCβ)를 적용함으로써 왼쪽 채널 신호(Lt) 및 오른쪽 채널 신호(Rt)를 생성하면, 모노 채널 오디오 신호(m)로부터 직접 스테레오 출력채널 오디오 신호(Lt, Rt)를 생성할 수 있다. 여기서의 조합 공간 파라미터(CLDβ, ICCβ)는 공간 파라미터(CLD0 내지 CLD4, 및 ICC0 내지 ICC4)를 이용하여 계산할 수 있다. 우선, 공간 파라미터 중 CLD0 내지 CLD4를 이용하여 조합 공간 파라미터 중 CLDβ를 계산하는 과정을 설명한 후, 공간 파라미터 중 CLD0 내지 CLD4 및 ICC0 내지 ICC4를 이용하여 조합 공간 파라미터 중 ICCβ를 계산하는 과정을 설명하고자 한다.
(2)-1-2-a. CLDβ 유도
우선, CLDβ는 왼쪽 출력 신호(Lt) 및 오른쪽 출력 신호(Rt)간의 레벨 차이이므로, 그 정의식에 왼쪽 출력 신호(Lt) 및 오른쪽 출력 신호(Rt)를 대입하면 다음과 같다.
[수학식 14]
Figure 112008015968843-pct00019
PLt는 Lt의 파워(power), PRt는 Rt의 파워.
[수학식 15]
Figure 112008015968843-pct00020
PLt는 Lt의 파워(power), PRt는 Rt의 파워, a는 매우 작은 수.
CLDβ는 상기 수학식 14 또는 수학식 15와 같이 정의된다.
한편, PLt 및 PRt를 공간 파라미터(CLD0 내지 CLD4)을 이용하여 표현하기 위해서는, 출력채널 오디오 신호의 왼쪽 출력 신호(L t), 오른쪽 출력 신호(Rt) 및 멀티채널 신호(L, Ls, R, Rs, C, LFE)과의 관계식이 필요한 바, 그 관계식은 수학식 3과 마찬가지로 다음과 같이 정의될 수 있다.
[수학식 16]
Figure 112008015968843-pct00021
수학식 16과 같은 관계식은 출력채널 오디오 신호를 어떻게 정의할지에 따라 달라질 수 있는 것이기 때문에, 다른 식으로도 정의될 수 있음은 당연하다. 예를 들어, C/√2 또는 LFE/√2 인자에서의 1/√2가 0이 될 수도 있고, 1이 될 수도 있다.
수학식 16에 의해 다음 수학식 17과 같은 관계식이 유도될 수 있다.
[수학식 17]
Figure 112008015968843-pct00022
수학식 14(또는 수학식 15)에서 CLDβ가 PLt 및 PRt를 이용하여 표현될 수 있고, PLt 및 PRt는 수학식 15에서 PL, PLs, PC, PLFE, PR, PRs를 이용하여 표현될 수 있으므로, PL, PLs, PC, PLFE, PR, PRs가 공간 파라미터(CLD0 내지 CLD4)를 이용하여 표현될 수 있는 관계식을 구하는 것이 필요하다.
한편, 도 6와 같은 트리 구조일 경우, 멀티채널 오디오 신호(L, R, C, LFE, Ls, Rs) 및 모노 다운믹스 채널 신호(m)의 관계는 다음과 같다.
[수학식 18]
Figure 112008015968843-pct00023
여기서,
Figure 112008015968843-pct00024
,
Figure 112008015968843-pct00025
수학식 18에 의해 다음 수학식 19과 같은 관계식이 유도될 수 있다.
[수학식 19]
Figure 112008015968843-pct00026
여기서,
Figure 112008015968843-pct00027
,
Figure 112008015968843-pct00028
즉, 수학식 19을 수학식 17에 대입하고, 수학식 17를 수학식 14(또는 수학식 15)에 대입함으로써, 조합 공간 파라미티인 CLDβ는 공간 파라미터인 CLD0 내지 CLD4를 조합하여 표현될 수 있다.
한편, 수학식 19을 수학식 17에서의 PL + PLs에 대입한 전개식은 다음과 같다.
[수학식 20]
Figure 112008015968843-pct00029
여기서, c1및 c2 의 정의에 따르면(수학식 5 참조), (c1,x)2 + (c2,x)2 =1 이므로 (C1,OTT3)2+ (C2,OTT3)2= 1이다.
따라서 수학식 20은 다음과 같이 간단하게 정리될 수 있다.
[수학식 21]
Figure 112008015968843-pct00030
다른 한편, 수학식 19를 수학식 17에서의 PR + PRs 에 대입한 전개식은 다음과 같다.
[수학식 22]
Figure 112008015968843-pct00031
여기서, c1및 c2 의 정의에 따르면(수학식 5 참조), (c1,x)2 + (c2,x)2 =1 이므로 (c1,OTT4)2+ (C2,OTT4)2= 1이다.
따라서 수학식 22은 다음과 같이 간단하게 정리될 수 있다.
[수학식 23]
Figure 112008015968843-pct00032
또 다른 한편, 수학식 19를 수학식 17에서의 PC/2 + PLFE/2에 대입한 전개식은 다음과 같다.
[수학식 24]
Figure 112008015968843-pct00033
여기서, c1 및 c2 의 정의에 따르면(수학식 5 참조), (C1,x)2 + (C2,x)2 =1 이므로 (c1,OTT2)2+ (c2,OTT2)2= 1이다.
따라서 수학식 24은 다음과 같이 간단하게 정리될 수 있다.
[수학식 25]
Figure 112008015968843-pct00034
결론적으로, 수학식 21, 수학식 23, 및 수학식 25를 수학식 17에 대입하고, 수학식 17를 수학식 14(또는 수학식 15)에 대입함으로써, 조합 공간 파라미터인 CLDβ는 공간 파라미터인 CLD0 내지 CLD4를 조합하여 표현될 수 있다.
(2)-1-2-b. ICCβ 유도
우선, ICCβ는 왼쪽 출력 신호(Lt) 및 오른쪽 출력 신호(Rt)간의 상관관계이므로, 그 정의식에 왼쪽 출력 신호(Lt) 및 오른쪽 출력 신호(Rt)를 대입하면 다음과 같다.
[수학식 26]
Figure 112008015968843-pct00035
여기서,
Figure 112008015968843-pct00036
수학식 26에서 PLt, PRt는 수학식 19에 의해 CLD0 내지 CLD4를 이용하여 표현될 수 있고, PLtPRt는 다음 수학식 27과 같이 전개될 수 있다.
[수학식 27]
Figure 112008015968843-pct00037
수학식 27에서 PC/2 + PLFE/2은 수학식 19에 의해 CLD0 내지 CLD4로 표현될 수 있고, PL_R_ 는 ICC 정의에 의해 다음과 같이 전개될 수 있다.
[수학식 28]
Figure 112008015968843-pct00038
√(PL_PR_) 를 이항하면, 다음 수학식 29가 된다.
[수학식 29]
Figure 112008015968843-pct00039
수학식 29에서 PL_, PR_ 는 각각 수학식 21 및 수학식 23에 의해 CLD0내지 CLD4로 표현될 수 있다. 수학식 21 및 수학식 23을 수학식 29에 대입한 식은 다음 수학식 30과 같다.
[수학식 30]
Figure 112008015968843-pct00040
정리하면, 수학식 30을 수학식 27에 대입하고, 수학식 27 및 수학식 17을 수학식 26에 대입함으로써, 조합 공간 파라미터인 ICCβ는 공간 파라미터인 CLD0 내지 CLD4 및, ICC1를 조합하여 표현될 수 있다.
상술한 공간 파라미터를 변형하는 방법은 하나의 실시예이며, 상술한 수학식은 Px 또는 Pxy를 구하는 데 있어서, 신호 에너지 이외에 각 채널간의 상관관계(예:ICC0 등)를 추가적으로 고려함에 따라 다양한 형태로 달라질 수 있음은 자명하다.
(2)-2. 서라운드 효과를 갖는 조합 공간정보
공간정보를 조합하여 조합 공간정보를 생성하는 데 있어서 음향경로를 고려할 경우, 가상 서라운드 효과를 낼 수가 있다. 가상 서라운드 효과 또는 가상 3D 효과란, 실제로는 서라운드 채널의 스피커없이도 서라운드 채널의 스피커가 있는 것과 같은 효과를 내는 것으로서, 예를 들어, 2개의 스테레오 스피커를 통해 5.1 채널 오디오 신호를 출력하는 것이다.
음향경로는 공간필터정보일 수 있는데, 공간필터정보는 HRTF(Head-Related Tranfer Function)라고 지칭되는 함수를 이용할 수 있지만 본 발명은 이에 한정되 지 아니한다. 공간필터정보는 필터 파라미터를 포함할 수 있는데, 이 필터 파라미터 및 공간 파라미터를 변환 공식에 대입하여 조합 공간 파라미터를 생성할 수 있다. 한편, 생성된 조합 공간 파라미터는 필터계수(filter co-efficients)를 포함할 수 있다.
이하에서는, 멀티채널 오디오 신호가 5채널이고, 3채널의 출력채널 오디오 신호를 생성하는 경우를 예를 들어서, 서라운드 효과를 갖는 조합 공간정보를 생성하기 위해 음향경로를 고려하는 방법에 관해 설명하고자 한다.
도 7은 3채널의 스피커의 위치 및, 스피커와 청자까지의 음향경로를 나타낸 도면이다. 도 7을 참조하면, 3개의 스피커(SPK1, SPK2, SPK3)의 위치가 각각 왼쪽 앞(L), 센터(C), 오른쪽(R)이고, 가상 서라운드 채널의 위치가 왼쪽 서라운드(Ls) 및 오른쪽 서라운드(Rs)인 것을 알 수 있다. 3개의 스피커의 위치(L, C, R) 및, 가상 서라운드 채널의 위치(Ls, Rs)로부터 청자의 왼쪽 귀 위치(l), 청자의 오른쪽 귀의 위치(r)에 이르기까지의 음향 경로가 표시되어 있다. Gx_y라는 표시는, x 위치로부터 y 위치까지 이르는 음향 경로를 나타낸다. 예를 들어, GL_r은 왼쪽 앞(L) 위치로부터 청자의 오른쪽 귀(r)의 위치까지 이르는 음향 경로이다.
만약, 5개의 위치에 스피커가 존재(즉, 왼쪽 서라운드(Ls) 및 오른쪽 서라운드(Rs)에도 스피커가 존재)하고, 청자가 도 7에 도시되어 있는 위치에 존재한다면, 청자의 왼쪽 귀로 유입되는 신호(L0) 및 청자의 오른쪽 귀로 유입되는 신호(R0)는 다음과 같다.
[수학식 31]
Figure 112008015968843-pct00041
여기서, L, C, R, Ls, Rs는 각 위치의 채널,
Gx_y는, x 위치로부터 y 위치까지 이르는 음향 경로,
*는 컨볼루션.
그러나, 앞서 언급한 바와 같이 3개의 위치(L, C, R)에만 스피커가 존재하는 경우, 청자의 왼쪽 귀로 유입되는 신호(L0_real) 및 청자의 오른쪽 귀로 유입되는 신호(R0_real)는 다음과 같다.
[수학식 32]
Figure 112008015968843-pct00042
수학식 32에 표시된 신호는 서라운드 채널 신호(Ls, Rs)가 고려되지 않기 때문에, 가상 서라운드 효과를 낼 수가 없다. 가상 서라운드 효과를 내기 위해서는, 왼쪽 서라운드 채널 신호(Ls)가 원래 위치(Ls)로부터 출력되어 청자의 위치(l,r)에 도달할 때 신호와, 원래 위치(Ls, Rs)가 아닌 3개의 위치(L, C, R)의 스피커를 통해 출력하여 청자의 위치(l,r)에 도달하는 신호와 같도록 하면 된다. 오른쪽 서라운드 채널 신호(Rs)의 경우도 마찬가지이다.
우선, 왼쪽 서라운드 채널 신호(Ls)를 살펴보면, 왼쪽 서라운드 채널 신호 (Ls)가 원래의 위치인 왼쪽 서라운드 위치(Ls)의 스피커에서 출력되는 경우, 청자의 왼쪽 귀(l) 및 청자의 오른쪽 귀(r)에 도달되는 신호는 각각 다음과 같다.
[수학식 33]
Figure 112008015968843-pct00043
그리고 오른쪽 서라운드 채널 신호(Rs)가 원래의 위치인 오른쪽 서라운드 위치(Rs)의 스피커에서 출력되는 경우, 청자의 왼쪽 귀(l) 및 청자의 오른쪽 귀(r)에 도달되는 신호는 각각 다음과 같다.
[수학식 34]
Figure 112008015968843-pct00044
청자의 왼쪽 귀(l) 및 청자의 오른쪽 귀(r)에 도달되는 신호가 수학식 33 및 수학식 34의 성분들과 같다면, 어떤 위치의 스피커를 통해 출력된다고 하더라도(예를 들어, 왼쪽 앞 위치의 스피커(SPK1) 등을 통한다고 하더라도), 청자는 왼쪽 서라운드의 위치(Ls) 및 오른쪽 서라운드의 위치(Rs)에 스피커가 존재하는 것처럼 느낄 수 있다.
한편, 수학식 33에 표시된 성분들은 왼쪽 서라운드 위치(Ls)의 스피커에서 출력되는 경우, 각각 청자의 왼쪽 귀(l) 및 청자의 오른쪽 귀(r)에 도달되는 신호이기 때문에, 수학식 33에 표시된 성분들 그대로 왼쪽 앞 위치의 스피커(SPK1)에서 출력하게 되면, 각각 청자의 왼쪽 귀(l) 및 청자의 오른쪽 귀(r)에 도달되는 신호는 다음과 같다.
[수학식 35]
Figure 112008015968843-pct00045
수학식 35를 살펴보면, 왼쪽 앞 위치(L)부터 청자의 왼쪽 귀(l)(또는 오른쪽 귀(r)까지의 음향경로에 해당하는 성분인 'GL_l'(또는 'GL_r')가 추가된다. 그러나 청자의 왼쪽 귀(l) 및 청자의 오른쪽 귀(r)에 도달되는 신호는 수학식 35에 표시된 성분들이 아니라 수학식 33에 표시된 성분들이어야 한다. 그렇기 때문에, 왼쪽 앞 위치(L)의 스피커에서 출력하여 청자에게 도달하는 경우, 'GL_l'(또는 'GL_r') 성분이 추가되기 때문에, 수학식 33에 나타난 성분들을 왼쪽 앞 위치(L)의 스피커(SPK1)에서 출력하는 경우에는, 음향경로에 'GL_l'(또는 'GL_r')의 역함수 'GL_l -1' (또는 'GL_l -1')를 고려해야 한다. 다시 말해서, 수학식 33에 해당하는 성분들을 왼쪽 앞 위치(L)의 스피커(SPK1)에서 출력하는 경우, 다음 수학식과 같이 변형되어야 한다.
[수학식 36]
Figure 112008015968843-pct00046
그리고 수학식 34에 해당하는 성분들을 왼쪽 앞 위치(L)의 스피커(SPK1)에서 출력하는 경우, 다음 수학식과 같이 변형되어야 한다.
[수학식 37]
Figure 112008015968843-pct00047
따라서, 왼쪽 앞 위치(L)의 스피커(SPK1)에서 출력되는 신호(L')를 정리하면 다음과 같다.
[수학식 38]
Figure 112008015968843-pct00048
(Ls*GLs_r*GL_r -1 및 Rs*GRs_r*GL_l -1 성분은 생략됨)
수학식 38에 표시된 신호가 왼쪽 앞 위치의 스피커(SPK1)에서 출력하여 청자의 왼쪽 귀(l) 위치에 도달하면, 음향경로 'GL_l' 팩터가 추가되기 때문에 수학식 38에서의 'GL_l -1' 항들이 상쇄되어, 결과적으로 수학식 33 및 수학식 34에 표시된 팩터가 남게 되는 것이다.
도 8은 가상 서라운드 효과를 위해 각 위치에서 출력되는 신호를 나타낸 도면이다. 도 8을 참조하면, 서라운드의 위치(Ls, Rs)에서 출력되는 신호(Ls, Rs)에 음향경로를 고려하여 각 스피커 위치(SPK1)에서 출력되는 신호(L')에 포함시키게 되면, 수학식 38과 같음을 알 수 있다.
수학식 38에서, GLs_l*GL_l -1를 HLs_L으로 간략하게 표시하면 다음과 같다.
[수학식 39]
Figure 112008015968843-pct00049
한편, 센터 위치(C)의 스피커(SPK2)에서 출력되는 신호(C')를 정리하면 다음과 같다.
[수학식 40]
Figure 112008015968843-pct00050
다른 한편, 오른쪽 앞 위치(R)의 스피커(SPK3)에서 출력되는 신호(R')를 정리하면 다음과 같다.
[수학식 41]
Figure 112008015968843-pct00051
도 9는 수학식 38, 수학식 39, 및 수학식 40과 같이 5 채널 신호를 이용하여 3채널 신호를 생성하는 방법을 개념적으로 나타낸 도면이다. 5채널 신호를 이용하여 2 채널 신호(R', L')를 생성하거나 서라운드 채널 신호(Ls, Rs)를 센터 채널 신호(C')에 포함시키지 않을 경우, HLs_C 및 HRs_C는 0 이 된다.
구현상의 편의에 따라 Hx_y 대신에 Gx_y를 사용할 수도 있고 크로스 토크(cross-talk)를 고려하여 Hx_y를 이용할 수도 있는 등, Hx_y는 Gx_y를 다양한 변형한 형태가 될 수 있다.
상술한 설명은 서라운드 효과를 갖는 조합 공간정보의 일 예로서, 공간필터정보의 적용방법에 따라 다양한 형태로 달라질 수 있음은 자명하다. 위와 같은 과정을 통해 스피커로 출력되는 신호(위의 예에서는 왼쪽 앞 채널(L'), 오른쪽 앞 채널(R'), 센터 채널(C'))은 앞서 설명한 바와 같이 조합 공간정보 중 특히 조합 공간 파라미터를 이용하여 다운믹스 오디오 신호로부터 생성할 수 있다.
(3) 확대 공간정보
공간정보에 확장 공간정보를 추가하여 확대 공간정보를 생성할 수 있다. 그리고 이 확대 공간정보를 이용하여 오디오 신호를 업믹싱할 수 있는 데, 이때 업믹싱하는 단계는 공간정보에 근거하여 오디오 신호를 1차 업믹싱 오디오 신호로 변환하고, 확장 공간정보에 근거하여 1차 업믹싱 오디오 신호를 2차 업믹싱 오디오 신호로 변환된다.
여기서 확장 공간정보는 확장채널 구성정보, 확장채널 매핑정보 및 확장 공간 파라미터를 포함할 수 있다. 확장채널 구성정보란, 공간정보의 트리구조정보에 의해 구성될 수 있는 채널 이외에, 구성될 수 있는 채널에 관한 정보로서 분할 식별자 및 미분할 식별자 중 하나 이상을 포함할 수 있는데, 이에 대한 구체적인 설명은 후술하고자 한다. 확장채널 매핑정보는 확장채널을 구성하는 각 채널의 위치정보이다. 확장 공간 파라미터는 하나의 채널이 두 개 이상의 채널로 업믹스되기 위해 필요한 정보로서, 채널간 레벨차이를 포함할 수 있다.
이와 같은 확장 공간정보는 i) 인코딩 장치에 의해 생성된 후 공간정보에 포함된 것일 수도 있고, ii) 디코딩 장치에 의해 자체적으로 생성된 것일 수도 있다. 확장 공간정보가 인코딩 장치에 의해 생성된 것인 경우, 확장 공간정보의 존재여부는 공간정보의 지시자를 근거로 판단될 수 있다. 확장 공간정보가 디코딩 장치에 의해 자체적으로 생성된 것인 경우, 확장 공간정보의 확장 공간 파라미터는 공간정보의 공간 파라미터를 이용하여 계산한 것일 수도 있다.
한편, 공간정보 및 확장 공간정보를 근거로 생성된 확대 공간정보를 이용하여 오디오 신호를 업믹스하는 과정은, 순차적이고 계층적으로 수행될 수도 있지만, 일괄적이고 통합적으로도 처리될 수 있다. 만약, 확대 공간정보가 공간정보 및 확장 공간정보를 근거로 하나의 매트릭스로서 산출될 수 있으면, 상기 매트릭스를 이용함으로써, 일괄적이고 직접적으로 다운믹스 오디오 신호를 멀티채널 오디오 신호로 업믹스할 수 있는 것이다. 이때 매트릭스를 구성하는 인자는, 공간 파라미터, 및 확장 공간 파라미터에 의해 정의된 것일 수 있다.
우선, 인코딩 장치에 의해 생성된 확장 공간정보를 이용하는 경우에 대해서 설명한 후, 디코딩 장치에서 확장 공간정보를 자체적으로 생성하는 경우에 관해서 설명하고자 한다.
(3)-1 : 인코딩 장치에 의해 생성된 확장 공간정보를 이용하는 경우 : 임의 트리구조(arbitrary tree configuration)
확대 공간정보는 공간정보에 확장 공간정보를 추가하여 생성되는 데 있어서, 이 확장 공간정보가 인코딩 장치에 의해 생성된 것으로서, 디코딩 장치가 확장 공간정보를 수신한 경우에 관해서 설명하기로 한다. 한편, 여기서의 확장 공간정보는 인코딩 장치가 멀티채널 오디오 신호를 다운믹스하는 과정에서 추출한 것일 수 있다.
우선, 앞서 설명한 바와 같이 확장 공간정보는 확장채널 구성정보, 확장채널 매핑정보, 확장 공간 파라미터를 포함하는 데, 여기서 확장채널 구성정보는 분할 식별자 및 미분할 식별자를 하나 이상 포함한다. 이하, 분할 식별자 및 미분할 식별자의 배열을 근거로 확장채널을 구성하는 과정에 관해서 구체적으로 설명하고자 한다.
도 10은 확장채널 구성정보를 근거로 확장 채널이 구성되는 일 예를 나타낸 도면이다. 도 10의 하단을 참조하면, 0과 1이 순서대로 반복되어 배열되어 있는데, 여기서 0은 미분할 식별자이고, 1은 분할 식별자를 의미한다. 우선 첫번째 순서((1))에 미분할 식별자(0)가 존재하는 데, 이 첫번째 순서의 미분할 식별자(0)와 매칭되는 채널은 최상단에 존재하는 왼쪽 채널(L)이다. 따라서, 미분할 식별자(0)와 매칭되는 왼쪽 채널(L)을 분할하지 않고 출력채널로서 선택한다. 그리고 두번째 순서((2))는 분할 식별자(1)가 존재하는 데, 이 두번째 순서의 분할 식별자(0)와 매칭되는 채널은 왼쪽 채널(L) 다음의 왼쪽 서라운드 채널(Ls)이다. 따라서, 분할 식별자(1)와 매칭되는 왼쪽 서라운드 채널(Ls)을 2개의 채널로 분할한다. 세번째 순서((3)) 및 네번째 순서((4))에 미분할 식별자(0)들이 존재하므로, 왼쪽 서라운드 채널(Ls)에서 분할된 2개의 채널은 각각 분할하지 않고, 그대로 출력채널로서 선택한다. 이와 같은 과정을 마지막 순서((10))까지 반복하면, 전체 확장채널을 구성할 수 있다.
채널 분할 과정은 분할 식별자(1)의 개수만큼 반복되고, 채널을 출력채널로서 선택하는 과정은 미분할 식별자(0)의 개수만큼 반복된다. 따라서, 채널 분할부(AT0, AT1)의 개수는 분할 식별자(1)의 개수(2개)와 동일하고, 확장채널의 개수(L, Lfs, Ls, R, Rfs, Rs, C, LFE)는 미분할 식별자(0)의 개수(8개) 동일하게 된다.
한편, 확장채널을 구성한 이후, 확장채널 매핑정보를 이용하여 각 출력채널별로 그 위치를 다시 매핑시킬 수 있다. 도 10의 경우, 왼쪽 프론트 채널(L), 왼쪽 프론트 사이드 채널(Lfs), 왼쪽 서라운드 채널(Ls), 오른쪽 프론트 채널(R), 오른쪽 프론트 사이트 채널(Rfs), 오른쪽 서라운드 채널(Rs), 센터 채널(C), 저주파 채널(LFE) 순서대로 매핑되었다.
이상 살펴본 바와 같이, 확장채널 구성정보를 근거로 확장 채널이 구성될 수 있는 데, 하나의 채널을 두 개 이상의 채널로 분할하는 채널 분할부가 필요하다. 이 채널 분할부가 하나의 채널을 두 개 이상의 채널로 분할하는 데 있어서, 확장공간 파라미터가 사용될 수 있다. 이 확장 공간 파라미터는 채널 분할부의 개수와 동일하기 때문에, 분할 식별자의 개수와도 동일하다. 따라서, 확장 공간 파라미터는 분할 식별자의 개수만큼 추출된 것일 수 있다. 도 11은 도 10에 도시된 확장 채널의 구성, 및 확장 공간 파라미터와의 관계를 나타낸 도면이다. 도 11을 참조하면, 채널 분할부(AT0, AT1)가 2개 존재하고, 여기에 각각 적용되는 확장 공간 파라미터(ATD0, ATD1)가 표시되어 있다. 확장 공간 파라미터가 채널간 레벨 차이일 경우, 채널 분할부는 이러한 확장 공간 파라미터를 이용하여 2개로 분할되는 채널들 각각의 레벨을 결정할 수 있다. 위와 같이 확장 공간정보를 추가하여 업믹싱하는 과정에 있어서, 확장 공간 파라미터의 전부가 아니라 일부만을 적용할 수도 있다.
(3)-2 확장 공간정보를 생성하는 경우 : 내삽/외삽 (interpolation/extrapolation)
확대 공간정보는 공간정보에 확장 공간정보를 추가하여 생성될 수 있는 데, 확장 공간정보가 공간정보를 이용하여 생성된 경우에 관해 설명하기로 한다. 공간 정보 중 공간 파라미터를 이용하여 확장 공간정보를 생성할 수 있는데, 여기서 내삽 또는 외삽 등의 방법이 이용될 수 있다.
(3)-2-1. 6.1 채널로 확장
멀티채널 오디오 신호가 5.1 채널일 때, 6.1 채널의 출력채널 오디오 신호를 생성하고자 할 경우를 예를 들어 설명하기로 한다.
도 12는 5.1 채널의 멀티채널 오디오 신호의 위치와 6.1 채널의 출력채널 오디오 신호의 위치를 나타낸 도면이다. 도 12의 (a)를 참조하면, 5.1 채널의 멀티채널 오디오 신호의 채널 위치가 각각 왼쪽 앞 채널(L), 오른쪽 앞 채널(R), 센터 채널(C), 저주파채널(LFE)(미도시), 왼쪽 서라운드 채널(Ls), 오른쪽 서라운드 채널(Rs)임을 알 수 있다. 만약, 이러한 5.1 채널의 멀티채널 오디오 신호가 다운믹스된 오디오 신호의 경우, 이 다운믹스 오디오 신호에 공간 파라미터만을 적용하면 다시 5.1 채널의 멀티채널 오디오 신호로 업믹스된다, 그러나, 도 12의 (b)와 같이 6.1 채널의 멀티채널 오디오 신호로 업믹스하기 위해서는, 후방 센터(rear center)(RC)의 채널 신호를 더 생성하여야 한다.
이 후방 센터(rear center)(RC)의 채널 신호는 후방의 두 개의 채널(좌측 서라운드 채널(Ls) 및 우측 서라운드 채널(Rs))과 관련된 공간 파라미터를 이용하여 생성할 수 있다. 구체적으로, 공간 파라미터 중 채널간 레벨 차이(CLD)는 두 채널 간의 레벨 차이를 나타내는데, 두 채널 간의 레벨 차이를 조정함으로써, 두 채널 사이에 존재하는 가상 음원의 위치를 변화시킬 수 있다.
이하에서는, 두 채널 사이의 레벨 차이에 따라 가상 음원의 위치가 변화하는 원리에 관해서 살펴보고자 한다.
도 13는 두 채널간의 레벨 차이 및 가상 음원의 위치와의 관계를 나타내는 도면이다. 도 13에서, 왼쪽 서라운드 채널(Ls)의 레벨이 a이고, 오른쪽 서라운드 채널(Rs)의 레벨이 b이다. 도 13의 (a)를 참조하면, 왼쪽서라운드 채널(Ls)의 레벨(a)이 오른쪽 서라운드 채널(Rs)의 레벨(b)보다 큰 경우, 가상 음원의 위치(VS)는 오른쪽 서라운드 채널(Rs)의 위치보다 왼쪽 서라운드 채널(Ls)의 위치에 가까운 것을 알 수 있다. 두 채널에서 오디오 신호가 출력되는 경우, 청자는 두 채널 사이에 가상 음원이 존재하는 것처럼 느끼게 되는 데, 이 때 가상 음원의 위치는 두 채널의 중에서 레벨이 상대적으로 높은 채널의 위치에 가깝다, 도 13의 (b)의 경우는, 왼쪽 서라운드 채널(Ls)의 레벨(a)이 오른쪽 서라운드 채널(Rs)의 레벨(b)과 거의 동일하기 때문에, 가상 음원의 위치가 왼쪽 서라운드 채널(Ls) 및 오른쪽 서라운드 채널(Rs)의 가운데에 존재하는 것으로, 청자는 느끼게 된다.
위와 같은 원리를 이용하여 후방 센터(RC)의 레벨의 결정할 수 있다. 도 14은 두 후방 채널들의 레벨, 및 후방 센터 채널의 레벨을 나타내는 도면이다. 도 14에 도시된 바와 같이, 후방 센터 채널(RC)의 레벨(c)는 왼쪽 서라운드 채널(Ls)의 레벨(a) 및 오른쪽 서라운드 채널(Rs)의 레벨(b) 차이를 내삽하는 방식으로 산출할 수 있다. 내삽 방식으로서는 선형 내삽(linear) 뿐만 아니라 비선형 내삽(non-linear interpolation) 방식도 적용될 수 있다. 선형 내삽 방식에 따라, 두 채널들(예: Ls, Rs) 사이에 존재하는 새로운 채널(예: 후방 센터 채널(RC))의 레벨(c)을 산출하는 수학식은 다음과 같다.
[수학식 40]
Figure 112008015968843-pct00052
여기서, a, b는 두 채널 각각의 레벨,
k는 a 레벨의 채널 및 b 레벨의 채널와 c 레벨의 채널간의 상대적 위치.
만약, c 레벨의 채널(예: 후방 센터 채널(RC))이 a 레벨의 채널(예: Ls) 및 b 레벨의 채널(Rs)의 정 중앙에 위치할 경우, k는 0.5이다. k가 0.5일 경우, 수학식 40은 다음 식과 같다.
[수학식 41]
Figure 112008015968843-pct00053
수학식 41에 따르면, c 레벨의 채널(예: 후방 센터 채널(RC))이 a 레벨의 채널(예: Ls) 및 b 레벨의 채널(Rs)의 정 중앙에 위치할 경우, 새로운 채널의 레벨(c)은 기존의 채널의 레벨(a,b)의 평균간이 된다. 위 수학식 40 및 수학식 41은 하나의 예일 뿐이며, c 레벨의 결정 뿐만 아니라 a 레벨과 b 레벨의 값도 재조정하는 것이 가능하다.
(3)-2-2. 7.1 채널로 확장
멀티채널 오디오 신호가 5.1 채널일 때, 7.1 채널의 출력채널 오디오 신호를 생성하고자 할 경우를 예를 들어 설명하기로 한다.
도 15는 5.1 채널의 멀티채널 오디오 신호의 위치와 7.1 채널의 출력채널 오디오 신호의 위치를 나타낸 도면이다. 도 15의 (a)를 참조하면, 도 12의 (a)와 마찬가지로, 5.1 채널의 멀티채널 오디오 신호의 채널 위치가 각각 왼쪽 앞 채널(L), 오른쪽 앞 채널(R), 센터 채널(C), 저주파채널(LFE)(미도시), 왼쪽 서라운드 채널(Ls), 오른쪽 서라운드 채널(Rs)임을 알 수 있다. 만약, 이러한 5.1 채널의 멀티채널 오디오 신호가 다운믹스된 오디오 신호의 경우, 이 다운믹스 오디오 신호에 공간 파라미터만을 적용하면 역시 5.1 채널의 멀티채널 오디오 신호로 업믹스된다. 그러나, 도 15의 (b)와 같이 7.1 채널의 멀티채널 오디오 신호로 업믹스하기 위해서는, 왼쪽 프론트 사이드 채널(Lfs) 및 오른쪽 프론트 사이드 채널(Rfs)을 더 생성하여야 한다.
왼쪽 프론트 사이드 채널(Lfs)은 왼쪽 전방 채널(L) 및 왼쪽 서라운드 채널(Ls) 사이에 위치하기 때문에, 왼쪽 전방 채널(L)의 레벨 및 왼쪽 서라운드 채널(Ls)의 레벨을 이용하여, 내삽 방식으로 왼쪽 프론트 사이드 채널(Lfs)의 레벨을 결정할 수 있다. 도 16은 두 왼쪽 채널들의 레벨, 및 왼쪽 프론트 사이드 채널(Lfs)의 레벨을 나타내는 도면이다. 도 16을 참조하면, 왼쪽 프론트 사이드 채널(Lfs)의 레벨(c)은 왼쪽 전방 채널(L)의 레벨(a) 및 왼쪽 서라운드 채널(Ls)의 레벨(b)를 근거로 선형적으로 내삽 값임을 알 수 있다.
한편, 왼쪽 프론트 사이드 채널(Lfs)은 왼쪽 전방 채널(L) 및 왼쪽 서라운드 채널(Ls) 사이에 위치하기도 하지만, 왼쪽 전방 채널(L), 센터 채널(C), 및 우측 전방 채널(R)의 바깥에 위치하기도 한다. 그렇기 때문에, 왼쪽 전방 채널(L)의 레벨, 센터 채널(C)의 레벨, 및 우측 전방 채널(R)의 레벨을 이용하여, 외삽 방식으로 왼쪽 프론트 사이드 채널(Lfs)의 레벨을 결정할 수도 있다. 도 17은 세 전방(font) 채널들의 레벨, 및 왼쪽 프론트 사이드 채널의 레벨을 나타내는 도면이다. 도 17를 참조하면, 왼쪽 프론트 사이드 채널(Lfs)의 레벨(d)은 왼쪽 전방 채널(L)의 레벨(a), 센터 채널(C)의 레벨(c), 및 오른쪽 전방 채널(R)의 레벨(b)를 근거로 선형적으로 외삽된 값임을 알 수 있다.
이상 2가지 경우를 예를 들어서, 공간정보에 확장 공간정보를 추가하여 출력채널 오디오 신호를 생성하는 과정을 설명하였는 바, 앞서 언급한 바와 같이, 확장 공간정보를 추가하여 업믹싱하는 과정에 있어서, 확장 공간 파라미터의 전부가 아니라 일부만을 적용할 수도 있다. 이와 같이 오디오 신호에 공간 파라미터를 적용하는 과정은 순차적, 계층적으로 수행될 수도 있지만, 일괄적이고 통합적으로도 처리될 수 있다.
본 발명의 일 측면에 따르면, 정해진 트리구조와 다른 구조의 오디오 신호를 생성할 수 있기 때문에, 다양한 구조의 오디오 신호를 생성할 수 있다.
본 발명의 다른 측면에 따르면, 정해진 트리구조와 다른 구조의 오디오 신호를 생성할 수 있기 때문에, 다운믹스되기 전의 멀티채널의 개수가 스피커의 개수보다 많거나 적다고 하더라도, 다운믹스 오디오 신호로부터 스피커의 개수와 동일한 개수의 출력채널을 생성할 수 있다.
본 발명의 또 다른 측면에 따르면, 멀티채널의 개수보다 적은 수의 출력채널을 생성할 경우, 다운믹스 오디오 신호로부터 멀티채널 오디오 신호로 업믹스한 다음 이 멀티채널 오디오 신호로부터 출력채널 오디오 신호를 다운믹스하는 것이 아니라, 다운믹스 오디오 신호로부터 직접 멀티채널 오디오 신호를 생성하는 것이기 때문에, 오디오 신호를 디코딩하는 데 소요되는 연산량이 현저히 감소되는 효과가 있다.
본 발명의 또 다른 측면에 따르면, 조합 공간정보를 생성하는 데 있어서 음향경로를 고려할 수 있기 때문에, 서라운드 채널을 출력하지 못하는 상황인 경우에도 가상(pseudo)으로 서라운드 효과를 낼 수가 있다.

Claims (19)

  1. 오디오 신호를 수신하는 단계;
    트리구조정보 및 공간 파라미터를 포함하는 공간정보를 수신하는 단계;
    상기 공간정보에 확장 공간정보를 추가하여 변형 공간정보를 생성하는 단계; 및,
    상기 트리구조정보 및 상기 변형 공간정보를 이용하여 오디오 신호를 업믹싱하는 단계를 포함하되,
    상기 업믹싱하는 단계는,
    상기 트리구조정보에 근거하여 상기 오디오 신호를 1차 업믹싱 신호로 변환하는 단계; 및,
    상기 1차 업믹싱 오디오 신호를 2차 업믹싱 오디오 신호로 변환하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  2. 제 1 항에 있어서,
    상기 오디오 신호는 멀티채널 오디오 신호가 다운믹스된 다운믹스 오디오 신호이고, 상기 공간정보는, 상기 멀티채널 오디오 신호가 정해진 트리구조에 따라 다운믹스됨에 따라 결정된 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  3. 제 1 항에 있어서,
    상기 변형 공간정보는, 상기 공간정보 및 상기 확장 공간정보를 근거로 산출된 매트릭스이며, 상기 매트릭스를 구성하는 인자는, 상기 공간 파라미터, 및 상기 확장 공간정보의 확장 공간 파라미터에 의해 정의되는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  4. 제 1 항에 있어서,
    상기 확장 공간정보는, 확장채널 구성정보 및 확장 공간 파라미터를 포함하고, 상기 확장채널 구성정보는 분할 식별자 및 미분할 식별자 중 하나 이상을 포함하는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  5. 제 4 항에 있어서,
    상기 확장 공간 파라미터는, 채널간 레벨 차이를 포함하는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  6. 제 4 항에 있어서,
    상기 확장 공간정보는 수신된 것이며,
    상기 확장 공간 파라미터는, 상기 분할 식별자의 총 개수만큼 추출된 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  7. 제 4 항에 있어서,
    상기 업믹싱하는 단계는,
    상기 분할 식별자와 매칭되는 확장 공간 파라미터를 이용하여, 상기 분할 식별자와 매칭되는 채널을 두 개 이상의 채널로 분할하는 단계를 더 포함하고,
    상기 분할하는 단계는, 상기 분할 식별자의 총 개수만큼 반복되는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  8. 제 4 항에 있어서,
    상기 업믹싱하는 단계는,
    상기 미분할 식별자와 매칭되는 채널을 출력채널로서 선택하는 단계를 더 포함하고,
    상기 선택하는 단계는, 상기 미분할 식별자의 총 개수만큼 반복되는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  9. 삭제
  10. 제 1 항에 있어서,
    상기 확장 공간정보는, 확장채널 매핑정보를 포함하고,
    상기 업믹싱 단계 이후, 상기 확장채널 매핑정보를 이용하여 출력채널 오디 오 신호를 리매핑하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 디코딩 방법.
  11. 공간정보에 확장 공간정보를 추가하여 변형 공간정보를 생성하는 변형 공간정보 생성부; 및,
    트리구조정보 및 상기 변형 공간정보를 이용하여 오디오 신호를 업믹싱하는 출력채널 생성부를 포함하고,
    상기 공간정보는 상기 트리구조정보 및 공간 파라미터를 포함하며, 상기 공간정보 및 상기 오디오 신호는 수신된 것이고,
    상기 출력채널 생성부는, 상기 트리구조정보를 근거로 하여 상기 오디오 신호를 1차 업믹싱 신호로 변환한 후, 상기 1차 업믹싱 오디오 신호를 2차 업믹싱 오디오 신호로 변환하는 것임을 특징으로 하는 오디오 신호의 디코딩 장치.
  12. 제 11 항에 있어서,
    상기 오디오 신호는 멀티채널 오디오 신호가 다운믹스된 다운믹스 오디오 신호이고, 상기 공간정보는, 상기 멀티채널 오디오 신호가 정해진 트리구조에 따라 다운믹스됨에 따라 결정된 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  13. 제 11 항에 있어서,
    상기 변형 공간정보는, 상기 공간정보 및 상기 확장 공간정보를 근거로 산출된 매트릭스이며, 상기 매트릭스를 구성하는 인자는, 상기 공간 파라미터, 및 상기 확장 공간정보의 확장 공간 파라미터에 의해 정의되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  14. 제 11 항에 있어서,
    상기 확장 공간정보는, 확장채널 구성정보 및 확장 공간 파라미터를 포함하고, 상기 확장채널 구성정보는 분할 식별자 및 미분할 식별자 중 하나 이상을 포함하는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  15. 제 14 항에 있어서,
    상기 확장 공간 파라미터는, 채널간 레벨 차이를 포함하는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  16. 제 14 항에 있어서,
    상기 확장 공간정보는 수신된 것이며,
    상기 확장 공간 파라미터는, 상기 분할 식별자의 총 개수만큼 추출된 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  17. 제 14 항에 있어서,
    상기 출력채널 생성부는, 상기 분할 식별자와 매칭되는 확장 공간 파라미터를 이용하여, 상기 분할 식별자와 매칭되는 채널을 두 개 이상의 채널로 분할하고,
    상기 분할은, 상기 분할 식별자의 총 개수만큼 반복되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  18. 제 14 항에 있어서,
    상기 출력채널 생성부는, 상기 미분할 식별자와 매칭되는 채널을 출력채널로서 선택하고,
    상기 선택은 상기 미분할 식별자의 총 개수만큼 반복되는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
  19. 제 11 항에 있어서,
    상기 확장 공간정보는, 확장채널 매핑정보를 포함하고,
    상기 출력채널 생성부는, 상기 업믹싱 이후, 상기 확장채널 매핑정보를 이용하여 출력채널 오디오 신호를 리매핑하는 것을 특징으로 하는 오디오 신호의 디코딩 장치.
KR1020087005384A 2005-09-14 2006-09-14 오디오 신호의 디코딩 방법 및 장치 KR100857105B1 (ko)

Applications Claiming Priority (16)

Application Number Priority Date Filing Date Title
US71652405P 2005-09-14 2005-09-14
US60/716,524 2005-09-14
US75998006P 2006-01-19 2006-01-19
US60/759,980 2006-01-19
US76036006P 2006-01-20 2006-01-20
US60/760,360 2006-01-20
US77366906P 2006-02-16 2006-02-16
US60/773,669 2006-02-16
US77672406P 2006-02-27 2006-02-27
US60/776,724 2006-02-27
US78751606P 2006-03-31 2006-03-31
US60/787,516 2006-03-31
US81602206P 2006-06-22 2006-06-22
US60/816,022 2006-06-22
KR20060078300 2006-08-18
KR1020060078300 2006-08-18

Publications (2)

Publication Number Publication Date
KR20080039474A KR20080039474A (ko) 2008-05-07
KR100857105B1 true KR100857105B1 (ko) 2008-09-05

Family

ID=37865187

Family Applications (4)

Application Number Title Priority Date Filing Date
KR1020087005384A KR100857105B1 (ko) 2005-09-14 2006-09-14 오디오 신호의 디코딩 방법 및 장치
KR1020087005389A KR100857108B1 (ko) 2005-09-14 2006-09-14 오디오 신호의 디코딩 방법 및 장치
KR1020087005385A KR100857106B1 (ko) 2005-09-14 2006-09-14 오디오 신호의 디코딩 방법 및 장치
KR1020087005388A KR100857107B1 (ko) 2005-09-14 2006-09-14 오디오 신호의 디코딩 방법 및 장치

Family Applications After (3)

Application Number Title Priority Date Filing Date
KR1020087005389A KR100857108B1 (ko) 2005-09-14 2006-09-14 오디오 신호의 디코딩 방법 및 장치
KR1020087005385A KR100857106B1 (ko) 2005-09-14 2006-09-14 오디오 신호의 디코딩 방법 및 장치
KR1020087005388A KR100857107B1 (ko) 2005-09-14 2006-09-14 오디오 신호의 디코딩 방법 및 장치

Country Status (8)

Country Link
US (6) US20080228501A1 (ko)
EP (4) EP1946296A4 (ko)
JP (2) JP5108772B2 (ko)
KR (4) KR100857105B1 (ko)
AU (1) AU2006291689B2 (ko)
CA (1) CA2621664C (ko)
HK (1) HK1126306A1 (ko)
WO (4) WO2007032650A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100857105B1 (ko) 2005-09-14 2008-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
KR101120909B1 (ko) * 2006-10-16 2012-02-27 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 멀티 채널 파라미터 변환 장치, 방법 및 컴퓨터로 판독가능한 매체
CN102892070B (zh) * 2006-10-16 2016-02-24 杜比国际公司 多声道下混对象编码的增强编码和参数表示
CN101960514A (zh) 2008-03-14 2011-01-26 日本电气株式会社 信号分析控制系统及其方法、信号控制装置及其方法和程序
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
KR101283783B1 (ko) * 2009-06-23 2013-07-08 한국전자통신연구원 고품질 다채널 오디오 부호화 및 복호화 장치
WO2011027494A1 (ja) 2009-09-01 2011-03-10 パナソニック株式会社 デジタル放送送信装置、デジタル放送受信装置およびデジタル放送送受信システム
EP2522016A4 (en) 2010-01-06 2015-04-22 Lg Electronics Inc DEVICE FOR PROCESSING AN AUDIO SIGNAL AND METHOD THEREFOR
US8913757B2 (en) * 2010-02-05 2014-12-16 Qnx Software Systems Limited Enhanced spatialization system with satellite device
SG178320A1 (en) 2010-06-09 2012-03-29 Panasonic Corp Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit and audio decoding apparatus
US9154878B2 (en) * 2012-01-10 2015-10-06 Monster, Llc Interconnected speaker system
BR112014017457A8 (pt) * 2012-01-19 2017-07-04 Koninklijke Philips Nv aparelho de transmissão de áudio espacial; aparelho de codificação de áudio espacial; método de geração de sinais de saída de áudio espacial; e método de codificação de áudio espacial
US9774974B2 (en) 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
GB201718341D0 (en) * 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
US12010493B1 (en) * 2019-11-13 2024-06-11 EmbodyVR, Inc. Visualizing spatial audio
US11627428B2 (en) * 2020-03-02 2023-04-11 Magic Leap, Inc. Immersive audio platform

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030043620A (ko) * 2001-11-27 2003-06-02 삼성전자주식회사 좌표 인터폴레이터의 키 값 데이터 부호화/복호화 방법 및장치

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5166685A (en) * 1990-09-04 1992-11-24 Motorola, Inc. Automatic selection of external multiplexer channels by an A/D converter integrated circuit
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
DE4217276C1 (ko) 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
JP2924539B2 (ja) 1993-01-29 1999-07-26 日本ビクター株式会社 音像定位制御方法
DE69428939T2 (de) 1993-06-22 2002-04-04 Deutsche Thomson-Brandt Gmbh Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix
DE69433258T2 (de) * 1993-07-30 2004-07-01 Victor Company of Japan, Ltd., Yokohama Raumklangsignalverarbeitungsvorrichtung
JP3805786B2 (ja) * 1994-02-25 2006-08-09 メラー、ヘンリク バイノーラル信号合成と頭部伝達関数とその利用
JP3397001B2 (ja) 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
US5703584A (en) * 1994-08-22 1997-12-30 Adaptec, Inc. Analog data acquisition system
JPH08123494A (ja) 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JPH08202397A (ja) 1995-01-30 1996-08-09 Olympus Optical Co Ltd 音声復号化装置
JP3088319B2 (ja) * 1996-02-07 2000-09-18 松下電器産業株式会社 デコード装置およびデコード方法
US5912636A (en) * 1996-09-26 1999-06-15 Ricoh Company, Ltd. Apparatus and method for performing m-ary finite state machine entropy coding
KR100206333B1 (ko) 1996-10-08 1999-07-01 윤종용 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법
US6711266B1 (en) * 1997-02-07 2004-03-23 Bose Corporation Surround sound channel encoding and decoding
JP3572165B2 (ja) 1997-04-04 2004-09-29 株式会社デノン 映像音響信号再生装置及び映像音響信号再生方法
US6307941B1 (en) * 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound
CA2325482C (en) 1998-03-25 2009-12-15 Lake Technology Limited Audio signal processing method and apparatus
US6574339B1 (en) * 1998-10-20 2003-06-03 Samsung Electronics Co., Ltd. Three-dimensional sound reproducing apparatus for multiple listeners and method thereof
JP3346556B2 (ja) * 1998-11-16 2002-11-18 日本ビクター株式会社 音声符号化方法及び音声復号方法
EP1054575A3 (en) 1999-05-17 2002-09-18 Bose Corporation Directional decoding
KR100416757B1 (ko) 1999-06-10 2004-01-31 삼성전자주식회사 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
KR20010009258A (ko) 1999-07-08 2001-02-05 허진호 가상 멀티 채널 레코딩 시스템
US6864913B2 (en) * 1999-12-23 2005-03-08 Harry L. Tarnoff Method and apparatus for a reconfigurable digital processor for film conversion
US6973130B1 (en) * 2000-04-25 2005-12-06 Wee Susie J Compressed video signal including information for independently coded regions
US7212872B1 (en) 2000-05-10 2007-05-01 Dts, Inc. Discrete multichannel audio with a backward compatible mix
JP4304401B2 (ja) 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
JP3566220B2 (ja) 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
AUPR955001A0 (en) * 2001-12-11 2002-01-24 Medivac Technology Pty Limited Compact waste treatment apparatus
WO2003065353A1 (en) 2002-01-30 2003-08-07 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
EP1341160A1 (en) 2002-03-01 2003-09-03 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding and for decoding a digital information signal
ES2323294T3 (es) 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
US7391869B2 (en) 2002-05-03 2008-06-24 Harman International Industries, Incorporated Base management systems
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
US6703584B2 (en) * 2002-05-13 2004-03-09 Seagate Technology Llc Disc clamp adjustment using heat
BR0305434A (pt) * 2002-07-12 2004-09-28 Koninkl Philips Electronics Nv Métodos e arranjos para codificar e para decodificar um sinal de áudio multicanal, aparelhos para fornecer um sinal de áudio codificado e um sinal de áudio decodificado, sinal de áudio multicanal codificado, e, meio de armazenagem
DE60327039D1 (de) 2002-07-19 2009-05-20 Nec Corp Audiodekodierungseinrichtung, dekodierungsverfahren und programm
CN1219414C (zh) 2002-07-23 2005-09-14 华南理工大学 两扬声器虚拟5.1通路环绕声的信号处理方法
CN1689070A (zh) 2002-10-14 2005-10-26 皇家飞利浦电子股份有限公司 信号滤波
US8437868B2 (en) 2002-10-14 2013-05-07 Thomson Licensing Method for coding and decoding the wideness of a sound source in an audio scene
EP1552723A4 (en) 2002-10-15 2010-02-17 Korea Electronics Telecomm APPARATUS AND METHOD FOR ADAPTING AUDIO SIGNAL TO THE PREFERENCE OF A USER
WO2004036955A1 (en) 2002-10-15 2004-04-29 Electronics And Telecommunications Research Institute Method for generating and consuming 3d audio scene with extended spatiality of sound source
US7181019B2 (en) 2003-02-11 2007-02-20 Koninklijke Philips Electronics N. V. Audio coding
KR100917464B1 (ko) 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US8054980B2 (en) * 2003-09-05 2011-11-08 Stmicroelectronics Asia Pacific Pte, Ltd. Apparatus and method for rendering audio information to virtualize speakers in an audio system
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR20050060789A (ko) * 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
WO2005081229A1 (ja) * 2004-02-25 2005-09-01 Matsushita Electric Industrial Co., Ltd. オーディオエンコーダ及びオーディオデコーダ
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
MX2007015118A (es) * 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
CN101263742B (zh) * 2005-09-13 2014-12-17 皇家飞利浦电子股份有限公司 音频编码
TWI462086B (zh) * 2005-09-14 2014-11-21 Lg Electronics Inc 音頻訊號之解碼方法及其裝置
KR100857105B1 (ko) 2005-09-14 2008-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
RU2380767C2 (ru) 2005-09-14 2010-01-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования аудиосигнала
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
JP2007143596A (ja) 2005-11-24 2007-06-14 Tekken Constr Co Ltd 遊技機等の取り付け枠
US20070121953A1 (en) * 2005-11-28 2007-05-31 Mediatek Inc. Audio decoding system and method
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
EP2528058B1 (en) * 2006-02-03 2017-05-17 Electronics and Telecommunications Research Institute Method and apparatus for controling rendering of multi-object or multi-channel audio signal using spatial cue
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
JP5227946B2 (ja) * 2006-03-28 2013-07-03 テレフオンアクチーボラゲット エル エム エリクソン(パブル) フィルタ適応周波数分解能
JP4875142B2 (ja) * 2006-03-28 2012-02-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル・サラウンドサウンドのためのデコーダのための方法及び装置
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030043620A (ko) * 2001-11-27 2003-06-02 삼성전자주식회사 좌표 인터폴레이터의 키 값 데이터 부호화/복호화 방법 및장치
KR20030043622A (ko) * 2001-11-27 2003-06-02 삼성전자주식회사 좌표 인터폴레이터의 키 및 키 값 데이터의 부호화/복호화장치, 및 좌표 인터폴레이터를 부호화한 비트스트림을기록한 기록 매체

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Amir Said, 'On the reduction of entropy coding complexity via symbol grouping: I-redundancy analysis and optimal alphabet partition', HP Laboratories Palo Alto, HPL-2004-145, August 23 2004
Hee-Suk Pang ET AL., 'Extended pilot-based coding for lossless bit rate reduction of MPEG surround', ETRI Journal, Vol. 29, Number 1, February 2007
J.Breebaart et al., 'MPEG spatial audio coding / Mpeg surround: Overview and current status', AES 119th Convention Paper, NewYork USA, October 7-10 2005
대한민국 공개특허공보 특2003-0043620호 (공개 2003.06.02)
대한민국 공개특허공보 특2003-0043622호 (공개 2003.06.02)
미국특허공보 제5,912,636 A (1999.06.15)

Also Published As

Publication number Publication date
KR100857107B1 (ko) 2008-09-05
KR100857108B1 (ko) 2008-09-05
US20110246208A1 (en) 2011-10-06
AU2006291689A1 (en) 2007-03-22
KR20080039474A (ko) 2008-05-07
WO2007032650A1 (en) 2007-03-22
EP1938312A4 (en) 2010-01-20
US20080228501A1 (en) 2008-09-18
CA2621664C (en) 2012-10-30
JP5108772B2 (ja) 2012-12-26
WO2007032647A1 (en) 2007-03-22
KR20080041683A (ko) 2008-05-13
WO2007032648A1 (en) 2007-03-22
CA2621664A1 (en) 2007-03-22
KR20080049730A (ko) 2008-06-04
EP1946295A4 (en) 2010-01-20
US20110182431A1 (en) 2011-07-28
KR20080039475A (ko) 2008-05-07
AU2006291689B2 (en) 2010-11-25
EP1946295A1 (en) 2008-07-23
EP1946297B1 (en) 2017-03-08
JP2009508176A (ja) 2009-02-26
EP1946295B1 (en) 2013-11-06
EP1946296A1 (en) 2008-07-23
EP1946297A4 (en) 2010-01-20
EP1946297A1 (en) 2008-07-23
HK1126306A1 (en) 2009-08-28
EP1946296A4 (en) 2010-01-20
WO2007032646A1 (en) 2007-03-22
KR100857106B1 (ko) 2008-09-08
US20110178808A1 (en) 2011-07-21
US9747905B2 (en) 2017-08-29
JP2009508175A (ja) 2009-02-26
US20080255857A1 (en) 2008-10-16
EP1938312A1 (en) 2008-07-02
US20110196687A1 (en) 2011-08-11

Similar Documents

Publication Publication Date Title
KR100857105B1 (ko) 오디오 신호의 디코딩 방법 및 장치
RU2509442C2 (ru) Способ и устройство для применения реверберации к многоканальному звуковому сигналу с использованием параметров пространственных меток
US20080235006A1 (en) Method and Apparatus for Decoding an Audio Signal
JP4728398B2 (ja) オーディオ信号のデコーディング方法及び装置
US20080221907A1 (en) Method and Apparatus for Decoding an Audio Signal
JP2009524339A (ja) メディア信号の処理方法及び装置
JP2012516596A (ja) ダウンミックスオーディオ信号をアップミックスするためのアップミキサー、方法、および、コンピュータ・プログラム
JP4988718B2 (ja) オーディオ信号のデコーディング方法及び装置
CN101356572B (zh) 解码音频信号的方法和装置
RU2380767C2 (ru) Способ и устройство для декодирования аудиосигнала
RU2485605C2 (ru) Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120827

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130823

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140822

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150824

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160824

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170814

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180814

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20190814

Year of fee payment: 12