KR101135726B1

KR101135726B1 - 인코더, 디코더, 인코딩 방법, 디코딩 방법 및 기록 매체

Info

Publication number: KR101135726B1
Application number: KR1020067020275A
Authority: KR
Inventors: 에릭 지. 피. 슈이저스; 디르크 제이. 브리바르트; 프랑수아 피. 마이버그; 레온 엠. 반 드 케르코프
Original assignee: 코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date: 2004-04-05
Filing date: 2005-03-29
Publication date: 2012-04-16
Also published as: TWI387351B; EP1735778A1; WO2005098825A1; RU2392671C2; JP2007531915A; BRPI0509108B1; MXPA06011396A; EP3561810B1; US20110106540A1; PL3561810T3; TW200603637A; ES2945463T3; US8254585B2; US7646875B2; JP5032978B2; EP1944758A2; DK3561810T3; CN101887726A; CN101887726B; EP1944758A3

Abstract

인코딩된 데이터(100)를 생성하기 위해 입력 신호(l,r)를 인코딩하는 방법이 제공된다. 본 방법은 신호(l,r) 사이의 상대적 위상차 및 시간차를 설명하는 제 1 파라미터(

)를 결정하기 위해 입력 신호(l,r)를 처리하는 단계 및 중간 신호를 생성하기 위해 입력 신호를 처리하도록 이들 제 1 파라미터(

)를 적용하는 단계를 포함한다. 상기 방법은 주요 신호(m)와 잔여 신호(s)를 생성하기 위해 제 1 중간 신호의 각도 회전을 설명하는 제 2 파라미터(

)를 결정하기 위한 중간 신호의 처리 단계를 포함하며, 상기 주요 신호(m)는 잔여 신호(s)보다 큰 크기 또는 에너지를 갖는다. 이들 제 2 파라미터는 주요 신호(m) 및 잔여 신호(s)를 생성하기 위해 중간 신호를 처리하도록 적용가능하다. 본 방법은 또한 인코딩된 데이터(100)를 생성하기 위해 이후 멀티플렉싱을 위한 대응하는 양자화된 데이터를 생성하기 위한 제 1 파라미터, 제 2 파라미터 및 주요 및 잔여 신호(m,s)의 양자화 단계를 포함한다.

Description

인코더, 디코더, 인코딩 방법, 디코딩 방법 및 기록 매체{ENCODER, DECODER, ENCODING METHOD, DECODING METHOD, AND RECORDING MEDIUM}

본 발명은, 데이터 코딩 방법, 예를 들어, 데이터 성분의 가변 각도 회전을 이용한 오디오 및/또는 이미지 데이터 코딩 방법에 관한 것이다. 게다가, 본 발명은 또한 이러한 방법을 채용하는 인코더, 및 이들 인코더에 의해 생성된 데이터를 디코딩하도록 작동하는 디코더에 관한 것이다. 게다가, 본 발명은 데이터 캐리어 및/또는 통신 네트워크를 통해 전송된 인코딩된 데이터에 관한 것이며, 인코딩된 데이터는 상기 방법에 따라 생성된다.

다수의 현대의 방법들은 대응하는 인코딩된 출력 데이터를 생성하기 위해 오디오 및/또는 이미지 데이터를 인코딩하기 위해 알려져 있다. 오디오 인코딩하는 현재의 방법의 일례는 MP3로 알려져 있고, 1992년, ISO/IEC JTC1/SC29/WG11 MPEG, IS 11172-3의, 정보 기술- 대략 1.5Mbit/s까지 디지털 저장 매체를 위한 동화상 및 관련 오디오 코딩, 제 3부: 오디오, MPEG-1에 기술된 MPEG-1 레이어 III이다. 이들 현대 방법의 일부는 코딩 효율성을 개선하기 위해, 즉, J.D. Johnston 및 A.J. Ferreira의 1992년 3월, 캘리포니아, 샌프란시스코, 연설 및 신호 의사록의 IEEE 국제 음향 회의 회의록에 게재된, "합계-차 스테레오 변환 코딩"(pp. II:pp.569- 572)에 기술된 것과 같은 중간/측면(M/S) 스테레오 코딩 또는 합계/차이 스테레오 코딩을 채용함으로써, 개선된 데이터 압축을 제공하기 위해 배열된다.

M/S 코딩에서, 스테레오 신호는 예를 들어, 수학식 1과 수학식 2에 설명된 것 같은 처리를 적용함으로써, 합계 신호(m[n]) 및 차이 신호(s[n])로서 코딩된 각각의 왼쪽 및 오른쪽 신호(l[n],r[n])를 포함한다.

신호(l[n] 및 r[n])가 거의 동일할 때, M/S 코딩은 0에 도달하는 차이 신호(s[n])로 인해 중요한 데이터 압축을 제공할 수 있으며 이에 따라 비교적 작은 정보를 전달하는 반면 합계 신호는 신호 정보 컨텐츠의 대부분을 효율적으로 포함한다. 이러한 상황에서, 합계 및 차이 신호를 나타내는데 필요한 비트율은 신호(l[n] 및 r[n])를 독립적으로 코딩하는데 필요한 것의 절반에 가깝다.

수학식 1과 수학식 2는 수학식 3에서와 같은 회전 행렬에 의해 표시될 수 있다.

여기서 c는 클리핑(clipping)을 막기 위해 종종 사용된 일정한 스케일링 계수이다.

반면 수학식 3은 45°의 각도만큼 신호(l[n],r[n])의 회전에 해당하며, 다른 회전각은 수학식 4에서 제공된 것처럼 가능하며, α는 주요 및 잔여 신호 각각과 관련하여 이하 설명되는 대응 코딩 신호(m'[n],s'[n])를 생성하기 위해 신호(l[n],r[n])에 적용된 회전각이다.

각 α는 잔여 신호(s'[n])에 존재하는 정보 내용을 감소시키고 주요 신호(m'[n])에 정보 컨텐츠를 압축함으로써 신호(l[n],r[n])의 넓은 등급에 대한 향상된 압축을 제공하고, 즉 잔여 신호(s'[n]) 내의 전력을 최소화하고 이에 따라 주요 신호(m'[n]) 내의 전력을 최대화하기 위해 가변으로 이루어지는 것이 유리하다.

수학식 1 내지 수학식 4로 나타난 코딩 기술은, 종래 기술에서 광대역 신호가 아닌, 오디오 신호를 전달하기 위해 사용된 완전 대역폭의 더 작은 부분만을 각각 나타내는 하위-신호에 인가된다. 게다가, 수학식 1 내지 수학식 4의 기술은 또한 종래 기술에서 신호(l[n],r[n])의 주파수 영역 표현에 인가된다.

공개된 미국 특허 US 5,621,855에서, 제 1 및 제 2 신호 성분을 구비한 디지털 신호를 하위-대역 코딩하는 방법이 설명되며, 디지털 신호는 제 1 신호 성분에 응답하여 제 1 q-샘플 신호 블록을 구비한 제 1 하위-대역 신호 및 제 2 신호 성분에 응답하여 제 2 q-샘플 신호 블록을 구비한 제 2 하위-대역 신호를 생성하기 위해 하위-대역 코딩되며, 제 1 및 제 2 하위-대역 신호는 동일한 하위-대역 내에 있으며 제 1 및 제 2 신호 블록은 시간 등가적이다.

제 1 및 제 2 신호 블록은 시간-등가적 샘플의 지점 표시 사이의 최소 거리값을 얻기 위해 처리된다. 최소 거리값은 임계 거리값보다 작거나 이와 같은 때, q 샘플로 구성된 복합 블록은, 제 1 블록의 샘플 각각을 cos(α)로 제 2 신호 블록의 샘플 각각을 -sin(α)로 곱한 후 제 1 및 제 2 신호 블록 내의 시간-등가 샘플의 각 쌍을 더함으로써 얻어진다.

전술한 회전각(2)의 적용이 M/S 코딩의 많은 단점을 제거할 수 있다고 해도(오직 45°의 회전만이 채용됨), 이러한 접근 방식은 예를 들어 스테레오 신호 쌍과 같은, 신호의 그룹에 적용되는 경우, 이들 신호에서 상당한 상대적 상호 위상 또는 시간 오프셋이 발생하는 경우, 문제가 되는 것으로 밝혀졌다. 본 발명은 이러한 문제를 다루기 위한 것이다.

본 발명의 목적은 데이터 인코딩 방법을 제공하는 것이다.

본 발명의 제 1 양상에 따라, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 입력 신호(l,r)를 인코딩하는 방법이 제공되며, 상기 방법은:

(a) 신호(l,r) 간의 상대적 위상차 및 시간차 중 적어도 하나를 설명하는 제 1 파라미터(

)를 결정하기 위해 입력 신호(l,r)를 처리하는 단계 및 대응하는 중간 신호를 생성하기 위해 입력 신호를 처리하기 위해 이들 제 1 파라미터(

)를 적용하는 단계;

(b) 주요 신호(m)와 잔여 신호(s)를 생성하는데 필요한 중간 신호의 회전을 설명하는 제 2 파라미터를 결정하기 위해 중간 신호 및/또는 입력 신호(l,r)를 처리하는 단계로서, 상기 주요 신호(m)는 잔여 신호(s)보다 큰 크기 또는 에너지를 가지는 처리 단계 및 주요 신호(m)와 잔여 신호(s)를 생성하기 위해 중간 신호를 처리하기 위해 이들 제 2 파라미터를 적용하는 단계;

(c) 제 1 파라미터, 제 2 파라미터를 양자화하는 단계 및 대응하는 양자화된 데이터를 생성하기 위해 주요 신호(m)와 잔여 신호(s)의 적어도 일부를 인코딩하는 단계; 및

(d) 인코딩된 데이터를 생성하기 위해 양자화된 데이터를 멀티플렉싱하는 단계

를 포함한다.

본 발명은 데이터의 더욱 효율적인 인코딩을 제공할 수 있다는 점에서 유리하다.

바람직하게, 이 방법에서, 잔여 신호(s)의 오직 일부만이 인코딩된 데이터에 포함된다. 이러한 잔여 신호(s)의 부분적 포함은 인코딩된 데이터 내에서 달성가능한 데이터 압축을 향상시킬 수 있다.

더 바람직하게, 이 방법에서, 인코딩된 데이터는 또한 인코딩된 데이터 내에 포함된 잔여 신호의 일부를 가리키는 하나 이상의 파라미터를 포함한다. 이러한 표시 파라미터는 인코딩된 데이터의 후속 디코딩을 덜 복잡하게 만들 수 있다.

바람직하게, 방법의 단계 (a) 및 (b)는 주파수 도메인(l[k],r[k])에서 표시된 입력 신호(l[n],r[n])의 복소 회전(complex rotation)에 의해 구현된다. 복소 회전의 구현은 복수의 입력 신호 사이에서 발생한 상대적 시간 및/또는 위상차를 더욱 효율적으로 처리할 수 있다. 더 바람직하게, 단계 (a) 및 (b)는 주파수 도메인 또는 하위-대역 도메인에서 행해진다. "하위-대역"은 신호에 필요한 완전 주파수 대역폭보다 더 작은 주파수 영역으로 해석될 것이다.

바람직하게, 상기 방법은 입력 신호(l,r)를 포함하는 전체 주파수 범위의 하위-부분에서 응용된다. 더 바람직하게, 전체 주파수 범위의 다른 하위-부분은, 앞서 설명한 것처럼 종래의 M/S 인코딩과 같은 대안적인 인코딩 기술을 사용하여 인코딩된다.

바람직하게, 상기 방법은 인코딩된 데이터를 생성하기 위해 단계 (d)에서 멀티플렉싱을 위한 데이터를 제공하기 위해 양자화된 데이터를 손실없이 코딩하는 추가적 단계를 단계 (c) 이후에 포함한다. 더 구체적으로, 손실없는 코딩은 허프만 코딩을 이용하여 구현된다. 손실없는 코딩의 이용은 잠재적으로 더 높은 오디오 품질이 달성될 수 있게 한다.

바람직하게, 상기 방법은 잔여 신호(s)에 존재하는 지각적으로 무관한 시간-주파수 정보를 폐기함으로써 잔여 신호(s)를 조작하는 단계를 포함하며, 상기 조작된 잔여 신호(s)는 인코딩된 데이터(100)에 기여하며, 상기 지각적으로 무관한 정보는 입력 신호의 스펙트럼-시간 표시의 선택된 부분에 대응한다. 지각적으로 무관한 정보의 폐기는 상기 방법이 인코딩된 데이터 내에 더 큰 정도의 데이터 압축을 제공할 수 있게 한다.

바람직하게, 상기 방법의 단계 (b)에서, 제 2 파라미터(α;IID,ρ)는 잔여 신호(s)의 크기 또는 에너지를 최소화함으로써 도출된다. 이러한 접근 방식은 파라미터를 도출하는 대안적인 접근 방식에 비해 제 2 파라미터를 생성하기 위해 계산적으로 효율적이다.

바람직하게, 상기 방법에서, 제 2 파라미터(α;IID,ρ)는 인터-채널 강도 차이 파라미터 및 연접성 파라미터(IID,ρ)의 방법에 의해 표시된다. 이러한 방법의 구현은 기존 파라미터 스테레오 인코딩 및 관련 디코딩 하드웨어 또는 소프트웨어와의 후방 호환성을 제공할 수 있다.

바람직하게, 상기 방법의 단계 (c) 및 (d)에서, 인코딩된 데이터는 중요한 층 내에 배열되며, 상기 층들은 주요 신호(m)를 전달하는 기본층을 포함하며, 제 1 강화층은 스테레오 전달 파라미터에 대응하는 제 1 및/또는 제 2 파라미터를 포함하며, 제 2 강화층은 잔여 신호(s)의 표시를 전달한다. 더 구체적으로, 제 2 강화층은 잔여 신호(s)의 가장 관련된 시간-주파수 정보를 전달하는 제 1 하위-층 및 잔여 신호(s)의 덜 관련된 시간-주파수 정보를 전달하는 제 2 하위-층으로 더 하위 분할된다. 이들 층에 의한 입력 신호, 그리고 필요한 경우 하위-층의 표시는 인코딩된 데이터의 전송 오류에 대한 강건함을 향상시키며 더 단순한 디코딩 하드웨어와의 후방 호환성을 제공할 수 있다.

본 발명의 제 2 양상에 따라, 대응하는 인코딩된 데이터를 생성하기 위한 복수의 입력 신호(l,r)를 인코딩하기 위한 인코더가 제공되며, 상기 인코더는:

(a) 신호(l,r) 사이의 상대적 위상차 및 시간 차 중 적어도 하나를 설명하는 제 1 파라미터(

)를 결정하기 위해 입력 신호(l,r)를 처리하기 위한 제 1 처리 수단으로서, 상기 제 1 처리 수단은 대응하는 중간 신호를 생성하도록 입력 신호를 처리하기 위해 이들 제 1 파라미터(

)를 적용하기 위해 작동하는, 제 1 처리 수단;

(b) 주요 신호(m) 및 잔여 신호(s)를 생성하는데 필요한 중간 신호의 회전을 설명하는 제 2 파라미터를 결정하기 위해 중간 신호를 처리하는 제 2 처리 수단으로서, 상기 주요 신호(m)는 잔여 신호(s)보다 더 큰 크기 또는 에너지를 가지며, 상기 제 2 처리 수단은 적어도 주요 신호(m)와 잔여 신호(s)를 생성하도록 중간 신호를 처리하기 위해 이들 제 2 파라미터를 적용하도록 작동하는, 제 2 처리 수단

(c) 대응하는 양자화된 데이터를 생성하기 위해, 제 1 파라미터(

), 제 2 파라미터(α;IID,ρ) 및 주요 신호(m)와 잔여 신호(s)의 적어도 일부를 양자화하기 위한 양자화 수단; 및

(d) 인코딩된 데이터를 생성하기 위해 상기 양자화된 데이터를 멀티플렉싱하기 위한 멀티플렉싱 수단

을 포함한다.

상기 인코더는 데이터의 더욱 효율적인 인코딩을 제공할 수 있다는 점에서 유리하다.

바람직하게, 인코더는 잔연 신호(s) 내에 존재하는 지각적으로 무관한 시간-주파수 정보를 폐기함으로써 잔여 신호(s)를 조작하는 처리 수단을 포함하며, 상기 변화된 잔여 신호(s)는 인코딩된 데이터(100)에 기여하며 상기 지각적으로 무관한 정보는 입력 신호의 스펙트럼-시간 표시의 선택된 부분에 대응한다. 지각적으로 무관한 정보의 폐기는 인코더가 인코딩된 데이터로 더 큰 정도의 데이터 압축을 제공하는 것을 가능케 한다.

본 발명의 제 3 양상에 따라, 복수의 입력 신호(l',r')의 대응하는 표시를 재생성하기 위한 인코딩된 데이터를 디코딩하는 방법이 제공되며, 상기 입력 신호(l,r)는 상기 인코딩된 데이터를 생성하기 위해 이전에 인코딩되며, 상기 방법은:

(a) 대응하는 양자화된 데이터를 생성하기 위해 인코딩된 데이터를 디먹스하는 단계;

(b) 대응하는 제 1 파라미터(

), 제 2 파라미터 및 적어도 주요 신호(m) 및 잔여 신호(s)를 생성하기 위해 양자화된 데이터를 처리하는 단계, 상기 주요 신호(m)는 잔여 신호(s)보다 더 큰 크기 또는 에너지를 갖는, 양자화된 데이터를 처리하는 단계;

(c) 대응하는 중간 신호를 생성하기 위해 제 2 파라미터를 적용함으로써 주요 신호(m)와 잔여 신호(s)를 회전시키는 단계; 및

(d) 상기 입력 신호(l',r')의 상기 표시를 재생성하기 위해 제 1 파라미터(

)를 적용시킴으로써 중간 신호를 처리하는 단계로서, 제 1 파라미터(

)는 신호(l,r) 사이의 상대적 위상차와 시간차 중 적어도 하나를 설명하는, 중간 신호를 처리하는 단계

를 포함한다.

상기 방법은 본 발명의 제 1 양상에 따른 방법을 사용하여 효율적으로 코딩되었던 데이터를 효율적으로 디코딩할 수 있는 이점을 제공한다.

바람직하게, 상기 방법의 단계 (b)는 주요 신호(m)로부터 유도된 합성 잔여 신호로 잔여 신호(s)의 사라진 시간-주파수 정보를 적절히 보충하는 추가적 단계를 포함한다. 합성 신호의 생성은 인코딩된 데이터의 효율적인 디코딩을 초래할 수 있다.

바람직하게, 상기 방법에서, 인코딩된 데이터는 잔여 신호(s)의 어떤 부분이 인코딩된 데이터로 인코딩되었음을 나타내는 파라미터를 포함한다. 이러한 표시 파라미터의 포함은 효율적이며 더 적은 계산상의 요구를 위한 디코딩을 제공할 수 있다.

본 발명의 제 4 양상에 따라, 복수의 입력 신호(l',r')의 대응하는 표시를 재생성하기 위해 인코딩된 데이터를 디코딩하기 위한 디코더가 제공되며, 상기 입력 신호(l,r)는 인코딩된 데이터를 생성하기 위해 이전에 인코딩되며, 상기 디코더는:

(a) 대응하는 양자화된 데이터를 생성하기 위해 인코딩된 데이터를 디먹스하기 위한 디먹스 수단;

(b) 대응하는 제 1 파라미터(

), 제 2 파라미터, 및 적어도 하나의 주요 신호(m) 및 잔여 신호(s)를 생성하기 위해 상기 양자화된 데이터를 처리하는 제 1 처리 수단으로서, 상기 주요 신호(m)는 잔여 신호(s)보다 큰 크기 또는 에너지를 가지는, 제 1 처리 수단;

(c) 대응하는 중간 신호를 생성하기 위해 제 2 파라미터를 적용함으로써 주요 신호(m)와 잔여 신호(s)를 회전시키기 위한 제 2 처리 수단; 및

(d) 입력 신호(l,s)의 상기 표시를 재생성하기 위해 제 1 파라미터(

)를 적용함으로써 중간 신호를 처리하는 제 3 처리 수단으로서, 상기 제 1 파라미터(

)는 신호(l,r) 사이의 상대 위상차와 시간차 중 적어도 하나를 설명하는, 제 3 처리 수단

을 포함한다.

바람직하게, 상기 제 2 처리 수단은 상기 디코딩된 잔여 신호로부터 없어진 정보를 제공하기 위해 디코딩된 주요 신호(m)로부터 유도된 보충 합성 신호를 생성하도록 작동한다.

본 발명의 제 5 양상에 따라, 본 발명의 제 1 양상의 방법에 따라 생성된 인코딩된 데이터가 제공되며, 상기 데이터는 데이터 캐리어 상에 기록되고 통신 네트워크를 통해 통신가능한 것 중 적어도 하나이다.

본 발명의 제 6 양상에 따라, 계산 하드웨어 상에서 본 발명의 제 1 양상의 방법을 실행하는 소프트웨어가 제공된다.

본 발명의 제 7 양상에 따라, 계산 하드웨어 상에서 본 발명의 제 3 양상의 방법을 실행하는 소프트웨어가 제공된다.

본 발명의 제 8 양상에 따라, 데이터 캐리어 상에 기록되고 통신 네트워크를 통해 통신가능한 것 중 적어도 하나인 인코딩된 데이터가 제공되며, 상기 데이터는 양자화된 제 1 파라미터, 양자화된 제 2 파라미터 및 주요 신호(m) 및 잔여 신호(s)의 적어도 일부에 대응하는 양자화된 데이터를 포함하며, 상기 주요 신호(m)는 잔여 신호(s)보다 큰 크기 또는 에너지를 가지며, 상기 주요 신호(m) 및 상기 잔여 신호(s)는 상기 제 2 파라미터에 따라 중간 신호를 회전시킴으로써 유도가능하며, 상기 중간 신호는 제 1 파라미터로 설명된 것처럼 상대 위상 및/또는 그 사이의 시간 지연을 보상하기 위해 복수의 입력 신호를 처리함으로써 생성된다.

본 발명의 특성은 첨부한 청구항에서 정의된 것처럼 본 발명의 범위를 이탈하지 않고 임의의 결합으로 결합될 수 있다는 것을 이해할 것이다.

본 발명의 실시예들은 이제, 다음 도면을 참조로, 단지 예로써 설명될 것이다.

도 1은 상대적 상호 시간 및 위상 지연에 관한 신호(l[n],r[n])에 대한 샘플 시퀀스의 예시를 도시한 도면.

도 2는 대응하는 합계 및 차이 신호(m[n],s[n])를 생성하기 위해 도 1의 신호에 적용된 수학식 1 및 수학식 2에 따른 종래의 M/S 변환의 인가의 예시를 도시한 도면.

도 3은 대응하는 주요 신호(m[n]) 및 잔여 신호(s[n])를 생성하기 위해 도 1의 신호에 적용된 수학식 4에 따른 회전 변환의 인가의 예시를 도시한 도면.

도 4는 대응하는 주요 신호(m[n]) 및 잔여 신호(s[n])를 생성하기 위해 수학식 5 내지 수학식 15에 따른 본 발명에 따른 복합 회전 변환의 인가의 예시로서, 잔여 신호가 상대적 상호 위상 및 시간 지연을 구비한 도 1의 신호에도 불구하고 비교적 작은 진폭인, 본 발명에 따른 복합 회전 변환의 인가의 예시를 도시한 도면.

도 5는 본 발명에 따른 인코더의 개략도.

도 6은 디코더가 도 5의 인코더와 호환가능한, 본 발명에 따른 디코더의 개략도.

도 7은 파라미터 스테레오 디코더의 개략도.

도 8은 본 발명에 따른 강화된 파라미터 스테레오 인코더의 개략도.

도 9는 디코더가 도 9의 인코더와 호환가능한, 본 발명에 따른 강화된 파라미터 스테레오 디코더의 개략도.

개요에서, 본 발명은 가변 회전각을 채용하는 앞서 설명된 M/S 코딩 방법에 대한 진보를 나타내는 데이터 코딩 방법에 관한 것이다. 상기 방법은 상당한 위상 및/또는 시간 오프셋에 관한 신호의 그룹에 대응하는 더 나은 데이터 코딩이 가능한 발명자가 고안한 것이다. 게다가, 본 방법은 신호(l[n],r[n])가 그들의 등가 복합-값 주파수 도메인 표시(l[k],r[k]) 각각에 의해 표시될 때 사용될 수 있는 회전 각(α)에 대한 값을 채용함으로써 종래의 코딩 기술에 비해 이점을 제공한다.

각(α)은 이들 신호 간에 상호 시간적 및/또는 위상 지연을 수용하기 위해 l[n],r[n] 신호를 상호 "결합"하기 위해 적용된 실제-값 및 실제-값 위상 회전이 되도록 배열될 수 있다. 그러나, 회전각(α)에 대한 복합값의 사용은 본 발명의 구현을 더 용이하게 한다. 각(α) 만큼의 회전을 구현하기 위한 대안적인 접근 방식은 본 발명의 범위 내에 있는 것으로 해석될 것이다.

전술한 시간-도메인 신호(l[n],r[n])의 주파수-도메인 표시는 윈도우화된(windowed) 신호(l_q[n],r_q[n])를 제공하기 위해 수학식 5와 수학식 6으로 설명된 것처럼 시간 윈도우화 절차를 적용하여 유도되는 것이 바람직하다.

여기서,

q= 연속적인 신호 프레임을 나타내기 위해 q=0,1,2,..가 되도록 하는 프레임 지수;

H= 홉(hop)-크기 또는 업데이트-크기; 및

n= 파라미터(L)가 윈도우(h[n])의 길이에 상응하는 0 내지 L-1의 범위 내의 값을 갖는 시간 지수.

윈도우화된 신호(l_q[n],r_q[n])는 수학식 7과 수학식 8에 설명된 것처럼, 이산 푸리에 변환(DFT) 또는 기능적으로 등가인 변환을 사용함으로써, 주파수 영역으로 변환가능하다.

파라미터 N은 N≥L이 되도록 하는 DFT 길이를 나타낸다. 실제 값 시퀀스의 DFT가 대칭적이므로, 오직 첫 번째 N/2+1 지점만이 변환 이후에 보전된다. DFT를 구현할 때 신호 에너지를 보전하기 위해, 수학식 9와 수학식 10에서 설명된 것처럼 다음 스케일링은 바람직하게 채용된다.

본 발명의 방법은 수학식 7과 수학식 8에서의 주파수 영역 신호 표시(l[k],r[k])를 주파수 영역 내의 대응하는 회전된 합계와 차이 신호(m''[k],s''[k])로 변환하기 위해 수학식 11로 표현된 것처럼 신호 처리 연산을 수행한다.

여기서

실제-값 가변 회전각;

관련 경계에 대해 신호의 연속을 최대화하는데 사용된 공통각; 및

오른쪽 신호(r[k])를 위상-회전함으로써 잔여 신호(s"[k])의 에너지를 최소화하는데 사용된 각.

각(

)의 사용은 선택적이다. 게다가, 수학식 11에 따른 회전은 프레임 단위로, 즉 프레임 단계에서 동적으로 실행되는 것이 바람직하다. 그러나, 프레임에서 프레임으로의 회전의 이러한 동적 변화는 각(

)의 적절한 선택에 의해 적어도 부분적으로 제거될 수 있는 합계 신호(m"[k]) 내의 신호 불연속성을 잠재적으로 야기시킬 수 있다.

게다가, 수학식 11의 주파수 범위(k=0...N/2+1)는 하위-범위, 즉 영역으로 분할되는 것이 바람직하다. 인코딩동안의 각 영역에 대해, 대응 각 파라미터(

,

및

)는 이후 독립적으로 결정되며, 코딩된 후 전송되거나 그렇지 않으면 다음 디코딩을 위해 디코더로 전송된다. 하위 분할될 주파수 범위에 대해 배열함으로써, 신호 속성은 더 높은 압축 비율을 잠재적으로 초래하는 인코딩동안에 캡쳐되는 것 이 더 나을 수 있다.

수학식 7 내지 수학식 11에 따라 맵핑을 구현한 후, 신호(m"[k],s"[k])는 수학식 12 및 수학식 13에 설명된 것처럼 역 이산 푸리에 변환이 수행된다.

여기서

주요 시간-도메인 표시; 및

잔여(차이) 시간-도메인 표시.

주요 및 잔여 표시는 이러한 방법으로 이후 수학식 14 및 수학식 15로 설명된 것처럼 연산 처리에 의해 제공된 것처럼 중복이 적용된 윈도우화를 기초로 표시로 변환된다.

대안적으로, 수학식 5 내지 수학식 15로 설명된 것처럼 본 발명의 방법의 처 리 연산은, 적어도 부분적으로 복합-변조된 필터 뱅크를 채용함으로써 실제로 구현될 수 있다. 컴퓨터 처리 하드웨어에 적용된 디지털 처리는 본 발명을 구현하기 위해 채용될 수 있다.

본 발명의 방법을 설명하기 위해, 본 발명의 신호 처리 예는 이제 설명될 것이다. 이러한 예로써, 2개의 시간 신호는 상기 방법을 사용하여 처리될 초기 신호로서 사용되며, 상기 2개의 신호는 수학식 16 및 수학식 17에 의해 정의된다.

,

및

는 단위 분산(unity variance)의 상호 독립적인 흰색 잡음 시퀀스이다. 본 발명의 방법의 연산을 더 잘 이해하기 위해, 수학식 16과 수학식 17로 설명된 신호(l[n],r[n])의 부분들은 도 1로 도시된다.

도 2에서, M/S 변환 신호(m[n] 및 s[n])는 도시되며, 이들 변환 신호는 수학식 1과 수학식 2에 따라 종래의 처리에 의한 수학식 16과 수학식 17의 신호(l[n],r[n])로부터 유도된다. 수학식 16 및 수학식 17의 신호로부터 신호(m[n] 및 s[n])를 생성하기 위한 이러한 종래의 접근 방식은 수학식 17에서 입력 신호(r[n])의 에너지보다 더 큰 잔여 신호(s[n])의 에너지를 초래한다는 것을 도 2로부터 알 수 있다. 명백히, 수학식 16과 수학식 17의 신호에 인가된 종래의 M/S 변 환 신호 처리는 신호(s[n])가 미미한 크기가 아니므로 신호 압축을 초래한다는 점에서 효과적이지 않다.

수학식 4로 설명된 것과 같은 회전 변환을 채용함으로써, 예시적인 신호(l[n],r[n])가 도 3에 도시된 것과 같이 대응 잔여 신호(s[n]) 내의 잔여 에너지를 감소시키고 이에 따라 주요 신호(m[n])를 향상시키는 것이 가능하다. 수학식 4의 회전 접근 방식이 도 2에 제공된 것처럼 종래의 M/S 처리보다 더 나은 수행이 가능하다고 해도, 발명자는 신호(l[n],r[n])가 상대 상호 위상 및/또는 시간 시프트를 따를 때 만족스럽지 못한 것을 알게 되었다.

수학식 16 및 수학식 17의 샘플 신호(l[n],r[n])가 주파수 도메인의 변환을 받을 때, 이후 수학식 5 내지 15에 따른 복합 최적화 회전에 따라서, 도 4에 도시된 것과 같은 비교적 작은 크기로 잔여 신호(s[n])의 에너지를 감소시킬 수 있다.

수학식 5 내지 수학식 15로 설명된 것과 같은 신호 처리를 구현하도록 작동하는 인코더 하드웨어의 실시예는 다음에 설명될 것이다.

도 5에서, 일반적으로 10으로 표시된 본 발명에 따른 인코더가 개시된다. 인코더(10)는 왼쪽(l)과 오른쪽(r) 보충 입력 신호를 수신하고 인코딩된 비트-스트림(bs)(100)을 생성하기 위해 이들 신호들을 인코딩하도록 작동한다. 게다가, 인코더(10)는 위상 회전 유닛(20), 신호 회전 유닛(30), 시간/주파수 선택기(40), 제 1 코더(50), 제 2 코더(60), 파라미터 양자화 처리 유닛(Q)(70) 및 비트-스트림 멀티플렉서 유닛(80)을 포함한다.

입력 신호(l,r)는 대응 출력이 신호 회전 유닛(30)에 연결된 위상 회전 유 닛(20)의 입력에 연결된다. 신호 회전 유닛(30)의 주요 및 잔여 신호는 m, s 각각으로 표시된다. 주요 신호(m)는 제 1 코더(50)를 통해 멀티플렉서 유닛(80)으로 전송된다. 게다가, 잔여 신호(s)는 시간/주파수 선택기(40)를 통해 제 2 코더(60)로 이후에는 멀티플렉서 유닛(80)으로 연결된다. 위상 회전 유닛(20)으로부터의 각 파라미터 출력(

,

)은 처리 유닛(70)을 통해 멀티플렉서 유닛(80)으로 연결된다. 추가적으로, 각 파라미터 출력(

)은 신호 회전 유닛(30)으로부터 처리 유닛(70)을 통해 멀티플렉서 유닛(80)으로 연결된다. 멀티플렉서 유닛(80)은 전술한 인코딩된 비트 스트림 출력(bs)(100)을 포함한다.

연산 중에, 위상 회전 유닛(20)은 상대적 위상차를 보상하고 이에 따라 파라미터(

,

)를 생성하기 위해 신호(l,r)를 처리하며 파라미터(

)는 이러한 상대적 위상차를 나타내며, 파라미터(

)는 양자화를 위해 처리 유닛(70)으로 전송되며 이에 따라 대응 파라미터 데이터로서 인코딩된 비트 스트림(100)에 포함시킨다. 상대적 위상차에 대해 보상된 신호(l,r)는 주요 신호(m) 내의 신호 에너지의 최대량 및 잔여 신호(s) 내의 신호 에너지의 최소량을 집중시키기 위해 각(

)에 대한 최적화된 값을 결정하는 신호 회전 유닛(30)으로 전달된다. 주요 및 잔여 신호(m,s)는 이후 비트 스트림(100)으로 포함시키기 위해 적절한 형식으로 변환되기 위해 코더(50,60)를 통해 전달된다. 처리 유닛(70)은 각 신호(

)를 수신하고 비트-스트림 출력(bs)(100)을 생성하기 위해 코더(50,60)로부터의 출력과 함께 이들을 멀티플렉스한다. 따라서, 비트-스트림(bs)(100)은 이에 따라 각 파라미터 데 이터(

)와 함께 주요 및 잔여 신호(m,s)의 표시를 포함하는 데이터 스트림을 포함하며, 파라미터(

)는 필수적이며 파라미터(

)는 선택적이지만 포함시키는 것이 유익하다.

코더(50,60)는 2개의 모노 오디오 인코더 또는 대안적으로 하나의 이중 모노 인코더로서 구현되는 것이 바람직하다. 선택적으로, 예를 들어, 시간-주파수 평면으로 표시될 때 확인되었지만, 지각가능하게 비트 스트림(100)에 기여하지 않는 잔여 신호(s)의 특정 부분은 시간/주파수 선택기(40)에서 폐기될 수 있으며, 이에 따라 이하 더 자세히 설명되는 것처럼 측정가능한 데이터 압축을 제공한다.

인코더(10)는 입력 신호를 포함하는 전체 주파수 범위의 일부에 대해 입력 신호(l,r)를 처리하는데 사용될 수 있다. 인코더(10)로 인코딩되지 않은 입력 신호(l,r)의 이들 부분은 이후 예를 들어 앞서 설명한 것과 같은 종래의 M/S 코딩을 사용하는 것처럼, 다른 방법을 사용하여 병렬로 인코딩된다. 필요한 경우 왼쪽(l) 및 오른쪽(r) 입력 신호의 개별 인코딩은 구현될 수 있다.

인코더(10)는 예를 들어, 맞춤형 집적 회로 또는 이러한 회로의 그룹으로서, 하드웨어로 구현될 수 있다. 대안적으로, 인코더(10)는, 예를 들어 독점적 소프트웨어-구동 신호 처리 집적 회로 또는 이러한 회로의 그룹과 같은, 계산 하드웨어 상에서 실행하는 소프트웨어로 구현될 수 있다.

도 6에서, 인코더(10)와 호환가능한 디코더는 일반적으로 200으로 표시된다. 디코더(200)는 비트-스트림 디먹스(210), 제 1 및 제 2 디코더(220,230), 파라미터 의 역양자화하기 위한 처리 유닛(240), 신호 회전 디코더 유닛(250) 및 입력 신호(l,r) 입력에 대응하는 디코딩된 출력(l',r')을 인코더(10)에 제공하는 위상 회전 디코딩 유닛(260)을 포함한다. 디먹스(210)는 예를 들어 CD 또는 DVD와 같은 광디스크 데이터 캐리어와 같은 데이터 캐리어에 의해 및/또는 인터넷과 같은, 통신 네트워크를 통해, 인코더(10)로부터 디코더(200)로 전송되는 것처럼, 인코더(10)에 의해 생성된 것처럼 비트-스트림(bs)(100)을 수신하기 위해 구성된다. 디먹스(210)의 디먹스된 출력은 디코더(220,230)의 입력 및 처리 유닛(240)으로 연결된다. 제 1 및 제 2 디코더(220,230)는 회전 디코더 유닛(250)에 연결된 주요 및 잔여 디코딩된 출력(m',s') 각각을 포함한다. 게다가, 처리 유닛(240)은 회전 디코더 유닛(250)에 또한 연결된 회전 각 출력(

)을 포함하며; 각(

)은 인코더(10)에 대해 전술한 각(

)의 디코딩된 버전에 해당한다. 각 출력(

)은 인코더(10)에 대해 전술한 각(

)의 디코딩된 버전에 해당하며; 이들 각 출력(

)은 회전 디코더 유닛(250)에서 도시된 것처럼 디코딩된 출력(l',r')을 포함하는 위상 회전 디코딩 유닛(260)으로 디코딩된 주요 및 잔여 신호 출력과 함께 전송된다.

연산 중에, 디코더(200)는 인코더(10) 내에서 실행된 인코딩 단계를 역으로 실행한다. 따라서, 디코더(200)에서, 비트-스트림(100)은 디코딩된 주요 및 잔여 신호(m',s')를 생성하기 위해 디코더(220,230)에 의해 재구성된 주요 및 잔여 신호에 대응하는 데이터를 고립시키기 위해 디먹스(210)에서 디먹스한다. 이들 신호(m',s')는 이후 각(

)에 따라 회전된 다음 왼쪽 및 오른쪽 신호(l',r')를 재생 성하기 위해 각(

)을 사용하여 상대적 위상에 대해 정정된다. 각(

)은 디먹스(210)에서 디먹스된 파라미터로부터 재생성되며 처리 유닛(240) 내에 고립된다.

인코더(10)에서, 그리고 또한 디코더(200)에서, 전술한 각(

)보다는 비트-스트림(100)에서 IID 값 및 연접 값(

)을 전송하는 것이 바람직하다. IID 값은 인터-채널 차이를 나타내도록, 즉 왼쪽 및 오른쪽 신호(l,r) 사이의 주파수 및 시간 가변 크기를 표시하기 위해 배열된다. 연접 값(

)은 주파수 가변 연접성, 즉 위상 동기화 이후의 왼쪽과 오른쪽 신호(l,r) 사이의 유사성을 표시한다. 그러나, 예를 들어 디코더(200)에서, 각(

)은 수학식 18을 응용함으로써 IID와

값으로부터 즉시 유도될 수 있다.

파라미터 디코더는 도 7에서 일반적으로 400으로 표시되며, 이 디코더(400)는 본 발명에 따른 인코더에 대해 보충적이다. 디코더(400)는 비트-스트림 디먹스(410), 디코더(420), 상관해제 유닛(430), 스케일링 유닛(440), 신호 회전 유닛(450), 위상 회전 유닛(460) 및 역양자화 유닛(470)을 포함한다. 디먹스(410)는 비트-스트림 신호(bs)(100)를 수신하기 위한 입력 및 신호(m,s) 데이터, 각도 파라미터 데이터, IID 데이터 및 연접 데이터(

)에 대한 4개의 대응 출력을 포함하며, 이들 출력은 도시된 것처럼 디코더(420)와 역양자화 유닛(470)에 연결된다. 디코더(420)로부터의 출력은 스케일링 함수(440)에 대한 입력을 위한 잔여 신호(s')의 표시를 재생성하기 위해 상관 해제 유닛(430)을 통해 연결된다. 게다가, 주요 신호(m')의 재생성된 표시는 디코더 유닛(420)으로부터 스케일링 유닛(440)으로 전송된다. 스케일링 유닛(440)은 또한 역양자화 유닛(470)으로부터 IID'와 연접 데이터(

)가 제공된다. 스케일링 유닛(440)으로부터의 출력은 중간 출력 신호를 생성하기 위해 신호 회전 유닛(450)에 연결된다. 이들 중간 출력 신호들은 이후 왼쪽 및 오른쪽 신호(l',r') 표현을 재생성하기 위해 역양자화 유닛(470)으로 디코딩된 각(

)을 사용하여 위상 회전 유닛(460)에서 정정된다.

디코더(400)는 상관 해제 유닛(430) 내에 실행된 상관 해제 처리에 의해 주요 신호(m')에 기초하여 잔여 신호(s')를 평가하기 위한 상관 해제 유닛(430)을 포함한다는 점에서 도 6의 디코더(200)와 구별된다. 게다가, 왼쪽 및 오른쪽 출력 신호(l',r') 사이의 연접 양은 스케일링 연산에 의해 결정된다. 스케일링 연산은 스케일링 유닛(440) 내에서 실행되며 주요 신호(m')와 잔여 신호(s') 사이의 비율에 관한 것이다.

다음으로 도 8을 참조하면, 일반적으로 500으로 표시된 강화된 인코더가 도시된다. 인코더(500)는 왼쪽 및 오른쪽 입력 신호(l,r) 각각을 수신하기 위한 위상 회전 유닛(510), 신호 회전 유닛(520), 시간/주파수 선택기(530), 각각의 제 1 및 제 2 코더(540,550), 양자화 유닛(560) 및 비트-스트림 출력(bs)(100)을 포함하는 멀티플렉서(570)를 포함한다. 위상 회전 유닛(510)으로부터의 각 출력(

)은 위상 회전 유닛(510)으로부터 양자화 유닛(560)으로 연결된다. 게다가, 위상 회전 유닛(510)으로부터의 위상-정정된 출력은 IID와 연접(

) 데이터/파라미터뿐만 아니라, 주요 및 잔여 신호(m,s) 각각을 생성하기 위해 신호 회전 유닛(520)과 시간/주파수 선택기(530)를 통해 연결된다. IID 및 연접(

) 데이터/파라미터는 양자화 유닛(560)에 연결되는 반면, 주요 및 잔여 신호 m,s는 멀티플렉스(570)에 대한 대응 데이터를 생성하기 위해 제 1 및 제 2 디코더(540,550)를 통해 전송된다. 멀티플렉스(570)는 또한 각(

), 연접(

) 및 IID를 설명하는 파라미터 데이터를 수신하기 위해 배열된다. 멀티플렉서(570)는 비트-스트림(bs)(100)을 생성하기 위해 코더(540,550)와 양자화 유닛(560)으로부터 데이터를 멀티플렉싱하도록 작동한다.

인코더(500)에서, 잔여 신호는 비트-스트림(100)으로 직접 인코딩된다. 선택적으로, 시간/주파수 선택기 유닛(530)은 잔여 신호(s)의 시간/주파수 평면의 어떤 부분이 비트-스트림(bs)(100)으로 인코딩될지를 결정하며, 유닛(530)은 이에 따라 잔여 정보가 비트-스트림(100)에 포함되는 정도를 결정하며, 따라서 인코더(500) 내에서 달성가능한 압축과 비트-스트림(100) 내에 포함된 정보의 정도 사이의 타협에 영향을 준다.

도 9에서, 강화된 파라미터 디코더는 일반적으로 600으로 표시되며, 디코더(600)는 도 8에 도시된 인코더(500)에 대해 보충적이다. 디코더(600)는 디먹스 유닛(610), 각각의 제 1 및 제 2 디코더(620,640), 상관 해제 유닛(630), 결합기 유닛(650), 스케일링 유닛(660), 신호 회전 유닛(670), 위상 회전 유닛(680) 및 역양자화 유닛(690)을 포함한다. 디먹스 유닛(610)은 인코딩된 비트-스트림(bs)(100)을 수신하고 대응하는 디먹스된 출력을 제 1 및 제 2 디코더(620,640) 및 또한 디먹스 유닛(690)에 제공하기 위해 연결된다. 상관 해제 유닛(630)과 결합기 유닛(650)과 관련된 디코더(620,640)는 주요 및 잔여 신호(m',s') 각각의 표시를 재생성하기 위해 작동한다. 이들 표시는 왼쪽 및 오른쪽 신호(l',r')의 표시를 재생성하기 위해 역양자화 유닛(690)에 의해 생성된 각도 파라미터에 응답하여 회전 유닛(680)에서 위상 회전된 중간 신호를 생성하기 위해 신호 회전 유닛(670)의 회전이 후속되는 스케일링 유닛(660)의 스케일링 처리를 받는다.

디코더(600)에서, 비트-스트림(100)은 주요 신호(m')에 대해, 잔여 신호(s')에 대해 그리고 스테레오 파라미터에 대해, 분리된 스트림으로 디먹스된다. 주요 및 잔여 신호(m',s')는 이후 디코더(620,640) 각각에 의해 디코딩된다. 비트-스트림(100)으로 인코딩되었던 잔여 신호(s')의 스펙트럼/시간부분은 묵시적으로, 즉 시간-주파수 평면 내의 "빈" 영역을 검출함으로써, 또는 명시적으로, 즉, 비트 스트림(100)으로부터 디코딩된 대표적인 시그널링 파라미터에 의해 비트-스트림(100)으로 전송된다. 상관 해제 유닛(630) 및 결합기 유닛(650)은 디코딩된 잔여 신호(s') 내의 빈 시간-주파수 영역을 합성 잔여 신호로 효과적으로 채우도록 작동한다. 이러한 합성 신호는 상관 해제 유닛(630)으로부터 출력과 디코딩된 주요 신호(m')를 사용함으로써 생성된다. 모든 다른 시간-주파수 영역에 대해, 잔여 신호(s)는 디코딩된 잔여 신호(s')를 구성하기 위해 인가되며; 이들 영역에 대해, 어 떠한 스케일링도 스케일링 유닛(660) 내에 인가되지 않는다. 선택적으로, 이들 영역에 대해, IID 대신에 인코더(500) 내에 전술한 각도(

)를 전송하는 것이 유익하며, 단일 각 파라미터(

)를 전송하는데 필요한 데이터 비율로서 연접(

) 데이터는 등가의 IID 및 연접(

) 파라미터 데이터를 전송하는데 필요한 것보다 작다. 그러나, IID 및

파라미터 데이터 대신에 비트 스트림(100) 내의 각도(

) 파라미터의 전송은 이러한 IID 및 연접(

) 데이터를 이용하는 일반적인 종래의 파라미터 스테레오(PS) 시스템과 비-후방 호환적인 인코더(500) 및 디코더(600)를 제공한다.

인코더(10,500)의 선택기 유닛(40,530) 각각은 잔여 신호(s)의 어떤 시간-주파수 영역이 비트-스트림(100)으로 인코딩되어야 하는지를 선택할 때 지각 모델을 채용하기 위해 배열되는 것이 바람직하다. 인코더(10,500) 내에 잔여 신호(s)의 다양한 시간-주파수 양상을 코딩함으로써, 이에 따라 비트-율 측정가능한 인코더 및 디코더를 달성하는 것이 가능하다. 비트-스트림(100) 내의 층들이 상호 의존적일 때, 지각적으로 가장 관련된 시간-주파수 양상들에 대응하는 코딩된 데이터는 층들에 포함된 기본층에 포함되며, 지각적으로 덜 중요한 데이터는 층들에 포함된 정밀 또는 강화층으로 이동되며; "강화층"은 또한 "정밀층"이라고도 한다. 이러한 배열에서, 기본층은 바람직하게 주요 신호(m)에 대응하는 비트 스트림을 포함하며, 제 1 강화층은 전술한 각도(

)와 같은 스테레오 파라미터에 대응하는 비트 스트림을 포함하며, 제 2 강화층은 잔여 신호(s)에 대응하는 비트 스트림을 포함한다.

비트-스트림 데이터(100) 내의 이러한 층 배열은 선택적으로 손실되거나 폐 기될 잔여 신호를 전송하는 제 2 강화층을 허용하며; 게다가, 도 10에 도시된 디코더(600)는 사용자의 이해를 위해 지각적으로 의미있는 잔여 신호를 재생성하기 위해 앞서 설명한 것과 같은 합성 잔여 신호와 디코딩된 잔여층을 결합할 수 있다. 게다가, 디코더(600)에, 예를 들어 비용 및/또는 복잡성 제한으로 인해, 제 2 디코더(640)가 선택적으로 제공되지 않은 경우, 비록 감소된 품질이지만 잔여 신호(s)를 디코딩하는 것이 여전히 가능하다.

게다가, 전술한 내용에서 비트 스트림(bs)(100) 내의 비트율 감소는 인코딩된 각도 파라미터(

)를 폐기함으로써 가능하다. 이러한 상황에서, 디코더(600) 내의 위상 회전 유닛(680)은 예컨대 0의 값과 같은, 고정된 값의 기본 회전 각을 사용하여 재생성된 출력 신호(l',r')를 재구성하며; 이러한 추가적인 비트율 감소는 더 높은 오디오 주파수에서 사람의 청각 체계가 상대적으로 위상이 민감하지 못한 특성을 이용한다. 일례로서, 파라미터(

)는 비트 스트림(bs)(100)으로 전송되며 파라미터(

)는 비트율 감소를 달성하기 위해 이로부터 폐기된다.

앞서 설명된 본 발명에 따른 인코더 및 보충 디코더는 예를 들어, 인터넷 라디오, 인터넷 스트리밍, 전자 음악 분포(EMD), 반도체 오디오 플레이어 및 레코더 뿐만 아니라 일반적인 텔레비전 오디오 제품 중 적어도 하나에서와 같은, 전자 장치 및 시스템에서 광범위하게 잠재적으로 사용될 수 있다.

비트 스트림(100)을 생성하기 위해 입력 신호(l,r)를 인코딩하는 방법이 앞서 설명되었고, 비트 스트림(100)을 디코딩하는 보충적인 방법이 설명되었다고 해 도, 본 발명은 2개 이상의 입력 신호를 인코딩하기 위해 적응될 수 있다는 것을 이해할 것이다. 예컨대, 본 발명은 예컨대, 5-채널 가정용 영화 시스템과 같은, 복수-채널 오디오에 대한 데이터 인코딩 및 대응 디코딩을 제공하기 위해 적응될 수 있다.

첨부한 청구항에서, 괄호 안에 포함된 숫자와 다른 심벌들은 청구항의 이해를 돕기 위해 포함되었으며 어떠한 방법으로도 청구항의 범위를 제한하는 것으로 의도되지 않는다.

앞서 설명된 본 발명의 실시예들은 첨부한 청구항에 의해 정의된 것처럼 본 발명의 범위를 이탈하지 않고 변경될 수 있다는 것을 이해할 것이다.

"포함하다", "포괄하다", "결합하다", "함유하다", "이다" 및 "갖다"와 같은 표현은 상세한 설명 및 그 관련된 청구항을 해석할 때 배타적이지 않게 해석되어야 하며, 즉, 명시적으로 존재하는 것으로 정의되지 않은 다른 항목 또는 성분을 허용하도록 해석되어야 한다. 단수에 대한 참조는 또한 복수에 대한 참조로, 반대의 경우에는 역으로 해석되어야 한다.

본 발명은, 데이터 코딩 방법, 예를 들어, 데이터 성분의 가변 각도 회전을 이용한 오디오 및/또는 이미지 데이터 코딩 방법에 관한 것으로서, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 입력 신호를 인코딩하는 방법 등에 이용가능하다.

Claims

대응하는 인코딩된 데이터(100)를 생성하기 위해 복수의 오디오 입력 신호(l,r)를 인코딩하는 방법으로서,

(a) 오디오 입력 신호(l,r) 사이의 관련 위상차 및 시간차 중 적어도 하나를 설명하는 제 1 파라미터(
)를 결정하기 위해 상기 오디오 입력 신호(l,r)를 처리하는 단계, 및 상기 오디오 입력 신호를 처리하여 대응하는 중간 신호를 생성하기 위해 이들 제 1 파라미터(
)를 적용하는 단계;

(b) 주신호(m)와 잔여 신호(s)를 생성하는데 필요한 중간 신호의 회전을 설명하는 제 2 파라미터를 결정하기 위해 중간 신호 및/또는 오디오 입력 신호(l,r)를 처리하는 단계로서, 상기 주신호(m)는 잔여 신호(s)보다 큰 크기 또는 에너지를 가지며, 주신호(m) 및 잔여 신호(s)를 생성하도록 중간 신호를 처리하기 위해 이들 제 2 파라미터를 적용하는 단계;

(c) 제 1 파라미터와, 제 2 파라미터를 양자화하는 단계 및 대응하는 양자화된 데이터를 생성하기 위해 주신호(m) 및 잔여 신호(s)의 적어도 일부를 인코딩하는 단계; 및

(d) 인코딩된 데이터(100)를 생성하기 위해 양자화된 데이터를 멀티플렉싱하는 단계

를 포함하는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
제 1항에 있어서, 잔여 신호(s)의 오직 일부만이 인코딩된 데이터(100) 내에 포함된, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
제 2항에 있어서, 인코딩된 데이터는 또한 잔여 신호의 일부가 인코딩된 데이터(100)에 포함된 것을 나타내는 하나 이상의 파라미터를 포함하는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
제 1항에 있어서, 단계 (a) 및 단계 (b)는 주파수 영역(l[k],r[k])으로 표시된 오디오 입력 신호(l[n],r[n])로 복소 회전(complex rotation)으로 구현된, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
제 4항에 있어서, 단계 (a) 및 단계 (b)는 오디오 입력 신호(l[n],r[n])의 하위-대역 상에서 독립적으로 수행되는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
제 5항에 있어서, 상기 방법에 의해 인코딩되지 않은 다른 하위-대역은 M/S(Mid/Side) 인코딩 기술을 사용하여 인코딩되는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
삭제
제 1항에 있어서, 단계 (b)에서 제 2 파라미터는 잔여 신호(s)의 크기 또는 에너지를 최소화함으로써 유도되는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
제 1항에 있어서, 제 2 파라미터는 채널간 강도 차이 파라미터와 연접성 파라미터(IID,ρ)에 의해 표시되는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
제 1항에 있어서, 상기 제 2 파라미터는 주요 신호(m)와 잔여 신호(s)의 에너지 비율 및 회전각(α)에 의해 표시되는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
제 1항에 있어서, 단계 (c) 및 (d)에서, 인코딩된 데이터는 중요한 층 내에 배열되며, 상기 층들은 주요 신호(m)를 전송하는 기본층과, 스테레오 전달 파라미터에 대응하는 제 1 및/또는 제 2 파라미터를 포함하는 제 1 개선층과 잔여 신호(s)의 표시를 전송하는 제 2 개선층을 포함하는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
삭제
대응하는 인코딩된 데이터(100)를 생성하기 위해 복수의 오디오 입력 신호(l,r)를 인코딩하기 위한 인코더(10;300;500)로서,

(a) 오디오 입력 신호(l,r) 사이의 관련 위상차와 시간차 중 적어도 하나를 설명하는 제 1 파라미터(
)를 결정하기 위해 오디오 입력 신호(l,r)를 처리하기 위한 제 1 처리 수단(20;310;510)으로서, 제 1 처리 수단(20;310;510)은 오디오 입력 신호를 처리하여 대응하는 중간 신호를 생성하기 위해 이들 제 1 파라미터(
)를 적용하도록 작동하는, 제 1 처리 수단;

(b) 주요 신호(m)와 잔여 신호(s)를 생성하는데 필요한 중간 신호의 회전을 설명하는 제 2 파라미터를 결정하기 위해 중간 신호 및/또는 오디오 입력 신호(l,r)를 처리하기 위한 제 2 처리 수단(30,40,50,60;320,340;520,530,540,550)으로서, 상기 주요 신호(m)는 잔여 신호(s)보다 더 큰 크기 또는 에너지를 구비하며, 제 2 처리 수단은 주요 신호(m)와 잔여 신호(s)를 생성하도록 중간 신호를 처리하기 위해 이들 제 2 파라미터를 적용하도록 작동하는, 제 2 처리 수단;

(c) 대응하는 양자화된 데이터를 생성하기 위해, 제 1 파라미터(
), 제 2 파라미터(α;IID,ρ), 주요 신호(m)와 잔여 신호(s)의 적어도 일부를 양자화하기 위한 양자화 수단(70;360;560); 및

(d) 인코딩된 데이터(100)를 생성하기 위해 양자화된 데이터를 멀티플렉싱하기 위한 멀티플렉싱 수단

을 포함하는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하기 위한 인코더.
삭제
제 13항에 있어서, 잔여 신호(s)는 인코딩된 데이터(100)로 조작되며 인코딩되며 멀티플렉싱되는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하기 위한 인코더.
복수의 오디오 입력 신호(l',r')의 대응하는 표시를 재생성하기 위해 인코딩 데이터(100)를 디코딩하는 방법으로서, 상기 오디오 입력 신호(l,r)는 상기 인코딩된 데이터(100)를 생성하기 위해 이전에 인코딩되며, 상기 방법은,

(a) 대응하는 양자화된 데이터를 생성하기 위해 상기 인코딩된 데이터(100)를 디먹스하는 단계;

(b) 대응하는 제 1 파라미터(
), 제 2 파라미터(α;IID,ρ) 및 적어도 주요 신호(m) 및 잔여 신호(s)를 생성하기 위해 양자화된 데이터를 처리하는 단계로서, 상기 주요 신호(m)는 잔여 신호(s)보다 더 큰 크기 또는 에너지를 가지는, 양자화된 데이터를 처리하는 단계;

(c) 대응하는 중간 신호를 생성하기 위해 제 2 파라미터(α;IID,ρ)를 적용함으로써 주요 신호(m)와 잔여 신호(s)를 회전하는 단계; 및

(d) 상기 오디오 입력 신호(l,r)의 표시를 재생성하기 위해 제 1 파라미터(
)를 적용함으로써 중간 신호를 처리하는 단계로서, 제 1 파라미터(
)는 상기 오디오 입력 신호(l,r) 사이의 관련 위상차 및 시간차 중 적어도 하나를 설명하는, 중간 신호를 처리하는 단계

를 포함하는, 인코딩 데이터를 디코딩하는 방법.
제 16항에 있어서, 단계 (b)에서, 잔여 신호(s)의 사라진 시간-주파수 정보를 주요 신호(m)에서 유도된 합성 잔여 신호로 보충하는 추가 단계를 포함하는, 인코딩 데이터를 디코딩하는 방법.
제 16항에 있어서, 인코딩된 데이터는 잔여 신호(s)의 부분이 인코딩된 데이터로 인코딩되는 것을 나타내는 파라미터를 포함하는, 인코딩 데이터를 디코딩하는 방법.
제 16항에 있어서, 디코더는 시간/주파수 평면에 표시될 때 인코딩된 신호(100)의 빈 영역을 검출함으로써 보충을 필요로 하는 인코딩된 신호(100)의 부분을 디코딩하는, 인코딩 데이터를 디코딩하는 방법.
제 16항에 있어서, 디코더는 빈 영역을 나타내는 데이터 파라미터를 검출함으로써 교체 또는 보충을 필요로 하는 인코딩된 신호(100)의 부분을 디코딩하는, 인코딩 데이터를 디코딩하는 방법.
복수의 오디오 입력 신호(l',r')의 대응하는 표시를 재생성하기 위해 인코딩된 데이터(100)를 디코딩하기 위한 디코더(200;400;600)로서, 상기 오디오 입력 신호(l,r)는 상기 인코딩된 데이터를 생성하기 위해 이전에 인코딩되는, 상기 디코더(200;400;400)는:

(a) 대응하는 양자화된 데이터를 생성하기 위해 인코딩된 데이터(100)를 디먹스하기 위한 디먹스 수단(210;410;610);

(b) 주요 신호 (m)를 생성하기 위해 양자화된 데이터를 디코딩하기 위한 제1 디코딩 수단 ;

(c) 잔여 신호 (s)를 생성하기 위해 양자화된 데이터를 디코딩하기 위한 제 2 디코딩 수단으로서, 상기 주요 신호(m)는 잔여 신호(s)보다 큰 크기 또는 에너지를 가진, 제 2 디코딩 수단;

(d) 대응하는 제 1 파라미터(
) 및 제 2 파라미터(α;IID,ρ)를 생성하기 위해 양자화된 데이터를 처리하기 위한 제 1 처리 수단;

(e) 대응하는 중간 신호를 생성하기 위해 제 2 파라미터(α;IID,ρ)를 적용함으로써 주요 신호(m)와 잔여 신호(s)를 회전하기 위한 제 2 처리 수단; 및

(f) 대응하는 오디오 입력 신호(l,r)를 생성하기 위해 제 1 파라미터(
)를 적용함으로써 중간 신호를 처리하는 제 3 처리 수단으로서, 상기 제 1 파라미터(
)는 신호(l,r) 사이의 관련 위상차와 시간차 중 적어도 하나를 설명하는, 제 3 처리 수단

을 포함하는, 인코딩된 데이터를 디코딩하기 위한 디코더.
제 21항에 있어서, 제 2 처리 수단은 디코딩된 잔여 신호(s)에서 없어진 정보를 제공하기 위해 디코딩된 주요 신호(m)(630)로부터 유도된 보충 합성 잔여 신호를 생성하도록 작동하는, 인코딩된 데이터를 디코딩하기 위한 디코더.
제 22항에 있어서, 제 1 처리 수단은, 어떤 부분의 잔여 신호(s)가 전체 잔여 신호(s)를 생성하기 위해 잔여 신호의 없어진 비-코딩된 부분을 합성하기 위해 상기 제2 디코딩 수단에 의하여 디코딩되었는지를 결정하도록 작동하는, 인코딩된 데이터를 디코딩하기 위한 디코더.
계산 하드웨어 상에서 제 1항의 방법을 실행하기 위한 소프트웨어를 저장하는 컴퓨터 판독 가능한 기록 매체.
계산 하드웨어 상에서 제 16항의 방법을 실행하기 위한 소프트웨어를 저장하는 컴퓨터 판독 가능한 기록 매체.
삭제
삭제