KR101135726B1 - 인코더, 디코더, 인코딩 방법, 디코딩 방법 및 기록 매체 - Google Patents
인코더, 디코더, 인코딩 방법, 디코딩 방법 및 기록 매체 Download PDFInfo
- Publication number
- KR101135726B1 KR101135726B1 KR1020067020275A KR20067020275A KR101135726B1 KR 101135726 B1 KR101135726 B1 KR 101135726B1 KR 1020067020275 A KR1020067020275 A KR 1020067020275A KR 20067020275 A KR20067020275 A KR 20067020275A KR 101135726 B1 KR101135726 B1 KR 101135726B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- parameter
- produce
- encoded data
- audio input
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 89
- 238000012545 processing Methods 0.000 claims abstract description 70
- 238000013139 quantization Methods 0.000 claims abstract description 14
- 230000008569 process Effects 0.000 claims abstract description 12
- 239000002131 composite material Substances 0.000 claims description 10
- 230000000153 supplemental effect Effects 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 2
- 238000013459 approach Methods 0.000 description 6
- 238000013144 data compression Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000001172 regenerating effect Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
인코딩된 데이터(100)를 생성하기 위해 입력 신호(l,r)를 인코딩하는 방법이 제공된다. 본 방법은 신호(l,r) 사이의 상대적 위상차 및 시간차를 설명하는 제 1 파라미터()를 결정하기 위해 입력 신호(l,r)를 처리하는 단계 및 중간 신호를 생성하기 위해 입력 신호를 처리하도록 이들 제 1 파라미터()를 적용하는 단계를 포함한다. 상기 방법은 주요 신호(m)와 잔여 신호(s)를 생성하기 위해 제 1 중간 신호의 각도 회전을 설명하는 제 2 파라미터()를 결정하기 위한 중간 신호의 처리 단계를 포함하며, 상기 주요 신호(m)는 잔여 신호(s)보다 큰 크기 또는 에너지를 갖는다. 이들 제 2 파라미터는 주요 신호(m) 및 잔여 신호(s)를 생성하기 위해 중간 신호를 처리하도록 적용가능하다. 본 방법은 또한 인코딩된 데이터(100)를 생성하기 위해 이후 멀티플렉싱을 위한 대응하는 양자화된 데이터를 생성하기 위한 제 1 파라미터, 제 2 파라미터 및 주요 및 잔여 신호(m,s)의 양자화 단계를 포함한다.
Description
본 발명은, 데이터 코딩 방법, 예를 들어, 데이터 성분의 가변 각도 회전을 이용한 오디오 및/또는 이미지 데이터 코딩 방법에 관한 것이다. 게다가, 본 발명은 또한 이러한 방법을 채용하는 인코더, 및 이들 인코더에 의해 생성된 데이터를 디코딩하도록 작동하는 디코더에 관한 것이다. 게다가, 본 발명은 데이터 캐리어 및/또는 통신 네트워크를 통해 전송된 인코딩된 데이터에 관한 것이며, 인코딩된 데이터는 상기 방법에 따라 생성된다.
다수의 현대의 방법들은 대응하는 인코딩된 출력 데이터를 생성하기 위해 오디오 및/또는 이미지 데이터를 인코딩하기 위해 알려져 있다. 오디오 인코딩하는 현재의 방법의 일례는 MP3로 알려져 있고, 1992년, ISO/IEC JTC1/SC29/WG11 MPEG, IS 11172-3의, 정보 기술- 대략 1.5Mbit/s까지 디지털 저장 매체를 위한 동화상 및 관련 오디오 코딩, 제 3부: 오디오, MPEG-1에 기술된 MPEG-1 레이어 III이다. 이들 현대 방법의 일부는 코딩 효율성을 개선하기 위해, 즉, J.D. Johnston 및 A.J. Ferreira의 1992년 3월, 캘리포니아, 샌프란시스코, 연설 및 신호 의사록의 IEEE 국제 음향 회의 회의록에 게재된, "합계-차 스테레오 변환 코딩"(pp. II:pp.569- 572)에 기술된 것과 같은 중간/측면(M/S) 스테레오 코딩 또는 합계/차이 스테레오 코딩을 채용함으로써, 개선된 데이터 압축을 제공하기 위해 배열된다.
M/S 코딩에서, 스테레오 신호는 예를 들어, 수학식 1과 수학식 2에 설명된 것 같은 처리를 적용함으로써, 합계 신호(m[n]) 및 차이 신호(s[n])로서 코딩된 각각의 왼쪽 및 오른쪽 신호(l[n],r[n])를 포함한다.
신호(l[n] 및 r[n])가 거의 동일할 때, M/S 코딩은 0에 도달하는 차이 신호(s[n])로 인해 중요한 데이터 압축을 제공할 수 있으며 이에 따라 비교적 작은 정보를 전달하는 반면 합계 신호는 신호 정보 컨텐츠의 대부분을 효율적으로 포함한다. 이러한 상황에서, 합계 및 차이 신호를 나타내는데 필요한 비트율은 신호(l[n] 및 r[n])를 독립적으로 코딩하는데 필요한 것의 절반에 가깝다.
수학식 1과 수학식 2는 수학식 3에서와 같은 회전 행렬에 의해 표시될 수 있다.
여기서 c는 클리핑(clipping)을 막기 위해 종종 사용된 일정한 스케일링 계수이다.
반면 수학식 3은 45°의 각도만큼 신호(l[n],r[n])의 회전에 해당하며, 다른 회전각은 수학식 4에서 제공된 것처럼 가능하며, α는 주요 및 잔여 신호 각각과 관련하여 이하 설명되는 대응 코딩 신호(m'[n],s'[n])를 생성하기 위해 신호(l[n],r[n])에 적용된 회전각이다.
각 α는 잔여 신호(s'[n])에 존재하는 정보 내용을 감소시키고 주요 신호(m'[n])에 정보 컨텐츠를 압축함으로써 신호(l[n],r[n])의 넓은 등급에 대한 향상된 압축을 제공하고, 즉 잔여 신호(s'[n]) 내의 전력을 최소화하고 이에 따라 주요 신호(m'[n]) 내의 전력을 최대화하기 위해 가변으로 이루어지는 것이 유리하다.
수학식 1 내지 수학식 4로 나타난 코딩 기술은, 종래 기술에서 광대역 신호가 아닌, 오디오 신호를 전달하기 위해 사용된 완전 대역폭의 더 작은 부분만을 각각 나타내는 하위-신호에 인가된다. 게다가, 수학식 1 내지 수학식 4의 기술은 또한 종래 기술에서 신호(l[n],r[n])의 주파수 영역 표현에 인가된다.
공개된 미국 특허 US 5,621,855에서, 제 1 및 제 2 신호 성분을 구비한 디지털 신호를 하위-대역 코딩하는 방법이 설명되며, 디지털 신호는 제 1 신호 성분에 응답하여 제 1 q-샘플 신호 블록을 구비한 제 1 하위-대역 신호 및 제 2 신호 성분에 응답하여 제 2 q-샘플 신호 블록을 구비한 제 2 하위-대역 신호를 생성하기 위해 하위-대역 코딩되며, 제 1 및 제 2 하위-대역 신호는 동일한 하위-대역 내에 있으며 제 1 및 제 2 신호 블록은 시간 등가적이다.
제 1 및 제 2 신호 블록은 시간-등가적 샘플의 지점 표시 사이의 최소 거리값을 얻기 위해 처리된다. 최소 거리값은 임계 거리값보다 작거나 이와 같은 때, q 샘플로 구성된 복합 블록은, 제 1 블록의 샘플 각각을 cos(α)로 제 2 신호 블록의 샘플 각각을 -sin(α)로 곱한 후 제 1 및 제 2 신호 블록 내의 시간-등가 샘플의 각 쌍을 더함으로써 얻어진다.
전술한 회전각(2)의 적용이 M/S 코딩의 많은 단점을 제거할 수 있다고 해도(오직 45°의 회전만이 채용됨), 이러한 접근 방식은 예를 들어 스테레오 신호 쌍과 같은, 신호의 그룹에 적용되는 경우, 이들 신호에서 상당한 상대적 상호 위상 또는 시간 오프셋이 발생하는 경우, 문제가 되는 것으로 밝혀졌다. 본 발명은 이러한 문제를 다루기 위한 것이다.
본 발명의 목적은 데이터 인코딩 방법을 제공하는 것이다.
본 발명의 제 1 양상에 따라, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 입력 신호(l,r)를 인코딩하는 방법이 제공되며, 상기 방법은:
(a) 신호(l,r) 간의 상대적 위상차 및 시간차 중 적어도 하나를 설명하는 제 1 파라미터()를 결정하기 위해 입력 신호(l,r)를 처리하는 단계 및 대응하는 중간 신호를 생성하기 위해 입력 신호를 처리하기 위해 이들 제 1 파라미터()를 적용하는 단계;
(b) 주요 신호(m)와 잔여 신호(s)를 생성하는데 필요한 중간 신호의 회전을 설명하는 제 2 파라미터를 결정하기 위해 중간 신호 및/또는 입력 신호(l,r)를 처리하는 단계로서, 상기 주요 신호(m)는 잔여 신호(s)보다 큰 크기 또는 에너지를 가지는 처리 단계 및 주요 신호(m)와 잔여 신호(s)를 생성하기 위해 중간 신호를 처리하기 위해 이들 제 2 파라미터를 적용하는 단계;
(c) 제 1 파라미터, 제 2 파라미터를 양자화하는 단계 및 대응하는 양자화된 데이터를 생성하기 위해 주요 신호(m)와 잔여 신호(s)의 적어도 일부를 인코딩하는 단계; 및
(d) 인코딩된 데이터를 생성하기 위해 양자화된 데이터를 멀티플렉싱하는 단계
를 포함한다.
본 발명은 데이터의 더욱 효율적인 인코딩을 제공할 수 있다는 점에서 유리하다.
바람직하게, 이 방법에서, 잔여 신호(s)의 오직 일부만이 인코딩된 데이터에 포함된다. 이러한 잔여 신호(s)의 부분적 포함은 인코딩된 데이터 내에서 달성가능한 데이터 압축을 향상시킬 수 있다.
더 바람직하게, 이 방법에서, 인코딩된 데이터는 또한 인코딩된 데이터 내에 포함된 잔여 신호의 일부를 가리키는 하나 이상의 파라미터를 포함한다. 이러한 표시 파라미터는 인코딩된 데이터의 후속 디코딩을 덜 복잡하게 만들 수 있다.
바람직하게, 방법의 단계 (a) 및 (b)는 주파수 도메인(l[k],r[k])에서 표시된 입력 신호(l[n],r[n])의 복소 회전(complex rotation)에 의해 구현된다. 복소 회전의 구현은 복수의 입력 신호 사이에서 발생한 상대적 시간 및/또는 위상차를 더욱 효율적으로 처리할 수 있다. 더 바람직하게, 단계 (a) 및 (b)는 주파수 도메인 또는 하위-대역 도메인에서 행해진다. "하위-대역"은 신호에 필요한 완전 주파수 대역폭보다 더 작은 주파수 영역으로 해석될 것이다.
바람직하게, 상기 방법은 입력 신호(l,r)를 포함하는 전체 주파수 범위의 하위-부분에서 응용된다. 더 바람직하게, 전체 주파수 범위의 다른 하위-부분은, 앞서 설명한 것처럼 종래의 M/S 인코딩과 같은 대안적인 인코딩 기술을 사용하여 인코딩된다.
바람직하게, 상기 방법은 인코딩된 데이터를 생성하기 위해 단계 (d)에서 멀티플렉싱을 위한 데이터를 제공하기 위해 양자화된 데이터를 손실없이 코딩하는 추가적 단계를 단계 (c) 이후에 포함한다. 더 구체적으로, 손실없는 코딩은 허프만 코딩을 이용하여 구현된다. 손실없는 코딩의 이용은 잠재적으로 더 높은 오디오 품질이 달성될 수 있게 한다.
바람직하게, 상기 방법은 잔여 신호(s)에 존재하는 지각적으로 무관한 시간-주파수 정보를 폐기함으로써 잔여 신호(s)를 조작하는 단계를 포함하며, 상기 조작된 잔여 신호(s)는 인코딩된 데이터(100)에 기여하며, 상기 지각적으로 무관한 정보는 입력 신호의 스펙트럼-시간 표시의 선택된 부분에 대응한다. 지각적으로 무관한 정보의 폐기는 상기 방법이 인코딩된 데이터 내에 더 큰 정도의 데이터 압축을 제공할 수 있게 한다.
바람직하게, 상기 방법의 단계 (b)에서, 제 2 파라미터(α;IID,ρ)는 잔여 신호(s)의 크기 또는 에너지를 최소화함으로써 도출된다. 이러한 접근 방식은 파라미터를 도출하는 대안적인 접근 방식에 비해 제 2 파라미터를 생성하기 위해 계산적으로 효율적이다.
바람직하게, 상기 방법에서, 제 2 파라미터(α;IID,ρ)는 인터-채널 강도 차이 파라미터 및 연접성 파라미터(IID,ρ)의 방법에 의해 표시된다. 이러한 방법의 구현은 기존 파라미터 스테레오 인코딩 및 관련 디코딩 하드웨어 또는 소프트웨어와의 후방 호환성을 제공할 수 있다.
바람직하게, 상기 방법의 단계 (c) 및 (d)에서, 인코딩된 데이터는 중요한 층 내에 배열되며, 상기 층들은 주요 신호(m)를 전달하는 기본층을 포함하며, 제 1 강화층은 스테레오 전달 파라미터에 대응하는 제 1 및/또는 제 2 파라미터를 포함하며, 제 2 강화층은 잔여 신호(s)의 표시를 전달한다. 더 구체적으로, 제 2 강화층은 잔여 신호(s)의 가장 관련된 시간-주파수 정보를 전달하는 제 1 하위-층 및 잔여 신호(s)의 덜 관련된 시간-주파수 정보를 전달하는 제 2 하위-층으로 더 하위 분할된다. 이들 층에 의한 입력 신호, 그리고 필요한 경우 하위-층의 표시는 인코딩된 데이터의 전송 오류에 대한 강건함을 향상시키며 더 단순한 디코딩 하드웨어와의 후방 호환성을 제공할 수 있다.
본 발명의 제 2 양상에 따라, 대응하는 인코딩된 데이터를 생성하기 위한 복수의 입력 신호(l,r)를 인코딩하기 위한 인코더가 제공되며, 상기 인코더는:
(a) 신호(l,r) 사이의 상대적 위상차 및 시간 차 중 적어도 하나를 설명하는 제 1 파라미터()를 결정하기 위해 입력 신호(l,r)를 처리하기 위한 제 1 처리 수단으로서, 상기 제 1 처리 수단은 대응하는 중간 신호를 생성하도록 입력 신호를 처리하기 위해 이들 제 1 파라미터()를 적용하기 위해 작동하는, 제 1 처리 수단;
(b) 주요 신호(m) 및 잔여 신호(s)를 생성하는데 필요한 중간 신호의 회전을 설명하는 제 2 파라미터를 결정하기 위해 중간 신호를 처리하는 제 2 처리 수단으로서, 상기 주요 신호(m)는 잔여 신호(s)보다 더 큰 크기 또는 에너지를 가지며, 상기 제 2 처리 수단은 적어도 주요 신호(m)와 잔여 신호(s)를 생성하도록 중간 신호를 처리하기 위해 이들 제 2 파라미터를 적용하도록 작동하는, 제 2 처리 수단
(c) 대응하는 양자화된 데이터를 생성하기 위해, 제 1 파라미터(), 제 2 파라미터(α;IID,ρ) 및 주요 신호(m)와 잔여 신호(s)의 적어도 일부를 양자화하기 위한 양자화 수단; 및
(d) 인코딩된 데이터를 생성하기 위해 상기 양자화된 데이터를 멀티플렉싱하기 위한 멀티플렉싱 수단
을 포함한다.
상기 인코더는 데이터의 더욱 효율적인 인코딩을 제공할 수 있다는 점에서 유리하다.
바람직하게, 인코더는 잔연 신호(s) 내에 존재하는 지각적으로 무관한 시간-주파수 정보를 폐기함으로써 잔여 신호(s)를 조작하는 처리 수단을 포함하며, 상기 변화된 잔여 신호(s)는 인코딩된 데이터(100)에 기여하며 상기 지각적으로 무관한 정보는 입력 신호의 스펙트럼-시간 표시의 선택된 부분에 대응한다. 지각적으로 무관한 정보의 폐기는 인코더가 인코딩된 데이터로 더 큰 정도의 데이터 압축을 제공하는 것을 가능케 한다.
본 발명의 제 3 양상에 따라, 복수의 입력 신호(l',r')의 대응하는 표시를 재생성하기 위한 인코딩된 데이터를 디코딩하는 방법이 제공되며, 상기 입력 신호(l,r)는 상기 인코딩된 데이터를 생성하기 위해 이전에 인코딩되며, 상기 방법은:
(a) 대응하는 양자화된 데이터를 생성하기 위해 인코딩된 데이터를 디먹스하는 단계;
(b) 대응하는 제 1 파라미터(), 제 2 파라미터 및 적어도 주요 신호(m) 및 잔여 신호(s)를 생성하기 위해 양자화된 데이터를 처리하는 단계, 상기 주요 신호(m)는 잔여 신호(s)보다 더 큰 크기 또는 에너지를 갖는, 양자화된 데이터를 처리하는 단계;
(c) 대응하는 중간 신호를 생성하기 위해 제 2 파라미터를 적용함으로써 주요 신호(m)와 잔여 신호(s)를 회전시키는 단계; 및
(d) 상기 입력 신호(l',r')의 상기 표시를 재생성하기 위해 제 1 파라미터()를 적용시킴으로써 중간 신호를 처리하는 단계로서, 제 1 파라미터()는 신호(l,r) 사이의 상대적 위상차와 시간차 중 적어도 하나를 설명하는, 중간 신호를 처리하는 단계
를 포함한다.
상기 방법은 본 발명의 제 1 양상에 따른 방법을 사용하여 효율적으로 코딩되었던 데이터를 효율적으로 디코딩할 수 있는 이점을 제공한다.
바람직하게, 상기 방법의 단계 (b)는 주요 신호(m)로부터 유도된 합성 잔여 신호로 잔여 신호(s)의 사라진 시간-주파수 정보를 적절히 보충하는 추가적 단계를 포함한다. 합성 신호의 생성은 인코딩된 데이터의 효율적인 디코딩을 초래할 수 있다.
바람직하게, 상기 방법에서, 인코딩된 데이터는 잔여 신호(s)의 어떤 부분이 인코딩된 데이터로 인코딩되었음을 나타내는 파라미터를 포함한다. 이러한 표시 파라미터의 포함은 효율적이며 더 적은 계산상의 요구를 위한 디코딩을 제공할 수 있다.
본 발명의 제 4 양상에 따라, 복수의 입력 신호(l',r')의 대응하는 표시를 재생성하기 위해 인코딩된 데이터를 디코딩하기 위한 디코더가 제공되며, 상기 입력 신호(l,r)는 인코딩된 데이터를 생성하기 위해 이전에 인코딩되며, 상기 디코더는:
(a) 대응하는 양자화된 데이터를 생성하기 위해 인코딩된 데이터를 디먹스하기 위한 디먹스 수단;
(b) 대응하는 제 1 파라미터(), 제 2 파라미터, 및 적어도 하나의 주요 신호(m) 및 잔여 신호(s)를 생성하기 위해 상기 양자화된 데이터를 처리하는 제 1 처리 수단으로서, 상기 주요 신호(m)는 잔여 신호(s)보다 큰 크기 또는 에너지를 가지는, 제 1 처리 수단;
(c) 대응하는 중간 신호를 생성하기 위해 제 2 파라미터를 적용함으로써 주요 신호(m)와 잔여 신호(s)를 회전시키기 위한 제 2 처리 수단; 및
(d) 입력 신호(l,s)의 상기 표시를 재생성하기 위해 제 1 파라미터()를 적용함으로써 중간 신호를 처리하는 제 3 처리 수단으로서, 상기 제 1 파라미터()는 신호(l,r) 사이의 상대 위상차와 시간차 중 적어도 하나를 설명하는, 제 3 처리 수단
을 포함한다.
바람직하게, 상기 제 2 처리 수단은 상기 디코딩된 잔여 신호로부터 없어진 정보를 제공하기 위해 디코딩된 주요 신호(m)로부터 유도된 보충 합성 신호를 생성하도록 작동한다.
본 발명의 제 5 양상에 따라, 본 발명의 제 1 양상의 방법에 따라 생성된 인코딩된 데이터가 제공되며, 상기 데이터는 데이터 캐리어 상에 기록되고 통신 네트워크를 통해 통신가능한 것 중 적어도 하나이다.
본 발명의 제 6 양상에 따라, 계산 하드웨어 상에서 본 발명의 제 1 양상의 방법을 실행하는 소프트웨어가 제공된다.
본 발명의 제 7 양상에 따라, 계산 하드웨어 상에서 본 발명의 제 3 양상의 방법을 실행하는 소프트웨어가 제공된다.
본 발명의 제 8 양상에 따라, 데이터 캐리어 상에 기록되고 통신 네트워크를 통해 통신가능한 것 중 적어도 하나인 인코딩된 데이터가 제공되며, 상기 데이터는 양자화된 제 1 파라미터, 양자화된 제 2 파라미터 및 주요 신호(m) 및 잔여 신호(s)의 적어도 일부에 대응하는 양자화된 데이터를 포함하며, 상기 주요 신호(m)는 잔여 신호(s)보다 큰 크기 또는 에너지를 가지며, 상기 주요 신호(m) 및 상기 잔여 신호(s)는 상기 제 2 파라미터에 따라 중간 신호를 회전시킴으로써 유도가능하며, 상기 중간 신호는 제 1 파라미터로 설명된 것처럼 상대 위상 및/또는 그 사이의 시간 지연을 보상하기 위해 복수의 입력 신호를 처리함으로써 생성된다.
본 발명의 특성은 첨부한 청구항에서 정의된 것처럼 본 발명의 범위를 이탈하지 않고 임의의 결합으로 결합될 수 있다는 것을 이해할 것이다.
본 발명의 실시예들은 이제, 다음 도면을 참조로, 단지 예로써 설명될 것이다.
도 1은 상대적 상호 시간 및 위상 지연에 관한 신호(l[n],r[n])에 대한 샘플 시퀀스의 예시를 도시한 도면.
도 2는 대응하는 합계 및 차이 신호(m[n],s[n])를 생성하기 위해 도 1의 신호에 적용된 수학식 1 및 수학식 2에 따른 종래의 M/S 변환의 인가의 예시를 도시한 도면.
도 3은 대응하는 주요 신호(m[n]) 및 잔여 신호(s[n])를 생성하기 위해 도 1의 신호에 적용된 수학식 4에 따른 회전 변환의 인가의 예시를 도시한 도면.
도 4는 대응하는 주요 신호(m[n]) 및 잔여 신호(s[n])를 생성하기 위해 수학식 5 내지 수학식 15에 따른 본 발명에 따른 복합 회전 변환의 인가의 예시로서, 잔여 신호가 상대적 상호 위상 및 시간 지연을 구비한 도 1의 신호에도 불구하고 비교적 작은 진폭인, 본 발명에 따른 복합 회전 변환의 인가의 예시를 도시한 도면.
도 5는 본 발명에 따른 인코더의 개략도.
도 6은 디코더가 도 5의 인코더와 호환가능한, 본 발명에 따른 디코더의 개략도.
도 7은 파라미터 스테레오 디코더의 개략도.
도 8은 본 발명에 따른 강화된 파라미터 스테레오 인코더의 개략도.
도 9는 디코더가 도 9의 인코더와 호환가능한, 본 발명에 따른 강화된 파라미터 스테레오 디코더의 개략도.
개요에서, 본 발명은 가변 회전각을 채용하는 앞서 설명된 M/S 코딩 방법에 대한 진보를 나타내는 데이터 코딩 방법에 관한 것이다. 상기 방법은 상당한 위상 및/또는 시간 오프셋에 관한 신호의 그룹에 대응하는 더 나은 데이터 코딩이 가능한 발명자가 고안한 것이다. 게다가, 본 방법은 신호(l[n],r[n])가 그들의 등가 복합-값 주파수 도메인 표시(l[k],r[k]) 각각에 의해 표시될 때 사용될 수 있는 회전 각(α)에 대한 값을 채용함으로써 종래의 코딩 기술에 비해 이점을 제공한다.
각(α)은 이들 신호 간에 상호 시간적 및/또는 위상 지연을 수용하기 위해 l[n],r[n] 신호를 상호 "결합"하기 위해 적용된 실제-값 및 실제-값 위상 회전이 되도록 배열될 수 있다. 그러나, 회전각(α)에 대한 복합값의 사용은 본 발명의 구현을 더 용이하게 한다. 각(α) 만큼의 회전을 구현하기 위한 대안적인 접근 방식은 본 발명의 범위 내에 있는 것으로 해석될 것이다.
전술한 시간-도메인 신호(l[n],r[n])의 주파수-도메인 표시는 윈도우화된(windowed) 신호(lq[n],rq[n])를 제공하기 위해 수학식 5와 수학식 6으로 설명된 것처럼 시간 윈도우화 절차를 적용하여 유도되는 것이 바람직하다.
여기서,
q= 연속적인 신호 프레임을 나타내기 위해 q=0,1,2,..가 되도록 하는 프레임 지수;
H= 홉(hop)-크기 또는 업데이트-크기; 및
n= 파라미터(L)가 윈도우(h[n])의 길이에 상응하는 0 내지 L-1의 범위 내의 값을 갖는 시간 지수.
윈도우화된 신호(lq[n],rq[n])는 수학식 7과 수학식 8에 설명된 것처럼, 이산 푸리에 변환(DFT) 또는 기능적으로 등가인 변환을 사용함으로써, 주파수 영역으로 변환가능하다.
파라미터 N은 N≥L이 되도록 하는 DFT 길이를 나타낸다. 실제 값 시퀀스의 DFT가 대칭적이므로, 오직 첫 번째 N/2+1 지점만이 변환 이후에 보전된다. DFT를 구현할 때 신호 에너지를 보전하기 위해, 수학식 9와 수학식 10에서 설명된 것처럼 다음 스케일링은 바람직하게 채용된다.
본 발명의 방법은 수학식 7과 수학식 8에서의 주파수 영역 신호 표시(l[k],r[k])를 주파수 영역 내의 대응하는 회전된 합계와 차이 신호(m''[k],s''[k])로 변환하기 위해 수학식 11로 표현된 것처럼 신호 처리 연산을 수행한다.
여기서
각()의 사용은 선택적이다. 게다가, 수학식 11에 따른 회전은 프레임 단위로, 즉 프레임 단계에서 동적으로 실행되는 것이 바람직하다. 그러나, 프레임에서 프레임으로의 회전의 이러한 동적 변화는 각()의 적절한 선택에 의해 적어도 부분적으로 제거될 수 있는 합계 신호(m"[k]) 내의 신호 불연속성을 잠재적으로 야기시킬 수 있다.
게다가, 수학식 11의 주파수 범위(k=0...N/2+1)는 하위-범위, 즉 영역으로 분할되는 것이 바람직하다. 인코딩동안의 각 영역에 대해, 대응 각 파라미터(, 및 )는 이후 독립적으로 결정되며, 코딩된 후 전송되거나 그렇지 않으면 다음 디코딩을 위해 디코더로 전송된다. 하위 분할될 주파수 범위에 대해 배열함으로써, 신호 속성은 더 높은 압축 비율을 잠재적으로 초래하는 인코딩동안에 캡쳐되는 것 이 더 나을 수 있다.
수학식 7 내지 수학식 11에 따라 맵핑을 구현한 후, 신호(m"[k],s"[k])는 수학식 12 및 수학식 13에 설명된 것처럼 역 이산 푸리에 변환이 수행된다.
여기서
주요 및 잔여 표시는 이러한 방법으로 이후 수학식 14 및 수학식 15로 설명된 것처럼 연산 처리에 의해 제공된 것처럼 중복이 적용된 윈도우화를 기초로 표시로 변환된다.
대안적으로, 수학식 5 내지 수학식 15로 설명된 것처럼 본 발명의 방법의 처 리 연산은, 적어도 부분적으로 복합-변조된 필터 뱅크를 채용함으로써 실제로 구현될 수 있다. 컴퓨터 처리 하드웨어에 적용된 디지털 처리는 본 발명을 구현하기 위해 채용될 수 있다.
본 발명의 방법을 설명하기 위해, 본 발명의 신호 처리 예는 이제 설명될 것이다. 이러한 예로써, 2개의 시간 신호는 상기 방법을 사용하여 처리될 초기 신호로서 사용되며, 상기 2개의 신호는 수학식 16 및 수학식 17에 의해 정의된다.
, 및 는 단위 분산(unity variance)의 상호 독립적인 흰색 잡음 시퀀스이다. 본 발명의 방법의 연산을 더 잘 이해하기 위해, 수학식 16과 수학식 17로 설명된 신호(l[n],r[n])의 부분들은 도 1로 도시된다.
도 2에서, M/S 변환 신호(m[n] 및 s[n])는 도시되며, 이들 변환 신호는 수학식 1과 수학식 2에 따라 종래의 처리에 의한 수학식 16과 수학식 17의 신호(l[n],r[n])로부터 유도된다. 수학식 16 및 수학식 17의 신호로부터 신호(m[n] 및 s[n])를 생성하기 위한 이러한 종래의 접근 방식은 수학식 17에서 입력 신호(r[n])의 에너지보다 더 큰 잔여 신호(s[n])의 에너지를 초래한다는 것을 도 2로부터 알 수 있다. 명백히, 수학식 16과 수학식 17의 신호에 인가된 종래의 M/S 변 환 신호 처리는 신호(s[n])가 미미한 크기가 아니므로 신호 압축을 초래한다는 점에서 효과적이지 않다.
수학식 4로 설명된 것과 같은 회전 변환을 채용함으로써, 예시적인 신호(l[n],r[n])가 도 3에 도시된 것과 같이 대응 잔여 신호(s[n]) 내의 잔여 에너지를 감소시키고 이에 따라 주요 신호(m[n])를 향상시키는 것이 가능하다. 수학식 4의 회전 접근 방식이 도 2에 제공된 것처럼 종래의 M/S 처리보다 더 나은 수행이 가능하다고 해도, 발명자는 신호(l[n],r[n])가 상대 상호 위상 및/또는 시간 시프트를 따를 때 만족스럽지 못한 것을 알게 되었다.
수학식 16 및 수학식 17의 샘플 신호(l[n],r[n])가 주파수 도메인의 변환을 받을 때, 이후 수학식 5 내지 15에 따른 복합 최적화 회전에 따라서, 도 4에 도시된 것과 같은 비교적 작은 크기로 잔여 신호(s[n])의 에너지를 감소시킬 수 있다.
수학식 5 내지 수학식 15로 설명된 것과 같은 신호 처리를 구현하도록 작동하는 인코더 하드웨어의 실시예는 다음에 설명될 것이다.
도 5에서, 일반적으로 10으로 표시된 본 발명에 따른 인코더가 개시된다. 인코더(10)는 왼쪽(l)과 오른쪽(r) 보충 입력 신호를 수신하고 인코딩된 비트-스트림(bs)(100)을 생성하기 위해 이들 신호들을 인코딩하도록 작동한다. 게다가, 인코더(10)는 위상 회전 유닛(20), 신호 회전 유닛(30), 시간/주파수 선택기(40), 제 1 코더(50), 제 2 코더(60), 파라미터 양자화 처리 유닛(Q)(70) 및 비트-스트림 멀티플렉서 유닛(80)을 포함한다.
입력 신호(l,r)는 대응 출력이 신호 회전 유닛(30)에 연결된 위상 회전 유 닛(20)의 입력에 연결된다. 신호 회전 유닛(30)의 주요 및 잔여 신호는 m, s 각각으로 표시된다. 주요 신호(m)는 제 1 코더(50)를 통해 멀티플렉서 유닛(80)으로 전송된다. 게다가, 잔여 신호(s)는 시간/주파수 선택기(40)를 통해 제 2 코더(60)로 이후에는 멀티플렉서 유닛(80)으로 연결된다. 위상 회전 유닛(20)으로부터의 각 파라미터 출력(,)은 처리 유닛(70)을 통해 멀티플렉서 유닛(80)으로 연결된다. 추가적으로, 각 파라미터 출력()은 신호 회전 유닛(30)으로부터 처리 유닛(70)을 통해 멀티플렉서 유닛(80)으로 연결된다. 멀티플렉서 유닛(80)은 전술한 인코딩된 비트 스트림 출력(bs)(100)을 포함한다.
연산 중에, 위상 회전 유닛(20)은 상대적 위상차를 보상하고 이에 따라 파라미터(,)를 생성하기 위해 신호(l,r)를 처리하며 파라미터()는 이러한 상대적 위상차를 나타내며, 파라미터()는 양자화를 위해 처리 유닛(70)으로 전송되며 이에 따라 대응 파라미터 데이터로서 인코딩된 비트 스트림(100)에 포함시킨다. 상대적 위상차에 대해 보상된 신호(l,r)는 주요 신호(m) 내의 신호 에너지의 최대량 및 잔여 신호(s) 내의 신호 에너지의 최소량을 집중시키기 위해 각()에 대한 최적화된 값을 결정하는 신호 회전 유닛(30)으로 전달된다. 주요 및 잔여 신호(m,s)는 이후 비트 스트림(100)으로 포함시키기 위해 적절한 형식으로 변환되기 위해 코더(50,60)를 통해 전달된다. 처리 유닛(70)은 각 신호()를 수신하고 비트-스트림 출력(bs)(100)을 생성하기 위해 코더(50,60)로부터의 출력과 함께 이들을 멀티플렉스한다. 따라서, 비트-스트림(bs)(100)은 이에 따라 각 파라미터 데 이터()와 함께 주요 및 잔여 신호(m,s)의 표시를 포함하는 데이터 스트림을 포함하며, 파라미터()는 필수적이며 파라미터()는 선택적이지만 포함시키는 것이 유익하다.
코더(50,60)는 2개의 모노 오디오 인코더 또는 대안적으로 하나의 이중 모노 인코더로서 구현되는 것이 바람직하다. 선택적으로, 예를 들어, 시간-주파수 평면으로 표시될 때 확인되었지만, 지각가능하게 비트 스트림(100)에 기여하지 않는 잔여 신호(s)의 특정 부분은 시간/주파수 선택기(40)에서 폐기될 수 있으며, 이에 따라 이하 더 자세히 설명되는 것처럼 측정가능한 데이터 압축을 제공한다.
인코더(10)는 입력 신호를 포함하는 전체 주파수 범위의 일부에 대해 입력 신호(l,r)를 처리하는데 사용될 수 있다. 인코더(10)로 인코딩되지 않은 입력 신호(l,r)의 이들 부분은 이후 예를 들어 앞서 설명한 것과 같은 종래의 M/S 코딩을 사용하는 것처럼, 다른 방법을 사용하여 병렬로 인코딩된다. 필요한 경우 왼쪽(l) 및 오른쪽(r) 입력 신호의 개별 인코딩은 구현될 수 있다.
인코더(10)는 예를 들어, 맞춤형 집적 회로 또는 이러한 회로의 그룹으로서, 하드웨어로 구현될 수 있다. 대안적으로, 인코더(10)는, 예를 들어 독점적 소프트웨어-구동 신호 처리 집적 회로 또는 이러한 회로의 그룹과 같은, 계산 하드웨어 상에서 실행하는 소프트웨어로 구현될 수 있다.
도 6에서, 인코더(10)와 호환가능한 디코더는 일반적으로 200으로 표시된다. 디코더(200)는 비트-스트림 디먹스(210), 제 1 및 제 2 디코더(220,230), 파라미터 의 역양자화하기 위한 처리 유닛(240), 신호 회전 디코더 유닛(250) 및 입력 신호(l,r) 입력에 대응하는 디코딩된 출력(l',r')을 인코더(10)에 제공하는 위상 회전 디코딩 유닛(260)을 포함한다. 디먹스(210)는 예를 들어 CD 또는 DVD와 같은 광디스크 데이터 캐리어와 같은 데이터 캐리어에 의해 및/또는 인터넷과 같은, 통신 네트워크를 통해, 인코더(10)로부터 디코더(200)로 전송되는 것처럼, 인코더(10)에 의해 생성된 것처럼 비트-스트림(bs)(100)을 수신하기 위해 구성된다. 디먹스(210)의 디먹스된 출력은 디코더(220,230)의 입력 및 처리 유닛(240)으로 연결된다. 제 1 및 제 2 디코더(220,230)는 회전 디코더 유닛(250)에 연결된 주요 및 잔여 디코딩된 출력(m',s') 각각을 포함한다. 게다가, 처리 유닛(240)은 회전 디코더 유닛(250)에 또한 연결된 회전 각 출력()을 포함하며; 각()은 인코더(10)에 대해 전술한 각()의 디코딩된 버전에 해당한다. 각 출력()은 인코더(10)에 대해 전술한 각()의 디코딩된 버전에 해당하며; 이들 각 출력()은 회전 디코더 유닛(250)에서 도시된 것처럼 디코딩된 출력(l',r')을 포함하는 위상 회전 디코딩 유닛(260)으로 디코딩된 주요 및 잔여 신호 출력과 함께 전송된다.
연산 중에, 디코더(200)는 인코더(10) 내에서 실행된 인코딩 단계를 역으로 실행한다. 따라서, 디코더(200)에서, 비트-스트림(100)은 디코딩된 주요 및 잔여 신호(m',s')를 생성하기 위해 디코더(220,230)에 의해 재구성된 주요 및 잔여 신호에 대응하는 데이터를 고립시키기 위해 디먹스(210)에서 디먹스한다. 이들 신호(m',s')는 이후 각()에 따라 회전된 다음 왼쪽 및 오른쪽 신호(l',r')를 재생 성하기 위해 각()을 사용하여 상대적 위상에 대해 정정된다. 각()은 디먹스(210)에서 디먹스된 파라미터로부터 재생성되며 처리 유닛(240) 내에 고립된다.
인코더(10)에서, 그리고 또한 디코더(200)에서, 전술한 각()보다는 비트-스트림(100)에서 IID 값 및 연접 값()을 전송하는 것이 바람직하다. IID 값은 인터-채널 차이를 나타내도록, 즉 왼쪽 및 오른쪽 신호(l,r) 사이의 주파수 및 시간 가변 크기를 표시하기 위해 배열된다. 연접 값()은 주파수 가변 연접성, 즉 위상 동기화 이후의 왼쪽과 오른쪽 신호(l,r) 사이의 유사성을 표시한다. 그러나, 예를 들어 디코더(200)에서, 각()은 수학식 18을 응용함으로써 IID와 값으로부터 즉시 유도될 수 있다.
파라미터 디코더는 도 7에서 일반적으로 400으로 표시되며, 이 디코더(400)는 본 발명에 따른 인코더에 대해 보충적이다. 디코더(400)는 비트-스트림 디먹스(410), 디코더(420), 상관해제 유닛(430), 스케일링 유닛(440), 신호 회전 유닛(450), 위상 회전 유닛(460) 및 역양자화 유닛(470)을 포함한다. 디먹스(410)는 비트-스트림 신호(bs)(100)를 수신하기 위한 입력 및 신호(m,s) 데이터, 각도 파라미터 데이터, IID 데이터 및 연접 데이터()에 대한 4개의 대응 출력을 포함하며, 이들 출력은 도시된 것처럼 디코더(420)와 역양자화 유닛(470)에 연결된다. 디코더(420)로부터의 출력은 스케일링 함수(440)에 대한 입력을 위한 잔여 신호(s')의 표시를 재생성하기 위해 상관 해제 유닛(430)을 통해 연결된다. 게다가, 주요 신호(m')의 재생성된 표시는 디코더 유닛(420)으로부터 스케일링 유닛(440)으로 전송된다. 스케일링 유닛(440)은 또한 역양자화 유닛(470)으로부터 IID'와 연접 데이터()가 제공된다. 스케일링 유닛(440)으로부터의 출력은 중간 출력 신호를 생성하기 위해 신호 회전 유닛(450)에 연결된다. 이들 중간 출력 신호들은 이후 왼쪽 및 오른쪽 신호(l',r') 표현을 재생성하기 위해 역양자화 유닛(470)으로 디코딩된 각()을 사용하여 위상 회전 유닛(460)에서 정정된다.
디코더(400)는 상관 해제 유닛(430) 내에 실행된 상관 해제 처리에 의해 주요 신호(m')에 기초하여 잔여 신호(s')를 평가하기 위한 상관 해제 유닛(430)을 포함한다는 점에서 도 6의 디코더(200)와 구별된다. 게다가, 왼쪽 및 오른쪽 출력 신호(l',r') 사이의 연접 양은 스케일링 연산에 의해 결정된다. 스케일링 연산은 스케일링 유닛(440) 내에서 실행되며 주요 신호(m')와 잔여 신호(s') 사이의 비율에 관한 것이다.
다음으로 도 8을 참조하면, 일반적으로 500으로 표시된 강화된 인코더가 도시된다. 인코더(500)는 왼쪽 및 오른쪽 입력 신호(l,r) 각각을 수신하기 위한 위상 회전 유닛(510), 신호 회전 유닛(520), 시간/주파수 선택기(530), 각각의 제 1 및 제 2 코더(540,550), 양자화 유닛(560) 및 비트-스트림 출력(bs)(100)을 포함하는 멀티플렉서(570)를 포함한다. 위상 회전 유닛(510)으로부터의 각 출력()은 위상 회전 유닛(510)으로부터 양자화 유닛(560)으로 연결된다. 게다가, 위상 회전 유닛(510)으로부터의 위상-정정된 출력은 IID와 연접() 데이터/파라미터뿐만 아니라, 주요 및 잔여 신호(m,s) 각각을 생성하기 위해 신호 회전 유닛(520)과 시간/주파수 선택기(530)를 통해 연결된다. IID 및 연접() 데이터/파라미터는 양자화 유닛(560)에 연결되는 반면, 주요 및 잔여 신호 m,s는 멀티플렉스(570)에 대한 대응 데이터를 생성하기 위해 제 1 및 제 2 디코더(540,550)를 통해 전송된다. 멀티플렉스(570)는 또한 각(), 연접() 및 IID를 설명하는 파라미터 데이터를 수신하기 위해 배열된다. 멀티플렉서(570)는 비트-스트림(bs)(100)을 생성하기 위해 코더(540,550)와 양자화 유닛(560)으로부터 데이터를 멀티플렉싱하도록 작동한다.
인코더(500)에서, 잔여 신호는 비트-스트림(100)으로 직접 인코딩된다. 선택적으로, 시간/주파수 선택기 유닛(530)은 잔여 신호(s)의 시간/주파수 평면의 어떤 부분이 비트-스트림(bs)(100)으로 인코딩될지를 결정하며, 유닛(530)은 이에 따라 잔여 정보가 비트-스트림(100)에 포함되는 정도를 결정하며, 따라서 인코더(500) 내에서 달성가능한 압축과 비트-스트림(100) 내에 포함된 정보의 정도 사이의 타협에 영향을 준다.
도 9에서, 강화된 파라미터 디코더는 일반적으로 600으로 표시되며, 디코더(600)는 도 8에 도시된 인코더(500)에 대해 보충적이다. 디코더(600)는 디먹스 유닛(610), 각각의 제 1 및 제 2 디코더(620,640), 상관 해제 유닛(630), 결합기 유닛(650), 스케일링 유닛(660), 신호 회전 유닛(670), 위상 회전 유닛(680) 및 역양자화 유닛(690)을 포함한다. 디먹스 유닛(610)은 인코딩된 비트-스트림(bs)(100)을 수신하고 대응하는 디먹스된 출력을 제 1 및 제 2 디코더(620,640) 및 또한 디먹스 유닛(690)에 제공하기 위해 연결된다. 상관 해제 유닛(630)과 결합기 유닛(650)과 관련된 디코더(620,640)는 주요 및 잔여 신호(m',s') 각각의 표시를 재생성하기 위해 작동한다. 이들 표시는 왼쪽 및 오른쪽 신호(l',r')의 표시를 재생성하기 위해 역양자화 유닛(690)에 의해 생성된 각도 파라미터에 응답하여 회전 유닛(680)에서 위상 회전된 중간 신호를 생성하기 위해 신호 회전 유닛(670)의 회전이 후속되는 스케일링 유닛(660)의 스케일링 처리를 받는다.
디코더(600)에서, 비트-스트림(100)은 주요 신호(m')에 대해, 잔여 신호(s')에 대해 그리고 스테레오 파라미터에 대해, 분리된 스트림으로 디먹스된다. 주요 및 잔여 신호(m',s')는 이후 디코더(620,640) 각각에 의해 디코딩된다. 비트-스트림(100)으로 인코딩되었던 잔여 신호(s')의 스펙트럼/시간부분은 묵시적으로, 즉 시간-주파수 평면 내의 "빈" 영역을 검출함으로써, 또는 명시적으로, 즉, 비트 스트림(100)으로부터 디코딩된 대표적인 시그널링 파라미터에 의해 비트-스트림(100)으로 전송된다. 상관 해제 유닛(630) 및 결합기 유닛(650)은 디코딩된 잔여 신호(s') 내의 빈 시간-주파수 영역을 합성 잔여 신호로 효과적으로 채우도록 작동한다. 이러한 합성 신호는 상관 해제 유닛(630)으로부터 출력과 디코딩된 주요 신호(m')를 사용함으로써 생성된다. 모든 다른 시간-주파수 영역에 대해, 잔여 신호(s)는 디코딩된 잔여 신호(s')를 구성하기 위해 인가되며; 이들 영역에 대해, 어 떠한 스케일링도 스케일링 유닛(660) 내에 인가되지 않는다. 선택적으로, 이들 영역에 대해, IID 대신에 인코더(500) 내에 전술한 각도()를 전송하는 것이 유익하며, 단일 각 파라미터()를 전송하는데 필요한 데이터 비율로서 연접() 데이터는 등가의 IID 및 연접() 파라미터 데이터를 전송하는데 필요한 것보다 작다. 그러나, IID 및 파라미터 데이터 대신에 비트 스트림(100) 내의 각도() 파라미터의 전송은 이러한 IID 및 연접() 데이터를 이용하는 일반적인 종래의 파라미터 스테레오(PS) 시스템과 비-후방 호환적인 인코더(500) 및 디코더(600)를 제공한다.
인코더(10,500)의 선택기 유닛(40,530) 각각은 잔여 신호(s)의 어떤 시간-주파수 영역이 비트-스트림(100)으로 인코딩되어야 하는지를 선택할 때 지각 모델을 채용하기 위해 배열되는 것이 바람직하다. 인코더(10,500) 내에 잔여 신호(s)의 다양한 시간-주파수 양상을 코딩함으로써, 이에 따라 비트-율 측정가능한 인코더 및 디코더를 달성하는 것이 가능하다. 비트-스트림(100) 내의 층들이 상호 의존적일 때, 지각적으로 가장 관련된 시간-주파수 양상들에 대응하는 코딩된 데이터는 층들에 포함된 기본층에 포함되며, 지각적으로 덜 중요한 데이터는 층들에 포함된 정밀 또는 강화층으로 이동되며; "강화층"은 또한 "정밀층"이라고도 한다. 이러한 배열에서, 기본층은 바람직하게 주요 신호(m)에 대응하는 비트 스트림을 포함하며, 제 1 강화층은 전술한 각도()와 같은 스테레오 파라미터에 대응하는 비트 스트림을 포함하며, 제 2 강화층은 잔여 신호(s)에 대응하는 비트 스트림을 포함한다.
비트-스트림 데이터(100) 내의 이러한 층 배열은 선택적으로 손실되거나 폐 기될 잔여 신호를 전송하는 제 2 강화층을 허용하며; 게다가, 도 10에 도시된 디코더(600)는 사용자의 이해를 위해 지각적으로 의미있는 잔여 신호를 재생성하기 위해 앞서 설명한 것과 같은 합성 잔여 신호와 디코딩된 잔여층을 결합할 수 있다. 게다가, 디코더(600)에, 예를 들어 비용 및/또는 복잡성 제한으로 인해, 제 2 디코더(640)가 선택적으로 제공되지 않은 경우, 비록 감소된 품질이지만 잔여 신호(s)를 디코딩하는 것이 여전히 가능하다.
게다가, 전술한 내용에서 비트 스트림(bs)(100) 내의 비트율 감소는 인코딩된 각도 파라미터()를 폐기함으로써 가능하다. 이러한 상황에서, 디코더(600) 내의 위상 회전 유닛(680)은 예컨대 0의 값과 같은, 고정된 값의 기본 회전 각을 사용하여 재생성된 출력 신호(l',r')를 재구성하며; 이러한 추가적인 비트율 감소는 더 높은 오디오 주파수에서 사람의 청각 체계가 상대적으로 위상이 민감하지 못한 특성을 이용한다. 일례로서, 파라미터()는 비트 스트림(bs)(100)으로 전송되며 파라미터()는 비트율 감소를 달성하기 위해 이로부터 폐기된다.
앞서 설명된 본 발명에 따른 인코더 및 보충 디코더는 예를 들어, 인터넷 라디오, 인터넷 스트리밍, 전자 음악 분포(EMD), 반도체 오디오 플레이어 및 레코더 뿐만 아니라 일반적인 텔레비전 오디오 제품 중 적어도 하나에서와 같은, 전자 장치 및 시스템에서 광범위하게 잠재적으로 사용될 수 있다.
비트 스트림(100)을 생성하기 위해 입력 신호(l,r)를 인코딩하는 방법이 앞서 설명되었고, 비트 스트림(100)을 디코딩하는 보충적인 방법이 설명되었다고 해 도, 본 발명은 2개 이상의 입력 신호를 인코딩하기 위해 적응될 수 있다는 것을 이해할 것이다. 예컨대, 본 발명은 예컨대, 5-채널 가정용 영화 시스템과 같은, 복수-채널 오디오에 대한 데이터 인코딩 및 대응 디코딩을 제공하기 위해 적응될 수 있다.
첨부한 청구항에서, 괄호 안에 포함된 숫자와 다른 심벌들은 청구항의 이해를 돕기 위해 포함되었으며 어떠한 방법으로도 청구항의 범위를 제한하는 것으로 의도되지 않는다.
앞서 설명된 본 발명의 실시예들은 첨부한 청구항에 의해 정의된 것처럼 본 발명의 범위를 이탈하지 않고 변경될 수 있다는 것을 이해할 것이다.
"포함하다", "포괄하다", "결합하다", "함유하다", "이다" 및 "갖다"와 같은 표현은 상세한 설명 및 그 관련된 청구항을 해석할 때 배타적이지 않게 해석되어야 하며, 즉, 명시적으로 존재하는 것으로 정의되지 않은 다른 항목 또는 성분을 허용하도록 해석되어야 한다. 단수에 대한 참조는 또한 복수에 대한 참조로, 반대의 경우에는 역으로 해석되어야 한다.
본 발명은, 데이터 코딩 방법, 예를 들어, 데이터 성분의 가변 각도 회전을 이용한 오디오 및/또는 이미지 데이터 코딩 방법에 관한 것으로서, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 입력 신호를 인코딩하는 방법 등에 이용가능하다.
Claims (27)
- 대응하는 인코딩된 데이터(100)를 생성하기 위해 복수의 오디오 입력 신호(l,r)를 인코딩하는 방법으로서,(a) 오디오 입력 신호(l,r) 사이의 관련 위상차 및 시간차 중 적어도 하나를 설명하는 제 1 파라미터()를 결정하기 위해 상기 오디오 입력 신호(l,r)를 처리하는 단계, 및 상기 오디오 입력 신호를 처리하여 대응하는 중간 신호를 생성하기 위해 이들 제 1 파라미터()를 적용하는 단계;(b) 주신호(m)와 잔여 신호(s)를 생성하는데 필요한 중간 신호의 회전을 설명하는 제 2 파라미터를 결정하기 위해 중간 신호 및/또는 오디오 입력 신호(l,r)를 처리하는 단계로서, 상기 주신호(m)는 잔여 신호(s)보다 큰 크기 또는 에너지를 가지며, 주신호(m) 및 잔여 신호(s)를 생성하도록 중간 신호를 처리하기 위해 이들 제 2 파라미터를 적용하는 단계;(c) 제 1 파라미터와, 제 2 파라미터를 양자화하는 단계 및 대응하는 양자화된 데이터를 생성하기 위해 주신호(m) 및 잔여 신호(s)의 적어도 일부를 인코딩하는 단계; 및(d) 인코딩된 데이터(100)를 생성하기 위해 양자화된 데이터를 멀티플렉싱하는 단계를 포함하는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
- 제 1항에 있어서, 잔여 신호(s)의 오직 일부만이 인코딩된 데이터(100) 내에 포함된, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
- 제 2항에 있어서, 인코딩된 데이터는 또한 잔여 신호의 일부가 인코딩된 데이터(100)에 포함된 것을 나타내는 하나 이상의 파라미터를 포함하는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
- 제 1항에 있어서, 단계 (a) 및 단계 (b)는 주파수 영역(l[k],r[k])으로 표시된 오디오 입력 신호(l[n],r[n])로 복소 회전(complex rotation)으로 구현된, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
- 제 4항에 있어서, 단계 (a) 및 단계 (b)는 오디오 입력 신호(l[n],r[n])의 하위-대역 상에서 독립적으로 수행되는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
- 제 5항에 있어서, 상기 방법에 의해 인코딩되지 않은 다른 하위-대역은 M/S(Mid/Side) 인코딩 기술을 사용하여 인코딩되는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
- 삭제
- 제 1항에 있어서, 단계 (b)에서 제 2 파라미터는 잔여 신호(s)의 크기 또는 에너지를 최소화함으로써 유도되는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
- 제 1항에 있어서, 제 2 파라미터는 채널간 강도 차이 파라미터와 연접성 파라미터(IID,ρ)에 의해 표시되는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
- 제 1항에 있어서, 상기 제 2 파라미터는 주요 신호(m)와 잔여 신호(s)의 에너지 비율 및 회전각(α)에 의해 표시되는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
- 제 1항에 있어서, 단계 (c) 및 (d)에서, 인코딩된 데이터는 중요한 층 내에 배열되며, 상기 층들은 주요 신호(m)를 전송하는 기본층과, 스테레오 전달 파라미터에 대응하는 제 1 및/또는 제 2 파라미터를 포함하는 제 1 개선층과 잔여 신호(s)의 표시를 전송하는 제 2 개선층을 포함하는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하는 방법.
- 삭제
- 대응하는 인코딩된 데이터(100)를 생성하기 위해 복수의 오디오 입력 신호(l,r)를 인코딩하기 위한 인코더(10;300;500)로서,(a) 오디오 입력 신호(l,r) 사이의 관련 위상차와 시간차 중 적어도 하나를 설명하는 제 1 파라미터()를 결정하기 위해 오디오 입력 신호(l,r)를 처리하기 위한 제 1 처리 수단(20;310;510)으로서, 제 1 처리 수단(20;310;510)은 오디오 입력 신호를 처리하여 대응하는 중간 신호를 생성하기 위해 이들 제 1 파라미터()를 적용하도록 작동하는, 제 1 처리 수단;(b) 주요 신호(m)와 잔여 신호(s)를 생성하는데 필요한 중간 신호의 회전을 설명하는 제 2 파라미터를 결정하기 위해 중간 신호 및/또는 오디오 입력 신호(l,r)를 처리하기 위한 제 2 처리 수단(30,40,50,60;320,340;520,530,540,550)으로서, 상기 주요 신호(m)는 잔여 신호(s)보다 더 큰 크기 또는 에너지를 구비하며, 제 2 처리 수단은 주요 신호(m)와 잔여 신호(s)를 생성하도록 중간 신호를 처리하기 위해 이들 제 2 파라미터를 적용하도록 작동하는, 제 2 처리 수단;(c) 대응하는 양자화된 데이터를 생성하기 위해, 제 1 파라미터(), 제 2 파라미터(α;IID,ρ), 주요 신호(m)와 잔여 신호(s)의 적어도 일부를 양자화하기 위한 양자화 수단(70;360;560); 및(d) 인코딩된 데이터(100)를 생성하기 위해 양자화된 데이터를 멀티플렉싱하기 위한 멀티플렉싱 수단을 포함하는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하기 위한 인코더.
- 삭제
- 제 13항에 있어서, 잔여 신호(s)는 인코딩된 데이터(100)로 조작되며 인코딩되며 멀티플렉싱되는, 대응하는 인코딩된 데이터를 생성하기 위해 복수의 오디오 입력 신호를 인코딩하기 위한 인코더.
- 복수의 오디오 입력 신호(l',r')의 대응하는 표시를 재생성하기 위해 인코딩 데이터(100)를 디코딩하는 방법으로서, 상기 오디오 입력 신호(l,r)는 상기 인코딩된 데이터(100)를 생성하기 위해 이전에 인코딩되며, 상기 방법은,(a) 대응하는 양자화된 데이터를 생성하기 위해 상기 인코딩된 데이터(100)를 디먹스하는 단계;(b) 대응하는 제 1 파라미터(), 제 2 파라미터(α;IID,ρ) 및 적어도 주요 신호(m) 및 잔여 신호(s)를 생성하기 위해 양자화된 데이터를 처리하는 단계로서, 상기 주요 신호(m)는 잔여 신호(s)보다 더 큰 크기 또는 에너지를 가지는, 양자화된 데이터를 처리하는 단계;(c) 대응하는 중간 신호를 생성하기 위해 제 2 파라미터(α;IID,ρ)를 적용함으로써 주요 신호(m)와 잔여 신호(s)를 회전하는 단계; 및(d) 상기 오디오 입력 신호(l,r)의 표시를 재생성하기 위해 제 1 파라미터()를 적용함으로써 중간 신호를 처리하는 단계로서, 제 1 파라미터()는 상기 오디오 입력 신호(l,r) 사이의 관련 위상차 및 시간차 중 적어도 하나를 설명하는, 중간 신호를 처리하는 단계를 포함하는, 인코딩 데이터를 디코딩하는 방법.
- 제 16항에 있어서, 단계 (b)에서, 잔여 신호(s)의 사라진 시간-주파수 정보를 주요 신호(m)에서 유도된 합성 잔여 신호로 보충하는 추가 단계를 포함하는, 인코딩 데이터를 디코딩하는 방법.
- 제 16항에 있어서, 인코딩된 데이터는 잔여 신호(s)의 부분이 인코딩된 데이터로 인코딩되는 것을 나타내는 파라미터를 포함하는, 인코딩 데이터를 디코딩하는 방법.
- 제 16항에 있어서, 디코더는 시간/주파수 평면에 표시될 때 인코딩된 신호(100)의 빈 영역을 검출함으로써 보충을 필요로 하는 인코딩된 신호(100)의 부분을 디코딩하는, 인코딩 데이터를 디코딩하는 방법.
- 제 16항에 있어서, 디코더는 빈 영역을 나타내는 데이터 파라미터를 검출함으로써 교체 또는 보충을 필요로 하는 인코딩된 신호(100)의 부분을 디코딩하는, 인코딩 데이터를 디코딩하는 방법.
- 복수의 오디오 입력 신호(l',r')의 대응하는 표시를 재생성하기 위해 인코딩된 데이터(100)를 디코딩하기 위한 디코더(200;400;600)로서, 상기 오디오 입력 신호(l,r)는 상기 인코딩된 데이터를 생성하기 위해 이전에 인코딩되는, 상기 디코더(200;400;400)는:(a) 대응하는 양자화된 데이터를 생성하기 위해 인코딩된 데이터(100)를 디먹스하기 위한 디먹스 수단(210;410;610);(b) 주요 신호 (m)를 생성하기 위해 양자화된 데이터를 디코딩하기 위한 제1 디코딩 수단 ;(c) 잔여 신호 (s)를 생성하기 위해 양자화된 데이터를 디코딩하기 위한 제 2 디코딩 수단으로서, 상기 주요 신호(m)는 잔여 신호(s)보다 큰 크기 또는 에너지를 가진, 제 2 디코딩 수단;(e) 대응하는 중간 신호를 생성하기 위해 제 2 파라미터(α;IID,ρ)를 적용함으로써 주요 신호(m)와 잔여 신호(s)를 회전하기 위한 제 2 처리 수단; 및(f) 대응하는 오디오 입력 신호(l,r)를 생성하기 위해 제 1 파라미터()를 적용함으로써 중간 신호를 처리하는 제 3 처리 수단으로서, 상기 제 1 파라미터()는 신호(l,r) 사이의 관련 위상차와 시간차 중 적어도 하나를 설명하는, 제 3 처리 수단을 포함하는, 인코딩된 데이터를 디코딩하기 위한 디코더.
- 제 21항에 있어서, 제 2 처리 수단은 디코딩된 잔여 신호(s)에서 없어진 정보를 제공하기 위해 디코딩된 주요 신호(m)(630)로부터 유도된 보충 합성 잔여 신호를 생성하도록 작동하는, 인코딩된 데이터를 디코딩하기 위한 디코더.
- 제 22항에 있어서, 제 1 처리 수단은, 어떤 부분의 잔여 신호(s)가 전체 잔여 신호(s)를 생성하기 위해 잔여 신호의 없어진 비-코딩된 부분을 합성하기 위해 상기 제2 디코딩 수단에 의하여 디코딩되었는지를 결정하도록 작동하는, 인코딩된 데이터를 디코딩하기 위한 디코더.
- 계산 하드웨어 상에서 제 1항의 방법을 실행하기 위한 소프트웨어를 저장하는 컴퓨터 판독 가능한 기록 매체.
- 계산 하드웨어 상에서 제 16항의 방법을 실행하기 위한 소프트웨어를 저장하는 컴퓨터 판독 가능한 기록 매체.
- 삭제
- 삭제
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04101405 | 2004-04-05 | ||
EP04101405.1 | 2004-04-05 | ||
EP04103168 | 2004-07-05 | ||
EP04103168.3 | 2004-07-05 | ||
PCT/IB2005/051058 WO2005098825A1 (en) | 2004-04-05 | 2005-03-29 | Stereo coding and decoding methods and apparatuses thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070001207A KR20070001207A (ko) | 2007-01-03 |
KR101135726B1 true KR101135726B1 (ko) | 2012-04-16 |
Family
ID=34961999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067020275A KR101135726B1 (ko) | 2004-04-05 | 2005-03-29 | 인코더, 디코더, 인코딩 방법, 디코딩 방법 및 기록 매체 |
Country Status (13)
Country | Link |
---|---|
US (2) | US7646875B2 (ko) |
EP (3) | EP1944758A3 (ko) |
JP (1) | JP5032978B2 (ko) |
KR (1) | KR101135726B1 (ko) |
CN (2) | CN101887726B (ko) |
BR (1) | BRPI0509108B1 (ko) |
DK (1) | DK3561810T3 (ko) |
ES (1) | ES2945463T3 (ko) |
MX (1) | MXPA06011396A (ko) |
PL (1) | PL3561810T3 (ko) |
RU (1) | RU2392671C2 (ko) |
TW (1) | TWI387351B (ko) |
WO (1) | WO2005098825A1 (ko) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1944758A3 (en) * | 2004-04-05 | 2014-09-10 | Koninklijke Philips N.V. | Method of coding data |
BRPI0517949B1 (pt) * | 2004-11-04 | 2019-09-03 | Koninklijke Philips Nv | dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador |
KR101183859B1 (ko) * | 2004-11-04 | 2012-09-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다중채널 오디오 신호들의 인코딩 및 디코딩 |
RU2416129C2 (ru) * | 2005-03-30 | 2011-04-10 | Конинклейке Филипс Электроникс Н.В. | Масштабируемое многоканальное кодирование звука |
KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US8422555B2 (en) * | 2006-07-11 | 2013-04-16 | Nokia Corporation | Scalable video coding |
US7461106B2 (en) * | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
US8064624B2 (en) | 2007-07-19 | 2011-11-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for generating a stereo signal with enhanced perceptual quality |
US8576096B2 (en) * | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
US8209190B2 (en) * | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
KR101426271B1 (ko) | 2008-03-04 | 2014-08-06 | 삼성전자주식회사 | 영상의 부호화, 복호화 방법 및 장치 |
US20090234642A1 (en) * | 2008-03-13 | 2009-09-17 | Motorola, Inc. | Method and Apparatus for Low Complexity Combinatorial Coding of Signals |
US8639519B2 (en) * | 2008-04-09 | 2014-01-28 | Motorola Mobility Llc | Method and apparatus for selective signal coding based on core encoder performance |
CN101604524B (zh) * | 2008-06-11 | 2012-01-11 | 北京天籁传音数字技术有限公司 | 立体声编码方法及其装置、立体声解码方法及其装置 |
WO2009153995A1 (ja) * | 2008-06-19 | 2009-12-23 | パナソニック株式会社 | 量子化装置、符号化装置およびこれらの方法 |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
EP2313886B1 (en) * | 2008-08-11 | 2019-02-27 | Nokia Technologies Oy | Multichannel audio coder and decoder |
US9330671B2 (en) * | 2008-10-10 | 2016-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Energy conservative multi-channel audio coding |
US8140342B2 (en) * | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
US8219408B2 (en) * | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8200496B2 (en) * | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8175888B2 (en) | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
KR20100089705A (ko) * | 2009-02-04 | 2010-08-12 | 삼성전자주식회사 | 3차원 영상 부호화/복호화 장치 및 방법 |
CN101826326B (zh) * | 2009-03-04 | 2012-04-04 | 华为技术有限公司 | 一种立体声编码方法、装置和编码器 |
TWI451664B (zh) * | 2009-03-13 | 2014-09-01 | Foxnum Technology Co Ltd | 編碼器組合 |
KR101710113B1 (ko) | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
US8301803B2 (en) * | 2009-10-23 | 2012-10-30 | Samplify Systems, Inc. | Block floating point compression of signal data |
CN101705113B (zh) * | 2009-10-30 | 2012-12-19 | 清华大学 | 一种带引射器的气流床气化炉水冷循环系统 |
KR20110049068A (ko) * | 2009-11-04 | 2011-05-12 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US8942989B2 (en) | 2009-12-28 | 2015-01-27 | Panasonic Intellectual Property Corporation Of America | Speech coding of principal-component channels for deleting redundant inter-channel parameters |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8428936B2 (en) * | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
EP2523472A1 (en) | 2011-05-13 | 2012-11-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method and computer program for generating a stereo output signal for providing additional output channels |
CN102226852B (zh) * | 2011-06-13 | 2013-01-09 | 广州市晶华光学电子有限公司 | 一种数码体视显微镜的成像系统 |
JP5737077B2 (ja) * | 2011-08-30 | 2015-06-17 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
CN104471641B (zh) * | 2012-07-19 | 2017-09-12 | 杜比国际公司 | 用于改善对多声道音频信号的呈现的方法和设备 |
KR20140017338A (ko) * | 2012-07-31 | 2014-02-11 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 처리 장치 및 방법 |
US9129600B2 (en) | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
US9754596B2 (en) | 2013-02-14 | 2017-09-05 | Dolby Laboratories Licensing Corporation | Methods for controlling the inter-channel coherence of upmixed audio signals |
WO2014126688A1 (en) | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
GB2542511B (en) * | 2014-09-19 | 2018-09-12 | Imagination Tech Ltd | Data compression |
WO2016136341A1 (ja) * | 2015-02-25 | 2016-09-01 | 株式会社ソシオネクスト | 信号処理装置 |
CN109155705B (zh) * | 2016-06-20 | 2021-12-07 | 苹果公司 | 用于对编码块进行组合和解码的设备 |
US10224042B2 (en) * | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
US10535357B2 (en) * | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
US10580420B2 (en) * | 2017-10-05 | 2020-03-03 | Qualcomm Incorporated | Encoding or decoding of audio signals |
GB201718341D0 (en) | 2017-11-06 | 2017-12-20 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
GB2572650A (en) | 2018-04-06 | 2019-10-09 | Nokia Technologies Oy | Spatial audio parameters and associated spatial audio playback |
CN110556116B (zh) | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
GB2574239A (en) * | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Signalling of spatial audio parameters |
CN110556117B (zh) * | 2018-05-31 | 2022-04-22 | 华为技术有限公司 | 立体声信号的编码方法和装置 |
CN112997248B (zh) | 2018-10-31 | 2024-11-01 | 诺基亚技术有限公司 | 确定空间音频参数的编码和相关联解码 |
TWI702780B (zh) * | 2019-12-03 | 2020-08-21 | 財團法人工業技術研究院 | 提升共模瞬變抗擾度的隔離器及訊號產生方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL9100173A (nl) * | 1991-02-01 | 1992-09-01 | Philips Nv | Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting. |
DE4209544A1 (de) * | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
JP2693893B2 (ja) * | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
US5727119A (en) * | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
JP4005154B2 (ja) * | 1995-10-26 | 2007-11-07 | ソニー株式会社 | 音声復号化方法及び装置 |
JP3707153B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
JP4327420B2 (ja) * | 1998-03-11 | 2009-09-09 | パナソニック株式会社 | オーディオ信号符号化方法、及びオーディオ信号復号化方法 |
US6556966B1 (en) * | 1998-08-24 | 2003-04-29 | Conexant Systems, Inc. | Codebook structure for changeable pulse multimode speech coding |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
CZ300954B6 (cs) * | 1999-01-07 | 2009-09-23 | Koninklijke Philips Electronics N. V. | Zarízení a zpusob pro kódování digitálního informacního signálu, zarízení pro dekódování a nosic záznamu |
US6539357B1 (en) * | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
US6397175B1 (en) * | 1999-07-19 | 2002-05-28 | Qualcomm Incorporated | Method and apparatus for subsampling phase spectrum information |
WO2003085643A1 (en) * | 2002-04-10 | 2003-10-16 | Koninklijke Philips Electronics N.V. | Coding of stereo signals |
US7933415B2 (en) * | 2002-04-22 | 2011-04-26 | Koninklijke Philips Electronics N.V. | Signal synthesizing |
JP4322207B2 (ja) * | 2002-07-12 | 2009-08-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化方法 |
ATE339759T1 (de) * | 2003-02-11 | 2006-10-15 | Koninkl Philips Electronics Nv | Audiocodierung |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
EP1944758A3 (en) * | 2004-04-05 | 2014-09-10 | Koninklijke Philips N.V. | Method of coding data |
BRPI0517949B1 (pt) * | 2004-11-04 | 2019-09-03 | Koninklijke Philips Nv | dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
-
2005
- 2005-03-29 EP EP08153026.3A patent/EP1944758A3/en not_active Withdrawn
- 2005-03-29 JP JP2007506882A patent/JP5032978B2/ja active Active
- 2005-03-29 EP EP05718587A patent/EP1735778A1/en not_active Withdrawn
- 2005-03-29 PL PL19167336.7T patent/PL3561810T3/pl unknown
- 2005-03-29 MX MXPA06011396A patent/MXPA06011396A/es active IP Right Grant
- 2005-03-29 RU RU2006139036/09A patent/RU2392671C2/ru active
- 2005-03-29 US US10/599,564 patent/US7646875B2/en active Active
- 2005-03-29 BR BRPI0509108-0A patent/BRPI0509108B1/pt active IP Right Grant
- 2005-03-29 CN CN2010101493135A patent/CN101887726B/zh active Active
- 2005-03-29 CN CN2005800121024A patent/CN1973320B/zh active Active
- 2005-03-29 EP EP19167336.7A patent/EP3561810B1/en active Active
- 2005-03-29 WO PCT/IB2005/051058 patent/WO2005098825A1/en active Application Filing
- 2005-03-29 DK DK19167336.7T patent/DK3561810T3/da active
- 2005-03-29 ES ES19167336T patent/ES2945463T3/es active Active
- 2005-03-29 KR KR1020067020275A patent/KR101135726B1/ko active IP Right Grant
- 2005-04-01 TW TW094110557A patent/TWI387351B/zh active
-
2009
- 2009-11-23 US US12/623,676 patent/US8254585B2/en active Active
Non-Patent Citations (1)
Title |
---|
FALLER C ET AL: "BINAURAL CUE CODING: A NOVEL AND EFFICIENT REPRESENTATION OF SPATIAL AUDIO" AUDIO ENGINEERING SOCIETY CONVENTION PAPER, 10 MAY 2002. * |
Also Published As
Publication number | Publication date |
---|---|
TWI387351B (zh) | 2013-02-21 |
EP1735778A1 (en) | 2006-12-27 |
WO2005098825A1 (en) | 2005-10-20 |
RU2392671C2 (ru) | 2010-06-20 |
JP2007531915A (ja) | 2007-11-08 |
BRPI0509108B1 (pt) | 2019-11-19 |
MXPA06011396A (es) | 2006-12-20 |
EP3561810B1 (en) | 2023-03-29 |
US20110106540A1 (en) | 2011-05-05 |
PL3561810T3 (pl) | 2023-09-04 |
TW200603637A (en) | 2006-01-16 |
ES2945463T3 (es) | 2023-07-03 |
US8254585B2 (en) | 2012-08-28 |
US7646875B2 (en) | 2010-01-12 |
JP5032978B2 (ja) | 2012-09-26 |
EP1944758A2 (en) | 2008-07-16 |
DK3561810T3 (da) | 2023-05-01 |
CN101887726A (zh) | 2010-11-17 |
CN101887726B (zh) | 2013-11-20 |
EP1944758A3 (en) | 2014-09-10 |
RU2006139036A (ru) | 2008-05-20 |
BRPI0509108A (pt) | 2007-08-28 |
CN1973320B (zh) | 2010-12-15 |
EP3561810A1 (en) | 2019-10-30 |
CN1973320A (zh) | 2007-05-30 |
US20070171944A1 (en) | 2007-07-26 |
KR20070001207A (ko) | 2007-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101135726B1 (ko) | 인코더, 디코더, 인코딩 방법, 디코딩 방법 및 기록 매체 | |
US8804967B2 (en) | Method for encoding and decoding multi-channel audio signal and apparatus thereof | |
JP5265358B2 (ja) | パラメトリックマルチチャネルオーディオ符号化とマトリックスサラウンドマルチチャネル符号化との間のギャップを埋めるための概念 | |
JP4772279B2 (ja) | オーディオ信号のマルチチャネル/キュー符号化/復号化 | |
JP6069208B2 (ja) | 逆位相のチャネルに対する、改善されたステレオパラメトリック符号化/復号 | |
AU2006228821B2 (en) | Device and method for producing a data flow and for producing a multi-channel representation | |
KR100947013B1 (ko) | 멀티채널 오디오 신호의 시간적 및 공간적 정형 | |
KR101315077B1 (ko) | 멀티-채널 오디오 데이터를 인코딩 및 디코딩하기 위한 방법, 및 인코더들 및 디코더들 | |
RU2185024C2 (ru) | Способ и устройство масштабированного кодирования и декодирования звука | |
US20110211703A1 (en) | Stereo Compatible Multi-Channel Audio Coding | |
US20070078646A1 (en) | Method and apparatus to encode/decode audio signal | |
AU2003243441B2 (en) | Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components | |
JP2008519306A (ja) | 信号の組のエンコード及びデコード | |
JP2019506633A (ja) | 改良されたミッド/サイド決定を持つ包括的なildを持つmdct m/sステレオのための装置および方法 | |
JPH09252254A (ja) | オーディオ復号装置 | |
KR100891666B1 (ko) | 믹스 신호의 처리 방법 및 장치 | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
US20110051935A1 (en) | Method and apparatus for encoding and decoding stereo audio | |
EP1016231A1 (en) | Fast synthesis sub-band filtering method for digital signal decoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20160329 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170323 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20180323 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190325 Year of fee payment: 8 |