KR101169280B1 - 오디오 신호의 디코딩 방법 및 장치 - Google Patents
오디오 신호의 디코딩 방법 및 장치 Download PDFInfo
- Publication number
- KR101169280B1 KR101169280B1 KR1020087021436A KR20087021436A KR101169280B1 KR 101169280 B1 KR101169280 B1 KR 101169280B1 KR 1020087021436 A KR1020087021436 A KR 1020087021436A KR 20087021436 A KR20087021436 A KR 20087021436A KR 101169280 B1 KR101169280 B1 KR 101169280B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- audio signal
- information
- timeslot
- spatial information
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 236
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000013507 mapping Methods 0.000 claims description 21
- 230000005540 biological transmission Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 238000005192 partition Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
본 발명은 오디오 신호의 처리에 관한 것으로서, 특히 오디오 신호 디코딩 방법 및 그 장치에 관한 것이다.
일반적으로 오디오 신호의 경우, 인코딩 장치는 다채널 오디오 신호를 각각 압축하는 대신 오디오 신호를 모노 혹은 스테레오 형태의 다운믹스 신호로 압축하고, 압축된 다운믹스 신호를 공간 정보 신호(spatial information signal)와 함께 디코딩 장치로 전송하거나 저장 매체에 저장한다. 여기서, 공간 정보 신호는 다채널 오디오 신호를 다운믹싱할 때 추출되는 것으로 다운믹스 신호로부터 원래의 다채널 오디오 신호를 복원할 때 사용된다.
일반적으로 환경 설정 정보는 불변이므로 이 정보를 포함하는 헤더는 오디오 신호에 초기에 한 번 삽입되어 전송되므로 임의의 순간부터 오디오 신호를 재생할 경우 오디오 신호 디코딩 장치는 환경 설정 정보가 없어 공간 정보를 디코딩하지 못하는 문제가 있다.
또한, 오디오 신호 인코딩 장치는 다운믹스 신호와 공간 정보 신호를 함께 또는 각각 비트스트림 형태로 생성하여 오디오 신호 디코딩 장치로 전송하므로 공간 정보 신호에 불필요한 정보 등이 포함될 경우 신호 압축 및 전송 효율이 떨어진다는 문제가 있다.
본 발명이 이루고자 하는 기술적 과제는, 공간 정보 신호에 헤더를 선택적으로 포함시켜 임의의 순간부터 오디오 신호를 재생할 수 있는 오디오 신호 디코딩 방법 및 그 장치를 제공하는 데 있다.
또한, 본 발명이 이루고자 하는 다른 기술적 과제는, 파라미터 세트가 적용되는 타임슬롯의 위치를 가변 비트 수를 사용하여 효율적으로 표현하는 오디오 신호 디코딩 방법 및 그 장치를 제공하는 데 있다.
또한, 본 발명이 이루고자 하는 또 다른 기술적 과제는 다운믹스 신호 배열을 수행하거나 다채널을 스피커와 매핑할 때 요구되는 정보량을 최소한의 가변 비트 수로 표현하여 오디오 신호 압축 및 전송 효율이 높아지는 오디오 신호 디코딩 방법 및 그 장치를 제공하는 데 있다.
또한, 본 발명이 이루고자 하는 또 다른 기술적 과제는 다운믹스 신호 배열을 수행하지 않고 다채널을 스피커에 매핑함으로써 신호 배열에 소요되는 정보량을 감소시키는 오디오 신호 디코딩 방법 및 그 장치를 제공하는 데 있다.
상기 과제를 이루기 위한 본 발명에 의한 오디오 신호 디코딩 방법은 공간 정보 신호와 다운믹스 신호를 포함하는 오디오 신호를 수신하는 단계, 상기 오디오 신호에 포함된 타임슬롯의 수 및 파라미터의 수를 이용하여 타임슬롯의 위치 정보를 획득하는 단계, 상기 타임슬롯의 위치 정보에 근거하여, 상기 공간 정보 신호를 상기 다운믹스 신호에 적용하여 다채널 오디오 신호를 생성하는 단계 및 출력채널에 대응하여 상기 다채널 오디오 신호에 대한 다채널 배열을 수행하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 방법을 제공할 수 있다.
바람직한 실시예에서, 상기 타임슬롯의 위치정보는 가변적 비트수로 표현되는 것을 특징으로 한다. 또한, 상기 위치 정보는 초기값 및 차이값을 포함하며, 상기 초기값은 첫 번째 파라미터가 적용되는 타임슬롯의 상기 위치 정보를 나타내고, 상기 차이값은 두 번째 이후의 파라미터가 적용되는 타임슬롯의 상기 위치 정보를 나타내는 것을 특징으로 한다. 또한, 상기 초기값은 상기 타임슬롯 수 및 상기 파라미터의 수 중 하나 이상을 이용하여 결정되는 가변 비트로 표현되는 것을 특징으로 한다. 또한, 상기 차이값은 상기 타임슬롯 수, 상기 파라미터의 수 및 이전 파라미터가 적용되는 타임슬롯의 위치 정보 중 하나 이상을 이용하여 결정되는 가변적 비트 수로 표현되는 것을 특징으로 한다. 또한, 상기 오디오 신호 디코딩 방법은 미리 정해진 방식으로, 상기 다운믹스 신호에 대한 다운믹스 신호 배열을 수행하는 단계를 더 포함하는 것을 특징으로 한다. 또한, 상기 다운믹스 신호 배열을 수행하는 단계는 두 개의 다운믹스 신호를 세 개의 신호로 업믹싱하는 신호 변환부로 들어가는 다운믹스 신호에 대해서만 수행되는 것을 특징으로 한다. 또한, 상기 다운믹스 신호 배열은 상기 공간 정보 신호에 헤더가 포함된 경우, 상기 헤더로부터 추출한 환경 설정 정보에 포함된 오디오 신호 배열 정보를 이용하여 상기 다운믹스 신호를 배열하는 것을 특징으로 한다. 또한, 제1 항, 제2 항 또는 제6 항 중 어느 한 항에 있어서, i번째 상기 오디오 신호를 매핑하는데 필요한 정보량 또는 i 번째 상기 다운믹스 신호를 배열하는데 필요한 정보량은 전체 오디오 신호 또는 전체 다운믹스 신호의 갯수와 상기 i값의 차에 1을 더한 값을, 2를 밑으로 취하는 로그 함수에 대입할 때 상기 로그 함수 값보다 크거가 같은 최소한의 정수인 것을 특징으로 한다. 또한, 상기 다채널 배열 단계는 오디오 신호를 스피커에 대응하여 배열하는 단계를 더 포함하는 것을 특징으로 한다.
본 발명의 다른 실시 예에 따르면, 오디오 신호를 다채널 오디오 신호로 업믹싱하는 업믹싱부 및 상기 다채널 오디오 신호를 미리 정해진 배열에 따라 출력채널에 매핑하는 다채널 배열부를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 장치를 제공할 수 있다.
본 발명의 또 다른 실시 예에 따르면, 인코딩된 다운믹스 신호를 복호화하는 코어 디코딩부, 상기 복호화된 오디오 신호를 미리 정해진 배열에 따라 배열하는 배열부 및 상기 배열된 오디오 신호를 다채널 오디오 신호로 업믹싱하는 업믹싱부를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 장치를 제공할 수 있다.
본 발명에 의한 오디오 신호 디코딩 방법 및 장치는 공간 정보 신호에 헤더를 선택적으로 포함할 수 있다.
또한, 본 발명에 의한 오디오 신호 디코딩 방법 및 장치는 파라미터 세트가 적용되는 타임슬롯의 위치를 가변적인 비트 수로 표현함으로써 전송되는 데이터 양을 줄일 수 있다.
또한, 본 발명에 의한 오디오 신호 디코딩 방법 및 장치는 다운믹스 신호 배 열을 수행하거나 다채널을 스피커와 매핑할 때 요구되는 정보량을 최소한의 가변 비트 수로 표현하여 오디오 신호 압축 및 전송 효율을 높이는 효과를 갖는다.
또한, 본 발명에 의한 오디오 신호 디코딩 방법 및 장치는 다운믹스 신호 배열을 수행하지 않고 코어 디코딩부가 복호화하여 다채널 생성부로 전송한 신호를 순서대로 업믹싱함으로써 오디오 신호를 보다 효율적으로 압축 및 전송할 수 있고 오디오 신호 디코딩 장치의 복잡성이 감소하는 효과를 갖는다.
상기의 목적을 구체적으로 실현할 수 있는 본 발명의 실시 예를 첨부한 도면을 참조하여 설명한다.
도 1은 본 발명의 일 실시 예에 따라 오디오 신호 인코딩 장치에서 오디오 신호 디코딩 장치로 전송되는 오디오 신호의 구성도이다. 도 1에 따른 오디오 신호는 오디오 설명어(101), 다운믹스 신호(103) 그리고 공간 정보 신호(105)를 포함한다.
오디오 신호를 재생하는 코딩 방법을 방송 등에 이용하는 경우 오디오 신호는 오디오 설명어(101), 다운믹스 신호(103) 외에 부가 정보(ancillary data)를 포함할 수 있다. 본 발명은 부가 정보로 공간 정보 신호(105)를 포함한다. 오디오 신호는 오디오 신호 디코딩 장치가 오디오 신호를 분석하지 않고도 오디오 코덱의 기본적인 정보를 알 수 있도록 오디오 설명어(또는 오디오 기술자)(audio descriptor)(101)를 선택적으로 포함할 수 있다. 오디오 설명어(101)는 전송되는 오디오 신호의 전송률, 채널 수, 압축 데이터의 샘플링 주파수, 사용하고 있는 오 디오 코덱을 나타내는 식별자 등 오디오 디코딩에 필요한 기초적인 소수의 정보로 구성된다. 오디오 신호 디코딩 장치는 오디오 설명어(101)를 이용하여 오디오 신호가 사용하는 코덱의 종류가 무엇인지를 알 수 있다. 즉, 오디오 신호 디코딩 장치는 오디오 설명어(101)를 이용하여 오디오 신호가 공간 정보 신호(105)와 다운믹스 신호(103)를 이용하여 멀티 채널을 형성하는지 여부 등을 알 수 있다. 오디오 설명어(101)는 오디오 신호에 포함되어 있는 다운믹스 신호(103) 또는 공간 정보 신호(105)와는 독립적으로 위치한다. 예를 들면 오디오 설명어(101)는 오디오 신호를 표시하는 별도의 필드 안에 위치한다. 다운믹스 신호(103)에 헤더가 없는 경우 오디오 신호 디코딩 장치는 오디오 설명어(101)를 이용하여 다운믹스 신호(103)를 디코딩할 수 있다.
다운믹스 신호(103)는 멀티 채널을 다운 믹싱하여 생성되는 신호로 오디오 신호 인코딩 장치에 포함된 다운믹싱부를 통해 생성되거나 또는 인위적으로 생성될 수도 있다. 다운믹스 신호(103)는 헤더를 포함하는 경우와 그렇지 않은 경우로 나뉜다. 다운믹스 신호(103)가 헤더를 포함하는 경우에는 프레임 단위로 매 프레임에 헤더가 포함되어 있다. 다운믹스 신호(103)가 헤더를 포함하지 않는 경우에는 앞에서 언급한 바와 같이 오디오 설명어(101)를 이용하여 다운믹스 신호(103)를 디코딩할 수 있다. 다운믹스 신호(103)는 프레임마다 헤더를 포함하거나 또는 프레임에 헤더를 포함하지 않거나 둘 중 하나의 형태로 콘텐츠가 끝날 때까지 동일하게 오디오 신호에 포함된다.
공간 정보 신호(105) 또한 헤더(107)와 공간 정보(111)를 포함하는 경우와 헤더(107)를 포함하지 않고 공간 정보(111)만 포함하는 경우로 나뉜다. 공간 정보 신호(105)의 헤더(107)는 매 프레임에 동일하게 들어가야 하는 것은 아니라는 점에서 다운믹스 신호(103)의 헤더와는 구별된다. 공간 정보 신호(105)는 헤더(107)를 포함하는 프레임과 그렇지 않은 프레임을 함께 사용할 수 있다. 공간 정보 신호(105)의 헤더(107)에 포함되는 대부분의 정보는 공간 정보(111)를 해독하여 공간 정보(111)를 디코딩하는 정보인 환경 설정 정보(109)이다. 공간 정보(111)는 프레임으로 구성되고 각 프레임은 타임슬롯으로 구성된다.
타임슬롯은 공간 정보(111) 프레임을 시간 간격으로 나눌 때 각각의 시간 간격을 의미한다. 하나의 프레임에 포함되는 타임슬롯 개수는 환경 설정 정보(109)에 포함되어있다.
환경 설정 정보(109)에는 타임슬롯 개수 외에도 신호 배열 정보, 신호 변환부 개수, 채널 구성 정보, 스피커 매핑 정보 등이 포함되어 있다. 신호 배열 정보는 복호화된 다운믹스 신호(103)를 다채널로 복원하기 전에 업믹싱을 위해 오디오 신호를 배열할 것인가를 표시하는 식별자이다.
신호 변환부는 다운믹스 신호(103)를 업믹싱하여 다채널을 생성할 때, 한 개의 다운믹스 신호(103)를 두 개의 신호로 또는 두 개의 다운믹스 신호(103)를 세 개의 신호로 변환하기 위해 사용되는 OTT(One-To-Two) BOX 또는 TTT(Two-To-Three) BOX 등을 의미한다. OTT BOX 또는 TTT BOX는 오디오 신호 디코딩 장치의 업믹싱부(미도시)에 포함되어 다채널을 복원할 때 사용되는 개념적인 BOX이다. 공간 정보 신호(105)에는 신호 변환부의 종류 및 개수 등의 정보가 포함되어 있다.
채널 구성 정보는 오디오 신호 디코딩 장치에 포함된 업믹싱부의 구성을 표현하는 정보이다. 채널 구성 정보는 오디오 신호가 신호 변환부를 거치는지 여부를 표현하는 식별자로 구성되어 있다. 오디오 신호 디코딩 장치는 채널 구성 정보를 이용하여 업믹싱부로 입력되는 오디오 신호가 신호 변환부를 거치는지 여부 등을 알 수 있다. 오디오 신호 디코딩 장치는 신호 변환부에 대한 정보, 채널 구성 정보 등을 이용하여 다운믹스 신호(103)를 다채널 오디오 신호로 업믹싱한다. 오디오 신호 디코딩 장치는 공간 정보(111)에 포함된 상기 신호 변환부 정보, 채널 구성 정보 등을 이용하여 다운믹스 신호(103)를 업믹싱하여 다채널을 생성한다.
스피커 매핑 정보는 업믹싱하여 생성된 다채널 오디오 신호를 스피커로 출력할 때 다채널 오디오 신호를 각각 어느 스피커에 매핑할 것인가를 표시하는 정보이다. 오디오 신호 디코딩 장치는 환경 설정 정보(109)에 포함된 스피커 매핑 정보를 이용하여 다채널 오디오 신호를 스피커로 출력한다.
공간 정보(111)는 다운믹스 신호와 결합하여 다채널 오디오 신호를 생성할 때 공간감을 주기 위해 사용되는 정보이다. 공간 정보(111)에는 오디오 신호들 사이의 에너지 차이를 나타내는 CLD(Channel Level Differences), 오디오 신호들 간의 긴밀성 내지는 유사성을 나타내는 ICC(Interchannel Correlations), 다른 신호들을 이용하여 오디오 신호 값을 예상하는 계수를 나타내는 CPC(Channel Prediction Coefficients)등의 파라미터들이 포함되어 있다. 파라미터 세트는 이러한 파라미터들의 묶음이다.
공간 정보(111)에는 파라미터 외에도 파라미터 세트가 적용되는 타임슬롯의 위치가 고정되어 있는지 여부를 표현하는 프레임 식별자, 하나의 프레임에 적용되는 파라미터 세트의 개수, 파라미터 세트가 적용되는 타임슬롯의 위치 정보 등이 포함되어 있다.
도 2는 본 발명의 다른 실시 예에 따른 오디오 신호 디코딩 방법을 나타내는 순서도이다. 오디오 신호 디코딩 장치는 오디오 신호 인코딩 장치가 비트 스트림 형태로 전송한 공간 정보 신호(105)를 수신한다(단계 201). 공간 정보 신호(105)는 다운믹스 신호(103)와는 별도의 스트림 형태로 전송되거나 다운믹스 신호(103)의 보조 데이터 또는 부가 데이터에 포함되어 전송된다. 공간 정보 신호(105)가 다운믹스 신호(103)와 결합되어 전송되는 경우, 오디오 신호의 역다중화부(미도시)는 수신한 오디오 신호를 인코딩된 다운믹스 신호(103)와 인코딩된 공간 정보 신호(105)로 분리한다. 인코딩된 공간 정보 신호는 헤더(107)와 공간 정보(111)를 포함한다. 오디오 신호 디코딩 장치는 공간 정보 신호(105)에 헤더(107)가 포함되어 있는지를 판단하고(단계 203), 공간 정보 신호(105)에 헤더(107)가 포함되어 있는 경우 헤더(107)로부터 환경 설정 정보(109)를 추출한다(단계 205). 오디오 신호 디코딩 장치는 환경 설정 정보(109)가 공간 정보 신호(105)에 포함된 첫 번째 헤더(107)로부터 추출된 환경 설정 정보(109)인지를 판단한다(단계 207). 환경 설정 정보(109)가 공간 정보 신호(105)에서 첫 번째로 추출한 헤더(107)로부터 추출된 경우, 환경 설정 정보(109)를 디코딩하고(단계 215) 디코딩된 환경 설정 정보(109)에 따라 환경 설정 정보(109) 뒤로 전송되는 공간 정보(111)를 디코딩한다.
오디오 신호에서 추출된 헤더(107)가 공간 정보 신호(105)에서 첫 번째로 추 출된 헤더(107)가 아닌 경우, 헤더(107)에서 추출된 환경 설정 정보(109)가 첫 번째 헤더(107)로부터 추출된 환경 설정 정보(109)와 동일한지를 판단한다(단계 209). 환경 설정 정보(109)가 첫 번째 헤더(107)로부터 추출된 환경 설정 정보(109)와 동일한 경우에는 첫 번째 헤더(107)로부터 추출하여 디코딩한 환경 설정 정보(109)를 이용하여 공간 정보(111)를 디코딩한다. 추출한 환경 설정 정보(109)가 첫 번째 헤더(107)로부터 추출된 환경 설정 정보(109)와 동일하지 않은 경우에는 오디오 신호 인코딩 장치로부터 오디오 신호 디코딩 장치로 전송되는 경로 상에서 오디오 신호에 에러가 발생한 것인지를 판단한다(단계 211). 환경 설정 정보(109)가 가변인 경우에는 환경 설정 정보(109)가 첫 번째 헤더(107)로부터 추출된 환경 설정 정보(109)와 동일하지 않아도 에러가 발생한 것이 아니므로 헤더(107)를 가변인 헤더(107)로 갱신하고(단계 213), 갱신한 헤더(107)에서 추출된 환경 설정 정보(109)를 디코딩한다(단계 215). 오디오 신호 디코딩 장치는 디코딩한 환경 설정 정보(109)에 따라 환경 설정 정보(109) 뒤로 전송되는 공간 정보(111)를 디코딩한다. 환경 설정 정보(109)가 가변이 아님에도 첫 번째 헤더(107)로부터 추출된 환경 설정 정보(109)와 동일하지 않은 경우 오디오 신호 전송 경로 상에서 에러가 발생한 것이므로 에러가 발생한 환경 설정 정보(109)를 포함하는 공간 정보 신호(105)에 포함된 공간 정보(111)를 제거하거나 또는 공간 정보(111)의 에러를 정정한다(단계 217).
도 3은 본 발명의 또 다른 실시 예에 따른 오디오 신호 디코딩 방법을 나타내는 순서도이다. 오디오 신호 디코딩 장치는 오디오 신호 인코딩 장치로부터 다운 믹스 신호(103)와 공간 정보 신호(105)를 포함하는 오디오 신호를 수신한다(단계 301). 오디오 신호 디코딩 장치는 수신한 오디오 신호를 공간 정보 신호(105)와 다운믹스 신호(103)로 분리하고(단계 303), 분리된 공간 정보 신호(105)와 다운믹스 신호(103)를 각각 코어 디코딩부(미도시)와 공간 정보 디코딩부(미도시)로 보낸다.
오디오 신호 디코딩 장치는 공간 정보 신호(105)로부터 타임슬롯 개수와 파라미터 세트 개수를 추출한다. 오디오 신호 디코딩 장치는 추출한 타임슬롯 개수와 파라미터 세트 개수를 이용하여 파라미터 세트가 적용되는 타임슬롯의 위치를 구한다. 몇 번째 파라미터 세트인가에 따라 파라미터 세트가 적용되는 타임슬롯의 위치는 가변적 비트 수로 표현된다. 파라미터 세트가 적용될 타임슬롯의 위치를 표시하는 비트 수를 감소시킴으로써 공간 정보 신호(105)를 효율적으로 표현할 수 있다. 파라미터 세트가 적용되는 타임슬롯의 위치에 대해서는 이후 살펴볼 도 4 내지 5에서 상세히 설명하기로 한다. 오디오 신호 디코딩 장치는 타임슬롯 위치가 구해지면, 그 위치에 파라미터 세트를 적용하여 공간 정보 신호(105)를 디코딩한다(단계 305). 또한, 오디오 신호 디코딩 장치는 다운믹스 신호(103)를 코어 디코딩부에서 디코딩한다(단계 305).
오디오 신호 디코딩 장치는 디코딩된 다운믹스 신호(103)를 그대로 업믹싱하여 다채널을 생성할 수도 있으나 디코딩된 다운믹스 신호(103) 순서를 배열한 후에 업믹싱 할 수도 있다(단계 307).
오디오 신호 디코딩 장치는 디코딩된 다운믹스 신호(103)와 디코딩된 공간 정보 신호(105)를 이용하여 다채널을 생성한다(단계 309). 오디오 신호 디코딩 장 치는 다운믹스 신호(103)를 다채널로 생성하기 위해 공간 정보 신호(105)를 이용하는데, 공간 정보 신호(105)는 앞에서도 설명한 바와 같이 신호 변환부 개수, 다운믹스 신호(103)가 업믹싱될 때 신호 변환부를 거치는지 또는 신호 변환부를 거치치 않고 출력되는지 등을 표현하는 채널 구성 정보를 포함한다. 오디오 신호 디코딩 장치는 신호 변환부 개수, 채널 구성 정보 등을 이용하여 다운믹스 신호(103)를 업믹싱한다(단계 309). 채널 구성 정보를 표현하는 방법 및 보다 적은 비트 수를 이용하여 채널 구성 정보를 표현하는 방법에 대해서는 이후 살펴볼 도 6 내지 7을 이용하여 설명하기로 한다.
오디오 신호 디코딩 장치는 생성된 다채널 오디오 신호를 출력하기 위해 미리 정해진 순서대로 다채널 오디오 신호를 스피커에 매핑(mapping)한다(단계 311). 이때, 매핑하는 오디오 신호 순서가 증가함에 따라 다채널 오디오 신호를 스피커에 매핑하기위한 비트 수는 감소한다. 즉, 다채널 오디오 신호에 순서대로 번호를 부여할 경우, 첫 번째 오디오 신호는 전체 스피커 중 어느 하나의 스피커에 매핑될 수 있으므로 오디오 신호를 스피커에 매핑하기 위해 요구되는 정보량이 두 번째 이후의 오디오 신호를 매핑하기 위해 요구되는 정보량보다 크다. 두 번째 이후의 오디오 신호는 이전 오디오 신호와 매핑된 스피커를 제외한 나머지 스피커 중 하나의 스피커에 매핑되므로 매핑하기 위해 요구되는 정보량이 감소한다. 즉, 매핑하는 오디오 신호 순서가 증가함에 따라 오디오 신호를 매핑하기 위해 요구되는 정보량을 표현하는 비트 수를 감소시킴으로써 공간 정보 신호(105)를 효율적으로 표현할 수 있다. 이 같은 방법은 단계 307에서 다운믹스 신호(103)를 배열할 경우에도 사용될 수 있다.
도 4는 본 발명의 일실시 예에 따른 파라미터 세트가 적용되는 타임슬롯의 위치 정보를 나타내는 신택스이다. 도 4를 참조하면, 도 4의 신택스는 'FramingInfo'(401)에 대한 것으로 이는 파라미터 세트 수 및 파라미터 세트가 적용되는 타임슬롯에 대한 정보를 표현한다. 'bsFramingType' 필드(403)는 공간 정보 신호(105)에 포함된 프레임이 고정 프레임(fixed frame)인지, 또는 가변 프레임(variable frame)인지를 나타낸다. 고정 프레임이란 파라미터 세트가 적용되는 타임슬롯 위치가 미리 정해져 있는 프레임을 의미한다. 즉, 미리 정해진 규칙에 따라 파라미터 세트가 적용될 타임슬롯의 위치가 결정되어 있다. 가변 프레임은 파라미터 세트를 적용할 타임슬롯의 위치가 미리 정해져 있지 않은 프레임을 의미한다. 따라서 가변 프레임은 파라미터 세트가 적용될 타임슬롯의 위치를 표현하는 타임슬롯 위치 정보가 더 필요하다. 이하 'bsFramingType'(403)을 프레임이 고정 프레임인지, 가변 프레임인지를 표시하는 '프레임 식별자'라 부르기로 한다.
가변 프레임인 경우, 'bsParamSlot' 필드(407, 411)는 파라미터 세트가 적용될 타임슬롯의 위치 정보를 나타낸다. 'bsParamSlot[0]'(407)는 첫 번째 파라미터 세트가 적용될 타임슬롯의 위치를 표현하고 'bsParamSlot[ps]'(411)는 두 번째 이후의 파라미터 세트가 적용될 타임슬롯의 위치를 표현한다. 첫 번째 파라미터 세트가 적용될 타임슬롯의 위치는 초기값으로 표현되고, 두 번째 이후의 파라미터 세트가 적용될 타임슬롯의 위치는 차이값 ('bsDiffParamSlot[ps]')(409), 즉 'bsParamSlot[ps]'과 'bsParamSlot[ps-1]'의 차로 표현된다. 여기서 ps는 파라미터 세트를 의미한다. 첫 번째 파라미터 세트는 ps=0으로 표현된다. ps는 0부터 전체 파라미터 세트 수보다 작은 값까지 표현된다.
() 파라미터 세트가 적용되는 타임슬롯의 위치(407, 409)는 ps 값이 커짐에 따라 증가하고(bsParamSlot[ps]> bsParamSlot[ps-1]), () 첫 번째 파라미터 세트가 적용되는 타임슬롯 위치의 최대값은 타임슬롯 개수와 파라미터 세트 수의 차에 1을 더한 값이며 타임슬롯 위치는 'nBitsparamSlot(0)'(413)의 정보량으로 표현된다. () 두 번째 이후의 파라미터 세트에 대하여, N번째 파라미터 세트가 적용되는 타임슬롯 위치는 N-1번째 파라미터 세트가 적용되는 타임슬롯 위치보다 1 이상 크고, 타임슬롯 개수에서 파라미터 세트 수를 뺀 값에 N 값을 더한 값까지 가질 수 있다. 두 번째 이후의 파라미터 세트가 적용될 타임슬롯의 위치(bsParamSlot[ps])는 차이값 ('bsDiffParamSlot[ps]')(409)으로 표현되며 이 값은 'nBitsparamSlot(ps)'(409)의 정보량으로 표현된다. 위 () 내지 ()을 이용하여 파라미터 세트가 적용되는 타임슬롯 위치를 구할 수 있다.
예를 들어 하나의 공간 프레임에 포함되는 타임슬롯이 10개이고 파라미터 세트가 3개인 경우, 첫 번째 파라미터 세트(ps=0)가 적용되는 타임슬롯의 위치는 전체 타임슬롯 개수에서 전체 파라미터 세트 수를 뺀 값에 1을 더한 타임슬롯 위치까지 적용될 수 있다. 즉, 1부터 최대 8 중 어느 한 타임슬롯에 적용될 수 있다. 이는 파라미터 세트가 적용되는 타임슬롯의 위치가 파라미터 세트 번호에 따라 증가함을 고려하면, 나머지 두 개의 파라미터 세트가 적용될 수 있는 타임슬롯의 위치는 최대한 각각 9, 10 이 됨을 생각하면 이해할 수 있다. 따라서 첫 번째 파라미터 세트가 적용될 타임슬롯의 위치(407)는 1 내지 8을 표시하기 위해 3비트가 소요된다. 이를 수식으로 표현하면 ceil(log2(k-i+1))이 될 수 있다. 여기서, k는 타임슬롯의 수, i는 파라미터의 수를 의미한다.
만일 첫 번째 파라미터 세트가 적용되는 타임슬롯의 위치(407)가 5라면, 두 번째 파라미터 세트가 적용될 타임슬롯 위치 (bsParamSlot[1])는 상기 ()에 의해 '5+1=6' 내지 '10-3+2=9' 사이의 값 중에서 선택되어야 한다. 즉, 두 번째 파라미터 세트가 적용될 타임슬롯 위치는 첫 번째 파라미터 세트가 적용될 타임슬롯 위치에 1을 더한 값에 차이값(bsDiffParamSlot[ps]')(409)을 더한 값으로 표현할 수 있다. 차이값(409)은 따라서 0부터 3이 될 수 있고 이는 2비트로 표현할 수 있다. 두 번째 이후의 파라미터 세트에 대해서는 파라미터 세트가 적용될 타임슬롯의 위치를 직접 표시하지 않고 차이값(409)으로 표현함으로써 비트 수를 감소시킬 수 있다. 앞 예에서 보면, 타임슬롯 위치를 직접 표시하면 6 내지 9 중 어느 하나를 표시하기 위해 4비트가 소요되나 차이값으로 표시하면 2비트만 소요될 수 있다.
따라서 파라미터 세트가 적용될 타임슬롯의 위치 정보 표시량(nBitsParamSlot(0)(413), nBitsParamSlot(ps)(415)은 고정된 비트가 아닌 가변적인 비트 수로 표현될 수 있다.
도 5는 본 발명의 다른 실시 예에 따른 파라미터 세트를 타임슬롯에 적용하여 공간 정보 신호를 디코딩하는 방법을 나타내는 순서도이다. 도 5를 참조하면, 오디오 신호 디코딩 장치는 다운믹스 신호(103)와 공간 정보 신호(105)를 포함하는 오디오 신호를 수신한다(단계 501). 오디오 신호 디코딩 장치는 공간 정보 신 호(105)에 헤더(107)가 있는 경우 헤더(107)에 포함된 환경 설정 정보(109)로부터 프레임에 포함되는 타임슬롯의 개수를 추출한다(단계 503). 오디오 신호 디코딩 장치는 공간 정보 신호(105)에 헤더(107)가 포함되어 있지 않은 경우에는 이전에 추출한 헤더(107)에 포함된 환경 설정 정보(109)로부터 타임슬롯의 개수를 추출한다. 오디오 신호 디코딩 장치는 공간 정보 신호(105)로부터 프레임에 적용될 파라미터 세트의 개수를 추출한다(단계 505). 오디오 신호 디코딩 장치는 공간 정보 신호(105)에 포함되어 있는 프레임 식별자를 이용하여 프레임에 파라미터 세트들이 적용되는 타임슬롯의 위치가 고정되어 있는지 가변인지를 판단한다(단계 507). 프레임이 고정 프레임인 경우 오디오 신호 디코딩 장치는 미리 정해진 규칙에 따라 파라미터 세트를 타임슬롯에 적용하여 공간 정보 신호(105)를 디코딩한다(단계 513). 프레임이 가변 프레임인 경우 오디오 신호 디코딩 장치는 첫 번째 파라미터 세트가 적용되는 타임슬롯 위치 정보를 추출한다(단계 509). 앞에서 설명한 바와 같이, 첫 번째 파라미터 세트가 적용되는 타임슬롯 위치는 타임슬롯 개수와 파라미터 세트 수의 차에 1을 더한 값까지 최대 적용될 수 있다. 오디오 신호 디코딩 장치는 첫 번째 파라미터 세트가 적용되는 타임슬롯 위치 정보를 이용하여 두 번째 이후의 파라미터 세트가 적용되는 타임슬롯의 위치 정보를 구한다(단계 511). N이 2보다 크거나 같은 자연수라고 할 때, N번째 파라미터 세트가 적용되는 타임슬롯 위치는 N-1번째 파라미터 세트가 적용되는 타임슬롯 위치보다 1 이상 크고, 타임슬롯 개수에서 파라미터 세트 수를 뺀 값에 N 값을 더한 값까지 가질 수 있다는 것을 이용하여 파라미터 세트가 적용되는 타임슬롯의 위치를 최소 비트 수로 표현할 수 있다. 오디오 신호 디코딩 장치는 구해진 타임슬롯의 위치에 파라미터 세트를 적용하여 공간 정보 신호를 디코딩한다(단계 513).
도 6 및 7은 본 발명의 일 실시 예에 따른 오디오 신호 디코딩 장치의 업믹싱부를 나타낸 것이다. 오디오 신호 디코딩 장치는 오디오 신호 인코딩 장치로부터 수신한 오디오 신호를 다운믹스 신호(103)와 공간 정보 신호(105)로 분리하고 다운믹스 신호(103)와 공간 정보 신호(105)를 각각 디코딩한다. 앞에서 설명한 바와 같이 오디오 신호 디코딩 장치는 타임슬롯에 파라미터를 적용하여 공간 정보 신호(105)를 디코딩한다. 오디오 신호 디코딩 장치는 디코딩된 다운믹스 신호(103)와 공간 정보 신호(105)를 이용하여 다채널 오디오 신호를 생성한다.
오디오 신호 인코딩 장치가 N개의 입력 채널을 M개의 오디오 신호로 압축하여 비트스트림 형태로 오디오 신호 디코딩 장치로 전송하면, 오디오 신호 디코딩 장치는 원래의 N개의 채널을 복원하여 출력하는데 이러한 구성을 N-M-N 구조라고 한다. 경우에 따라, 오디오 신호 디코딩 장치가 N개의 채널을 복원할 수 없는 경우, 공간 정보 신호(105)를 고려하지 않고 다운믹스 신호(103)만을 두 개의 스테레오 신호로 출력하는 경우도 있으나 여기서는 논외로 한다. N, M의 값이 고정된 값으로 정해진 구조를 고정 채널 구조라고 하고 고정되지 않은 임의의 값으로 표현되는 경우를 임의 채널 구조라고 부르기로 한다. 5-1-5, 5-2-5, 7-2-7 등의 고정 채널 구조인 경우, 오디오 신호 인코딩 장치는 오디오 신호에 채널 구조를 포함시켜 전송하고 오디오 신호 디코딩 장치는 이를 읽어 오디오 신호를 디코딩한다.
오디오 신호 디코딩 장치는 M개의 오디오 신호를 N개의 다채널로 복원하기 위해 신호 변환부를 포함하는 업믹싱부를 이용한다. 신호 변환부는 다운믹스 신호(103)를 업믹싱하여 다채널을 생성할 때, 한 개의 다운믹스 신호(103)를 두 개의 신호로 또는 두 개의 다운믹스 신호를 세 개의 신호로 변환하기 위해 사용되는 개념적인 BOX이다.
오디오 신호 디코딩 장치는 공간 정보 신호(105)에 포함된 환경 설정 정보(109)로부터 채널 구성 정보를 추출하여 업믹싱부의 구조를 파악할 수 있다. 앞에서 설명한 바와 같이 채널 구성 정보는 오디오 신호 디코딩 장치에 포함된 업믹싱부의 구성을 표현하는 정보이다. 채널 구성 정보는 오디오 신호가 신호 변환부를 거치는지 여부를 표현하는 식별자로 구성되어 있다. 즉, 채널 구성 정보는 디코딩된 다운믹스 신호가 업믹싱부에서 신호 변환부를 거치는 경우에는 신호 변환부의 입, 출력 신호의 개수가 변하므로 분할 식별자로, 디코딩된 다운믹스 신호가 업믹싱부에서 신호 변환부를 거치지 않는 경우에는 신호 변환부의 입력 신호가 그대로 출력되므로 미분할 식별자로 표현될 수 있다. 본 발명에서는 분할 식별자를 '1'로 미분할 식별자를 '0'으로 표현하기로 한다.
채널 구성 정보를 표현하는 방법은 크게 수평 방법과 수직 방법이 있다. 수평 방법은 오디오 신호가 신호 변환부를 거치는 경우 즉, 채널 구성 정보가 1인 경우에는 신호 변환부를 거쳐 나온 하위 계층 신호가 다시 신호 변환부를 거치는지 여부를 분할 식별자 또는 미분할 식별자로 순차적으로 표시하고, 채널 구성 정보가 0인 경우에는 동일한 계층 또는 상위 계층의 다음 번째의 오디오 신호가 신호 변환부를 거치는지 여부를 분할 식별자 또는 미분할 식별자로 표시하는 방법이다. 수직 방법은 상위 계층의 오디오 신호가 신호 변환부를 거치는지 여부와 무관하게 상위 계층 오디오 신호 전체에 대해 각각의 오디오 신호가 신호 변환부를 거치는지 여부를 분할 식별자 또는 미분할 식별자로 순차적으로 표현한 후, 하위 계층의 오디오 신호에 대해 신호 변환부를 거치는지를 표현하는 방법이다.
이하 동일한 업믹싱부의 구조에 대해 도 6에서는 채널 구성 정보를 수평 방법으로, 도 7에서는 채널 구성 정보를 수직 방법으로 표현한 경우를 예로 들어 설명하기로 한다. 또한, 도 6과 도 7에서는 신호 변환부로 OTT 박스를 예로 들어 설명하기로 한다. 도 6을 참조하면, X1부터 X4까지 4개의 오디오 신호가 업믹싱부로 들어간다. X1은 제1 신호 변환부로 들어가서 두 신호(601, 601)로 변환된다. 업믹싱부에 포함된 신호 변환부는 CLD, ICC 등의 공간 파라미터를 이용하여 오디오 신호를 변환한다. 제1 신호 변환부에서 변환된 신호(601, 603)는 각각 제2 신호 변환부와 제3 신호 변환부로 들어가서 Y1부터 Y4까지의 다채널 오디오 신호로 출력된다. X2는 제4 신호 변환부로 들어가서 각각 Y5, Y6으로 출력된다. X3, X4는 신호 변환부를 거치치 않고 바로 출력된다.
X1이 제1 신호 변환부를 거치므로 채널 구성 정보는 분할 식별자 1로 표현된다. 도 6은 채널 구성 정보를 수평 방법으로 표현하고 있으므로, 채널 구성 정보가 분할 식별자로 표현되면 제1 신호 변환부를 거쳐 나온 두 신호(601, 603)가 신호 변환부를 거치는지 여부를 분할 식별자 또는 미분할 식별자로 순차적으로 표시한 다. 제1 변환부의 두 출력 신호 중 위에 있는 신호(601)는 다시 제2 신호 변환부를 거치므로 분할 식별자 1로 표현된다. 제2 신호 변환부를 거친 신호는 신호 변환부를 거치치 않고 그대로 출력되므로 미분할 식별자 0으로 표현된다. 채널 구성 정보가 0인 경우 동일 계층 또는 상위 계층의 다음 번째의 오디오 신호에 대해 신호 변환부를 거치는지 여부를 분할 식별자 또는 미분할 식별자로 표시하므로 상위 계층의 X2신호에 대해 채널 구성 정보를 표현한다. X2는 제4 신호 변환부를 거치므로 분할 식별자 1로 표현되고 제4 신호 변환부를 거친 신호가 각각 Y5, Y6으로 그대로 출력되므로 미분할 식별자 0으로 표현된다. X3, X4는 신호 변환부를 거치치 않고 바로 출력되므로 미분할 식별자 0으로 표현된다. 따라서 수평 방법으로 채널 구성 정보를 표현하면 110010010000가 된다. 이해를 돕기 위해 여기서는 업믹싱부의 구성을 통해 채널 구성 정보를 추출했지만 오디오 신호 디코딩 장치는 역으로 채널 구성 정보를 읽고 업믹싱부의 구조를 파악한다.
도 7은 도 6과 마찬가지로 X1부터 X4까지 4개의 오디오 신호가 업믹싱부로 들어간다. 수직 방법은 채널 구성 정보를 상위 계층부터 하위 계층 순으로 분할 식별자 또는 미분할 식별자로 표현하므로 우선 최상위계층인 제1 계층(701)의 오디오 신호의 식별자를 순서대로 표시한다. 즉, X1, X2는 각각 제1, 제4 신호 변환부를 거치므로 채널 구성 정보는 각각 1이 되고 X3, X4은 신호 변환부를 거치치 않으므로 채널 구성 정보는 0이 된다. 따라서 제1 계층(701)의 채널 구성 정보는 1100이 된 다. 이 같은 방법에 따라 제2 계층(703), 제3 계층(705)의 채널 구성 정보를 순서대로 표현하면 각각 1100, 0000이 된다. 따라서 수직 방법으로 표현된 전체 채널 구성 정보는 110011000000이 된다.
오디오 신호 디코딩 장치는 상기 채널 구성 정보를 읽고 업믹싱부를 구성한다. 오디오 신호 디코딩 장치가 업믹싱부를 구성하기 위해서는 채널 구성 정보가 수평 방법 또는 수직 방법 중 어느 방법으로 표현되었는지를 나타내는 식별자가 오디오 신호에 포함되어 있어야 한다. 또는 채널 구성 정보를 수평 방법으로 표현하는 것을 원칙으로 하되 수직 방법으로 표현하는 것이 효율적인 경우에는 오디오 신호 인코딩 장치는 채널 구성을 수직 방법으로 표현했음을 알려주는 식별자를 오디오 신호에 포함할 수도 있다.
오디오 신호 디코딩 장치는 수평 방법으로 표현된 채널 구성 정보를 읽고 업믹싱부를 구성할 수 있다. 그러나 수직 방법으로 표현된 채널 구성 정보인 경우, 오디오 신호 디코딩 장치는 업믹싱부에 포함되는 신호 변환부의 개수 또는 입출력 채널의 개수를 알아야 업믹싱부를 구성할 수 있다. 따라서 오디오 신호 디코딩 장치는 공간 정보 신호(105)에 포함된 환경 설정 정보(109)로부터 신호 변환부의 개수 또는 입출력 채널 개수를 추출하여 업믹싱부를 구성할 수 있다.
오디오 신호 디코딩 장치는 채널 구성 정보를 앞에서부터 순서대로 해독하는데 환경 설정 정보(109)로부터 추출한 신호 변환부의 개수만큼 채널 구성 정보에 포함되어 있는 분할 식별자 1의 개수를 감지하면 더 이상의 채널 구성 정보를 읽지 않아도 된다. 분할 식별자 1은 오디오 신호가 신호 변환부로 입력됨을 표시하므로 채널 구성 정보에 포함된 분할 식별자 1의 개수는 업믹싱부에 포함된 신호 변환부의 개수와 같기 때문이다. 즉, 앞에서 예를 든 바와 같이 수직 방법으로 표현된 채널 구성 정보가 110011000000인 경우, 채널 구성 정보를 디코딩하기 위해 총 12비트를 읽어야 하나 오디오 신호 디코딩 장치가 신호 변환부의 개수가 4개임을 감지한 경우에는 채널 구성 정보에 포함된 1의 개수가 네 번 나올 때까지 즉, 채널 구성 정보 중 110011까지만 디코딩한다. 더 이상의 채널 구성 정보를 이용하지 않아도 나머지 값들이 모두 미분할 식별자 0으로 표현되기 때문이다. 따라서 오디오 신호 디코딩 장치는 6비트만큼을 디코딩하지 않아도 되므로 디코딩 효율이 높아진다.
채널 구조가 이미 정해진 고정 채널 구조인 경우에는 신호 변환부의 개수 또는 입출력 채널 개수가 공간 정보 신호(105)에 포함된 환경 설정 정보에 포함되어 있으므로 별도의 정보가 필요 없으나 채널 구조가 정해지지 않은 임의 채널 구조인 경우에는 신호 변환부의 개수나 입출력 채널 개수가 공간 정보 신호(105)에 포함되어 있지 않으므로 신호 변환부의 개수나 입출력 채널 개수 등을 표현하기 위한 별도의 정보가 필요하다.
신호 변환부에 대한 정보를 예로 들어 설명하면, 신호 변환부로 OTT 박스만을 사용하는 경우, 신호 변환부를 표시하는 정보는 최대한 5비트로 표현될 수 있다. 업믹싱부로 들어가는 입력 신호는 OTT 박스 또는 TTT 박스를 거치는 경우 한 개의 입력 신호가 두 개로, 두 개의 입력 신호가 세 개로 변환되므로 출력 채널 수는 입력 신호에 OTT 박스 또는 TTT 박스 개수를 더한 값이 된다. 따라서 신호 변환부의 개수는 출력 채널 수에서 입력 신호 수와 TTT 박스 개수를 뺀 값이 된다. 일 반적으로 출력 채널은 최대 32개까지 사용될 수 있으므로 신호 변환부를 표시하는 정보는 5비트 이내의 값으로 표현된다.
따라서 채널 구성 정보가 수직 방법으로 표현되어 있고, 채널 구조 또한 임의 채널 구조인 경우에는 오디오 신호 인코딩 장치는 공간 정보 신호(105)에 신호 변환부의 개수를 최대 5비트로 별도로 표현해 주어야 한다. 상기 예에서는 6비트의 채널 구성 정보와 신호 변환부를 표시하는 정보 5비트가 소요되므로 총 11비트가 소요된다. 이는 수평 방법으로 표현된 채널 구성 정보보다 업믹싱부를 구성하기 위한 비트량이 감소함을 보여준다. 이와 같이 수직 방법으로 채널 구성 정보를 표현할 경우 비트 수가 감소하는 효과가 있다.
도 8은 본 발명의 일 실시 예에 따른 오디오 신호 디코딩 장치를 나타내는 구성도이다. 도 8을 참조하면 오디오 신호 디코딩 장치는 수신부, 역다중화부, 코어 디코딩부, 공간 정보 디코딩부, 신호 배열부, 다채널 생성부, 스피커 매핑부를 포함한다. 수신부(801)는 오디오 신호 인코딩 장치(미도시)로부터 다운믹스 신호(103)와 공간 정보 신호(105)를 포함하는 오디오 신호를 수신한다. 역다중화부(803)는 수신부(801)가 수신한 오디오 신호를 인코딩된 다운믹스 신호(103)와 인코딩된 공간 정보 신호(105)로 파싱하여 각각 코어 디코딩부(805), 공간 정보 디코딩부(807)로 보낸다. 코어 디코딩부(805)와 공간 정보 디코딩부(807)는 인코딩된 다운믹스 신호와 인코딩된 공간 정보 신호를 각각 복호화한다. 공간 정보 디코딩부(807)는 앞에서 설명한 바와 같이 공간 정보 신호(105)로부터 프레임 식별자, 타임슬롯 개수, 파라미터 세트 개수, 타임슬롯 위치 정보 등을 추출하여 파라미터 세 트를 타임슬롯에 적용하여 공간 정보 신호(105)를 디코딩한다.
*오디오 신호 디코딩 장치는 신호 배열부(809)를 포함할 수 있다. 신호 배열부(809)는 복호화된 다운믹스 신호(103)를 업믹싱하기 위해 복수의 다운믹스 신호(103)를 미리 정해진 배열에 따라 배열하는 곳이다. 즉, N-M-N 채널 구성에서 M 개의 다운믹스 신호를 M'의 오디오 신호로 배열한다. 오디오 신호 디코딩 장치는 코어 디코딩부(805)를 거친 순서 그대로 다운믹스 신호를 업믹싱할 수도 있지만 경우에 따라서는 다운믹스 신호의 순서를 배열하여 업믹싱을 수행하기도 한다. 상황에 따라서는 두 개의 다운믹스 신호를 세 개의 신호로 업믹싱하는 신호 변환부로 들어가는 신호에 대해서만 신호 배열을 수행할 수도 있다. 오디오 신호 인코딩 장치는 오디오 신호가 신호 배열을 수행하는 경우, 또는 TTT 박스의 입력 신호에 대해서만 신호 배열을 수행하는 경우에는 이를 표시하는 신호 배열 정보를 오디오 신호에 포함시켜야 한다. 신호 배열 정보는 오디오 신호를 다채널로 복원하기 전에 업믹싱을 위해 신호 순서를 배열할 것인가, 특정 신호에 대해서만 배열을 수행하는가 등을 표시하는 식별자이다. 오디오 신호 디코딩 장치는 공간 정보 신호(105)에 헤더(107)가 포함된 경우, 헤더(107)로부터 추출한 환경 설정 정보(109)에 포함된 오디오 신호 배열 정보를 이용하여 다운믹스 신호를 배열한다. 오디오 신호 디코딩 장치는 공간 정보 신호(105)에 헤더(107)가 포함되어 있지 않은 경우에는 이전 헤더(107)에 포함되어 있는 환경 설정 정보(109)로부터 추출한 오디오 신호 배열 정보를 이용하여 오디오 신호를 배열할 수도 있다.
오디오 신호 디코딩 장치는 다운믹스 신호 배열을 수행하지 않을 수도 있다. 즉, 오디오 신호 디코딩 장치는 다운믹스 신호 배열을 수행하지 않고 코어 디코딩부(805)가 복호화하여 다채널 생성부(811)로 전송한 신호를 그대로 업믹싱하여 다채널을 생성할 수도 있다. 생성된 다채널을 스피커에 매핑함으로써 신호 배열의 소기 목적은 달성되기 때문이다. 이 경우, 오디오 신호에 다운믹스 신호 배열에 대한 정보를 삽입하지 않음으로써 오디오 신호를 보다 효율적으로 압축 및 전송할 수 있다. 또한, 오디오 신호 디코딩 장치는 신호 배열을 별도로 수행하지 않음으로써 디코딩 장치의 복잡성(complexity)이 감소한다.
신호 배열부(809)는 배열한 다운믹스 신호(103)를 다채널 생성부(811)로 보낸다. 공간 정보 디코딩부(809) 또한 복호화된 공간 정보 신호(105)를 다채널 생성부(811)로 보낸다. 다채널 생성부(811)는 다운믹스 신호(103)와 공간 정보 신호(105)를 이용하여 다채널 오디오 신호를 생성한다.
오디오 신호 디코딩 장치는 다채널 생성부(811)를 거친 오디오 신호를 스피커로 출력하기 위해 스피커 매핑부(813)를 포함한다. 스피커 매핑부(813)는 다채널 오디오 신호를 각각 어느 스피커에 매핑하여 출력할 것인가를 결정한다. 일반적으로 오디오 신호를 출력하기 위해 사용되는 스피커 종류는 아래 표 1에 나타난 바와 같다.
표 1
일반적으로 출력된 오디오 신호와 매핑할 수 있는 스피커는 최대 32개까지 가능하다. 그러므로 표 1에서와 같이 스피커 매핑부(813)는 다채널 오디오 신호에 0부터 31까지 중 특정한 번호(bsOutputChannelPos)를 부여하여 각각의 번호에 해당하는 스피커(Loudspeaker)에 오디오 신호가 매핑되도록 한다. 이때 다채널 생성부(811)에서 출력된 다채널 오디오 신호 중 첫 번째 오디오 신호를 스피커에 매핑 하기 위해서는 전체 32개의 스피커 중 어느 하나의 스피커를 선택해야 하므로 5비트가 소요된다. 두 번째 오디오 신호를 스피커에 매핑하기 위해서는 남은 31개의 스피커 중 어느 하나의 스피커를 선택해야 하므로 역시 5비트가 소요된다. 이와 같은 방법에 따르면 열일곱 번째 오디오 신호를 스피커에 매핑하기 위해서는 남은 16개의 스피커 중 하나의 스피커를 선택해야 하므로 4비트가 소요된다. 즉, 오디오 신호를 매핑하는 개수가 늘어남에 따라 오디오 신호와 매핑되는 스피커를 표시하기 위해 소요되는 정보량도 감소한다. 이를 수식으로 표현하면 오디오 신호를 스피커에 매핑하기 위해 소요되는 비트 수는 ceil[log2(32-bsOutputChannelPos)] 와 같이 표현된다. 이같이 배열할 오디오 신호의 개수가 늘어남에 따라 소요되는 비트 수가 감소하는 것은 신호 배열부(809)에서 배열하는 다운믹스 신호의 개수가 늘어나는 경우도 동일하다. 오디오 신호 디코딩 장치는 이 같은 방법으로 다채널 오디오 신호를 스피커에 매핑하여 출력한다.
지금까지 본 발명에 대하여 몇몇 실시 예들을 들어 구체적으로 설명하였으나, 상기 실시 예들은 본 발명을 이해하기 위한 설명을 위해 제시된 것이며, 본 발명의 범위가 상기 실시 예에 제한되는 것은 아니다. 당업자라면 본 발명의 기술적 사상의 범위를 벗어나지 않고도 다양한 변형이 가능함을 이해할 수 있을 것이며, 본 발명의 범위는 첨부된 특허청구범위에 의해서 해석되어야 할 것이다.
도 1 은 본 발명의 일 실시 예에 따른 오디오 신호의 구성도이다.
도 2는 본 발명의 다른 실시 예에 따른 오디오 신호 디코딩 방법을 나타내는 순서도이다.
도 3은 본 발명의 또 다른 실시 예에 따른 오디오 신호 디코딩 방법을 나타내는 순서도이다.
도 4는 본 발명의 일 실시 예에 따른 파라미터 세트가 적용되는 타임슬롯의 위치 정보를 나타내는 신택스이다.
도 5는 본 발명의 다른 실시 예에 따른 파라미터 세트를 타임슬롯에 적용하여 공간 정보 신호를 디코딩하는 방법을 나타내는 순서도이다.
도 6 및 7은 본 발명의 일 실시 예에 따른 오디오 신호 디코딩 장치의 업믹싱부를 나타낸 것이다.
도 8은 본 발명의 일 실시 예에 따른 오디오 신호 디코딩 장치를 나타내는 구성도이다.
Claims (12)
- 공간 정보 신호 및 다운믹스 신호를 수신하는 단계;상기 공간 정보 신호로부터 타임슬롯의 위치 정보를 획득하는 단계;상기 공간 정보 신호에 헤더가 포함된 경우, 상기 헤더로부터 환경 설정 정보를 추출하는 단계;상기 타임슬롯의 위치 정보 및 상기 환경 설정 정보에 근거하여, 상기 공간 정보 신호를 상기 다운믹스 신호에 적용하여 다채널 오디오 신호를 생성하는 단계; 및상기 다채널 오디오 신호에 대한 다채널 배열을 수행하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 방법.
- 제1 항에 있어서,상기 타임슬롯의 위치 정보를 획득하는 단계는,상기 공간 정보 신호에 포함된 타임슬롯의 수 및 파라미터의 수를 이용하여 수행되는 것을 특징으로 하는 오디오 신호 디코딩 방법.
- 제1 항에 있어서,상기 타임슬롯의 위치정보는 가변적 비트수로 표현되는 것을 특징으로 하는 오디오 신호 디코딩 방법.
- 제3 항에 있어서, 상기 위치 정보는 초기값 및 차이값을 포함하며, 상기 초기값은 첫 번째 파라미터가 적용되는 타임슬롯의 상기 위치 정보를 나타내고, 상기 차이값은 두 번째 이후의 파라미터가 적용되는 타임슬롯의 상기 위치 정보를 나타내는 것을 특징으로 하는 오디오 신호 디코딩 방법.
- 제4 항에 있어서, 상기 초기값은 상기 타임슬롯의 수 및 상기 파라미터의 수 중 하나 이상을 이용하여 결정되는 가변 비트로 표현되는 것을 특징으로 하는 오디오 신호 디코딩 방법.
- 제 1 항에 있어서,상기 다채널 오디오 신호를 스피커 위치에 매핑하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 디코딩 방법.
- 공간 정보 신호 및 다운믹스 신호를 수신하는 수신부;상기 공간 정보 신호로부터 타임슬롯의 위치 정보를 획득하고, 상기 공간 정보 신호에 헤더가 포함된 경우, 상기 헤더로부터 환경 설정 정보를 추출하고, 상기 타임슬롯의 위치 정보 및 상기 환경 설정 정보에 근거하여 상기 공간 정보 신호를 상기 다운믹스 신호에 적용하여 다채널 오디오 신호를 생성하는 다채널 생성부; 및,상기 다채널 오디오 신호에 대한 다채널 배열을 수행하는 신호 재배열부를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 장치.
- 제7 항에 있어서,상기 다채널 생성부는, 상기 공간 정보 신호에 포함된 타임슬롯의 수 및 파라미터의 수를 이용하여 상기 타임슬롯의 위치 정보를 획득하는 것을 특징으로 하는 오디오 신호 디코딩 장치.
- 제7 항에 있어서,상기 타임슬롯의 위치정보는가변적 비트수로 표현되는 것을 특징으로 하는 오디오 신호 디코딩 장치.
- 제 9 항에 있어서, 상기 위치 정보는 초기값 및 차이값을 포함하며, 상기 초기값은 첫 번째 파라미터가 적용되는 타임슬롯의 상기 위치 정보를 나타내고, 상기 차이값은 두 번째 이후의 파라미터가 적용되는 타임슬롯의 상기 위치 정보를 나타내는 것을 특징으로 하는 오디오 신호 디코딩 장치.
- 제 10 항에 있어서, 상기 초기값은 상기 타임슬롯의 수 및 상기 파라미터의 수 중 하나 이상을 이용하여 결정되는 가변 비트로 표현되는 것을 특징으로 하는 오디오 신호 디코딩 장치.
- 제 7 항에 있어서,상기 다채널 오디오 신호를 스피커 위치에 매핑하는 스피커 매핑부를 더 포함하는 것을 특징으로 하는 오디오 신호 디코딩 장치.
Applications Claiming Priority (27)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US71211905P | 2005-08-30 | 2005-08-30 | |
US60/712,119 | 2005-08-30 | ||
US71920205P | 2005-09-22 | 2005-09-22 | |
US60/719,202 | 2005-09-22 | ||
US72300705P | 2005-10-04 | 2005-10-04 | |
US60/723,007 | 2005-10-04 | ||
US72622805P | 2005-10-14 | 2005-10-14 | |
US60/726,228 | 2005-10-14 | ||
US72922505P | 2005-10-24 | 2005-10-24 | |
US60/729,225 | 2005-10-24 | ||
US73562805P | 2005-11-12 | 2005-11-12 | |
US60/735,628 | 2005-11-12 | ||
US74860705P | 2005-12-09 | 2005-12-09 | |
US60/748,607 | 2005-12-09 | ||
KR1020060004056 | 2006-01-13 | ||
KR20060004055 | 2006-01-13 | ||
KR20060004065 | 2006-01-13 | ||
KR1020060004055 | 2006-01-13 | ||
KR20060004056 | 2006-01-13 | ||
KR1020060004065 | 2006-01-13 | ||
US76253606P | 2006-01-27 | 2006-01-27 | |
US60/762,536 | 2006-01-27 | ||
US80382506P | 2006-06-02 | 2006-06-02 | |
US60/803,825 | 2006-06-02 | ||
KR1020060056480A KR20070003574A (ko) | 2005-06-30 | 2006-06-22 | 오디오 신호 인코딩 및 디코딩 방법 및 장치 |
KR1020060056480 | 2006-06-22 | ||
PCT/KR2006/003435 WO2007027056A1 (en) | 2005-08-30 | 2006-08-30 | A method for decoding an audio signal |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087005992A Division KR100880642B1 (ko) | 2005-08-30 | 2006-08-30 | 오디오 신호의 디코딩 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080086552A KR20080086552A (ko) | 2008-09-25 |
KR101169280B1 true KR101169280B1 (ko) | 2012-08-02 |
Family
ID=39647552
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087005993A KR100880643B1 (ko) | 2005-08-30 | 2006-08-30 | 오디오 신호의 디코딩 방법 및 장치 |
KR1020087005994A KR20080049735A (ko) | 2005-08-30 | 2006-08-30 | 오디오 신호의 디코딩 방법 및 장치 |
KR1020087021436A KR101169280B1 (ko) | 2005-08-30 | 2006-08-30 | 오디오 신호의 디코딩 방법 및 장치 |
KR1020087005992A KR100880642B1 (ko) | 2005-08-30 | 2006-08-30 | 오디오 신호의 디코딩 방법 및 장치 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087005993A KR100880643B1 (ko) | 2005-08-30 | 2006-08-30 | 오디오 신호의 디코딩 방법 및 장치 |
KR1020087005994A KR20080049735A (ko) | 2005-08-30 | 2006-08-30 | 오디오 신호의 디코딩 방법 및 장치 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087005992A KR100880642B1 (ko) | 2005-08-30 | 2006-08-30 | 오디오 신호의 디코딩 방법 및 장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7987097B2 (ko) |
JP (2) | JP4568363B2 (ko) |
KR (4) | KR100880643B1 (ko) |
HK (1) | HK1124682A1 (ko) |
MX (1) | MX2008002760A (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100803212B1 (ko) * | 2006-01-11 | 2008-02-14 | 삼성전자주식회사 | 스케일러블 채널 복호화 방법 및 장치 |
KR101218776B1 (ko) * | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
KR100773560B1 (ko) | 2006-03-06 | 2007-11-05 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
KR100763920B1 (ko) * | 2006-08-09 | 2007-10-05 | 삼성전자주식회사 | 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치 |
CN101617360B (zh) * | 2006-09-29 | 2012-08-22 | 韩国电子通信研究院 | 用于编码和解码具有各种声道的多对象音频信号的设备和方法 |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
CN102484547A (zh) * | 2009-09-01 | 2012-05-30 | 松下电器产业株式会社 | 数字广播发送装置、数字广播接收装置以及数字广播收发系统 |
US9601122B2 (en) * | 2012-06-14 | 2017-03-21 | Dolby International Ab | Smooth configuration switching for multichannel audio |
US9865269B2 (en) | 2012-07-19 | 2018-01-09 | Nokia Technologies Oy | Stereo audio signal encoder |
WO2020086357A1 (en) * | 2018-10-24 | 2020-04-30 | Otto Engineering, Inc. | Directional awareness audio communications system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001188578A (ja) | 1998-11-16 | 2001-07-10 | Victor Co Of Japan Ltd | 音声符号化方法及び音声復号方法 |
US20040199276A1 (en) | 2003-04-03 | 2004-10-07 | Wai-Leong Poon | Method and apparatus for audio synchronization |
Family Cites Families (139)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6096079A (ja) | 1983-10-31 | 1985-05-29 | Matsushita Electric Ind Co Ltd | 多値画像の符号化方法 |
US4661862A (en) * | 1984-04-27 | 1987-04-28 | Rca Corporation | Differential PCM video transmission system employing horizontally offset five pixel groups and delta signals having plural non-linear encoding functions |
US4621862A (en) * | 1984-10-22 | 1986-11-11 | The Coca-Cola Company | Closing means for trucks |
JPS6294090A (ja) | 1985-10-21 | 1987-04-30 | Hitachi Ltd | 符号化装置 |
US4725885A (en) * | 1986-12-22 | 1988-02-16 | International Business Machines Corporation | Adaptive graylevel image compression system |
JPH0793584B2 (ja) * | 1987-09-25 | 1995-10-09 | 株式会社日立製作所 | 符号化装置 |
NL8901032A (nl) | 1988-11-10 | 1990-06-01 | Philips Nv | Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting. |
US5243686A (en) * | 1988-12-09 | 1993-09-07 | Oki Electric Industry Co., Ltd. | Multi-stage linear predictive analysis method for feature extraction from acoustic signals |
CA2332407C (en) | 1989-01-27 | 2002-03-05 | Dolby Laboratories Licensing Corporation | Method for defining coding information |
DE3943879B4 (de) * | 1989-04-17 | 2008-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Digitales Codierverfahren |
NL9000338A (nl) * | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
US6289308B1 (en) * | 1990-06-01 | 2001-09-11 | U.S. Philips Corporation | Encoded wideband digital transmission signal and record carrier recorded with such a signal |
GB8921320D0 (en) | 1989-09-21 | 1989-11-08 | British Broadcasting Corp | Digital video coding |
AU653582B2 (en) * | 1991-01-08 | 1994-10-06 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
ATE210347T1 (de) * | 1991-08-02 | 2001-12-15 | Sony Corp | Digitaler kodierer mit dynamischer quantisierungsbitverteilung |
DE4209544A1 (de) * | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
JP3104400B2 (ja) | 1992-04-27 | 2000-10-30 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
JP3123286B2 (ja) * | 1993-02-18 | 2001-01-09 | ソニー株式会社 | ディジタル信号処理装置又は方法、及び記録媒体 |
US5481643A (en) * | 1993-03-18 | 1996-01-02 | U.S. Philips Corporation | Transmitter, receiver and record carrier for transmitting/receiving at least a first and a second signal component |
US5563661A (en) * | 1993-04-05 | 1996-10-08 | Canon Kabushiki Kaisha | Image processing apparatus |
US5508942A (en) * | 1993-11-24 | 1996-04-16 | Intel Corporation | Intra/inter decision rules for encoding and decoding video signals |
US6125398A (en) * | 1993-11-24 | 2000-09-26 | Intel Corporation | Communications subsystem for computer-based conferencing system using both ISDN B channels for transmission |
US5640159A (en) * | 1994-01-03 | 1997-06-17 | International Business Machines Corporation | Quantization method for image data compression employing context modeling algorithm |
RU2158970C2 (ru) | 1994-03-01 | 2000-11-10 | Сони Корпорейшн | Способ кодирования цифрового сигнала и устройство для его осуществления, носитель записи цифрового сигнала, способ декодирования цифрового сигнала и устройство для его осуществления |
JP3498375B2 (ja) * | 1994-07-20 | 2004-02-16 | ソニー株式会社 | ディジタル・オーディオ信号記録装置 |
US6549666B1 (en) * | 1994-09-21 | 2003-04-15 | Ricoh Company, Ltd | Reversible embedded wavelet system implementation |
JPH08123494A (ja) | 1994-10-28 | 1996-05-17 | Mitsubishi Electric Corp | 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置 |
JPH08130649A (ja) * | 1994-11-01 | 1996-05-21 | Canon Inc | データ処理装置 |
KR100209877B1 (ko) | 1994-11-26 | 1999-07-15 | 윤종용 | 복수개의 허프만부호테이블을 이용한 가변장부호화장치 및 복호화장치 |
JP3371590B2 (ja) | 1994-12-28 | 2003-01-27 | ソニー株式会社 | 高能率符号化方法及び高能率復号化方法 |
JP3484832B2 (ja) | 1995-08-02 | 2004-01-06 | ソニー株式会社 | 記録装置、記録方法、再生装置及び再生方法 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US6047027A (en) | 1996-02-07 | 2000-04-04 | Matsushita Electric Industrial Co., Ltd. | Packetized data stream decoder using timing information extraction and insertion |
JP3088319B2 (ja) * | 1996-02-07 | 2000-09-18 | 松下電器産業株式会社 | デコード装置およびデコード方法 |
US6399760B1 (en) | 1996-04-12 | 2002-06-04 | Millennium Pharmaceuticals, Inc. | RP compositions and therapeutic and diagnostic uses therefor |
EP0827312A3 (de) | 1996-08-22 | 2003-10-01 | Marconi Communications GmbH | Verfahren zur Änderung der Konfiguration von Datenpaketen |
US5912636A (en) * | 1996-09-26 | 1999-06-15 | Ricoh Company, Ltd. | Apparatus and method for performing m-ary finite state machine entropy coding |
US5893066A (en) | 1996-10-15 | 1999-04-06 | Samsung Electronics Co. Ltd. | Fast requantization apparatus and method for MPEG audio decoding |
TW429700B (en) | 1997-02-26 | 2001-04-11 | Sony Corp | Information encoding method and apparatus, information decoding method and apparatus and information recording medium |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
US6131084A (en) | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
US6639945B2 (en) * | 1997-03-14 | 2003-10-28 | Microsoft Corporation | Method and apparatus for implementing motion detection in video compression |
US6356639B1 (en) | 1997-04-11 | 2002-03-12 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
EP0903744B1 (en) | 1997-09-17 | 2001-01-10 | Matsushita Electric Industrial Co., Ltd | Optical disc, video data editing apparatus, computer-readable recording medium storing an editing program, reproduction apparatus for the optical disc, and computer-readable recording medium storing a reproduction program |
US6130418A (en) | 1997-10-06 | 2000-10-10 | U.S. Philips Corporation | Optical scanning unit having a main lens and an auxiliary lens |
US5966688A (en) | 1997-10-28 | 1999-10-12 | Hughes Electronics Corporation | Speech mode based multi-stage vector quantizer |
JP2005063655A (ja) | 1997-11-28 | 2005-03-10 | Victor Co Of Japan Ltd | オーディオ信号のエンコード方法及びデコード方法 |
JP3022462B2 (ja) | 1998-01-13 | 2000-03-21 | 興和株式会社 | 振動波の符号化方法及び復号化方法 |
ES2247741T3 (es) * | 1998-01-22 | 2006-03-01 | Deutsche Telekom Ag | Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio. |
JPH11225390A (ja) | 1998-02-04 | 1999-08-17 | Matsushita Electric Ind Co Ltd | マルチチャネルデータ再生方法 |
JPH11282496A (ja) * | 1998-03-30 | 1999-10-15 | Matsushita Electric Ind Co Ltd | 復号装置 |
US6339760B1 (en) * | 1998-04-28 | 2002-01-15 | Hitachi, Ltd. | Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data |
JPH11330980A (ja) | 1998-05-13 | 1999-11-30 | Matsushita Electric Ind Co Ltd | 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体 |
DE69921326T2 (de) * | 1998-07-03 | 2006-02-09 | Dolby Laboratories Licensing Corp., San Francisco | TRANSKODIERER FÜR DATENSTRöME MIT FESTEN UND VERÄNDERLICHEN DATENRATEN |
JP2000036795A (ja) | 1998-07-17 | 2000-02-02 | Sony Corp | データ送信装置および方法、データ受信装置および方法ならびにデータ送受信システムおよび方法 |
GB2340351B (en) | 1998-07-29 | 2004-06-09 | British Broadcasting Corp | Data transmission |
US6298071B1 (en) * | 1998-09-03 | 2001-10-02 | Diva Systems Corporation | Method and apparatus for processing variable bit rate information in an information distribution system |
MY118961A (en) | 1998-09-03 | 2005-02-28 | Sony Corp | Beam irradiation apparatus, optical apparatus having beam irradiation apparatus for information recording medium, method for manufacturing original disk for information recording medium, and method for manufacturing information recording medium |
JP3632891B2 (ja) | 1998-09-07 | 2005-03-23 | 日本ビクター株式会社 | オーディオ信号の伝送方法、オーディオディスク、エンコード装置及びデコード装置 |
US6148283A (en) | 1998-09-23 | 2000-11-14 | Qualcomm Inc. | Method and apparatus using multi-path multi-stage vector quantizer |
US6553147B2 (en) * | 1998-10-05 | 2003-04-22 | Sarnoff Corporation | Apparatus and method for data partitioning to improving error resilience |
US6556685B1 (en) * | 1998-11-06 | 2003-04-29 | Harman Music Group | Companding noise reduction system with simultaneous encode and decode |
US6757659B1 (en) | 1998-11-16 | 2004-06-29 | Victor Company Of Japan, Ltd. | Audio signal processing apparatus |
US6195024B1 (en) * | 1998-12-11 | 2001-02-27 | Realtime Data, Llc | Content independent data compression method and system |
US6208276B1 (en) * | 1998-12-30 | 2001-03-27 | At&T Corporation | Method and apparatus for sample rate pre- and post-processing to achieve maximal coding gain for transform-based audio encoding and decoding |
US6631352B1 (en) * | 1999-01-08 | 2003-10-07 | Matushita Electric Industrial Co. Ltd. | Decoding circuit and reproduction apparatus which mutes audio after header parameter changes |
AU781629B2 (en) * | 1999-04-07 | 2005-06-02 | Dolby Laboratories Licensing Corporation | Matrix improvements to lossless encoding and decoding |
JP3323175B2 (ja) | 1999-04-20 | 2002-09-09 | 松下電器産業株式会社 | 符号化装置 |
US6421467B1 (en) * | 1999-05-28 | 2002-07-16 | Texas Tech University | Adaptive vector quantization/quantizer |
KR100307596B1 (ko) | 1999-06-10 | 2001-11-01 | 윤종용 | 디지털 오디오 데이터의 무손실 부호화 및 복호화장치 |
JP2001006291A (ja) | 1999-06-21 | 2001-01-12 | Fuji Film Microdevices Co Ltd | オーディオ信号の符号化方式判定装置、及びオーディオ信号の符号化方式判定方法 |
JP4337198B2 (ja) | 1999-12-07 | 2009-09-30 | ソニー株式会社 | 伝送方法及び伝送装置 |
US7212872B1 (en) * | 2000-05-10 | 2007-05-01 | Dts, Inc. | Discrete multichannel audio with a backward compatible mix |
JP2002042423A (ja) | 2000-07-27 | 2002-02-08 | Pioneer Electronic Corp | オーディオ再生装置 |
US20020049586A1 (en) * | 2000-09-11 | 2002-04-25 | Kousuke Nishio | Audio encoder, audio decoder, and broadcasting system |
JP2002191099A (ja) | 2000-09-26 | 2002-07-05 | Matsushita Electric Ind Co Ltd | 信号処理装置 |
US6636830B1 (en) * | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
JP2002233395A (ja) | 2001-02-06 | 2002-08-20 | Mitsubishi Rayon Co Ltd | 補酵素nadhの再生方法 |
JP4008244B2 (ja) | 2001-03-02 | 2007-11-14 | 松下電器産業株式会社 | 符号化装置および復号化装置 |
JP3566220B2 (ja) | 2001-03-09 | 2004-09-15 | 三菱電機株式会社 | 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法 |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7583805B2 (en) | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
JP2002335230A (ja) | 2001-05-11 | 2002-11-22 | Victor Co Of Japan Ltd | 音声符号化信号の復号方法、及び音声符号化信号復号装置 |
JP2003005797A (ja) | 2001-06-21 | 2003-01-08 | Matsushita Electric Ind Co Ltd | オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム |
JP2003015692A (ja) | 2001-07-03 | 2003-01-17 | Fujitsu Ltd | 音声信号記録装置、音声信号再生装置、およびコンピュータ読み取り可能な記憶媒体 |
GB0119569D0 (en) * | 2001-08-13 | 2001-10-03 | Radioscape Ltd | Data hiding in digital audio broadcasting (DAB) |
EP1308931A1 (de) * | 2001-10-23 | 2003-05-07 | Deutsche Thomson-Brandt Gmbh | Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist |
EP1315148A1 (en) | 2001-11-17 | 2003-05-28 | Deutsche Thomson-Brandt Gmbh | Determination of the presence of ancillary data in an audio bitstream |
KR100480787B1 (ko) | 2001-11-27 | 2005-04-07 | 삼성전자주식회사 | 좌표 인터폴레이터의 키 값 데이터 부호화/복호화 방법 및 장치 |
RU2319223C2 (ru) | 2001-11-30 | 2008-03-10 | Конинклейке Филипс Электроникс Н.В. | Кодирование сигнала |
TW569550B (en) | 2001-12-28 | 2004-01-01 | Univ Nat Central | Method of inverse-modified discrete cosine transform and overlap-add for MPEG layer 3 voice signal decoding and apparatus thereof |
EP1827027A1 (en) * | 2002-01-18 | 2007-08-29 | Kabushiki Kaisha Toshiba | Video encoding method and apparatus and video decoding method and apparatus |
JP2003233395A (ja) | 2002-02-07 | 2003-08-22 | Matsushita Electric Ind Co Ltd | オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム |
WO2003077425A1 (fr) * | 2002-03-08 | 2003-09-18 | Nippon Telegraph And Telephone Corporation | Procedes de codage et de decodage signaux numeriques, dispositifs de codage et de decodage, programme de codage et de decodage de signaux numeriques |
WO2003085644A1 (en) * | 2002-04-11 | 2003-10-16 | Matsushita Electric Industrial Co., Ltd. | Encoding device and decoding device |
US7275036B2 (en) * | 2002-04-18 | 2007-09-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data |
JP4322207B2 (ja) | 2002-07-12 | 2009-08-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化方法 |
CN1669358A (zh) | 2002-07-16 | 2005-09-14 | 皇家飞利浦电子股份有限公司 | 音频编码 |
JP3579047B2 (ja) | 2002-07-19 | 2004-10-20 | 日本電気株式会社 | オーディオ復号装置と復号方法およびプログラム |
BRPI0305746B1 (pt) | 2002-08-07 | 2018-03-20 | Dolby Laboratories Licensing Corporation | Tradução espacial de canal de áudio |
US7536305B2 (en) | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
TW567466B (en) | 2002-09-13 | 2003-12-21 | Inventec Besta Co Ltd | Method using computer to compress and encode audio data |
US8306340B2 (en) | 2002-09-17 | 2012-11-06 | Vladimir Ceperkovic | Fast codec with high compression ratio and minimum required resources |
JP3519724B2 (ja) * | 2002-10-25 | 2004-04-19 | パイオニア株式会社 | 情報記録媒体、情報記録装置及び情報記録方法並びに情報再生装置及び情報再生方法 |
JP4084990B2 (ja) | 2002-11-19 | 2008-04-30 | 株式会社ケンウッド | エンコード装置、デコード装置、エンコード方法およびデコード方法 |
JP2004220743A (ja) | 2003-01-17 | 2004-08-05 | Sony Corp | 情報記録装置及び情報記録制御方法、並びに情報再生装置及び情報再生制御方法 |
ATE339759T1 (de) | 2003-02-11 | 2006-10-15 | Koninkl Philips Electronics Nv | Audiocodierung |
AU2003219430A1 (en) | 2003-03-04 | 2004-09-28 | Nokia Corporation | Support of a multichannel audio extension |
ATE359687T1 (de) * | 2003-04-17 | 2007-05-15 | Koninkl Philips Electronics Nv | Audiosignalgenerierung |
JP2005086486A (ja) * | 2003-09-09 | 2005-03-31 | Alpine Electronics Inc | オーディオ装置およびオーディオ処理方法 |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
JP4966013B2 (ja) * | 2003-10-30 | 2012-07-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号のエンコードまたはデコード |
US20050137729A1 (en) * | 2003-12-18 | 2005-06-23 | Atsuhiro Sakurai | Time-scale modification stereo audio signals |
SE527670C2 (sv) | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
JP2005202248A (ja) | 2004-01-16 | 2005-07-28 | Fujitsu Ltd | オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路 |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US20050174269A1 (en) * | 2004-02-05 | 2005-08-11 | Broadcom Corporation | Huffman decoder used for decoding both advanced audio coding (AAC) and MP3 audio |
JP4148157B2 (ja) | 2004-02-27 | 2008-09-10 | 日本ビクター株式会社 | 音声信号伝送方法及び音声信号復号化装置 |
US7392195B2 (en) * | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
WO2005104563A1 (ja) * | 2004-04-22 | 2005-11-03 | Mitsubishi Denki Kabushiki Kaisha | 画像符号化装置及び画像復号装置 |
JP2005332449A (ja) | 2004-05-18 | 2005-12-02 | Sony Corp | 光学ピックアップ装置、光記録再生装置及びチルト制御方法 |
TWM257575U (en) | 2004-05-26 | 2005-02-21 | Aimtron Technology Corp | Encoder and decoder for audio and video information |
JP2006012301A (ja) * | 2004-06-25 | 2006-01-12 | Sony Corp | 光記録再生方法、光ピックアップ装置、光記録再生装置、光記録媒体とその製造方法及び半導体レーザ装置 |
DE102004043521A1 (de) | 2004-09-08 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
JP2006120247A (ja) | 2004-10-21 | 2006-05-11 | Sony Corp | 集光レンズ及びその製造方法、これを用いた露光装置、光学ピックアップ装置及び光記録再生装置 |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
US7991610B2 (en) | 2005-04-13 | 2011-08-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Adaptive grouping of parameters for enhanced coding efficiency |
EP1829424B1 (en) * | 2005-04-15 | 2009-01-21 | Dolby Sweden AB | Temporal envelope shaping of decorrelated signals |
KR100803205B1 (ko) | 2005-07-15 | 2008-02-14 | 삼성전자주식회사 | 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
JP4876574B2 (ja) * | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
KR100773560B1 (ko) * | 2006-03-06 | 2007-11-05 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
CN101406073B (zh) | 2006-03-28 | 2013-01-09 | 弗劳恩霍夫应用研究促进协会 | 用于多声道音频重构中的信号成形的增强的方法 |
US7975184B2 (en) * | 2006-04-03 | 2011-07-05 | Donald Goff | Diagnostic access system |
-
2006
- 2006-08-30 KR KR1020087005993A patent/KR100880643B1/ko active IP Right Grant
- 2006-08-30 JP JP2008528949A patent/JP4568363B2/ja not_active Expired - Fee Related
- 2006-08-30 US US12/065,270 patent/US7987097B2/en active Active
- 2006-08-30 KR KR1020087005994A patent/KR20080049735A/ko active IP Right Grant
- 2006-08-30 MX MX2008002760A patent/MX2008002760A/es active IP Right Grant
- 2006-08-30 JP JP2008528950A patent/JP5173811B2/ja active Active
- 2006-08-30 KR KR1020087021436A patent/KR101169280B1/ko active IP Right Grant
- 2006-08-30 KR KR1020087005992A patent/KR100880642B1/ko active IP Right Grant
-
2009
- 2009-02-27 HK HK09101884.8A patent/HK1124682A1/xx not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001188578A (ja) | 1998-11-16 | 2001-07-10 | Victor Co Of Japan Ltd | 音声符号化方法及び音声復号方法 |
US20040199276A1 (en) | 2003-04-03 | 2004-10-07 | Wai-Leong Poon | Method and apparatus for audio synchronization |
Also Published As
Publication number | Publication date |
---|---|
KR20080049735A (ko) | 2008-06-04 |
JP2009506378A (ja) | 2009-02-12 |
KR100880642B1 (ko) | 2009-01-30 |
KR100880643B1 (ko) | 2009-01-30 |
MX2008002760A (es) | 2008-04-07 |
KR20080039487A (ko) | 2008-05-07 |
JP2009506707A (ja) | 2009-02-12 |
US20080243519A1 (en) | 2008-10-02 |
HK1124682A1 (en) | 2009-07-17 |
JP4568363B2 (ja) | 2010-10-27 |
KR20080086552A (ko) | 2008-09-25 |
KR20080039488A (ko) | 2008-05-07 |
US7987097B2 (en) | 2011-07-26 |
JP5173811B2 (ja) | 2013-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101169280B1 (ko) | 오디오 신호의 디코딩 방법 및 장치 | |
JP4859925B2 (ja) | オーディオ信号デコーディング方法及びその装置 | |
JP5006315B2 (ja) | オーディオ信号のエンコーディング及びデコーディング方法及び装置 | |
US9779740B2 (en) | Audio encoding device and audio decoding device | |
JP4601669B2 (ja) | マルチチャネル信号またはパラメータデータセットを生成する装置および方法 | |
KR100830472B1 (ko) | 오디오 신호 디코딩 방법 및 장치 | |
US7788107B2 (en) | Method for decoding an audio signal | |
RU2383942C2 (ru) | Способ и устройство для декодирования аудиосигнала | |
RU2383941C2 (ru) | Способ и устройство для кодирования и декодирования аудиосигналов | |
KR100891685B1 (ko) | 오디오 신호의 인코딩 및 디코딩 장치, 및 방법 | |
KR20070014936A (ko) | 오디오 신호의 인코딩/디코딩 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150624 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160624 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170614 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20180614 Year of fee payment: 7 |