KR20080051042A - Apparatus and method for decoding multi-channel audio signal using cross-correlation - Google Patents
Apparatus and method for decoding multi-channel audio signal using cross-correlation Download PDFInfo
- Publication number
- KR20080051042A KR20080051042A KR1020070107406A KR20070107406A KR20080051042A KR 20080051042 A KR20080051042 A KR 20080051042A KR 1020070107406 A KR1020070107406 A KR 1020070107406A KR 20070107406 A KR20070107406 A KR 20070107406A KR 20080051042 A KR20080051042 A KR 20080051042A
- Authority
- KR
- South Korea
- Prior art keywords
- channel
- signal
- cross
- correlation
- audio signal
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 140
- 238000000034 method Methods 0.000 title claims abstract description 24
- 230000003044 adaptive effect Effects 0.000 claims description 17
- 238000001914 filtration Methods 0.000 claims description 13
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims 2
- 230000001105 regulatory effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 8
- 230000008447 perception Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
Abstract
Description
본 발명은 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그 방법에 관한 것으로, 더욱 상세하게는 좌우 채널 간 상호상관 값을 이용하여 다운믹싱 스테레오 오디오 신호로부터 다채널 오디오 신호를 생성하고 부호화 정보(상호상관 정보, 가상음원 방향정보)를 이용하여 상기 생성된 다채널 오디오 신호를 조정함으로써, 다채널 오디오 신호 중 중앙채널 및 서라운드 채널 신호를 정확하게 복원하기 위한, 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그 방법에 관한 것이다.The present invention relates to an apparatus and method for decoding a multichannel audio signal using cross-correlation, and more particularly, to generate a multi-channel audio signal from a downmixed stereo audio signal using cross-correlation values between left and right channels and to encode encoded information (correlation). A multi-channel audio signal decoding apparatus using cross-correlation for accurately reconstructing the center channel and surround channel signals among the multi-channel audio signals by adjusting the generated multi-channel audio signals using correlation information and virtual sound source direction information; It's about how.
본 발명은 정보통신부 및 정보통신연구진흥원의 IT차세대핵심기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2005-S-403-02, 과제명: 지능형 통합정보 방송(Smar TV) 기술 개발].The present invention is derived from the research conducted as part of the next generation core technology development project of the Ministry of Information and Communication and the Ministry of Information and Communication Research and Development. [Task Management Number: 2005-S-403-02, Title: Intelligent Integrated Information Broadcasting ) Technology development].
최근에 가정용 극장 시스템이 보편화되면서 5.1채널 오디오 형식은 가정용 오디오의 대세로 자리매김해 가고 있다. 또한, 휴대형 오디오 장비에서도 헤드폰 또는 내장된 소형 스피커에 의해 가상 서라운드를 재생하는 3차원 오디오 효과 기능이 필수 구비사항으로 되고 있다. 이러한 추세를 감안하면 향후 5.1채널 오디오 형식이 가정용 및 휴대용 오디오 장비의 기본 오디오 재생 형식이 될 것이라는 예측을 가능하게 한다.With the recent popularization of home theater systems, the 5.1-channel audio format is becoming the mainstream of home audio. In addition, portable audio equipment has become a necessity to have a three-dimensional audio effect function that reproduces virtual surround by headphones or a small built-in speaker. This trend makes it possible to predict that the 5.1-channel audio format will be the default audio playback format for home and portable audio equipment.
하지만, 종래의 5.1채널 오디오 기술은 채널 개수에 따라 데이터 량이 증가한다는 문제점이 있다. 그러므로 종래의 5.1채널 오디오 기술에서는 데이터 량을 효과적으로 압축할 수 있는 다채널 부호화 방식이 중요한 기능을 수행한다. 예를 들어, MPEG(Moving Picture Expert Group)-2 및 MPEG-4에서는 지각 부호화 방식을 사용한 다채널 부호화 방식을 표준화하고 있다. 그러나 그 특성상 채널 수에 비례하여 비트율이 증가하게 되는 문제점이 있다.However, the conventional 5.1 channel audio technology has a problem in that the amount of data increases with the number of channels. Therefore, in the conventional 5.1-channel audio technology, a multi-channel encoding method capable of compressing the data amount effectively performs an important function. For example, moving picture expert group (MPEG) -2 and MPEG-4 standardize the multi-channel coding method using the perceptual coding method. However, there is a problem in that the bit rate increases in proportion to the number of channels.
최근에, 채널 수가 증가하여도 비트율이 거의 증가하지 않는 BCC(Binaural Cue Coding) 방식이 개발되었다. BCC는 그 구조가 비교적 간단하다. 그리고 다채널 오디오를 스테레오 또는 모노로 다운믹스한 후, 이로부터 다채널 오디오 신호를 복원하기 위한 파라미터를 산출한다. 이들 파라미터는 채널간 레벨 차이(ICLD: Inter Channel Level Difference), 채널간 시간 차이(ICTD: Inter Channel Time Difference), 및 채널간 상호상관(ICC: Inter Channel Cross-correlation)을 포함할 수 있다.Recently, Binaural Cue Coding (BCC) schemes have been developed in which the bit rate does not increase even when the number of channels increases. The BCC is relatively simple in structure. After downmixing the multichannel audio to stereo or mono, a parameter for reconstructing the multichannel audio signal is calculated therefrom. These parameters may include Inter Channel Level Difference (ICLD), Inter Channel Time Difference (ICTD), and Inter Channel Cross-correlation (ICC).
또한, 스테레오 오디오 신호로부터 다채널 오디오 신호를 복원하는 기술로는 돌비 프로로직을 대표적인 기술로 들 수 있다. 그러나 돌비 프로로직의 경우 스테 레오 신호 사이의 상호상관에 따라 스펙트럼 상에서 불필요하게 제거되거나 증폭되는 신호가 발생할 수 있다는 문제점이 있다. 특히, 스테레오 오디오 신호로부터 다채널 오디오 신호를 복원할 때, 단순한 신호의 가산 및 감산을 통해 서라운드 신호성분이 정확하게 복원되지 않는다는 문제점이 있다.In addition, Dolby Pro Logic is a representative technology for recovering a multi-channel audio signal from a stereo audio signal. However, in the case of Dolby Pro Logic, there is a problem that a signal that is unnecessarily removed or amplified in the spectrum may occur depending on the correlation between the stereo signals. In particular, when restoring a multi-channel audio signal from a stereo audio signal, there is a problem that the surround signal component is not correctly restored through simple addition and subtraction of the signal.
따라서 상기와 같은 종래 기술은 다운믹싱 스테레오 오디오 신호로부터 원 신호인 다채널 오디오 신호를 복원할 때, 중앙채널, 서라운드 좌채널, 및 서라운드 우채널 신호성분이 스펙트럼 상에서 불필요하게 제거되거나 증폭되어 중앙채널, 및 서라운드 채널 신호성분을 충실하게 복원하지 못한다는 문제점이 있으며, 이러한 문제점을 해결하고자 하는 것이 본 발명의 과제이다.Therefore, in the prior art as described above, when restoring a multichannel audio signal that is an original signal from a downmixing stereo audio signal, the center channel, surround left channel, and surround right channel signal components are unnecessarily removed or amplified in the spectrum, thereby causing the center channel, And there is a problem that can not be faithfully restored to the surround channel signal component, it is an object of the present invention to solve this problem.
따라서 본 발명은 좌우 채널 간 상호상관 값을 이용하여 다운믹싱 스테레오 오디오 신호로부터 다채널 오디오 신호를 생성하고 부호화 정보(상호상관 정보, 가상음원 방향정보)를 이용하여 상기 생성된 다채널 오디오 신호를 조정함으로써, 다채널 오디오 신호 중 중앙채널 및 서라운드 채널 신호를 정확하게 복원하기 위한, 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그 방법을 제공하는데 그 목적이 있다.Accordingly, the present invention generates a multi-channel audio signal from the downmixed stereo audio signal using the cross-correlation value between the left and right channels and adjusts the generated multi-channel audio signal using encoding information (correlation information, virtual sound source direction information). Accordingly, an object of the present invention is to provide an apparatus and method for decoding a multichannel audio signal using cross-correlation for accurately reconstructing a center channel and a surround channel signal among multichannel audio signals.
본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.The objects of the present invention are not limited to the above-mentioned objects, and other objects and advantages of the present invention which are not mentioned above can be understood by the following description, and will be more clearly understood by the embodiments of the present invention. Also, it will be readily appreciated that the objects and advantages of the present invention may be realized by the means and combinations thereof indicated in the claims.
본 발명은 상기 문제점을 해결하기 위하여 제안된 것으로, 좌우 채널 간 상호상관 값을 이용하여 다운믹싱 스테레오 오디오 신호로부터 다채널 오디오 신호를 생성하고 부호화 정보(상호상관 정보, 가상음원 방향정보)를 이용하여 상기 생성된 다채널 오디오 신호를 조정하는 것을 특징으로 한다.The present invention has been proposed to solve the above problems, and generates a multi-channel audio signal from a downmixed stereo audio signal using cross-correlation values between left and right channels and uses encoding information (cross-correlation information, virtual sound source direction information). And adjusting the generated multi-channel audio signal.
더욱 구체적으로, 본 발명은, 상호상관을 이용한 다채널 오디오 신호 복호화 장치에 있어서, 좌/우 채널 간 상호상관 값을 이용하여 다운믹싱 스테레오 오디오 신호로부터 복수의 채널별 오디오 신호를 생성하기 위한 다채널 신호 생성 수단; 및 상기 다운믹싱 스테레오 오디오 신호에 대한 원 신호를 복원할 수 있도록, 상기 생성된 복수의 채널별 오디오 신호의 상호상관 값 및 서브밴드별 파워 값을 상기 원 신호의 채널 간 상호상관 정보와 가상음원 방향정보를 이용하여 조정하기 위한 다채널 신호 조정 수단을 포함한다.More specifically, in the multi-channel audio signal decoding apparatus using cross-correlation, a multi-channel for generating a plurality of channel-specific audio signals from the downmixed stereo audio signal using the cross-correlation value between the left and right channels Signal generating means; And a cross-correlation value and a sub-band power value of the generated plurality of channel-specific audio signals and the sub-band cross-correlation information and the virtual sound source direction to restore the original signal for the downmixed stereo audio signal. Multi-channel signal adjusting means for adjusting using information.
또한, 본 발명은, 상호상관을 이용한 다채널 오디오 신호 복호화 방법에 있어서, 좌/우 채널 간 상호상관 값을 이용하여 다운믹싱 스테레오 오디오 신호로부터 복수의 채널별 오디오 신호를 생성하는 다채널 신호 생성 단계; 및 상기 다운믹싱 스테레오 오디오 신호에 대한 원 신호를 복원할 수 있도록, 상기 생성된 복수의 채널별 오디오 신호의 상호상관 값 및 서브밴드별 파워 값을 상기 원 신호의 채널 간 상호상관 정보와 가상음원 방향정보를 이용하여 조정하는 다채널 신호 조정 단계를 포함한다.Also, in the multi-channel audio signal decoding method using cross-correlation, a multi-channel signal generation step of generating a plurality of channel-specific audio signals from the downmixed stereo audio signal using cross-correlation values between left and right channels ; And a cross-correlation value and a sub-band power value of the generated plurality of channel-specific audio signals and the sub-band cross-correlation information and the virtual sound source direction to restore the original signal for the downmixed stereo audio signal. A multi-channel signal adjustment step of adjusting using the information.
상기와 같은 본 발명은, 좌우 채널 간 상호상관 값에 따라 다운믹싱 스테레오 오디오 신호로부터 다채널 오디오 신호를 생성하고 채널 간 상호상관 및 가상음원 방향정보로 구성되는 공간음향 지각단서를 이용하여 다채널 오디오 신호를 조정함으로써, 다채널 오디오 신호 중 중앙채널 및 서라운드 채널 신호를 정확하게 복원할 수 있도록 하는 효과가 있다.As described above, the present invention generates multi-channel audio signals from downmixed stereo audio signals according to cross-correlation values between left and right channels, and uses multi-channel audio using spatial acoustic perception cues composed of cross-correlation between channel and virtual sound source direction information. By adjusting the signal, it is possible to accurately restore the center channel and surround channel signals among the multichannel audio signals.
또한, 본 발명은, 채널 간 상호상관 및 가상음원 방향정보로 구성되는 공간음향 지각단서를 이용하여 다채널 오디오 신호를 조정함으로써, 스펙트럼 왜곡현상을 완화시킬 수 있는 효과가 있다.In addition, the present invention has the effect of mitigating the spectral distortion phenomenon by adjusting the multi-channel audio signal using the spatial acoustic perception terminal composed of the cross-correlation between the channel and the virtual sound source direction information.
상술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되어 있는 상세한 설명을 통하여 보다 명확해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하기로 한다.The above objects, features, and advantages will become more apparent from the detailed description given hereinafter with reference to the accompanying drawings, and accordingly, those skilled in the art to which the present invention pertains may share the technical idea of the present invention. It will be easy to implement. In addition, in describing the present invention, when it is determined that the detailed description of the known technology related to the present invention may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1 은 본 발명에 따른 상호상관을 이용한 다채널 오디오 신호 복호화 장치의 일실시예 구성도로서, 다채널 오디오 신호 부호화 장치와 함께 도시되어 있다.1 is a configuration diagram of an apparatus for decoding a multi-channel audio signal using cross-correlation according to the present invention, which is illustrated together with the apparatus for encoding a multi-channel audio signal.
도 1에 도시된 바와 같이, 본 발명에 따른 상호상관을 이용한 다채널 오디오 신호 복호화 장치(120)는 다채널 신호 생성부(121)와 다채널 신호 조정부(122)를 포함하고, 참고적으로 부호화 장치(110)는 다운믹싱부(112)와 공간음향 지각단서 분석부(111)를 포함한다.As shown in FIG. 1, the multi-channel audio
이하, 부호화 장치(110)와 복호화 장치(120)의 구성요소 각각에 대해 상세히 살펴보기로 한다.Hereinafter, each component of the
공간음향 지각단서 분석부(111)는 다채널 오디오 신호를 전달받아 각 채널과 관련된 서브밴드별로 다채널 오디오 신호를 서브밴드 필터링한다. 그리고 공간음향 지각단서 분석부(111)는 서브밴드 필터링된 각 채널의 오디오 신호에서 인접 채널 간 레벨 차이 및 상호상관을 분석하여 공간음향 지각단서를 추출한다. 여기서, 공간음향 지각단서는 채널 간 상호상관 값과 가상음원 방향정보를 포함한다.The spatial acoustic
그리고 다운믹싱부(112)는 공간음향 지각단서 분석부(111)로부터 전달받은 다채널 오디오 신호를 스테레오 오디오 신호로 압축하는 기능을 수행한다. 즉, 다운믹싱부(112)는 공간음향 지각단서 분석부(111)에서 서브밴드 필터링된 다채널 음향 스펙트럼을 다운믹싱 스테레오 오디오 신호로 혼합하고, 다운믹싱 스테레오 오디오 신호를 시간영역 신호로 변환한다.The
이때, 다운믹싱부(112)에서 다운믹싱하기 위한 일반적인 매트릭스의 수식은 하기의 [수학식 1]과 같다.At this time, the formula of the general matrix for downmixing in the
Rdm = R + SR + SQRT(2)/2×CR dm = R + SR + SQRT (2) / 2 x C
여기서, Ldm 및 Rdm은 각각 다운믹싱 좌채널 및 다운믹싱 우채널 스테레오 신호, L 및 R은 다채널 음향 신호에 있어 좌채널 및 우채널 신호, SL 및 SR은 서라운드 좌채널 및 서라운드 우채널 신호, C는 중앙채널 신호를 나타낸다. 통상적으로 사용되는 저음 채널(LFE: Low Frequency Effect) 신호는 C와 동일하게 양측 다운믹싱 채널에 나누어 부가함으로써 처리할 수 있다.Where L dm And R dm are the downmix left channel and downmix right channel stereo signals, L and R are the left and right channel signals in the multichannel sound signal, SL and SR are the surround left and surround right channel signals, and C is the center. Indicates a channel signal. A low frequency effect (LFE) signal, which is commonly used, can be processed by dividing it into both downmixing channels as in C.
이하, 본 발명에 따른 상호상관을 이용한 다채널 오디오 신호 복호화 장치(120)의 구성요소 각각에 대하여 상세히 살펴보기로 한다.Hereinafter, each component of the multi-channel audio
다채널 신호 생성부(121)는 부호화 장치(110)에서 다채널 오디오 신호(원 신호)가 다운믹싱된 다운믹싱 스테레오 오디오 신호를 각 채널간 상호상관 값에 따라 분리하여 다운믹싱 다채널 오디오 신호를 생성한다. 다채널 신호 생성부(121)는 전달받은 다운믹싱 스테레오 오디오 신호로부터 적응필터를 이용해 두 채널 간 공통된 신호와 독립된 신호를 적응적으로 추출하여 서라운드 채널 신호와 중앙채널의 신호를 일부 분리하는 기능을 수행한다. 즉, 다채널 신호 생성부(121)는 부호화 장 치(110)에서의 다운믹싱 스테레오(좌채널, 우채널) 오디오 신호로부터 적응필터와 두 채널 간 합 및 차 신호를 이용하여 다운믹싱 중앙채널 신호 및 다운믹싱 서라운드 채널 신호를 생성한다.The
그리고 다채널 신호 조정부(122)는 다채널 신호 생성부(121)에서 생성된 다운믹싱 다채널 오디오 신호의 채널 간 상호상관 값을 부호화 장치(110)로부터 전달받은 원 신호의 채널 간 상호상관 정보에 맞게 조정하고, 상기 조정된 다채널 오디오 신호의 서브밴드별 파워 값을 부호화 장치(110)로부터 전달받은 원 신호의 가상음원 방향정보에 맞게 조정한다. 다채널 신호 조정부(122)는 부호화 장치(110)에서 추출된 채널간 상호상관 및 가상음원 방향정보를 이용하여 다채널 신호 생성부(121)에서 생성된 다운믹싱 다채널 음향 신호의 서브밴드 별 스펙트럼의 상호상관 및 형상을 조정한다. 즉, 다채널 신호 조정부(122)는 다채널 신호 생성부(121)에서 출력된 다채널 음향 신호의 상호상관 및 서브밴드 파워를 조정하여 원래의 다채널 신호를 복원한다. 그리고 다채널 신호 조정부(122)는 상호상관 및 형상이 조정된 다채널 오디오 신호를 출력한다.In addition, the multi-channel
도 2 는 본 발명에 이용되는 도 1의 공간음향 지각단서 분석부의 일실시예 상세구성도이다.2 is a detailed configuration diagram of an embodiment of the spatial acoustic perception cue analysis unit of FIG. 1 used in the present invention.
도 2에 도시된 바와 같이, 공간음향 지각단서 분석부(111)는, 각 채널에 상응하는 제1 내지 제5 서브밴드 필터링부(201 내지 205), 및 공간음향 지각단서 추출부(206)를 포함한다.As shown in FIG. 2, the spatial acoustic perceptual
제1 내지 제5 서브밴드 필터링부(201 내지 205)는 외부로부터 입력된 다채널 오디오 신호를 각 채널에 대해 인간 청각특성에 기반한 서브밴드별로 구분하여 서브밴드 필터링한다. 그리고 제1 내지 제5 서브밴드 필터링부(201 내지 205)는 서브밴드 필터링된 제1 채널 내지 제5 채널 오디오 신호를 공간음향 지각단서 추출부(206)로 전달한다.The first to fifth
그리고 공간음향 지각단서 추출부(206)는 제1 내지 제5 서브밴드 필터링부(201 내지 205)에서 각각 서브밴드 필터링된 제1 채널 내지 제5 채널 오디오 신호를 분석하여 인접 채널 간 상호상관 정보 및 가상음원 방향정보가 포함된 공간음향 지각단서를 추출한다. 즉, 공간음향 지각단서 추출부(206)는 각 서브밴드 별로 채널간 상호상관 정보 및 가상음원 방향정보를 생성한다. 그리고 공간음향 지각단서 추출부(206)는 제1 채널 내지 제5 채널 오디오 신호를 다운믹싱부(112)로 전달하고, 생성된 채널간 상호상관 및 가상음원 방향정보를 복호화 장치(120)로 전송한다.The spatial acoustic
여기서, 채널 간 상호상관 정보는 각 서브밴드 신호에 대하여 주파수 영역에서 산출될 수 있다. 또한, 가상음원 방향정보는 인접채널 신호의 서브밴드 파워비율에 의해 인접채널 스피커 배치 각도 사이에서 각도 값으로 산출될 수 있다.Here, the cross-correlation information between channels may be calculated in the frequency domain for each subband signal. In addition, the virtual sound source direction information may be calculated as an angle value between the adjacent channel speaker placement angles by the subband power ratio of the adjacent channel signal.
도 3 은 본 발명에 따른 도 1의 다채널 신호 생성부의 일실시예 상세구성도이다.3 is a detailed block diagram of an embodiment of the multi-channel signal generator of FIG. 1 according to the present invention.
도 3에 도시된 바와 같이, 다채널 신호 생성부(121)는 제1 서라운드 채널신호 생성부(310), 제2 서라운드 채널신호 생성부(320), 및 중앙채널 신호 생성부(330)를 포함한다. 여기서, 제1 서라운드 채널신호 생성부(310)는 제1 적응필 터(311)와 제1 및 제2 감산기(312, 313)를 포함한다. 또한, 제2 서라운드 채널신호 생성부(320)는 제2 적응필터(321)와 제3 및 제4 감산기(322, 323)를 포함한다. 또한, 중앙채널 신호 생성부(330)는 가산기(331)와 제산기(332)를 포함한다.As shown in FIG. 3, the
다채널 신호 생성부(121)는 부호화 장치(110)에서 다채널 오디오 신호(원 신호)가 다운믹싱된 다운믹싱 스테레오 오디오 신호를 각 채널간 상호상관 값에 따라 분리하여 다운믹싱 다채널 오디오 신호를 생성한다. 여기서, 다운믹싱 다채널 오디오 신호 중 서라운드 채널 신호성분은 다운믹싱 좌채널 신호와 다운믹싱 우채널 신호의 차이 값을 제1 및 제2 적응필터(311, 321)의 계수를 갱신하는데 이용하여 구한다. 다채널 신호 생성부(121)는 적응필터를 이용한 스무딩 효과로 위상차이에 따라 특정 스펙트럼 신호가 왜곡되는 현상을 제거할 수 있다.The
이하, 다채널 신호 생성부(121)의 구성요소를 각각 상세히 살펴보기로 한다.Hereinafter, the components of the
제1 서라운드 채널신호 생성부(310)는 다운믹싱 스테레오 오디오 신호 중 다운믹싱 좌채널 오디오 신호에서 상호상관 값을 이용하여 중앙채널 신호성분과 서라운드 우채널 신호성분을 제거하여 다운믹싱 서라운드 좌채널 신호를 생성한다. 즉, 제1 서라운드 채널신호 생성부(310)는 다운믹싱 우채널 신호와 다운믹싱 좌채널 신호를 입력받고, 입력된 신호에서 제1 적응필터(311)와 제1 및 제2 감산기(312, 313)를 이용하여 다운믹싱 서라운드 좌채널 신호를 생성한다.The first surround
여기서, 제1 적응필터(311)는 공통된 신호 성분인 중앙채널 신호 성분을 억제하고 독립된 신호 성분인 서라운드 신호를 통과시키는 기능을 수행한다. 제1 감산기(312)는 다운믹싱 우채널 신호에서 제1 적응필터를 통과한 다운믹싱 좌채널 신 호를 빼서 오차신호를 출력한다. 이때, 출력된 오차신호는 제1 적응필터(311)의 계수를 갱신하는데 사용된다. 그리고 제2 감산기(313)는 다운믹싱 좌채널 신호에서 제1 감산기(312)의 출력 신호를 빼서 다운믹싱 서라운드 좌채널 신호를 생성한다. 여기서, 제1 감산기(312)의 출력 신호를 다운믹싱 서라운드 좌채널 신호에서 빼는 것은 전후방 상호상관을 최대화하기 위함이다.Here, the first
제2 서라운드 채널신호 생성부(320)는 다운믹싱 스테레오 오디오 신호 중 다운믹싱 우채널 오디오 신호에서 상호상관 값을 이용하여 중앙채널 신호성분과 서라운드 좌채널 신호성분을 제거하여 다운믹싱 서라운드 우채널 신호를 생성한다. 즉, 제2 서라운드 채널신호 생성부(320)는 다운믹싱 좌채널 신호와 다운믹싱 우채널 신호를 입력받고, 입력된 신호에서 제2 적응필터(321)와 제3 및 제4 감산기(322, 323)를 이용하여 다운믹싱 서라운드 우채널 신호를 생성한다.The second surround
여기서, 제2 적응필터(321)는 공통된 신호 성분인 중앙채널 신호 성분을 억제하고 독립된 신호 성분인 서라운드 신호를 통과시키는 기능을 수행한다. 제3 감산기(322)는 다운믹싱 좌채널 신호에서 다운믹싱 우채널 신호를 빼서 오차신호를 출력한다. 이때, 출력된 오차신호는 제2 적응필터(321)의 계수를 갱신하는데 사용된다. 그리고 제4 감산기(323)는 다운믹싱 우채널 신호에서 제2 감산기(322)의 출력 신호를 빼서 다운믹싱 서라운드 우채널 신호를 출력한다. 여기서, 제3 감산기(322)의 출력 신호를 다운믹싱 서라운드 우채널 신호에서 빼는 것은 전후방 상호상관을 최대화하기 위함이다.Here, the second
중앙채널 신호 생성부(330)는 다운믹싱 스테레오 오디오 신호 중 좌채널 오 디오 신호와 우채널 오디오 신호를 결합하여 다운믹싱 중앙채널 신호를 생성한다. 즉, 중앙채널 신호 생성부(330)는 다운믹싱 좌채널 신호와 다운믹싱 우채널 신호를 입력받고, 다운믹싱 두 채널 신호를 더한 후 반으로 나누어서 다운믹싱 중앙채널 신호를 생성한다.The center channel signal generator 330 generates a downmixed center channel signal by combining a left channel audio signal and a right channel audio signal among the downmixed stereo audio signals. That is, the center channel signal generator 330 receives the downmixing left channel signal and the downmixing right channel signal, adds the downmixing two channel signals, and divides them in half to generate the downmixing central channel signal.
도 4 는 본 발명에 따른 도 1의 다채널 신호 조정부의 일실시예 상세구성도이다.4 is a detailed configuration diagram of an embodiment of the multi-channel signal adjusting unit of FIG. 1 according to the present invention.
도 4에 도시된 바와 같이, 다채널 신호 조정부(122)는 제6 내지 제10 서브밴드 필터링부(401 내지 405), 제1 및 제2 상호상관 조정부(406, 407), 다채널 파워비율 산출부(408), 및 신호 변환부(409)를 포함한다.As shown in FIG. 4, the multi-channel
다채널 신호 조정부(122)는 다채널 신호 생성부(121)에서 생성된 다운믹싱 다채널 오디오 신호의 채널 간 상호상관 값을 원 신호의 채널 간 상호상관 정보에 맞게 조정하고, 상기 조정된 다채널 오디오 신호의 서브밴드별 파워 값을 원 신호의 가상음원 방향정보에 맞게 조정한다. 즉, 다채널 신호 조정부(122)는 다채널 신호 생성부(121)에서 생성된 다채널 음향 신호의 상호상관 및 서브밴드 파워를 조정하여 원래의 다채널 오디오 신호를 복원하는 기능을 수행한다.The multi-channel
이하, 다채널 신호 조정부(122)의 구성요소 각각에 대해 상세히 살펴보기로 한다.Hereinafter, each component of the multi-channel
제6 내지 제10 서브밴드 필터링부(401 내지 405)는 다채널 신호 생성부(121)에서 생성된 다운믹싱 다채널 오디오 신호를 각각 서브밴드 필터링한다.The sixth to tenth
그리고 다채널 파워비율 산출부(408)는 부호화 장치(110)로부터 전달받은 가 상음원 방향정보로부터 다채널 신호의 서브밴드별 파워비율을 산출한다.The multi-channel
그리고 제1 및 제2 상호상관 조정부(406, 407)는 제6 내지 제10 서브밴드 필터링부(401 내지 405)에서 각각 서브밴드 필터링된 다운믹싱 다채널 오디오 신호의 채널 간 상호상관 값을 원 신호의 채널 간 상호상관 정보에 맞게 조정한다.In addition, the first and second
그리고 신호 변환부(409)는 제1 및 제2 상호상관 조정부(406, 407)에서 각각 상호상관이 조정된 다채널 오디오 신호의 서브밴드별 파워 값을 다채널 파워비율 산출부(408)에서 산출된 다채널 파워비율에 맞게 조정하고 시간영역으로 변환한다. 즉, 신호 변환부(409)는 다채널 파워비율 산출부(408)에서 계산된 파워비율에 맞게 제1 및 제2 상호상관 조정부(406, 407)에 의해 출력된 서라운드 신호의 파워에 해당하는 서브밴드별로 다채널 음향신호의 파워 값을 조정하고, 파워 값이 조정된 신호를 시간영역으로 변환한다.In addition, the
도 5 는 본 발명에 따른 상호상관을 이용한 다채널 오디오 신호 복호화 방법에 대한 일실시예 흐름도이다.5 is a flowchart illustrating a method of decoding a multichannel audio signal using cross-correlation according to the present invention.
우선, 부호화 방법을 살펴보면, 공간음향 지각단서 분석부(111)는 다채널 오디오 신호를 서브밴드 필터링하고 필터링된 각 채널 오디오 신호로부터 인접 채널 간 상호상관 및 가상음원 방향정보가 포함되는 공간음향 지각단서를 추출한다.First, referring to the encoding method, the spatial acoustic
그리고 다운믹싱부(112)는 필터링된 각 채널 오디오 신호를 스테레오 오디오 신호로 다운믹싱하여 부호화한다.The
이하, 본 발명에 따른 다채널 오디오 신호 복호화 방법에 살펴보면 다음과 같다.Hereinafter, a multichannel audio signal decoding method according to the present invention will be described.
다채널 신호 생성부(121)는 부호화 장치(110)로부터 전달받은 다운믹싱 스테레오 신호에서 다채널 오디오 신호(원 신호)가 다운믹싱된 스테레오 오디오 신호를 각 채널간 상호상관 값에 따라 분리하여 다운믹싱 다채널 오디오 신호를 생성한다(502).The
그리고 다채널 신호 조정부(122)는 생성된 다운믹싱 다채널 오디오 신호의 채널 간 상호상관 값을 원 신호의 채널 간 상호상관 정보에 맞게 조정한다(504).The multi-channel
이후, 다채널 신호 조정부(122)는 조정된 다채널 오디오 신호의 서브밴드별 파워 값을 원 신호의 가상음원 방향정보에 맞게 조정하여 복호화한다(506).Thereafter, the multi-channel
한편, 전술한 바와 같은 본 발명의 방법은 컴퓨터 프로그램으로 작성이 가능하다. 그리고 상기 프로그램을 구성하는 코드 및 코드 세그먼트는 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 작성된 프로그램은 컴퓨터가 읽을 수 있는 기록매체(정보저장매체)에 저장되고, 컴퓨터에 의하여 판독되고 실행됨으로써 본 발명의 방법을 구현한다. 그리고 상기 기록매체는 컴퓨터가 판독할 수 있는 모든 형태의 기록매체를 포함한다.On the other hand, the method of the present invention as described above can be written in a computer program. And the code and code segments constituting the program can be easily inferred by a computer programmer in the art. In addition, the written program is stored in a computer-readable recording medium (information storage medium), and read and executed by a computer to implement the method of the present invention. The recording medium may include any type of computer readable recording medium.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.The present invention described above is capable of various substitutions, modifications, and changes without departing from the technical spirit of the present invention for those skilled in the art to which the present invention pertains. It is not limited by the drawings.
도 1 은 본 발명에 따른 상호상관을 이용한 다채널 오디오 신호 복호화 장치의 일실시예 구성도,1 is a configuration diagram of an apparatus for decoding a multichannel audio signal using cross-correlation according to the present invention;
도 2 는 본 발명에 이용되는 도 1의 공간음향 지각단서 분석부의 일실시예 상세구성도,2 is a detailed configuration diagram of an embodiment of the spatial acoustic perception cue analysis unit of FIG. 1 used in the present invention;
도 3 은 본 발명에 따른 도 1의 다채널 신호 생성부의 일실시예 상세구성도,3 is a detailed configuration diagram of an embodiment of the multi-channel signal generator of FIG. 1 according to the present invention;
도 4 는 본 발명에 따른 도 1의 다채널 신호 조정부의 일실시예 상세구성도,4 is a detailed configuration diagram of an embodiment of the multi-channel signal adjusting unit of FIG. 1 according to the present invention;
도 5 는 본 발명에 따른 상호상관을 이용한 다채널 오디오 신호 복호화 방법에 대한 일실시예 흐름도이다.5 is a flowchart illustrating a method of decoding a multichannel audio signal using cross-correlation according to the present invention.
* 도면의 주요 부분에 대한 부호 설명* Explanation of symbols on the main parts of the drawing
120: 복호화 장치 121: 다채널 신호 생성부120: decoding apparatus 121: multi-channel signal generation unit
122: 다채널 신호 조정부 310: 제1 서라운드 채널신호 생성부122: multi-channel signal adjusting unit 310: first surround channel signal generating unit
320: 제2 서라운드 채널신호 생성부 311: 제1 적응 필터320: second surround channel signal generator 311: first adaptive filter
321: 제2 적응 필터 330: 중앙채널 신호 생성부321: second adaptive filter 330: center channel signal generator
401 내지 405: 제6 내지 제10 서브밴드 필터링부401 to 405: sixth to tenth subband filtering units
406: 제1 상호상관 조정부 407: 제2 상호상관 조정부406: first cross-correlation adjustment unit 407: second cross-correlation adjustment unit
408: 다채널 파워비율 산출부 409: 신호 변환부408: multi-channel power ratio calculator 409: signal converter
Claims (8)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20060121683 | 2006-12-04 | ||
KR1020060121683 | 2006-12-04 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080051042A true KR20080051042A (en) | 2008-06-10 |
KR100917845B1 KR100917845B1 (en) | 2009-09-18 |
Family
ID=39806185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070107406A KR100917845B1 (en) | 2006-12-04 | 2007-10-24 | Apparatus and method for decoding multi-channel audio signal using cross-correlation |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100917845B1 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010036060A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
KR101108060B1 (en) * | 2008-09-25 | 2012-01-25 | 엘지전자 주식회사 | A method and an apparatus for processing a signal |
KR101112215B1 (en) * | 2010-02-26 | 2012-03-13 | 서경대학교 산학협력단 | Method and system for blocking contents including harmful sound |
US8258849B2 (en) | 2008-09-25 | 2012-09-04 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
US8346379B2 (en) | 2008-09-25 | 2013-01-01 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6267860B2 (en) | 2011-11-28 | 2018-01-24 | 三星電子株式会社Samsung Electronics Co.,Ltd. | Audio signal transmitting apparatus, audio signal receiving apparatus and method thereof |
KR20140117931A (en) | 2013-03-27 | 2014-10-08 | 삼성전자주식회사 | Apparatus and method for decoding audio |
-
2007
- 2007-10-24 KR KR1020070107406A patent/KR100917845B1/en not_active IP Right Cessation
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010036060A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
WO2010036060A3 (en) * | 2008-09-25 | 2010-07-22 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
KR101108060B1 (en) * | 2008-09-25 | 2012-01-25 | 엘지전자 주식회사 | A method and an apparatus for processing a signal |
US8258849B2 (en) | 2008-09-25 | 2012-09-04 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
US8346379B2 (en) | 2008-09-25 | 2013-01-01 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
US8346380B2 (en) | 2008-09-25 | 2013-01-01 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
KR101112215B1 (en) * | 2010-02-26 | 2012-03-13 | 서경대학교 산학협력단 | Method and system for blocking contents including harmful sound |
Also Published As
Publication number | Publication date |
---|---|
KR100917845B1 (en) | 2009-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101228575B (en) | Sound channel reconfiguration with side information | |
KR100878371B1 (en) | Energy dependent quantization for efficient coding of spatial audio parameters | |
TWI544479B (en) | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program usin | |
KR101065704B1 (en) | Methods and apparatuses for encoding and decoding object-based audio signals | |
US8553895B2 (en) | Device and method for generating an encoded stereo signal of an audio piece or audio datastream | |
JP5081838B2 (en) | Audio encoding and decoding | |
JP5455647B2 (en) | Audio decoder | |
TWI404429B (en) | Method and apparatus for encoding/decoding multi-channel audio signal | |
RU2406166C2 (en) | Coding and decoding methods and devices based on objects of oriented audio signals | |
CN101542595B (en) | For the method and apparatus of the object-based sound signal of Code And Decode | |
EP2850613B1 (en) | Efficient encoding and decoding of multi-channel audio signal with multiple substreams | |
AU2019216363B2 (en) | Audio scene encoder, audio scene decoder and related methods using hybrid encoder/decoder spatial analysis | |
CN101410889A (en) | Controlling spatial audio coding parameters as a function of auditory events | |
JP2011030228A (en) | Device and method for generating level parameter, and device and method for generating multichannel representation | |
KR100917845B1 (en) | Apparatus and method for decoding multi-channel audio signal using cross-correlation | |
RU2581782C1 (en) | Hybrid encoding of multichannel sound | |
JP7383685B2 (en) | Improved binaural dialogue | |
JPWO2005112002A1 (en) | Audio signal encoding apparatus and audio signal decoding apparatus | |
IL266580A (en) | Method and apparatus for adaptive control of decorrelation filters | |
RU2420026C2 (en) | Methods and devices to code and to decode audio signals based on objects | |
KR20070001139A (en) | An audio distribution system, an audio encoder, an audio decoder and methods of operation therefore | |
MX2008011994A (en) | Generation of spatial downmixes from parametric representations of multi channel signals. | |
KR20080010981A (en) | Method for encoding and decoding data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |