KR100608062B1 - 오디오 데이터의 고주파수 복원 방법 및 그 장치 - Google Patents
오디오 데이터의 고주파수 복원 방법 및 그 장치 Download PDFInfo
- Publication number
- KR100608062B1 KR100608062B1 KR1020040061423A KR20040061423A KR100608062B1 KR 100608062 B1 KR100608062 B1 KR 100608062B1 KR 1020040061423 A KR1020040061423 A KR 1020040061423A KR 20040061423 A KR20040061423 A KR 20040061423A KR 100608062 B1 KR100608062 B1 KR 100608062B1
- Authority
- KR
- South Korea
- Prior art keywords
- high frequency
- filter bank
- transient
- frequency region
- bank value
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000001052 transient effect Effects 0.000 claims abstract description 36
- 238000011084 recovery Methods 0.000 claims abstract description 12
- 230000008569 process Effects 0.000 claims abstract description 10
- 230000005236 sound signal Effects 0.000 claims abstract description 6
- 230000007704 transition Effects 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000013139 quantization Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 abstract description 3
- 230000003595 spectral effect Effects 0.000 description 7
- 230000010076 replication Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
디코더내에서 mp3 압축 오디오 신호의 고주파수 복원 방법 및 그 장치가 개시되어 있다. 본 발명은 입력되는 비트스트림으로부터 추출되는 MDCT 계수로부터 윈도우 타입에 따른 저주파수 영역의 필터 뱅크 값을 생성하는 과정, 윈도우 타입을 근거로 프레임의 트랜지언트(transient)정보를 추출하고, 그 트랜지언트 정보에 따른 웨이트 계수를 선택하는 과정, 저주파수 영역의 필터 뱅크값으로부터 손실된 고주파수 영역의 필터 뱅크 값을 복원하는 과정, 선택된 웨이트 계수를 바탕으로 상기 과정에서 복원된 고주파수 성분들의 필터 뱅크 값을 조정하는 과정을 포함한다.
Description
도 1은 기존의 SBR 방식의 mp3PRO 디코딩 블록도이다.
도 2는 본 발명에 따른 고주파수 복원 방식을 적용한 mp3 디코더의 전체 블록도이다.
도 3a 내지 도 3d는 본 발명에 따른 고주파수 성분을 복원하는 과정을 보이는 그래프이다.
도 4는 본 발명에 따른 오디오 데이터 고주파수 복원 방법을 보이는 흐름도이다.
본 발명은 오디오 압축/복호 시스템에 관한 것이며, 특히 디코더내에서 mp3 압축 오디오 신호의 고주파수 복원 방법 및 그 장치에 관한 것이다.
일반적으로 디지탈 엠펙(MPEG:Moving Picture Experts Group) 오디오로 통칭되고 있는 디지탈 오디오는 고품질,고능률 스테레오 부호화를 위한 국제 표준화기구(ISO/IEC)의 표준방식이다. 상기 엠펙 오디오는 엠펙 비디오와 조합됨으로써 고 능률의 멀티미디어 정보압축을 실현 가능하게 하며, 최근에는 디지탈 티브이(DTV),디브이디(DVD), 디지탈 음악방송(DAB:Digital Audio Broadcasting) 및 엠피-3 플레이어등 다양한 응용 제품이 등장하고 있는 상황이다. mp3오디오는 최근 널리 사용되고 있는 .mp3 확장자를 갖는 방식으로, 엠펙-1 오디오 계층 3의 방식으로 인코딩된 것을 의미한다. 또한, 엠펙 오디오의 압축원리는 인간의 감각특성을 이용해서 감도가 낮은 세부의 정보를 생략하여 부호량을 절감시키는 "지각부호화(Perceptual Coding)" 방법을 이용한다.
그러나 mp3 오디오 데이터는 압축을 많이 할수록 고주파수 영역을 손실하게된다. 이러한 고주파 영역의 손실로 인해 음색이 바뀌고 명료도가 저하되며 억눌리거나 무딘 소리가 나게 된다. 따라서 손실 고주파수 성분들을 복원하기 위해 후처리 음질 개선을 적용한 SBR(SBR(Spectral Band Replication)방식의 mp3PRO 포맷을 이용하고 있다.
도 1은 기존의 SBR 방식의 mp3PRO 디코딩 블록도이다.
도 1을 참조하면, 디코더부(110)는 mp3PRO 비트스트림이 입력되면 시간 차원의 PCM 오디오 데이터와 보조 데이터로 디코딩한다. 이때 PCM 오디오 데이터는 좌측채널 오디오 데이터와 우측채널 오디오 데이터로 분리되고, 보조 데이터는 엔벨로프(envelope) 정보를 포함한다. QMF 분석부(120)는 PCM 오디오 데이터를 32 밴드들의 저주파수 영역의 신호로 변환한다. 고주파수 발생부(130)는 QMF 분석부(120)에서 변환된 저주파수 영역의 성분들과 하모닉(harmonic)한 관계를 가지도록 엔벨로프 정보에 따른 고주파수 성분들을 생성한다. 엔벨로프 조정부(140)는 저주파스 영역의 스펙트럼을 이용하여 엔벨로프 정보에 따라 고주파수 성분들의 에너지를 조정한다. QMF 합성부(150)는 엔벨로프 조정부(140)에서 조정된 고주파수 성분들의 에너지와 QMF 분석부(120)에서 분석된 저주파수 영역의 신호를 합성하여 고주파수 성분이 복원된 시간차원의 오디오 데이터를 출력한다. 채널분리부(160)는 디코더(110)에서 발생하는 보조 데이터에 따라 좌측 채널과 우측 채널을 분리한 오디오 데이터를 출력한다.
결국, 기존에서 디코더부(110)에서 디코딩된 mp3 오디오 데이터는 후처리 장치들 즉, QMF 분석부(120), 고주파발생부(130), 엔벨로프조절부(140), QMF 합성부(150)에 의해 고주파수 성분이 복원된다. 따라서 SBR(Spectral Band Replication)방식은 후처리를 이용함으로써 다음과 같은 두 가지 문제점이 있다.
첫째로, 디코딩된 파일을 주파수 영역으로 변환하고 존재하는 주파수 성분들로부터 고주파 성분들을 추정한다. 추정된 고주파 성분들은 다시 시간 차원으로 변환되고 디코딩 파일에 더해져서 출력된다. 기존의 SBR(Spectral Band Replication)방식의 mp3 디코딩 방법은 시간 차원에서 주파수 차원으로, 주파수 차원에서 시간 차원으로 변환하는 두가지 과정이 필요하게 된다. 따라서 기존의 SBR(Spectral Band Replication)방식의 mp3 디코딩 방법은 차원 변환 과정에서 과도한 계산량이 요구된다.
두 번째로, SBR(Spectral Band Replication)방식의 mp3PRO 디코더는 주파수 차원에서 고주파수 영역을 복원하기 위해 인코더단에서 구한 스펙트럼 엔빌로프(spectrum envelope) 정보를 이용하므로 기존의 mp3 인코더가 그대로 사용되지 않 고 수정된다. 즉, SBR(Spectral Band Replication)방식의 mp3PRO 디코더는 기존의 mp3 파일에 대해 고주파수 성분들을 복원할 수 없다.
본 발명이 이루고자하는 기술적 과제는 mp3 디코딩 과정중에 손실된 고주파수 성분들을 복원함으로써 기존의 오디오 코덱 방식에 의해 손실된 고주파수 성분들로 인해 저하된 원음의 음색을 재생하고 명료도를 높이는 오디오 데이터의 고주파수 복원 방법을 제공하는 데 있다.
본 발명이 이루고자하는 다른 기술적 과제는 오디오 데이터의 고주파수 복원 방법을 적용한 오디오 데이터의 고주파수 복원 장치를 제공하는 데 있다.
상기의 기술적 과제를 해결하기 위하여, 본 발명은 압축 오디오 신호의 고주파수 성분 복원 방법에 있어서,
(a) 입력되는 비트스트림으로부터 추출되는 MDCT 계수로부터 윈도우 타입에 따른 저주파수 영역의 필터 뱅크 값을 생성하는 과정;
(b) 상기 윈도우 타입을 근거로 프레임의 트랜지언트(transient)정보를 추출하고, 그 트랜지언트 정보에 따른 웨이트 계수를 선택하는 과정;
(c) 상기 생성된 저주파수 영역의 필터 뱅크값으로부터 손실된 고주파수 영역의 필터 뱅크 값을 복원하는 과정;
(d) 상기 과정에서 선택된 웨이트 계수를 바탕으로 상기 과정에서 복원된 고주파수 성분들의 필터 뱅크 값을 조정하는 과정을 포함하는 것을 특징으로 한다.
상기의 다른 기술적 과제를 해결하기 위하여, 본 발명은 압축 오디오 신호의 고주파수 성분 복원 장치에 있어서,
입력되는 압축 오디오 비트 스트림을 역양자화하여 MDCT를 추출하는 역 양자화부;
상기 역 양자화부 추출된 MDCT 계수로부터 저주파수 영역의 필터 뱅크 값을 생성하는 역 MDCT부;
상기 역 MDCT부에서 사용하는 윈도우 타입을 근거로 프레임의 트랜지언트(transient)정보를 추출하고, 그 트랜지언트 정보를 바탕으로 고주파수 성분들의 크기를 조정하는 웨이트 계수를 선택하는 웨이트 계수 추출부;
상기 역 DCT부에서 생성된 저주파수 영역의 필터 뱅크값으로 부터 고주파수 영역의 필터 뱅크값을 복원하는 고주파수 영역 생성부;
상기 웨이트 계수 추출부에서 선택된 웨이트 계수를 상기 고주파수영역 생성부에서 복원된 고주파수 영역의 필터 뱅크 값에 곱하는 곱셈부를 포함하는 것을 특징으로 한다.
이하 첨부된 도면을 참조로하여 본 발명의 바람직한 실시예를 설명하기로 한다.
먼저, 본 발명에 따른 mp3 디코더에 입력되는 mp3 비트 스트림은 다음과 같은 과정을 통해 형성된다. 먼저, PCM(Pulse coded Modulation) 형태의 오디오 데이터를 입력한다. 이어서, 입력된 PCM 오디오 데이터를 각 그래뉼(granule) 마다 576개 샘플들로 나눈다. 이어서, 그 샘플들에 대해서 MPEG1 레이어3(MP3)에서 심리 음 향 모델을 적용하여 지각 에너지(perceptual energy)를 구한다. 이어서, 심리음향 모델에서 구해진 지각 에너지와 임계치를 비교하여 윈도우잉을 스위칭하면서 MDCT를 수행한다. MDCT 윈도우 사이즈의 일부 또는 전부는 임계치에 따라 스위칭 될 수 있다. 즉, 지각 에너지의 레벨이 임계치보다 크면 에너지 레벨이 급격하게 증가하는 어택(atack) 상태 신호에 해당하므로 쇼트 윈도우를 선택하고, 임계치보다 적으면 에너지 레벨이 일정한 상태의 신호에 해당하므로 롱 윈도우를 선택하며, 이어서 그 선택된 각 윈도우 범위에 해당하는 오디오 샘플들을 MDCT 처리하여 주파수 도메인상의 데이터로 변환한다. 이때 스타트 윈도우 또는 스톱 윈도우는 롱 윈도우에서 쇼트 윈도우로 스위칭하기 위해 사용된다. 또한 윈도우잉 타입은 MPEG 1 레이어3에서 롱 윈도우, 시작 윈도우, 쇼트 윈도우, 스톱 윈도우등으로 개시되어 있다. 그리고 각 윈도우들은 엘리어싱을 방지하기 위해 서로 오버랩된다. 이어서, MDCT가 수행된 주파수 도메인상의 데이터를 할당된 비트수에 따라 양자화한다. 이어서, 양자화된 데이터를 호프만 코딩(huffman coding)을 이용하여 mp3 비트스트림을 형성한다. 이때 mp3 비트스트림은 프레임 단위로 형성된다. mp3 프레임 포맷은 헤더, 사이드 정보 및 메인 데이터로 이루어진다. 사이드 정보는 스케일 팩터, 윈도우 타입과 같이 메인 데이터를 디코드하기 위한 필요 정보를 포함한다.
도 2는 본 발명에 따른 고주파수 복원 방식을 적용한 mp3 디코더의 전체 블록도이다.
도 2의 mp3 디코더는 역양자화부(210), 사이드 정보 분석부(220), 역MDCT부(230), 고주파 영역 분석부(250), 고주파 영역 생성부(260), 웨이트 계수 추출부 (240), 곱셈부(270), 합산부(280), 역 필터 뱅크부(290)로 구성되며, 웨이트 계수 추출부(240)는 트랜지언트 정보 검출부(242), 웨이트 테이블 선택부(244)를 구비한다.
먼저, 역양자화부(210)는 입력되는 mp3 비트 스트림으로부터 MDCT(Modified DCT) 계수를 추출한다. 이때 역양자화된 MDCT 계수는 고주파수 대역이 손실된 저주파수 대역으로 분포한다.
사이드 정보 분석부(220)는 입력되는 mp3 비트 스트림으로부터 사이드 정보(side information)를 분석하여 윈도우 타입을 추출한다.
역MDCT부(230)는 주파수역양자화부(210)에서 추출된 MDCT 계수로부터 사이드 정보 분석부(220)에서 추출된 윈도우 타입을 이용하여 필터 뱅크값(filter bank value)을 생성한다.
트랜지언트 정보 검출부(242)는 역MDCT부(230)에서 사용하던 윈도우 타입으로부터 현재 프레임의 트랜지언트 정보를 검출한다. 즉, 윈도우 타입이 롱(long)인 경우 현재 프레임은 논-트랜지언트(non-transient) 영역이고, 상기 윈도우 타입이 쇼트(short)인 경우 현재 프레임은 트랜지언트(transient) 영역이고, 상기 윈도우 타입이 스타트(start) 또는 엔드(end)인 경우 현재 프레임이 트랜지션(transition) 영역이다.
웨이트 테이블 선택부(244)는 트랜지언트 정보 검출부(242)에서 검출된 트랜지언트 정보로부터 고주파수 성분들의 웨이트를 조정하기 위한 웨이트 계수를 선택한다. 예컨대, 트랜지언트(transient) 영역에서는 높은 웨이트를 갖는 고주파 성분 (harmonic component), 논-트랜지언트(non-transient) 영역에서는 낮은 웨이트를 갖는 고주파 성분(harmonic component), 트랜지션(transition) 영역에서는 중간 웨이트를 갖는 고주파 성분을 갖는다.
고주파수 영역 분석부(250)는 역MDCT부(230)에서 생성된 필터 뱅크값을 분석하여 손실된 고주파수 영역을 검출한다. 예를 들어 도 3a를 보면, 96kbps의 mp3 파일인 경우 32개의 필터 뱅크값들중 11.025kHz이상의 주파수 성분들이 손실된다.128kbps의 mp3 파일인 경우 15kHz 32개의 필터 뱅크값들중 15kHz이상의 주파수 성분들이 손실된다.
고주파수 영역 생성부(260)는 고주파수 영역 분석부(250)에서 손실된 고주파수 성분들을 복원한다. 도 3b를 참조하여 96kbps의 mp3 파일에 대해서 설명하면, 32개의 필터 뱅크값들중 11.025kHz이상의 주파수 성분들이 손실되므로 "0"값을 가지는 16번째 뱅크 이상의 필터 뱅크값들을 8 - 15번째 필터 뱅크 값들로부터 복원해야한다. 예컨대, 16번째 밴드는 8번째 밴드와 하모닉(harmonic) 관계를 가지므로 8번째의 필터 뱅크값이 복사된다. 마찬가지로 18번째 밴드는 9번째 밴드의 필터 뱅크값이 복사된다. 또한 사람의 인지 특성상 고주파수 영역에서 같은 주파수라고 인지하는 대역폭이 넓어지므로 19번째 밴드는 복원된 18번째 밴드를 복사한다. 이때 음성은 6kHzs이내의 주파수 성분을 갖는다. 음성이 포함된 저주파 성분들로부터 고주파 성분들을 생성할 경우 고주파수 영역에 음성에 해당하는 주파수 성분들이 나타나는 문제점이 있다. 따라서 5.5kHz이내의 저주파수 영역의 1 - 7번째 필터 뱅크값은 고주파수 복원용으로 이용되지 않는다.
곱셈부(270)는 웨이트 테이블 선택부(244)에서 선택된 웨이트 계수를 고주파수 성분들에 곱하여 도 3c 및 도 3d의 그래프와 같은 고주파수 성분들의 크기를 조정한다. 도 3c는 현재 프레임이 트랜지언트 영역인 경우 복원된 고조파 성분들을 보이는 그래프이다. 도 3c를 보면, 트랜지언트 영역에서는 높은 웨이트들을 갖는 고조파 성분들이 생성된다. 도 3d는 현재 프레임이 논-트랜지언트 영역인 경우 복원된 고조파 성분들을 보이는 그래프이다. 도 3d를 보면, 논-트랜지언트 영역에서는 낮은 웨이트들을 갖는 고조파 성분들이 생성된다.
합성부(280)는 역 MDCT부(230)에서 생성된 저주파수 영역의 필터 뱅크 값과 곱셈부(270)에서 생성되는 고주파수 영역의 필터 뱅크 값을 합성한다.
역다상필터뱅크부(290)는 합성부(280)에서 고주파수 성분이 복원된 필터 뱅크 값들을 서브밴드로 통합한 후, 이 통합된 서브밴드를 합성 필터로 통과시켜 PCM(Pulse Coded Modulation)오디오 데이터로 복원한다.
도 4는 본 발명에 따른 오디오 데이터 고주파수 복원 방법을 보이는 흐름도이다.
먼저, 프레임 단위의 mp3 비트스트림을 입력한다(410).
이때 입력되는 압축 오디오 비트 스트림을 역양자화하여 MDCT를 추출한다(420). 동시에 사이드 정보(side information)를 분석하여 윈도우 타입을 추출한다.
이어서, MDCT 계수를 윈도우 타입에 따라 역 MDCT하여 저주파수 영역의 필터 뱅크 값을 생성한다(430). 이때 윈도우 타입을 근거로 프레임의 트랜지언트 (transient)정보를 추출하고(424), 그 트랜지언트 정보를 바탕으로 고주파수 성분들의 크기를 조정하는 웨이트 계수를 계수 테이블에서 선택한다(426).
이어서, 저주파수영역의 필터 뱅크값을 분석하여 손실된 고주파수 영역을 검출한다(440).
이어서, 저주파수 영역의 필터 뱅크값으로 부터 고주파수 영역의 필터 뱅크값을 복원한다(450).
이어서, 계수 테이블에서 선택된 웨이트 계수를 복원된 고주파수 영역의 필터 뱅크 값에 곱하여 고주파수 성분의 크기를 조정한다(460).
이어서, 역 MDCT를 통해 생성된 저주파수 영역의 필터 뱅크 값과 조정된 고주파수 영역의 필터 뱅크 값을 합성한다(470).
이어서, 고주파수 성분이 복원된 필터 뱅크 값들을 서브밴드로 통합한 후, 이 통합된 서브밴드를 합성 필터로 통과시켜 PCM(Pulse Coded Modulation)오디오 데이터로 복원한다(480).
본 발명은 상술한 실시예에 한정되지 않으며, 본 발명의 사상내에서 당업자에 의한 변형이 가능함은 물론이다. 즉, 본 발명은 MP3재생기, 노트북 PC등과 같은 오디오를 재생하는 모든 기기에 오디오 데이터의 고주파수 성분을 복원하는 기술에 적용할 수 있다.
상술한 바와 같이 본 발명에 의하면, 기존의 mp3 인코더에 대한 수정이 전혀 필요없고, mp3 디코딩 과정중에 손실된 고주파수 성분들을 복원함으로써 기존에 사 용하던 차원 변환이 필요하지 않으므로 적은 계산량으로 mp3 음질을 개선할 수 있다.
Claims (8)
- 압축 오디오 신호의 고주파수 성분 복원 방법에 있어서,(a) 입력되는 비트스트림으로부터 추출되는 MDCT 계수로부터 윈도우 타입에 따른 저주파수 영역의 필터 뱅크 값을 생성하는 과정;(b) 상기 윈도우 타입을 근거로 프레임의 트랜지언트(transient)정보를 추출하고, 그 트랜지언트 정보에 따른 웨이트 계수를 선택하는 과정;(c) 상기 생성된 저주파수 영역의 필터 뱅크값으로부터 손실된 고주파수 영역의 필터 뱅크 값을 복원하는 과정;(d) 상기 (b)과정에서 선택된 웨이트 계수를 바탕으로 상기 과정에서 복원된 고주파수 성분들의 필터 뱅크 값을 조정하는 과정을 포함하는 오디오 데이터의 고주파수 복원 방법.
- 제1항에 있어서, (b) 과정은(b-1) 역 MDCT에서 사용되는 윈도우 타입을 참조하여 현재 프레임에 대한 트랜지언트 정보를 추출하는 과정;(b-2) 상기 (b-1)과정에서 추출된 트랜지언트 정보에 따라 상기 고주파 성분의 필터 뱅크값의 웨이트를 조정하는 웨이트 계수를 소정의 계수 테이블로부터 선택하는 과정을 구비하는 것을 특징으로 하는 오디오 데이터의 고주파수 복원 방법.
- 제2항에 있어서, 상기 트랜지언트 정보는 트랜지언트 영역 정보, 논-트랜지언트 영역 정보, 트랜지션 영역 정보임을 특징으로 하는 오디오 데이터의 고주파수 복원 방법.
- 제2항에 있어서, 상기 윈도우가 롱(long) 타입인 경우 현재 프레임은 논-트랜지언트(non-transient) 영역이고, 상기 윈도우가 쇼트(short) 타입인 경우 현재 프레임은 트랜지언트(transient) 영역이고, 상기 윈도우가 스타트(start) 또는 엔드(end)타입인 경우 현재 프레임이 트랜지션(transition) 영역임을 특징으로 하는 오디오 데이터의 고주파수 복원 방법.
- 제1항에 있어서, 상기 (c)과정은 상기 트랜지언트 정보에 따라 선택된 웨이트 계수와 고주파 성분들의 필터 뱅크값을 곱하는 것임을 특징으로 하는 오디오 데이터의 고주파수 복원 방법.
- 압축 오디오 신호의 고주파수 성분 복원 장치에 있어서,입력되는 압축 오디오 비트 스트림을 역양자화하여 MDCT를 추출하는 역 양자화부;상기 역 양자화부 추출된 MDCT 계수로부터 저주파수 영역의 필터 뱅크 값을 생성하는 역 MDCT부;상기 역 MDCT부에서 사용하는 윈도우 타입을 근거로 프레임의 트랜지언트(transient)정보를 추출하고, 그 트랜지언트 정보를 바탕으로 고주파수 성분들의 크기를 조정하는 웨이트 계수를 선택하는 웨이트 계수 추출부;상기 역 DCT부에서 생성된 저주파수 영역의 필터 뱅크값으로 부터 고주파수 영역의 필터 뱅크값을 복원하는 고주파수 영역 생성부;상기 웨이트 계수 추출부에서 선택된 웨이트 계수를 상기 고주파수영역 생성부에서 복원된 고주파수 영역의 필터 뱅크 값에 곱하는 곱셈부를 포함하는 오디오 데이터의 고주파수 복원 장치.
- 제6항에 있어서, 상기 역 MDCT부에서 생성된 주파수 영역의 필터 뱅크 값과 상기 곱셈부에서 생성되는 고주파수 영역의 필터 뱅크 값을 합성하는 합성부를 더 포함하는 것을 특징으로 하는 오디오 데이터의 고주파수 복원 장치.
- 제6항에 있어서, 상기 웨이트 계수 추출부는상기 역 MDCT에서 사용되는 윈도우 타입으로부터 현재 프레임에 대한 트랜지언트정보를 검출하는 트랜지언트 정보 검출부;상기 트랜지언트 정보 검출부에서 검출된 트랜지언트 정보에 상응하는 웨이트를 미리 정해진 계수 테이블로부터 선택하는 웨이트 계수 선택부를 포함하는 것을 특징으로 하는 오디오 데이터의 고주파수 복원 장치.
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040061423A KR100608062B1 (ko) | 2004-08-04 | 2004-08-04 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
US11/125,152 US20060031075A1 (en) | 2004-08-04 | 2005-05-10 | Method and apparatus to recover a high frequency component of audio data |
IT001351A ITMI20051351A1 (it) | 2004-08-04 | 2005-07-14 | Metodo ed apparato per recuperare un componente ad alta frequenza di dati audio |
CNA2005100842636A CN1734555A (zh) | 2004-08-04 | 2005-07-15 | 恢复音频数据的高频分量的方法和设备 |
NL1029619A NL1029619C2 (nl) | 2004-08-04 | 2005-07-26 | Werkwijze en inrichting voor het herstellen van een hoge frequentiecomponent van audiodata. |
JP2005221617A JP2006048043A (ja) | 2004-08-04 | 2005-07-29 | オーディオデータの高周波数の復元方法及びその装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040061423A KR100608062B1 (ko) | 2004-08-04 | 2004-08-04 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060012783A KR20060012783A (ko) | 2006-02-09 |
KR100608062B1 true KR100608062B1 (ko) | 2006-08-02 |
Family
ID=36076940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040061423A KR100608062B1 (ko) | 2004-08-04 | 2004-08-04 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20060031075A1 (ko) |
JP (1) | JP2006048043A (ko) |
KR (1) | KR100608062B1 (ko) |
CN (1) | CN1734555A (ko) |
IT (1) | ITMI20051351A1 (ko) |
NL (1) | NL1029619C2 (ko) |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100530377B1 (ko) * | 2003-12-30 | 2005-11-22 | 삼성전자주식회사 | 엠펙 오디오 디코더의 합성필터 및 그 디코딩 방법 |
KR100707177B1 (ko) * | 2005-01-19 | 2007-04-13 | 삼성전자주식회사 | 디지털 신호 부호화/복호화 방법 및 장치 |
CN101326853B (zh) * | 2005-12-13 | 2011-11-23 | Nxp股份有限公司 | 处理音频数据流的装置和方法 |
DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
JP4967618B2 (ja) * | 2006-11-24 | 2012-07-04 | 富士通株式会社 | 復号化装置および復号化方法 |
WO2008071353A2 (en) | 2006-12-12 | 2008-06-19 | Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V: | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
FR2911227A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard |
FR2911228A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
KR101355376B1 (ko) * | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
JP5098530B2 (ja) * | 2007-09-12 | 2012-12-12 | 富士通株式会社 | 復号化装置、復号化方法および復号化プログラム |
US9177569B2 (en) | 2007-10-30 | 2015-11-03 | Samsung Electronics Co., Ltd. | Apparatus, medium and method to encode and decode high frequency signal |
KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
KR101441896B1 (ko) | 2008-01-29 | 2014-09-23 | 삼성전자주식회사 | 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 |
KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
KR101441897B1 (ko) * | 2008-01-31 | 2014-09-23 | 삼성전자주식회사 | 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치 |
JP5511785B2 (ja) * | 2009-02-26 | 2014-06-04 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
EP2555191A1 (en) * | 2009-03-31 | 2013-02-06 | Huawei Technologies Co., Ltd. | Method and device for audio signal denoising |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
ES2906085T3 (es) | 2009-10-21 | 2022-04-13 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
JP5850216B2 (ja) * | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) * | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP6103324B2 (ja) * | 2010-04-13 | 2017-03-29 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
KR102439053B1 (ko) * | 2010-09-16 | 2022-09-02 | 돌비 인터네셔널 에이비 | 교차 곱 강화된 서브밴드 블록 기반 고조파 전위 |
CN102436820B (zh) * | 2010-09-29 | 2013-08-28 | 华为技术有限公司 | 高频带信号编码方法及装置、高频带信号解码方法及装置 |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
EP2716075B1 (en) * | 2011-05-26 | 2016-01-06 | Koninklijke Philips N.V. | An audio system and method therefor |
JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP6046169B2 (ja) * | 2012-02-23 | 2016-12-14 | ドルビー・インターナショナル・アーベー | 高周波オーディオ内容の効率的な復元のための方法およびシステム |
KR101897455B1 (ko) | 2012-04-16 | 2018-10-04 | 삼성전자주식회사 | 음질 향상 장치 및 방법 |
EP2717265A1 (en) * | 2012-10-05 | 2014-04-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder, decoder and methods for backward compatible dynamic adaption of time/frequency resolution in spatial-audio-object-coding |
CA2979260C (en) * | 2013-01-29 | 2020-07-07 | Martin Dietz | Concept for coding mode switching compensation |
CN110223703B (zh) | 2013-04-05 | 2023-06-02 | 杜比国际公司 | 音频信号的解码方法和解码器、介质以及编码方法 |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
KR101498113B1 (ko) * | 2013-10-23 | 2015-03-04 | 광주과학기술원 | 사운드 신호의 대역폭 확장 장치 및 방법 |
CN105745706B (zh) * | 2013-11-29 | 2019-09-24 | 索尼公司 | 用于扩展频带的装置、方法和程序 |
JP6593173B2 (ja) | 2013-12-27 | 2019-10-23 | ソニー株式会社 | 復号化装置および方法、並びにプログラム |
CN107077849B (zh) * | 2014-11-07 | 2020-09-08 | 三星电子株式会社 | 用于恢复音频信号的方法和设备 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
KR101930337B1 (ko) * | 2015-12-07 | 2018-12-19 | 삼성전자 주식회사 | 전자기기 및 그 제어방법 |
US11282535B2 (en) * | 2017-10-25 | 2022-03-22 | Samsung Electronics Co., Ltd. | Electronic device and a controlling method thereof |
TWI834582B (zh) | 2018-01-26 | 2024-03-01 | 瑞典商都比國際公司 | 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體 |
CN109243485B (zh) * | 2018-09-13 | 2021-08-13 | 广州酷狗计算机科技有限公司 | 恢复高频信号的方法和装置 |
CN112289343B (zh) * | 2020-10-28 | 2024-03-19 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频修复方法、装置及电子设备和计算机可读存储介质 |
CN113035205B (zh) * | 2020-12-28 | 2022-06-07 | 阿里巴巴(中国)有限公司 | 音频丢包补偿处理方法、装置及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1991016769A1 (en) | 1990-04-12 | 1991-10-31 | Dolby Laboratories Licensing Corporation | Adaptive-block-length, adaptive-transform, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio |
US6115689A (en) | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
WO2002052545A1 (en) | 2000-12-22 | 2002-07-04 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
KR20030062338A (ko) * | 2000-11-14 | 2003-07-23 | 코딩 테크놀러지스 스웨덴 에이비 | 적응형 필터링에 의해 고주파 복원 코딩 방법의 인식성능을 향상시키기 위한 방법 및 장치 |
KR20030068716A (ko) * | 2002-02-16 | 2003-08-25 | 삼성전자주식회사 | 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58145998A (ja) * | 1982-02-25 | 1983-08-31 | ソニー株式会社 | 音声過渡点検出方法 |
US4797926A (en) * | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
CA2032765C (en) * | 1989-12-21 | 1995-12-12 | Hidetaka Yoshikawa | Variable rate encoding and communicating apparatus |
US5189701A (en) * | 1991-10-25 | 1993-02-23 | Micom Communications Corp. | Voice coder/decoder and methods of coding/decoding |
US5214708A (en) * | 1991-12-16 | 1993-05-25 | Mceachern Robert H | Speech information extractor |
US5893065A (en) * | 1994-08-05 | 1999-04-06 | Nippon Steel Corporation | Apparatus for compressing audio data |
JP2976860B2 (ja) * | 1995-09-13 | 1999-11-10 | 松下電器産業株式会社 | 再生装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
GB2326572A (en) * | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
US6233550B1 (en) * | 1997-08-29 | 2001-05-15 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
CA2359771A1 (en) * | 2001-10-22 | 2003-04-22 | Dspfactory Ltd. | Low-resource real-time audio synthesis system and method |
CN100395817C (zh) * | 2001-11-14 | 2008-06-18 | 松下电器产业株式会社 | 编码设备、解码设备和解码方法 |
US6985856B2 (en) * | 2002-12-31 | 2006-01-10 | Nokia Corporation | Method and device for compressed-domain packet loss concealment |
KR20050027179A (ko) * | 2003-09-13 | 2005-03-18 | 삼성전자주식회사 | 오디오 데이터 복원 방법 및 그 장치 |
-
2004
- 2004-08-04 KR KR1020040061423A patent/KR100608062B1/ko not_active IP Right Cessation
-
2005
- 2005-05-10 US US11/125,152 patent/US20060031075A1/en not_active Abandoned
- 2005-07-14 IT IT001351A patent/ITMI20051351A1/it unknown
- 2005-07-15 CN CNA2005100842636A patent/CN1734555A/zh active Pending
- 2005-07-26 NL NL1029619A patent/NL1029619C2/nl not_active IP Right Cessation
- 2005-07-29 JP JP2005221617A patent/JP2006048043A/ja not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1991016769A1 (en) | 1990-04-12 | 1991-10-31 | Dolby Laboratories Licensing Corporation | Adaptive-block-length, adaptive-transform, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio |
US6115689A (en) | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
KR20030062338A (ko) * | 2000-11-14 | 2003-07-23 | 코딩 테크놀러지스 스웨덴 에이비 | 적응형 필터링에 의해 고주파 복원 코딩 방법의 인식성능을 향상시키기 위한 방법 및 장치 |
WO2002052545A1 (en) | 2000-12-22 | 2002-07-04 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
KR20030068716A (ko) * | 2002-02-16 | 2003-08-25 | 삼성전자주식회사 | 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템 |
Also Published As
Publication number | Publication date |
---|---|
CN1734555A (zh) | 2006-02-15 |
NL1029619A1 (nl) | 2006-02-07 |
NL1029619C2 (nl) | 2006-07-25 |
US20060031075A1 (en) | 2006-02-09 |
KR20060012783A (ko) | 2006-02-09 |
ITMI20051351A1 (it) | 2006-02-05 |
JP2006048043A (ja) | 2006-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100608062B1 (ko) | 오디오 데이터의 고주파수 복원 방법 및 그 장치 | |
US9728196B2 (en) | Method and apparatus to encode and decode an audio/speech signal | |
JP5539203B2 (ja) | 改良された音声及びオーディオ信号の変換符号化 | |
US7275031B2 (en) | Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal | |
JP5404412B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
JP6457625B2 (ja) | 独立したノイズ充填を用いた強化された信号を生成するための装置および方法 | |
JP2009515212A (ja) | オーディオ圧縮 | |
US20040002854A1 (en) | Audio coding method and apparatus using harmonic extraction | |
KR20050027179A (ko) | 오디오 데이터 복원 방법 및 그 장치 | |
JP2003523535A (ja) | 複数のデータ圧縮フォーマット間でのオーディオ信号の変換方法及び装置 | |
WO2006041055A1 (ja) | スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法 | |
KR100378796B1 (ko) | 디지탈 오디오 부호화기 및 복호화 방법 | |
IL296961B1 (en) | Harmonic-inverse harmonic exchanger combination for high-frequency reproduction of audio signals | |
JP2008519990A (ja) | 信号符号化の方法 | |
Yu et al. | A scalable lossy to lossless audio coder for MPEG-4 lossless audio coding | |
KR100433984B1 (ko) | 디지털 오디오 부호화/복호화 장치 및 방법 | |
JP4721355B2 (ja) | 符号化データの符号化則変換方法および装置 | |
KR100902332B1 (ko) | 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화장치 및 그 방법 | |
JP2002215192A (ja) | オーディオ情報処理装置及び処理方法 | |
JPH1093441A (ja) | ディジタル化されたオーディオ信号の符号化方法及び装置 | |
Cavagnolo et al. | Introduction to Digital Audio Compression | |
US9854379B2 (en) | Personal audio studio system | |
JP2001094432A (ja) | サブバンド符号化・復号方法 | |
Li et al. | Efficient stereo bitrate allocation for fully scalable audio codec | |
KR970071703A (ko) | 복잡도 조절이 가능한 오디오 복호화방법 및 이를 이용한 오디오 복호화기 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130627 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140627 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20150629 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20160629 Year of fee payment: 11 |
|
LAPS | Lapse due to unpaid annual fee |