JP6258522B2 - デバイスにおいてコーディング技術を切り替える装置および方法 - Google Patents
デバイスにおいてコーディング技術を切り替える装置および方法 Download PDFInfo
- Publication number
- JP6258522B2 JP6258522B2 JP2016559604A JP2016559604A JP6258522B2 JP 6258522 B2 JP6258522 B2 JP 6258522B2 JP 2016559604 A JP2016559604 A JP 2016559604A JP 2016559604 A JP2016559604 A JP 2016559604A JP 6258522 B2 JP6258522 B2 JP 6258522B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- encoder
- audio signal
- signal
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 108
- 230000005236 sound signal Effects 0.000 claims description 158
- 238000004458 analytical method Methods 0.000 claims description 96
- 238000012545 processing Methods 0.000 claims description 21
- 238000009499 grossing Methods 0.000 claims description 16
- 239000002131 composite material Substances 0.000 claims description 9
- 238000010295 mobile communication Methods 0.000 claims description 9
- 230000001413 cellular effect Effects 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 7
- 238000013213 extrapolation Methods 0.000 claims description 5
- 230000001052 transient effect Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000003287 optical effect Effects 0.000 claims description 4
- 230000015654 memory Effects 0.000 description 22
- 238000004891 communication Methods 0.000 description 19
- 230000015572 biosynthetic process Effects 0.000 description 16
- 238000003786 synthesis reaction Methods 0.000 description 16
- 230000005284 excitation Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000003595 spectral effect Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
説明のために、ベースバンド信号130は、MDCTローカルデコーダ126の合成バッファから生成されてもよい。MDCT分析モジュール121が「完全」MDCTを行う場合、ローカルデコーダ126は、「完全」逆MDCT(IMDCT)(0Hz〜16kHz)を実施し得、ベースバンド信号130は、オーディオ信号102のハイバンド部分ならびにオーディオ信号の付加的部分(たとえば、ローバンド部分)に対応し得る。この例では、合成出力および/またはベースバンド信号130は、ハイバンドデータを(たとえば、8kHz〜16kHzの帯域において)近似する(たとえば、含む)結果信号を生成するために、(たとえば、ハイパスフィルタ(HPF)、フリップおよびデシメーション動作などを介して)フィルタ処理され得る。
以下に本願発明の当初の特許請求の範囲に記載された発明を付記する。
[C1]
第1のエンコーダを使用して、オーディオ信号の第1のフレームを符号化することと、
前記第1のフレームの符号化の間に、前記オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成することと、
第2のエンコーダを使用して、前記オーディオ信号の第2のフレームを符号化することと、ここで、前記第2のフレームを符号化することは、前記第2のフレームと関連付けられるハイバンドパラメータを生成するために前記ベースバンド信号を処理することを含み、
を備える方法。
[C2]
前記第2のフレームは、前記オーディオ信号において前記第1のフレームに連続的に続く、C1に記載の方法。
[C3]
前記第1のエンコーダは、変換ベースのエンコーダを備える、C1に記載の方法。
[C4]
前記変換ベースのエンコーダは、修正離散コサイン変換(MDCT)エンコーダを備える、C3に記載の方法。
[C5]
前記第2のエンコーダは、線形予測(LP)ベースのエンコーダを備える、C1に記載の方法。
[C6]
前記線形予測(LP)ベースのエンコーダは、代数符号励振線形予測(ACELP)エンコーダを備える、C5に記載の方法。
[C7]
前記ベースバンド信号を生成することは、フリップ動作とデシメーション動作とを実行することを含む、C1に記載の方法。
[C8]
前記ベースバンド信号を生成することは、高次フィルタ処理動作を実行することを含まず、ダウンミキシング動作を実行することを含まない、C1に記載の方法。
[C9]
前記ベースバンド信号に少なくとも部分的に基づいて、および前記第2のフレームの特定のハイバンド部分に少なくとも部分的に基づいて、前記第2のエンコーダのターゲット信号バッファにポピュレートすることをさらに備える、C1に記載の方法。
[C10]
前記ベースバンド信号は、前記第1のエンコーダのローカルデコーダを使用して生成され、ここにおいて、前記ベースバンド信号は、前記オーディオ信号の少なくとも一部分の合成バージョンに対応する、C1に記載の方法。
[C11]
前記ベースバンド信号は、前記オーディオ信号の前記ハイバンド部分に対応し、前記第2のエンコーダのターゲット信号バッファにコピーされる、C10に記載の方法。
[C12]
前記ベースバンド信号は、前記オーディオ信号の前記ハイバンド部分および前記オーディオ信号の付加的な部分に対応し、前記方法は、
前記ハイバンド部分を近似する結果信号を生成するために、前記ベースバンド信号に対してフリップ動作とデシメーション動作とを実行することと、
前記結果信号に基づいて、前記第2のエンコーダのターゲット信号バッファにポピュレートすることと、
をさらに備える、C10に記載の方法。
[C13]
第1のデコーダと第2のデコーダとを含むデバイスにおいて、前記第2のデコーダを使用してオーディオ信号の第1のフレームを復号することと、ここで、前記第2のデコーダは、前記オーディオ信号の第2のフレームの一部分に対応する重複データを生成し、
前記第1のデコーダを使用して前記第2のフレームを復号することと、ここで、前記第2のフレームを復号することは、前記第2のデコーダからの前記重複データを使用して平滑化動作を適用することを含み、
を備える方法。
[C14]
前記第1のデコーダは修正離散コサイン変換(MDCT)デコーダを備え、前記第2のデコーダは代数符号励振線形予測(ACELP)デコーダを備える、C13に記載の方法。
[C15]
前記重複データは、前記第2のフレームの20オーディオサンプルを備える、C13に記載の方法。
[C16]
前記平滑化動作はクロスフェード動作を備える、C13に記載の方法。
[C17]
オーディオ信号の第1のフレームを符号化し、
前記第1のフレームの符号化の間に、前記オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成する
ように構成された第1のエンコーダと、
前記オーディオ信号の第2のフレームを符号化するように構成された第2のエンコーダと、ここで、前記第2のフレームを符号化することは、前記第2のフレームと関連付けられるハイバンドパラメータを生成するために、前記ベースバンド信号を処理することを含む、
を備える装置。
[C18]
前記第2のフレームは、前記オーディオ信号において前記第1のフレームに連続的に続く、C17に記載の装置。
[C19]
前記第1のエンコーダは修正離散コサイン変換(MDCT)エンコーダを備え、前記第2のエンコーダは代数符号励振線形予測(ACELP)エンコーダを備える、C17に記載の装置。
[C20]
前記ベースバンド信号を生成することは、フリップ動作とデシメーション動作とを実行することを含み、前記ベースバンド信号を生成することは、高次のフィルタ処理動作を実行することを含まず、前記ベースバンド信号を生成することは、ダウンミキシング動作を実行することを含まない、C17に記載の装置。
[C21]
オーディオ信号の第1のフレームを符号化するように構成された第1のエンコーダと、
前記オーディオ信号の第2のフレームの符号化の間に、
前記第1のフレームの第1の部分を推定し、
前記第1のフレームの前記第1の部分および前記第2のフレームに基づいて、前記第2のエンコーダのバッファにポピュレートし、
前記第2のフレームと関連付けられるハイバンドパラメータを生成するように構成された第2のエンコーダと、
を備える装置。
[C22]
前記第1のフレームの前記第1の部分を推定することは、前記第2のフレームのデータに基づいて外挿動作を実行することを含む、C21に記載の装置。
[C23]
前記第1のフレームの前記第1の部分を推定することは、後方線形予測を実施することを含む、C21に記載の装置。
[C24]
前記第1のフレームの前記第1の部分は、前記第1のフレームと関連付けられるエネルギーに基づいて推定される、C21に記載の装置。
[C25]
前記第1のエンコーダに結合された第1のバッファをさらに備え、
前記第1のフレームと関連付けられる前記エネルギーは、前記第1のバッファと関連付けられる第1のエネルギーに基づいて決定される、C24に記載の装置。
[C26]
前記第1のフレームと関連付けられる前記エネルギーは、前記第1のバッファのハイバンド部分と関連付けられる第2のエネルギーに基づいて決定される、C25に記載の装置。
[C27]
前記第1のフレームの前記第1の部分は、前記第1のフレームの第1のフレームタイプ、前記第2のフレームの第2のフレームタイプ、またはそれら両方に少なくとも部分的に基づいて推定される、C21に記載の装置。
[C28]
前記第1のフレームタイプは、有声フレームタイプ、無声フレームタイプ、過渡フレームタイプ、または一般フレームタイプを備え、
前記第2のフレームタイプは、前記有声フレームタイプ、前記無声フレームタイプ、前記過渡フレームタイプ、または前記一般フレームタイプを備える、C27に記載の装置。
[C29]
前記第1のフレームの前記第1の部分は、持続時間において約5ミリ秒であり、前記第2のフレームは、持続時間において約20ミリ秒である、C21に記載の装置。
[C30]
前記第1のフレームの前記第1の部分は、前記第1のフレームの局所的に復号されたローバンド部分、前記第1のフレームの局所的に復号されたハイバンド部分、またはそれら両方と関連付けられるエネルギーに基づいて推定される、C21に記載の装置。
[C31]
第1のデコーダと、
第2のデコーダと、を備え、
前記第2のデコーダは、
オーディオ信号の第1のフレームを復号し、
前記オーディオ信号の第2のフレームの一部分に対応する重複データを生成するように構成され、
前記第1のデコーダは、前記第2のフレームの復号の間、前記第2のデコーダからの前記重複データを使用して平滑化動作を適用するように構成される、装置。
[C32]
前記平滑化動作はクロスフェード動作を備える、C31に記載の装置。
[C33]
命令を記憶したコンピュータ可読記憶デバイスであって、前記命令は、プロセッサによって実行されると、前記プロセッサに、
第1のエンコーダを使用して、オーディオ信号の第1のフレームを符号化することと、
前記第1のフレームの符号化の間に、前記オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成することと、
第2のエンコーダを使用して、前記オーディオ信号の第2のフレームを符号化することと、ここで、前記第2のフレームを符号化することは、前記第2のフレームと関連付けられるハイバンドパラメータを生成するために、前記ベースバンド信号を処理することを含む、
を備える動作を実行させる、コンピュータ可読記憶デバイス。
[C34]
前記第1のエンコーダは、変換ベースのエンコーダを備え、前記第2のエンコーダは、線形予測(LP)ベースのエンコーダを備える、C33に記載のコンピュータ可読記憶デバイス。
[C35]
前記ベースバンド信号を生成することは、フリップ動作とデシメーション動作とを実行することを含み、
前記動作は、前記ベースバンド信号に少なくとも部分的に基づいて、および前記第2のフレームの特定のハイバンド部分に少なくとも部分的に基づいて、前記第2のエンコーダのターゲット信号バッファにポピュレートすることをさらに備える、
C33に記載のコンピュータ可読記憶デバイス。
[C36]
前記ベースバンド信号は、前記第1のエンコーダのローカルデコーダを使用して生成され、前記ベースバンド信号は、前記オーディオ信号の少なくとも一部分の合成バージョンに対応する、C33に記載のコンピュータ可読記憶デバイス。
[C37]
オーディオ信号の第1のフレームを符号化するための第1の手段と、符号化するための前記第1の手段は、前記第1のフレームの符号化の間に、前記オーディオ信号のハイバンド部分に対応するコンテンツを含むベースバンド信号を生成するように構成され、
前記オーディオ信号の第2のフレームを符号化するための第2の手段と、ここで、前記第2のフレームを符号化することは、前記第2のフレームと関連付けられるハイバンドパラメータを生成するために前記ベースバンド信号を処理することを含む、
を備える装置。
[C38]
符号化するための前記第1の手段および符号化するための前記第2の手段は、モバイル通信デバイス、スマートフォン、セルラーフォン、ラップトップコンピュータ、コンピュータ、タブレットコンピュータ、携帯情報端末、ディスプレイデバイス、テレビ、ゲーム機、音楽プレーヤ、ラジオ、デジタルビデオプレーヤ、光ディスクプレーヤ、チューナー、カメラ、ナビゲーションデバイス、デコーダシステム、またはエンコーダシステムのうちの少なくとも1つに統合される、C37に記載の装置。
[C39]
符号化するための前記第1の手段は、フリップ動作とデシメーション動作とを実行することによって前記ベースバンド信号を生成するようにさらに構成される、C37に記載の装置。
[C40]
符号化するための前記第1の手段は、ローカルデコーダを使用することによって、前記ベースバンド信号を生成するようにさらに構成され、
前記ベースバンド信号は、前記オーディオ信号の少なくとも一部分の合成バージョンに対応する、C37に記載の装置。
Claims (40)
- オーディオ信号を符号化するための方法であって、前記方法は、
第1のエンコーダにおける第1の領域分析を使用して、前記オーディオ信号の第1のフレームを符号化することと、
前記第1のフレームの符号化の間に、前記オーディオ信号のハイバンド推定値、または前記オーディオ信号の少なくとも一部分の合成バージョンに対応するベースバンド信号を生成することと、
第2のエンコーダにおける第2の領域分析を使用して、前記オーディオ信号の第2のフレームを、前記第2のフレームと関連付けられるハイバンドパラメータを生成するために、前記ベースバンド信号を表す第1のデータと前記第2のフレームのハイバンド部分を表す第2のデータとを処理することによって、符号化することと、
を備える、方法。 - 前記第1の領域分析と前記第2の領域分析とは、それぞれ、周波数領域分析と時間領域分析とを備え、前記第2のフレームは、前記オーディオ信号において前記第1のフレームに連続的に続く、請求項1に記載の方法。
- 前記オーディオ信号の前記第1のフレームは、変換ベースのエンコーダを使用して符号化される、請求項1に記載の方法。
- 前記オーディオ信号の前記第1のフレームは、修正離散コサイン変換(MDCT)エンコーダを使用して符号化される、請求項1に記載の方法。
- 前記オーディオ信号の前記第2のフレームは、ターゲット信号バッファに前記第1のデータおよび前記第2のデータを記憶する線形予測(LP)ベースのエンコーダを使用して符号化される、請求項1に記載の方法。
- 前記オーディオ信号の前記第2のフレームは、帯域幅拡張を実行するように構成された代数符号励振線形予測(ACELP)エンコーダを使用して符号化される、請求項1に記載の方法。
- 前記ベースバンド信号を生成することは、フリップ動作とデシメーション動作とを実行することを含む、請求項1に記載の方法。
- 前記ベースバンド信号を生成することは、高次のフィルタ処理動作を実行することを含まず、および、ダウンミキシング動作を実行することを含まない、請求項1に記載の方法。
- 前記第2のエンコーダは、前記第2のエンコーダのターゲット信号バッファの第1の部分に前記第1のデータを記憶し、前記ターゲット信号バッファの第2の部分に前記第2のデータを記憶する、請求項1に記載の方法。
- 前記第1のエンコーダおよび前記第2のエンコーダは、モバイル通信デバイスに含まれる、請求項1に記載の方法。
- 前記ベースバンド信号を生成することは、前記第1のエンコーダのローカルデコーダを使用することを備え、前記第2のエンコーダのターゲット信号バッファに前記第1のデータをコピーすることをさらに備える、請求項1に記載の方法。
- 前記オーディオ信号の前記ハイバンド部分を近似する結果信号を生成するために、前記ベースバンド信号に対してフリップ動作とデシメーション動作とを実行することと、
前記結果信号に基づいて、前記第2のエンコーダのターゲット信号バッファにポピュレートすることと、
をさらに備える、請求項1に記載の方法。 - オーディオ信号を復号するための方法であって、前記方法は、
第1のエンコーダにおける第1の領域分析を使用して符号化された前記オーディオ信号の第2のフレームに基づく第2のビットの、および、第2のエンコーダにおける第2の領域分析を使用して符号化された前記オーディオ信号の第1のフレームに基づく第1のビットのビットストリームを受信することと、前記第1のフレームは、ベースバンド信号を表す第1のデータと前記第1のフレームのハイバンド部分を表す第2のデータとを処理することによって符号化され、ここで、前記ベースバンド信号は、第3のフレームのハイバンド推定値、または前記第3のフレームの少なくとも一部分の合成バージョンに基づいて前記第1のエンコーダによって生成され、
第1のデコーダと第2のデコーダとを含むデバイスにおいて、前記第2のデコーダおよび前記第1のビットを使用して前記第1のフレームの符号化バージョンを復号することと、前記第2のデコーダは、前記第2のフレームの一部分に対応する重複データを生成し、
前記第1のデコーダおよび前記第2のビットを使用して前記第2のフレームの符号化バージョンを復号することと、前記復号することは、前記第2のデコーダからの前記重複データを使用して平滑化動作を適用することを含む、
を備える、方法。 - 前記第1のデコーダは、修正離散コサイン変換(MDCT)デコーダを備え、前記第2のデコーダは、帯域幅拡張パラメータに基づいて算出を実行する代数符号励振線形予測(ACELP)デコーダを備え、前記重複データは、前記第2のフレームの20オーディオサンプルに対応するデータを備える、請求項13に記載の方法。
- 前記第1の領域分析と前記第2の領域分析とは、それぞれ、周波数領域分析と時間領域分析とを備える、請求項13に記載の方法。
- 前記平滑化動作は、クロスフェード動作を含み、前記第1のデコーダおよび前記第2のデコーダは、モバイル通信デバイスに含まれる、請求項13に記載の方法。
- オーディオ信号を符号化するための装置であって、前記装置は、
アンテナと、
第1の領域分析に基づいて、前記オーディオ信号の第1のフレームを符号化することと、
前記第1のフレームの符号化の間に、前記オーディオ信号のハイバンド推定値、または、前記オーディオ信号の少なくとも一部分の合成バージョンに対応するベースバンド信号を生成することと、
を行うように構成された第1のエンコーダと、
第2の領域分析と、
前記ベースバンド信号を表す第1のデータと第2のフレームのハイバンド部分を表す第2のデータと、
に基づいて、前記オーディオ信号の第2のフレームを符号化するように構成された第2のエンコーダと、第2のエンコーダは、前記第2のフレームと関連付けられるハイバンドパラメータを生成するように構成され、
前記アンテナに結合され、前記ベースバンド信号と関連付けられる符号化オーディオ信号を送信するように構成された送信機と、
を備える、装置。 - 前記第1の領域分析と前記第2の領域分析とは、それぞれ、周波数領域分析と時間領域分析とを備え、前記第2のフレームは、前記オーディオ信号において前記第1のフレームに連続的に続く、請求項17に記載の装置。
- 前記第1のエンコーダは、修正離散コサイン変換(MDCT)エンコーダを備え、
前記第2のエンコーダは、ターゲット信号バッファに前記第1のデータまたは前記第2のデータのうちの少なくとも1つを記憶することと、帯域幅拡張を実行することとを行うように構成された代数符号励振線形予測(ACELP)エンコーダを備え、
前記第1のエンコーダおよび前記第2のエンコーダは、モバイル通信デバイスに統合される、
請求項17に記載の装置。 - 前記第1のエンコーダは、高次のフィルタ処理動作を実行せずに、および、ダウンミキシング動作を実行せずに、フリップ動作を使用して、およびデシメーション動作を使用して、前記ベースバンド信号を生成するように構成される、請求項17に記載の装置。
- オーディオ信号を符号化するための装置であって、前記装置は、
アンテナと、
第1の領域分析に基づいて、オーディオ信号の第1のフレームを符号化するように構成された第1のエンコーダと、
第2の領域分析に基づいて、前記オーディオ信号の第2のフレームを符号化する間に、前記第1のフレームの第1の部分の信号推定値を生成することと、
前記信号推定値に基づいて第1のデータで、および、前記オーディオ信号の第2のフレームのハイバンド部分を表す第2のデータで、第2のエンコーダのバッファにポピュレートすることと、
前記バッファに記憶された前記第1のデータおよび前記第2のデータに基づいて、前記第2のフレームと関連付けられるハイバンドパラメータを生成することと、
を行うように構成された第2のエンコーダと、
前記アンテナに結合され、前記オーディオ信号と関連付けられる符号化オーディオ信号を送信するように構成された送信機と、
を備える、装置。 - 前記信号推定値は、前記第2のフレームのデータに基づく外挿動作に基づく、請求項21に記載の装置。
- 前記信号推定値は、後方線形予測に基づく、請求項21に記載の装置。
- 前記信号推定値は、前記第1のフレームと関連付けられるエネルギーを示すエネルギー情報に基づく、請求項21に記載の装置。
- 前記第1のエンコーダに結合された第1のバッファをさらに備え、
前記第1のフレームと関連付けられる前記エネルギーは、前記第1のバッファと関連付けられる第1のエネルギーに基づいて決定され、前記第1のフレームと関連付けられる前記エネルギーは、前記第1のバッファのハイバンド部分と関連付けられる第2のエネルギーに基づいて決定される、請求項24に記載の装置。 - 前記符号化オーディオ信号を変調するように構成された変調器をさらに備える、請求項21に記載の装置。
- 前記アンテナ、前記送信機、および前記変調器は、モバイル通信デバイスに統合される、請求項26に記載の装置。
- 前記第1の領域分析と前記第2の領域分析とは、それぞれ、周波数領域分析と時間領域分析とを備え、
前記信号推定値は、前記第1のフレームの第1のフレームタイプ、前記第2のフレームの第2のフレームタイプ、またはそれら両方に少なくとも部分的に基づき、
前記第1のフレームタイプは、有声フレームタイプ、無声フレームタイプ、過渡フレームタイプ、または一般フレームタイプを備え、
前記第2のフレームタイプは、前記有声フレームタイプ、前記無声フレームタイプ、前記過渡フレームタイプ、または前記一般フレームタイプを備える、請求項21に記載の装置。 - 前記第1のフレームの前記第1の部分は、持続時間において約5ミリ秒であり、前記第2のフレームは、持続時間において約20ミリ秒である、請求項21に記載の装置。
- 前記信号推定値は、前記第1のフレームの局所的に復号されたローバンド部分、前記第1のフレームの局所的に復号されたハイバンド部分、またはそれら両方と関連付けられるエネルギーに基づく、請求項21に記載の装置。
- オーディオ信号を復号するための装置であって、前記装置は、
第1のエンコーダにおける第1の領域分析を介して符号化される前記オーディオ信号の第2のフレームに対応する第2のビットの、および、第2のエンコーダにおける第2の領域分析を介して符号化される前記オーディオ信号の第1のフレームに対応する第1のビットの、ビットストリームを受信するように構成された受信機と、前記第1のフレームは、ベースバンド信号を表す第1のデータと前記第1のフレームのハイバンド部分を表す第2のデータとを処理することによって符号化され、ここで、前記ベースバンド信号は、第3のフレームのハイバンド推定値、または前記第3のフレームの少なくとも一部分の合成バージョンに基づいて前記第1のエンコーダによって生成され、
前記第2のビットに基づく前記第2のフレームの符号化バージョンの復号の間に、前記第2のフレームの一部分に対応する重複データを使用して平滑化動作を適用するように構成された第1のデコーダと、
前記第1のフレームの符号化バージョンを復号することと、前記重複データを生成することとを行うように構成された第2のデコーダと、
を備える、装置。 - 前記受信機に結合されたアンテナをさらに備え、前記第1の領域分析と前記第2の領域分析とは、それぞれ、周波数領域分析と時間領域分析とを備え、前記平滑化動作は、クロスフェード動作を含み、前記アンテナ、前記受信機、前記第1のデコーダ、および前記第2のデコーダは、モバイル通信デバイスに統合される、請求項31に記載の装置。
- 命令を記憶したコンピュータ可読記憶デバイスであって、前記命令は、プロセッサによって実行されると、前記プロセッサに、
第1のエンコーダにおける第1の領域分析を使用して、オーディオ信号の第1のフレームを符号化することと、
前記第1のフレームの符号化の間に、前記オーディオ信号のハイバンド推定値、または、前記オーディオ信号の少なくとも一部分の合成バージョンに対応するベースバンド信号を生成することと、
第2のエンコーダにおける第2の領域分析を使用して、前記オーディオ信号の第2のフレームを符号化することと、ここで、前記第2のフレームを符号化することは、前記第2のフレームと関連付けられるハイバンドパラメータを生成するために、前記ベースバンド信号を表す第1のデータと前記第2のフレームのハイバンド部分を表す第2のデータとを処理することを含む、
を備える、オーディオ信号を符号化するための動作を実行させる、コンピュータ可読記憶デバイス。 - 前記第1のエンコーダは、変換ベースのエンコーダを備え、前記第2のエンコーダは、線形予測(LP)ベースのエンコーダを備える、請求項33に記載のコンピュータ可読記憶デバイス。
- 前記ベースバンド信号を生成することは、フリップ動作とデシメーション動作とを実行することを含み、
前記動作は、前記第1のデータに少なくとも部分的に基づいて、前記第2のエンコーダのターゲット信号バッファの第1の部分にポピュレートすることと、前記第2のデータに少なくとも部分的に基づいて、前記ターゲット信号バッファの第2の部分にポピュレートすることとをさらに備える、
請求項33に記載のコンピュータ可読記憶デバイス。 - 前記ベースバンド信号は、前記第1のエンコーダのローカルデコーダを使用して生成される、請求項33に記載のコンピュータ可読記憶デバイス。
- オーディオ信号を符号化するための装置であって、前記装置は、
第1の領域分析に基づいて、オーディオ信号の第1のフレームを符号化するための第1の手段と、符号化するための前記第1の手段は、前記第1のフレームの符号化の間に、前記オーディオ信号のハイバンド推定値、または前記オーディオ信号の少なくとも一部分の合成バージョンに対応するベースバンド信号を生成するように構成され、
第2の領域分析に基づいて、前記オーディオ信号の第2のフレームを、前記第2のフレームと関連付けられるハイバンドパラメータを生成するために、前記ベースバンド信号を表す第1のデータと前記第2のフレームのハイバンド部分を表す第2のデータとを処理することに基づいて、符号化するための第2の手段と、
前記オーディオ信号と関連付けられる符号化オーディオ信号を送信するための手段と、
を備える、装置。 - 前記第1の領域分析と前記第2の領域分析とは、それぞれ、周波数領域分析と時間領域分析とを備え、
符号化するための前記第1の手段、符号化するための前記第2の手段、および送信するための前記手段は、モバイル通信デバイス、スマートフォン、セルラーフォン、ラップトップコンピュータ、コンピュータ、タブレットコンピュータ、携帯情報端末、ディスプレイデバイス、テレビ、ゲーム機、音楽プレーヤ、ラジオ、デジタルビデオプレーヤ、光ディスクプレーヤ、チューナー、カメラ、ナビゲーションデバイス、デコーダシステム、またはエンコーダシステムのうちの少なくとも1つに統合される、請求項37に記載の装置。 - 符号化するための前記第1の手段は、フリップ動作とデシメーション動作とを実行することによって前記ベースバンド信号を生成するようにさらに構成され、符号化するための前記第2の手段は、ターゲット信号バッファに前記第1のデータおよび前記第2のデータを記憶するようにさらに構成される、請求項37に記載の装置。
- 符号化するための前記第1の手段は、ローカルデコーダを使用して前記ベースバンド信号を生成するようにさらに構成される、請求項37に記載の装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461973028P | 2014-03-31 | 2014-03-31 | |
US61/973,028 | 2014-03-31 | ||
US14/671,757 | 2015-03-27 | ||
US14/671,757 US9685164B2 (en) | 2014-03-31 | 2015-03-27 | Systems and methods of switching coding technologies at a device |
PCT/US2015/023398 WO2015153491A1 (en) | 2014-03-31 | 2015-03-30 | Apparatus and methods of switching coding technologies at a device |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017511503A JP2017511503A (ja) | 2017-04-20 |
JP2017511503A5 JP2017511503A5 (ja) | 2017-09-07 |
JP6258522B2 true JP6258522B2 (ja) | 2018-01-10 |
Family
ID=54191285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016559604A Active JP6258522B2 (ja) | 2014-03-31 | 2015-03-30 | デバイスにおいてコーディング技術を切り替える装置および方法 |
Country Status (26)
Country | Link |
---|---|
US (1) | US9685164B2 (ja) |
EP (1) | EP3127112B1 (ja) |
JP (1) | JP6258522B2 (ja) |
KR (1) | KR101872138B1 (ja) |
CN (1) | CN106133832B (ja) |
AU (1) | AU2015241092B2 (ja) |
BR (1) | BR112016022764B1 (ja) |
CA (1) | CA2941025C (ja) |
CL (1) | CL2016002430A1 (ja) |
DK (1) | DK3127112T3 (ja) |
ES (1) | ES2688037T3 (ja) |
HK (1) | HK1226546A1 (ja) |
HU (1) | HUE039636T2 (ja) |
MX (1) | MX355917B (ja) |
MY (1) | MY183933A (ja) |
NZ (1) | NZ723532A (ja) |
PH (1) | PH12016501882A1 (ja) |
PL (1) | PL3127112T3 (ja) |
PT (1) | PT3127112T (ja) |
RU (1) | RU2667973C2 (ja) |
SA (1) | SA516371927B1 (ja) |
SG (1) | SG11201606852UA (ja) |
SI (1) | SI3127112T1 (ja) |
TW (1) | TW201603005A (ja) |
WO (1) | WO2015153491A1 (ja) |
ZA (1) | ZA201606744B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
US9984699B2 (en) | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
CN108352165B (zh) * | 2015-11-09 | 2023-02-03 | 索尼公司 | 解码装置、解码方法以及计算机可读存储介质 |
US9978381B2 (en) * | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
CN111709872B (zh) * | 2020-05-19 | 2022-09-23 | 北京航空航天大学 | 一种图三角形计数算法的自旋存内计算架构 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5673412A (en) * | 1990-07-13 | 1997-09-30 | Hitachi, Ltd. | Disk system and power-on sequence for the same |
SE504010C2 (sv) | 1995-02-08 | 1996-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för prediktiv kodning av tal- och datasignaler |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
AU3372199A (en) * | 1998-03-30 | 1999-10-18 | Voxware, Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
US7236688B2 (en) * | 2000-07-26 | 2007-06-26 | Matsushita Electric Industrial Co., Ltd. | Signal processing method and signal processing apparatus |
JP2005244299A (ja) * | 2004-02-24 | 2005-09-08 | Sony Corp | 記録再生装置、記録方法および再生方法、並びに、プログラム |
US7463901B2 (en) * | 2004-08-13 | 2008-12-09 | Telefonaktiebolaget Lm Ericsson (Publ) | Interoperability for wireless user devices with different speech processing formats |
KR20070115637A (ko) | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
JP5448850B2 (ja) * | 2008-01-25 | 2014-03-19 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
WO2010003545A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | An apparatus and a method for decoding an encoded audio signal |
CN102105930B (zh) | 2008-07-11 | 2012-10-03 | 弗朗霍夫应用科学研究促进协会 | 用于编码采样音频信号的帧的音频编码器和解码器 |
EP2146343A1 (en) * | 2008-07-16 | 2010-01-20 | Deutsche Thomson OHG | Method and apparatus for synchronizing highly compressed enhancement layer data |
EP2224433B1 (en) * | 2008-09-25 | 2020-05-27 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
JP4977157B2 (ja) | 2009-03-06 | 2012-07-18 | 株式会社エヌ・ティ・ティ・ドコモ | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
JP5678071B2 (ja) * | 2009-10-08 | 2015-02-25 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 線形予測符号化ベースのノイズ整形を用いた多重モードオーディオ信号デコーダ、多重モードオーディオ信号エンコーダ、方法およびコンピュータプログラム |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
US9037456B2 (en) | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
WO2014108738A1 (en) * | 2013-01-08 | 2014-07-17 | Nokia Corporation | Audio signal multi-channel parameter encoder |
-
2015
- 2015-03-27 US US14/671,757 patent/US9685164B2/en active Active
- 2015-03-30 PL PL15717334T patent/PL3127112T3/pl unknown
- 2015-03-30 PT PT15717334T patent/PT3127112T/pt unknown
- 2015-03-30 SI SI201530314T patent/SI3127112T1/en unknown
- 2015-03-30 NZ NZ723532A patent/NZ723532A/en unknown
- 2015-03-30 MX MX2016012522A patent/MX355917B/es active IP Right Grant
- 2015-03-30 HU HUE15717334A patent/HUE039636T2/hu unknown
- 2015-03-30 EP EP15717334.5A patent/EP3127112B1/en active Active
- 2015-03-30 RU RU2016137922A patent/RU2667973C2/ru active
- 2015-03-30 AU AU2015241092A patent/AU2015241092B2/en active Active
- 2015-03-30 BR BR112016022764-6A patent/BR112016022764B1/pt active IP Right Grant
- 2015-03-30 CN CN201580015567.9A patent/CN106133832B/zh active Active
- 2015-03-30 SG SG11201606852UA patent/SG11201606852UA/en unknown
- 2015-03-30 DK DK15717334.5T patent/DK3127112T3/en active
- 2015-03-30 CA CA2941025A patent/CA2941025C/en active Active
- 2015-03-30 JP JP2016559604A patent/JP6258522B2/ja active Active
- 2015-03-30 KR KR1020167029177A patent/KR101872138B1/ko active IP Right Grant
- 2015-03-30 MY MYPI2016703170A patent/MY183933A/en unknown
- 2015-03-30 TW TW104110334A patent/TW201603005A/zh unknown
- 2015-03-30 ES ES15717334.5T patent/ES2688037T3/es active Active
- 2015-03-30 WO PCT/US2015/023398 patent/WO2015153491A1/en active Application Filing
-
2016
- 2016-09-23 PH PH12016501882A patent/PH12016501882A1/en unknown
- 2016-09-27 CL CL2016002430A patent/CL2016002430A1/es unknown
- 2016-09-27 SA SA516371927A patent/SA516371927B1/ar unknown
- 2016-09-29 ZA ZA2016/06744A patent/ZA201606744B/en unknown
- 2016-12-22 HK HK16114581A patent/HK1226546A1/zh unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK3138096T3 (en) | Highband excitation signal-GENERATION | |
KR101809866B1 (ko) | 고대역 신호 특성에 기초한 시간 이득 조정 | |
JP6396538B2 (ja) | 複数のサブバンドを使用するハイバンド信号コーディング | |
KR101988710B1 (ko) | 미스매치된 주파수 범위들을 이용한 고-대역 신호 코딩 | |
JP6258522B2 (ja) | デバイスにおいてコーディング技術を切り替える装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161213 Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170728 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170728 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20170728 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20171101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171206 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6258522 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |