JPWO2020010064A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2020010064A5 JPWO2020010064A5 JP2020547044A JP2020547044A JPWO2020010064A5 JP WO2020010064 A5 JPWO2020010064 A5 JP WO2020010064A5 JP 2020547044 A JP2020547044 A JP 2020547044A JP 2020547044 A JP2020547044 A JP 2020547044A JP WO2020010064 A5 JPWO2020010064 A5 JP WO2020010064A5
- Authority
- JP
- Japan
- Prior art keywords
- superframe
- field
- metadata
- signal
- configuration information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 81
- 230000005236 sound signal Effects 0.000 claims description 36
- 230000019491 signal transduction Effects 0.000 claims description 2
- 230000011664 signaling Effects 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
Description
明細書および図面は、提案される方法および装置の原理を説明するに過ぎないことを注意しておくべきである。よって、当業者は、本明細書に明示的に記載または図示されていないが、本発明の原理を具現し、その精神および範囲内に含まれるさまざまな構成を考案することができることが理解されるであろう。さらに、本明細書に記載されたすべての例は、主として、提案される方法および装置の原理、ならびに当該技術を促進するために発明者によって寄与された概念を理解する際に読者を助けるという教育目的のみをはっきりと目的とするものであり、そのように具体的に記載された例および条件に限定することなく、解釈される。さらに、本発明の原理、側面、および実施形態、ならびにそれらの特定の例を記載する本明細書のすべての陳述は、それらの均等物を包含することが意図されている。
いくつかの態様を記載しておく。
〔態様1〕
ビットストリーム(101)を生成する方法(500)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該方法(500)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階(501)と;
前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階(502)とを実行することを含む、
方法。
〔態様2〕
・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズを示す、
態様1に記載の方法。
〔態様3〕
・前記メタデータ・フィールド(403)は可能な最大サイズを示し;
・前記ヘッダ・フィールド(401)は調整値を示し;
・前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズは、前記可能な最大サイズから前記調整値を引いたものに対応する、
態様2に記載の方法。
〔態様4〕
前記ヘッダ・フィールド(401)は、前記メタデータ・フィールド(403)についてのサイズ・インジケータを含み;
前記サイズ・インジケータは、前記メタデータ・フィールド(403)のサイズの異なるサイズ範囲について異なる分解能を示す、
態様2または3に記載の方法。
〔態様5〕
・前記没入的オーディオ信号(111)の前記一つまたは複数のフレームを再構成するための前記メタデータ(202,205)は、該メタデータ(202,205)のサイズの統計的サイズ分布を示し;
・前記サイズ・インジケータの分解能は、前記メタデータ(202,205)のサイズ分布に依存する、
態様4に記載の方法。
〔態様6〕
・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が構成情報フィールド(402)を含むか否かを示し;
・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)の存在を示す、
態様1ないし5のうちいずれか一項に記載の方法。
〔態様7〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記スーパーフレーム(400)のデータ・フィールド(411、421、412、422)によって表わされるダウンミックス・チャネル信号(203)の数を示す、
態様1ないし6のうちいずれか一項に記載の方法。
〔態様8〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記メタデータ・フィールド(403)の可能な最大サイズを示す、
態様1ないし7のうちいずれか一項に記載の方法。
〔態様9〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記没入的オーディオ信号(111)内に含まれる音場表現信号の次数を示す、
態様1ないし8のうちいずれか一項に記載の方法。
〔態様10〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記一つまたは複数のダウンミックス・チャネル信号(203)のそれぞれを符号化するために使用されるフレーム・タイプおよび/または符号化モードを示す、
態様1ないし9のうちいずれか一項に記載の方法。
〔態様11〕
・当該方法(500)は、ヘッダ・フィールド(401)を前記スーパーフレーム(400)に挿入することを含み;
・ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が前記没入的オーディオ信号(111)に関する追加的情報のための拡張フィールド(404)を含むか否かを示す、
態様1ないし10のうちいずれか一項に記載の方法。
〔態様12〕
スーパーフレーム(400)が、前記一つまたは複数のダウンミックス・チャネル信号(203)の2つ以上のフレームを含む、態様1ないし3のうちいずれか一項に記載の方法。
〔態様13〕
・ダウンミックス・チャネル信号(203)のフレームの前記符号化されたオーディオ・データ(206)は、マルチモードおよび/またはマルチレート発話またはオーディオ・コーデックを使用して生成される;および/または
・前記メタデータ(202,205)は、マルチモードおよび/またはマルチレートの没入的メタデータ符号化方式を使用して生成される、
態様1ないし12のうちいずれか一項に記載の方法。
〔態様14〕
ダウンミックス・チャネル信号(203)のフレームの前記符号化されたオーディオ・データ(206)が、向上音声サービス・エンコーダを使用してエンコードされる、態様1ないし13のうちいずれか一項に記載の方法。
〔態様15〕
前記スーパーフレーム(400)が、伝送プロトコル、特にDASH、RTSPまたはRTPを用いて伝送される、または記憶フォーマット、特にISOBMFFに従ってファイルに格納される、データ要素の少なくとも一部を構成する、態様1ないし14のうちいずれか一項に記載の方法。
〔態様16〕
・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)が存在しないことを示し;
・当該方法(500)は、前記スーパーフレーム(400)のシーケンスの以前のスーパーフレーム(400)において、またはアウトオブバンド信号伝達方式を使って、構成情報を伝達することを含む、
態様1ないし15のうちいずれか一項に記載の方法。
〔態様17〕
当該方法が、
・前記没入的オーディオ信号(111)から導出された第1のダウンミックス・チャネル信号(203)および第2のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、前記スーパーフレーム(400)の一つまたは複数の第1データ・フィールド(411、421)および一つまたは複数の第2データ・フィールド(412、422)に、それぞれ挿入する段階であって、前記第1のダウンミックス・チャネル信号(203)は第1のエンコーダを用いてエンコードされ、前記第2のダウンミックス・チャネル信号(203)は第2のエンコーダを用いてエンコードされる、段階と;
・前記第1のエンコーダおよび前記第2のエンコーダに関する構成情報を、前記スーパーフレーム(400)内で、前記スーパーフレーム(400)のシーケンスのうち以前のスーパーフレーム(400)内で、またはアウトオブバンド信号伝達方式を使って、提供する段階とを含む、
態様1ないし16のうちいずれか一項に記載の方法。
〔態様18〕
当該方法が、
・IA信号と呼ばれる、前記没入的オーディオ信号(111)から一つまたは複数のオーディオ・オブジェクトを抽出する段階であって、オーディオ・オブジェクトは、オブジェクト信号と、前記オーディオ・オブジェクトの位置を示すオブジェクト・メタデータ(202)とを含む、段階と;
・前記IA信号(111)に基づき、かつ前記一つまたは複数のオーディオ・オブジェクトに基づいて、残留信号(201)を決定する、段階と;
・前記IA信号(111)に基づいてダウンミックス信号を提供し、特に、前記ダウンミックス信号のダウンミックス・チャネル信号(203)の数が前記IA信号(111)のチャネル信号の数よりも少ないようにする、段階と;
・前記ダウンミックス信号を、前記一つまたは複数のオーディオ・オブジェクトに対応する一つまたは複数の再構成されたオーディオ・オブジェクト信号および/または前記残留信号(201)に対応する再構成された残留信号(311)にアップミックスすることを可能にするための合同符号化メタデータ(205)を決定する段階と;
・前記ダウンミックス信号の波形符号化を実行して、前記一つまたは複数のダウンミックス・チャネル信号(203)のフレームのシーケンスについて、符号化されたオーディオ・データ(206)を提供する段階と;
・前記合同符号化メタデータ(205)および前記一つまたは複数のオーディオ・オブジェクトの前記オブジェクト・メタデータ(202)のエントロピー符号化を実行して、前記スーパーフレーム(400)のシーケンスの前記メタデータ・フィールド(403)に挿入される前記メタデータ(202,205)を提供する段階とを含む、
態様1ないし17のうちいずれか一項に記載の方法。
〔態様19〕
ビットストリーム(101)のスーパーフレーム(400)であって、当該ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、前記スーパーフレーム(400)は、
・前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)のデータ・フィールド(411、421、412、422)と;
・前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するように適応されたメタデータ(202,205)のための単一のメタデータ・フィールド(403)とを含む、
スーパーフレーム。
〔態様20〕
ビットストリーム(101)から没入的オーディオ信号(111)に関するデータを導出するための方法(600)であって、前記ビットストリーム(101)は、前記没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該方法(600)は、スーパーフレーム(400)の前記シーケンスについて繰り返し、
・スーパーフレーム(400)のデータ・フィールド(411、421、412、422)から、前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を抽出する段階(601)と;
・前記スーパーフレーム(400)のメタデータ・フィールド(403)から、前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を抽出する段階(602)とを実行することを含む、
方法。
〔態様21〕
・前記符号化されたオーディオ・データ(206)および前記メタデータ(202,205)から一つまたは複数の再構成されたオーディオ・オブジェクトを導出する段階であって、オーディオ・オブジェクトは、オブジェクト信号および該オーディオ・オブジェクトの位置を示すオブジェクト・メタデータ(202)を含む、段階と;
・前記符号化されたオーディオ・データ(206)および前記メタデータ(202,205)から、再構成された残留信号(311)を導出する段階であって、前記一つまたは複数の再構成されたオーディオ・オブジェクトおよび前記再構成された残留信号(311)は、前記没入的オーディオ信号(111)を記述する、
態様20に記載の方法。
〔態様22〕
当該方法は、
・前記スーパーフレーム(400)からヘッダ・フィールド(401)を抽出する段階と;
・前記ヘッダ・フィールド(401)から前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズを導出する段階とを含む、
態様20または21に記載の方法。
〔態様23〕
・前記メタデータ・フィールド(403)が可能な最大サイズを示し;
・前記ヘッダ・フィールド(401)が調整値を示し;
・前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズは、前記可能な最大サイズから前記調整値を引いたものに対応する、
態様22に記載の方法。
〔態様24〕
・前記ヘッダ・フィールド(401)は、前記メタデータ・フィールド(403)のサイズについてのサイズ・インジケータを含み;
・前記サイズ・インジケータは、前記メタデータ・フィールド(403)のサイズの異なるサイズ範囲について異なる分解能を示す、
態様22または23に記載の方法。
〔態様25〕
当該方法が、
・前記スーパーフレーム(400)からヘッダ・フィールド(401)を抽出する段階と;
・前記ヘッダ・フィールド(401)に基づき、前記スーパーフレーム(400)が構成情報フィールド(402)を含むか否かを判定する段階と;
・前記ヘッダ・フィールド(401)に基づいて、構成情報フィールド(402)が前記スーパーフレーム(400)内に存在するかどうかを判定する段階とを含む、
態様20ないし24のうちいずれか一項に記載の方法。
〔態様26〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記スーパーフレーム(400)の前記データ・フィールド(411、421、412、422)によって表わされるダウンミックス・チャネル信号(203)の数を決定する段階とを含む、
態様20ないし25のうちいずれか一項に記載の方法。
〔態様27〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記メタデータ・フィールド(403)の可能な最大サイズを決定する段階とを含む、
態様20ないし26のうちいずれか一項に記載の方法。
〔態様28〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記没入的オーディオ信号(111)内に含まれる音場表現信号の次数を決定する段階とを含む、
態様20ないし27のうちいずれか一項に記載の方法。
〔態様29〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記一つまたは複数のダウンミックス・チャネル信号(203)のそれぞれを符号化するために使用されるフレーム・タイプおよび/または符号化モードを決定する段階とを含む、
態様20ないし28のうちいずれか一項に記載の方法。
〔態様30〕
当該方法が、
・前記スーパーフレーム(400)からヘッダ・フィールド(401)を抽出する段階と;
・前記ヘッダ・フィールド(401)に基づいて、前記スーパーフレーム(400)が、前記没入的オーディオ信号(111)に関する追加的情報のための拡張フィールド(404)を含むか否かを判定する段階とを含む、
態様20ないし29のうちいずれか一項に記載の方法。
〔態様31〕
ビットストリーム(101)を生成するよう構成されたエンコード装置(110)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該エンコード装置(110)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階と;
前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階とを実行するように構成されている、
エンコード装置。
〔態様32〕
ビットストリーム(101)から没入的オーディオ信号(111)に関するデータを導出するよう構成されたデコード装置(120)であって、前記ビットストリーム(101)は、前記没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該デコード装置(120)は、スーパーフレーム(400)の前記シーケンスについて繰り返し、
・スーパーフレーム(400)のデータ・フィールド(411、421、412、422)から、前記没入的オーディオ信号から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を抽出する段階と;
・前記スーパーフレーム(400)のメタデータ・フィールド(403)から、前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を抽出する段階とを実行するよう構成されている、
デコード装置。
いくつかの態様を記載しておく。
〔態様1〕
ビットストリーム(101)を生成する方法(500)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該方法(500)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階(501)と;
前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階(502)とを実行することを含む、
方法。
〔態様2〕
・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズを示す、
態様1に記載の方法。
〔態様3〕
・前記メタデータ・フィールド(403)は可能な最大サイズを示し;
・前記ヘッダ・フィールド(401)は調整値を示し;
・前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズは、前記可能な最大サイズから前記調整値を引いたものに対応する、
態様2に記載の方法。
〔態様4〕
前記ヘッダ・フィールド(401)は、前記メタデータ・フィールド(403)についてのサイズ・インジケータを含み;
前記サイズ・インジケータは、前記メタデータ・フィールド(403)のサイズの異なるサイズ範囲について異なる分解能を示す、
態様2または3に記載の方法。
〔態様5〕
・前記没入的オーディオ信号(111)の前記一つまたは複数のフレームを再構成するための前記メタデータ(202,205)は、該メタデータ(202,205)のサイズの統計的サイズ分布を示し;
・前記サイズ・インジケータの分解能は、前記メタデータ(202,205)のサイズ分布に依存する、
態様4に記載の方法。
〔態様6〕
・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が構成情報フィールド(402)を含むか否かを示し;
・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)の存在を示す、
態様1ないし5のうちいずれか一項に記載の方法。
〔態様7〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記スーパーフレーム(400)のデータ・フィールド(411、421、412、422)によって表わされるダウンミックス・チャネル信号(203)の数を示す、
態様1ないし6のうちいずれか一項に記載の方法。
〔態様8〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記メタデータ・フィールド(403)の可能な最大サイズを示す、
態様1ないし7のうちいずれか一項に記載の方法。
〔態様9〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記没入的オーディオ信号(111)内に含まれる音場表現信号の次数を示す、
態様1ないし8のうちいずれか一項に記載の方法。
〔態様10〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記一つまたは複数のダウンミックス・チャネル信号(203)のそれぞれを符号化するために使用されるフレーム・タイプおよび/または符号化モードを示す、
態様1ないし9のうちいずれか一項に記載の方法。
〔態様11〕
・当該方法(500)は、ヘッダ・フィールド(401)を前記スーパーフレーム(400)に挿入することを含み;
・ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が前記没入的オーディオ信号(111)に関する追加的情報のための拡張フィールド(404)を含むか否かを示す、
態様1ないし10のうちいずれか一項に記載の方法。
〔態様12〕
スーパーフレーム(400)が、前記一つまたは複数のダウンミックス・チャネル信号(203)の2つ以上のフレームを含む、態様1ないし3のうちいずれか一項に記載の方法。
〔態様13〕
・ダウンミックス・チャネル信号(203)のフレームの前記符号化されたオーディオ・データ(206)は、マルチモードおよび/またはマルチレート発話またはオーディオ・コーデックを使用して生成される;および/または
・前記メタデータ(202,205)は、マルチモードおよび/またはマルチレートの没入的メタデータ符号化方式を使用して生成される、
態様1ないし12のうちいずれか一項に記載の方法。
〔態様14〕
ダウンミックス・チャネル信号(203)のフレームの前記符号化されたオーディオ・データ(206)が、向上音声サービス・エンコーダを使用してエンコードされる、態様1ないし13のうちいずれか一項に記載の方法。
〔態様15〕
前記スーパーフレーム(400)が、伝送プロトコル、特にDASH、RTSPまたはRTPを用いて伝送される、または記憶フォーマット、特にISOBMFFに従ってファイルに格納される、データ要素の少なくとも一部を構成する、態様1ないし14のうちいずれか一項に記載の方法。
〔態様16〕
・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)が存在しないことを示し;
・当該方法(500)は、前記スーパーフレーム(400)のシーケンスの以前のスーパーフレーム(400)において、またはアウトオブバンド信号伝達方式を使って、構成情報を伝達することを含む、
態様1ないし15のうちいずれか一項に記載の方法。
〔態様17〕
当該方法が、
・前記没入的オーディオ信号(111)から導出された第1のダウンミックス・チャネル信号(203)および第2のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、前記スーパーフレーム(400)の一つまたは複数の第1データ・フィールド(411、421)および一つまたは複数の第2データ・フィールド(412、422)に、それぞれ挿入する段階であって、前記第1のダウンミックス・チャネル信号(203)は第1のエンコーダを用いてエンコードされ、前記第2のダウンミックス・チャネル信号(203)は第2のエンコーダを用いてエンコードされる、段階と;
・前記第1のエンコーダおよび前記第2のエンコーダに関する構成情報を、前記スーパーフレーム(400)内で、前記スーパーフレーム(400)のシーケンスのうち以前のスーパーフレーム(400)内で、またはアウトオブバンド信号伝達方式を使って、提供する段階とを含む、
態様1ないし16のうちいずれか一項に記載の方法。
〔態様18〕
当該方法が、
・IA信号と呼ばれる、前記没入的オーディオ信号(111)から一つまたは複数のオーディオ・オブジェクトを抽出する段階であって、オーディオ・オブジェクトは、オブジェクト信号と、前記オーディオ・オブジェクトの位置を示すオブジェクト・メタデータ(202)とを含む、段階と;
・前記IA信号(111)に基づき、かつ前記一つまたは複数のオーディオ・オブジェクトに基づいて、残留信号(201)を決定する、段階と;
・前記IA信号(111)に基づいてダウンミックス信号を提供し、特に、前記ダウンミックス信号のダウンミックス・チャネル信号(203)の数が前記IA信号(111)のチャネル信号の数よりも少ないようにする、段階と;
・前記ダウンミックス信号を、前記一つまたは複数のオーディオ・オブジェクトに対応する一つまたは複数の再構成されたオーディオ・オブジェクト信号および/または前記残留信号(201)に対応する再構成された残留信号(311)にアップミックスすることを可能にするための合同符号化メタデータ(205)を決定する段階と;
・前記ダウンミックス信号の波形符号化を実行して、前記一つまたは複数のダウンミックス・チャネル信号(203)のフレームのシーケンスについて、符号化されたオーディオ・データ(206)を提供する段階と;
・前記合同符号化メタデータ(205)および前記一つまたは複数のオーディオ・オブジェクトの前記オブジェクト・メタデータ(202)のエントロピー符号化を実行して、前記スーパーフレーム(400)のシーケンスの前記メタデータ・フィールド(403)に挿入される前記メタデータ(202,205)を提供する段階とを含む、
態様1ないし17のうちいずれか一項に記載の方法。
〔態様19〕
ビットストリーム(101)のスーパーフレーム(400)であって、当該ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、前記スーパーフレーム(400)は、
・前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)のデータ・フィールド(411、421、412、422)と;
・前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するように適応されたメタデータ(202,205)のための単一のメタデータ・フィールド(403)とを含む、
スーパーフレーム。
〔態様20〕
ビットストリーム(101)から没入的オーディオ信号(111)に関するデータを導出するための方法(600)であって、前記ビットストリーム(101)は、前記没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該方法(600)は、スーパーフレーム(400)の前記シーケンスについて繰り返し、
・スーパーフレーム(400)のデータ・フィールド(411、421、412、422)から、前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を抽出する段階(601)と;
・前記スーパーフレーム(400)のメタデータ・フィールド(403)から、前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を抽出する段階(602)とを実行することを含む、
方法。
〔態様21〕
・前記符号化されたオーディオ・データ(206)および前記メタデータ(202,205)から一つまたは複数の再構成されたオーディオ・オブジェクトを導出する段階であって、オーディオ・オブジェクトは、オブジェクト信号および該オーディオ・オブジェクトの位置を示すオブジェクト・メタデータ(202)を含む、段階と;
・前記符号化されたオーディオ・データ(206)および前記メタデータ(202,205)から、再構成された残留信号(311)を導出する段階であって、前記一つまたは複数の再構成されたオーディオ・オブジェクトおよび前記再構成された残留信号(311)は、前記没入的オーディオ信号(111)を記述する、
態様20に記載の方法。
〔態様22〕
当該方法は、
・前記スーパーフレーム(400)からヘッダ・フィールド(401)を抽出する段階と;
・前記ヘッダ・フィールド(401)から前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズを導出する段階とを含む、
態様20または21に記載の方法。
〔態様23〕
・前記メタデータ・フィールド(403)が可能な最大サイズを示し;
・前記ヘッダ・フィールド(401)が調整値を示し;
・前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズは、前記可能な最大サイズから前記調整値を引いたものに対応する、
態様22に記載の方法。
〔態様24〕
・前記ヘッダ・フィールド(401)は、前記メタデータ・フィールド(403)のサイズについてのサイズ・インジケータを含み;
・前記サイズ・インジケータは、前記メタデータ・フィールド(403)のサイズの異なるサイズ範囲について異なる分解能を示す、
態様22または23に記載の方法。
〔態様25〕
当該方法が、
・前記スーパーフレーム(400)からヘッダ・フィールド(401)を抽出する段階と;
・前記ヘッダ・フィールド(401)に基づき、前記スーパーフレーム(400)が構成情報フィールド(402)を含むか否かを判定する段階と;
・前記ヘッダ・フィールド(401)に基づいて、構成情報フィールド(402)が前記スーパーフレーム(400)内に存在するかどうかを判定する段階とを含む、
態様20ないし24のうちいずれか一項に記載の方法。
〔態様26〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記スーパーフレーム(400)の前記データ・フィールド(411、421、412、422)によって表わされるダウンミックス・チャネル信号(203)の数を決定する段階とを含む、
態様20ないし25のうちいずれか一項に記載の方法。
〔態様27〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記メタデータ・フィールド(403)の可能な最大サイズを決定する段階とを含む、
態様20ないし26のうちいずれか一項に記載の方法。
〔態様28〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記没入的オーディオ信号(111)内に含まれる音場表現信号の次数を決定する段階とを含む、
態様20ないし27のうちいずれか一項に記載の方法。
〔態様29〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記一つまたは複数のダウンミックス・チャネル信号(203)のそれぞれを符号化するために使用されるフレーム・タイプおよび/または符号化モードを決定する段階とを含む、
態様20ないし28のうちいずれか一項に記載の方法。
〔態様30〕
当該方法が、
・前記スーパーフレーム(400)からヘッダ・フィールド(401)を抽出する段階と;
・前記ヘッダ・フィールド(401)に基づいて、前記スーパーフレーム(400)が、前記没入的オーディオ信号(111)に関する追加的情報のための拡張フィールド(404)を含むか否かを判定する段階とを含む、
態様20ないし29のうちいずれか一項に記載の方法。
〔態様31〕
ビットストリーム(101)を生成するよう構成されたエンコード装置(110)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該エンコード装置(110)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階と;
前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階とを実行するように構成されている、
エンコード装置。
〔態様32〕
ビットストリーム(101)から没入的オーディオ信号(111)に関するデータを導出するよう構成されたデコード装置(120)であって、前記ビットストリーム(101)は、前記没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該デコード装置(120)は、スーパーフレーム(400)の前記シーケンスについて繰り返し、
・スーパーフレーム(400)のデータ・フィールド(411、421、412、422)から、前記没入的オーディオ信号から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を抽出する段階と;
・前記スーパーフレーム(400)のメタデータ・フィールド(403)から、前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を抽出する段階とを実行するよう構成されている、
デコード装置。
Claims (17)
- ビットストリーム(101)を生成する方法(500)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該方法(500)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階(501)と;
前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階(502)とを実行することを含む、
方法。 - ・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズを示す、
請求項1に記載の方法。 - ・前記メタデータ・フィールド(403)は可能な最大サイズを示し;
・前記ヘッダ・フィールド(401)は調整値を示し;
・前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズは、前記可能な最大サイズから前記調整値を引いたものに対応する、
請求項2に記載の方法。 - 前記ヘッダ・フィールド(401)は、前記メタデータ・フィールド(403)についてのサイズ・インジケータを含み;
前記サイズ・インジケータは、前記メタデータ・フィールド(403)のサイズの異なるサイズ範囲について異なる分解能を示す、
請求項2または3に記載の方法。 - ・前記没入的オーディオ信号(111)の前記一つまたは複数のフレームを再構成するための前記メタデータ(202,205)は、該メタデータ(202,205)のサイズの統計的サイズ分布を示し;
・前記サイズ・インジケータの分解能は、前記メタデータ(202,205)のサイズ分布に依存する、
請求項4に記載の方法。 - ・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が構成情報フィールド(402)を含むか否かを示し;
・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)の存在を示す、
請求項1ないし5のうちいずれか一項に記載の方法。 - ・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記スーパーフレーム(400)のデータ・フィールド(411、421、412、422)によって表わされるダウンミックス・チャネル信号(203)の数を示す、
請求項1ないし6のうちいずれか一項に記載の方法。 - ・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記メタデータ・フィールド(403)の可能な最大サイズを示す、
請求項1ないし7のうちいずれか一項に記載の方法。 - ・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記没入的オーディオ信号(111)内に含まれる音場表現信号の次数を示す、
請求項1ないし8のうちいずれか一項に記載の方法。 - ・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記一つまたは複数のダウンミックス・チャネル信号(203)のそれぞれを符号化するために使用されるフレーム・タイプおよび/または符号化モードを示す、
請求項1ないし9のうちいずれか一項に記載の方法。 - ・当該方法(500)は、ヘッダ・フィールド(401)を前記スーパーフレーム(400)に挿入することを含み;
・ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が前記没入的オーディオ信号(111)に関する追加的情報のための拡張フィールド(404)を含むか否かを示す、
請求項1ないし10のうちいずれか一項に記載の方法。 - スーパーフレーム(400)が、前記一つまたは複数のダウンミックス・チャネル信号(203)の2つ以上のフレームを含む、請求項1ないし3のうちいずれか一項に記載の方法。
- ・ダウンミックス・チャネル信号(203)のフレームの前記符号化されたオーディオ・データ(206)は、マルチモードおよび/またはマルチレート発話またはオーディオ・コーデックを使用して生成される;および/または
・前記メタデータ(202,205)は、マルチモードおよび/またはマルチレートの没入的メタデータ符号化方式を使用して生成される、
請求項1ないし12のうちいずれか一項に記載の方法。 - ・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)が存在しないことを示し;
・当該方法(500)は、前記スーパーフレーム(400)のシーケンスの以前のスーパーフレーム(400)において、またはアウトオブバンド信号伝達方式を使って、構成情報を伝達することを含む、
請求項1ないし13のうちいずれか一項に記載の方法。 - 当該方法が、
・前記没入的オーディオ信号(111)から導出された第1のダウンミックス・チャネル信号(203)および第2のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、前記スーパーフレーム(400)の一つまたは複数の第1データ・フィールド(411、421)および一つまたは複数の第2データ・フィールド(412、422)に、それぞれ挿入する段階であって、前記第1のダウンミックス・チャネル信号(203)は第1のエンコーダを用いてエンコードされ、前記第2のダウンミックス・チャネル信号(203)は第2のエンコーダを用いてエンコードされる、段階と;
・前記第1のエンコーダおよび前記第2のエンコーダに関する構成情報を、前記スーパーフレーム(400)内で、前記スーパーフレーム(400)のシーケンスのうち以前のスーパーフレーム(400)内で、またはアウトオブバンド信号伝達方式を使って、提供する段階とを含む、
請求項1ないし14のうちいずれか一項に記載の方法。 - 当該方法が、
・IA信号と呼ばれる、前記没入的オーディオ信号(111)から一つまたは複数のオーディオ・オブジェクトを抽出する段階であって、オーディオ・オブジェクトは、オブジェクト信号と、前記オーディオ・オブジェクトの位置を示すオブジェクト・メタデータ(202)とを含む、段階と;
・前記IA信号(111)に基づき、かつ前記一つまたは複数のオーディオ・オブジェクトに基づいて、残留信号(201)を決定する、段階と;
・前記IA信号(111)に基づいてダウンミックス信号を提供し、特に、前記ダウンミックス信号のダウンミックス・チャネル信号(203)の数が前記IA信号(111)のチャネル信号の数よりも少ないようにする、段階と;
・前記ダウンミックス信号を、前記一つまたは複数のオーディオ・オブジェクトに対応する一つまたは複数の再構成されたオーディオ・オブジェクト信号および/または前記残留信号(201)に対応する再構成された残留信号(311)にアップミックスすることを可能にするための合同符号化メタデータ(205)を決定する段階と;
・前記ダウンミックス信号の波形符号化を実行して、前記一つまたは複数のダウンミックス・チャネル信号(203)のフレームのシーケンスについて、符号化されたオーディオ・データ(206)を提供する段階と;
・前記合同符号化メタデータ(205)および前記一つまたは複数のオーディオ・オブジェクトの前記オブジェクト・メタデータ(202)のエントロピー符号化を実行して、前記スーパーフレーム(400)のシーケンスの前記メタデータ・フィールド(403)に挿入される前記メタデータ(202,205)を提供する段階とを含む、
請求項1ないし15のうちいずれか一項に記載の方法。 - ビットストリーム(101)を生成するよう構成されたエンコード装置(110)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該エンコード装置(110)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階と;
前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階とを実行するように構成されている、
エンコード装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862693246P | 2018-07-02 | 2018-07-02 | |
US62/693,246 | 2018-07-02 | ||
PCT/US2019/040271 WO2020010064A1 (en) | 2018-07-02 | 2019-07-02 | Methods and devices for generating or decoding a bitstream comprising immersive audio signals |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021530723A JP2021530723A (ja) | 2021-11-11 |
JPWO2020010064A5 true JPWO2020010064A5 (ja) | 2022-07-05 |
JP7575947B2 JP7575947B2 (ja) | 2024-10-30 |
Family
ID=67439427
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020547116A Active JP7516251B2 (ja) | 2018-07-02 | 2019-07-02 | 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置 |
JP2020547044A Active JP7575947B2 (ja) | 2018-07-02 | 2019-07-02 | 没入的オーディオ信号を含むビットストリームを生成するための方法および装置 |
JP2024107105A Pending JP2024133563A (ja) | 2018-07-02 | 2024-07-03 | 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020547116A Active JP7516251B2 (ja) | 2018-07-02 | 2019-07-02 | 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024107105A Pending JP2024133563A (ja) | 2018-07-02 | 2024-07-03 | 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置 |
Country Status (15)
Country | Link |
---|---|
US (4) | US12020718B2 (ja) |
EP (3) | EP3818521A1 (ja) |
JP (3) | JP7516251B2 (ja) |
KR (2) | KR20210027238A (ja) |
CN (4) | CN111837182B (ja) |
AU (3) | AU2019298240B2 (ja) |
BR (2) | BR112020017338A2 (ja) |
CA (2) | CA3091150A1 (ja) |
DE (1) | DE112019003358T5 (ja) |
ES (1) | ES2968801T3 (ja) |
IL (4) | IL307898A (ja) |
MX (4) | MX2020009581A (ja) |
SG (2) | SG11202007628PA (ja) |
UA (1) | UA128634C2 (ja) |
WO (2) | WO2020010072A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11315581B1 (en) * | 2020-08-17 | 2022-04-26 | Amazon Technologies, Inc. | Encoding audio metadata in an audio frame |
EP4202921A4 (en) * | 2020-09-28 | 2024-02-21 | Samsung Electronics Co., Ltd. | AUDIO ENCODING APPARATUS AND METHOD AND AUDIO DECODING APPARATUS AND METHOD |
US11930349B2 (en) | 2020-11-24 | 2024-03-12 | Naver Corporation | Computer system for producing audio content for realizing customized being-there and method thereof |
JP7536733B2 (ja) | 2020-11-24 | 2024-08-20 | ネイバー コーポレーション | オーディオと関連してユーザカスタム型臨場感を実現するためのコンピュータシステムおよびその方法 |
KR102508815B1 (ko) * | 2020-11-24 | 2023-03-14 | 네이버 주식회사 | 오디오와 관련하여 사용자 맞춤형 현장감 실현을 위한 컴퓨터 시스템 및 그의 방법 |
CN114582356A (zh) * | 2020-11-30 | 2022-06-03 | 华为技术有限公司 | 一种音频编解码方法和装置 |
KR20240137613A (ko) * | 2022-01-20 | 2024-09-20 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 낮은 레이턴시 몰입형 오디오 코덱을 위한 고차 앰비소닉스의 공간적 코딩 |
GB2615607A (en) * | 2022-02-15 | 2023-08-16 | Nokia Technologies Oy | Parametric spatial audio rendering |
IL315013A (en) * | 2022-03-10 | 2024-10-01 | Dolby Laboratories Licensing Corp | Directional audio coding methods, devices and systems - spatial reconstruction audio processing |
WO2024175587A1 (en) * | 2023-02-23 | 2024-08-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal representation decoding unit and audio signal representation encoding unit |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1502361B1 (en) | 2002-05-03 | 2015-01-14 | Harman International Industries Incorporated | Multi-channel downmixing device |
WO2005081229A1 (ja) | 2004-02-25 | 2005-09-01 | Matsushita Electric Industrial Co., Ltd. | オーディオエンコーダ及びオーディオデコーダ |
US7848931B2 (en) | 2004-08-27 | 2010-12-07 | Panasonic Corporation | Audio encoder |
US9015051B2 (en) * | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
KR101024924B1 (ko) | 2008-01-23 | 2011-03-31 | 엘지전자 주식회사 | 오디오 신호의 처리 방법 및 이의 장치 |
MY152252A (en) | 2008-07-11 | 2014-09-15 | Fraunhofer Ges Forschung | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
PL2346030T3 (pl) * | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
ES2425814T3 (es) * | 2008-08-13 | 2013-10-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato para determinar una señal de audio espacial convertida |
EP2154911A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
EP2154910A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for merging spatial audio streams |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
KR101283783B1 (ko) | 2009-06-23 | 2013-07-08 | 한국전자통신연구원 | 고품질 다채널 오디오 부호화 및 복호화 장치 |
CN102714035B (zh) * | 2009-10-16 | 2015-12-16 | 弗兰霍菲尔运输应用研究公司 | 用以提供一或多个经调整参数的装置及方法 |
EP2523189B1 (en) | 2010-01-08 | 2014-09-03 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, encoder apparatus, decoder apparatus, program and recording medium |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
DE102010030534A1 (de) * | 2010-06-25 | 2011-12-29 | Iosono Gmbh | Vorrichtung zum Veränderung einer Audio-Szene und Vorrichtung zum Erzeugen einer Richtungsfunktion |
US20150348558A1 (en) * | 2010-12-03 | 2015-12-03 | Dolby Laboratories Licensing Corporation | Audio Bitstreams with Supplementary Data and Encoding and Decoding of Such Bitstreams |
EP2686848A1 (en) * | 2011-03-18 | 2014-01-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frame element positioning in frames of a bitstream representing audio content |
UA124570C2 (uk) | 2011-07-01 | 2021-10-13 | Долбі Лабораторіс Лайсензін Корпорейшн | Система та спосіб для генерування, кодування та представлення даних адаптивного звукового сигналу |
TWI505262B (zh) * | 2012-05-15 | 2015-10-21 | Dolby Int Ab | 具多重子流之多通道音頻信號的有效編碼與解碼 |
US9516446B2 (en) * | 2012-07-20 | 2016-12-06 | Qualcomm Incorporated | Scalable downmix design for object-based surround codec with cluster analysis by synthesis |
EP2898506B1 (en) * | 2012-09-21 | 2018-01-17 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
US9609452B2 (en) | 2013-02-08 | 2017-03-28 | Qualcomm Incorporated | Obtaining sparseness information for higher order ambisonic audio renderers |
US10178489B2 (en) * | 2013-02-08 | 2019-01-08 | Qualcomm Incorporated | Signaling audio rendering information in a bitstream |
US9685163B2 (en) * | 2013-03-01 | 2017-06-20 | Qualcomm Incorporated | Transforming spherical harmonic coefficients |
US9980074B2 (en) * | 2013-05-29 | 2018-05-22 | Qualcomm Incorporated | Quantization step sizes for compression of spatial components of a sound field |
CN105612766B (zh) | 2013-07-22 | 2018-07-27 | 弗劳恩霍夫应用研究促进协会 | 使用渲染音频信号的解相关的多声道音频解码器、多声道音频编码器、方法、以及计算机可读介质 |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
CN117037811A (zh) | 2013-09-12 | 2023-11-10 | 杜比国际公司 | 多声道音频内容的编码 |
CN105531759B (zh) | 2013-09-12 | 2019-11-26 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
PL3074969T3 (pl) | 2013-11-27 | 2019-05-31 | Dts Inc | Matrycowe miksowanie oparte na multiplecie dla wielokanałowego audio o dużej liczbie kanałów |
US9922656B2 (en) * | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9502045B2 (en) * | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
EP2928216A1 (en) * | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
CN106465029B (zh) | 2014-05-30 | 2018-05-08 | 高通股份有限公司 | 用于渲染高阶立体混响系数及产生位流的装置和方法 |
US9847088B2 (en) * | 2014-08-29 | 2017-12-19 | Qualcomm Incorporated | Intermediate compression for higher order ambisonic audio data |
ES2922373T3 (es) * | 2015-03-03 | 2022-09-14 | Dolby Laboratories Licensing Corp | Realce de señales de audio espacial por decorrelación modulada |
EP3067887A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US10497379B2 (en) | 2015-06-17 | 2019-12-03 | Samsung Electronics Co., Ltd. | Method and device for processing internal channels for low complexity format conversion |
TWI607655B (zh) | 2015-06-19 | 2017-12-01 | Sony Corp | Coding apparatus and method, decoding apparatus and method, and program |
KR20240028560A (ko) | 2016-01-27 | 2024-03-05 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 음향 환경 시뮬레이션 |
EP3208800A1 (en) | 2016-02-17 | 2017-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for stereo filing in multichannel coding |
SG11202003125SA (en) * | 2017-10-04 | 2020-05-28 | Fraunhofer Ges Forschung | Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding |
CN111630593B (zh) * | 2018-01-18 | 2021-12-28 | 杜比实验室特许公司 | 用于译码声场表示信号的方法和装置 |
-
2019
- 2019-07-02 KR KR1020207026492A patent/KR20210027238A/ko not_active Application Discontinuation
- 2019-07-02 AU AU2019298240A patent/AU2019298240B2/en active Active
- 2019-07-02 MX MX2020009581A patent/MX2020009581A/es unknown
- 2019-07-02 IL IL307898A patent/IL307898A/en unknown
- 2019-07-02 CN CN201980017996.8A patent/CN111837182B/zh active Active
- 2019-07-02 IL IL312390A patent/IL312390A/en unknown
- 2019-07-02 CN CN202410978891.1A patent/CN118711601A/zh active Pending
- 2019-07-02 ES ES19745016T patent/ES2968801T3/es active Active
- 2019-07-02 WO PCT/US2019/040282 patent/WO2020010072A1/en active Application Filing
- 2019-07-02 MX MX2020009578A patent/MX2020009578A/es unknown
- 2019-07-02 SG SG11202007628PA patent/SG11202007628PA/en unknown
- 2019-07-02 US US17/251,940 patent/US12020718B2/en active Active
- 2019-07-02 WO PCT/US2019/040271 patent/WO2020010064A1/en active Application Filing
- 2019-07-02 IL IL276619A patent/IL276619B2/en unknown
- 2019-07-02 JP JP2020547116A patent/JP7516251B2/ja active Active
- 2019-07-02 EP EP19745400.2A patent/EP3818521A1/en active Pending
- 2019-07-02 CA CA3091150A patent/CA3091150A1/en active Pending
- 2019-07-02 IL IL276618A patent/IL276618B2/en unknown
- 2019-07-02 CA CA3091241A patent/CA3091241A1/en active Pending
- 2019-07-02 CN CN202410628495.6A patent/CN118368577A/zh active Pending
- 2019-07-02 AU AU2019298232A patent/AU2019298232B2/en active Active
- 2019-07-02 CN CN201980017282.7A patent/CN111819627A/zh active Pending
- 2019-07-02 US US17/251,913 patent/US11699451B2/en active Active
- 2019-07-02 KR KR1020207025684A patent/KR20210027236A/ko not_active Application Discontinuation
- 2019-07-02 SG SG11202007629UA patent/SG11202007629UA/en unknown
- 2019-07-02 EP EP19745016.6A patent/EP3818524B1/en active Active
- 2019-07-02 BR BR112020017338-0A patent/BR112020017338A2/pt unknown
- 2019-07-02 BR BR112020016948-0A patent/BR112020016948A2/pt unknown
- 2019-07-02 UA UAA202005869A patent/UA128634C2/uk unknown
- 2019-07-02 JP JP2020547044A patent/JP7575947B2/ja active Active
- 2019-07-02 EP EP23215970.7A patent/EP4312212A3/en active Pending
- 2019-07-02 DE DE112019003358.1T patent/DE112019003358T5/de active Pending
-
2020
- 2020-09-14 MX MX2024002328A patent/MX2024002328A/es unknown
- 2020-09-14 MX MX2024002403A patent/MX2024002403A/es unknown
-
2023
- 2023-07-10 US US18/349,427 patent/US20240005933A1/en active Pending
-
2024
- 2024-06-05 AU AU2024203810A patent/AU2024203810A1/en active Pending
- 2024-06-21 US US18/751,078 patent/US20240347069A1/en active Pending
- 2024-07-03 JP JP2024107105A patent/JP2024133563A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
IL312390A (en) | Methods and devices for producing or decoding a bit sequence comprising embedded audio signals | |
JP5461835B2 (ja) | オーディオ信号の符号化/復号化方法及び符号化/復号化装置 | |
RU2368074C2 (ru) | Адаптивная группировка параметров для улучшенной эффективности кодирования | |
RU2658535C1 (ru) | Декодирование битовых потоков аудио с метаданными расширенного копирования спектральной полосы в по меньшей мере одном заполняющем элементе | |
ES2923661T3 (es) | Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia | |
US20100305956A1 (en) | Method and an apparatus for processing a signal | |
JP6214765B2 (ja) | 音声デコーダ、符号化音声出力データを生成するための装置、及びデコーダの初期化を可能にする方法 | |
US9570082B2 (en) | Method, medium, and apparatus encoding and/or decoding multichannel audio signals | |
JP7311940B2 (ja) | 変換長切替えをサポートする周波数ドメインオーディオ符号化 | |
JP6728154B2 (ja) | オーディオ信号のエンコードおよびデコード | |
KR20240038819A (ko) | 오디오 인코더 및 디코더 | |
US20080288263A1 (en) | Method and Apparatus for Encoding/Decoding | |
TWI631554B (zh) | Encoding device and method, decoding device and method, and program | |
JPWO2020010064A5 (ja) | ||
KR20060122694A (ko) | 두 채널 이상의 다운믹스 오디오 신호에 공간 정보비트스트림을 삽입하는 방법 | |
RU2383941C2 (ru) | Способ и устройство для кодирования и декодирования аудиосигналов | |
RU2023121109A (ru) | Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы | |
RU2802677C2 (ru) | Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы | |
TH2001005154A (th) | วิธีการและอุปกรณ์สำหรับให้กำเนิดหรือถอดรหัสกระแสบิตซึ่งประกอบรวมด้วยสัญญาณเสียงผ่านโสตแบบซึมซาบ |