[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPWO2020010064A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2020010064A5
JPWO2020010064A5 JP2020547044A JP2020547044A JPWO2020010064A5 JP WO2020010064 A5 JPWO2020010064 A5 JP WO2020010064A5 JP 2020547044 A JP2020547044 A JP 2020547044A JP 2020547044 A JP2020547044 A JP 2020547044A JP WO2020010064 A5 JPWO2020010064 A5 JP WO2020010064A5
Authority
JP
Japan
Prior art keywords
superframe
field
metadata
signal
configuration information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020547044A
Other languages
English (en)
Other versions
JP7575947B2 (ja
JP2021530723A (ja
Publication date
Application filed filed Critical
Priority claimed from PCT/US2019/040271 external-priority patent/WO2020010064A1/en
Publication of JP2021530723A publication Critical patent/JP2021530723A/ja
Publication of JPWO2020010064A5 publication Critical patent/JPWO2020010064A5/ja
Application granted granted Critical
Publication of JP7575947B2 publication Critical patent/JP7575947B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

明細書および図面は、提案される方法および装置の原理を説明するに過ぎないことを注意しておくべきである。よって、当業者は、本明細書に明示的に記載または図示されていないが、本発明の原理を具現し、その精神および範囲内に含まれるさまざまな構成を考案することができることが理解されるであろう。さらに、本明細書に記載されたすべての例は、主として、提案される方法および装置の原理、ならびに当該技術を促進するために発明者によって寄与された概念を理解する際に読者を助けるという教育目的のみをはっきりと目的とするものであり、そのように具体的に記載された例および条件に限定することなく、解釈される。さらに、本発明の原理、側面、および実施形態、ならびにそれらの特定の例を記載する本明細書のすべての陳述は、それらの均等物を包含することが意図されている。
いくつかの態様を記載しておく。
〔態様1〕
ビットストリーム(101)を生成する方法(500)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該方法(500)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階(501)と;
前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階(502)とを実行することを含む、
方法。
〔態様2〕
・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズを示す、
態様1に記載の方法。
〔態様3〕
・前記メタデータ・フィールド(403)は可能な最大サイズを示し;
・前記ヘッダ・フィールド(401)は調整値を示し;
・前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズは、前記可能な最大サイズから前記調整値を引いたものに対応する、
態様2に記載の方法。
〔態様4〕
前記ヘッダ・フィールド(401)は、前記メタデータ・フィールド(403)についてのサイズ・インジケータを含み;
前記サイズ・インジケータは、前記メタデータ・フィールド(403)のサイズの異なるサイズ範囲について異なる分解能を示す、
態様2または3に記載の方法。
〔態様5〕
・前記没入的オーディオ信号(111)の前記一つまたは複数のフレームを再構成するための前記メタデータ(202,205)は、該メタデータ(202,205)のサイズの統計的サイズ分布を示し;
・前記サイズ・インジケータの分解能は、前記メタデータ(202,205)のサイズ分布に依存する、
態様4に記載の方法。
〔態様6〕
・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が構成情報フィールド(402)を含むか否かを示し;
・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)の存在を示す、
態様1ないし5のうちいずれか一項に記載の方法。
〔態様7〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記スーパーフレーム(400)のデータ・フィールド(411、421、412、422)によって表わされるダウンミックス・チャネル信号(203)の数を示す、
態様1ないし6のうちいずれか一項に記載の方法。
〔態様8〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記メタデータ・フィールド(403)の可能な最大サイズを示す、
態様1ないし7のうちいずれか一項に記載の方法。
〔態様9〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記没入的オーディオ信号(111)内に含まれる音場表現信号の次数を示す、
態様1ないし8のうちいずれか一項に記載の方法。
〔態様10〕
・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
・前記構成情報フィールド(402)は、前記一つまたは複数のダウンミックス・チャネル信号(203)のそれぞれを符号化するために使用されるフレーム・タイプおよび/または符号化モードを示す、
態様1ないし9のうちいずれか一項に記載の方法。
〔態様11〕
・当該方法(500)は、ヘッダ・フィールド(401)を前記スーパーフレーム(400)に挿入することを含み;
・ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が前記没入的オーディオ信号(111)に関する追加的情報のための拡張フィールド(404)を含むか否かを示す、
態様1ないし10のうちいずれか一項に記載の方法。
〔態様12〕
スーパーフレーム(400)が、前記一つまたは複数のダウンミックス・チャネル信号(203)の2つ以上のフレームを含む、態様1ないし3のうちいずれか一項に記載の方法。
〔態様13〕
・ダウンミックス・チャネル信号(203)のフレームの前記符号化されたオーディオ・データ(206)は、マルチモードおよび/またはマルチレート発話またはオーディオ・コーデックを使用して生成される;および/または
・前記メタデータ(202,205)は、マルチモードおよび/またはマルチレートの没入的メタデータ符号化方式を使用して生成される、
態様1ないし12のうちいずれか一項に記載の方法。
〔態様14〕
ダウンミックス・チャネル信号(203)のフレームの前記符号化されたオーディオ・データ(206)が、向上音声サービス・エンコーダを使用してエンコードされる、態様1ないし13のうちいずれか一項に記載の方法。
〔態様15〕
前記スーパーフレーム(400)が、伝送プロトコル、特にDASH、RTSPまたはRTPを用いて伝送される、または記憶フォーマット、特にISOBMFFに従ってファイルに格納される、データ要素の少なくとも一部を構成する、態様1ないし14のうちいずれか一項に記載の方法。
〔態様16〕
・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)が存在しないことを示し;
・当該方法(500)は、前記スーパーフレーム(400)のシーケンスの以前のスーパーフレーム(400)において、またはアウトオブバンド信号伝達方式を使って、構成情報を伝達することを含む、
態様1ないし15のうちいずれか一項に記載の方法。
〔態様17〕
当該方法が、
・前記没入的オーディオ信号(111)から導出された第1のダウンミックス・チャネル信号(203)および第2のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、前記スーパーフレーム(400)の一つまたは複数の第1データ・フィールド(411、421)および一つまたは複数の第2データ・フィールド(412、422)に、それぞれ挿入する段階であって、前記第1のダウンミックス・チャネル信号(203)は第1のエンコーダを用いてエンコードされ、前記第2のダウンミックス・チャネル信号(203)は第2のエンコーダを用いてエンコードされる、段階と;
・前記第1のエンコーダおよび前記第2のエンコーダに関する構成情報を、前記スーパーフレーム(400)内で、前記スーパーフレーム(400)のシーケンスのうち以前のスーパーフレーム(400)内で、またはアウトオブバンド信号伝達方式を使って、提供する段階とを含む、
態様1ないし16のうちいずれか一項に記載の方法。
〔態様18〕
当該方法が、
・IA信号と呼ばれる、前記没入的オーディオ信号(111)から一つまたは複数のオーディオ・オブジェクトを抽出する段階であって、オーディオ・オブジェクトは、オブジェクト信号と、前記オーディオ・オブジェクトの位置を示すオブジェクト・メタデータ(202)とを含む、段階と;
・前記IA信号(111)に基づき、かつ前記一つまたは複数のオーディオ・オブジェクトに基づいて、残留信号(201)を決定する、段階と;
・前記IA信号(111)に基づいてダウンミックス信号を提供し、特に、前記ダウンミックス信号のダウンミックス・チャネル信号(203)の数が前記IA信号(111)のチャネル信号の数よりも少ないようにする、段階と;
・前記ダウンミックス信号を、前記一つまたは複数のオーディオ・オブジェクトに対応する一つまたは複数の再構成されたオーディオ・オブジェクト信号および/または前記残留信号(201)に対応する再構成された残留信号(311)にアップミックスすることを可能にするための合同符号化メタデータ(205)を決定する段階と;
・前記ダウンミックス信号の波形符号化を実行して、前記一つまたは複数のダウンミックス・チャネル信号(203)のフレームのシーケンスについて、符号化されたオーディオ・データ(206)を提供する段階と;
・前記合同符号化メタデータ(205)および前記一つまたは複数のオーディオ・オブジェクトの前記オブジェクト・メタデータ(202)のエントロピー符号化を実行して、前記スーパーフレーム(400)のシーケンスの前記メタデータ・フィールド(403)に挿入される前記メタデータ(202,205)を提供する段階とを含む、
態様1ないし17のうちいずれか一項に記載の方法。
〔態様19〕
ビットストリーム(101)のスーパーフレーム(400)であって、当該ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、前記スーパーフレーム(400)は、
・前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)のデータ・フィールド(411、421、412、422)と;
・前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するように適応されたメタデータ(202,205)のための単一のメタデータ・フィールド(403)とを含む、
スーパーフレーム。
〔態様20〕
ビットストリーム(101)から没入的オーディオ信号(111)に関するデータを導出するための方法(600)であって、前記ビットストリーム(101)は、前記没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該方法(600)は、スーパーフレーム(400)の前記シーケンスについて繰り返し、
・スーパーフレーム(400)のデータ・フィールド(411、421、412、422)から、前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を抽出する段階(601)と;
・前記スーパーフレーム(400)のメタデータ・フィールド(403)から、前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を抽出する段階(602)とを実行することを含む、
方法。
〔態様21〕
・前記符号化されたオーディオ・データ(206)および前記メタデータ(202,205)から一つまたは複数の再構成されたオーディオ・オブジェクトを導出する段階であって、オーディオ・オブジェクトは、オブジェクト信号および該オーディオ・オブジェクトの位置を示すオブジェクト・メタデータ(202)を含む、段階と;
・前記符号化されたオーディオ・データ(206)および前記メタデータ(202,205)から、再構成された残留信号(311)を導出する段階であって、前記一つまたは複数の再構成されたオーディオ・オブジェクトおよび前記再構成された残留信号(311)は、前記没入的オーディオ信号(111)を記述する、
態様20に記載の方法。
〔態様22〕
当該方法は、
・前記スーパーフレーム(400)からヘッダ・フィールド(401)を抽出する段階と;
・前記ヘッダ・フィールド(401)から前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズを導出する段階とを含む、
態様20または21に記載の方法。
〔態様23〕
・前記メタデータ・フィールド(403)が可能な最大サイズを示し;
・前記ヘッダ・フィールド(401)が調整値を示し;
・前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズは、前記可能な最大サイズから前記調整値を引いたものに対応する、
態様22に記載の方法。
〔態様24〕
・前記ヘッダ・フィールド(401)は、前記メタデータ・フィールド(403)のサイズについてのサイズ・インジケータを含み;
・前記サイズ・インジケータは、前記メタデータ・フィールド(403)のサイズの異なるサイズ範囲について異なる分解能を示す、
態様22または23に記載の方法。
〔態様25〕
当該方法が、
・前記スーパーフレーム(400)からヘッダ・フィールド(401)を抽出する段階と;
・前記ヘッダ・フィールド(401)に基づき、前記スーパーフレーム(400)が構成情報フィールド(402)を含むか否かを判定する段階と;
・前記ヘッダ・フィールド(401)に基づいて、構成情報フィールド(402)が前記スーパーフレーム(400)内に存在するかどうかを判定する段階とを含む、
態様20ないし24のうちいずれか一項に記載の方法。
〔態様26〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記スーパーフレーム(400)の前記データ・フィールド(411、421、412、422)によって表わされるダウンミックス・チャネル信号(203)の数を決定する段階とを含む、
態様20ないし25のうちいずれか一項に記載の方法。
〔態様27〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記メタデータ・フィールド(403)の可能な最大サイズを決定する段階とを含む、
態様20ないし26のうちいずれか一項に記載の方法。
〔態様28〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記没入的オーディオ信号(111)内に含まれる音場表現信号の次数を決定する段階とを含む、
態様20ないし27のうちいずれか一項に記載の方法。
〔態様29〕
当該方法が、
・前記スーパーフレーム(400)から構成情報フィールド(402)を抽出する段階と;
・前記構成情報フィールド(402)に基づいて、前記一つまたは複数のダウンミックス・チャネル信号(203)のそれぞれを符号化するために使用されるフレーム・タイプおよび/または符号化モードを決定する段階とを含む、
態様20ないし28のうちいずれか一項に記載の方法。
〔態様30〕
当該方法が、
・前記スーパーフレーム(400)からヘッダ・フィールド(401)を抽出する段階と;
・前記ヘッダ・フィールド(401)に基づいて、前記スーパーフレーム(400)が、前記没入的オーディオ信号(111)に関する追加的情報のための拡張フィールド(404)を含むか否かを判定する段階とを含む、
態様20ないし29のうちいずれか一項に記載の方法。
〔態様31〕
ビットストリーム(101)を生成するよう構成されたエンコード装置(110)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該エンコード装置(110)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階と;
前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階とを実行するように構成されている、
エンコード装置。
〔態様32〕
ビットストリーム(101)から没入的オーディオ信号(111)に関するデータを導出するよう構成されたデコード装置(120)であって、前記ビットストリーム(101)は、前記没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該デコード装置(120)は、スーパーフレーム(400)の前記シーケンスについて繰り返し、
・スーパーフレーム(400)のデータ・フィールド(411、421、412、422)から、前記没入的オーディオ信号から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を抽出する段階と;
・前記スーパーフレーム(400)のメタデータ・フィールド(403)から、前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を抽出する段階とを実行するよう構成されている、
デコード装置。

Claims (17)

  1. ビットストリーム(101)を生成する方法(500)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該方法(500)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
    前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階(501)と;
    前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階(502)とを実行することを含む、
    方法。
  2. ・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
    ・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズを示す、
    請求項1に記載の方法。
  3. ・前記メタデータ・フィールド(403)は可能な最大サイズを示し;
    ・前記ヘッダ・フィールド(401)は調整値を示し;
    ・前記スーパーフレーム(400)の前記メタデータ・フィールド(403)のサイズは、前記可能な最大サイズから前記調整値を引いたものに対応する、
    請求項2に記載の方法。
  4. 前記ヘッダ・フィールド(401)は、前記メタデータ・フィールド(403)についてのサイズ・インジケータを含み;
    前記サイズ・インジケータは、前記メタデータ・フィールド(403)のサイズの異なるサイズ範囲について異なる分解能を示す、
    請求項2または3に記載の方法。
  5. ・前記没入的オーディオ信号(111)の前記一つまたは複数のフレームを再構成するための前記メタデータ(202,205)は、該メタデータ(202,205)のサイズの統計的サイズ分布を示し;
    ・前記サイズ・インジケータの分解能は、前記メタデータ(202,205)のサイズ分布に依存する、
    請求項4に記載の方法。
  6. ・当該方法(500)が、前記スーパーフレーム(400)にヘッダ・フィールド(401)を挿入することを含み;
    ・前記ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が構成情報フィールド(402)を含むか否かを示し;
    ・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)の存在を示す、
    請求項1ないし5のうちいずれか一項に記載の方法。
  7. ・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
    ・前記構成情報フィールド(402)は、前記スーパーフレーム(400)のデータ・フィールド(411、421、412、422)によって表わされるダウンミックス・チャネル信号(203)の数を示す、
    請求項1ないし6のうちいずれか一項に記載の方法。
  8. ・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
    ・前記構成情報フィールド(402)は、前記メタデータ・フィールド(403)の可能な最大サイズを示す、
    請求項1ないし7のうちいずれか一項に記載の方法。
  9. ・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
    ・前記構成情報フィールド(402)は、前記没入的オーディオ信号(111)内に含まれる音場表現信号の次数を示す、
    請求項1ないし8のうちいずれか一項に記載の方法。
  10. ・当該方法(500)は、構成情報フィールド(402)を前記スーパーフレーム(400)に挿入することを含み;
    ・前記構成情報フィールド(402)は、前記一つまたは複数のダウンミックス・チャネル信号(203)のそれぞれを符号化するために使用されるフレーム・タイプおよび/または符号化モードを示す、
    請求項1ないし9のうちいずれか一項に記載の方法。
  11. ・当該方法(500)は、ヘッダ・フィールド(401)を前記スーパーフレーム(400)に挿入することを含み;
    ・ヘッダ・フィールド(401)は、前記スーパーフレーム(400)が前記没入的オーディオ信号(111)に関する追加的情報のための拡張フィールド(404)を含むか否かを示す、
    請求項1ないし10のうちいずれか一項に記載の方法。
  12. スーパーフレーム(400)が、前記一つまたは複数のダウンミックス・チャネル信号(203)の2つ以上のフレームを含む、請求項1ないし3のうちいずれか一項に記載の方法。
  13. ・ダウンミックス・チャネル信号(203)のフレームの前記符号化されたオーディオ・データ(206)は、マルチモードおよび/またはマルチレート発話またはオーディオ・コーデックを使用して生成される;および/または
    ・前記メタデータ(202,205)は、マルチモードおよび/またはマルチレートの没入的メタデータ符号化方式を使用して生成される、
    請求項1ないし12のうちいずれか一項に記載の方法。
  14. ・前記ヘッダ・フィールド(401)は、構成情報フィールド(402)が存在しないことを示し;
    ・当該方法(500)は、前記スーパーフレーム(400)のシーケンスの以前のスーパーフレーム(400)において、またはアウトオブバンド信号伝達方式を使って、構成情報を伝達することを含む、
    請求項1ないし13のうちいずれか一項に記載の方法。
  15. 当該方法が、
    ・前記没入的オーディオ信号(111)から導出された第1のダウンミックス・チャネル信号(203)および第2のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、前記スーパーフレーム(400)の一つまたは複数の第1データ・フィールド(411、421)および一つまたは複数の第2データ・フィールド(412、422)に、それぞれ挿入する段階であって、前記第1のダウンミックス・チャネル信号(203)は第1のエンコーダを用いてエンコードされ、前記第2のダウンミックス・チャネル信号(203)は第2のエンコーダを用いてエンコードされる、段階と;
    ・前記第1のエンコーダおよび前記第2のエンコーダに関する構成情報を、前記スーパーフレーム(400)内で、前記スーパーフレーム(400)のシーケンスのうち以前のスーパーフレーム(400)内で、またはアウトオブバンド信号伝達方式を使って、提供する段階とを含む、
    請求項1ないし14のうちいずれか一項に記載の方法。
  16. 当該方法が、
    ・IA信号と呼ばれる、前記没入的オーディオ信号(111)から一つまたは複数のオーディオ・オブジェクトを抽出する段階であって、オーディオ・オブジェクトは、オブジェクト信号と、前記オーディオ・オブジェクトの位置を示すオブジェクト・メタデータ(202)とを含む、段階と;
    ・前記IA信号(111)に基づき、かつ前記一つまたは複数のオーディオ・オブジェクトに基づいて、残留信号(201)を決定する、段階と;
    ・前記IA信号(111)に基づいてダウンミックス信号を提供し、特に、前記ダウンミックス信号のダウンミックス・チャネル信号(203)の数が前記IA信号(111)のチャネル信号の数よりも少ないようにする、段階と;
    ・前記ダウンミックス信号を、前記一つまたは複数のオーディオ・オブジェクトに対応する一つまたは複数の再構成されたオーディオ・オブジェクト信号および/または前記残留信号(201)に対応する再構成された残留信号(311)にアップミックスすることを可能にするための合同符号化メタデータ(205)を決定する段階と;
    ・前記ダウンミックス信号の波形符号化を実行して、前記一つまたは複数のダウンミックス・チャネル信号(203)のフレームのシーケンスについて、符号化されたオーディオ・データ(206)を提供する段階と;
    ・前記合同符号化メタデータ(205)および前記一つまたは複数のオーディオ・オブジェクトの前記オブジェクト・メタデータ(202)のエントロピー符号化を実行して、前記スーパーフレーム(400)のシーケンスの前記メタデータ・フィールド(403)に挿入される前記メタデータ(202,205)を提供する段階とを含む、
    請求項1ないし15のうちいずれか一項に記載の方法。
  17. ビットストリーム(101)を生成するよう構成されたエンコード装置(110)であって、前記ビットストリーム(101)は、没入的オーディオ信号(111)のフレームのシーケンスについてのスーパーフレーム(400)のシーケンスを含み、当該エンコード装置(110)は、スーパーフレーム(400)の前記シーケンスについて、繰り返し:
    前記没入的オーディオ信号(111)から導出された一つまたは複数のダウンミックス・チャネル信号(203)の一つまたは複数のフレームについての符号化されたオーディオ・データ(206)を、スーパーフレーム(400)のデータ・フィールド(411、421、412、422)に挿入する段階と;
    前記符号化されたオーディオ・データ(206)から前記没入的オーディオ信号(111)の一つまたは複数のフレームを再構成するためのメタデータ(202,205)を、前記スーパーフレーム(400)のメタデータ・フィールド(403)に挿入する段階とを実行するように構成されている、
    エンコード装置。
JP2020547044A 2018-07-02 2019-07-02 没入的オーディオ信号を含むビットストリームを生成するための方法および装置 Active JP7575947B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862693246P 2018-07-02 2018-07-02
US62/693,246 2018-07-02
PCT/US2019/040271 WO2020010064A1 (en) 2018-07-02 2019-07-02 Methods and devices for generating or decoding a bitstream comprising immersive audio signals

Publications (3)

Publication Number Publication Date
JP2021530723A JP2021530723A (ja) 2021-11-11
JPWO2020010064A5 true JPWO2020010064A5 (ja) 2022-07-05
JP7575947B2 JP7575947B2 (ja) 2024-10-30

Family

ID=67439427

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2020547116A Active JP7516251B2 (ja) 2018-07-02 2019-07-02 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置
JP2020547044A Active JP7575947B2 (ja) 2018-07-02 2019-07-02 没入的オーディオ信号を含むビットストリームを生成するための方法および装置
JP2024107105A Pending JP2024133563A (ja) 2018-07-02 2024-07-03 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020547116A Active JP7516251B2 (ja) 2018-07-02 2019-07-02 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024107105A Pending JP2024133563A (ja) 2018-07-02 2024-07-03 没入的オーディオ信号をエンコードおよび/またはデコードするための方法および装置

Country Status (15)

Country Link
US (4) US12020718B2 (ja)
EP (3) EP3818521A1 (ja)
JP (3) JP7516251B2 (ja)
KR (2) KR20210027238A (ja)
CN (4) CN111837182B (ja)
AU (3) AU2019298240B2 (ja)
BR (2) BR112020017338A2 (ja)
CA (2) CA3091150A1 (ja)
DE (1) DE112019003358T5 (ja)
ES (1) ES2968801T3 (ja)
IL (4) IL307898A (ja)
MX (4) MX2020009581A (ja)
SG (2) SG11202007628PA (ja)
UA (1) UA128634C2 (ja)
WO (2) WO2020010072A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11315581B1 (en) * 2020-08-17 2022-04-26 Amazon Technologies, Inc. Encoding audio metadata in an audio frame
EP4202921A4 (en) * 2020-09-28 2024-02-21 Samsung Electronics Co., Ltd. AUDIO ENCODING APPARATUS AND METHOD AND AUDIO DECODING APPARATUS AND METHOD
US11930349B2 (en) 2020-11-24 2024-03-12 Naver Corporation Computer system for producing audio content for realizing customized being-there and method thereof
JP7536733B2 (ja) 2020-11-24 2024-08-20 ネイバー コーポレーション オーディオと関連してユーザカスタム型臨場感を実現するためのコンピュータシステムおよびその方法
KR102508815B1 (ko) * 2020-11-24 2023-03-14 네이버 주식회사 오디오와 관련하여 사용자 맞춤형 현장감 실현을 위한 컴퓨터 시스템 및 그의 방법
CN114582356A (zh) * 2020-11-30 2022-06-03 华为技术有限公司 一种音频编解码方法和装置
KR20240137613A (ko) * 2022-01-20 2024-09-20 돌비 레버러토리즈 라이쎈싱 코오포레이션 낮은 레이턴시 몰입형 오디오 코덱을 위한 고차 앰비소닉스의 공간적 코딩
GB2615607A (en) * 2022-02-15 2023-08-16 Nokia Technologies Oy Parametric spatial audio rendering
IL315013A (en) * 2022-03-10 2024-10-01 Dolby Laboratories Licensing Corp Directional audio coding methods, devices and systems - spatial reconstruction audio processing
WO2024175587A1 (en) * 2023-02-23 2024-08-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal representation decoding unit and audio signal representation encoding unit

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1502361B1 (en) 2002-05-03 2015-01-14 Harman International Industries Incorporated Multi-channel downmixing device
WO2005081229A1 (ja) 2004-02-25 2005-09-01 Matsushita Electric Industrial Co., Ltd. オーディオエンコーダ及びオーディオデコーダ
US7848931B2 (en) 2004-08-27 2010-12-07 Panasonic Corporation Audio encoder
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
KR101024924B1 (ko) 2008-01-23 2011-03-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
MY152252A (en) 2008-07-11 2014-09-15 Fraunhofer Ges Forschung Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
ES2425814T3 (es) * 2008-08-13 2013-10-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para determinar una señal de audio espacial convertida
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
EP2154910A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for merging spatial audio streams
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
KR101283783B1 (ko) 2009-06-23 2013-07-08 한국전자통신연구원 고품질 다채널 오디오 부호화 및 복호화 장치
CN102714035B (zh) * 2009-10-16 2015-12-16 弗兰霍菲尔运输应用研究公司 用以提供一或多个经调整参数的装置及方法
EP2523189B1 (en) 2010-01-08 2014-09-03 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder apparatus, decoder apparatus, program and recording medium
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
DE102010030534A1 (de) * 2010-06-25 2011-12-29 Iosono Gmbh Vorrichtung zum Veränderung einer Audio-Szene und Vorrichtung zum Erzeugen einer Richtungsfunktion
US20150348558A1 (en) * 2010-12-03 2015-12-03 Dolby Laboratories Licensing Corporation Audio Bitstreams with Supplementary Data and Encoding and Decoding of Such Bitstreams
EP2686848A1 (en) * 2011-03-18 2014-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frame element positioning in frames of a bitstream representing audio content
UA124570C2 (uk) 2011-07-01 2021-10-13 Долбі Лабораторіс Лайсензін Корпорейшн Система та спосіб для генерування, кодування та представлення даних адаптивного звукового сигналу
TWI505262B (zh) * 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
US9516446B2 (en) * 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
EP2898506B1 (en) * 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
US9609452B2 (en) 2013-02-08 2017-03-28 Qualcomm Incorporated Obtaining sparseness information for higher order ambisonic audio renderers
US10178489B2 (en) * 2013-02-08 2019-01-08 Qualcomm Incorporated Signaling audio rendering information in a bitstream
US9685163B2 (en) * 2013-03-01 2017-06-20 Qualcomm Incorporated Transforming spherical harmonic coefficients
US9980074B2 (en) * 2013-05-29 2018-05-22 Qualcomm Incorporated Quantization step sizes for compression of spatial components of a sound field
CN105612766B (zh) 2013-07-22 2018-07-27 弗劳恩霍夫应用研究促进协会 使用渲染音频信号的解相关的多声道音频解码器、多声道音频编码器、方法、以及计算机可读介质
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
CN117037811A (zh) 2013-09-12 2023-11-10 杜比国际公司 多声道音频内容的编码
CN105531759B (zh) 2013-09-12 2019-11-26 杜比实验室特许公司 用于下混合音频内容的响度调整
PL3074969T3 (pl) 2013-11-27 2019-05-31 Dts Inc Matrycowe miksowanie oparte na multiplecie dla wielokanałowego audio o dużej liczbie kanałów
US9922656B2 (en) * 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9502045B2 (en) * 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
EP2928216A1 (en) * 2014-03-26 2015-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for screen related audio object remapping
CN106465029B (zh) 2014-05-30 2018-05-08 高通股份有限公司 用于渲染高阶立体混响系数及产生位流的装置和方法
US9847088B2 (en) * 2014-08-29 2017-12-19 Qualcomm Incorporated Intermediate compression for higher order ambisonic audio data
ES2922373T3 (es) * 2015-03-03 2022-09-14 Dolby Laboratories Licensing Corp Realce de señales de audio espacial por decorrelación modulada
EP3067887A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US10497379B2 (en) 2015-06-17 2019-12-03 Samsung Electronics Co., Ltd. Method and device for processing internal channels for low complexity format conversion
TWI607655B (zh) 2015-06-19 2017-12-01 Sony Corp Coding apparatus and method, decoding apparatus and method, and program
KR20240028560A (ko) 2016-01-27 2024-03-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 음향 환경 시뮬레이션
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
SG11202003125SA (en) * 2017-10-04 2020-05-28 Fraunhofer Ges Forschung Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding
CN111630593B (zh) * 2018-01-18 2021-12-28 杜比实验室特许公司 用于译码声场表示信号的方法和装置

Similar Documents

Publication Publication Date Title
IL312390A (en) Methods and devices for producing or decoding a bit sequence comprising embedded audio signals
JP5461835B2 (ja) オーディオ信号の符号化/復号化方法及び符号化/復号化装置
RU2368074C2 (ru) Адаптивная группировка параметров для улучшенной эффективности кодирования
RU2658535C1 (ru) Декодирование битовых потоков аудио с метаданными расширенного копирования спектральной полосы в по меньшей мере одном заполняющем элементе
ES2923661T3 (es) Configuración de envolvente temporal para codificación espacial de audio usando filtrado de Wiener de dominio de frecuencia
US20100305956A1 (en) Method and an apparatus for processing a signal
JP6214765B2 (ja) 音声デコーダ、符号化音声出力データを生成するための装置、及びデコーダの初期化を可能にする方法
US9570082B2 (en) Method, medium, and apparatus encoding and/or decoding multichannel audio signals
JP7311940B2 (ja) 変換長切替えをサポートする周波数ドメインオーディオ符号化
JP6728154B2 (ja) オーディオ信号のエンコードおよびデコード
KR20240038819A (ko) 오디오 인코더 및 디코더
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
TWI631554B (zh) Encoding device and method, decoding device and method, and program
JPWO2020010064A5 (ja)
KR20060122694A (ko) 두 채널 이상의 다운믹스 오디오 신호에 공간 정보비트스트림을 삽입하는 방법
RU2383941C2 (ru) Способ и устройство для кодирования и декодирования аудиосигналов
RU2023121109A (ru) Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы
RU2802677C2 (ru) Способы и устройства для формирования или декодирования битового потока, содержащего иммерсивные аудиосигналы
TH2001005154A (th) วิธีการและอุปกรณ์สำหรับให้กำเนิดหรือถอดรหัสกระแสบิตซึ่งประกอบรวมด้วยสัญญาณเสียงผ่านโสตแบบซึมซาบ