[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

TWM487509U - 音訊處理設備及電子裝置 - Google Patents

音訊處理設備及電子裝置 Download PDF

Info

Publication number
TWM487509U
TWM487509U TW102211969U TW102211969U TWM487509U TW M487509 U TWM487509 U TW M487509U TW 102211969 U TW102211969 U TW 102211969U TW 102211969 U TW102211969 U TW 102211969U TW M487509 U TWM487509 U TW M487509U
Authority
TW
Taiwan
Prior art keywords
audio
metadata
program
indication
processing
Prior art date
Application number
TW102211969U
Other languages
English (en)
Inventor
傑佛瑞 萊德米勒
麥可 沃德
Original Assignee
杜比實驗室特許公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 杜比實驗室特許公司 filed Critical 杜比實驗室特許公司
Publication of TWM487509U publication Critical patent/TWM487509U/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Information Transfer Systems (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Application Of Or Painting With Fluid Materials (AREA)

Description

音訊處理設備及電子裝置 相關申請案之交互參照
本申請案根據2013年6月19日申請之美國臨時專利申請案No.61/836,865「具節目資訊或子串流結構元資料的音訊編碼器及解碼器」(發明人為Jeffrey Riedmiller及Michael Ward)主張優先權。
本申請案關於音訊信號處理單元,更具體地關於具有關由位元流指出之音訊內容之節目資訊的元資料指示之音訊資料位元流的解碼器。本新型之一些實施例以已知為杜比數位(Dolby Digital)(AC-3)、杜比數位加強(Dolby Digital Plus)(增強AC-3或E-AC-3)、或Dolby E之格式之一者產生或解碼音訊資料。
Dolby、Dolby Digital、Dolby Digital Plus、及Dolby E為杜比實驗室授權公司(Dolby Laboratories Licensing Corporation)的商標。杜比實驗室提供分別已 知為杜比數位及杜比數位加強之AC-3及E-AC-3的數位實施。
音訊資料處理單元典型地以盲目方式操作,且未注意資料接收前發生之音訊資料的處理歷史。此可在處理框架中作業,其中單一實體實施所有音訊資料處理及各種目標媒體呈現裝置之編碼,同時目標媒體呈現裝置實施所有解碼及編碼音訊資料之呈現。然而,此盲目處理在複數音訊處理單元分散在不同網路或串聯配置(即鏈)而希望最佳實施其個別類型音訊處理之情況下並未做好(或一點也不好)。例如,一些音訊資料可能編碼用於高性能媒體系統且必須轉換為適於沿媒體處理鏈之行動裝置的簡化型式。因此,音訊處理單元不必要在已實施之音訊資料上實施處理。例如,音量調整單元可於輸入音訊剪輯上實施處理,無論先前是否已於輸入音訊剪輯上實施相同或類似音量調整。結果,甚至當不必要時,音量調整單元可實施調整。此不必要處理亦可能造成音訊資料內容呈現時特徵惡化及/或移除。
揭露一種電子裝置,其包括用於接收編碼音訊之訊框的介面,該訊框包括位於訊框之跳過欄位中的節目資訊元資料,及位於跳過欄位外的編碼音訊資料。緩衝器耦接至暫時儲存訊框之介面,及剖析器耦接至從訊框提取編碼音訊資料之緩衝器。AC-3音訊解碼器耦接至剖析 器或與剖析器整合,而從編碼音訊資料產生解碼音訊。
100、105‧‧‧編碼器
101、152、200‧‧‧解碼器
102、203‧‧‧音訊狀態驗證器
103‧‧‧響度處理級
104‧‧‧音訊流選擇級
106‧‧‧元資料產生級
107‧‧‧填充器/格式器級
108‧‧‧對話響度測量子系統
109、110、201、301‧‧‧訊框緩衝器
111、205‧‧‧剖析器
150‧‧‧編碼音訊傳送子系統
202‧‧‧音訊解碼器
204‧‧‧控制位元產生級
300‧‧‧後處理器
圖1為可經組配以實施新型方法之實施例的系統實施例之方塊圖。
圖2為新型音訊處理單元之實施例的編碼器之方塊圖。
圖3為新型音訊處理單元之實施例的解碼器及與其耦接之新型音訊處理單元之另一實施例的後處理器之方塊圖。
圖4為AC-3訊框,包括其劃分之段。
圖5為AC-3訊框之同步資訊(SI)段,包括其劃分之段。
圖6為AC-3訊框之位元流資訊(BSI)段,包括其劃分之段。
圖7為E-AC-3訊框,包括其劃分之段。
圖8為依據本新型之實施例產生之編碼位元流的元資料段。
符號及命名
在包括申請專利範圍之本揭露通篇,(編碼音訊位元流之)「元資料」表達係指來自位元流之對應音 訊資料的分立及不同資料。
在包括申請專利範圍之本揭露通篇,「節目資訊元資料」(「PIM」)表達標示至少一音訊節目之編碼音訊位元流指示的元資料,其中該元資料為至少一該節目之音訊內容之至少一屬性或特性的指示(例如,元資料指出於節目或元資料之音訊資料上實施之處理的類型或參數,該節目或元資料指出節目之哪些通道為現用通道)。
在包括申請專利範圍之本揭露通篇,「音訊節目」表達標示一組一或多個音訊通道及可選地相關元資料(例如,元資料說明所欲空間音訊呈現及/或PIM)。
在包括申請專利範圍之本揭露通篇,「耦接」用詞用以表示直接或間接連接。因而,若第一裝置耦接至第二裝置,該連接可透過直接連接,或透過經由其他裝置及連接之間接連接。
典型音訊資料流包括音訊內容(例如,一或多個音訊內容通道)及音訊內容之至少一特性的元資料指示。例如,在AC-3位元流中,存在一些音訊元資料參數,其特定希望用於改變傳送至聆聽環境之節目的聲音。元資料參數之一者為DIALNORM參數,其希望指出音訊節目中對話的平均位準,並用以判定音訊播放信號位準。
儘管本新型不侷限於使用AC-3位元流、E-AC-3位元流、或Dolby E位元流,為求方便,將於實施例中說明其產生、解碼、或處理該等位元流。
AC-3編碼位元流包含元資料及一至六個音訊內容通道。音訊內容為已使用知覺音訊編碼壓縮之音訊資料。元資料包括一些音訊元資料參數,其希望用於改變傳送至聆聽環境之節目的聲音。
AC-3編碼音訊位元流之每一訊框包含數位音訊之1536個樣本的音訊內容及元資料。針對48kHz的取樣速率,此代表32毫秒數位音訊或每秒31.25個訊框的速率之音訊。
E-AC-3編碼音訊位元流的每一訊框包含數位音訊之256、512、768或1536個樣本的音訊內容及元資料,其取決於訊框是否分別包含一、二、三或六個音訊資料方塊。針對48kHz取樣率,此分別代表5.333、10.667、16或32毫秒數位音訊或分別為每秒189.9、93.75、62.5或31.25個訊框的速率之音訊。
如圖4中所指出,每一AC-3訊框劃分為區段(段),包括:同步資訊(SI)區段,其包含(如圖5中所示)同步字(SW)及二錯誤修正字之第一者(CRC1);位元流資訊(BSI)區段,其包含大部分元資料;六個音訊方塊(AB0至AB5),其包含資料壓縮音訊內容(亦可包括元資料);廢棄位元段(W)(亦已知為「跳過欄位」),其包含音訊內容壓縮後所遺留之任何未使用位元;輔助(AUX)資訊區段,其包含更多元資料;及二錯誤修正字之第二者(CRC2)。
如圖7中所指出,每一E-AC-3訊框劃分為區 段(段),包括:同步資訊(SI)區段,其包含(如圖5中所示)同步字(SW);位元流資訊(BSI)區段,其包含大部分元資料;介於一及六個音訊方塊(AB0至AB5),其包含資料壓縮音訊內容(亦可包括元資料);廢棄位元段(W)(亦已知為「跳過欄位」),其包含音訊內容壓縮後所遺留之任何未使用位元(儘管僅顯示一廢棄位元段,不同廢棄位元或跳過欄位段典型地將接著每一音訊方塊);輔助(AUX)資訊區段,其包含更多元資料;及錯誤修正字(CRC)。
在AC-3(或E-AC-3)位元流中,存在一些音訊元資料參數,具體地希望用於改變傳送至聆聽環境之節目的聲音。元資料參數之一者為DIALNORM參數,其包括於BSI段中。
如圖6中所示,AC-3訊框之BSI段包括五位元參數(「DIALNORM」),指出節目之DIALNORM值。若AC-3訊框之音訊編碼模式(「acmod」)為「0」,則包括指出相同AC-3訊框中所攜帶第二音訊節目之DIALNORM值的五位元參數(「DIALNORM2」),指出使用雙單通道或「1+1」通道組態。
BSI段亦包括旗標(「addbsie」),指出「addbsie」位元之後存在(或不存在)額外位元流資訊;參數(「addbsil」),指出「addbsil」值之後之任何額外位元流資訊的長度;及「addbsil」值之後最多64位元的額外位元流資訊(「addbsi」)。
BSI段包括圖6中未具體顯示之其他元資料值。
依據本新型之典型實施例,PIM(及可選地連同其他元資料)係於音訊位元流之元資料段的一或多個預留欄位(或槽)(例如跳過欄位)中體現,其亦包括其他段(音訊資料段)中之音訊資料。典型地,位元流之每一訊框的至少一段(例如,跳過欄位)包括PIM,且訊框之至少一其他段包括對應音訊資料(即,具有由PIM指出之至少一特性或屬性的音訊資料)。
在一類實施例中,每一元資料段為資料結構(文中有時係指容器),其可包含一或多個元資料酬載。每一酬載包括標頭,其包括特定酬載識別符(及酬載組態資料)以提供酬載中所呈現元資料類型的明白指示。容器內之酬載順序未定義,使得可以任何順序儲存酬載,且剖析器必須能解析整個容器以提取有關酬載並忽略無關或未支援之酬載。圖8(以下將說明)描繪該等容器之結構及容器內的酬載。
當二或更多音訊處理單元需遍佈處理鏈(或內容生命週期)相互串聯作業時,於音訊資料處理鏈中傳達元資料(例如,PIM)特別有用。例如,當鏈中利用二或更多音訊編解碼器且於至媒體消費裝置(或位元流之音訊內容的呈現點)之位元流路徑施加一次以上的單端音量調整時,音訊位元流中未包括元資料可能發生諸如品質、位準及空間惡化的嚴重媒體處理問題。
圖1為示範音訊處理鏈(音訊資料處理系統)之方塊圖,其中系統之一或多個元件可依據本新型之實施例組配。系統包括如同所示耦接在一起之下列元件:預處理單元、編碼器、信號分析及元資料修正單元、轉碼器、解碼器、及後處理單元。在所示系統之變化中,省略一或多個元件,或包括額外音訊資料處理單元。
在一些實施中,圖1之預處理單元經組配以接受包含音訊內容作為輸入之PCM(脈衝編碼調變)(時域)樣本,並輸出處理之PCM樣本。編碼器可經組配以接受PCM樣本作為輸入並輸出音訊內容之編碼(例如壓縮)音訊位元流指示。為音訊內容指示之位元流的資料文中有時係指「音訊資料」。若編碼器係依據本新型之典型實施例組配,則從編碼器輸出之音訊位元流包括PIM以及音訊資料。
圖1之信號分析及元資料修正單元可接受一或多個編碼音訊位元流作為輸入,並藉由實施信號分析判定(例如驗證)每一編碼音訊位元流中之元資料是否正確。若信號分析及元資料修正單元發現所包括之元資料無效,則典型地以從信號分析獲得之正確值置換錯誤值。因而,從信號分析及元資料修正單元輸出之每一編碼音訊位元流可包括修正(或未修正)處理狀態元資料以及編碼音訊資料。
圖1之解碼器可接受編碼(例如壓縮)音訊位元流作為輸入,並(回應)輸出解碼PCM音訊樣本 流。若解碼器係依據本新型之典型實施例組配,則典型作業中解碼器之輸出為或包括下列之任何項:音訊樣本流及從輸入編碼位元流提取之至少一對應PIM(及典型地連同其他元資料)流;或音訊樣本流及從輸入編碼位元流提取之PIM(及典型地連同其他元資料)所判定之對應控制位元流;或音訊樣本流,無從元資料所判定之對應元資料或控制位元流。在最後狀況下,解碼器可從輸入編碼位元流提取元資料,並於提取之元資料上實施至少一作業(例如驗證),即使其未輸出由此判定之提取的元資料或控制位元。
藉由依據本新型之典型實施例組配圖1之後處理單元,後處理單元經組配以接受解碼PCM音訊樣本流,並使用以樣本接收之PIM(及典型地連同其他元資料),或由解碼器從以樣本接收之元資料所判定之控制位元,而於上實施後處理(例如,音訊內容之音量調整)。後處理單元典型地亦經組配以呈現後處理之音訊內容供一或多個揚聲器播放。
本新型之典型實施例提供增強音訊處理鏈,其中音訊處理單元(例如,編碼器、解碼器、轉碼器、及預及後處理單元)依據如由音訊處理單元分別接收之元資料所指出之媒體資料的同期狀態,而調適其施加於音訊資料的個別處理。
輸入至圖1系統(例如,圖1之編碼器或轉碼器)之任何音訊處理單元的音訊資料可包括PIM(及可選地連同其他元資料)以及音訊資料(例如編碼音訊資料)。此元資料已包括於由依據本新型之實施例之圖1系統的另一元件(或另一來源,圖1中未顯示)所輸入的音訊中。接收輸入音訊(具元資料)之處理單元可經組配以於元資料上實施至少一作業(例如驗證),或回應於元資料(例如,輸入音訊之自適應處理),且典型地亦將元資料、元資料之處理版本、或從元資料判定之控制位元包括於其輸出音訊中。
圖2為編碼器(100)之方塊圖,其係新型音訊處理單元之實施例。編碼器100之任何組件或元件可實施為以硬體、軟體、或硬體及軟體之組合的一或多個處理及/或一或多個電路(例如,ASIC、FPGA、或其他積體電路)。編碼器100包含訊框緩衝器110、剖析器111、解碼器101、音訊狀態驗證器102、響度處理級103、音訊流選擇級104、編碼器105、填充器/格式器級107、元資料產生級106、對話響度測量子系統108、及訊框緩衝器109,如所示連接。亦典型地,編碼器100包括其他處理元件(未顯示)。
編碼器100(其係轉碼器)經組配以將輸入音訊位元流(其可為例如AC-3位元流、E-AC-3位元流、或Dolby E位元流之一者)轉換為編碼輸出音訊位元流(其可為例如AC-3位元流、E-AC-3位元流、或Dolby E位元 流之另一者),包括實施自適應及使用輸入位元流中所包括之響度處理狀態元資料的自動響度處理。例如,編碼器100可經組配以將輸入Dolby E位元流(格式典型地用於產生及廣播設施但不在接收向其廣播之音訊節目的消費者裝置中)轉換為AC-3或E-AC-3格式之編碼輸出音訊位元流(適於廣播至消費者裝置)。
圖2之系統亦包括編碼音訊傳送子系統150(其儲存及/或傳送從編碼器100輸出之編碼位元流)及解碼器152。從編碼器100輸出的編碼音訊位元流可由子系統150儲存(例如,以DVD或藍光光碟之形式),或由子系統150傳輸(其可實施傳輸鏈路或網路),或可由子系統150儲存及傳輸。解碼器152經組配以解碼其經由子系統150接收之編碼音訊位元流(由編碼器100產生),包括從位元流之每一訊框提取元資料(PIM及可選地連同響度處理狀態元資料及/或其他元資料),並產生解碼音訊資料。典型地,解碼器152經組配以使用PIM於解碼音訊資料上實施自適應處理,及/或將解碼音訊資料及元資料轉發至後處理器,該後處理器經組配以使用元資料於解碼音訊資料上實施自適應處理。典型地,解碼器152包括緩衝器,其儲存(例如,以非短暫方式)從子系統150接收之編碼音訊位元流。
編碼器100及解碼器152之各式實施經組配以實施新型方法之不同實施例。
訊框緩衝器110為耦接以接收編碼輸入音訊 位元流的緩衝器記憶體。作業中,緩衝器110儲存(例如,以非短暫方式)編碼音訊位元流之至少一訊框,並從緩衝器110向剖析器111顯示編碼音訊位元流之一連串訊框。
剖析器111耦接並經組配以從其中包括元資料之編碼輸入音訊的每一訊框提取PIM,從編碼輸入音訊提取音訊資料,及將音訊資料顯示予解碼器101。編碼器100之解碼器101經組配以解碼音訊資料而產生解碼音訊資料,並將解碼音訊資料顯示予響度處理級103、音訊流選擇級104、子系統108,及典型地亦顯示予狀態驗證器102。
狀態驗證器102經組配以認證及驗證所顯示之元資料。在一些實施例中,元資料為已包括於輸入位元流中的資料方塊(或包括於其中)(例如,依據本新型之實施例)。方塊可包含加密散列(基於散列的信息認證碼(HMAC))用於處理元資料及/或相關音訊資料(從解碼器101提供予驗證器102)。於該些實施例中,可數位簽署資料方塊,使得下游音訊處理單元可相對簡單地認證及驗證處理狀態元資料。
狀態驗證器102將控制資料顯示予音訊流選擇級104、元資料產生器106、及對話響度測量子系統108,以指出驗證作業之結果。回應於控制資料,級104可選擇自適應處理響度處理級103之輸出或從解碼器101輸出之音訊資料(並傳送至編碼器105)。
編碼器100之級103經組配以依據解碼器101提取之元資料所指出的一或多個音訊資料特性,於從解碼器101輸出之解碼音訊資料上實施自適應響度處理。級103可為自適應變換域實時響度及動態範圍控制處理器。級103可接收使用者輸入(例如,使用者目標響度/動態範圍值或「dialnorm」值),或其他元資料輸入(例如,一或多個類型之第三方資料、追蹤資訊、識別符、專屬或標準資訊、使用者註解資料、使用者偏好資料等)及/或其他輸入(例如,來自指紋處理),並使用該等輸入以處理從解碼器101輸出之解碼音訊資料。級103可於單一音訊節目之解碼音訊資料(從解碼器101輸出)指示上實施自適應響度處理,並可回應於接收不同音訊節目之解碼音訊資料(從解碼器101輸出)指示而重置響度處理。
當來自驗證器102之控制位元指出元資料無效時,對話響度測量子系統108例如可使用解碼器101提取之元資料來操作以判定對話(或其他談話)之指示之解碼音訊之段(來自解碼器101)的響度。當來自驗證器102之控制位元指出元資料有效時,可於元資料指出先前判定之解碼音訊之對話(或其他談話)段(來自解碼器101)的響度時,停用對話響度測量子系統108的作業。子系統108可於單一音訊節目之解碼音訊資料指示上實施響度測量,並可回應於接收不同音訊節目的解碼音訊資料指示而重置測量。
有用的工具(例如,Dolby LM100響度尺) 存在用於方便及容易地測量音訊內容中對話的位準。實施新型APU(音訊處理單元)之一些實施例(例如,編碼器100之級108)以包括該等工具(或實施其功能)而測量音訊位元流之音訊內容的平均對話響度(例如,從編碼器100之解碼器101顯示解碼AC-3位元流予級108)。
若實施級108以測量音訊資料之真實平均對話響度,則測量可包括隔離主要包含談話之音訊內容段的步驟。接著依據響度測量演算法處理主要為談話之音訊段。對從AC-3位元流解碼之音訊資料而言,此演算法可為標準K加權響度測量(依據國際標準ITU-R BS.1770)。另一方面,可使用其他響度測量(例如,根據響度之心理模型者)。
元資料產生器106產生(及/或傳送至級107)元資料將由級107包括於編碼位元流中並從編碼器100輸出。元資料產生器106可將解碼器101及/或剖析器111提取(例如,當來自驗證器102之控制位元指出元資料為有效時)之元資料(及可選地連同PIM)傳送至級107,或產生新PIM及/或其他元資料並將新元資料顯示予級107(例如,當來自驗證器102之控制位元指出由解碼器101提取之元資料為無效時),或將解碼器101及/或剖析器111提取之元資料及新產生之元資料的組合顯示予級107。元資料產生器106可包括子系統108產生之響度資料,及至少一值指示子系統108實施之響度處理的類型。
元資料產生器106可產生保護位元(其可包含或包括基於散列的信息認證碼(HMAC)),其有助於編碼位元流中所包括之元資料及/或編碼位元流中所包括之相關音訊資料之解碼、認證、或驗證之至少一者。元資料產生器106可將該等保護位元提供予級107而包括於編碼位元流中。
在典型作業中,對話響度測量子系統108處理從解碼器101輸出之音訊資料以回應於此而產生響度值(例如,閘控及非閘控對話響度值)及動態範圍值。回應於該些值,元資料產生器106可產生響度處理狀態元資料而包括(藉由填充器/格式器107)於從編碼器100輸出之編碼位元流中。
編碼器105編碼(例如,於其上實施壓縮)從選擇級104輸出之音訊資料,並將編碼音訊顯示予級107而包括於從級107輸出之編碼位元流中。
級107多工處理來自編碼器105之編碼音訊及來自產生器106之元資料(包括PIM)以產生從級107輸出之編碼位元流,較佳地使得編碼位元流具有如本新型之較佳實施例指明之格式。
訊框緩衝器109為緩衝器記憶體,其儲存(例如,以非短暫方式)從級107輸出之編碼音訊位元流的至少一訊框,且編碼音訊位元流之訊框序列接著作為來自編碼器100之輸出從緩衝器109顯示予傳送系統150。
在編碼器100之一些實施中,記憶體109中 緩衝(及輸出至傳送系統150)的編碼位元流為AC-3位元流或E-AC-3位元流,並包含音訊資料段(例如,圖4中所示之訊框的AB0-AB5段)及元資料段,其中音訊資料段為音訊資料之指示,且至少一些元資料段之每一者包括PIM(及可選地連同其他元資料)。級107以下列格式將元資料段(包括元資料)插入位元流。元資料段之每一者包括位元流之廢棄位元段中所包括之PIM(亦稱為「跳過欄位」)(例如,圖4或圖7中所示之廢棄位元段「W」),或位元流之訊框之位元流資訊(「BSI」)段的「addbsi」欄位,或在位元流之訊框末端的輔助資料欄位中(例如,圖4或圖7中所示之AUX段)。位元流之訊框可包括一或二個元資料段,每一者包括元資料,若訊框包括二個元資料段,則一個可呈現於訊框之addbsi欄位中,另一個呈現於訊框之AUX欄位中。
在一些實施例中,由級107插入之每一元資料段(文中有時稱為「容器」)的格式包括元資料段標頭(及可選地連同其他強制性或「核心」元件)及元資料段標頭後之一或多個元資料酬載。若存在PIM,係包括元資料酬載之第一者中(由酬載標頭識別並典型地具有第一類型格式)。類似地,元資料(若存在)之每一其他類型係包括於元資料酬載之另一者中(由酬載標頭識別並典型地具有特定元資料類型格式)。示範格式允許於解碼期間之外方便存取PIM及其他元資料(例如,藉由解碼後之後處理器,或藉由處理器經組配以識別元資料而未在編碼位 元流上實施完全解碼),並允許於位元流之解碼期間方便及有效率地(例如,子串流確認)錯誤檢測及修正。元資料段中之一元資料酬載可包括PIM,元資料段中之另一元資料酬載可包括第二元資料類型,且元資料段中可選地至少一其他元資料酬載可包括其他元資料(例如,響度處理狀態元資料(LPSM))。
在一些實施例中,編碼位元流(例如,至少一音訊節目的AC-3位元流指示)之訊框中所包括(藉由級107)之節目資訊元資料(PIM)酬載具有下列格式:酬載標頭,典型地包括至少一確認值(例如,PIM格式版本之值指示,及可選地連同長度、時期、計數、及子串流關聯值);以及標頭之後,下列格式之PIM:現用通道元資料,指示音訊節目之每一無聲通道及每一非無聲通道(即節目之哪一通道包含音訊資訊及哪一通道(如有)僅包含無聲(典型地用於訊框期間))。在編碼位元流為AC-3或E-AC-3位元流之實施例中,位元流之訊框中之現用通道元資料可用以結合位元流之額外元資料(例如,訊框之音訊編碼模式(「acmod」)欄位及若存在之訊框或相關相依子串流訊框中之「chanmap」欄位)以判定節目之哪一通道包含音訊資訊及哪一通道包含無聲。AC-3或E-AC-3訊框之「acmod」欄位指出由訊框之音訊內容指出之音訊節目的全範圍通道數量(例如,節目是否為1.0通道單聲道節 目、2.0通道立體聲節目,或節目包含L(左)、R(右)、C(中央)、Ls(左環繞)、Rs(右環繞)全範圍通道),或指出訊框為二獨立1.0通道單聲道節目之指示。E-AC-3位元流之「chanmap」欄位指出由位元流指出之相依子串流的通道地圖。現用通道元資料可有助於實施上混(於後處理器中)解碼器之下游,例如於解碼器之輸出增加音訊至包含無聲之通道;降混處理狀態元資料,指示節目是否降混(編碼之前或期間),若然,則指示施加之降混類型。降混處理狀態元資料可有助於實施上混(於後處理器中)解碼器之下游,例如使用最匹配所施加降混類型之參數來上混節目之音訊內容。在編碼位元流為AC-3或E-AC-3位元流之實施例中,降混處理狀態元資料可用於結合訊框之音訊編碼模式(「acmod」)欄位,以判定施加於節目通道之降混類型(如有);上混處理狀態元資料,指示節目於編碼之前或期間是否上混(例如,從較少數量通道),若然,則指示施加之上混類型。上混處理狀態元資料可有助於實施降混(於後處理器中)解碼器之下游,例如以與施加於節目之上混類型相符之方式降混節目之音訊內容(例如,Dolby Pro Logic、或Dolby Pro Logic II電影模式、或Dolby Pro Logic II音樂模式、或Dolby Professional Upmixer)。在編碼位元流為E-AC-3位元流之實施例中,上混處理狀態元資料可用於結合其他元資料(例如,訊框 之「strmtyp」欄位值),以判定施加於節目通道之上混類型(如有)。「strmtyp」欄位值(在E-AC-3位元流之訊框的BSI段中)指出訊框之音訊內容是否屬於獨立流(其判定節目)或(包括或與多個子串流相關之節目的)獨立子串流,因而可獨立解碼由E-AC-3位元流指出之任何其他子串流,或指出訊框之音訊內容是否屬於(包括或與多個子串流相關之節目的)相依子串流,因而必須結合相關獨立子串流解碼;以及預處理狀態元資料,指示(在編碼音訊內容以產生編碼位元流之前)是否於訊框之音訊內容上實施預處理,若然,則指示實施之預處理類型。
在一些實施中,預處理狀態元資料指示:是否施加環繞衰減(例如,音訊節目之環繞通道是否於編碼之前衰減3 dB),是否施加90度相位偏移(例如,編碼之前音訊節目之環繞通道-Ls及Rs通道),編碼之前,音訊節目之LFE(低頻效應)通道是否施加低通濾波器,產生期間是否監控節目之LFE通道位準,若然,節目之LFE通道之監控位準相對於全範圍音訊通道之位準,是否於節目之解碼音訊內容的每一方塊上實施動態範圍壓縮(例如,在解碼器中),若然,則指示將實施之動態範圍壓縮的類型(及/或參數)(例如,此預 處理狀態元資料類型可指示編碼器假定下列壓縮設定檔類型之哪一者,以產生編碼位元流中所包括之動態範圍壓縮控制值:影片標準、影片燈光、音樂標準、音樂燈光、或談話。另一方面,此預處理狀態元資料類型可指出將以編碼位元流中所包括之動態範圍壓縮控制值所判定的方式,於節目之解碼音訊內容的每一訊框上實施重動態範圍壓縮(「compr(壓縮)」壓縮),是否採用頻譜擴展處理及/或通道耦接編碼,以編碼節目之內容的特定頻率範圍,若然,則指示其上實施頻譜擴展編碼之內容之頻率分量的最小及最大頻率,及其上實施通道耦接編碼之內容之頻率分量的最小及最大頻率。此預處理狀態元資料資訊類型可有助於實施等化(於後處理器中)解碼器之下游。通道耦接及頻譜擴展資訊亦有助於使轉碼作業及應用期間品質優化。例如,編碼器可依據參數狀態,諸如頻譜擴展及通道耦接資訊,使其行為優化(包括調適預處理步驟,諸如頭戴式耳機虛擬化、上混等)。再者,編碼器可動態調適其耦接及頻譜擴展參數以根據入站(及認證)元資料之狀態而匹配及/或使值優化,以及對話增強調整範圍資料是否包括於編碼位元流中,若然,則指示對話增強處理實施期間可用調整範圍(例如,在解碼器之後處理器下游),以調整音訊節目中相對於非對話內容位準之對話內容位準。
在一些實施中,從編碼器100輸出之編碼位 元流的PIM酬載包括(藉由級107)額外預處理狀態元資料(例如,頭戴式耳機相關參數之元資料指示)。
每一元資料酬載依循對應酬載ID及酬載組態值。
在一些實施例中,訊框之廢棄位元/跳過欄位段(或輔助資料欄位或「addbsi」欄位)中之每一元資料段具有三結構位準:高位準結構(例如,元資料段標頭),包括旗標,指出廢棄位元(或輔助資料或「addbsi」)欄位是否包括元資料;至少一ID值,指出存在哪一元資料類型;及典型地連同一值,指出(若元資料存在)存在多少元資料位元(例如,每一類型)。可存在一元資料類型為PIM,可存在另一元資料類型為LPSM;中間位準結構,包含與每一識別之元資料類型相關聯之資料(例如,每一識別之元資料類型的元資料酬載標頭、保護值、及酬載ID及酬載組態值);以及低位準結構,包含每一識別之元資料類型的元資料酬載(例如,若PIM經識別為存在,則為一連串PIM值,及/或若其他元資料類型經識別為存在,則為另一類型(例如,LPSM)之元資料值)。
可套入該等三位準結構中之資料值。例如,藉由高及中間位準結構識別之每一酬載之保護值(例如,每一PIM或其他元資料酬載)可包括於酬載之後(因而在酬載之元資料酬載標頭之後),或藉由高及中間位準結 構識別之所有元資料酬載的保護值可包括於元資料段中最後元資料酬載之後(因而在元資料段之所有酬載的元資料酬載標頭之後)。
在一範例(將參照圖8之元資料段或「容器」說明)中,元資料段標頭識別四元資料酬載。如圖8中所示,元資料段標頭包含容器同步字(識別為「容器同步」)及版本及主要ID值。元資料段標頭之後為四元資料酬載及保護位元。第一酬載(例如,PIM酬載)之酬載ID及酬載組態(例如,酬載尺寸)值在元資料段標頭之後,第一酬載本身在ID及組態值之後,第二酬載(例如,PIM酬載)之酬載ID及酬載組態(例如,酬載尺寸)值在第一酬載之後,第二酬載本身在該些ID及組態值之後,第三酬載(例如,響度處理狀態元資料酬載)之酬載ID及酬載組態(例如,酬載尺寸)值在第二酬載之後,第三酬載本身在該些ID及組態值之後,第四酬載之酬載ID及酬載組態(例如,酬載尺寸)值在第三酬載之後,第四酬載本身在該些ID及組態值之後,及所有或一些酬載(或高及中間位準結構及所有或一些酬載)的保護值(識別為圖8中之「保護資料」)在最後酬載之後。
圖3為解碼器(200)之方塊圖,其係新穎的音訊處理單元及所耦接之後處理器(300)的實施例。後處理器(300)亦為新型音訊處理單元之實施例。解碼器200及後處理器300之任何組件或元件可以硬體、軟體、或硬體及軟體之組合實施為一或多個程序及/或一或多個 電路(例如,ASIC、FPGA、或其他積體電路)。解碼器200包含如所示連接之訊框緩衝器201、剖析器205、音訊解碼器202、音訊狀態驗證級(驗證器)203、及控制位元產生級204。典型地,解碼器200包括其他處理元件(未顯示)。
訊框緩衝器201(緩衝器記憶體)儲存(例如,以非短暫方式)解碼器200所接收之編碼音訊位元流的至少一訊框。編碼音訊位元流的一連串訊框從緩衝器201顯示予剖析器205。
剖析器205經耦接並經組配以從編碼輸入音訊之每一訊框提取PIM(及可選地連同其他元資料),以顯示至少一些元資料(例如,PIM)予音訊狀態驗證器203及級204,將提取之元資料作為輸出而顯示(例如,予後處理器300),從編碼輸入音訊提取音訊資料,及將提取之音訊資料顯示予解碼器202。
輸入至解碼器200之編碼音訊位元流可為AC-3位元流、E-AC-3位元流、或Dolby E位元流之一者。
圖3之系統亦包括後處理器300。後處理器300包含訊框緩衝器301及包括耦接至緩衝器301之至少一處理元件的其他處理元件(未顯示)。訊框緩衝器301儲存(例如,以非短暫方式)後處理器300從解碼器200接收之解碼音訊位元流的至少一訊框。後處理器300之處理元件經耦接並經組配以接收及使用解碼器200輸出之元 資料及/或從解碼器200之級204輸出的控制位元,而自適應處理從緩衝器301輸出之解碼音訊位元流的一連串訊框。典型地,後處理器300經組配以使用來自解碼器200之元資料而於解碼音訊資料上實施自適應處理(例如,使用元資料值於解碼音訊資料上自適應響度處理,其中自適應處理可根據響度處理狀態,及/或藉由單一音訊節目之音訊資料指示的元資料所指出的一或多個音訊資料特性)。
解碼器200及後處理器300之各式實施經組配以實施新型方法之不同實施例。
在解碼器200之一些實施中,所接收(及記憶體201中所緩衝)之編碼位元流為AC-3位元流或E-AC-3位元流,並包含音訊資料段(例如,圖4中所示之訊框的AB0-AB5段)及元資料段,其中音訊資料段為音訊資料之指示,且至少一些元資料段之每一者包括PIM(或其他元資料)。解碼器級202(及/或剖析器205)經組配以從位元流提取元資料。包括PIM(及可選地連同其他元資料)之每一元資料段係包括於位元流之訊框的廢棄位元段、位元流之訊框之位元流資訊(「BSI」)段的「addbsi」欄位、或位元流之訊框末端的輔助資料欄位(例如,圖4中所示之AUX段)中。位元流之訊框可包括一或二元資料段,其每一者包括元資料,且若訊框包括二元資料段,則其一者可存在於訊框之「addbsi」欄位中,另一者存在於訊框之AUX欄位欄位中。
本新型之實施例可以硬體、韌體、或軟體、 或二者之組合(例如,可程控邏輯陣列)實施。此外,文中所說明之音訊處理單元可為各式通訊裝置之一部分及/或與其整合,諸如電視、行動電話、個人電腦、平板電腦、膝上型電腦、機上盒、及音訊/視訊接收器。除非指明,包括作為本新型之一部分的演算法或處理並非固有關於任何特定電腦或其他設備。尤其,各式通用機器可用於依據文中提及而書寫之程式,或其可更方便組建更專用設備(例如,積體電路)以實施所需方法步驟。因而,本新型可以在一或多個可程控電腦系統(例如,圖1之任何元件之實施、或圖2之編碼器100(或其元件)、或圖3之解碼器200(或其元件)、或圖3之後處理器300(或其元件))上執行的一或多個電腦程式實施,該些電腦系統各包含至少一處理器、至少一資料儲存系統(包括揮發性及非揮發性記憶體及/或儲存元件)、至少一輸入裝置或埠、及至少一輸出裝置或埠。程式碼施加於輸入資料以實施文中所說明之功能並產生輸出資訊。輸出資訊以已知方式施加於一或多個輸出裝置。
每一該等程式可以任何所欲電腦語言實施(包括機器、組合、或高階程序、邏輯、或物件導向程式語言)以與電腦系統通訊。在任何狀況下,語言可為編譯或直譯語言。
例如,當由電腦軟體指令序列實施時,本新型之實施例的各式功能及步驟可藉由在適當數位信號處理硬體中運行之多線程軟體指令序列實施,在此狀況下,實 施例之各式裝置、步驟、及功能可對應於軟體指令部分。
每一該等電腦程式較佳地儲存或下載至可由通用或專用可程控電腦讀取之儲存媒體或裝置(例如,固態記憶體或媒體,或磁性或光學媒體),當儲存媒體或裝置由電腦系統讀取時,用於組配及操作電腦以實施文中所說明之程序。新型系統亦可實施為與電腦程式組配(即儲存)之電腦可讀取儲存媒體,其中儲存媒體被組配致使電腦系統以特定及預定方式操作而實施文中所說明之功能。
已說明本新型之一些實施例。然而,將理解的是可實施各式修改而不偏離本新型之精神及範圍。鑒於上述,本新型的許多修改及變化是可能的。應理解的是,在申請專利範圍範疇內,本新型之實施不限於此處所說明之實施方式。
200‧‧‧解碼器
203‧‧‧音訊狀態驗證器
201、301‧‧‧訊框緩衝器
205‧‧‧剖析器
204‧‧‧控制位元產生級
202‧‧‧音訊解碼器
300‧‧‧後處理器

Claims (20)

  1. 一種電子裝置,包含:介面,用於接收編碼音訊之訊框,其中,該訊框包含位於該訊框之跳過欄位中的節目資訊元資料及位於該跳過欄位外的編碼音訊資料;緩衝器,耦接至該介面,用於暫時儲存該訊框;剖析器,耦接至該緩衝器,用於從該訊框提取該編碼音訊資料;以及杜比數位(AC-3)音訊解碼器,耦接至該剖析器或與該剖析器整合,用於從該編碼音訊資料產生解碼音訊。
  2. 如申請專利範圍第1項之電子裝置,其中,該節目資訊元資料包含元資料之酬載,且該酬載包括標頭,及該標頭後之至少一些該節目資訊元資料。
  3. 如申請專利範圍第1項之電子裝置,其中,該編碼音訊為音訊節目之指示,且該節目資訊元資料為該音訊節目之音訊內容之至少一屬性或特性的指示。
  4. 如申請專利範圍第3項之電子裝置,其中,該節目資訊元資料包括現用通道元資料,其為該音訊節目之每一非無聲通道及每一無聲通道的指示。
  5. 如申請專利範圍第3項之電子裝置,其中,該節目資訊元資料包括降混處理狀態元資料,其為該音訊節目是否降混的指示,以及若然,並為施加於該音訊節目之降混類型的指示。
  6. 如申請專利範圍第3項之電子裝置,其中,該節目 資訊元資料包括上混處理狀態元資料,其為該音訊節目是否上混的指示,以及若然,並為施加於該音訊節目之上混類型的指示。
  7. 如申請專利範圍第3項之電子裝置,其中,該節目資訊元資料包括預處理狀態元資料,其為該訊框之音訊內容上是否實施預處理的指示,以及若然,並為該音訊內容上所實施之預處理類型的指示。
  8. 如申請專利範圍第3項之電子裝置,其中,該節目資訊元資料包括頻譜擴展處理或通道耦接元資料,其為頻譜擴展處理或通道耦接是否施加於該音訊節目的指示,以及若然,並為所施加的該頻譜擴展處理或該通道耦接之頻率範圍的指示。
  9. 如申請專利範圍第1項之電子裝置,其中,該編碼音訊為AC-3位元流。
  10. 如申請專利範圍第1項之電子裝置,進一步包含耦接至該杜比數位(AC-3)音訊解碼器之後處理器,其中,該後處理器經組配以於該解碼音訊上實施自適應處理。
  11. 一種音訊處理設備,包含:輸入緩衝器記憶體,用於儲存包含節目資訊元資料及音訊資料之編碼音訊位元流的至少一訊框;剖析器,耦接至該輸入緩衝器記憶體,用於提取該音訊資料及/或該節目資訊元資料;AC-3或杜比數位加強(E-AC-3)解碼器,耦接至該剖析器或與該剖析器整合,用於產生解碼音訊資料;以及 輸出緩衝器記憶體,耦接至該解碼器,用於儲存該解碼音訊資料。
  12. 如申請專利範圍第11項之音訊處理設備,其中,該節目資訊元資料包含元資料之酬載,且該酬載包括標頭,及該標頭後之至少一些該節目資訊元資料。
  13. 如申請專利範圍第12項之音訊處理設備,其中,該編碼音訊位元流為音訊節目之指示,且該節目資訊元資料為該音訊節目之音訊內容之至少一屬性或特性的指示。
  14. 如申請專利範圍第13項之音訊處理設備,其中,該節目資訊元資料包括現用通道元資料,其為該音訊節目之每一非無聲通道及每一無聲通道的指示。
  15. 如申請專利範圍第13項之音訊處理設備,其中,該節目資訊元資料包括降混處理狀態元資料,其為該音訊節目是否降混的指示,以及若然,並為施加於該音訊節目之降混類型的指示。
  16. 如申請專利範圍第13項之音訊處理設備,其中,該節目資訊元資料包括上混處理狀態元資料,其為該音訊節目是否上混的指示,以及若然,並為施加於該音訊節目之上混類型的指示。
  17. 如申請專利範圍第13項之音訊處理設備,其中,該節目資訊元資料包括預處理狀態元資料,其為該訊框之音訊內容上是否實施預處理的指示,以及若然,並為該音訊內容上所實施之預處理類型的指示。
  18. 如申請專利範圍第13項之音訊處理設備,其中, 該節目資訊元資料包括頻譜擴展處理或通道耦接元資料,其為頻譜擴展處理或通道耦接是否施加於該音訊節目的指示,以及若然,並為所施加的該頻譜擴展處理或該通道耦接之頻率範圍的指示。
  19. 如申請專利範圍第13項之音訊處理設備,其中,該編碼音訊位元流為AC-3位元流。
  20. 如申請專利範圍第13項之音訊處理設備,其中,該音訊處理設備為選自下列群組之通訊裝置,該群組包含電視、行動電話、個人電腦、平板電腦、膝上型電腦、機上盒、及音訊/視訊接收器。
TW102211969U 2013-06-19 2013-06-26 音訊處理設備及電子裝置 TWM487509U (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201361836865P 2013-06-19 2013-06-19

Publications (1)

Publication Number Publication Date
TWM487509U true TWM487509U (zh) 2014-10-01

Family

ID=49112574

Family Applications (11)

Application Number Title Priority Date Filing Date
TW102211969U TWM487509U (zh) 2013-06-19 2013-06-26 音訊處理設備及電子裝置
TW103118801A TWI553632B (zh) 2013-06-19 2014-05-29 音訊處理單元與解碼編碼音訊位元流的方法
TW112101558A TWI831573B (zh) 2013-06-19 2014-05-29 音訊處理單元與音訊處理的方法
TW107136571A TWI708242B (zh) 2013-06-19 2014-05-29 音訊處理單元與音訊處理的方法
TW110102543A TWI756033B (zh) 2013-06-19 2014-05-29 音訊處理單元與音訊處理的方法
TW111102327A TWI790902B (zh) 2013-06-19 2014-05-29 音訊處理單元與音訊處理的方法
TW106111574A TWI613645B (zh) 2013-06-19 2014-05-29 音訊處理單元與解碼編碼音訊位元流的方法
TW109121184A TWI719915B (zh) 2013-06-19 2014-05-29 音訊處理單元與音訊處理的方法
TW105119766A TWI588817B (zh) 2013-06-19 2014-05-29 音訊處理單元與解碼編碼音訊位元流的方法
TW106135135A TWI647695B (zh) 2013-06-19 2014-05-29 音訊處理單元與解碼編碼音訊位元流的方法
TW105119765A TWI605449B (zh) 2013-06-19 2014-05-29 音訊處理單元與解碼編碼音訊位元流的方法

Family Applications After (10)

Application Number Title Priority Date Filing Date
TW103118801A TWI553632B (zh) 2013-06-19 2014-05-29 音訊處理單元與解碼編碼音訊位元流的方法
TW112101558A TWI831573B (zh) 2013-06-19 2014-05-29 音訊處理單元與音訊處理的方法
TW107136571A TWI708242B (zh) 2013-06-19 2014-05-29 音訊處理單元與音訊處理的方法
TW110102543A TWI756033B (zh) 2013-06-19 2014-05-29 音訊處理單元與音訊處理的方法
TW111102327A TWI790902B (zh) 2013-06-19 2014-05-29 音訊處理單元與音訊處理的方法
TW106111574A TWI613645B (zh) 2013-06-19 2014-05-29 音訊處理單元與解碼編碼音訊位元流的方法
TW109121184A TWI719915B (zh) 2013-06-19 2014-05-29 音訊處理單元與音訊處理的方法
TW105119766A TWI588817B (zh) 2013-06-19 2014-05-29 音訊處理單元與解碼編碼音訊位元流的方法
TW106135135A TWI647695B (zh) 2013-06-19 2014-05-29 音訊處理單元與解碼編碼音訊位元流的方法
TW105119765A TWI605449B (zh) 2013-06-19 2014-05-29 音訊處理單元與解碼編碼音訊位元流的方法

Country Status (24)

Country Link
US (7) US10037763B2 (zh)
EP (3) EP2954515B1 (zh)
JP (8) JP3186472U (zh)
KR (7) KR200478147Y1 (zh)
CN (10) CN203415228U (zh)
AU (1) AU2014281794B9 (zh)
BR (6) BR122020017897B1 (zh)
CA (1) CA2898891C (zh)
CL (1) CL2015002234A1 (zh)
DE (1) DE202013006242U1 (zh)
ES (2) ES2777474T3 (zh)
FR (1) FR3007564B3 (zh)
HK (3) HK1204135A1 (zh)
IL (1) IL239687A (zh)
IN (1) IN2015MN01765A (zh)
MX (5) MX2021012890A (zh)
MY (2) MY192322A (zh)
PL (1) PL2954515T3 (zh)
RU (4) RU2619536C1 (zh)
SG (3) SG10201604617VA (zh)
TR (1) TR201808580T4 (zh)
TW (11) TWM487509U (zh)
UA (1) UA111927C2 (zh)
WO (1) WO2014204783A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI774090B (zh) * 2019-11-15 2022-08-11 美商博姆雲360公司 動態顯現裝置元資料資訊音頻增強系統

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CN109920440B (zh) 2013-09-12 2024-01-09 杜比实验室特许公司 用于各种回放环境的动态范围控制
US9621963B2 (en) 2014-01-28 2017-04-11 Dolby Laboratories Licensing Corporation Enabling delivery and synchronization of auxiliary content associated with multimedia data using essence-and-version identifier
SG11201607940WA (en) * 2014-03-25 2016-10-28 Fraunhofer Ges Forschung Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
US10313720B2 (en) 2014-07-18 2019-06-04 Sony Corporation Insertion of metadata in an audio stream
WO2016039287A1 (ja) * 2014-09-12 2016-03-17 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
EP3193330B1 (en) * 2014-09-12 2024-10-30 Sony Group Corporation Transmission device, transmission method, reception device, and reception method
EP3736809B1 (en) 2014-10-01 2022-03-09 Dolby International AB Decoding an encoded audio signal using drc profiles
JP6412259B2 (ja) * 2014-10-03 2018-10-24 ドルビー・インターナショナル・アーベー パーソナル化されたオーディオへのスマート・アクセス
JP6812517B2 (ja) * 2014-10-03 2021-01-13 ドルビー・インターナショナル・アーベー パーソナル化されたオーディオへのスマート・アクセス
CN112185402B (zh) * 2014-10-10 2024-06-04 杜比实验室特许公司 基于发送无关的表示的节目响度
US10523731B2 (en) 2014-10-20 2019-12-31 Lg Electronics Inc. Apparatus for transmitting broadcast signal, apparatus for receiving broadcast signal, method for transmitting broadcast signal and method for receiving broadcast signal
TWI631835B (zh) * 2014-11-12 2018-08-01 弗勞恩霍夫爾協會 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器
CN107211200B (zh) 2015-02-13 2020-04-17 三星电子株式会社 用于发送/接收媒体数据的方法和设备
US10217471B2 (en) * 2015-02-14 2019-02-26 Samsung Electronics Co., Ltd. Method and apparatus for decoding audio bitstream including system data
TWI771266B (zh) 2015-03-13 2022-07-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10304467B2 (en) 2015-04-24 2019-05-28 Sony Corporation Transmission device, transmission method, reception device, and reception method
MX2017016333A (es) 2015-06-17 2018-04-24 Fraunhofer Ges Forschung Control de intensidad subjetiva para interaccion del usuario en sistemas de codificacion de audio.
TWI607655B (zh) * 2015-06-19 2017-12-01 Sony Corp Coding apparatus and method, decoding apparatus and method, and program
US9934790B2 (en) 2015-07-31 2018-04-03 Apple Inc. Encoded audio metadata-based equalization
US10140822B2 (en) 2015-08-05 2018-11-27 Dolby Laboratories Licensing Corporation Low bit rate parametric encoding and transport of haptic-tactile signals
US10341770B2 (en) 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC
US9691378B1 (en) * 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
CN105468711A (zh) * 2015-11-19 2016-04-06 中央电视台 一种音频处理方法及装置
US10573324B2 (en) 2016-02-24 2020-02-25 Dolby International Ab Method and system for bit reservoir control in case of varying metadata
CN105828272A (zh) * 2016-04-28 2016-08-03 乐视控股(北京)有限公司 音频信号处理方法和装置
US10015612B2 (en) * 2016-05-25 2018-07-03 Dolby Laboratories Licensing Corporation Measurement, verification and correction of time alignment of multiple audio channels and associated metadata
CN117037807A (zh) 2017-01-10 2023-11-10 弗劳恩霍夫应用研究促进协会 音频解码器和编码器、提供解码的音频信号的方法、提供编码的音频信号的方法、使用流标识符的音频流、音频流提供器和计算机程序
US10878879B2 (en) * 2017-06-21 2020-12-29 Mediatek Inc. Refresh control method for memory system to perform refresh action on all memory banks of the memory system within refresh window
US11232805B2 (en) 2018-02-22 2022-01-25 Dolby International Ab Method and apparatus for processing of auxiliary media streams embedded in a MPEGH 3D audio stream
CN108616313A (zh) * 2018-04-09 2018-10-02 电子科技大学 一种基于超声波的旁路信息安全隐蔽传送方法
US10937434B2 (en) * 2018-05-17 2021-03-02 Mediatek Inc. Audio output monitoring for failure detection of warning sound playback
KR102486256B1 (ko) 2018-06-26 2023-01-06 후아웨이 테크놀러지 컴퍼니 리미티드 포인트 클라우드 코딩을 위한 하이-레벨 신택스 설계
EP3821430A1 (en) * 2018-07-12 2021-05-19 Dolby International AB Dynamic eq
CN109284080B (zh) * 2018-09-04 2021-01-05 Oppo广东移动通信有限公司 音效调整方法、装置、电子设备以及存储介质
JP7455836B2 (ja) * 2018-12-13 2024-03-26 ドルビー ラボラトリーズ ライセンシング コーポレイション デュアルエンドのメディア・インテリジェンス
WO2020164752A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transmitter processor, audio receiver processor and related methods and computer programs
GB2582910A (en) * 2019-04-02 2020-10-14 Nokia Technologies Oy Audio codec extension
CN114303190A (zh) * 2019-08-15 2022-04-08 杜比国际公司 用于生成和处理经修改的音频比特流的方法和设备
US20220319526A1 (en) * 2019-08-30 2022-10-06 Dolby Laboratories Licensing Corporation Channel identification of multi-channel audio signals
US11380344B2 (en) 2019-12-23 2022-07-05 Motorola Solutions, Inc. Device and method for controlling a speaker according to priority data
CN112634907B (zh) * 2020-12-24 2024-05-17 百果园技术(新加坡)有限公司 用于语音识别的音频数据处理方法及装置
CN113990355A (zh) * 2021-09-18 2022-01-28 赛因芯微(北京)电子科技有限公司 音频节目元数据和产生方法、电子设备及存储介质
CN114051194A (zh) * 2021-10-15 2022-02-15 赛因芯微(北京)电子科技有限公司 一种音频轨道元数据和生成方法、电子设备及存储介质
US20230117444A1 (en) * 2021-10-19 2023-04-20 Microsoft Technology Licensing, Llc Ultra-low latency streaming of real-time media
CN114363791A (zh) * 2021-11-26 2022-04-15 赛因芯微(北京)电子科技有限公司 串行音频元数据生成方法、装置、设备及存储介质
WO2023205025A2 (en) * 2022-04-18 2023-10-26 Dolby Laboratories Licensing Corporation Multisource methods and systems for coded media

Family Cites Families (131)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
JPH0746140Y2 (ja) 1991-05-15 1995-10-25 岐阜プラスチック工業株式会社 かん水栽培方法において使用する水位調整タンク
JPH0746140A (ja) * 1993-07-30 1995-02-14 Toshiba Corp 符号化装置及び復号化装置
US6611607B1 (en) * 1993-11-18 2003-08-26 Digimarc Corporation Integrating digital watermarks in multimedia content
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
JP3186472B2 (ja) 1994-10-04 2001-07-11 キヤノン株式会社 ファクシミリ装置およびその記録紙選択方法
US7224819B2 (en) * 1995-05-08 2007-05-29 Digimarc Corporation Integrating digital watermarks in multimedia content
JPH11234068A (ja) 1998-02-16 1999-08-27 Mitsubishi Electric Corp ディジタル音声放送受信機
JPH11330980A (ja) * 1998-05-13 1999-11-30 Matsushita Electric Ind Co Ltd 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体
US6530021B1 (en) * 1998-07-20 2003-03-04 Koninklijke Philips Electronics N.V. Method and system for preventing unauthorized playback of broadcasted digital data streams
JP3580777B2 (ja) * 1998-12-28 2004-10-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号又はビットストリームの符号化又は復号化のための方法及び装置
US6909743B1 (en) 1999-04-14 2005-06-21 Sarnoff Corporation Method for generating and processing transition streams
US8341662B1 (en) * 1999-09-30 2012-12-25 International Business Machine Corporation User-controlled selective overlay in a streaming media
AU2001229402A1 (en) * 2000-01-13 2001-07-24 Digimarc Corporation Authenticating metadata and embedding metadata in watermarks of media signals
US7450734B2 (en) * 2000-01-13 2008-11-11 Digimarc Corporation Digital asset management, targeted searching and desktop searching using digital watermarks
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US8091025B2 (en) * 2000-03-24 2012-01-03 Digimarc Corporation Systems and methods for processing content objects
US7392287B2 (en) * 2001-03-27 2008-06-24 Hemisphere Ii Investment Lp Method and apparatus for sharing information using a handheld device
GB2373975B (en) 2001-03-30 2005-04-13 Sony Uk Ltd Digital audio signal processing
US6807528B1 (en) * 2001-05-08 2004-10-19 Dolby Laboratories Licensing Corporation Adding data to a compressed data frame
AUPR960601A0 (en) * 2001-12-18 2002-01-24 Canon Kabushiki Kaisha Image protection
US7535913B2 (en) * 2002-03-06 2009-05-19 Nvidia Corporation Gigabit ethernet adapter supporting the iSCSI and IPSEC protocols
JP3666463B2 (ja) * 2002-03-13 2005-06-29 日本電気株式会社 光導波路デバイスおよび光導波路デバイスの製造方法
EP1491033A1 (en) * 2002-03-27 2004-12-29 Koninklijke Philips Electronics N.V. Watermarking a digital object with a digital signature
JP4355156B2 (ja) 2002-04-16 2009-10-28 パナソニック株式会社 画像復号化方法及び画像復号化装置
US7072477B1 (en) 2002-07-09 2006-07-04 Apple Computer, Inc. Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US7398207B2 (en) * 2003-08-25 2008-07-08 Time Warner Interactive Video Group, Inc. Methods and systems for determining audio loudness levels in programming
CA2562137C (en) 2004-04-07 2012-11-27 Nielsen Media Research, Inc. Data insertion apparatus and methods for use with compressed audio/video data
GB0407978D0 (en) * 2004-04-08 2004-05-12 Holset Engineering Co Variable geometry turbine
US8131134B2 (en) * 2004-04-14 2012-03-06 Microsoft Corporation Digital media universal elementary stream
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7624021B2 (en) 2004-07-02 2009-11-24 Apple Inc. Universal container for audio data
EP2262108B1 (en) * 2004-10-26 2017-03-01 Dolby Laboratories Licensing Corporation Adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8199933B2 (en) * 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US9639554B2 (en) * 2004-12-17 2017-05-02 Microsoft Technology Licensing, Llc Extensible file system
US7729673B2 (en) 2004-12-30 2010-06-01 Sony Ericsson Mobile Communications Ab Method and apparatus for multichannel signal limiting
CN101156208B (zh) * 2005-04-07 2010-05-19 松下电器产业株式会社 记录媒体、再现装置、记录方法、再现方法
EP1873775A4 (en) * 2005-04-07 2009-10-14 Panasonic Corp RECORDING MEDIUM, PLAYING DEVICE, RECORDING METHOD AND PLAYBACK PROCESS
TW200638335A (en) * 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
KR20070025905A (ko) * 2005-08-30 2007-03-08 엘지전자 주식회사 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법
CN101292428B (zh) * 2005-09-14 2013-02-06 Lg电子株式会社 用于编码/解码的方法和装置
BRPI0520718A2 (pt) * 2005-12-05 2009-05-26 Thomson Licensing inserir marca d'água em conteúdo codificado
US8929870B2 (en) * 2006-02-27 2015-01-06 Qualcomm Incorporated Methods, apparatus, and system for venue-cast
US8244051B2 (en) * 2006-03-15 2012-08-14 Microsoft Corporation Efficient encoding of alternative graphic sets
US20080025530A1 (en) 2006-07-26 2008-01-31 Sony Ericsson Mobile Communications Ab Method and apparatus for normalizing sound playback loudness
US8948206B2 (en) * 2006-08-31 2015-02-03 Telefonaktiebolaget Lm Ericsson (Publ) Inclusion of quality of service indication in header compression channel
MX2009003564A (es) * 2006-10-16 2009-05-28 Fraunhofer Ges Forschung Aparato y metodo para transformacion de parametro multicanal.
BRPI0802613A2 (pt) * 2007-02-14 2011-08-30 Lg Electronics Inc métodos e aparelhos para codificação e decodificação de sinais de áudio baseados em objeto
BRPI0807703B1 (pt) * 2007-02-26 2020-09-24 Dolby Laboratories Licensing Corporation Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador
EP3712888B1 (en) * 2007-03-30 2024-05-08 Electronics and Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
WO2008123709A1 (en) * 2007-04-04 2008-10-16 Humax Co., Ltd. Bitstream decoding device and method having decoding solution
JP4750759B2 (ja) * 2007-06-25 2011-08-17 パナソニック株式会社 映像音声再生装置
US7961878B2 (en) * 2007-10-15 2011-06-14 Adobe Systems Incorporated Imparting cryptographic information in network communications
EP2083585B1 (en) * 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
US9143329B2 (en) * 2008-01-30 2015-09-22 Adobe Systems Incorporated Content integrity and incremental security
KR20100131467A (ko) * 2008-03-03 2010-12-15 노키아 코포레이션 복수의 오디오 채널들을 캡쳐하고 렌더링하는 장치
US20090253457A1 (en) * 2008-04-04 2009-10-08 Apple Inc. Audio signal processing for certification enhancement in a handheld wireless communications device
KR100933003B1 (ko) * 2008-06-20 2009-12-21 드리머 Bd-j 기반 채널 서비스 제공 방법 및 이를 실현시키기위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8315396B2 (en) 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
CN102113312B (zh) * 2008-07-29 2013-07-17 Lg电子株式会社 用于处理音频信号的方法和设备
JP2010081397A (ja) 2008-09-26 2010-04-08 Ntt Docomo Inc データ受信端末、データ配信サーバ、データ配信システム、およびデータ配信方法
JP2010082508A (ja) 2008-09-29 2010-04-15 Sanyo Electric Co Ltd 振動モータおよびそれを用いた携帯端末装置
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
CN102203854B (zh) * 2008-10-29 2013-01-02 杜比国际公司 使用预先存在的音频增益元数据的信号削波保护
JP2010135906A (ja) 2008-12-02 2010-06-17 Sony Corp クリップ防止装置及びクリップ防止方法
EP2205007B1 (en) * 2008-12-30 2019-01-09 Dolby International AB Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
KR20100089772A (ko) * 2009-02-03 2010-08-12 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
US8302047B2 (en) * 2009-05-06 2012-10-30 Texas Instruments Incorporated Statistical static timing analysis in non-linear regions
WO2010143088A1 (en) * 2009-06-08 2010-12-16 Nds Limited Secure association of metadata with content
EP2309497A3 (en) * 2009-07-07 2011-04-20 Telefonaktiebolaget LM Ericsson (publ) Digital audio signal processing system
TWI405107B (zh) 2009-10-09 2013-08-11 Egalax Empia Technology Inc 分析位置的方法與裝置
PL2489038T3 (pl) * 2009-11-20 2016-07-29 Fraunhofer Ges Forschung Urządzenie do dostarczania reprezentacji sygnału upmixu na bazie reprezentacji sygnału downmixu, urządzenie do dostarczania strumienia bitów reprezentującego wielokanałowy sygnał audio, sposoby, programy komputerowe i strumień bitów reprezentujący wielokanałowy sygnał audio z zastosowaniem parametru kombinacji liniowej
RS53288B (en) * 2009-12-07 2014-08-29 Dolby Laboratories Licensing Corporation DECODE CODED BIT FLOWS FROM MULTIPLE AUDIO CHANNELS BY USING ADAPTIVE HYBRID TRANSFORMATIONS
TWI529703B (zh) * 2010-02-11 2016-04-11 杜比實驗室特許公司 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
TWI443646B (zh) * 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
TWI525987B (zh) * 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
EP2381574B1 (en) 2010-04-22 2014-12-03 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an input audio signal
WO2011141772A1 (en) * 2010-05-12 2011-11-17 Nokia Corporation Method and apparatus for processing an audio signal based on an estimated loudness
US8948406B2 (en) * 2010-08-06 2015-02-03 Samsung Electronics Co., Ltd. Signal processing method, encoding apparatus using the signal processing method, decoding apparatus using the signal processing method, and information storage medium
WO2012026092A1 (ja) * 2010-08-23 2012-03-01 パナソニック株式会社 音声信号処理装置及び音声信号処理方法
JP5903758B2 (ja) 2010-09-08 2016-04-13 ソニー株式会社 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8908874B2 (en) * 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
RU2553084C2 (ru) * 2010-10-07 2015-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для оценки уровня кодированных аудио кадров в области битового потока
TWI581250B (zh) * 2010-12-03 2017-05-01 杜比實驗室特許公司 利用多媒體處理節點之適應性處理技術
US8989884B2 (en) 2011-01-11 2015-03-24 Apple Inc. Automatic audio configuration based on an audio output device
CN102610229B (zh) * 2011-01-21 2013-11-13 安凯(广州)微电子技术有限公司 一种音频动态范围压缩方法、装置及设备
JP2012235310A (ja) 2011-04-28 2012-11-29 Sony Corp 信号処理装置および方法、プログラム、並びにデータ記録媒体
KR102608968B1 (ko) * 2011-07-01 2023-12-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 오디오 신호 생성, 코딩 및 렌더링을 위한 시스템 및 방법
RU2564681C2 (ru) * 2011-07-01 2015-10-10 Долби Лабораторис Лайсэнзин Корпорейшн Способы и системы синхронизации и переключения для системы адаптивного звука
US8965774B2 (en) 2011-08-23 2015-02-24 Apple Inc. Automatic detection of audio compression parameters
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
JP2013102411A (ja) 2011-10-14 2013-05-23 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
KR102172279B1 (ko) * 2011-11-14 2020-10-30 한국전자통신연구원 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법
US9373334B2 (en) 2011-11-22 2016-06-21 Dolby Laboratories Licensing Corporation Method and system for generating an audio metadata quality score
MX349398B (es) 2011-12-15 2017-07-26 Fraunhofer Ges Forschung Metodo, aparato y programa de computadora para evitar artefactos de recorte.
WO2013118476A1 (ja) * 2012-02-10 2013-08-15 パナソニック株式会社 音響/音声符号化装置、音響/音声復号装置、音響/音声符号化方法および音響/音声復号方法
WO2013150340A1 (en) * 2012-04-05 2013-10-10 Nokia Corporation Adaptive audio signal filtering
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
US8793506B2 (en) * 2012-08-31 2014-07-29 Intel Corporation Mechanism for facilitating encryption-free integrity protection of storage data at computing systems
US20140074783A1 (en) * 2012-09-09 2014-03-13 Apple Inc. Synchronizing metadata across devices
EP2757558A1 (en) 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
SG10201604643RA (en) * 2013-01-21 2016-07-28 Dolby Lab Licensing Corp Audio encoder and decoder with program loudness and boundary metadata
BR122022020276B1 (pt) 2013-01-28 2023-02-23 Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Método e aparelho para reprodução de áudio normalizado de mídia com e sem metadados de ruído integrado em novos dispositivos de mídia
US9372531B2 (en) * 2013-03-12 2016-06-21 Gracenote, Inc. Detecting an event within interactive media including spatialized multi-channel audio content
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9607624B2 (en) 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
JP2015050685A (ja) 2013-09-03 2015-03-16 ソニー株式会社 オーディオ信号処理装置および方法、並びにプログラム
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
US9300268B2 (en) 2013-10-18 2016-03-29 Apple Inc. Content aware audio ducking
PL3061090T3 (pl) 2013-10-22 2019-09-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koncepcja połączonej kompresji zakresu dynamiki i sterowanego zapobiegania obcinaniu dla urządzeń audio
US9240763B2 (en) 2013-11-25 2016-01-19 Apple Inc. Loudness normalization based on user feedback
US9276544B2 (en) 2013-12-10 2016-03-01 Apple Inc. Dynamic range control gain encoding
JP6593173B2 (ja) 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
US9608588B2 (en) 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
SG11201607940WA (en) 2014-03-25 2016-10-28 Fraunhofer Ges Forschung Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
EP3800898B1 (en) 2014-05-28 2023-07-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Data processor and transport of user control data to audio decoders and renderers
JPWO2015182491A1 (ja) 2014-05-30 2017-04-20 ソニー株式会社 情報処理装置および情報処理方法
CN113851138A (zh) 2014-06-30 2021-12-28 索尼公司 信息处理装置和信息处理方法
TWI631835B (zh) 2014-11-12 2018-08-01 弗勞恩霍夫爾協會 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器
US20160315722A1 (en) 2015-04-22 2016-10-27 Apple Inc. Audio stem delivery and control
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
RU2703973C2 (ru) 2015-05-29 2019-10-22 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ регулировки уровня громкости
MX2017016333A (es) 2015-06-17 2018-04-24 Fraunhofer Ges Forschung Control de intensidad subjetiva para interaccion del usuario en sistemas de codificacion de audio.
US9934790B2 (en) 2015-07-31 2018-04-03 Apple Inc. Encoded audio metadata-based equalization
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US10341770B2 (en) 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI774090B (zh) * 2019-11-15 2022-08-11 美商博姆雲360公司 動態顯現裝置元資料資訊音頻增強系統
US11533560B2 (en) 2019-11-15 2022-12-20 Boomcloud 360 Inc. Dynamic rendering device metadata-informed audio enhancement system
TWI828241B (zh) * 2019-11-15 2024-01-01 美商博姆雲360公司 增強音頻信號之方法及裝置及相關的非暫時性電腦可讀媒體
US11863950B2 (en) 2019-11-15 2024-01-02 Boomcloud 360 Inc. Dynamic rendering device metadata-informed audio enhancement system

Also Published As

Publication number Publication date
PL2954515T3 (pl) 2018-09-28
TWI553632B (zh) 2016-10-11
JP6561031B2 (ja) 2019-08-14
HK1217377A1 (zh) 2017-01-06
BR122016001090B1 (pt) 2022-05-24
RU2019120840A (ru) 2021-01-11
JP2022116360A (ja) 2022-08-09
TW202042216A (zh) 2020-11-16
JP6866427B2 (ja) 2021-04-28
CN110491395A (zh) 2019-11-22
CN110459228A (zh) 2019-11-15
CL2015002234A1 (es) 2016-07-29
JP7090196B2 (ja) 2022-06-23
TWI605449B (zh) 2017-11-11
WO2014204783A1 (en) 2014-12-24
EP3373295A1 (en) 2018-09-12
CN203415228U (zh) 2014-01-29
SG11201505426XA (en) 2015-08-28
US10147436B2 (en) 2018-12-04
TWI708242B (zh) 2020-10-21
CN110600043A (zh) 2019-12-20
JP6571062B2 (ja) 2019-09-04
BR112015019435B1 (pt) 2022-05-17
JP6046275B2 (ja) 2016-12-14
KR20150099615A (ko) 2015-08-31
SG10201604619RA (en) 2016-07-28
KR102659763B1 (ko) 2024-04-24
US20200219523A1 (en) 2020-07-09
BR122020017896B1 (pt) 2022-05-24
TW202143217A (zh) 2021-11-16
MX2022015201A (es) 2023-01-11
RU2589370C1 (ru) 2016-07-10
BR122017011368A2 (pt) 2019-09-03
US20240153515A1 (en) 2024-05-09
TW201735012A (zh) 2017-10-01
RU2017122050A3 (zh) 2019-05-22
KR102297597B1 (ko) 2021-09-06
JP2017004022A (ja) 2017-01-05
AU2014281794B2 (en) 2015-08-20
MX342981B (es) 2016-10-20
ES2674924T3 (es) 2018-07-05
JP2017040943A (ja) 2017-02-23
JP2019174852A (ja) 2019-10-10
MX2019009765A (es) 2019-10-14
KR200478147Y1 (ko) 2015-09-02
HK1204135A1 (zh) 2015-11-06
TW202244900A (zh) 2022-11-16
KR102041098B1 (ko) 2019-11-06
JP2024028580A (ja) 2024-03-04
CA2898891C (en) 2016-04-19
CN104240709A (zh) 2014-12-24
CN106297810B (zh) 2019-07-16
ES2777474T3 (es) 2020-08-05
TW201635276A (zh) 2016-10-01
KR101673131B1 (ko) 2016-11-07
RU2017122050A (ru) 2018-12-24
TW201921340A (zh) 2019-06-01
TW201506911A (zh) 2015-02-16
KR20220021001A (ko) 2022-02-21
CN106297810A (zh) 2017-01-04
TWI756033B (zh) 2022-02-21
US20160196830A1 (en) 2016-07-07
TW202343437A (zh) 2023-11-01
MX2021012890A (es) 2022-12-02
JP7427715B2 (ja) 2024-02-05
TWI790902B (zh) 2023-01-21
CN104995677A (zh) 2015-10-21
TWI831573B (zh) 2024-02-01
TWI613645B (zh) 2018-02-01
CN110459228B (zh) 2024-02-06
SG10201604617VA (en) 2016-07-28
IN2015MN01765A (zh) 2015-08-28
UA111927C2 (uk) 2016-06-24
KR102358742B1 (ko) 2022-02-08
CN104240709B (zh) 2019-10-01
JP2016507088A (ja) 2016-03-07
CN106297811A (zh) 2017-01-04
MY192322A (en) 2022-08-17
CN104995677B (zh) 2016-10-26
TWI588817B (zh) 2017-06-21
TW201804461A (zh) 2018-02-01
US20160307580A1 (en) 2016-10-20
US20230023024A1 (en) 2023-01-26
BR122017012321B1 (pt) 2022-05-24
KR20210111332A (ko) 2021-09-10
TWI647695B (zh) 2019-01-11
EP2954515B1 (en) 2018-05-09
TWI719915B (zh) 2021-02-21
MY171737A (en) 2019-10-25
KR20140006469U (ko) 2014-12-30
IL239687A (en) 2016-02-29
DE202013006242U1 (de) 2013-08-01
RU2619536C1 (ru) 2017-05-16
IL239687A0 (en) 2015-08-31
TW201635277A (zh) 2016-10-01
AU2014281794B9 (en) 2015-09-10
EP3680900A1 (en) 2020-07-15
MX2015010477A (es) 2015-10-30
KR20190125536A (ko) 2019-11-06
US11823693B2 (en) 2023-11-21
BR122020017897B1 (pt) 2022-05-24
US9959878B2 (en) 2018-05-01
EP2954515A4 (en) 2016-10-05
CN110491396A (zh) 2019-11-22
CN106297811B (zh) 2019-11-05
BR122016001090A2 (pt) 2019-08-27
CN110491395B (zh) 2024-05-10
BR122017012321A2 (pt) 2019-09-03
KR20160088449A (ko) 2016-07-25
CN110491396B (zh) 2024-07-26
EP3373295B1 (en) 2020-02-12
TR201808580T4 (tr) 2018-07-23
US11404071B2 (en) 2022-08-02
CA2898891A1 (en) 2014-12-24
CN110473559A (zh) 2019-11-19
FR3007564A3 (fr) 2014-12-26
BR112015019435A2 (pt) 2017-07-18
FR3007564B3 (fr) 2015-11-13
AU2014281794A1 (en) 2015-07-23
US20180012610A1 (en) 2018-01-11
KR20240055880A (ko) 2024-04-29
MX367355B (es) 2019-08-16
EP2954515A1 (en) 2015-12-16
US10037763B2 (en) 2018-07-31
JP3186472U (ja) 2013-10-10
RU2624099C1 (ru) 2017-06-30
BR122017011368B1 (pt) 2022-05-24
JP2021101259A (ja) 2021-07-08
RU2696465C2 (ru) 2019-08-01
US20160322060A1 (en) 2016-11-03
CN110473559B (zh) 2024-07-26
HK1214883A1 (zh) 2016-08-05

Similar Documents

Publication Publication Date Title
JP7427715B2 (ja) プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ
KR102158002B1 (ko) 프로그램 라우드니스 및 경계 메타데이터를 가진 오디오 인코더 및 디코더

Legal Events

Date Code Title Description
MK4K Expiration of patent term of a granted utility model