JP2005532585A - Audio coding - Google Patents
Audio coding Download PDFInfo
- Publication number
- JP2005532585A JP2005532585A JP2004519077A JP2004519077A JP2005532585A JP 2005532585 A JP2005532585 A JP 2005532585A JP 2004519077 A JP2004519077 A JP 2004519077A JP 2004519077 A JP2004519077 A JP 2004519077A JP 2005532585 A JP2005532585 A JP 2005532585A
- Authority
- JP
- Japan
- Prior art keywords
- track
- sine wave
- audio
- phase
- sinusoidal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 15
- 238000000034 method Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 230000001052 transient effect Effects 0.000 description 27
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Amplifiers (AREA)
Abstract
オーディオ信号(x)の符号化(1)は、複数の連続したセグメントの各々について、サンプリングされた信号値のそれぞれの組を提供するステップを有する。前記サンプリングされた信号値は分析され(130)、前記複数の連続したセグメントの各々について1つ又は複数の正弦波成分が生成される。正弦波成分は、複数の連続したセグメント間でリンクされる。正弦波コード(CS)は、前記複数の連続したセグメントの各々についてのリンクされた正弦波成分のトラックを有する。前記トラックのそれぞれは、トラックの開始セグメントに正弦波成分の周波数及び振幅を有する一方で、選択されたトラックは、前記開始セグメントの位相が含まれないことのインジケータを含む。The encoding (1) of the audio signal (x) comprises providing a respective set of sampled signal values for each of a plurality of consecutive segments. The sampled signal value is analyzed 130 and one or more sinusoidal components are generated for each of the plurality of consecutive segments. A sinusoidal component is linked between a plurality of consecutive segments. A sinusoidal code (CS) has a track of linked sinusoidal components for each of the plurality of consecutive segments. Each of the tracks has a frequency and amplitude of a sinusoidal component in the starting segment of the track, while the selected track includes an indicator that the phase of the starting segment is not included.
Description
本発明は、オーディオ信号の符号化及び復号に関する。 The present invention relates to encoding and decoding of audio signals.
パラメトリック符号化方式、特に正弦波コーダが、国際特許出願第WO00/79519−A1号(整理番号PHN017502)及びPCT特許出願第IB02/01297(整理番号PHNL010252)において説明されている。このコーダでは、オーディオセグメント又はフレームが、正弦波コーダによって、振幅、周波数及び位相パラメータによって表される多くの正弦波を用いてモデル化される。セグメントの正弦波が推定されたら、トラッキングアルゴリズムが開始される。このアルゴリズムは、正弦波をセグメントごとに互いにリンクさせるよう試みる。このように、連続したセグメントからの適当な正弦波からの正弦波パラメータがリンクされ、いわゆるトラックが得られる。リンクの基準は、2つの連続したセグメントの周波数に基づくが、更に、振幅及び/又は位相情報も用いられることができる。この情報は、リンクされるべき正弦波を決定する費用関数において組み合わせられる。このように、トラッキングアルゴリズムは、特定の時間インスタンスで開始し、複数の時間セグメントに亘って或る時間の間発展し、そして停止するような正弦波トラックを生じさせる。 Parametric coding schemes, particularly sinusoidal coders, are described in International Patent Application No. WO 00 / 79519-A1 (reference number PHN017502) and PCT Patent Application No. IB02 / 01297 (reference number PHNL010252). In this coder, an audio segment or frame is modeled by a sine wave coder with a number of sine waves represented by amplitude, frequency and phase parameters. Once the sine wave of the segment is estimated, the tracking algorithm is started. This algorithm attempts to link sine waves together segment by segment. In this way, sine wave parameters from the appropriate sine wave from successive segments are linked to obtain a so-called track. The link criteria is based on the frequency of two consecutive segments, but also amplitude and / or phase information can be used. This information is combined in a cost function that determines the sine wave to be linked. Thus, the tracking algorithm produces a sinusoidal track that starts at a particular time instance, develops for a period of time over multiple time segments, and stops.
この方式においては、正弦波トラックのために、初期位相が送信され、このトラック中の他の正弦波の位相は、この初期位相及びこれら他の正弦波の周波数から取得される。正弦波の振幅及び周波数は、前の正弦波とは異なって符合化されることもできる。更に、非常に短いトラックは、除去されることができる。 In this scheme, the initial phase is transmitted for a sine wave track, and the phase of the other sine waves in the track is obtained from this initial phase and the frequency of these other sine waves. The amplitude and frequency of the sine wave can also be encoded differently than the previous sine wave. Furthermore, very short tracks can be removed.
このように、トラッキングに起因して、正弦波コーダのビットレートは、相当に低下されうる。 Thus, due to tracking, the bit rate of the sine wave coder can be significantly reduced.
本発明によれば、請求項1に記載のオーディオ信号を符合化する方法が提供される。
According to the invention, there is provided a method for encoding an audio signal according to
本発明の好適な実施例(図1)において、エンコーダは、国際特許出願公開第01/69593−A1号(整理番号PHNL000120)に説明される種類の正弦波コーダである。このコーダ及びその対応するデコーダの動作は、よく説明されており、ここでは、本発明に関連する部分の説明のみが与えられる。 In the preferred embodiment of the present invention (FIG. 1), the encoder is a sine wave coder of the type described in WO 01 / 69593-A1 (reference number PHNL000120). The operation of this coder and its corresponding decoder is well described, and only a description of the parts relevant to the present invention is given here.
前の場合及び好適な実施例の両方において、オーディオコーダ1は、入力オーディオ信号を特定のサンプリング周波数でサンプリングし、結果として、オーディオ信号のデジタル表示x(t)が得られる。次にコーダ1は、サンプリングされた入力信号を3つの成分、即ち、過渡信号成分、持続決定的成分及び持続確率的成分に分離する。オーディオコーダ1は、過渡コーダ11、正弦波コーダ13及び雑音コーダ14を有する。オーディオコーダは、随意に、利得圧縮機構(GC)12を有する。
In both the previous case and the preferred embodiment, the
過渡コーダ11は、過渡検出器(TD)110、過渡解析器(TA)111及び過渡合成器(TS)112を有する。まず、信号x(t)が過渡検出器110に入る。この検出器110は、過渡信号成分が存在するか、及び、当該信号成分の位置を推定する。この情報は、過渡解析器111に供給される。過渡信号成分の位置が決定された場合、過渡解析器111は、該過渡信号成分(の主要部分)を抽出するよう試みる。該解析器は形状関数を、好ましくは推定された開始位置で始まる信号セグメントと整合し、例えば(少)数の正弦波成分を利用して該形状関数の下の内容を決定する。この情報は、過渡コードCTに含まされる。過渡コードCTを生成するためのより詳細な情報は、国際特許出願第01/69593−A1号に与えられる。
The transient coder 11 includes a transient detector (TD) 110, a transient analyzer (TA) 111, and a transient synthesizer (TS) 112. First, the signal x (t) enters the
過渡コードCTは、過渡合成器112に供給される。合成された過渡信号成分は減算器16において入力信号x(t)から減算され、結果として信号x1が得られる。GC 12が省略された場合は、x1=x2となる。
The transient code CT is supplied to the
信号x2は、正弦波コーダ13に供給されて、正弦波解析器(130)において解析され、該解析器は(決定的)正弦波成分を決定する。従って、過渡解析器の存在は望ましいが、これは必須なわけではなく、本発明は、このような解析器無しでも実現可能であることが分かるであろう。いずれにせよ、正弦波コーディングの結果は正弦波コードCSであり、例示的な正弦波コードCSの従来型の生成を示すより詳細な例は、国際特許出願公開第00/79519−A1号において与えられる。
The signal x2 is fed to a
しかし、要するに、このような正弦波コーダは、入力信号x2を、1つのフレームセグメントから次のフレームセグメントにリンクされる正弦波成分のトラックとして、符合化する。従来技術においては、トラックは、最初に、所与のセグメントで始まる正弦波についての開始周波数、開始振幅及び開始位相によって表される(発生(birth))。 In essence, however, such a sine wave coder encodes the input signal x2 as a track of a sine wave component that is linked from one frame segment to the next. In the prior art, a track is first represented by a starting frequency, starting amplitude and starting phase for a sine wave starting in a given segment (birth).
本発明の好適な実施例において、開始位相は、トラックについて、当該トラックの長さの関数として選択的に符合化される。より詳しくは、開始位相は、長い存続期間のトラックについてのみ使用される。これはなぜなら、長い存続期間のトラックには、おそらく音的情報(tonal information)が符合化してあり、このような場合には、トラックの開始位相を送信することによって可能な限りトラックの音的特性を保存することが重要であると推定されるからである。短い存続期間のトラックは、非音的情報(non-tonal information)を符号化していると推定され、従って、開始位相をこのようなトラックと共に送信することは、実際には、トラックに音的特性を追加し、そのため、符号化されたビットストリームを再生するときに歪みの知覚を与えると推定される。 In the preferred embodiment of the invention, the starting phase is selectively encoded as a function of the length of the track. More specifically, the start phase is only used for long duration tracks. This is because a long-lived track is probably encoded with tonal information, and in such a case, the acoustic characteristics of the track are as much as possible by transmitting the starting phase of the track. This is because it is presumed that it is important to preserve. Short-lived tracks are presumed to encode non-tonal information, so transmitting a start phase with such a track is actually a sonic property to the track. Is thus estimated to give a perception of distortion when playing the encoded bitstream.
短いトラックについては開始位相を送信しないことによって、ビットレートの大幅な節減が起こり得ることが分かるであろう。なぜなら、短いトラックについての開始位相データのオーバヘッドは、より長いトラックについてよりも比例的に高いからである。 It will be appreciated that by not transmitting the start phase for short tracks, significant bit rate savings can occur. This is because the overhead of starting phase data for short tracks is proportionally higher than for longer tracks.
トラックが開始位相を必要とするのに十分長いか、又はこれに対応して、開始位相を必要としないのに十分短いか、を決定するための多くの代替基準がある。 There are many alternative criteria for determining whether a track is long enough to require a starting phase or correspondingly short enough not to require a starting phase.
最も単純な基準は絶対トラック長を選択することである。実験的に、40ms未満のトラックが開始位相を必要としない一方で、これよりも長いトラックは、有利には、開始位相と共に送信されることが発見された。8msの更新間隔を有するエンコーダにおいては、これは、長さがセグメント5つ分未満のトラックは、開始位相を含むのではなく、該トラックによって開始位相が使用されないことのインジケータを含むことを意味する。(このようなインジケータを符合化することは、開始位相値と比較してより効率的であると推定される。)代替的に、エンコーダが、該エンコーダが作成する符合化された信号が互換デコーダによって復号されると推定する場合には、該エンコーダは、開始位相が使用されないという表示を含む必要はなく、デコーダに、開始位相のないトラックをどのように処理するかの決定を任せることができる。 The simplest criterion is to select an absolute track length. Experimentally, it has been discovered that tracks shorter than 40 ms do not require a start phase, while longer tracks are advantageously transmitted with a start phase. In an encoder with an update interval of 8 ms, this means that a track that is less than 5 segments in length does not contain a start phase, but an indicator that the start phase is not used by that track. . (Encoding such an indicator is presumed to be more efficient compared to the starting phase value.) Alternatively, the encoded signal produced by the encoder is a compatible decoder. The encoder does not have to include an indication that the starting phase is not used, but can leave the decoder to determine how to process the track without the starting phase. .
代替基準は、トラックが存在している時間間隔が、有声か(voiced)又は非有声か(non-voiced)を決定することに基づく。時間間隔が有声であると決定されたら、この、事実上非音的である時間間隔は(従ってトラックも)、開始位相を含まないべきであり、非有声の時間間隔についてはその逆が成り立つ、と推定される。L.R.
Rabiner, M.J. Cheng, A.E. Rosenberg及びC.A.
McGonegalによる「A
Comparative Performance Study of Several Pitch Detection Algorithms」(IEEE
Transactions on Acoustics, Speech and Signal Processing、ASSP−24巻、ページ399〜417、1976年10月)は、このような決定を行う方法を開示し、この方法においては、このような方法を実現する成分をトラッキングアルゴリズム中に含めることによって、このトラッキングアルゴリズムは、音的時間間隔内に存在しているトラックについては開始位相情報を含む一方で、非音的時間間隔内に存在しているトラックについては、開始位相は、符合化されたビットストリームに含まれない。この基準は、音的時間間隔においては、トラックは非音的時間間隔におけるよりも長くなる傾向にあり、従って、トラックが開始位相を含むべきか否かの決定がなされる前に、トラックの最終的な長さが知られている必要はない、と仮定する。
The alternative criteria is based on determining whether the time interval in which a track is present is voiced or non-voiced. If the time interval is determined to be voiced, this effectively silent time interval (and thus the track) should not include the start phase, and vice versa for unvoiced time intervals, It is estimated to be. LR
Rabiner, MJ Cheng, AE Rosenberg and CA
“A” by McGonegal
Comparative Performance Study of Several Pitch Detection Algorithms '' (IEEE
Transactions on Acoustics, Speech and Signal Processing, ASSP-24, pp. 399-417, October 1976) discloses a method for making such a determination, and in this method, components that realize such a method. Is included in the tracking algorithm so that the tracking algorithm includes start phase information for tracks that exist within a sound time interval, while for tracks that exist within a non-sound time interval, The starting phase is not included in the encoded bitstream. This criterion is that in a sound time interval, the track tends to be longer than in a non-sound time interval, so the final of the track is determined before a determination is made whether the track should contain a start phase. Suppose the specific length need not be known.
時間間隔が音的オーディオ信号を表示するか又は非音的オーディオ信号を表示するかを決定する代替の方法は、以下に述べるように、信号の雑音成分のエネルギーレベルを調べることである。雑音エネルギーの正弦波成分エネルギーに対する比が所与の時間間隔の間所与の閾値を超えると分かったら、上記と同様に、オーディオ信号は非音的であり、開始位相情報は、トラックに含まれる必要はないと仮定されることができる。また、雑音エネルギーの正弦波成分エネルギーに対する比が所与の閾値を下回ったときについて、逆もまた同じである。再び、信号が音的であると決定される場合には、トラックは非音的信号におけるよりも長いと仮定される。 An alternative way of determining whether the time interval represents a sonic or non-audio audio signal is to examine the energy level of the noise component of the signal, as described below. Once the ratio of noise energy to sinusoidal component energy is found to exceed a given threshold for a given time interval, the audio signal is silent and the start phase information is included in the track, as above. It can be assumed that there is no need. The reverse is also true when the ratio of noise energy to sinusoidal component energy falls below a given threshold. Again, if the signal is determined to be sonic, the track is assumed to be longer than in the non-phonic signal.
好適な実施例及び従来技術の両方において、トラックは、トラックが終了する(死亡)セグメントまで、周波数差及び振幅差によって(長いトラックについては更に位相差(継続)によって)連続したセグメントで表される。実際には、長いトラックについてさえ位相差を符号化することにはほとんど利得がないと決定され得る。従って、位相情報は、継続のために符号化される必要は全くなく、長いトラックのための位相情報は、継続的位相復元を用いて再生成されることができる。 In both the preferred embodiment and the prior art, a track is represented by a continuous segment by frequency and amplitude differences (or by phase difference (continuation) for longer tracks) until the track ends (dead) segment. . In practice, it can be determined that there is little gain in encoding the phase difference even for long tracks. Thus, the phase information need not be encoded for continuation, and the phase information for long tracks can be regenerated using continuous phase recovery.
従来技術と同様に、本発明の改善された正弦波コーダによって生成される正弦波コードCSから、正弦波合成器(SS)131によって正弦波信号成分が復元される。この信号は、減算器17において正弦波コーダ13への入力x2から減算され、結果として(大きな)遷移信号成分及び(主な)決定的正弦波成分を含まない残存信号x3が得られる。
Similar to the prior art, the sine wave signal component is recovered by the sine wave synthesizer (SS) 131 from the sine wave code CS generated by the improved sine wave coder of the present invention. This signal is subtracted from the input x2 to the
残存信号x3は、主に雑音を有すると推定され、好適な実施例の雑音解析器14は、例えば国際特許出願第01/89086−A1号に説明されるように、この雑音の表示である雑音コードCNを生じさせる。再び、このような解析器の使用は、本発明の実現のためには必須ではなく、このような使用に対しては補完的であることが分かるであろう。
The residual signal x3 is presumed to have mainly noise, and the
最後に、マルチプレクサ15で、コードCT、CS及びCNを含むオーディオストリームASが構成される。オーディオストリームASは、例えばデータバス、アンテナシステム、記憶媒体等に供給される。
Finally, the
図2は、本発明によるオーディオプレーヤ3を示す。例えば図1によるエンコーダによって生成されるオーディオストリームAS’は、データバス、アンテナシステム、記憶媒体等から得られる。オーディオストリームASは、デマルチプレクサ30において多重分離され、コードCT、CS及びCNが得られる。これらのコードは、過渡合成器31、正弦波合成器32及び雑音合成器33にそれぞれ供給される。過渡信号成分は、過渡合成器31において過渡コードCTから計算される。過渡コードが形状関数を示す場合、形状は受信されたパラメータに基づいて計算される。更に、形状内容は、正弦波成分の周波数及び振幅に基づいて計算される。過渡コードCTがステップを示す場合、過渡は計算されない。合計過渡信号yTは、全ての過渡の合計である。
FIG. 2 shows an
正弦波コードCSが、信号ySを生成するために用いられ、これは、所与のセグメントの正弦波の合計として説明される。デコーダにおいて、正弦波トラックの正弦波の位相は、2つの方法のうちの1つで決定される。トラックが開始位相を含む場合には、従来技術と同様に、位相は、生じる正弦波の位相及び中間正弦波の周波数から計算される。開始位相が提供されないという表示をトラックが含む好適な実施例において、デコーダは、トラックの全ての正弦波についてランダムな開始位相を生成して、トラックを前と同様にに合成する。(デコーダは、代替的に、生じる正弦波についてのみランダムな開始位相を計算してもよく、残りの位相は従来技術と同様に計算してもよい。)このような表示又は開始位相が提供されない場合には、デコーダは、トラックの正弦波のためのランダムな開始位相を作成することが必要とされると推定する。 A sine wave code CS is used to generate the signal yS, which is described as the sum of the sine waves of a given segment. At the decoder, the phase of the sine wave of the sine wave track is determined in one of two ways. If the track contains a starting phase, the phase is calculated from the resulting sine wave phase and the intermediate sine wave frequency, as in the prior art. In a preferred embodiment where the track includes an indication that no start phase is provided, the decoder generates a random start phase for all sine waves of the track and synthesizes the track as before. (The decoder may alternatively calculate a random starting phase only for the resulting sine wave, and the remaining phases may be calculated as in the prior art.) No such indication or starting phase is provided. In some cases, the decoder assumes that it is required to create a random starting phase for the sine wave of the track.
本発明の1つの側面が、非音的オーディオフラグメントの非音性(non-tonality)を保存することであることは理解されるであろう。従って、本発明を利用するときには、エンコーダが、非音的オーディオフラグメントのためには非常に短いトラックを保存し、デコーダが、これらの短いトラックをランダムな開始位相で再生することが望ましい可能性がある。これは、非常に短いトラックがビットストリームのどこにも含まれない従来技術とは異なる。 It will be appreciated that one aspect of the invention is to preserve the non-tonality of non-audio audio fragments. Thus, when utilizing the present invention, it may be desirable for the encoder to store very short tracks for non-audio audio fragments and for the decoder to play these short tracks with a random starting phase. is there. This is different from the prior art where very short tracks are not included anywhere in the bitstream.
同時に、雑音コードCNは、雑音のスペクトラムに近似した周波数応答を有する主にフィルタである雑音合成器NS33に供給される。NS33は、雑音コードCNによって白色雑音信号をフィルタすることによって復元された雑音yNを生成する。
At the same time, the noise code CN is supplied to the noise synthesizer NS33, which is mainly a filter having a frequency response approximating the noise spectrum. The
合計信号y(t)は、過渡信号yT並びにあらゆる振幅伸長(g)と正弦波信号yS及びノイズ信号yNの合計との積の合計を有する。オーディオプレーヤは、それぞれの信号の和を取るための2つの加算器36及び37を有する。
合計信号は出力ユニット35に供給され、これは例えばスピーカである。
The total signal y (t) has the sum of the product of the transient signal yT and any amplitude expansion (g) and the sum of the sinusoidal signal yS and the noise signal yN. The audio player has two
The total signal is supplied to the
図3は、図1で示すオーディオコーダ1及び図2で示すオーディオプレーヤ3を有する本発明によるオーディオシステムを示す。このようなシステムは、再生及び記録機能を提供する。オーディオストリームASは、オーディオコーダから通信チャネル2を通じてオーディオプレーヤに供給され、この通信チャネルは、ワイヤレス接続、データ20バス又は記憶媒体であってもよい。通信チャネル2が記憶媒体である場合には、記憶媒体はシステムに固定されていてもよく、又は、取り外し可能なディスク、メモリスティック等であってもよい。通信チャネル2は、オーディオシステムの一部であってもよいが、多くの場合オーディオシステムの外部にある。
FIG. 3 shows an audio system according to the invention having the
本発明は、いかなる正弦波オーディオコーダにおいても用いられることができる。従って、本発明は、このようなコーダが使用されるどこにでも適用可能である。 The present invention can be used in any sinusoidal audio coder. Thus, the present invention is applicable wherever such a coder is used.
上述の実施例は、本発明を制限するのではなく説明しているのであり、当業者は、添付の請求項の範囲から離れることなく代替の実施例を設計することができることに注意されたい。請求項において、括弧内に配置されたいかなる引用符号も当該請求項を制限するように解釈されてはならない。「有する(comprising)」なる用語は、請求項に記載されたもの以外の要素又はステップの存在を排除するものではない。本発明は、幾つかの個別素子を有するハードウェアにより、及び適切にプログラムされたコンピュータによって実行されることができる。幾つかの手段を列挙している装置請求項において、複数のこれらの手段を、ハードウェアの全く同一のアイテムによって具体化することもできる。特定の手段が相互に異なる従属請求項において記載されているという事実のみでは、これらの手段の組合せが有利に用いられることができないということを示すことにはならない。 It should be noted that the above-described embodiments illustrate rather than limit the invention, and that those skilled in the art can design alternative embodiments without departing from the scope of the appended claims. In the claims, any reference signs placed between parentheses shall not be construed as limiting the claim. The word “comprising” does not exclude the presence of elements or steps other than those listed in a claim. The present invention can be implemented by hardware having several individual elements and by a suitably programmed computer. In the device claim enumerating several means, several of these means can be embodied by one and the same item of hardware. The mere fact that certain measures are recited in mutually different dependent claims does not indicate that a combination of these measured cannot be used to advantage.
Claims (15)
複数の連続したセグメントの各々について、サンプリングされた信号値のそれぞれの組を提供するステップと、
前記サンプリングされた信号値を分析して、前記複数の連続したセグメントの各々について1つ又は複数の正弦波成分を生成するステップと、
複数の連続したセグメント間で正弦波成分をリンクするステップと、
前記複数の連続したセグメントの各々について、リンクされた正弦波成分のトラックを有する正弦波コードを生成するステップであって、前記トラックのそれぞれは、トラックの開始セグメントの正弦波成分の周波数及び振幅を有し、選択されたトラックは前記開始セグメントの位相を含まない、ステップと、
前記正弦波コードを含む符合化されたオーディオストリームを生成するステップと、
を有する方法。 In a method of encoding an audio signal,
Providing a respective set of sampled signal values for each of a plurality of consecutive segments;
Analyzing the sampled signal value to generate one or more sinusoidal components for each of the plurality of consecutive segments;
Linking sinusoidal components between a plurality of consecutive segments;
Generating a sine wave code having linked sine wave component tracks for each of the plurality of consecutive segments, each of the tracks having a frequency and amplitude of a sine wave component of a start segment of the track; And the selected track does not include the phase of the start segment; and
Generating an encoded audio stream including the sine wave code;
Having a method.
複数の連続したセグメントの各々についてのリンクされた正弦波成分のトラックを有する正弦波コードを含む符合化されたオーディオストリームを読み取るステップであって、前記トラックのそれぞれは、トラックの開始セグメントの正弦波成分の周波数及び振幅を有し、選択されたトラックは前記開始セグメントの位相を含まない、ステップと、
前記選択されたトラックのためにランダムな開始位相を生成するステップと、
複数の連続したセグメントに亘って正弦波成分を復元することを含む、前記正弦波コードを使用して前記オーディオ信号を合成するステップと、
を有する方法。 In a method for decoding an audio stream,
Reading an encoded audio stream including a sinusoidal code having a track of linked sinusoidal components for each of a plurality of consecutive segments, each of the tracks being a sinusoid of a start segment of the track Having a frequency and amplitude of components, and the selected track does not include the phase of the start segment;
Generating a random starting phase for the selected track;
Synthesizing the audio signal using the sine wave code comprising restoring a sine wave component over a plurality of consecutive segments;
Having a method.
前記サンプリングされた信号値を分析して、前記複数の連続したセグメントの各々について1つ又は複数の正弦波成分を生成するように構成された解析器と、
複数の連続したセグメント間で正弦波成分をリンクするように構成されたリンカーと、
前記複数の連続したセグメントの各々について、リンクされた正弦波成分のトラックを有する正弦波コードを生成するように構成された部品であって、前記トラックのそれぞれは、トラックの開始セグメントの正弦波成分の周波数及び振幅を有し、選択されたトラックは前記開始セグメントの位相を含まない、部品と、
前記正弦波コードを含む符合化されたオーディオストリームを生成するためのビットストリーム生成器と、
を有するオーディオコーダ。 In an audio coder configured to process a respective set of sampled signal values for each of a plurality of consecutive segments of an audio signal,
An analyzer configured to analyze the sampled signal value to generate one or more sinusoidal components for each of the plurality of consecutive segments;
A linker configured to link sinusoidal components between a plurality of consecutive segments;
A component configured to generate, for each of the plurality of consecutive segments, a sine wave code having a track of linked sine wave components, each of the tracks being a sine wave component of a start segment of the track The selected track does not include the phase of the start segment; and
A bitstream generator for generating an encoded audio stream including the sine wave code;
Audio coder with.
前記選択されたトラックのためにランダムな開始位相を生成するように構成された位相発生器と、
複数の連続したセグメントに亘って正弦波成分を復元することを含む、前記正弦波コードを使用して前記オーディオ信号を合成する合成器と、
を有するオーディオプレーヤ。 Means for reading an encoded audio stream comprising a sinusoidal code having a track of linked sinusoidal components for each of a plurality of consecutive segments, each of said tracks comprising a start segment of the track Means having a frequency and amplitude of a sinusoidal component, wherein the selected track does not include the phase of the start segment;
A phase generator configured to generate a random starting phase for the selected track;
A synthesizer for synthesizing the audio signal using the sine wave code, comprising restoring a sine wave component over a plurality of consecutive segments;
An audio player.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02077727 | 2002-07-08 | ||
PCT/IB2003/002746 WO2004006225A1 (en) | 2002-07-08 | 2003-06-18 | Sinusoidal audio coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005532585A true JP2005532585A (en) | 2005-10-27 |
JP2005532585A5 JP2005532585A5 (en) | 2006-08-03 |
Family
ID=30011169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004519077A Pending JP2005532585A (en) | 2002-07-08 | 2003-06-18 | Audio coding |
Country Status (8)
Country | Link |
---|---|
US (1) | US20050259822A1 (en) |
EP (1) | EP1522063B1 (en) |
JP (1) | JP2005532585A (en) |
CN (1) | CN1666256A (en) |
AT (1) | ATE356404T1 (en) |
AU (1) | AU2003237010A1 (en) |
DE (1) | DE60312336D1 (en) |
WO (1) | WO2004006225A1 (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100790110B1 (en) * | 2006-03-18 | 2008-01-02 | 삼성전자주식회사 | Morphology-based speech signal codec method and device |
KR101080421B1 (en) * | 2007-03-16 | 2011-11-04 | 삼성전자주식회사 | Method and apparatus for sinusoidal audio coding |
KR101425355B1 (en) * | 2007-09-05 | 2014-08-06 | 삼성전자주식회사 | Parametric audio encoding and decoding apparatus and method thereof |
KR101441898B1 (en) * | 2008-02-01 | 2014-09-23 | 삼성전자주식회사 | Frequency encoding method and apparatus and frequency decoding method and apparatus |
CN104882145B (en) * | 2014-02-28 | 2019-10-29 | 杜比实验室特许公司 | It is clustered using the audio object of the time change of audio object |
US9904508B1 (en) * | 2016-09-27 | 2018-02-27 | Bose Corporation | Method for changing type of streamed content for an audio system |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0792998A (en) * | 1993-07-27 | 1995-04-07 | Sony Corp | Encoding method and decoding method for speech signal |
JPH08272398A (en) * | 1995-02-22 | 1996-10-18 | Digital Voice Syst Inc | Speech synthetis using regenerative phase information |
US5664051A (en) * | 1990-09-24 | 1997-09-02 | Digital Voice Systems, Inc. | Method and apparatus for phase synthesis for speech processing |
JP2000515992A (en) * | 1996-07-30 | 2000-11-28 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | Language coding |
WO2000079519A1 (en) * | 1999-06-18 | 2000-12-28 | Koninklijke Philips Electronics N.V. | Audio transmission system having an improved encoder |
WO2001041124A2 (en) * | 1999-12-01 | 2001-06-07 | Koninklijke Philips Electronics N.V. | Method of and system for coding and decoding sound signals |
-
2003
- 2003-06-18 JP JP2004519077A patent/JP2005532585A/en active Pending
- 2003-06-18 DE DE60312336T patent/DE60312336D1/en not_active Expired - Lifetime
- 2003-06-18 AT AT03735915T patent/ATE356404T1/en not_active IP Right Cessation
- 2003-06-18 AU AU2003237010A patent/AU2003237010A1/en not_active Abandoned
- 2003-06-18 US US10/520,196 patent/US20050259822A1/en not_active Abandoned
- 2003-06-18 CN CN038161702A patent/CN1666256A/en active Pending
- 2003-06-18 EP EP03735915A patent/EP1522063B1/en not_active Expired - Lifetime
- 2003-06-18 WO PCT/IB2003/002746 patent/WO2004006225A1/en active IP Right Grant
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5664051A (en) * | 1990-09-24 | 1997-09-02 | Digital Voice Systems, Inc. | Method and apparatus for phase synthesis for speech processing |
JPH0792998A (en) * | 1993-07-27 | 1995-04-07 | Sony Corp | Encoding method and decoding method for speech signal |
JPH08272398A (en) * | 1995-02-22 | 1996-10-18 | Digital Voice Syst Inc | Speech synthetis using regenerative phase information |
JP2000515992A (en) * | 1996-07-30 | 2000-11-28 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | Language coding |
WO2000079519A1 (en) * | 1999-06-18 | 2000-12-28 | Koninklijke Philips Electronics N.V. | Audio transmission system having an improved encoder |
JP2003502703A (en) * | 1999-06-18 | 2003-01-21 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Audio transmission system with improved encoder |
WO2001041124A2 (en) * | 1999-12-01 | 2001-06-07 | Koninklijke Philips Electronics N.V. | Method of and system for coding and decoding sound signals |
JP2003515776A (en) * | 1999-12-01 | 2003-05-07 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Method and system for encoding and decoding audio signals |
Also Published As
Publication number | Publication date |
---|---|
AU2003237010A1 (en) | 2004-01-23 |
EP1522063B1 (en) | 2007-03-07 |
ATE356404T1 (en) | 2007-03-15 |
CN1666256A (en) | 2005-09-07 |
EP1522063A1 (en) | 2005-04-13 |
DE60312336D1 (en) | 2007-04-19 |
US20050259822A1 (en) | 2005-11-24 |
WO2004006225A1 (en) | 2004-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2496156C2 (en) | Concealment of transmission error in digital audio signal in hierarchical decoding structure | |
KR100956623B1 (en) | System and method for time warping frames within a vocoder due to residual change | |
US7328161B2 (en) | Audio decoding method and apparatus which recover high frequency component with small computation | |
JP5792710B2 (en) | Sinusoidal coding | |
JP2004508597A (en) | Simulation of suppression of transmission error in audio signal | |
US20030083886A1 (en) | Audio coding | |
JP4359499B2 (en) | Editing audio signals | |
CN101573751B (en) | Method and apparatus for synthesizing digital audio signal represented by continuous blocks of samples | |
JP2004519741A (en) | Audio encoding | |
JP2005532585A (en) | Audio coding | |
US20060009967A1 (en) | Sinusoidal audio coding with phase updates | |
KR101261528B1 (en) | Method and apparatus for error concealment of decoded audio signal | |
JP4470122B2 (en) | Speech coding apparatus, speech decoding apparatus, speech coding program, and speech decoding program | |
KR20080072223A (en) | Parametric part / decryption method and apparatus therefor | |
JPH0774650A (en) | Audio encoder and decoder for encoding signal thereof | |
JP4737416B2 (en) | Code conversion method and apparatus | |
KR20050017088A (en) | Sinusoidal audio coding | |
JP2006276476A (en) | Method, device, program, and storage medium thereof for code conversion | |
JPH0997098A (en) | Soundless compression sound encoding/decoding device | |
JP2011209412A (en) | Compressing device, compressing method, reproducing device, and reproducing method | |
JPH1020896A (en) | Code excited linear predictive speech encoding system | |
HK1055346B (en) | Transmission error concealment in an audio signal | |
HK1113011A (en) | Time warping frames inside the vocoder by modifying the residual |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060616 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091027 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100323 |