EP1741039B1 - Information signal processing by carrying out modification in the spectral/modulation spectral region representation - Google Patents
Information signal processing by carrying out modification in the spectral/modulation spectral region representation Download PDFInfo
- Publication number
- EP1741039B1 EP1741039B1 EP05735002A EP05735002A EP1741039B1 EP 1741039 B1 EP1741039 B1 EP 1741039B1 EP 05735002 A EP05735002 A EP 05735002A EP 05735002 A EP05735002 A EP 05735002A EP 1741039 B1 EP1741039 B1 EP 1741039B1
- Authority
- EP
- European Patent Office
- Prior art keywords
- spectral
- values
- modulation
- sequence
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 289
- 238000012545 processing Methods 0.000 title claims abstract description 51
- 230000004048 modification Effects 0.000 title abstract description 5
- 238000012986 modification Methods 0.000 title abstract description 5
- 230000001131 transforming effect Effects 0.000 claims abstract 3
- 230000005236 sound signal Effects 0.000 claims description 105
- 238000000354 decomposition reaction Methods 0.000 claims description 23
- 238000001914 filtration Methods 0.000 claims description 14
- 238000000034 method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 230000002829 reductive effect Effects 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 description 86
- 239000012071 phase Substances 0.000 description 40
- 239000011159 matrix material Substances 0.000 description 14
- 238000003775 Density Functional Theory Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 6
- 239000000969 carrier Substances 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
Definitions
- the present invention relates to the processing of audio signals, and more particularly to spectral / modulation spectral processing.
- signals which consist of a carrier signal component and a modulation component frequently exist.
- modulated signals a representation in which the signals are decomposed into carrier and modulation components is often needed to be able to filter, encode or otherwise modify them, for example.
- Audio coding For purposes of audio coding, for example, it is known to subject the audio signal to a so-called modulation transformation. In this case, the audio signal is decomposed by a transformation into frequency bands. Then a decomposition in amount and phase is made. While the phase is not processed further, the amounts per subband are retransformed over a number of transformation blocks in a second transformation. The result is a frequency decomposition of the temporal envelope of the relevant subband into modulation coefficients. Audio codings that consist of such a modulation transformation are, for example, in M. Vinton and L. Atlas, "A Scalable and Progressive Audio Codec", in Proceedings of the 2001 IEEE ICASSP, 7-11.
- a disadvantage of the above-mentioned audio coding schemes using a modulation transformation is the following fact. As long as no further processing steps are performed on the modulation coefficients together with the phases, the modulation coefficients form a spectral / modulation spectral representation of the audio signal which is reversible and perfectly reconstructive, ie can be reconverted back to the original audio signal in the time domain without changes. In these methods, however, the modulation coefficients are filtered in order to reduce or quantize the modulation coefficients according to psychoacoustic criteria to the smallest possible values, so that the highest possible compression rate is achieved. However, this does not generally achieve the desired goal of removing the relevant modulation components from the resulting signal or of deliberately introducing quantization noise in this component.
- US 2003/185411 discloses an apparatus for processing an audio signal in which the result of a first transformation of the audio signal is transformed again.
- the first transformation separates the audio signal into a magnitude and a phase spectrogram.
- the second transformation is applied separately to each of these two spectrograms.
- the object of the present invention is thus to provide a processing scheme for audio signals, which allows a specific processing of audio signals separately according to modulation and carrier portions.
- the core idea of the present invention is that it is possible to achieve a more strictly processing of audio signals separately for modulation and carrier components if the transfer of the information signal from the time / spectral representation or the time / frequency representation into the spectral / modulation spectral representation or the frequency / modulation frequency representation is performed depending on both an amount component and a phase component of the time / spectral representation of the information signal. This eliminates a recombination between phase and magnitude, and thus the reintroduction of unwanted modulation components in the time representation of the processed audio signal on the synthesis side.
- Transferring the audio signal from the time / spectral representation to the spectral / modulation spectral representation involves the problem that the time / spectral representation of the information signal is in fact not only from the audio signal but also from the phase offset the time blocks to the carrier spectral component of the audio signal depends.
- the block-wise transformation of the audio signal from the time representation into the time / spectral representation causes the sequences of spectral values obtained per spectral component in the time / spectral representation of the audio signal to be a modulated complex Carrier, which depends only on the asynchronicity of the block repetition frequency to the carrier frequency component of the audio signal.
- a demodulation of the sequence of spectral values in the time / spectral representation of the audio signal per spectral component is therefore undertaken in order to obtain a demodulated sequence of spectral values per spectral component.
- the subsequent conversion of the demodulated sequences of spectral values thus obtained is carried out by block-wise transforms from the time / spectral representation into the spectral / modulation spectral representation or by blockwise spectral decomposition of the same, whereby blocks of modulation values are obtained.
- These are manipulated or modified, such as weighted for bandpass filtering to remove the modulation component from the original audio signal with a corresponding weighting function.
- the result is a modified demodulated sequence of spectral values or modified demodulated time / spectral representation.
- the complex carrier is re-modulated, whereby a modified sequence of spectral values is obtained which forms part of a time / spectral representation of the processed audio signal.
- a return of this representation into the time representation results in a processed audio signal in the time representation or time domain, which can be changed very precisely with respect to modulation and carrier components with respect to the original audio signal.
- Fig. 1 shows an apparatus for processing an audio signal according to an embodiment of the present invention.
- the device of Fig. 1 indicated generally at 10, includes an input 12 at which it receives the audio signal 14 to be processed.
- the device of Fig. 1 is exemplary provided to process the audio signal 14 such that the modulation component is removed from the audio signal 14, and thus to obtain a processed audio signal with only the carrier portion.
- the device 10 includes an output 16 for outputting the carrier portion as the processing result and the processed audio signal 18, respectively.
- the device 10 is divided essentially into a part 20 for transferring the audio signal 14 from a time representation into a time / frequency representation, a means 22 for transferring the audio signal from the time / frequency representation into the frequency / modulation frequency representation, a portion 24 in which the actual processing takes place, namely the modification of the audio signal, and a part 26 for the return of the processed in the frequency / modulation frequency representation audio signal from this representation in the time representation.
- the said four parts are connected in series between the input 12 and the output 16 in series, the more detailed structure and operation of which will be described hereinafter.
- the part 20 of the device 10 comprises a fenestration device 28 and a transformation device 30, which connect to the input 12 in this order.
- an input of the fenestration device 28 is connected to the input 12 to obtain the audio signal 14 as a sequence of information values. If the audio signal is still present as an analog signal, this can be converted, for example, by an A / D converter or a discrete sampling into a sequence of information or sampling values.
- the windowing device 28 forms blocks of the same number of information values from the sequence of information values and additionally performs a weighting with a weighting function on each block of information values, which, for example, can not correspond exclusively to a sine window or a KBD window. The blocks may overlap, such as by 50% or not.
- window functions having the property that they enable a good subband separation in the time / spectral representation and that the squares of their mutually corresponding weighting values applied in the overlap region, applied to one and the same information value, add up to one.
- An output of the fenestration device 28 is connected to an input of the transformation device 30.
- the blocks of information values output by the windowing means 28 are received by the transformation means 30. It then subjects the transformation means 30 in blocks to a spectrally decomposing transformation, such as a DFT or other complex transformation.
- the transformation device 30 thus achieves block-by-block decomposition of the audio signal 14 into spectral components and thus produces, in particular per block of time, as obtained from the windowing device 28, a block of spectral values which comprises one spectral value per spectral component.
- Several spectral values can be combined into subbands. In the following, however, the terms subband and Spectral component used synonymously.
- the transformation means 30 outputs per spectral component or subband a sequence of spectral values which represent the time profile of this spectral component or of this subband.
- the spectral values output by the transformation device 30 represent a time / frequency representation of the audio signal 14.
- the part 22 comprises a carrier frequency determination device 32, a mixer 34 serving as a demodulation device, a windowing device 36, and a second transformation device 38.
- the windowing device 32 comprises an input which is connected to the output of the transformation device 30. It receives there the spectral value sequences for the individual subbands and divides the spectral value sequences per subband - similarly as the fenestration 28 does with respect to the audio signal 14 - into blocks and weights the spectral values of each block with a suitable weighting function.
- the weighting function may be one of the weighting functions already mentioned above with respect to device 28.
- the successive blocks in a subband may or may not overlap, again exemplarily assuming a mutual overlap of 50%. In the following it is assumed that the blocks of different sub-bands are aligned with each other, as in the following with reference to Fig. 1 will be explained in more detail. Another approach with offset between the subbands block sequences would also be conceivable.
- the windowing device outputs sequences of windowed spectral value blocks per subband.
- the carrier frequency determination device 32 also has an input which is connected to the output of the transformation device 30 in order to obtain the spectral values of the subbands or spectral components as sequences of spectral values per subband. It is intended to find out in each subband that carrier component which results from the fact that the individual time blocks from which the individual spectral values of the subbands have been derived have a time-varying phase offset to the carrier frequency component of the audio signal.
- the carrier component determined per subband outputs the carrier frequency determining device 32 at its output to an input of the mixer 34, which in turn has a further input which is connected to the output of the fenestration device 36.
- the mixer 34 is designed such that, per subband, it multiplies the blocks of windowed spectral values as output from the transformation means by the complex conjugate of the respective carrier component as determined by the carrier frequency determining means 30 for the respective subband, whereby Subbands or blocks of windowed spectral values are demodulated.
- Demodulated subbands thus result at the output of the mixer 34 or a sequence of demodulated blocks of windowed spectral values results per subband.
- the output of the mixer 34 is connected to an input of the transformation device 38, so that the latter per subband each other - here exemplarily 50% - overlapping blocks of windowed and demodulated spectral values and transforms these blocks in the spectral / modulation spectral representation or spectrally decomposed to by processing all subbands or spectral components a previously modified only with regard to the demodulation of the subband spectral value sequences Frequency / modulation frequency representation of the audio signal 14 to produce.
- the transformation underlying the transformation device 38 per subband can be, for example, a DFT, an MDCT, MDST or the like, and in particular also the same transformation as that of the transformation device 30 Fig. 1
- the transformations of both transformation devices 30, 38 are DFTs.
- the transformation means 38 successively outputs blocks of values for each sub-band or spectral component, hereinafter referred to as modulation values, representing a spectral decomposition of the blocks of windowed and demodulated spectral values.
- modulation values representing a spectral decomposition of the blocks of windowed and demodulated spectral values.
- the blocks of spectral values per subband, with respect to which the transformation means 38 performs the transformations, are aligned with respect to one another in time, so that a time interval always results in a matrix of modulation values composed of one modulation value block per subband.
- the modulation values are forwarded by the transformation device 38 to the part 24 which has only one signal processing device 40.
- the signal processing device 40 is connected to the output of the transformation device 38 and thus receives the blocks of modulation values.
- the signal processor 40 since the device 10 is for modulation-rate rejection, the signal processor 40 performs effective low-pass filtering in the frequency domain on the incoming blocks of modulation values, namely, weighting the modulation values with a function increasing from zero to higher or lower Modulation frequencies drops.
- the thus modified blocks of modulation values pass the signal processing means 40 to the back transfer part 26. That of the signal processing device 40 output modified blocks of modulation values represent a modified frequency / modulation frequency representation of the information signal 14, or in other words, a frequency / modulation frequency representation other than the demodulation by the mixer 34 from the frequency / modulation frequency representation of the modified information signal 18.
- the re-transfer part 26 is in turn divided into two parts, namely a part for transferring the processed audio signal 18 from the frequency / modulation frequency representation as output from the signal processing means 40 to the time / frequency representation, and a part for returning the processed one Audio signal from the time / frequency representation in the time representation.
- the former of the two parts comprises a transformation means 42 for performing a block-wise transformation inverse to the transformation after the transformation means 38, a mixer 46 and an assembly means 44.
- the second part of the return part 26 comprises a transformation means 48 for performing the transformation of the transformation means 30 inverse blockwise transformation and an aggregator 50.
- the inverse transformation means 42 is connected with its input to the output of the signal processing means 40 and transforms the modified blocks of modulation values partially bandwise from the spectral representation back into the time / frequency representation and thus reverses the spectral decomposition to a subsequence of modified blocks of To obtain spectral values.
- These modified spectral value blocks output by the inverse transformation means 42 differ from the spectral value blocks as output by the windowing device 36, but not only by the processing by the signal processing device 40 but also by the demodulation effected by the mixer 34.
- the mixer 46 receives the strings of modified spectral value blocks output from the inverse transform means 42 per subband and mixes them with a complex carrier corresponding to that used at the corresponding block for demodulating the audio signal at the mixer 34 is complex conjugated to modulate the spectral value blocks again with the carrier caused by the phase offsets of the time blocks.
- the result, which is established at the output of the mixer 46, is a sequence of modified non-demodulated spectral value blocks per subband.
- the output of the mixer 46 is connected to an input of the assembler 44.
- the combination consists in a simple addition of mutually associated spectral values.
- the result that is thus output at the output of the OLA 44 are thus modified subbands or modified sequences of spectral values for all spectral components and represents a modified time / frequency representation of the information signal 14 and a time / frequency representation of the modified audio signal 18.
- the transformation device 48 receives the spectral value sequences and thus in particular successively a spectral value for all subbands or spectral components or a spectral decomposition of a section of the modified audio signal 18 successively. It generates a sequence of modified time blocks from the sequence of spectral decompositions by reversing the spectral decomposition. In turn, these modified time blocks receive the merge means 50.
- the merge means 50 works in a similar manner to the merge means 44. It assembles the modified time blocks, which overlap by way of example by 50%, by adding corresponding information values from adjacent or successive modified time blocks. The result at the output of the combining device 50 is thus a sequence of information values representing the processed audio signal 18.
- the processing of the audio signal by the device 10 begins with the reception of the audio signal 14 at the input 12.
- the audio signal 14 is present in a sampled form.
- the sampling has been carried out, for example, by means of an analog / digital converter.
- the sampling took place with a certain sampling frequency ⁇ s .
- the windowing device 28 combines 2N consecutive samples into time blocks, in this case exemplarily with a 50% overlap.
- each of these blocks weights the fenestration 28 with a weighting function as described above.
- the windowing device 28 after each N information values, forwards a new windowed time block to 2N information values to the transformation device 30.
- the repetition frequency of the time blocks is thus ⁇ s / N.
- the transformation means 30 transforms the windowed time blocks into a spectral representation.
- the transformation device 30 performs a spectral decomposition of the time blocks of windowed information values into a plurality of predetermined subbands or spectral components.
- the transformation is a DFT or discrete Fourier transformation.
- the transformation means 30 For each time block to 2N information values, the transformation means 30 generates in this exemplary Case N complex-valued spectral values for N spectral components when the audio signal is real.
- the complex spectral values output by the transformation device 30 represent the time / frequency representation 74 of the audio signal.
- the complex spectral values are in Fig. 2 illustrated by box 76.
- the transformation device 30 Since the transformation device 30 generates at least one spectral value per successive time block of information values per subband or spectral component, the transformation device 30 thus outputs a sequence of spectral values 76 with the frequency ⁇ s / N per subband or spectral component.
- the spectral values output to a time block are in Fig. 2 shown at 74 horizontally along the frequency axis 78 arranged.
- the spectral values output at a subsequent time block are directly adjacent thereto in the vertical direction along the axis 80.
- the axes 78 and 80 thus represent the frequency or time axis of the time / frequency representation of the audio signal 14.
- the sequence of spectral values per subband run in the exemplary representation of Fig. 2 along the columns and are shown at 82a, 82b, 82c and 82d.
- the audio signal 14 is exemplified as a function that is represented by sin (bt) ⁇ (1 + ⁇ ⁇ sin (at)), where ⁇ , for example, the modulation frequency of the envelope of the information signal indicated by the dashed line 84 14, while ⁇ represents the carrier frequency of the audio signal 14, t is the time and ⁇ is the modulation depth.
- ⁇ for example, the modulation frequency of the envelope of the information signal indicated by the dashed line 84 14
- ⁇ represents the carrier frequency of the audio signal
- t the time
- ⁇ is the modulation depth.
- ⁇ s results with this exemplary information signal by the transformation 72 per block of time a block of spectral values 76, ie a line at 74, in which primarily the spectral component or the associated spectral value at the carrier frequency ⁇ has a pronounced maximum.
- the spectral values for this spectral component f ⁇ however, varies in time for successive time blocks due to the variation of the envelope 84. Accordingly, the magnitude of the spectral values of the spectral component ⁇ varies with the modulation frequency ⁇ .
- the different time blocks may each have a different phase offset from the carrier frequency ⁇ due to a frequency mismatch between the time block repetition frequency ⁇ s / N and the carrier frequency of the audio signal 14.
- the spectral values of the spectral blocks resulting from the time blocks in transformation 72 are modulated with a carrier e j ⁇ f , where j represents the imaginary unit, f the frequency and ⁇ the phase offset of the respective time block.
- the phase offset ⁇ increases linearly. Therefore, the spectral values of a subband due to a frequency mismatch between the time block repetition frequency and the carrier frequency also undergo a modulation with a carrier component which depends on the mismatch of the two frequencies.
- the thus determined Modulationseselfrequenz ⁇ (m, f) determines the carrier frequency determining means 32 for each subband ⁇ b or each frequency f blockwise, where m indicates a block index, as will be explained in more detail below.
- the carrier frequency determination device 32 combines M consecutive spectral values 76 of a subband ⁇ b , for example the spectral values a ( ⁇ b , 0) to a ( ⁇ b , M-1). Among these M spectral values, it determines a phase course through phase unwrapping. It then determines, for example by means of a least squares algorithm, a straight line equation which comes closest to the phase curve.
- the carrier frequency determiner 32 From the slope and an intercept, or a phase or initial offset of the line equation, the carrier frequency determiner 32 obtains the desired modulation carrier frequency ⁇ d for subband b with respect to time block m, or a spectral value block phase offset ⁇ for subband b with respect to time block m. This determination carries out the carrier frequency determination device for all subbands over temporally identical spectral values, ie for all spectral value blocks a ( ⁇ b, 0 ) to a ( ⁇ b , M-1 ) with ⁇ b for all subbands 0 ⁇ b ⁇ N.
- the carrier frequency determiner 32 determines a modulation carrier frequency ⁇ d and the spectral value block phase offset ⁇ , block by block.
- the block ordering underlying the determination of the complex carriers for all subbands by the device 32 is that used by the fenestration device for fenestration.
- the carrier frequency determiner 32 outputs the determined values for the complex carriers to the demodulator 34.
- the mixer 34 now mixes the windowed blocks of spectral values of the individual subbands as output from the windowing means 36 with the complex conjugate of the respective modulation carrier frequencies ⁇ d taking into account the spectral value block phase offsets ⁇ by multiplying these subband spectral value blocks by e -j ⁇ ( ⁇ _d ⁇ n + ⁇ )) , wherein, as mentioned above, respectively a different pair of ⁇ d and ⁇ is used for each subband and within each subband for the successive blocks. In this way, the mixer 34 outputs demodulated subband spectral value blocks aligned with each other ie, two-dimensional blocks of N spectral value blocks for each M demodulated spectral values.
- the phase characteristic of the spectral values in the subbands within the blocks is on average flatter and substantially around phase 0. In this way it is achieved that in the subsequent transformation by the transformation means 38, the demodulated and windowed blocks of spectral values lead to a spectral decomposition in which the frequency 0 or the DC component is very well centered.
- the transformation 86 following the demodulation 84 by the mixer 34, is performed by the transformation means 38 on a block-by-block basis on each sub-band or demodulated blocks of spectral values.
- the demodulated spectral value blocks of the N subbands are subjected in block by block to spectral decomposition by the transformation 86.
- the result of the spectral decomposition of the blocks of spectral values may also be referred to as a modulation frequency representation.
- the transform 86 yields a matrix of M x N modulation values representing the frequency / modulation frequency representation of the information signal 14 over the time period of the M time blocks that contributed to that matrix.
- the frequency / modulation frequency representation 88 has two dimensions, namely the frequency 90 and the modulation frequency 92.
- the individual modulation values are symbolized at 88 with box 93.
- the transformation device 38 forwards the modulation matrix to the processing device 40.
- the processing device 40 is according to the present. Embodiment provided to filter out the modulation signal from the audio signal 14. In the present exemplary case, therefore, the processing means 40 performs low pass filtering on the modulation frequency components in the frequency / modulation frequency matrix.
- Fig. 1 For illustration, at 94, a diagram is shown in which the modulation frequency is plotted along the x-axis and the amount of the modulation values is plotted along the y-axis.
- the diagram 94 illustrates a section of the modulation matrix 88 for the exemplary case of the audio signal 14 of FIG Fig. 1 , namely the sinus modulated sine.
- plot of the amounts of the modulation values along the modulation frequency for the subband having the frequency ⁇ , ie the carrier frequency, is shown in the diagram 94.
- the modulation frequency spectrum is substantially perfectly centered - at least in the case of the FFT as the transformation 86 - or correctly aligned.
- the modulation frequency spectrum at the carrier frequency ⁇ two sidebands 96 and 98, which are arranged at the modulation frequency ⁇ , ie the modulation frequency of the envelope 84 of the audio signal 14.
- the modulation values of the modulation matrix 88 have a DC component 100 at the frequency ⁇ .
- the signal processing device 40 is now designed as a low-pass filter with a filter characteristic 102, which is shown with a dashed line, to remove the two sidebands 96 and 98 from the frequency / modulation frequency representation 88. In this way, the audio signal 14 is freed from its modulation component, after which only the carrier component remains.
- the modulation matrix modified in this way forwards the processing device 40 to the inverse transformation device 42.
- the inverse transformation means 42 processes the modified modulation matrix for each subband such that the block of modulation values for the respective subband, ie one Column in the modulation matrix 88, a to the transformation of the transformation means 38 inverse transform is subjected, so that these modulation value blocks are transferred from the frequency / modulation frequency representation back in the time / frequency representation. In this way, inverse transform means 42 generates from each such block of modulation values for each subband a block of spectral values for that subband.
- the preceding description referred primarily to the processing of the first M spectral values or of M consecutive spectral values for each subband.
- the processing by means 32, 34, 36, 38, 40 and 42 is also repeated for subsequent blocks of every M spectral values for each of the N subbands, with an overlap of the blocks to each of M spectral values of, in the present case, by way of example 50%, ie with an overlap per subband around M / 2 spectral values.
- the blocks are in Fig.
- the transformation means 38 generates a modulation matrix of M x N modulation values each, which are filtered by the signal processing means 40 in the manner described above.
- the inverse transformation device 42 again generates from these modified modulation matrices 88 a block of spectral values for each subband, ie a block of spectral values modified with the matrix but still demodulated.
- the blocks of spectral values per subband output by the inverse transform means 42 differ from those obtained from the information signal 14 at the output of the windowing device 36, however not only by the processing by the processing means 40, but also by the change caused by the demodulation.
- the spectral value blocks are therefore modulated in the modulation device 46 again with the modulation carrier component with which they were previously demodulated.
- sequences of blocks of spectral values per subband resulting after the modulation stage 46 are now combined for each subband by the merging device 44 to form a uniform stream 82a-82d of spectral values per subband, by the examples corresponding to the blocks of spectral values, in this case by 50%, overlapping each other and combining corresponding spectral values according to the weighting function used in the fenestration device 36, namely, by adding in the case of the sine or KBD windows exemplified above.
- the streams of spectral values per subband resulting at the output of the merging means 44 represent the time / frequency representation of the processed audio signal 18.
- the streams are received by the inverse transform means 48.
- each time step n it uses the spectral values for all subbands ⁇ b , ie all the spectral values a ( ⁇ b , n) where 0 ⁇ b ⁇ N, in order to perform a transformation from the frequency to the time representation in order to calculate for each n, ie with a repetition period of 2 ⁇ N / ⁇ s to obtain a time block.
- time blocks are overlaid by the merging device 50 by way of example by way of example 50% overlapping and combining mutually corresponding information values in these time blocks is brought together into a uniform stream of information values, which finally represents the processed audio signal in the time domain 18, which is output at the output 16.
- the processed audio signal is in Fig. 1 at 18 in a diagram in which the x-axis is the time and the y-axis the amplitude of the audio signal 18.
- the x-axis is the time and the y-axis the amplitude of the audio signal 18.
- the modulation components or the envelope component 84 has been removed.
- FIG Fig. 1 and 2 a processing device that used a signal adaptive filter bank to decompose signals into carriers and modulation components and used the resulting representation of the modulated signals to filter them.
- a demodulation is carried out per sub-band with respect to a carrier component. After estimating this subband carrier component in the carrier frequency determiner 32, the demodulation per subband is achieved by multiplication with the complex conjugate of that component.
- the subband signals demodulated in this way are then transformed into the modulation range by means of a further frequency decomposition by means of the window device 36 and the transformation device 38.
- Fig. 1 DFT with 50% overlap and windowing was used as the first transformation 72, although deviations and variations are conceivable.
- Several blocks of the first transformation 72 were again - there with 50% overlap example - summarized by the fenestration device 36 and partially bandwise with a complex modulator, which has been determined by the carrier frequency determining means 32, demodulated by the mixer 34 and then transformed with a DFT.
- the frequency of this modulator has been obtained from the phases of the respective blocks of the sub-band to be demodulated, namely by approximating a line through the unwrapped phase characteristic of the spectral values of the corresponding blocks.
- this can also be done differently.
- the carrier frequency determiner 32 may approximate one plane to the phase portion of all subbands in this section per spectral block section n to n + M-1. Furthermore, it would be possible for the carrier frequency determination device 32 to carry out the determination of the complex modulator not in blocks but continuously via the stream of spectral values per subband. For this purpose, for example, the carrier frequency determining device 32 could, for example, first unwrap the phases of the sequence of spectral values of a respective subband, then low pass filter it, and then use the local enhancement of the filtered phase response to adapt the complex modulator. Accordingly, the modulation part at the mixer 46 would also be changed.
- the carrier frequency determiner attempts to influence the phase response by either increasing or decreasing the phase of the complex spectral values of a subband having an increasing or decreasing amount across the sequence such that an average slope of the phase of the sequence of spectral values is reduced. or the unwrapped phase curve is essentially one solid phase value, preferably the phase 0, varies around.
- the complex demodulated subband signal can also be transformed into the frequency / modulation frequency representation separately or separated spectrally, each with a real-valued transformation into real and imaginary parts.
- the real part then represented, after the demodulation stage, the amplitude modulation of the subband signal with respect to the carrier used for demodulation.
- the imaginary part then represented the frequency modulation of this carrier.
- the amplitude modulation component of the subband signal is reflected in the symmetric component of the DFT spectrum along the modulation frequency axis, while the frequency modulation component of the carrier corresponds to the asymmetric component of the DFT spectrum along the modulation frequency axis ,
- the exemplary embodiment described above has been illustrated by way of example on a simple sine-modulated sinusoidal signal.
- the embodiment of Fig. 1 and 2 is also suitable for filtering the course of the envelope of a mixture of amplitude modulated signals of any frequency, such as amplitude modulated tonal signals.
- the individual frequency components of the envelope are directly represented in the modulation matrix 88 for consistent processing, in contrast to the already known magnitude-phase representation according to the modulation transformation analysis method for audio coding described in the introduction to the description.
- the filtering of frequency modulated signals low modulation depth, ie with a frequency deviation, the essential is smaller than the subband width of the first DFT is, with the embodiment of Fig. 1 and 2 possible.
- Fig. 1 and 2 Thus, an arrangement for modulation filtering, which was expressed in other words again based on a signal adaptive transformation, a filtering in the modulation range and a corresponding inverse transformation. Without signal manipulation in the modulation range, in the present embodiment of the filtering, the arrangement is made Fig. 1 perfectly reconstructed.
- an appropriate spectral range filter such as filter 102, ie, attenuating the modulation values with increasing distance from a center modulation frequency of zero, the modulation components to be removed may be attenuated as desired.
- filter 102 ie, attenuating the modulation values with increasing distance from a center modulation frequency of zero
- the modulation components to be removed may be attenuated as desired.
- other types of processing of audio signals in the frequency / modulation frequency representation are also conceivable. So it might also be desirable to remove only the carrier.
- the filtering would consist of a high-pass filtering, ie a weighting function with a modulation frequency edge at a certain modulation frequency, which weakens modulation values at lower modulation frequencies more than those at higher modulation frequencies.
- the signal processing in the signal processing device 40 could again consist of bandpass filtering, ie weighting with a weighting function falling away from a certain center modulation frequency, to separate portions of the audio signal originating from different sources, ie to achieve a source separation.
- Other applications in which the foregoing embodiment may be used may involve audio coding for encoding audio signals, disturbed signal reconstruction, and error concealment.
- the device 10 could be used as a music effect device to special acoustic effects in the incoming audio signal.
- the processing in the signal processing device 40 can accordingly take on a very wide variety of forms, such as the quantization of the modulation values, the zeroing of some modulation values, the weighting of individual sections of the or all modulation values or the like.
- Another application would be the use of the device 10 of Fig. 1 as a watermark embedder.
- the watermark embedder would receive an audio signal 14, wherein the processor 40 could introduce a received watermark into the audio signal by modifying individual segments or modulation values according to the watermark.
- the selection of the segments or modulation values could be different or time-varying for successive modulation matrices and would be made such that by psychoacoustic masking effects the modifications due to the human acoustic watermark insertion in the resulting watermarked audio signal 18 are inaudible.
- the transformation devices can of course also be embodied as filter banks which produce a spectral representation through many individual bandpass filters. It should also be noted that the resulting audio signal 18 does not have to be output in the time domain representation after processing. It would also be conceivable to output the information signal, for example in a time / spectral representation or even in the spectral / modulation spectral representation. In the latter case, of course, it would then have to be ensured that the necessary modulation 46 can again be performed on the receiver side with the suitable carrier, for example by supplying the complex carriers varying for each subband and spectral value block which were used for demodulation 84. In this way, the above embodiment could be used to implement a compression method.
- the inventive scheme can also be implemented in software.
- the implementation may be on a digital storage medium, in particular a floppy disk or a CD with electronically readable control signals, which may cooperate with a programmable computer system such that the corresponding method is executed.
- the invention thus also consists in a computer program product with program code stored on a machine-readable carrier for carrying out the method according to the invention when the computer program product runs on a computer.
- the invention can thus be realized as a computer program with a program code for carrying out the method when the computer program runs on a computer.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Optical Communication System (AREA)
- Holo Graphy (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Liquid Crystal (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Spectrometry And Color Measurement (AREA)
Abstract
Description
Die vorliegende Erfindung bezieht sich auf die Verarbeitung von Audiosignalen und insbesondere auf die Verarbeitung im Spektral-/Modulationsspektralbereich.The present invention relates to the processing of audio signals, and more particularly to spectral / modulation spectral processing.
Im Bereich der Signalverarbeitung, beispielsweise bei der Verarbeitung digitaler Audiosignale, existieren häufig Signale, die aus einem Trägersignalanteil und einem Modulationsanteil bestehen. In dem Fall modulierter Signale wird eine Repräsentation, in der die Signale in Träger- und Modulationskomponenten zerlegt sind, häufig benötigt, um diese beispielsweise filtern, codieren oder anderweitig modifizieren zu können.In the field of signal processing, for example in the processing of digital audio signals, signals which consist of a carrier signal component and a modulation component frequently exist. In the case of modulated signals, a representation in which the signals are decomposed into carrier and modulation components is often needed to be able to filter, encode or otherwise modify them, for example.
Zu Zwecken der Audiocodierung ist es beispielsweise bekannt, das Audiosignal einer sogenannten Modulationstransformation zu unterziehen. Dabei wird das Audiosignal durch eine Transformation in Frequenzbänder zerlegt. Anschließend wird eine Zerlegung in Betrag und Phase vorgenommen. Während die Phase nicht weiterverarbeitet, werden die Beträge je Teilband über eine Anzahl von Transformationsblöcken in einer zweiten Transformation erneut transformiert. Das Ergebnis ist eine Frequenzzerlegung der zeitlichen Hüllkurve des betreffenden Teilbandes in Modulationskoeffizienten. Audiocodierungen, die auf einer solchen Modulationstransformation bestehen, sind beispielsweise in
Einen Überblick über weitere verschiedene Demodulationstechniken über die volle Bandbreite des zu demodulierenden Signals, einschließlich asynchroner und synchroner Demodulationstechniken etc., gibt beispielsweise der Artikel
Ein Nachteil der oben genannten Schemata zur Audiocodierung unter Verwendung einer Modulationstransformation besteht in der folgenden Tatsache. Solange an den Modulationskoeffizienten zusammen mit den Phasen keine weitere Bearbeitungsschritte vorgenommen werden, bilden die Modulationskoeffizienten eine Spektral-/Modulationsspektraldarstellung des Audiosignals, die reversibel und perfekt rekonstruierend ist, d.h. ohne Veränderungen wieder ins ursprüngliche Audiosignal im Zeitbereich rückkonvertierbar ist. Bei diesen Verfahren werden jedoch die Modulationskoeffizienten gefiltert, um nach psychoakustischen Kriterien die Modulationskoeffizienten auf möglichst kleine Werte zu verringern bzw. quantisieren, so dass eine möglichst hohe Kompressionsrate erzielt wird. Hierdurch erreicht man jedoch im allgemeinen nicht das gewünschte Ziel, die betreffenden Modulationskomponenten aus dem resultierenden Signal zu entfernen oder bei dieser Komponente gezielt Quantisierungsrauschen einzubringen. Der Grund dafür besteht darin, dass die Phasen der Teilbänder nach der Rücktransformation der veränderten Modulationskoeffizienten nicht mehr konsistent mit den veränderten Beträgen dieser Teilbänder sind und auch weiterhin starke Komponenten des Modulationsanteiles des Originalsignals enthalten. Werden nun die Phasen der Teilbänder mit den veränderten Beträgen rekombiniert, werden diese Modulationsanteile bzw. -komponenten durch die Phase wieder in das gefilterte oder quantisierte Signal eingebracht. Mit anderen Worten ausgedrückt, liefert eine Modulationstransformation gefolgt von einer Modifikation der Modülationskoeffizienten auf die oben dargestellte Weise, also durch Filterung der Modulationskoeffizienten, zusammen mit einer anschließenden Synthese des Phasen- und Betragsanteils ein Signal, das bei einer erneuten Analyse bzw. Modulationstransformation immer noch erhebliche Modulationskomponenten an denjenigen Stellen in der Spektral-/Modulationsspektralbereichsdarstellung enthält, die ausgefiltert werden sollten. Eine wirksame Filterung ist also basierend auf den eingehend genannten Modulationstransformations-basierten Signalverarbeitungsschemata nicht möglich.A disadvantage of the above-mentioned audio coding schemes using a modulation transformation is the following fact. As long as no further processing steps are performed on the modulation coefficients together with the phases, the modulation coefficients form a spectral / modulation spectral representation of the audio signal which is reversible and perfectly reconstructive, ie can be reconverted back to the original audio signal in the time domain without changes. In these methods, however, the modulation coefficients are filtered in order to reduce or quantize the modulation coefficients according to psychoacoustic criteria to the smallest possible values, so that the highest possible compression rate is achieved. However, this does not generally achieve the desired goal of removing the relevant modulation components from the resulting signal or of deliberately introducing quantization noise in this component. The reason for this is that the phases of the subbands after the inverse transformation of the modified modulation coefficients are no longer consistent with the changed amounts of these subbands and still contain strong components of the modulation component of the original signal. If the phases of the subbands are recombined with the changed amounts, these modulation components or components are again introduced into the filtered or quantized signal by the phase. In other words, provides a modulation transformation followed by a modification of the modulation coefficients in the manner described above, that is to say by filtering the modulation coefficients, together with a subsequent synthesis of the phase and magnitude components, a signal which, in a renewed analysis or modulation transformation, still contains significant modulation components at those points in the spectral range. / Modulation spectral range representation that should be filtered out. Effective filtering is therefore not possible based on the detailed modulation transformation-based signal processing schemes.
Es besteht deshalb ein Bedarf nach einem Audiosignalverarbeitungsschema, das es ermöglicht, modulierte Signale mit einem Trägeranteil und einem Modulationsanteil gezielter nach Modulations- und Trägeranteil getrennt verarbeiten zu können.There is therefore a need for an audio signal processing scheme that makes it possible to separately process modulated signals having a carrier component and a modulation component according to modulation and carrier component.
Die Aufgabe der vorliegenden Erfindung besteht folglich darin, ein Verarbeitungsschema für Audiosignale zu schaffen, das eine gezielter nach Modulations- und Trägeranteilen getrennte Verarbeitung von Audiosignalen ermöglicht.The object of the present invention is thus to provide a processing scheme for audio signals, which allows a specific processing of audio signals separately according to modulation and carrier portions.
Diese Aufgabe wird durch eine Vorrichtung gemäß Anspruch 1 und ein Verfahren gemäß Anspruch 17 gelöst.This object is achieved by a device according to
Der Kerngedanke der vorliegenden Erfindung besteht darin, dass sich eine strikter nach Modulations- und Trägeranteilen getrennte Verarbeitung von Audiosignalen erzielen lässt, wenn die Überführung des Informationssignals von der Zeit-/Spektraldarstellung bzw. der Zeit-/Frequenzdarstellung in die Spektral-/Modulationsspektraldarstellung bzw. die Frequenz-/Modulationsfrequenzdarstellung abhängig von sowohl einem Betragsanteil als auch einem Phasenanteil der Zeit-/Spektraldarstellung des Informationssignals durchgeführt wird. Hierdurch entfällt eine Rekombination zwischen Phase und Betrag, und damit die Wiedereinführung von unerwünschten Modulationskomponenten in die Zeitdarstellung des verarbeiteten Audiosignals auf der Syntheseseite.The core idea of the present invention is that it is possible to achieve a more strictly processing of audio signals separately for modulation and carrier components if the transfer of the information signal from the time / spectral representation or the time / frequency representation into the spectral / modulation spectral representation or the frequency / modulation frequency representation is performed depending on both an amount component and a phase component of the time / spectral representation of the information signal. This eliminates a recombination between phase and magnitude, and thus the reintroduction of unwanted modulation components in the time representation of the processed audio signal on the synthesis side.
Die Überführung des Audiosignals von der Zeit-/Spektraldarstellung in die Spektral-/Modulationsspektraldarstellung unter Berücksichtigung sowohl des Betrags als auch der Phase bringt das Problem mit sich, dass die Zeit-/Spektraldarstellung des Informationssignals tatsächlich nicht nur von dem Audiosignal sondern auch von dem Phasenversatz der Zeitblöcke zu der Trägerspektralkomponente des Audiosignals abhängt. Anders ausgedrückt bewirkt die blockweise Transformation des Audiosignals von der Zeitdarstellung in die Zeit/Spektraldarstellung, dass die pro Spektralkomponente in der Zeit-/Spektraldarstellung des Audiosignals erhaltenen Folgen von Spektralwerten einen aufmodulierten komplexen Träger aufweisen, der lediglich von der Asynchronität der Blockwiederholfrequenz zu der Trägerfrequenzkomponente des Audiosignals abhängt. Gemäß den Ausführungsbeispielen der vorliegenden Erfindung wird deshalb pro Spektralkomponente eine Demodulation der Folge von Spektralwerten in der Zeit-/Spektraldarstellung des Audiosignals vorgenommen, um pro Spektralkomponente eine demodulierte Folge von Spektralwerten zu erhalten. Die anschließende Überführung der so erhaltenen demodulierten Folgen von Spektralwerten wird durch blockweise Transformationen von der Zeit/Spektraldarstellung in die Spektral/Modulationsspektraldarstellung bzw. durch blockweises spektrales Zerlegen derselben durchgeführt, wodurch Blöcke von Modulationswerten erhalten werden. Diese werden manipuliert bzw. modifiziert, wie z.B. zur Bandpassfilterung zur Entfernung des Modulationsanteils aus dem ursprünglichen Audiosignal mit einer entsprechenden Gewichtungsfunktion gewichtet. Das Ergebnis ist eine modifizierte demodulierte Folge von Spektralwerten bzw. modifizierte demodulierte Zeit/Spektraldarstellung. Auf die so erhaltenen modifizierten demodulierten Folgen von Spektralwerten wird der komplexe Träger wieder aufmoduliert, wodurch eine modifizierte Folge von Spektralwerten erhalten wird, die einen Teil einer Zeit-/Spektraldarstellung des verarbeiteten Audiosignals darstellt. Eine Rücküberführung dieser Darstellung in die Zeitdarstellung ergibt ein verarbeitetes Audiosignal in der Zeitdarstellung bzw. Zeitbereich, das im Hinblick auf Modulations- und Trägeranteile äußerst genau bezüglich des ursprünglichen Audiosignals verändert sein kann.Transferring the audio signal from the time / spectral representation to the spectral / modulation spectral representation, taking into account both the magnitude and the phase, involves the problem that the time / spectral representation of the information signal is in fact not only from the audio signal but also from the phase offset the time blocks to the carrier spectral component of the audio signal depends. In other words, the block-wise transformation of the audio signal from the time representation into the time / spectral representation causes the sequences of spectral values obtained per spectral component in the time / spectral representation of the audio signal to be a modulated complex Carrier, which depends only on the asynchronicity of the block repetition frequency to the carrier frequency component of the audio signal. According to the exemplary embodiments of the present invention, a demodulation of the sequence of spectral values in the time / spectral representation of the audio signal per spectral component is therefore undertaken in order to obtain a demodulated sequence of spectral values per spectral component. The subsequent conversion of the demodulated sequences of spectral values thus obtained is carried out by block-wise transforms from the time / spectral representation into the spectral / modulation spectral representation or by blockwise spectral decomposition of the same, whereby blocks of modulation values are obtained. These are manipulated or modified, such as weighted for bandpass filtering to remove the modulation component from the original audio signal with a corresponding weighting function. The result is a modified demodulated sequence of spectral values or modified demodulated time / spectral representation. On the modified demodulated sequences of spectral values thus obtained, the complex carrier is re-modulated, whereby a modified sequence of spectral values is obtained which forms part of a time / spectral representation of the processed audio signal. A return of this representation into the time representation results in a processed audio signal in the time representation or time domain, which can be changed very precisely with respect to modulation and carrier components with respect to the original audio signal.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:
- Fig. 1
- ein Blockschaltbild einer Vorrichtung zur Verarbeitung eines Audiosignals gemäß einem Ausführungsbeispiel der vorliegenden Erfindung; und
- Fig. 2
- eine schematische Skizze zur Veranschaulichung der Funktionsweise der Vorrichtung nach
Fig. 1 .
- Fig. 1
- a block diagram of an apparatus for processing an audio signal according to a Embodiment of the present invention; and
- Fig. 2
- a schematic diagram for illustrating the operation of the device according to
Fig. 1 ,
Intern gliedert sich die Vorrichtung 10 im wesentlichen in einen Teil 20 zur Überführung des Audiosignals 14 von einer Zeitdarstellung in eine Zeit-/Frequenzdarstellung, eine Einrichtung 22 zur Überführung des Audiosignals von der Zeit-/Frequenzdarstellung in die Frequenz-/Modulationsfrequenzdarstellung, einen Teil 24, in welchem die eigentliche Verarbeitung stattfindet, nämlich die Modifikation des Audiosignals, und einen Teil 26 zur Rücküberführung des in der Frequenz-/Modulationsfrequenzdarstellung verarbeiteten Audiosignals von dieser Darstellung in die Zeitdarstellung. Die genannten vier Teile sind in dieser Reihenfolge zwischen den Eingang 12 und den Ausgang 16 in Reihe geschaltet, wobei deren genauerer Aufbau und deren genauere Funktionsweise im folgenden beschrieben wird.Internally, the
Der Teil 20 der Vorrichtung 10 umfasst eine Fensterungseinrichtung 28 und eine Transformationseinrichtung 30, die sich in dieser Reihenfolge an den Eingang 12 anschließen. Insbesondere ist ein Eingang der Fensterungseinrichtung 28 mit dem Eingang 12 verbunden, um das Audiosignal 14 als eine Folge von Informationswerten zu erhalten. Sollte das Audiosignal noch als analoges Signal vorliegen, kann dies beispielsweise durch einen A/D-Wandler bzw. eine diskrete Abtastung in eine Folge von Informations- bzw. Abtastwerten überführt werden. Die Fensterungseinrichtung 28 bildet aus der Folge von Informationswerten Blöcke zu je gleicher Anzahl an Informationswerten und führt an jedem Block von Informationswerten zudem eine Gewichtung mit einer Gewichtungsfunktion durch, die beispielsweise aber nicht ausschließlich einem Sinusfenster oder einem KBD-Fenster entsprechen kann. Die Blöcke können sich überlappen, wie z.B. um 50%, oder nicht. Im folgenden wird lediglich exemplarisch von einer 50%-Überlappung ausgegangen. Bevorzugt werden Fensterfunktionen mit der Eigenschaft, dass sie eine gute Teilbandtrennung in der Zeit/Spektraldarstellung ermöglichen und sich die Quadrate ihrer einander korrespondierenden, da auf ein und denselben Informationswert angewendeten, Gewichtungswerte im Überlappungsbereich zu Eins addieren.The part 20 of the
Ein Ausgang der Fensterungseinrichtung 28 ist mit einem Eingang der Transformationseinrichtung 30 verbunden. Die von der Fensterungseinrichtung 28 ausgegeben Blöcke von Informationswerten werden von der Transformationseinrichtung 30 empfangen. Dieselben unterzieht die Transformationseinrichtung 30 dann blockweise einer spektral zerlegenden Transformation, wie z.B. einer DFT oder einer anderen komplexen Transformation. Die Transformationseinrichtung 30 erzielt somit blockweise eine Zerlegung des Audiosignals 14 in Spektralkomponenten und erzeugt somit insbesondere pro Zeitblock, wie er von der Fensterungseinrichtung 28 erhalten wird, einen Block von Spektralwerten, der einen Spektralwert pro Spektralkomponente umfasst. Mehrere Spektralwerte können zu Teilbändern zusammengefasst sein. Im folgenden werden allerdings die Begriffe Teilband und Spektralkomponente synonym verwendet. Für jede Spektralkomponente bzw. jedes Teilband ergibt sich somit pro Zeitblock ein Spektralwert, oder mehrere, falls eine Teilbandzusammenfassung vorliegt, was im folgenden jedoch nicht angenommen wird. Dementsprechend gibt die Transformationseinrichtung 30 pro Spektralkomponente bzw. Teilband eine Folge von Spektralwerten aus, die den zeitlichen Verlauf dieser Spektralkomponente bzw. dieses Teilbandes darstellen. Die von der Transformationseinrichtung 30 ausgegebenen Spektralwerte stellen eine Zeit-/Frequenzdarstellung des Audiosignals 14 dar.An output of the
Der Teil 22 umfasst eine Trägerfrequenzbestimmungseinrichtung 32, einen als Demodulationseinrichtung dienenden Mischer 34, eine Fensterungseinrichtung 36, und eine zweite Transformationseinrichtung 38.The
Die Fensterungseinrichtung 32 umfasst einen Eingang, der mit dem Ausgang der Transformationseinrichtung 30 verbunden ist. Sie empfängt dort die Spektralwertfolgen für die einzelnen Teilbänder und teilt die Spektralwertfolgen pro Teilband - ähnlich, wie es die Fensterungseinrichtung 28 bezüglich des Audiosignals 14 tut - in Blöcke ein und gewichtet die Spektralwerte jedes Blocks mit einer geeigneten Gewichtungsfunktion. Die Gewichtungsfunktion kann eine der bereits im vorhergehenden bezüglich Einrichtung 28 exemplarisch erwähnten Gewichtungsfunktionen sein. Die aufeinanderfolgenden Blöcke in einem Teilband können sich überlappen oder nicht, wobei im folgenden wieder exemplarisch von einer gegenseitigen Überlappung um 50% ausgegangen wird. Im folgenden wird davon ausgegangen, dass die Blöcke verschiedener Teilbänder zueinander ausgerichtet sind, wie es im folgenden bezugnehmend auf
Auch die Trägerfrequenzbestimmungseinrichtung 32 umfasst einen Eingang, der mit dem Ausgang der Transformationseinrichtung 30 verbunden ist, um die Spektralwerte der Teilbänder bzw. Spektralkomponenten als Folgen von Spektralwerten pro Teilband zu erhalten. Sie ist dazu vorgesehen, in jedem Teilband diejenige Trägerkomponente herauszufinden, die dadurch herrührt, dass die einzelnen Zeitblöcke, aus denen die einzelnen Spektralwerte der Teilbänder abgeleitet worden sind, einen zeitlich variierenden Phasenversatz zu der Trägerfrequenzkomponente des Audiosignals 14 aufweisen. Die pro Teilband bestimmte Trägerkomponente gibt die Trägerfrequenzbestimmungseinrichtung 32 an ihrem Ausgang an einen Eingang des Mischers 34 aus, der wiederum einen weiteren Eingang aufweist, der mit dem Ausgang der Fensterungseinrichtung 36 verbunden ist.The carrier
Der Mischer 34 ist derart ausgebildet, dass er je Teilband die Blöcke von gefensterten Spektralwerten, wie sie von der Transformationseinrichtung ausgegeben werden, mit dem komplex Konjugierten der jeweiligen Trägerkomponente multipliziert, wie sie durch die Trägerfrequenzbestimmungseinrichtung 30 für das jeweilige Teilband bestimmt worden ist, wodurch die Teilbänder bzw. Blöcke von gefensterten Spektralwerten demoduliert werden.The
Am Ausgang des Mischers 34 ergeben sich somit demodulierte Teilbänder bzw. ergibt sich pro Teilband eine Folge von demodulierten Blöcken von gefensterten Spektralwerten. Der Ausgang des Mischers 34 ist mit einem Eingang der Transformationseinrichtung 38 verbunden, so dass letztere pro Teilband sich gegenseitig - hier exemplarisch 50% - überlappende Blöcke von gefensterten und demodulierten Spektralwerten erhält und diese blockweise in die Spektral/Modulationsspektraldarstellung transformiert bzw. spektral zerlegt, um durch Verarbeitung aller Teilbänder bzw. Spektralkomponenten eine bisher lediglich in Hinblick auf die Demodulation der Teilbandspektralwertfolgen modifizierte Frequenz-/Modulationsfrequenzdarstellung des Audiosignals 14 zu erzeugen. Die der Transformationseinrichtung 38 pro Teilband zugrundeliegende Transformation kann beispielsweise eine DFT, eine MDCT, MDST oder dergleichen sein, und insbesondere auch die gleiche Transformation wie diejenige der Transformationseinrichtung 30. In
Dementsprechend gibt die Transformationseinrichtung 38 an ihrem Ausgang für jedes Teilband bzw. jede Spektralkomponente nacheinander Blöcke von Werten aus, die im folgenden als Modulationswerte bezeichnet werden und eine spektral Zerlegung der Blöcke von gefensterten und demodulierten Spektralwerten darstellen. Die Blöcke von Spektralwerten pro Teilband, bezüglich derer die Transformationseinrichtung 38 die Transformationen durchführt, sind zeitlich zueinander ausgerichtet, so dass sich pro Zeitabschnitt immer gleich eine sich aus einem Modulationswertblock pro Teilband zusammensetzende Matrix von Modulationswerten ergibt. Die Modulationswerte gibt die Transformationseinrichtung 38 an den Teil 24 weiter, der lediglich eine Signalverarbeitungseinrichtung 40 aufweist.Accordingly, at its output, the transformation means 38 successively outputs blocks of values for each sub-band or spectral component, hereinafter referred to as modulation values, representing a spectral decomposition of the blocks of windowed and demodulated spectral values. The blocks of spectral values per subband, with respect to which the transformation means 38 performs the transformations, are aligned with respect to one another in time, so that a time interval always results in a matrix of modulation values composed of one modulation value block per subband. The modulation values are forwarded by the
Die Signalverarbeitungseinrichtung 40 ist mit dem Ausgang der Transformationseinrichtung 38 verbunden und erhält somit die Blöcke von Modulationswerten. In dem vorliegenden exemplarischen Fall, da die Vorrichtung 10 der Modulationsanteilunterdrückung dient, vollzieht die Signalverarbeitungseinrichtung 40 eine effektive Tiefpassfilterung im Frequenzbereich an den eingehenden Blöcken von Modulationswerten, nämlich eine Gewichtung der Modulationswerte mit einer Funktion, die ausgehend von der Modulationsfrequenz Null zu höheren bzw. niedrigeren Modulationsfrequenzen abfällt. Die derart modifizierten Blöcke von Modulationswerten gibt die Signalverarbeitungseinrichtung 40 an den Rücküberführungsteil 26 weiter. Die von der Signalverarbeitungseinrichtung 40 ausgegebenen modifizierten Blöcke von Modulationswerten stellen eine modifizierte Frequenz-/Modulationsfrequenzdarstellung des Informationssignals 14 dar, oder anders ausgedrückt eine noch um die Demodulation durch den Mischer 34 von der Frequenz-/Modulationsfrequenzdarstellung des modifizierten Informationssignals 18 abweichende Frequenz-/Modulationsfrequenzdarstellung.The signal processing device 40 is connected to the output of the
Der Rücküberführungsteil 26 gliedert sich seinerseits wiederum in zwei Teile, nämlich einen Teil zur Überführung des verarbeiteten Audiosignals 18 aus der Frequenz-/Modulationsfrequenzdarstellung, wie sie von der Signalverarbeitungseinrichtung 40 ausgegeben wird, in die Zeit-/Frequenzdarstellung, und einen Teil zur Rücküberführung des verarbeiteten Audiosignals von der Zeit-/Frequenzdarstellung in die Zeitdarstellung. Der erstgenannte der beiden Teile umfasst eine Transformationseinrichtung 42 zur Durchführung einer zu der Transformation nach der Transformationseinrichtung 38 inversen blockweisen Transformation, einen Mischer 46 und eine Zusammenfügungseinrichtung 44. Der zweitgenannte Teil des Rückführungsteils 26 umfasst eine Transformationseinrichtung 48 zur Durchführung einer zu der Transformation der Transformationseinrichtung 30 inversen blockweisen Transformation und eine Zusammenfügungseinrichtung 50.The
Die inverse Transformationseinrichtung 42 ist mit ihrem Eingang an den Ausgang der Signalverarbeitungseinrichtung 40 angeschlossen und transformiert die modifizierten Blöcke von Modulationswerten teilbandweise von der Spektraldarstellung zurück in die Zeit/Frequenzdarstellung und macht damit die spektrale Zerlegung wieder rückgängig, um pro Teilband eine Folge von modifizierten Blöcken von Spektralwerten zu erhalten. Diese von der inversen Transformationseinrichtung 42 ausgegebenen modifizierten Spektralwertblöcke unterscheiden sich von den Spektralwertblöcken, wie sie von der Fensterungseinrichtung 36 ausgegeben worden sind, aber nicht nur durch die Verarbeitung durch die Signalverarbeitungseinrichtung 40 sondern auch durch die durch den Mischer 34 bewirkte Demodulation. Deshalb empfängt der Mischer 46 die von der inversen Transformationseinrichtung 42 pro Teilband ausgegebenen Folgen von modifizierten Spektralwertblöcken und mischt dieselben mit einem komplexen Träger, der zu demjenigen, der an entsprechender Stelle bzw. für den entsprechenden Block zur Demodulation des Audiosignals an dem Mischer 34 verwendet worden ist, komplex konjugiert ist, um die Spektralwertblöcke wieder mit dem durch die Phasenversätze der Zeitblöcke bewirkten Träger zu modulieren. Das Ergebnis, das sich am Ausgang des Mischers 46 einstellt, ist pro Teilband eine Folge von modifizierten nicht-demodulierten Spektralwertblöcken.The inverse transformation means 42 is connected with its input to the output of the signal processing means 40 and transforms the modified blocks of modulation values partially bandwise from the spectral representation back into the time / frequency representation and thus reverses the spectral decomposition to a subsequence of modified blocks of To obtain spectral values. These modified spectral value blocks output by the inverse transformation means 42 differ from the spectral value blocks as output by the
Der Ausgang des Mischer 46 ist mit einem Eingang der Zusammenfügungseinrichtung 44 verbunden. Diese führt pro Teilband die Folge von wieder mit dem komplexen Träger aufmodulierten modifizierten Blöcken von Spektralwerten zu einem einheitlichen Strom bzw. einer einheitlichen Folge von Spektralwerten zusammen, indem sie einander entsprechende Spektralwerte benachbarter bzw. aufeinanderfolgender Blöcke von Spektralwerten für ein Teilband, wie sie von dem Mischer 46 erhalten werden, geeignet miteinander verknüpft. In dem Fall der Verwendung oben exemplarisch genannter Gewichtungsfunktionen mit der positiven Eigenschaft, dass sich bei Überlappung die Quadrate einander korrespondierender Gewichtungswerte zu Eins summieren, besteht die Verknüpfung in einer einfachen Addition einander zugeordneter Spektralwerte. Das am Ausgang der Zusammenfügungseinrichtung 44 (OLA = overlap-add = Überlappaddierung) ausgegebene Ergebnis setzt sich aus einer modifizierten Folge von Spektralwerten pro Teilband zusammen. Das Ergebnis, das somit am Ausgang des der OLA 44 ausgegeben wird, sind somit modifizierte Teilbänder bzw. modifizierte Folgen von Spektralwerten für alle Spektralkomponenten und stellt eine modifizierte Zeit-/Frequenzdarstellung des Informationssignals 14 bzw. eine Zeit-/Frequenzdarstellung des modifizierten Audiosignals 18 dar.The output of the
Die Transformationseinrichtung 48 empfängt die Spektralwertfolgen und somit insbesondere nacheinander jeweils einen Spektralwert für alle Teilbänder bzw. Spektralkomponenten bzw. nacheinander eine spektrale Zerlegung eines Abschnitts des modifizierten Audiosignals 18. Sie erzeugt aus der Folge von spektralen Zerlegungen durch Rückgängigmachung der Spektralzerlegung eine Folge von modifizierten Zeitblöcken. Diese modifizierten Zeitblöcke empfängt wiederum die Zusammenfügungseinrichtung 50. Die Zusammenfügungseinrichtung 50 arbeitet ähnlich der Zusammenfügungseinrichtung 44. Sie fügt die sich exemplarisch um 50% überlappenden modifizierten Zeitblöcke dadurch zusammen, dass sie aus benachbarten bzw. aufeinanderfolgenden modifizierten Zeitblöcken einander entsprechende Informationswerte addiert. Das Ergebnis am Ausgang der Zusammenfügungseinrichtung 50 ist somit eine Folge von Informationswerten, die das verarbeitete Audiosignal 18 darstellen.The
Nachdem nun im vorhergehenden der Aufbau der Vorrichtung 10 sowie die Funktionsweise der Einzelkomponenten beschrieben worden ist, wird im folgenden die Funktionsweise derselben Bezug nehmend auf
Die Verarbeitung des Audiosignals durch die Vorrichtung 10 beginnt mit dem Empfang des Audiosignals 14 am Eingang 12. Das Audiosignal 14 liegt dabei in einer abgetasteten Form vor. Die Abtastung ist beispielsweise mittels eines Analog/Digital-Wandlers vorgenommen worden. Die Abtastung erfolgte mit einer gewissen Abtastfrequenz ωs. Das Informationssignal 14 erreicht den Eingang 12 folglich als eine Folge von Abtast- bzw. Informationswerten si = s (2π/ωs · i), wobei s das analoge Informationssignal, si die Informationswerte und der Index i ein Index für die Informationswerte sein sollen. Unter den eingehenden Abtastwerten si fasst die Fensterungseinrichtung 28 je 2N aufeinanderfolgende Abtastwerte zu Zeitblöcken zusammen, vorliegend exemplarisch mit einer 50%-igen Überlappung. Beispielsweise fasst sie die Abtastwerte s0 bis s2N-1 zu einem Zeitblock mit dem Index n = 0 zusammen, die Abtastwerte sN bis s3N-1 zu einem zweiten Zeitblock mit dem Index n = 1, die Abtastwerte s2N bis s4N-1 zu einem dritten Zeitblock von Informationswerten mit dem Index n = 2 usw. zusammen. Jeden dieser Blöcke gewichtet die Fensterungseinrichtung 28 mit einer Fenster- bzw. Gewichtungsfunktion, wie es im Vorhergehenden beschrieben wurde. Seien sn 0 bis sn 2N-1 beispielsweise die 2N Informationswerte des Zeitblocks n, dann ergibt sich der durch die Einrichtung 28 ausgegebene Block schließlich zu sn 0 → sn 0 · g0 bis sn 2N-1 → sn 2N-1 · g2N-1, wobei gi mit i = 0 bis 2N-1 die Gewichtungsfunktion sei.The processing of the audio signal by the
In
Die Transformationseinrichtung 30 transformiert die gefensterten Zeitblöcke in eine Spektraldarstellurig. Die Transformationseinrichtung 30 führt dabei eine spektrale Zerlegung der Zeitblöcke von gefensterten Informationswerten in eine Mehrzahl von vorbestimmten Teilbändern bzw. Spektralkomponenten durch. Im vorliegenden Fall wird exemplarisch davon ausgegangen, dass es sich bei der Transformation um eine DFT bzw. diskrete Fouriertransformation handelt. Für jeden Zeitblock zu 2N Informationswerten erzeugt die Transformationseinrichtung 30 in diesem exemplarischen Fall N komplexwertige Spektralwerte für N Spektralkomponenten, wenn das Audiosignal reell ist. Die von der Transformationseinrichtung 30 ausgegebenen komplexen Spektralwerte stellen die Zeit-/-Frequenzdarstellung 74 des Audiosignals dar. Die komplexen Spektralwerte sind hierbei in
Es wird wieder kurz auf
Die bisherige Betrachtung ließ aber außer acht, dass die verschiedenen Zeitblöcke aufgrund einer Frequenzfehlanpassung zwischen der Zeitblockwiederholfrequenz ωs/N und der Trägerfrequenz des Audiosignals 14 jeweils einen unterschiedlichen Phasenversatz zur Trägerfrequenz β aufweisen können. Je nach dem Phasenversatz sind die Spektralwerte der Spektralblöcke, die sich bei Transformation 72 aus den Zeitblöcken ergeben, mit einem Träger ejΔϕf moduliert, wobei j die imaginäre Einheit, f die Frequenz und Δϕ den Phasenversatz des jeweiligen Zeitblocks darstelle. Bei im wesentlichen gleicher Trägerfrequenz, wie es in dem vorliegenden exemplarischen Fall der Fall ist, nimmt der Phasenversatz Δϕ linear zu. Deshalb erfahren auch die Spektralwerte eines Teilbandes aufgrund einer Frequenzfehlanpassung zwischen der Zeitblockwiederholfrequenz und der Trägerfrequenz eine Modulation mit einer Trägerkomponente, die von der Fehlanpassung der beiden Frequenzen abhängt.However, the previous consideration ignored that the different time blocks may each have a different phase offset from the carrier frequency β due to a frequency mismatch between the time block repetition frequency ω s / N and the carrier frequency of the
Dies in Betracht ziehend leitet nun die Trägerfrequenzbestimmungseinrichtung 32 aus den Spektralwerten a(ωb, n) die durch den Phasenversatz der Zeitblöcke resultierende bzw. durch den Zeitblockphasenversatz bewirkte Trägerkomponente in den Teilbändern ab, wobei ωb die Kreisfrequenz ω bzw. Frequenz f (ω=2πf) des jeweiligen Teilbandes 0≤b<N unter allen N Teilbändern und n der Zeitblock- bzw. Spektralblockindex sei, der gemäß n = ωs · t mit der Zeit t zusammenhängt. Die so ermittelte Modulationsträgerfrequenz ω (m,f) bestimmt die Trägerfrequenzbestimmungseinrichtung 32 für jedes Teilband ωb bzw. jede Frequenz f blockweise, wobei m einen Blockindex anzeige, wie er im folgenden noch näher erläutert wird. Dazu fasst die Trägerfrequenzbestimmungseinrichtung 32 je M aufeinanderfolgende Spektralwerte 76 eines Teilbandes ωb zusammen, wie z.B. die Spektralwerte a (ωb, 0) bis a (ωb, M-1). Unter diesen M Spektralwerten bestimmt sie einen Phasenverlauf durch ein Phasenunwrapping. Anschließend bestimmt sie beispielsweise mittels eines Algorithmus der kleinsten Fehlerquadrate eine Geradengleichung, die dem Phasenverlauf am nächsten kommt. Aus der Steigung und einem Achsenabschnitt bzw. einem Phasen- oder Anfangsoffset der Geradengleichung erhält die Trägerfrequenzbestimmungseinrichtung 32 die gewünschte Modulationsträgerfrequenz ωd für das Teilband b bezüglich des Zeitblockes m bzw. einen Spektralwertblockphasenversatz ϕ für das Teilband b bezüglich des Zeitblockes m. Diese Bestimmung führt die Trägerfrequenzbestimmungseinrichtung für alle Teilbänder über zeitlich gleiche Spektralwerte durch, also für alle Spektralwertblöcke a (ωb, 0) bis a (ωb,M-1) mit ωb für alle Teilbänder 0≤b<N. Auf diese Weise bestimmt die Trägerfrequenzbestimmungseinrichtung 32 für jedes Teilband ωb eine Modulationsträgerfrequenz ωd und den Spektralwertblockphasenversatz ϕ, und das für Block für Block. Die Blockeinteilung, die der Bestimmung der komplexen Träger für alle Teilbänder durch die Einrichtung 32 zugrunde liegt, ist diejenige, wie sie auch von der Fensterungseinrichtung zur Fensterung verwendet wird. Die Trägerfrequenzbestimmungseinrichtung 32 gibt die bestimmten Werte für die komplexen Träger an die Demodulationseinrichtung bzw. den Mischer 34 aus.Taking this into consideration, the carrier
Der Mischer 34 mischt nun die gefensterten Blöcke von Spektralwerten der einzelnen Teilbänder, wie sie von der Fensterungseinrichtung 36 ausgeben werden, mit dem komplex konjugierten der jeweiligen Modulationsträgerfrequenzen ωd unter Berücksichtigung der Spektralwertblockphasenversätze ϕ durch Multiplikation dieser Teilbandspektralwertblöcke mit e-j · (ω_d·n + ϕ)), wobei, wie oben erwähnt, jeweils ein unterschiedliches Paar von ωd und ϕ für jedes Teilband und innerhalb jedes Teilbands für die aufeinanderfolgenden Blöcke verwendet wird. Auf diese Weise gibt der Mischer 34 zueinander ausgerichtete demodulierte Teilbandspektralwertblöcke aus, d.h. zweidimensionale Blöcke aus N Spektralwertblöcken zu je M demodulierten Spektralwerten.The
Da die durch die Zeitblockversätze verursachten Modulationen in den Teilbändern durch die Demodulation mittels des Mischers 34 entfernt worden sind, ist der Phasenverlauf der Spektralwerte in den Teilbändern innerhalb der Blöcke im Mittel flacher und verläuft im wesentlichen um die Phase 0 herum. Auf diese Weise wird erzielt, dass bei der anschließenden Transformation durch die Transformationseinrichtung 38 die demodulierten und gefensterten Blöcke von Spektralwerten zu einer spektralen Zerlegung führen, bei der die Frequenz 0 bzw. der Gleichanteil sehr gut zentriert ist.Since the modulations in the subbands caused by the time block offsets have been removed by the demodulation by means of the
Die sich an die Demodulation 84 durch den Mischer 34 anschließende Transformation 86 durch die Transformationseinrichtung 38 wird blockweise an jedem Teilband bzw. jeder Folge von demodulierten Blöcken von Spektralwerten durchgeführt. Durch die Transformation 86 werden insbesondere die demodulierten Spektralwertblöcke der N Teilbänder blockweise einer spektralen Zerlegung unterzogen. Das Ergebnis der spektralen Zerlegung der Blöcke von Spektralwerten kann auch als Modulationsfrequenzdarstellung bezeichnet werden. Für N zueinander ausgerichtete Blöcke von gefensterten und demodulierten Spektralwerten ergibt die Transformation 86 folglich eine Matrix von M x N Modulationswerten, die die Frequenz-/Modulationsfrequenzdarstellung des Informationssignals 14 über die Zeitdauer der M Zeitblöcke repräsentiert, die zu dieser Matrix beigetragen haben. Die Modulationsmatrix ist in
Die Transformationseinrichtung 38 gibt die Modulationsmatrix an die Verarbeitungseinrichtung 40 weiter. Die Verarbeitungseinrichtung 40 ist gemäß dem vorliegenden. Ausführungsbeispiel dazu vorgesehen, aus dem Audiosignal 14 den Modulationsanteil herauszufiltern. In dem vorliegenden exemplarischen Fall führt die Verarbeitungseinrichtung 40 deshalb eine Tiefpassfilterung an den Modulationsfrequenzanteilen in der Frequenz-/Modulationsfrequenzmatrix durch. In
Ab der Ausgabe der Spektralwerte durch die Transformationseinrichtung 30 bezog sich die vorhergehende Beschreibung vornehmlich auf die Verarbeitung der ersten M Spektralwerte bzw. von M aufeinanderfolgenden Spektralwerten für jedes Teilband. Die Verarbeitungen durch die Einrichtungen 32, 34, 36, 38, 40 und 42 werden aber auch für nachfolgende Blöcke zu je M Spektralwerten für jedes der N Teilbänder wiederholt, und zwar mit einer Überlappung der Blöcke zu je M Spektralwerten von in dem vorliegenden Fall exemplarisch 50%, also mit einer Überlappung pro Teilband um M/2 Spektralwerte. Die Blöcke sind in
Die von der inversen Transformationseinrichtung 42 ausgegebenen Blöcke von Spektralwerten pro Teilband weichen von denjenigen, wie sie aus dem Informationssignal 14 am Ausgang der Fensterungseinrichtung 36 erhalten wurden, jedoch nicht nur durch die Verarbeitung durch die Verarbeitungseinrichtung 40 ab, sondern auch durch die durch die Demodulation bewirkte Veränderung. Die Spektralwertblöcke werden deshalb in der Modulationsei-nrichtung 46 wieder mit der Modulationsträgerkomponente moduliert, mit der sie vorher demoduliert wurden. Insbesondere werden also die entsprechenden Blöcke von Spektralwerten, die zuvor mit e-j· (ω_d · n + ϕ)) multipliziert worden sind, nun mit e+j · (ω_d · n + ϕ)) multipliziert, wobei n den Index der Spektralwertefolge des jeweiligen Teilbandes anzeige und ω_d bzw. ωd die Kreisfrequenz des komplexen durch die Einrichtung 32 für den jeweiligen Spektralwertblock bestimmten Modulationsträgers sei.However, the blocks of spectral values per subband output by the inverse transform means 42 differ from those obtained from the
Die sich nach der Modulationsstufe 46 ergebenden Folgen von Blöcken von Spektralwerten pro Teilband werden nun für jedes Teilband durch die Zusammenfügungseinrichtung 44 zu einem einheitlichen Strom 82a-82d von Spektralwerten pro Teilband zusammengefügt, indem dieselbe die Blöcke von Spektralwerten entsprechend, vorliegend exemplarisch um 50%, miteinander überlappt und einander entsprechende Spektralwerte je nach in der Fensterungseinrichtung 36 verwendeter Gewichtungsfunktion kombiniert, nämlich durch Addieren in dem Fall der oben exemplarisch angegebenen Sinus- oder KBD-Fenster.The sequences of blocks of spectral values per subband resulting after the
Die sich am Ausgang der Zusammenfügungseinrichtung 44 ergebenden Ströme von Spektralwerten pro Teilband stellen die Zeit-/Frequenzdarstellung des verarbeiteten Audiosignals 18 dar. Die Ströme werden von der inversen Transformationseinrichtung 48 empfangen. Sie verwendet in jedem Zeitschritt n die Spektralwerte für alle Teilbänder ωb, also alle Spektralwerte a (ωb, n) mit 0≤b<N, um an denselben eine Transformation von der Frequenz- in die ZeitDarstellung durchzuführen, um für jedes n, d.h. mit einer Wiederholzeitdauer von 2πN/ωs, einen Zeitblock zu erhalten. Diese Zeitblöcke werden durch die Zusammenfügungseinrichtung 50 durch vorliegend exemplarisch 50%-ige Überlappung und Kombinieren einander entsprechender Informationswerte in diesen Zeitblöcken zu einem einheitlichen Strom von Informationswerten zusammengeführt, der schließlich das verarbeitete Audiosignal im Zeitbereich 18 darstellt, das am Ausgang 16 ausgegeben wird.The streams of spectral values per subband resulting at the output of the merging means 44 represent the time / frequency representation of the processed
Das verarbeitete Audiosignal ist in
In anderen Worten ausgedrückt repräsentierte das Ausführungsbeispiel von
Bei dem Ausführungsbeispiel von
Noch einmal explizit wird auf die Tatsache hingewiesen, dass für die verwendeten Transformationen 72, 86 und die hierzu inversen Transformationseinrichtungen 42 und 48 auch andere Typen denkbar sind als die DFT bzw. IDFT. So kann beispielsweise, allerdings nicht erfindungsgemäß das komplexe demodulierte Teilbandsignal auch mit je einer reellwertigen Transformation getrennt nach Real- und Imaginärteil in die Frequenz/Modulationsfrequenzdarstellung transformiert bzw. spektral zerlegt werden. Der Realteil repräsentierte dann nach der Demodulationsstufe die Amplitudenmodulation des Subbandsignals bezüglich des zur Demodulation verwendeten Trägers. Der Imaginärteil repräsentierte dann die Frequenzmodulation dieses Trägers. In dem Fall der DFT bzw. IDFT für die Einrichtungen 38 bzw. 42, spiegelt sich der Amplitudenmodulationsanteil des Subbandsignals im symmetrischen Anteil des DFT-Spektrums entlang der Modulationsfrequenzachse wieder, während der Frequenzmodulationsanteil des Trägers dem asymmetrischen Anteil des DFT-Spektrums entlang der Modulationsfrequenzachse entspricht.Once again explicit reference is made to the fact that other types than the DFT or IDFT are conceivable for the
Das im vorhergehenden beschriebene Ausführungsbeispiel wurde exemplarisch an einem einfachen sinusmodulierten Sinussignal veranschaulicht. Das Ausführungsbeispiel von
Das Ausführungsbeispiel von
Im Hinblick auf die Transformationseinrichtungen wird noch darauf hingewiesen, dass dieselben natürlich auch als Filterbanken ausgebildet sein können, die eine Spektraldarstellung durch viele einzelne Bandpassfilterungen erzeugen. Ferner wird darauf hingewiesen, dass das sich ergebende Audiosignal 18 nach der Verarbeitung nicht in der Zeitbereichsdarstellung ausgegeben werden muss. Es wäre ferner denkbar das Informationssignal beispielweise in einer Zeit/Spektraldarstellung oder sogar in der Spektral/Modulationsspektraldarstellung auszugeben. Im letztgenannten Fall müsste dann natürlich sichergestellt werden, dass empfängerseitig die notwendige Modulation 46 wieder mit dem geeigneten Träger durchgeführt werden kann, beispielsweise durch Mitlieferung der pro Teilband und Spektralwertblock variierenden komplexen Träger, die zur Demodulation 84 verwendet worden sind. Auf diese Weise ließe sich obiges Ausführungsbeispiel zur Verwirklichung eines Kompressionsverfahrens verwenden.With regard to the transformation devices, it should also be pointed out that they can of course also be embodied as filter banks which produce a spectral representation through many individual bandpass filters. It should also be noted that the resulting
Insbesondere wird darauf hingewiesen, dass abhängig von den Gegebenheiten das erfindungsgemäße Schema auch in Software implementiert sein kann. Die Implementation kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder einer CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, dass das entsprechende Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computerprogrammprodukt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Computerprogrammprodukt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computerprogramm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computerprogramm auf einem Computer abläuft.In particular, it should be noted that, depending on the circumstances, the inventive scheme can also be implemented in software. The implementation may be on a digital storage medium, in particular a floppy disk or a CD with electronically readable control signals, which may cooperate with a programmable computer system such that the corresponding method is executed. In general, the invention thus also consists in a computer program product with program code stored on a machine-readable carrier for carrying out the method according to the invention when the computer program product runs on a computer. In other words, the invention can thus be realized as a computer program with a program code for carrying out the method when the computer program runs on a computer.
Claims (18)
- Device for processing an audio signal (14), comprisingmeans (20) for converting the audio signal (14) to a time/spectral representation (74) by block-wise transforming of the audio signal;means (22) for converting the audio signal from the time/spectral representation (74) to a spectral/modulation spectral representation (88) by means of one single frequency decomposition transform, wherein the means (22) for converting is designed such that the spectral/modulation spectral representation (88) depends on both a magnitude component and a phase component of the time/spectral representation (74) of the audio signal (14);means (24, 40) for manipulating the audio signal (14) in the spectral/modulation spectral representation (88) to obtain a modified spectral/modulation spectral representation; andmeans (26) for forming a processed audio signal (18) representing a processed version of the audio signal (14) based on the modified spectral/modulation spectral representation.
- Device according to claim 1, wherein the means (20) for converting the audio signal (14) to the time/spectral representation (74) is designed to decompose the time/spectral representation into a plurality of spectral components to obtain a sequence (82a, 82b, 82c, 82d) of complex spectral values per spectral component.
- Device according to claim 2, wherein the means (22) for converting the audio signal (14) from the time/spectral representation (74) to the spectral/modulation spectral representation (88) comprises means (36, 38) for block-wise spectral decomposition of the sequence (82a, 82b, 82c, 82d) of spectral values for a predetermined spectral component to obtain a portion of the spectral/modulation spectral representation (88).
- Device according to claim 3, wherein the means (22) for block-wise spectral decomposition of the sequence (82a, 82b, 82c, 82d) of spectral values for a predetermined spectral component is designed to first multiply (84) the sequence (82a, 82b, 82c, 82d) of spectral values block-wise by a complex carrier such that a magnitude of a mean slope of a phase course of the sequence (82a, 82b, 82c, 82d) of spectral values is reduced block-wise to obtain demodulated blocks of spectral values, and to then spectrally decompose the demodulated blocks of spectral values block-wise to obtain the portion of the modified spectral/modulation spectral representation (88).
- Device according to claim 4, wherein the means (22) for block-wise spectral decomposition of the sequence (82a, 82b, 82c, 82d) of complex spectral values for a predetermined spectral component comprises means (32) for block-wise varying, depending on the time/spectral representation (74) of the audio signal, the complex carrier by which the sequence (82a, 82b, 82c, 82d) of complex spectral values is multiplied block-wise.
- Device according to claim 5, wherein the means (32) for varying is designed to block-wise unwrap phases of the spectral values in the sequence of spectral values for block-wise varying of the complex carrier to obtain a phase course, to determine a mean slope of the phase course and to determine the complex carrier based on the mean slope.
- Device according to claim 6, wherein the means (32) for varying is further designed to determine an axis portion of the phase course from the phase course and to further determine the complex carrier based on the axis portion.
- Device according to one of claims 4 to 7, wherein the means (26) for forming comprises:means (42) for back-converting the audio signal from the modified spectral/modulation spectral representation to a modified time/spectral representation to obtain modified demodulated blocks of spectral values for the predetermined spectral component;means (46) for block-wise multiplying the modified demodulated blocks of spectral values by a carrier complex conjugated with respect to the complex carrier to obtain modified blocks of spectral values; andmeans (44) for combining the modified blocks of spectral values to form a modified sequence of spectral values to obtain a portion of a time/spectral representation of the processed audio signal (18).
- Device according to claim 8, wherein the means for forming further comprises:means for back-converting the processed audio signal (18) from the time/spectral representation to the time representation.
- Device according to one of the preceding claims, wherein the means (40) for modifying is designed to perform weighting of the modulation components of the spectral/modulation spectral representation (88) for modulation filtering, audio coding, source separation, reconstruction of the audio signal, for error concealing or for superimposing a watermark on the audio signal.
- Device according to claim 1, wherein the means (20) for converting the audio signal to the time/spectral representation (74) comprises:block formation means (28) for forming a sequence of blocks of information values from the audio signal (14); andmeans (30) for spectrally decomposing each of the sequence of blocks of information values to obtain a sequence of spectral value blocks, wherein each spectral value block comprises a spectral value (76) for each of a predetermined plurality of spectral components, so that the sequence of spectral value blocks per spectral component forms a sequence (82a-82d) of spectral values.
- Device according to claim 11, wherein the means (22) for converting the audio signal (14) to the spectral/modulation spectral representation (88) comprises:means (32-38) for spectrally decomposing a predetermined sequence of the sequences (82a-82d) of spectral values to obtain a block of modulation values,wherein the means (24; 40) for modifying is designed to modify the block (88) of modulation values to obtain a modified block of modulation values, which is part of the modified spectral/modulation spectral representation (88).
- Device according to claim 12, wherein the means (26) for forming is designed to back-convert (42, 44, 46) the modified block of modulation values from the spectral decomposition to obtain a modified sequence of spectral values, and to back-convert (48) a sequence of modified spectral blocks based on the modified sequence of spectral values to obtain a sequence of modified blocks of information values, and to combine (50) the modified blocks of information values to obtain the processed audio signal (18).
- Device according to claim 13, wherein the means (20) for spectrally decomposing each of the sequence of blocks of information values is designed to first multiply each block of the sequence of blocks of information values by a window function and to then spectrally decompose it, and the means (26) for forming is designed to process the modified blocks of information values, when combining (50), such that the multiplication by the window function does not affect the processed audio signal (18).
- Device according to claim 12, wherein the means (20) for spectrally decomposing each of the sequence of blocks of information values is designed such that it provides a sequence (82a-82d) of complex spectral values in the spectral decomposition per spectral component, and the means (32, 34, 36, 38) for spectrally decomposing the predetermined sequence of the sequences (82a-82d) of spectral values is designed to first modify (34) the predetermined sequence (82a-82d) of spectral values such that a phase of the spectral values of the predetermined sequence of spectral values is increased or reduced by an amount steadily increasing or decreasing with the sequence to obtain a phase-modified sequence of spectral values, and then to spectrally decompose (38) the phase-modified sequence of spectral values to obtain the at least one block of modulation values, and the means for forming is designed to back-convert (42) the modified block of modulation values from the spectral decomposition to obtain a modified sequence of spectral values, to modify (46) the modified sequence of spectral values inversely to the means (34) for spectrally decomposing the predetermined sequence of the sequences of spectral values such that a phase of the spectral values of the at least one sequence of spectral values is increased or reduced by an amount steadily increasing or decreasing with the sequence to obtain a modified sequence of spectral values, to back-convert (48) a sequence of modified spectral blocks based on the modified sequence of spectral values to obtain a sequence of modified blocks of information values, and to combine (50) the modified blocks of information values to obtain the processed audio signal (18).
- Device according to one of the preceding claims, wherein the only frequency decomposition transform is one single discrete Fourier transform.
- Method for processing an audio signal (14), comprisingconverting (20) the audio signal (14) to a time/spectral representation (74) by block-wise transforming of the information signal;converting (22) the audio signal from the time/spectral representation (74) to a spectral/modulation spectral representation (88) by means of one single frequency decomposition transform, wherein the conversion is performed such that the spectral/modulation spectral representation (88) depends on both a magnitude component and a phase component of the time/spectral representation (74) of the audio signal (14);modifying (24) the audio signal (14) in the spectral/modulation spectral representation (88) to obtain a modified spectral/modulation spectral representation; andforming (26) a processed audio signal (18) representing a processed version of the audio signal (14) based on the modified spectral/modulation spectral representation.
- Computer program with a program code for performing the method according to claim 16 when the computer program runs on a computer.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102004021403A DE102004021403A1 (en) | 2004-04-30 | 2004-04-30 | Information signal processing by modification in the spectral / modulation spectral range representation |
PCT/EP2005/003064 WO2005109240A1 (en) | 2004-04-30 | 2005-03-22 | Information signal processing by carrying out modification in the spectral/modulation spectral region representation |
Publications (2)
Publication Number | Publication Date |
---|---|
EP1741039A1 EP1741039A1 (en) | 2007-01-10 |
EP1741039B1 true EP1741039B1 (en) | 2010-02-17 |
Family
ID=34965409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP05735002A Active EP1741039B1 (en) | 2004-04-30 | 2005-03-22 | Information signal processing by carrying out modification in the spectral/modulation spectral region representation |
Country Status (16)
Country | Link |
---|---|
US (1) | US7574313B2 (en) |
EP (1) | EP1741039B1 (en) |
JP (1) | JP4473913B2 (en) |
KR (1) | KR100851424B1 (en) |
CN (1) | CN100583085C (en) |
AT (1) | ATE458225T1 (en) |
AU (1) | AU2005241157B8 (en) |
BR (1) | BRPI0509818B1 (en) |
CA (1) | CA2564970C (en) |
DE (2) | DE102004021403A1 (en) |
HK (1) | HK1097326A1 (en) |
IL (1) | IL178671A (en) |
MX (1) | MXPA06012424A (en) |
NO (1) | NO337309B1 (en) |
RU (1) | RU2351006C2 (en) |
WO (1) | WO2005109240A1 (en) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19947877C2 (en) * | 1999-10-05 | 2001-09-13 | Fraunhofer Ges Forschung | Method and device for introducing information into a data stream and method and device for encoding an audio signal |
DE102004023436B4 (en) * | 2004-05-10 | 2006-06-14 | M2Any Gmbh | Apparatus and method for analyzing an information signal |
DE102006047197B3 (en) | 2006-07-31 | 2008-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device for processing realistic sub-band signal of multiple realistic sub-band signals, has weigher for weighing sub-band signal with weighing factor that is specified for sub-band signal around subband-signal to hold weight |
DE102006051673A1 (en) | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for reworking spectral values and encoders and decoders for audio signals |
US8214200B2 (en) * | 2007-03-14 | 2012-07-03 | Xfrm, Inc. | Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
US20090048828A1 (en) * | 2007-08-15 | 2009-02-19 | University Of Washington | Gap interpolation in acoustic signals using coherent demodulation |
US8126578B2 (en) * | 2007-09-26 | 2012-02-28 | University Of Washington | Clipped-waveform repair in acoustic signals using generalized linear prediction |
US9436759B2 (en) | 2007-12-27 | 2016-09-06 | Nant Holdings Ip, Llc | Robust information extraction from utterances |
ES2898865T3 (en) * | 2008-03-20 | 2022-03-09 | Fraunhofer Ges Forschung | Apparatus and method for synthesizing a parameterized representation of an audio signal |
EP2362376A3 (en) * | 2010-02-26 | 2011-11-02 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an audio signal using envelope shaping |
EP2431970A1 (en) | 2010-09-21 | 2012-03-21 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Watermark generator, watermark decoder, method for providing a watermarked signal based on discrete valued data and method for providing discrete valued data in dependence on a watermarked signal |
FR2977439A1 (en) * | 2011-06-28 | 2013-01-04 | France Telecom | WINDOW WINDOWS IN ENCODING / DECODING BY TRANSFORMATION WITH RECOVERY, OPTIMIZED IN DELAY. |
US20130070811A1 (en) * | 2011-09-20 | 2013-03-21 | Electronics And Telecommunications Research Institute | Transmission/reception apparatus and method for filtered multi-tone system |
US8634502B2 (en) * | 2011-09-30 | 2014-01-21 | Silicon Laboratories Inc. | Receiver with asynchronous and synchronous demodulator |
RU2505868C2 (en) * | 2011-12-07 | 2014-01-27 | Ооо "Цифрасофт" | Method of embedding digital information into audio signal |
TWI575962B (en) * | 2012-02-24 | 2017-03-21 | 杜比國際公司 | Low delay real-to-complex conversion in overlapping filter banks for partially complex processing |
WO2014168777A1 (en) * | 2013-04-10 | 2014-10-16 | Dolby Laboratories Licensing Corporation | Speech dereverberation methods, devices and systems |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP3028275B1 (en) * | 2013-08-23 | 2017-09-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a combination in an overlap range |
EP2963645A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Calculator and method for determining phase correction data for an audio signal |
KR102356028B1 (en) | 2015-02-06 | 2022-01-26 | 삼성디스플레이 주식회사 | Display device |
EP3262639B1 (en) | 2015-02-26 | 2020-10-07 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for processing an audio signal to obtain a processed audio signal using a target time-domain envelope |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
RU2746708C1 (en) * | 2020-07-29 | 2021-04-19 | Закрытое акционерное общество "Перспективный мониторинг" | Method and device for introducing watermark into audio signal |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5173923A (en) * | 1991-11-22 | 1992-12-22 | Bell Communications Research, Inc. | Spread-time code division multiple access technique with arbitrary spectral shaping |
US5321497A (en) * | 1992-03-09 | 1994-06-14 | Wyko Corporation | Interferometric integration technique and apparatus to confine 2π discontinuity |
US5671168A (en) * | 1995-07-06 | 1997-09-23 | Technion Research & Development Foundation Ltd. | Digital frequency-domain implementation of arrays |
US6584138B1 (en) * | 1996-03-07 | 2003-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Coding process for inserting an inaudible data signal into an audio signal, decoding process, coder and decoder |
DE19640825C2 (en) | 1996-03-07 | 1998-07-23 | Fraunhofer Ges Forschung | Encoder for introducing an inaudible data signal into an audio signal and decoder for decoding a data signal contained inaudibly in an audio signal |
US5724270A (en) * | 1996-08-26 | 1998-03-03 | He Holdings, Inc. | Wave-number-frequency adaptive beamforming |
US5915027A (en) | 1996-11-05 | 1999-06-22 | Nec Research Institute | Digital watermarking |
DE19947877C2 (en) * | 1999-10-05 | 2001-09-13 | Fraunhofer Ges Forschung | Method and device for introducing information into a data stream and method and device for encoding an audio signal |
US6725372B1 (en) | 1999-12-02 | 2004-04-20 | Verizon Laboratories Inc. | Digital watermarking |
JP3507743B2 (en) | 1999-12-22 | 2004-03-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Digital watermarking method and system for compressed audio data |
AU2001231109A1 (en) | 2000-01-24 | 2001-07-31 | Businger, Peter A. | Transform domain allocation for multimedia watermarking |
FR2807897B1 (en) * | 2000-04-18 | 2003-07-18 | France Telecom | SPECTRAL ENRICHMENT METHOD AND DEVICE |
CA2418722C (en) | 2000-08-16 | 2012-02-07 | Dolby Laboratories Licensing Corporation | Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information |
US20020168082A1 (en) | 2001-03-07 | 2002-11-14 | Ravi Razdan | Real-time, distributed, transactional, hybrid watermarking method to provide trace-ability and copyright protection of digital content in peer-to-peer networks |
US7136418B2 (en) * | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
US7006452B2 (en) * | 2001-05-22 | 2006-02-28 | Intel Corporation | Matching DSL data link layer protocol detection |
DE10129239C1 (en) | 2001-06-18 | 2002-10-31 | Fraunhofer Ges Forschung | Audio signal water-marking method processes water-mark signal before embedding in audio signal so that it is not audibly perceived |
US6963842B2 (en) * | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7243060B2 (en) * | 2002-04-02 | 2007-07-10 | University Of Washington | Single channel sound separation |
KR20040108796A (en) | 2002-05-10 | 2004-12-24 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | Watermark embedding and retrieval |
US7254500B2 (en) * | 2003-03-31 | 2007-08-07 | The Salk Institute For Biological Studies | Monitoring and representing complex signals |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
JP4535278B2 (en) * | 2005-07-04 | 2010-09-01 | 株式会社デンソー | Ion current detector |
JP2008001004A (en) * | 2006-06-23 | 2008-01-10 | Canon Inc | Manufacturing method of liquid feeding part of liquid storage container and liquid storage container |
-
2004
- 2004-04-30 DE DE102004021403A patent/DE102004021403A1/en not_active Withdrawn
-
2005
- 2005-03-22 KR KR1020067021826A patent/KR100851424B1/en active IP Right Grant
- 2005-03-22 DE DE502005009035T patent/DE502005009035D1/en active Active
- 2005-03-22 BR BRPI0509818-1A patent/BRPI0509818B1/en active IP Right Grant
- 2005-03-22 RU RU2006142324/09A patent/RU2351006C2/en active
- 2005-03-22 AU AU2005241157A patent/AU2005241157B8/en active Active
- 2005-03-22 WO PCT/EP2005/003064 patent/WO2005109240A1/en active Application Filing
- 2005-03-22 MX MXPA06012424A patent/MXPA06012424A/en active IP Right Grant
- 2005-03-22 CA CA2564970A patent/CA2564970C/en active Active
- 2005-03-22 CN CN200580013764A patent/CN100583085C/en active Active
- 2005-03-22 JP JP2007509903A patent/JP4473913B2/en active Active
- 2005-03-22 EP EP05735002A patent/EP1741039B1/en active Active
- 2005-03-22 AT AT05735002T patent/ATE458225T1/en not_active IP Right Cessation
-
2006
- 2006-10-17 IL IL178671A patent/IL178671A/en active IP Right Grant
- 2006-10-26 US US11/553,376 patent/US7574313B2/en active Active
- 2006-11-24 NO NO20065423A patent/NO337309B1/en unknown
-
2007
- 2007-05-07 HK HK07104845.2A patent/HK1097326A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
KR20070015174A (en) | 2007-02-01 |
DE502005009035D1 (en) | 2010-04-01 |
NO337309B1 (en) | 2016-03-07 |
CA2564970A1 (en) | 2005-11-17 |
KR100851424B1 (en) | 2008-08-11 |
AU2005241157A1 (en) | 2005-11-17 |
AU2005241157B8 (en) | 2008-11-06 |
JP4473913B2 (en) | 2010-06-02 |
AU2005241157B2 (en) | 2008-05-22 |
IL178671A0 (en) | 2007-02-11 |
RU2351006C2 (en) | 2009-03-27 |
ATE458225T1 (en) | 2010-03-15 |
NO20065423L (en) | 2007-01-26 |
US20070100610A1 (en) | 2007-05-03 |
BRPI0509818B1 (en) | 2022-06-07 |
CA2564970C (en) | 2012-02-07 |
EP1741039A1 (en) | 2007-01-10 |
IL178671A (en) | 2011-03-31 |
WO2005109240A1 (en) | 2005-11-17 |
HK1097326A1 (en) | 2007-06-22 |
RU2006142324A (en) | 2008-06-10 |
CN1950815A (en) | 2007-04-18 |
MXPA06012424A (en) | 2007-01-17 |
DE102004021403A1 (en) | 2005-11-24 |
US7574313B2 (en) | 2009-08-11 |
BRPI0509818A (en) | 2007-09-18 |
JP2007535849A (en) | 2007-12-06 |
CN100583085C (en) | 2010-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1741039B1 (en) | Information signal processing by carrying out modification in the spectral/modulation spectral region representation | |
DE60317722T2 (en) | Method for reducing aliasing interference caused by the adjustment of the spectral envelope in real value filter banks | |
DE102008015702B4 (en) | Apparatus and method for bandwidth expansion of an audio signal | |
DE60013785T2 (en) | IMPROVED SUBJECTIVE QUALITY OF SBR (SPECTRAL BAND REPLICATION) AND HFR (HIGH FREQUENCY RECONSTRUCTION) CODING PROCEDURES BY ADDING NOISE AND LIMITING NOISE REDUCTION | |
DE102006047197B3 (en) | Device for processing realistic sub-band signal of multiple realistic sub-band signals, has weigher for weighing sub-band signal with weighing factor that is specified for sub-band signal around subband-signal to hold weight | |
DE10200653B4 (en) | Scalable encoder, encoding method, decoder and decoding method for a scaled data stream | |
DE602006000399T2 (en) | PARTLY COMPLEX MODULATED FILTER BANK | |
EP1979901B1 (en) | Method and arrangements for audio signal encoding | |
DE4316297C1 (en) | Audio signal frequency analysis method - using window functions to provide sample signal blocks subjected to Fourier analysis to obtain respective coefficients. | |
DE69221228T2 (en) | Adaptive filtering method of a signal transformed in subbands and corresponding filter arrangement | |
DE10234130B3 (en) | Device and method for generating a complex spectral representation of a discrete-time signal | |
EP1016319B1 (en) | Process and device for coding a time-discrete stereo signal | |
DE60310449T2 (en) | AUDIO SIGNAL CODING | |
EP1869671A1 (en) | Noise suppression process and device | |
DE602004009926T2 (en) | DEVICE AND METHOD FOR EMBEDDING A WATERMARK USING SUBBAND FILTERING | |
DE60105576T2 (en) | PROCESS AND DEVICE FOR SPECTRUM ENRICHMENT | |
EP1239455A2 (en) | Method and system for implementing a Fourier transformation which is adapted to the transfer function of human sensory organs, and systems for noise reduction and speech recognition based thereon | |
EP0464534A2 (en) | Transform coder with adaptive window function | |
EP0608281B1 (en) | Process for reducing frequency crosstalk during acoustic or optical signal transmission and/or recording | |
DE69515509T2 (en) | LANGUAGE PROCESSING | |
DE3732047C2 (en) | ||
DE69522883T2 (en) | DEVICE FOR DETERMINING THE SIGNAL SPECTRUM OF A DIGITAL BROADBAND SIGNAL AND FOR DERIVING A BIT ASSIGNMENT INFORMATION | |
EP1538749A2 (en) | Filterbank for spectrally modifying a digital signal and corresponding method | |
DE602004007249T2 (en) | Uniform treatment of resolved and unresolved harmonics | |
WO2006072526A1 (en) | Method for bandwidth extension |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
17P | Request for examination filed |
Effective date: 20061016 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU MC NL PL PT RO SE SI SK TR |
|
RAP1 | Party data changed (applicant data changed or rights of an application transferred) |
Owner name: FRAUNHOFER-GESELLSCHAFT ZUR FOERDERUNG DER ANGEWAN |
|
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1097326 Country of ref document: HK |
|
DAX | Request for extension of the european patent (deleted) | ||
GRAP | Despatch of communication of intention to grant a patent |
Free format text: ORIGINAL CODE: EPIDOSNIGR1 |
|
GRAS | Grant fee paid |
Free format text: ORIGINAL CODE: EPIDOSNIGR3 |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU MC NL PL PT RO SE SI SK TR |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: FG4D Free format text: NOT ENGLISH |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: EP |
|
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FG4D Free format text: LANGUAGE OF EP DOCUMENT: GERMAN |
|
REF | Corresponds to: |
Ref document number: 502005009035 Country of ref document: DE Date of ref document: 20100401 Kind code of ref document: P |
|
REG | Reference to a national code |
Ref country code: NL Ref legal event code: VDEP Effective date: 20100217 |
|
LTIE | Lt: invalidation of european patent or patent extension |
Effective date: 20100217 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: LT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 Ref country code: ES Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100528 Ref country code: IS Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100617 Ref country code: PT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100617 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: SI Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 Ref country code: PL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 Ref country code: FI Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 |
|
REG | Reference to a national code |
Ref country code: IE Ref legal event code: FD4D |
|
BERE | Be: lapsed |
Owner name: FRAUNHOFER-GESELLSCHAFT ZUR FORDERUNG DER ANGEWAN Effective date: 20100331 |
|
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1097326 Country of ref document: HK |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: EE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 Ref country code: GR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100518 Ref country code: IE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 Ref country code: MC Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20100331 Ref country code: NL Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 Ref country code: RO Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 Ref country code: SE Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 Ref country code: CY Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 |
|
REG | Reference to a national code |
Ref country code: CH Ref legal event code: PL |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: SK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 Ref country code: BG Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100517 Ref country code: CZ Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 |
|
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
26N | No opposition filed |
Effective date: 20101118 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: DK Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: BE Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20100331 Ref country code: CH Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20100331 Ref country code: LI Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20100331 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: IT Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: AT Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20100322 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: LU Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date: 20100322 Ref country code: HU Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100818 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: TR Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date: 20100217 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 12 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 13 |
|
REG | Reference to a national code |
Ref country code: FR Ref legal event code: PLFP Year of fee payment: 14 |
|
P01 | Opt-out of the competence of the unified patent court (upc) registered |
Effective date: 20230512 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: DE Payment date: 20240321 Year of fee payment: 20 Ref country code: GB Payment date: 20240322 Year of fee payment: 20 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: FR Payment date: 20240320 Year of fee payment: 20 |