JPH08248997A - Voice band enlarging device - Google Patents
Voice band enlarging deviceInfo
- Publication number
- JPH08248997A JPH08248997A JP7052558A JP5255895A JPH08248997A JP H08248997 A JPH08248997 A JP H08248997A JP 7052558 A JP7052558 A JP 7052558A JP 5255895 A JP5255895 A JP 5255895A JP H08248997 A JPH08248997 A JP H08248997A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- band
- signal
- output
- envelope information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、狭帯域音声信号のみが
得られる環境下において、狭帯域音声信号から広帯域な
音声信号へと帯域を拡大することにより、明瞭度、帯域
感のある音声を提供する音声帯域拡大装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention expands the band from a narrow band audio signal to a wide band audio signal in an environment where only a narrow band audio signal can be obtained, thereby providing a voice with clarity and a sense of band. The present invention relates to a voice band expansion device provided.
【0002】[0002]
【従来の技術】近年、音声帯域の拡大方法は学会等で幾
つか提案されている。それらの多くは電話音声の帯域拡
大を主眼としたものであり、それぞれの手法での効果が
発表されている。以下に従来の音声帯域拡大方法につい
て説明する。2. Description of the Related Art In recent years, several methods for expanding a voice band have been proposed by academic societies. Most of them focus on expanding the bandwidth of telephone voice, and the effects of each method have been announced. The conventional voice band expansion method will be described below.
【0003】図4は、電子情報通信学会技報(SP93
−61)「コードブックマッピングによる狭帯域音声か
ら広帯域音声の復元法」において吉田、阿部氏らによっ
て提案された手法であり、第1の従来例の音声帯域拡大
方法を実現するための装置構成図を示すものである。図
4において、41はLPC分析部、42はベクトル量子
化部、43はディコーディング部、44は狭帯域コード
ブック、45は広帯域コードブック、46は低域復元
部、47は第1の高域復元部、48は第2の高域復元
部、49は加算部、410はアップサンプリング部であ
る。以下、その動作について説明する。FIG. 4 is a technical report of the Institute of Electronics, Information and Communication Engineers (SP93
-61) This is a method proposed by Yoshida, Abe et al. In "Reconstruction method of narrow band speech to wide band speech by codebook mapping", and is a device configuration diagram for realizing the speech band expanding method of the first conventional example. Is shown. In FIG. 4, 41 is an LPC analysis unit, 42 is a vector quantization unit, 43 is a decoding unit, 44 is a narrow band codebook, 45 is a wideband codebook, 46 is a low band restoration unit, and 47 is a first high band. A restoration unit, 48 is a second high frequency restoration unit, 49 is an addition unit, and 410 is an upsampling unit. The operation will be described below.
【0004】入力された狭帯域音声信号は、LPC分析
部41で線形予測分析される。LPC分析部41により
抽出されたスペクトル包絡情報を狭帯域コードブック4
4を用いて、ベクトル量子化部42でベクトル量子化を
行なう。ベクトル量子化部42の結果を用い狭帯域コー
ドブック44に対応する広帯域コードブック45に格納
されている広帯域スペクトル包絡情報をディコーディン
グ部43で得る。低域復元部46ではLPC分析部41
により抽出されたピッチ情報、パワ情報、および、ディ
コーディング部43から得られるスペクトル包絡情報を
用い、LPC合成により低域を復元する。同様に第1の
高域復元部47では、前記ピッチ情報と前記パワ情報と
ディコーディング部43から得られるスペクトル包絡情
報により高域を復元する。低域復元部46と第1の高域
復元部47の出力と、前記入力された狭帯域信号をアッ
プサンプリング部410でサンプリング周波数を変換さ
れた出力を加算部49で代数的に加算し、広帯域合成音
声を得る。The input narrowband speech signal is subjected to linear prediction analysis in the LPC analysis section 41. The spectral envelope information extracted by the LPC analysis unit 41 is converted into the narrowband codebook 4
4, the vector quantizer 42 performs vector quantization. The decoding unit 43 obtains wideband spectrum envelope information stored in the wideband codebook 45 corresponding to the narrowband codebook 44 using the result of the vector quantization unit 42. In the low-frequency restoration unit 46, the LPC analysis unit 41
Using the pitch information, the power information, and the spectrum envelope information obtained from the decoding unit 43, the low frequency band is restored by LPC synthesis. Similarly, the first high frequency band restoration unit 47 restores the high frequency band based on the pitch information, the power information, and the spectrum envelope information obtained from the decoding unit 43. An adder 49 algebraically adds the outputs of the low-band restorer 46 and the first high-band restorer 47 and the input narrowband signal whose sampling frequency has been converted by the upsampling unit 410 to obtain a wideband. Get synthetic speech.
【0005】また、この第1の従来例では、第1の高域
復元部47の代わりに第2の高域復元部48を用いた手
法も提案されており、第2の高域復元部48では、ベク
トル量子化部42の出力を参照して、蓄積された波形素
片データとLPC分析部41からの前記ピッチ情報と前
記パワ情報から高域を復元し、低域復元部46の出力と
アップサンプリング部410からの出力とを加算部49
で加算し、広帯域合成音声を得る。それ以外の構成は、
第1の高域復元部47を用いる手法と同様である。Further, in this first conventional example, a method of using the second high-frequency restoring unit 48 instead of the first high-frequency restoring unit 47 is also proposed, and the second high-frequency restoring unit 48 is proposed. Then, referring to the output of the vector quantizer 42, the high band is restored from the accumulated waveform segment data, the pitch information and the power information from the LPC analyzer 41, and the output of the low band restorer 46 The output from the upsampling unit 410 is added to the adding unit 49.
To obtain wideband synthesized speech. Other configurations are
This is the same as the method using the first high frequency band restoration unit 47.
【0006】図5は、日本音響学会論文講演集1−P−
6(1994ー11)「電話帯域音声の疑似広帯域化の
検討」において田中氏らによって提案された手法であっ
て、第2の従来例の音声帯域拡大方法を実現する装置構
成図を示すものである。図5において、51はLPC分
析部、52はLPC逆フィルタ部、53は整流部、54
はLPC合成部、55は帯域通過フィルタ部、56は高
域通過フィルタ部、57はイコライザー部である。以
下、その動作について説明する。[0006] FIG. 5 is a 1-P-
6 (1994-11), which is a method proposed by Mr. Tanaka et al. In "Examination of Pseudo Wide Band of Telephone Band Voice", showing a device configuration diagram for realizing the second conventional voice band expanding method. is there. In FIG. 5, 51 is an LPC analysis unit, 52 is an LPC inverse filter unit, 53 is a rectification unit, and 54.
Is an LPC synthesis unit, 55 is a band pass filter unit, 56 is a high pass filter unit, and 57 is an equalizer unit. The operation will be described below.
【0007】入力された狭帯域信号は、LPC分析部5
1で線形予測分析される。LPC分析部51から得た出
力を用い、LPC逆フィルタ部52で残差信号を算出す
る。前記残差信号は、整流部53において半波整流を用
いて非線形処理される。整流部53の出力とLPC分析
部51から得られるスペクトル包絡情報により、LPC
合成部54で線形合成が行なわれる。帯域通過フィルタ
55では、前記入力された狭帯域信号から、0〜300
Hzの帯域をろ波する。高域通過フィルタ部56では、
前記入力された狭帯域信号から300Hz〜4kHz帯
域の高域成分をろ波する。帯域通過フィルタ55の出力
と高域通過フィルタ56の出力を加算し、イコライザー
部57で、合成音声がこもり感の無いように周波数のイ
コライジングを行ない、広帯域な出力音声を得る。The input narrow band signal is processed by the LPC analyzer 5
1 for linear predictive analysis. Using the output obtained from the LPC analysis unit 51, the LPC inverse filter unit 52 calculates the residual signal. The residual signal is non-linearly processed by the rectifying unit 53 using half-wave rectification. Based on the output of the rectification unit 53 and the spectrum envelope information obtained from the LPC analysis unit 51, the LPC
Linear combination is performed in the combining unit 54. In the band pass filter 55, 0 to 300 is calculated from the input narrow band signal.
Filter the Hz band. In the high pass filter unit 56,
From the input narrow band signal, high frequency components in the 300 Hz to 4 kHz band are filtered. The output of the band-pass filter 55 and the output of the high-pass filter 56 are added, and the equalizer unit 57 performs frequency equalization so that the synthesized voice does not have a muffled feeling, thereby obtaining a wide-band output voice.
【0008】図6は、日本音響学会論文講演集1−5−
9(1994−11)「狭帯域CELP符号からの広帯
域音声の復元」において田崎氏らによって提案された手
法であって、第3の従来例の音声帯域拡大方法を実現す
る装置構成図を示すものである。図6において、61は
アップサンプリング部、62はLSP分析部、63は適
応音源分析部、64は広帯域LSP推定部、65はLS
P合成フィルタ部、66は適応音源合成部、67は雑音
生成部、68は高域通過フィルタ部、69、610は乗
算器、611、612は加算器である。以下、その動作
について説明する。[0008] FIG. 6 is a collection of papers of the Acoustical Society of Japan 1-5.
9 (1994-11) "Reconstruction of wideband speech from narrowband CELP code" proposed by Tasaki et al., Showing an apparatus configuration diagram for realizing the third conventional speech band expansion method. Is. In FIG. 6, 61 is an upsampling unit, 62 is an LSP analysis unit, 63 is an adaptive sound source analysis unit, 64 is a wideband LSP estimation unit, and 65 is an LS.
A P synthesis filter unit, 66 is an adaptive sound source synthesis unit, 67 is a noise generation unit, 68 is a high-pass filter unit, 69 and 610 are multipliers, and 611 and 612 are adders. The operation will be described below.
【0009】入力された狭帯域信号は、線形予測分析の
うちのLSP分析を用いてLSP分析部62で分析を行
なう。すなわち、よく知られているCELP(Code Exc
itedLinear Prediction)の考えを用いて、分析した
後、狭帯域な適応音源ゲイン、適応音源ラグ長、残差ゲ
インを適応音源分析部63から出力する。前記適応音源
ラグ長は2倍され、この値を用いて適応音源合成部66
で適応音源を合成する。適応音源合成部66からの出力
は、乗算器69にて、前記適応音源ゲインを2倍した値
と乗算される。また、雑音コードブックから雑音生成部
67で雑音成分を生成し、この雑音成分は、乗算器61
0にて、前記残差ゲインを2倍した値と乗算される。乗
算器69の出力と乗算器610の出力を加算器611で
加算することにより広帯域音源を生成する。LSP分析
部62からのLSPを次数を低減することにより、広帯
域LSP推定部64で疑似広帯域化する。加算器611
から出力される前記広帯域音源と、広帯域LSP推定部
64からの出力とを用いて、LSP合成フィルタ部65
で広帯域音声を合成する。前記広帯域音声から高域通過
フィルタ部68により3400Hz〜7200Hzの高
域成分を抽出し、前記入力された狭帯域信号をアップサ
ンプリング部61でアップサンプリングされた信号と、
高域通過フィルタ部68の出力とを加算器612で加算
し、広帯域合成音を得る。The input narrow band signal is analyzed by the LSP analysis section 62 using the LSP analysis of the linear prediction analysis. That is, the well-known CELP (Code Exc
After it is analyzed using the idea of itedLinear Prediction), the adaptive sound source analysis unit 63 outputs the narrow band adaptive sound source gain, the adaptive sound source lag length, and the residual gain. The adaptive sound source lag length is doubled, and using this value, the adaptive sound source synthesizing unit 66
To synthesize an adaptive sound source. The output from the adaptive sound source synthesis unit 66 is multiplied by a value obtained by doubling the adaptive sound source gain in a multiplier 69. In addition, the noise generation unit 67 generates a noise component from the noise codebook, and this noise component is added to the multiplier 61.
At 0, it is multiplied by a value obtained by doubling the residual gain. A wide band sound source is generated by adding the output of the multiplier 69 and the output of the multiplier 610 by the adder 611. By reducing the order of the LSP from the LSP analysis unit 62, the wideband LSP estimation unit 64 widens the pseudo band. Adder 611
The wideband sound source output from the LSP synthesis filter unit 65 and the output from the wideband LSP estimation unit 64 are used.
Wideband speech is synthesized with. A signal obtained by extracting a high-frequency component of 3400 Hz to 7200 Hz by the high-pass filter unit 68 from the wideband sound, and up-sampling the input narrow-band signal by the up-sampling unit 61;
The output of the high-pass filter unit 68 is added by the adder 612 to obtain a wideband synthesized sound.
【0010】[0010]
【発明が解決しようとする課題】しかしながら上記の従
来の構成において、まず、第1の従来例の方法では、音
源情報がピッチ、白色雑音であるため、ピッチ推定誤り
による音質劣化が問題となる。また、包絡情報の推定に
多くの計算量とメモリを必要とする。However, in the above-mentioned conventional configuration, first, in the method of the first conventional example, since the sound source information is pitch and white noise, sound quality deterioration due to a pitch estimation error becomes a problem. In addition, a large amount of calculation and memory are required to estimate the envelope information.
【0011】第2の従来例の方法では、0Hz〜300
Hzの帯域のみを拡大するもので、3400Hz以上の
帯域は拡大していないため、帯域感が得られない。In the second conventional method, 0 Hz to 300 Hz
Only the band of Hz is expanded, and the band of 3400 Hz or higher is not expanded, so that a band feeling cannot be obtained.
【0012】第3の従来例の方法では、300Hz以下
の低域は生成されておらず、充分な自然性が得られな
い。また、LSP次数の低減によるスペクトル包絡情報
の広帯域化は、充分な精度で広帯域なスペクトル包絡情
報の復元ができないなどの問題を有していた。In the method of the third conventional example, a low frequency band of 300 Hz or less is not generated, and sufficient naturalness cannot be obtained. In addition, widening the spectrum envelope information by reducing the LSP order has a problem that the broadband spectrum envelope information cannot be restored with sufficient accuracy.
【0013】本発明は上記従来の問題点を解決するもの
で、低域成分と高域成分の両者を合成することで、明瞭
でかつ帯域感のある音声帯域拡大装置を提供することを
目的とする。The present invention solves the above-mentioned conventional problems, and an object of the present invention is to provide a speech band expanding device which is clear and has a sense of band by synthesizing both low frequency components and high frequency components. To do.
【0014】[0014]
【課題を解決するための手段】この目的を達成するため
に、本発明の音声帯域拡大装置は、入力信号からスペク
トル情報と残差信号を線形予測分析法を用いて抽出する
LPC分析部と、前記LPC分析部により抽出された前
記スペクトル包絡情報を所望の周波数帯域に線形写像関
数により帯域を拡大する包絡拡大部と、前記LPC分析
部により算出された前記残差信号を非線形処理により、
所望の周波数帯域の特性を有する信号へと変換する駆動
音源拡大部と、前記包絡拡大部より得られる帯域拡大さ
れた包絡情報と前記駆動音源拡大部より得られる帯域拡
大された音源情報を用いて音声をLPC合成するLPC
合成部と、前記LPC合成部から得られた信号列を時間
軸上で平滑化する波形平滑化部と、前記波形平滑化部よ
り得られた信号から前記入力信号に付加すべき周波数帯
域成分を漉波するフィルタ部と、前記入力信号を周波数
特性を保持しながら前記入力信号のサンプリング周波数
よりも高いサンプリング周波数に変換した信号列を出力
するアップサンプリング部と、前記フィルタ部の出力信
号と前記アップサンプリング部の出力信号を加算する加
算部とを有し、前記入力信号よりも広帯域な出力信号を
得る構成を有している。In order to achieve this object, a speech band expanding apparatus of the present invention comprises an LPC analysis section for extracting spectral information and a residual signal from an input signal using a linear prediction analysis method. An envelope expansion unit that expands the spectrum envelope information extracted by the LPC analysis unit to a desired frequency band by a linear mapping function, and a non-linear processing of the residual signal calculated by the LPC analysis unit,
Using a driving sound source expansion unit for converting into a signal having a desired frequency band characteristic, band expanded envelope information obtained by the envelope expansion unit, and band expanded sound source information obtained by the driving sound source expansion unit. LPC that synthesizes voice with LPC
A combining unit, a waveform smoothing unit that smoothes the signal sequence obtained from the LPC combining unit on the time axis, and a frequency band component to be added to the input signal from the signal obtained from the waveform smoothing unit. A filter section for filtering, an up-sampling section for outputting a signal sequence in which the input signal is converted to a sampling frequency higher than the sampling frequency of the input signal while maintaining frequency characteristics, an output signal of the filter section and the up-sampling section. And an adder that adds the output signals of the sampling unit, and is configured to obtain an output signal in a wider band than the input signal.
【0015】[0015]
【作用】本発明は上記構成によって、低域成分および高
域成分の両者を帯域拡大する構成であるため、自然感お
よび帯域感のある音声を得ることができ、線形写像関数
によりスペクトル包絡情報を帯域拡大しているので、少
ない計算量で正確なスペクトル包絡情報を得ることがで
き、非線形処理により残差信号の帯域拡大をしているの
で、音声の調波構造を保持したまま広帯域化が可能とな
る。また、波形平滑化処理を行なうことで、合成音声の
時間的な不連続性を取り除くことができ、より自然な合
成音を得ることが可能となる。According to the present invention, since the low-frequency component and the high-frequency component are both band-enhanced by the above-described configuration, it is possible to obtain a voice with a natural feeling and a feeling of a band, and to obtain spectral envelope information by a linear mapping function. Since the band is expanded, accurate spectral envelope information can be obtained with a small amount of calculation, and the band of the residual signal is expanded by non-linear processing, so it is possible to widen the band while maintaining the harmonic structure of the voice. Becomes Further, by performing the waveform smoothing process, temporal discontinuity of the synthesized speech can be removed, and a more natural synthesized speech can be obtained.
【0016】[0016]
【実施例】以下、本発明の一実施例について、図面を参
照しながら説明する。An embodiment of the present invention will be described below with reference to the drawings.
【0017】図1は本発明の一実施例における音声帯域
拡大装置の全体構成図である。図1において、入力され
た狭帯域音声信号は、LPC分析部12で線形予測分析
法で分析され、スペクトル包絡情報と残差信号が抽出さ
れる。前記スペクトル包絡情報は、包絡拡大部13によ
って広帯域なスペクトル包絡情報に変換される。前記残
差信号は、駆動音源拡大部14で広帯域な残差信号に変
換され、LPC合成部15にて、包絡拡大部13からの
出力と駆動音源拡大部14からの出力によって広帯域な
合成音声にLPC合成される。広帯域な合成音声は、波
形平滑化部16にて、フレーム分析による合成波形の不
連続性を減少させるために平滑化処理が行なわれる。波
形平滑化部16からの出力は、フィルタ部17によっ
て、狭帯域な入力信号に欠落している周波数成分をろ波
される。フィルタ部17からの出力は、入力信号をアッ
プサンプリングするアップサンプリング部11からの出
力と加算部18にて加算され、出力信号を得る。FIG. 1 is an overall configuration diagram of a voice band expanding apparatus according to an embodiment of the present invention. In FIG. 1, the input narrowband speech signal is analyzed by the LPC analysis unit 12 by a linear prediction analysis method, and spectral envelope information and a residual signal are extracted. The spectrum envelope information is converted into wideband spectrum envelope information by the envelope enlarging unit 13. The residual signal is converted into a wide band residual signal by the driving sound source expanding unit 14, and the LPC synthesizing unit 15 converts the output from the envelope expanding unit 13 and the output from the driving sound source expanding unit 14 into a wide band synthetic speech. LPC synthesized. The wideband synthesized speech is smoothed by the waveform smoothing unit 16 in order to reduce discontinuity of the synthesized waveform due to frame analysis. The output from the waveform smoothing unit 16 is filtered by the filter unit 17 for the frequency components missing in the narrowband input signal. The output from the filter unit 17 is added to the output from the up-sampling unit 11 that up-samples the input signal in the adder unit 18 to obtain an output signal.
【0018】各部の詳細な説明を、図2を用いて行な
う。図2は、図1の音声帯域拡大装置の詳細な全体構成
図である(図1におけるフィルタ部17と波形平滑化部
16は、より具体的な構成として、帯域通過フィルタ部
210とクロスフェード部29で構成している)。A detailed description of each part will be given with reference to FIG. FIG. 2 is a detailed overall configuration diagram of the voice band expansion device of FIG. 1 (the filter unit 17 and the waveform smoothing unit 16 in FIG. 1 have a bandpass filter unit 210 and a crossfade unit as a more specific configuration. It is composed of 29).
【0019】図2において、入力された狭帯域音声信号
は、LPC分析部12にて線形予測分析され、スペクト
ル包絡情報と残差信号に分離する。LPC分析部12で
は、例えば、入力信号に対して(数1)の窓関数を乗算
する。In FIG. 2, the input narrow band speech signal is subjected to linear prediction analysis in the LPC analysis section 12 and separated into spectrum envelope information and a residual signal. In the LPC analysis unit 12, for example, the input signal is multiplied by the window function of (Equation 1).
【0020】[0020]
【数1】 [Equation 1]
【0021】ここで、(数1)はハミング窓を示す関数
であり、h(i);ただしi=0,2,・・・,N-1は窓関数、Nは分析
フレーム長を示す。そしてこの次にこのh(i)を用い
て、(数2)で定義される相関関数を算出する。Here, (Equation 1) is a function indicating a Hamming window, and h (i); where i = 0, 2, ..., N-1 is a window function, and N is an analysis frame length. Then, using this h (i), the correlation function defined by (Equation 2) is calculated.
【0022】[0022]
【数2】 [Equation 2]
【0023】(数2)において、y(i)は時刻iにおける
入力信号で、r(j)はj次の相関値を示す。In (Equation 2), y (i) is the input signal at time i, and r (j) is the j-th order correlation value.
【0024】次に(数2)の相関値を用いて、(数3)
の正規方程式を導く。Next, using the correlation value of (Equation 2), (Equation 3)
Derive the normal equation of.
【0025】[0025]
【数3】 (Equation 3)
【0026】(数3)において、a0,a1,・・・,anは線形予
測係数で、Vnはn次の線形予測係数であり、モデルを構
成した場合の予測誤差パワを示す。但し、a0 = 1 であ
る。最後に、(数4)の目的関数を最小化するようにし
て、(数3)の正規方程式から線形予測係数を算出する
ことで、スペクトル包絡情報を抽出することができる。In (Equation 3), a 0 , a 1 , ..., A n are linear prediction coefficients, and V n is an nth-order linear prediction coefficient, which indicates the prediction error power when the model is constructed. . However, a 0 = 1. Finally, the spectral envelope information can be extracted by minimizing the objective function of (Equation 4) and calculating the linear prediction coefficient from the normal equation of (Equation 3).
【0027】[0027]
【数4】 [Equation 4]
【0028】残差信号は、(数4)の目的関数を最小化
する線形予測係数を用いて、例えば(数5)などで算出
される。The residual signal is calculated by, for example, (Equation 5) using a linear prediction coefficient that minimizes the objective function of (Equation 4).
【0029】[0029]
【数5】 (Equation 5)
【0030】(数5)のε(i)は時刻iにおける残差信号
である。LPC分析部12で抽出されたスペクトル包絡
情報、例えばLPC係数、PARCOR係数などは、線
形写像関数部23で、複数の線形写像関数を用いて、入
力と同数の広帯域なスペクトル包絡情報へと写像され
る。また、LPC分析部12で抽出されたスペクトル包
絡情報は、狭帯域コードブック21を参照して、ベクト
ル量子化部22でベクトル量子化により距離を算出され
る。包絡加算部24では、線形写像関数部23で得られ
た広帯域なスペクトル包絡情報を、ベクトル量子化部2
2で算出された距離に基づいて重みつけ加算し、広帯域
なスペクトル包絡情報を得る。コードブックは予め狭帯
域なスペクトル包絡情報により学習させておき、線形写
像関数は、狭帯域なスペクトル包絡情報から広帯域なス
ペクトル包絡情報への写像関係を学習させておく。スペ
クトル包絡情報の帯域拡大は、例えば、(数6)に示す
ように、狭帯域なスペクトル包絡情報を入力し、狭帯域
の包絡情報を関数の数だけ広帯域な包絡情報へと線形写
像する。Ε (i) in (Equation 5) is the residual signal at time i. The spectral envelope information extracted by the LPC analysis unit 12, such as the LPC coefficient and the PARCOR coefficient, is mapped by the linear mapping function unit 23 into the same number of broadband spectral envelope information as the input using a plurality of linear mapping functions. It Further, the spectrum envelope information extracted by the LPC analysis unit 12 is referred to the narrow band codebook 21, and the vector quantization unit 22 calculates the distance by vector quantization. In the envelope addition unit 24, the wide band spectrum envelope information obtained by the linear mapping function unit 23 is converted into the vector quantization unit 2
Weighted addition is performed based on the distance calculated in 2 to obtain broadband spectral envelope information. The codebook is preliminarily trained with the narrowband spectrum envelope information, and the linear mapping function is trained with the mapping relationship from the narrowband spectrum envelope information to the wideband spectrum envelope information. To expand the band of the spectrum envelope information, for example, as shown in (Equation 6), narrow band spectrum envelope information is input, and the narrow band envelope information is linearly mapped to the wide band envelope information by the number of functions.
【0031】[0031]
【数6】 (Equation 6)
【0032】(数6)において、zkiは、Akはk番目の線
形写像関数で、狭帯域な包絡情報xiを写像した結果であ
る。In (Equation 6), z ki is the result of mapping the narrow band envelope information x i , where A k is the k-th linear mapping function.
【0033】次に、狭帯域なスペクトル包絡情報から、
(数7)で定義されるベクトル量子化の式を用いて、各
コードと狭帯域なスペクトル包絡情報との距離を算出す
ることで、線形写像された各々のスペクトル包絡情報に
対する重み係数を得る。Next, from the narrow band spectrum envelope information,
By calculating the distance between each code and the narrow-band spectral envelope information using the vector quantization formula defined by (Equation 7), the weighting coefficient for each linearly mapped spectral envelope information is obtained.
【0034】[0034]
【数7】 (Equation 7)
【0035】(数7)に示すように、重みwikはk番目の
包絡情報の代表点Vkと狭帯域な包絡情報xiとの距離から
算出される。(数6)で得られる線形写像されたスペク
トル包絡情報と、(数7)で得られた重み係数とを用い
て、(数8)によって広帯域なスペクトル包絡情報に写
像される。As shown in (Equation 7), the weight w ik is calculated from the distance between the representative point V k of the kth envelope information and the narrow band envelope information x i . Using the linearly mapped spectrum envelope information obtained in (Equation 6) and the weighting coefficient obtained in (Equation 7), it is mapped to wideband spectrum envelope information by (Equation 8).
【0036】[0036]
【数8】 (Equation 8)
【0037】(数8)において、広帯域な包絡情報y
iは、前出の(数6)と(数7)で算出された値により
定まる。In (Equation 8), the wide band envelope information y
i is determined by the values calculated by the above (Equation 6) and (Equation 7).
【0038】一方、LPC分析部12で抽出された残差
情報は、残差アップサンプリング部25でアップサンプ
リングされ、非線形処理部26にて全波整流などの処理
を施される。非線形処理部26では、全波整流、半波整
流、二乗処理、クリッピング等の非線形操作を用いても
よい。それらの非線形操作を行なうことで、音源情報の
低域成分と高域成分を歪みによって生成することができ
る。非線形処理部26からの出力は、歪みによって生じ
たスペクトル包絡情報を含有しているため、スペクトル
平滑化部27で、低次のLPC分析を施した残差を得る
ことで周波数特性を平滑化する。例えばスペクトル平滑
化部27におけるLPC分析の次数は3次程度とする。
スペクトル平滑化部27からの出力は、スペクトル平滑
化部27への入力に対してパワが減衰しているため、ゲ
イン制御部28で定数倍を乗じることによって補正す
る。あるいは、スペクトル平滑化部27への入力と出力
のパワ比を乗じることで補正する方法や、後処理的にL
PC合成部15で信号を合成してから、LPC分析部1
2に入力される入力信号が持つ周波数帯域と同じ帯域を
通過する帯域通過フィルタを用いて、LPC合成部15
からの出力をろ波し、入力信号と前出の帯域通過フィル
タ後の出力のパワを同一にするように分析フレームごと
に比を算出し、その比を乗じる方法を用いてもよい。On the other hand, the residual information extracted by the LPC analysis section 12 is up-sampled by the residual up-sampling section 25 and subjected to processing such as full-wave rectification by the non-linear processing section 26. The non-linear processing unit 26 may use non-linear operations such as full-wave rectification, half-wave rectification, square processing, and clipping. By performing these non-linear operations, it is possible to generate low-frequency components and high-frequency components of sound source information by distortion. Since the output from the non-linear processing unit 26 contains the spectrum envelope information generated by the distortion, the spectrum smoothing unit 27 smoothes the frequency characteristic by obtaining the residual subjected to the low-order LPC analysis. . For example, the order of the LPC analysis in the spectrum smoothing unit 27 is about the third order.
The output from the spectrum smoothing unit 27 has its power attenuated with respect to the input to the spectrum smoothing unit 27, and therefore is corrected by being multiplied by a constant multiple in the gain control unit 28. Alternatively, a method of performing correction by multiplying the power ratio between the input and the output to the spectrum smoothing unit 27, or L as a post-processing method
After the signals are combined by the PC combiner 15, the LPC analyzer 1
The LPC synthesis unit 15 is configured by using a bandpass filter that passes the same frequency band as the frequency band of the input signal input to
Alternatively, a method may be used in which the output is filtered, the ratio is calculated for each analysis frame so that the power of the input signal and the output of the output after the band pass filter are the same, and the ratio is multiplied.
【0039】駆動音源の帯域拡大は、例えば、狭帯域な
残差信号を(数9)の演算によって、残差アップサンプ
リング部25でアップサンプリングを行なう。To expand the band of the driving sound source, for example, the residual upsampling unit 25 performs upsampling of the narrowband residual signal by the calculation of (Equation 9).
【0040】[0040]
【数9】 [Equation 9]
【0041】(数9)において、uε(i)は、ε(i)をア
ップサンプリングした信号列である。次に、残差アップ
サンプリング部25の出力を、非線形処理部26で(数
10)を用いて全波整流を行なう。In (Equation 9), uε (i) is a signal sequence obtained by up-sampling ε (i). Next, the non-linear processing unit 26 performs full-wave rectification on the output of the residual up-sampling unit 25 using (Equation 10).
【0042】[0042]
【数10】 [Equation 10]
【0043】(数10)において、cε(i)は、uε(i)を
全波整流したものである。全波整流された信号をスペク
トル平滑化部27で(数11)のように低次の線形予測
法の残差信号を得ることで、スペクトル平滑化処理を行
なう。In (Equation 10), cε (i) is the full-wave rectification of uε (i). The spectrum smoothing unit 27 performs spectrum smoothing processing by obtaining a residual signal of a low-order linear prediction method as shown in (Equation 11) from the full-wave rectified signal.
【0044】[0044]
【数11】 [Equation 11]
【0045】(数11)において、fε(i)は、cε(i)を
スペクトル平滑化したもので、biはcε(i)を入力信号と
して、前出の線形予測の方法を用いて算出した線形予測
係数である。In (Equation 11), fε (i) is a spectrum smoothed version of cε (i), and b i is calculated using the above-described linear prediction method using cε (i) as an input signal. Is a linear prediction coefficient.
【0046】ゲイン制御部28の出力として得られた広
帯域残差信号と、包絡加算部24で得られた前記広帯域
なスペクトル包絡情報とを用いて、LPC合成部15で
LPC合成し、広帯域な合成音を得る。この広帯域な合
成音は、クロスフェード部29において、フレーム分析
のシフト幅がフレーム分析長よりも短くした場合に、時
間的にオーバーラップして得られる結果を一つの時間軸
上で滑らかに得るために用いる。なお、クロスフェード
部29の概念図を図3に示す。The wideband residual signal obtained as the output of the gain control section 28 and the wideband spectrum envelope information obtained by the envelope addition section 24 are LPC-synthesized by the LPC synthesis section 15 to obtain wideband synthesis. Get the sound. In the crossfade unit 29, when the shift width of the frame analysis is made shorter than the frame analysis length, this wide-band synthetic sound smoothly obtains the results obtained by overlapping in time on one time axis. Used for. A conceptual diagram of the crossfade unit 29 is shown in FIG.
【0047】図3において、a)は入力信号で、c)、
e)、g)はそれぞれ時間的に連続した分析フレームで
あるフレーム1、フレーム2、フレーム3における合成
出力波形である。b)、d)、f)は前記フレーム1か
らフレーム3のフレームごとの合成波形出力に乗じる重
み関数であり、出力波形h)はc)にb)を乗じた波形
と、e)にd)を乗じた波形、さらにg)にf)を乗じ
た波形を加算するなどして算出される。例えば、1フレ
ーム長が400ポイントで、フレームシフト幅が100
ポイント、現時刻でのLPC合成出力列がyi、一つ前の
時刻のLPC合成出力列がxiである時、クロスフェード
による合成出力は、(数12)のziとして算出される。In FIG. 3, a) is an input signal, and c),
e) and g) are composite output waveforms in the frame 1, the frame 2, and the frame 3, which are analysis frames that are temporally continuous, respectively. b), d), and f) are weighting functions for multiplying the composite waveform output for each frame from frame 1 to frame 3, and the output waveform h) is a waveform obtained by multiplying c) by b), and e) is d). It is calculated by, for example, adding a waveform obtained by multiplying by, and further adding a waveform obtained by multiplying g) by f). For example, one frame length is 400 points and frame shift width is 100 points.
Point, when the LPC composite output sequence at the current time is y i and the LPC composite output sequence at the previous time is x i , the composite output due to the crossfade is calculated as z i in (Equation 12).
【0048】[0048]
【数12】 (Equation 12)
【0049】クロスフェード部29からの出力信号は帯
域通過フィルタ210で、例えば0〜300Hzと34
00Hz〜7200Hzの成分を抽出するFIRフィル
タやIIRフィルタを用いてろ波される。The output signal from the crossfade unit 29 is output from the bandpass filter 210, for example, 0 to 300 Hz and 34.
It is filtered using an FIR filter or an IIR filter that extracts a component of 00 Hz to 7200 Hz.
【0050】アップサンプリング部11では、入力信号
をそのままアップサンプリングし、帯域通過フィルタ部
210の出力と代数的に加算部18で加算され、出力信
号を得る。アップサンプリング部11では、例えば8kH
zサンプリングを16kHzサンプリングにアップサンプリ
ングする。The upsampling unit 11 upsamples the input signal as it is, and algebraically adds it to the output of the bandpass filter unit 210 by the addition unit 18 to obtain an output signal. In the upsampling unit 11, for example, 8 kHz
Upsample z sampling to 16 kHz sampling.
【0051】以上のように本実施例によれば、低域成
分、高域成分の両者を推定し合成することで、明瞭で帯
域感のある自然な音声を得ることができる。具体的に
は、ピッチ推定を直接行なって駆動音源を帯域拡大する
のではなく、アップサンプリングした残差信号に対し
て、全波整流などの非線形処理を行なうことで低域成分
および高域成分を生成しているので、ピッチ推定誤り時
に起こる不自然な合成音を生成するという問題を避ける
ことができる。また、線形写像関数を用いてスペクトル
包絡情報の広帯域化を行なっているため、少ないコード
ブック数と計算量で広帯域なスペクトル包絡情報を生成
することができる。また、合成波形をクロスフェードを
用いて時間的に平滑化することで、合成によるフレーム
間の不連続性を平坦化することが容易に行なえる。As described above, according to this embodiment, by estimating and synthesizing both the low-frequency component and the high-frequency component, it is possible to obtain a clear and natural sound with a feeling of band. Specifically, instead of directly performing pitch estimation to expand the band of the driving sound source, nonlinear processing such as full-wave rectification is performed on the upsampled residual signal to remove low-frequency components and high-frequency components. Since it is generated, it is possible to avoid the problem of generating an unnatural synthesized voice that occurs when the pitch estimation error occurs. Further, since the spectral envelope information is widened by using the linear mapping function, it is possible to generate the wideband spectral envelope information with a small number of codebooks and a small amount of calculation. Further, by smoothing the combined waveform temporally by using crossfade, discontinuity between frames due to combining can be easily flattened.
【0052】[0052]
【発明の効果】以上のように、本発明の音声帯域拡大装
置は、陽(暗の反意語)にピッチ推定を用いないで帯域
拡大を行なうことにより、ピッチ推定誤りの無い自然な
合成音を得ることができる。また、ファジーベクトル量
子化によるスペクトル包絡情報の帯域拡大では計算量も
非常に多いのに対し、本発明では線形写像関数により帯
域拡大しているので、比較的少ない計算量とメモリで構
成できる。さらに、本発明は、低域、高域成分の両者を
帯域拡大する方式であるため、低域による自然感の向上
と高域による帯域感の向上との両者を実現することがで
きる優れた音声帯域拡大装置を実現できるものである。As described above, the speech band expanding apparatus of the present invention obtains a natural synthesized sound without pitch estimation error by expanding the band without using pitch estimation in the positive (dark antonym). be able to. Further, while the amount of calculation is very large in expanding the band of the spectrum envelope information by fuzzy vector quantization, in the present invention, since the band is expanded by the linear mapping function, it can be configured with a relatively small amount of calculation and memory. Furthermore, since the present invention is a method of expanding the band of both the low frequency band and the high frequency band, it is possible to realize an excellent voice that can improve both the natural feeling by the low frequency band and the band feeling by the high frequency band. A band expansion device can be realized.
【図1】本発明の一実施例における音声帯域拡大装置の
構成図FIG. 1 is a configuration diagram of a voice band expansion device according to an embodiment of the present invention.
【図2】本発明の音声帯域拡大装置の実施例における、
さらに具体的な構成図FIG. 2 is a diagram showing an embodiment of a voice band expanding device of the present invention.
More specific configuration diagram
【図3】本発明の実施例に係るクロスフェード部の動作
説明のための概念図FIG. 3 is a conceptual diagram for explaining an operation of a crossfade unit according to an embodiment of the present invention.
【図4】第1の従来例の動作説明のための説明図FIG. 4 is an explanatory diagram for explaining an operation of a first conventional example.
【図5】第2の従来例の動作説明のための説明図FIG. 5 is an explanatory diagram for explaining an operation of a second conventional example.
【図6】第3の従来例の動作説明のための説明図FIG. 6 is an explanatory diagram for explaining an operation of a third conventional example.
【符号の説明】 11 アップサンプリング部 12 LPC分析部 13 包絡拡大部 14 駆動音源拡大部 15 LPC分析部 16 波形平滑化部 17 フィルタ部 18 加算部 21 狭帯域コードブック 22 ベクトル量子化部 23 線形写像関数部 24 包絡加算部 25 残差アップサンプリング部 26 非線形処理部 27 スペクトル平滑化部 28 ゲイン制御部 29 クロスフェード部 210 帯域通過フィルタ部[Description of Codes] 11 Upsampling Section 12 LPC Analysis Section 13 Envelope Expansion Section 14 Driving Sound Source Expansion Section 15 LPC Analysis Section 16 Waveform Smoothing Section 17 Filter Section 18 Addition Section 21 Narrowband Codebook 22 Vector Quantization Section 23 Linear Mapping Function section 24 Envelope addition section 25 Residual upsampling section 26 Non-linear processing section 27 Spectral smoothing section 28 Gain control section 29 Crossfade section 210 Band pass filter section
Claims (6)
号を線形予測分析法を用いて抽出するLPC分析部と、
前記LPC分析部により抽出された前記スペクトル包絡
情報を所望の周波数帯域に帯域を拡大する包絡拡大部
と、前記LPC分析部により算出された前記残差信号
を、所望の周波数帯域に帯域を拡大した周波数特性を有
する残差信号へと変換する駆動音源拡大部と、前記包絡
拡大部より得られる帯域拡大されたスペクトル包絡情報
と前記駆動音源拡大部より得られる帯域拡大された残差
信号を用いて音声をLPC合成するLPC合成部と、前
記LPC合成部から得られた信号列を時間軸上で平滑化
する波形平滑化部と、前記波形平滑化部より得られた信
号から前記入力信号に付加すべき周波数帯域成分をろ波
するフィルタ部と、前記入力信号を周波数特性を保持し
ながら前記入力信号のサンプリング周波数よりも高いサ
ンプリング周波数に変換した信号列を出力するアップサ
ンプリング部と、前記フィルタ部からの出力信号と前記
アップサンプリング部からの出力信号を加算する加算部
とを有する音声帯域拡大装置。1. An LPC analysis unit for extracting spectral envelope information and a residual signal from an input signal by using a linear prediction analysis method,
An envelope expansion unit that expands the spectrum envelope information extracted by the LPC analysis unit to a desired frequency band, and the residual signal calculated by the LPC analysis unit is expanded to a desired frequency band. Using a driving sound source expansion unit for converting into a residual signal having frequency characteristics, a band expanded spectrum envelope information obtained by the envelope expansion unit, and a band expanded residual signal obtained by the driving sound source expansion unit. An LPC synthesizing unit for LPC synthesizing voice, a waveform smoothing unit for smoothing a signal sequence obtained from the LPC synthesizing unit on the time axis, and a signal obtained from the waveform smoothing unit added to the input signal A filter section for filtering the frequency band component to be converted, and a sampling frequency higher than the sampling frequency of the input signal while maintaining the frequency characteristics of the input signal. And upsampling unit for outputting a signal sequence was the voice band expansion device and an addition unit for adding the output signal from the output signal of the up-sampling unit from the filter unit.
情報を広帯域なスペクトル包絡情報に線形写像する複数
の関数を有する線形写像部と、複数の狭帯域なスペクト
ル包絡情報を有するコードブックと前記コードブック中
のコードと前記入力されたスペクトル包絡情報との距離
を算出し、ベクトル量子化を行なうベクトル量子化部
と、前記線形写像部の一つ一つの関数の出力に、前記ベ
クトル量子化部からの出力で重み付けを行ない加算する
包絡拡大部とを具備してなり、前記入力されたスペクト
ル包絡情報を広帯域な包絡情報に変換することを特徴と
する請求項1記載の音声帯域拡大装置。2. The envelope enlarging unit has a linear mapping unit having a plurality of functions for linearly mapping the input spectral envelope information to a wide band spectral envelope information, a codebook having a plurality of narrow band spectral envelope information, and A vector quantizer that calculates the distance between the code in the codebook and the input spectral envelope information and performs vector quantization, and the vector quantizer at the output of each function of the linear mapping unit. The speech band expanding device according to claim 1, further comprising: an envelope expanding unit for performing weighting and adding with the output from, and converting the input spectral envelope information into wide band envelope information.
アップサンプリングする残差アップサンプリング部と、
前記残差アップサンプリング部からの出力を非線形処理
する非線形処理部と、前記非線形処理部からの出力信号
の周波数特性を平坦化するスペクトル平滑化部と、前記
スペクトル平滑化部からの出力のパワを前記残差アップ
サンプリング部からの出力を参照して制御するゲイン制
御部とを具備することを特徴とする請求項1記載の音声
帯域拡大装置。3. The driving sound source expanding unit includes a residual upsampling unit that upsamples an input residual signal,
A non-linear processing unit that performs non-linear processing on the output from the residual upsampling unit, a spectrum smoothing unit that flattens the frequency characteristics of the output signal from the non-linear processing unit, and power output from the spectrum smoothing unit. The voice band expansion device according to claim 1, further comprising a gain control unit that controls the output with reference to the output from the residual upsampling unit.
レームごとに合成された信号列を一つの時間軸上に連続
した波形として得るために、前記フレーム合成された信
号列の各々に重み付けを行ない、加算することにより時
間軸上で平滑化された信号列を得ることを特徴とする請
求項1記載の音声帯域拡大装置。4. The waveform smoothing unit adds to each of the frame-synthesized signal sequences in order to obtain a signal sequence synthesized for each frame having temporal overlap as a continuous waveform on one time axis. The voice band expansion device according to claim 1, wherein a signal sequence smoothed on a time axis is obtained by weighting and adding.
可観測な帯域をろ波し、入力音声のパワとろ波した合成
音声のパワとを同一にすることによりゲイン制御を行な
うことを特徴とする請求項3記載の音声帯域拡大装置。5. The gain control unit performs gain control by filtering the observable band of the input voice from the synthetic voice and making the power of the input voice and the power of the filtered synthetic voice the same. The voice band expansion device according to claim 3.
形を線形予測分析法を用いて抽出するLPC分析部と、
前記LPC分析部により抽出された前記スペクトル包絡
情報を複数の関数を用いて線形写像することにより、広
帯域なスペクトル包絡情報に変換する線形写像部と、複
数の狭帯域なスペクトル包絡情報により構成されるコー
ドブックと前記コードブック中の各コードと前記LPC
分析部により抽出されたスペクトル包絡情報との距離を
算出することによりベクトル量子化を行なうベクトル量
子化部と、前記線形写像部の各々の関数の出力を、前記
ベクトル量子化部の出力により重み付けを行ない加算す
ることにより広帯域スペクトル包絡情報を出力する包絡
加算部と、前記LPC分析部より抽出された前記残差信
号をアップサンプリングする残差アップサンプリング部
と、前記残差アップサンプリング部からの出力を非線形
処理する非線形処理部と、前記非線形処理部からの出力
の周波数特性を平坦化するスペクトル平滑部と、前記ス
ペクトル平滑化部からの出力を前記残差アップサンプリ
ング部からの出力を参照してパワについて制御するゲイ
ン制御部と、前記ゲイン制御部からの出力と前記包絡加
算部からの出力を用いてLPC合成を行なうLPC合成
部と、前記LPC合成部から得られた信号列を時間軸上
で平滑化する波形平滑化部と、前記波形平滑化部より得
られた信号から前記入力信号に付加すべき周波数帯域成
分をろ波する帯域通過フィルタ部と、前記入力信号を周
波数特性を保持しながら前記入力信号のサンプリング周
波数よりも高いサンプリング周波数に変換した信号列を
出力するアップサンプリング部と、前記帯域通過フィル
タ部からの出力信号と前記アップサンプリング部からの
出力信号を加算する加算部とを有する音声帯域拡大装
置。6. An LPC analysis section for extracting spectral envelope information and a residual waveform from an input signal using a linear prediction analysis method,
A linear mapping unit that converts the spectrum envelope information extracted by the LPC analysis unit into a wide band spectrum envelope information by linearly mapping the spectrum envelope information using a plurality of functions, and a plurality of narrow band spectrum envelope information. Codebook, each code in the codebook, and the LPC
A vector quantization unit for performing vector quantization by calculating a distance from the spectrum envelope information extracted by the analysis unit, and the output of each function of the linear mapping unit, weighted by the output of the vector quantization unit. An envelope adding unit that outputs wideband spectrum envelope information by performing addition, a residual upsampling unit that upsamples the residual signal extracted by the LPC analysis unit, and an output from the residual upsampling unit. A non-linear processing section for performing non-linear processing, a spectrum smoothing section for flattening the frequency characteristic of the output from the non-linear processing section, and an output from the spectrum smoothing section with reference to the output from the residual upsampling section. A gain control unit for controlling the output from the gain control unit and the output from the envelope addition unit. An LPC synthesizer for performing LPC synthesis, a waveform smoothing unit for smoothing the signal sequence obtained from the LPC synthesizer on the time axis, and a signal obtained from the waveform smoothing unit added to the input signal. A band-pass filter section for filtering a frequency band component to be processed, an up-sampling section for outputting a signal string obtained by converting the input signal to a sampling frequency higher than the sampling frequency of the input signal while maintaining frequency characteristics, and A voice band expansion device having an output signal from a band pass filter unit and an addition unit for adding an output signal from the upsampling unit.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05255895A JP3189614B2 (en) | 1995-03-13 | 1995-03-13 | Voice band expansion device |
EP96301726A EP0732687B2 (en) | 1995-03-13 | 1996-03-12 | Apparatus for expanding speech bandwidth |
DE69619284T DE69619284T3 (en) | 1995-03-13 | 1996-03-12 | Device for expanding the voice bandwidth |
US09/157,419 US5978759A (en) | 1995-03-13 | 1998-09-21 | Apparatus for expanding narrowband speech to wideband speech by codebook correspondence of linear mapping functions |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05255895A JP3189614B2 (en) | 1995-03-13 | 1995-03-13 | Voice band expansion device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08248997A true JPH08248997A (en) | 1996-09-27 |
JP3189614B2 JP3189614B2 (en) | 2001-07-16 |
Family
ID=12918154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP05255895A Expired - Lifetime JP3189614B2 (en) | 1995-03-13 | 1995-03-13 | Voice band expansion device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3189614B2 (en) |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0732687A2 (en) † | 1995-03-13 | 1996-09-18 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
WO2004040553A1 (en) * | 2002-10-31 | 2004-05-13 | Nec Corporation | Bandwidth expanding device and method |
WO2004040552A1 (en) * | 2002-10-31 | 2004-05-13 | Nec Corporation | Transcoder and coder conversion method |
JP2005258226A (en) * | 2004-03-12 | 2005-09-22 | Toshiba Corp | Method and device for wide-band voice sound decoding |
WO2006075663A1 (en) * | 2005-01-14 | 2006-07-20 | Matsushita Electric Industrial Co., Ltd. | Audio switching device and audio switching method |
JP2006201801A (en) * | 1999-01-27 | 2006-08-03 | Coding Technologies Ab | Device for improving performance of information source coding system |
US7151802B1 (en) | 1998-10-27 | 2006-12-19 | Voiceage Corporation | High frequency content recovering method and device for over-sampled synthesized wideband signal |
JP2007108360A (en) * | 2005-10-13 | 2007-04-26 | Kenwood Corp | Interpolation device, audio reproducing device, and interpolation method and interpolation program |
JP2007249075A (en) * | 2006-03-17 | 2007-09-27 | Toshiba Corp | Audio reproducing device and high-frequency interpolation processing method |
JP2007532934A (en) * | 2004-01-23 | 2007-11-15 | マイクロソフト コーポレーション | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JP2008076988A (en) * | 2006-09-25 | 2008-04-03 | Sanyo Electric Co Ltd | Low-frequency-band speech restoring device, speech signal processor, and sound recording equipment |
JPWO2006062202A1 (en) * | 2004-12-10 | 2008-06-12 | 松下電器産業株式会社 | Wideband coding apparatus, wideband LSP prediction apparatus, band scalable coding apparatus, and wideband coding method |
JP2008537165A (en) * | 2005-04-01 | 2008-09-11 | クゥアルコム・インコーポレイテッド | System, method and apparatus for wideband speech coding |
US7486719B2 (en) | 2002-10-31 | 2009-02-03 | Nec Corporation | Transcoder and code conversion method |
JP2010055000A (en) * | 2008-08-29 | 2010-03-11 | Toshiba Corp | Signal band extension device |
JP2010079275A (en) * | 2008-08-29 | 2010-04-08 | Sony Corp | Device and method for expanding frequency band, device and method for encoding, device and method for decoding, and program |
JP2010134481A (en) * | 2010-02-24 | 2010-06-17 | Toshiba Corp | Audio playback device and high-frequency interpolation processing method |
WO2011080855A1 (en) * | 2009-12-28 | 2011-07-07 | 三菱電機株式会社 | Speech signal restoration device and speech signal restoration method |
JP2012027255A (en) * | 2010-07-23 | 2012-02-09 | Oki Electric Ind Co Ltd | Band extension device, program, and voice communication device |
JP2012163981A (en) * | 2005-05-31 | 2012-08-30 | Microsoft Corp | Audio codec post-filter |
US8280727B2 (en) | 2009-06-10 | 2012-10-02 | Fujitsu Limited | Voice band expansion device, voice band expansion method, and communication apparatus |
JP2014021307A (en) * | 2012-07-19 | 2014-02-03 | Mitsubishi Electric Corp | Audio signal restoring device and audio signal restoring method |
JP2015172706A (en) * | 2014-03-12 | 2015-10-01 | 沖電気工業株式会社 | Sound decoding device and program |
US9443525B2 (en) | 2001-12-14 | 2016-09-13 | Microsoft Technology Licensing, Llc | Quality improvement techniques in an audio encoder |
JP2016528539A (en) * | 2013-07-12 | 2016-09-15 | オランジュ | Optimization scale factor for frequency band extension in speech frequency signal decoder |
US9741354B2 (en) | 2007-06-29 | 2017-08-22 | Microsoft Technology Licensing, Llc | Bitstream syntax for multi-process audio decoding |
JP2017227701A (en) * | 2016-06-21 | 2017-12-28 | 日本電信電話株式会社 | Voice encoder, voice decoder, voice encoding method, voice decoding method, program, and storage medium |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5519230B2 (en) | 2009-09-30 | 2014-06-11 | パナソニック株式会社 | Audio encoder and sound signal processing system |
-
1995
- 1995-03-13 JP JP05255895A patent/JP3189614B2/en not_active Expired - Lifetime
Cited By (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0732687A2 (en) † | 1995-03-13 | 1996-09-18 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
EP0732687B2 (en) † | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
US7151802B1 (en) | 1998-10-27 | 2006-12-19 | Voiceage Corporation | High frequency content recovering method and device for over-sampled synthesized wideband signal |
JP4519783B2 (en) * | 1999-01-27 | 2010-08-04 | ドルビー インターナショナル アクチボラゲット | Device for improving performance of information source coding system |
JP2006201801A (en) * | 1999-01-27 | 2006-08-03 | Coding Technologies Ab | Device for improving performance of information source coding system |
US9443525B2 (en) | 2001-12-14 | 2016-09-13 | Microsoft Technology Licensing, Llc | Quality improvement techniques in an audio encoder |
WO2004040553A1 (en) * | 2002-10-31 | 2004-05-13 | Nec Corporation | Bandwidth expanding device and method |
WO2004040552A1 (en) * | 2002-10-31 | 2004-05-13 | Nec Corporation | Transcoder and coder conversion method |
US7684979B2 (en) | 2002-10-31 | 2010-03-23 | Nec Corporation | Band extending apparatus and method |
US7486719B2 (en) | 2002-10-31 | 2009-02-03 | Nec Corporation | Transcoder and code conversion method |
JP2007532934A (en) * | 2004-01-23 | 2007-11-15 | マイクロソフト コーポレーション | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JP2005258226A (en) * | 2004-03-12 | 2005-09-22 | Toshiba Corp | Method and device for wide-band voice sound decoding |
JPWO2006062202A1 (en) * | 2004-12-10 | 2008-06-12 | 松下電器産業株式会社 | Wideband coding apparatus, wideband LSP prediction apparatus, band scalable coding apparatus, and wideband coding method |
JPWO2006075663A1 (en) * | 2005-01-14 | 2008-06-12 | 松下電器産業株式会社 | Voice switching device and voice switching method |
US8010353B2 (en) | 2005-01-14 | 2011-08-30 | Panasonic Corporation | Audio switching device and audio switching method that vary a degree of change in mixing ratio of mixing narrow-band speech signal and wide-band speech signal |
WO2006075663A1 (en) * | 2005-01-14 | 2006-07-20 | Matsushita Electric Industrial Co., Ltd. | Audio switching device and audio switching method |
JP2008537165A (en) * | 2005-04-01 | 2008-09-11 | クゥアルコム・インコーポレイテッド | System, method and apparatus for wideband speech coding |
US8364494B2 (en) | 2005-04-01 | 2013-01-29 | Qualcomm Incorporated | Systems, methods, and apparatus for split-band filtering and encoding of a wideband signal |
US8244526B2 (en) | 2005-04-01 | 2012-08-14 | Qualcomm Incorporated | Systems, methods, and apparatus for highband burst suppression |
US8332228B2 (en) | 2005-04-01 | 2012-12-11 | Qualcomm Incorporated | Systems, methods, and apparatus for anti-sparseness filtering |
US8260611B2 (en) | 2005-04-01 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for highband excitation generation |
US8069040B2 (en) | 2005-04-01 | 2011-11-29 | Qualcomm Incorporated | Systems, methods, and apparatus for quantization of spectral envelope representation |
JP2012163981A (en) * | 2005-05-31 | 2012-08-30 | Microsoft Corp | Audio codec post-filter |
JP2007108360A (en) * | 2005-10-13 | 2007-04-26 | Kenwood Corp | Interpolation device, audio reproducing device, and interpolation method and interpolation program |
JP2007249075A (en) * | 2006-03-17 | 2007-09-27 | Toshiba Corp | Audio reproducing device and high-frequency interpolation processing method |
JP2008076988A (en) * | 2006-09-25 | 2008-04-03 | Sanyo Electric Co Ltd | Low-frequency-band speech restoring device, speech signal processor, and sound recording equipment |
US9741354B2 (en) | 2007-06-29 | 2017-08-22 | Microsoft Technology Licensing, Llc | Bitstream syntax for multi-process audio decoding |
JP2010055000A (en) * | 2008-08-29 | 2010-03-11 | Toshiba Corp | Signal band extension device |
US8244547B2 (en) | 2008-08-29 | 2012-08-14 | Kabushiki Kaisha Toshiba | Signal bandwidth extension apparatus |
JP2010079275A (en) * | 2008-08-29 | 2010-04-08 | Sony Corp | Device and method for expanding frequency band, device and method for encoding, device and method for decoding, and program |
US8280727B2 (en) | 2009-06-10 | 2012-10-02 | Fujitsu Limited | Voice band expansion device, voice band expansion method, and communication apparatus |
CN102652336A (en) * | 2009-12-28 | 2012-08-29 | 三菱电机株式会社 | Speech signal restoration device and speech signal restoration method |
WO2011080855A1 (en) * | 2009-12-28 | 2011-07-07 | 三菱電機株式会社 | Speech signal restoration device and speech signal restoration method |
US8706497B2 (en) | 2009-12-28 | 2014-04-22 | Mitsubishi Electric Corporation | Speech signal restoration device and speech signal restoration method |
JP2010134481A (en) * | 2010-02-24 | 2010-06-17 | Toshiba Corp | Audio playback device and high-frequency interpolation processing method |
JP2012027255A (en) * | 2010-07-23 | 2012-02-09 | Oki Electric Ind Co Ltd | Band extension device, program, and voice communication device |
JP2014021307A (en) * | 2012-07-19 | 2014-02-03 | Mitsubishi Electric Corp | Audio signal restoring device and audio signal restoring method |
JP2016528539A (en) * | 2013-07-12 | 2016-09-15 | オランジュ | Optimization scale factor for frequency band extension in speech frequency signal decoder |
JP2015172706A (en) * | 2014-03-12 | 2015-10-01 | 沖電気工業株式会社 | Sound decoding device and program |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US11437049B2 (en) | 2015-06-18 | 2022-09-06 | Qualcomm Incorporated | High-band signal generation |
US12009003B2 (en) | 2015-06-18 | 2024-06-11 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
JP2017227701A (en) * | 2016-06-21 | 2017-12-28 | 日本電信電話株式会社 | Voice encoder, voice decoder, voice encoding method, voice decoding method, program, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP3189614B2 (en) | 2001-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3189614B2 (en) | Voice band expansion device | |
JP3483958B2 (en) | Broadband audio restoration apparatus, wideband audio restoration method, audio transmission system, and audio transmission method | |
JP4550289B2 (en) | CELP code conversion | |
JP3591068B2 (en) | Noise reduction method for audio signal | |
JP5535241B2 (en) | Audio signal restoration apparatus and audio signal restoration method | |
JPH10124088A (en) | Device and method for expanding voice frequency band width | |
JP3364825B2 (en) | Audio encoding device and audio encoding / decoding device | |
JP2798003B2 (en) | Voice band expansion device and voice band expansion method | |
JPH05500573A (en) | Digital audio decoder with post filter with reduced spectral distortion | |
JP4438280B2 (en) | Transcoder and code conversion method | |
JP3138574B2 (en) | Linear prediction coefficient interpolator | |
JP3598111B2 (en) | Broadband audio restoration device | |
JP2004151423A (en) | Band extending device and method | |
JP3748081B2 (en) | Broadband speech restoration method and broadband speech restoration apparatus | |
JP3770901B2 (en) | Broadband speech restoration method and broadband speech restoration apparatus | |
JP3560964B2 (en) | Broadband audio restoration apparatus, wideband audio restoration method, audio transmission system, and audio transmission method | |
JP3773509B2 (en) | Broadband speech restoration apparatus and broadband speech restoration method | |
JP3576805B2 (en) | Voice encoding method and system, and voice decoding method and system | |
JP3598112B2 (en) | Broadband audio restoration method and wideband audio restoration apparatus | |
JP2000132195A (en) | Signal encoding device and method therefor | |
JP3748080B2 (en) | Broadband speech restoration method and broadband speech restoration apparatus | |
JP4087823B2 (en) | Wideband voice restoration method and wideband voice restoration apparatus | |
JP3770899B2 (en) | Broadband speech restoration method and broadband speech restoration apparatus | |
JP3770900B2 (en) | Broadband speech restoration method and broadband speech restoration apparatus | |
JP3748083B2 (en) | Broadband speech restoration method and broadband speech restoration apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090518 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100518 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110518 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110518 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120518 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120518 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130518 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130518 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term |