[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2004246313A - Telephone set, telephone calling method, and voice frequency converting method - Google Patents

Telephone set, telephone calling method, and voice frequency converting method Download PDF

Info

Publication number
JP2004246313A
JP2004246313A JP2003160759A JP2003160759A JP2004246313A JP 2004246313 A JP2004246313 A JP 2004246313A JP 2003160759 A JP2003160759 A JP 2003160759A JP 2003160759 A JP2003160759 A JP 2003160759A JP 2004246313 A JP2004246313 A JP 2004246313A
Authority
JP
Japan
Prior art keywords
frequency
data
voice
audio
synthesized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003160759A
Other languages
Japanese (ja)
Inventor
Hideo Sano
英雄 佐野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2003160759A priority Critical patent/JP2004246313A/en
Publication of JP2004246313A publication Critical patent/JP2004246313A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a telephone set which reduces mishearing of a voice including a hard-to-hear voice frequency component. <P>SOLUTION: The telephone set has a frequency converter 6 which expands voice data received from outside into voice frequency components, generates frequency-converted data as voice data by multiplying the respective voice frequency components by a specified value, and sending the voice data to a voice output means 8. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、音声データを送受信する電話機、通話方法、および音声周波数変換方法に関する。
【0002】
【従来の技術】
従来の電話機について説明する。
【0003】
図11は従来の電話機の一構成例を示すブロック図であり、一方の電話機の送信部210aと他方の電話機の受信部220bとを示す。
【0004】
従来の電話機は、送信部210および受信部220を有する構成である。図11に示すように、送信部210aは、音声を入力するためのマイク1と、アナログ信号をデジタル信号に変換するA/D変換器2と、デジタル信号を符号化する符号器3とを備えている。受信部220bは、符号化したデータを復号する復号器5と、デジタル信号をアナログ信号に変換するD/A変換器7と、音声を出力するための音声出力手段となるスピーカ8とを備えている。一方の電話機の送信部210aに備えた符号器3と他方の電話機の受信部220bに備えた復号器5が伝送路4を介して通信可能に接続される。
【0005】
なお、一方の電話機の受信部220aは上記受信部220bと同様の構成であり、他方の電話機の送信部210bは上記送信部210aと同様の構成であることから、図11に示すことを省略している。
【0006】
上記構成の電話機の動作について説明する。
【0007】
図11において、通話者の音声が送信部210aのマイク1に入力されると、マイク1は、音声を電気信号に変換し、アナログ信号の音声データである音声信号をA/D変換器2に送出する。A/D変換器2は、マイク1から音声信号を受け取ると、音声信号を所定の時間にサンプリングし、デジタル信号の音声データである音声デジタルデータに変換して符号器3に送出する。符号器3は、A/D変換器2から音声デジタルデータを受け取ると、音声デジタルデータを符号化し、その符号化データを伝送路4を介して復号器5に送信する。
【0008】
復号器5は、符号器3から符号化データを受信すると、符号化データを復号化して音声デジタルデータをD/A変換器7に送出する。D/A変換器7は、復号器5から音声デジタルデータを受け取ると、デジタル信号の音声デジタルデータをアナログ信号の音声信号に変換し、音声信号をスピーカ8に送出する。スピーカ8は、D/A変換器7から音声信号を受け取ると、音声信号を電気音響変換して、音声で出力する(例えば、特許文献1参照)。
【0009】
また、別の電話機の構成として、音声を聞き取りやすくした手段を設けた電話機が開示されている(例えば、特許文献2参照)。
【0010】
【特許文献1】
特開2001−285409号公報
【特許文献2】
特開2002−244686号公報
【0011】
【発明が解決しようとする課題】
上述した従来の電話機には、次のような問題があった。
【0012】
年輩者は一般的に音声周波数が高くなるほど聞き取りずらくなる。特に、電話機での通話ではその傾向が強くなる。そのため、例えば、人の姓の「カトウ」を「サトウ」と聞き間違えたりすることがある。これは、「カ」および「サ」の母音「ア」の音声周波数成分のうち、高域側の2.5KHz付近に振幅の極大部があるためと考えられる。そして、このような聞き間違えが多くなると、通話者同士の意思の疎通がスムーズに行われなくなるという問題があった。
【0013】
また、近年、この問題に対して、特開2002−244686号公報に「音声加工法、これを用いた電話機及び中継局」として、高音ほど低音域への周波数変換量を大きくするような音声加工技術の提案がされている。この公報によれば、伝送路より受信した信号から周波数検出を行い、周波数変換手段により周波数シフトされた音声信号を音声回路部によって再生する構成である。この構成は、受信時に周波数特性を検出しやすい符号化方式には有効な手段であるが、一般公衆網で使用されているμ―LawやADPCM(Adaptive Differential Pulse Code Modulation)の様なCODEC(Code/Decode)には適していない。
【0014】
本発明は上記したような従来の技術が有する問題点を解決するためになされたものであり、聞き取りずらい音声周波数成分を含む音声について聞き間違いを低減する電話機、通話方法および音声周波数変換方法を提供することを目的とする。
【0015】
【課題を解決するための手段】
上記目的を達成するための本発明の電話機は、外部から受信した音声データを音声周波数成分に展開し、該各音声周波数成分に所定の倍率を乗算した音声データである周波数変換データを作成して音声を出力するための音声出力手段に送出する周波数変換器を有する構成である。
【0016】
また、本発明の電話機は、通話者の入力による音声データを音声周波数成分に展開し、該各音声周波数成分に所定の倍率を乗算した音声データである周波数変換データを作成して外部に送出する周波数変換器を有する構成である。
【0017】
また、上記本発明の電話機において、前記周波数変換器は、
前記音声データを、前記音声周波数成分およびその信号レベルからなる組み合わせデータに展開するフーリエ変換回路と、
前記フーリエ変換回路から受信する前記組み合わせデータについて信号レベルを維持したまま、前記各音声周波数成分に前記所定の倍率を乗算して周波数変換する補間回路と、
前記補間回路から受信する、周波数変換後の組み合わせデータから前記周波数変換データを作成する逆フーリエ変換回路と、
を有することとしてもよい。
【0018】
また、本発明の電話機は、音声データに近似した音声周波数特性を示す合成音声データを特定するための合成音声識別子と該合成音声識別子に対応した該合成音声データの音声周波数特性の各音声周波数成分に所定の倍率を乗算した音声周波数特性を示す周波数変換合成音声識別子を含むテーブルが格納され、前記音声データを符号化した符号化データに含まれる前記合成音声識別子に対応する前記周波数変換合成音声識別子を前記テーブルから選択し、該周波数変換合成音声識別子を含む周波数変換符号化データを作成する周波数変換器を有する構成である。
【0019】
この場合、前記周波数変換器は、
前記符号化データに含まれる前記合成音声識別子、および該合成音声識別子の合成音声データと該符号化データの音声データとの誤差を最小にするための励振信号を該符号化データから分離するインデックス分離部と、
前記合成音声識別子と該合成音声識別子に対応した周波数変換合成音声識別子を含むテーブルが格納され、前記インデックス分離部から受信する前記合成音声識別子に対応する前記周波数変換合成音声識別子を前記テーブルから選択する変換部と、
前記変換部から受信する周波数変換合成音声信号と前記インデックス分離部から受信する前記励振信号とを合成して前記周波数変換符号化データを作成するインデックス合成部と、
を有することとしてもよい。
【0020】
さらに、上記本発明の電話機において、前記所定の倍率は1より小さい正の値であることとしてもよい。
【0021】
一方、上記目的を達成するための本発明の通話方法は、外部から受信した音声データを音声周波数成分に展開し、
前記各音声周波数成分に所定の倍率を乗算した音声データである周波数変換データを作成し、
前記周波数変換データを音声を出力するための音声出力手段に送出するものである。
【0022】
また、本発明の通話方法は、通話者の入力による音声データを音声周波数成分に展開し、
前記各音声周波数成分に所定の倍率を乗算した音声データである周波数変換データを作成し、
前記周波数変換データを外部に送出するものである。
【0023】
また、上記本発明の通話方法において、前記所定の倍率は1より小さい正の値であることとしてもよい。
【0024】
さらに、上記目的を達成するための本発明の音声周波数変換方法は、音声データに近似した音声周波数特性を示す合成音声データを特定するための合成音声識別子と該合成音声識別子に対応した該合成音声データの音声周波数特性の各音声周波数成分に所定の倍率を乗算した音声周波数特性を示す周波数変換合成音声識別子を含むテーブルを設け、
前記音声データを符号化した符号化データに含まれる前記合成音声識別子に対応する前記周波数変換合成音声識別子を前記テーブルから選択し、
前記周波数変換合成音声識別子を含む周波数変換符号化データを作成するものである。
【0025】
(作用)
本発明では、音声データの音声周波数成分に所定の倍率を乗算することで、音声周波数が聞き取りやすい周波数領域側にシフトし、聞き取りやすい音声周波数に変換された音声が音声出力手段から出力される。
【0026】
また、本発明では、音声データの音声周波数成分に所定の倍率を乗算しているため、聞き取りやすい周波数に変換された音声データが外部に送出される。そのため、通信先の電話機は、受信する音声データを周波数変換する機能を備えていなくても、聞き取りやすい周波数に変換された音声を出力できる。
【0027】
また、本発明では、音声データから音声周波数成分に一旦展開してから各音声周波数に所定の倍率を乗算し、周波数変換しているので、音声周波数を聞き取りやすい周波数領域側に容易にシフトできる。
【0028】
また、本発明では、合成音声識別子と周波数変換合成音声識別子を含むテーブルを備えているため、音声周波数特性の各音声周波数に所定の倍率を乗算した音声周波数特性を示す周波数変換合成音声識別子が容易に特定される。
【0029】
さらに、本発明では、1より小さい正の値を所定の倍率として音声周波数に乗算することで、高域側の音声周波数ほど低域側に大きくシフトした音声データが出力される。そのため、高域側音声周波数の信号レベルが大きい音声について起こりやすい聞き間違いを低減できる。
【0030】
【発明の実施の形態】
本発明の電話機は、音声データの音声周波数を低域側へシフトすることで、聞き取り間違いが生じやすい高域側の音声周波数成分を低域側に変換して出力することを特徴とする。
【0031】
(第1実施例)
本発明の電話機の第1実施例について説明する。なお、以下では、従来と同様の構成については同一の符号を付し、その詳細な説明を省略する。
【0032】
図1は本実施例における電話機の一構成例を示すブロック図である。
【0033】
本実施例の電話機は、送信部210aは従来と同様の構成であるが、受信部120bは復号器5およびD/A変換器7の間に周波数変換器6を有する構成である。
【0034】
次に、周波数変換器6について説明する。
【0035】
図2は周波数変換器6の一構成例を示すブロック図である。
【0036】
図2に示すように、周波数変換器6は、音声データから音声周波数成分に展開するFFT(Fast Fourier Transform)回路31と、展開した各音声周波数成分に所定の倍率を乗算する補間(Interpolation)回路32と、周波数変換した音声周波数成分を音声データに変換した周波数変換データを作成するIFFT(Inverse Fast Fourier
Transform)回路33とを有する構成である。
【0037】
FFT回路31は、所定の時間毎に受信した音声デジタルデータにどのような周波数成分が含まれているかを調べるために、高速フーリエ変換により、周波数およびその信号レベルからなる組み合わせデータに展開する。
【0038】
補間回路32は、組み合わせデータを受信すると、各組み合わせデータについて信号レベルを維持したまま、音声周波数に所定の倍率を乗算して低域側にシフトした音声周波数に変換する。続いて、変換後の音声周波数間を補うための組み合わせデータを作成する。なお、ここでは、周波数を低域側にシフトさせるために、所定の倍率は1より小さい正の値である。
【0039】
IFFT回路33は、周波数変換後の組み合わせデータを受信すると、逆フーリエ変換して、周波数変換後の組み合わせデータを音声デジタルデータに変換した周波数変換データを作成する。
【0040】
次に、上述した構成の電話機の動作手順を説明する。
【0041】
図1において、通話者が一方の電話機を操作して他の電話機と通話可能になると、送信部210aのマイク1に音声を入力する。マイク1は、音声が入力されると、音声を電気信号に変換し、その変換による音声信号をA/D変換器2に送出する。A/D変換器2は、マイク1から音声信号を受け取ると、10KHzでサンプリングした音声デジタルデータに変換して符号器3に送出する。符号器3は、A/D変換器2から受信した音声デジタルデータを符号化し、この符号化データを伝送路4を介して他の電話機に備えた受信部120bに送信する。
【0042】
通信先の電話機に備えた受信部120bの復号器5は、符号器3から符号化データを受信すると、符号化データを復号化して音声デジタルデータを周波数変換器6に送出する。
【0043】
図3は周波数変換器6の動作手順を示すフローチャートである。
【0044】
図3に示すように、周波数変換器6が復号器5から音声デジタルデータを所定時間毎に受け取ると、FFT回路31は、音声デジタルデータについて、10KHzの周波数領域を512点で分割した19.5Hzの分解能で高速フーリエ変換して周波数成分に変換する(ステップSA1)。変換後、周波数およびその信号レベルからなる組み合わせデータを補間回路32に送出する(ステップSA2)。補間回路32は、FFT回路31から組み合わせデータを受信すると、各組み合わせデータについて信号レベルを維持したまま、周波数に所定の倍率を乗算して低域側にシフトした周波数に変換する(ステップSA3)。続いて、変換後の周波数間を補うための組み合わせデータを作成して(ステップSA4)、組み合わせデータをIFFT回路33に送出する。IFFT回路33は、補間回路32から組み合わせデータを受信すると、組み合わせデータから逆フーリエ変換して周波数変換データを作成し(ステップSA5)、周波数変換データをD/A変換器7に送出する(ステップSA6)。
【0045】
D/A変換器7は、周波数変換器6から周波数変換データを受け取ると、従来と同様に、周波数変換データをデジタル信号からアナログ信号に変換し、アナログ信号の音声信号をスピーカ8に送出する。スピーカ8は、D/A変換器7から音声信号を受け取ると、音声信号を電気音響変換して、音声で出力する。
【0046】
次に、補間回路32による周波数変換について、周波数特性データを周波数変換する場合で具体的に説明する。
【0047】
図4は周波数特性データの一例を示すグラフであり、図5は図4に示した周波数特性データの周波数変換後を示すグラフである。なお、グラフの横軸は周波数[Hz]を示し、縦軸は信号レベル[dB]を示す。
【0048】
図5に示すグラフは、図4に示した音声周波数およびその信号レベルからなる組み合わせデータについて、信号レベルを維持したまま各音声周波数に所定の倍率として0.8を乗算してプロットしたものである。ここで、図4に示す、音声周波数1.1KHzおよび4.5KHz付近にある極大部の周波数変換について注目する。周波数1.1KHz付近の極大部は、図5に示すように、変換後の音声周波数が0.9KHzになり、0.2KHz分低域側に移動している。一方、音声周波数4.5KHz付近の極大部は、図5に示すように、変換後の音声周波数が3.6KHzになり、0.9KHz分低域側に移動している。
【0049】
上述のように、図4に示す波形全体がグラフの左方向に同じ倍率でシフトして、図5に示す波形になる。また、高域側の音声周波数ほど低域側に大きく移動している。この場合、図4に示す音声周波数の極大部間の比は図5に示す波形でも同じになる。
【0050】
本実施例では、受信部に上述の周波数変換器6を備えることで、音声デジタルデータの音声周波数成分を低域側にシフトしているため、音声周波数を高域側から低域側にシフトした音声がスピーカから出力される。そのため、高域側音声周波数の信号レベルが大きい音声について、年輩者の聞き間違いを低減できる。
【0051】
また、音声デジタルデータを音声周波数成分に一旦展開してから周波数変換しているので、音声周波数を低域側に容易にシフトできる。
【0052】
さらに、所定の倍率を1より小さい正の値にすることで、高域側の音声周波数ほど低域側に大きくシフトできる。一方、所定の倍率を1より大きい正の値にすれば、低域側の音声周波数ほど高域側に大きくシフトすることもできる。この場合、低域側の音声周波数の音声を聞き取りずらい人には、音声が聞き取りやすくなる。
【0053】
(第2実施例)
本実施例は、第1実施例の周波数変換器6を送信部側に備えたものである。
【0054】
本実施例について説明する。なお、第1実施例と同様の構成については同一の符号を付し、その詳細な説明を省略する。
【0055】
図6は第2実施例における電話機の構成例を示すブロック図である。
【0056】
本実施例の電話機は、受信部220bは従来の電話機と同様の構成であるが、送信部310の構成が異なる。図6に示すように、送信部310aはA/D変換器2および符号器3の間に周波数変換器6を有する構成である。
【0057】
本実施例の電話機の動作について説明する。
【0058】
図6において、通話者が一方の電話機を操作して他の電話機と通話可能になると、送信部310aのマイク1に音声を入力する。マイク1は、音声が入力されると、その音声信号をA/D変換器2に送出する。A/D変換器2は、マイク1から音声信号を受け取ると、音声信号をアナログ信号からデジタル信号に変換した音声デジタルデータを周波数変換器6に送出する。周波数変換器6は、A/D変換器2から音声デジタルデータを受け取ると、第1実施例と同様にして、音声デジタルデータを音声周波数成分に展開して音声周波数を低域側にシフトし、作成した周波数変換データを符号器3に送出する。
【0059】
その後、第1実施例と同様に、符号器3は、周波数変換器6から受信した周波数変換データを符号化して、その符号化データを伝送路4を介して他の電話機に備えた受信部220bに送信する。
【0060】
本実施例では、第1実施例で示した周波数変換器6を送信部に備えることで、通信先の電話機に送信する音声デジタルデータの音声周波数成分を低域側にシフトしているため、音声周波数が高域側から低域側にシフトした音声デジタルデータが符号化されて通信先の電話機に送信される。そのため、通信先の電話機は、受信部に周波数変換器を備えていなくても、音声周波数が高域側から低域側にシフトした音声を出力し、高域側音声周波数の信号レベルが大きい音声について、年輩者の聞き間違いを低減できる。
【0061】
なお、上記第1実施例および第2実施例において、符号器3および復号器5で使用される符号化方式は、例えば、ITU−T G.722 SB−ADPCMを使用することができる。
【0062】
また、上記第1実施例および第2実施例では、周波数変換器6を構成する周波数展開手段にFFT回路31を用いているが離散フーリエ変換(DFT)回路としてもよい。IFFT回路33については、逆離散フーリエ変換(IDFT)回路としてもよい。
【0063】
また、上記第1実施例および第2実施例では、周波数変換器6は、音声デジタルデータから周波数変換データを作成したが、音声信号から周波数変換データを作成してもよい。
【0064】
さらに、上記第1実施例および第2実施例では、電話機同士で送受信する音声データを音声デジタルデータとしたが、音声信号でもよい。また、音声デジタルデータを符号化して送受信しているが、符号化せずに送受信してもよい。
【0065】
(第3実施例)
本実施例では、符号化データから音声周波数特性を示す情報を抽出して各音声周波数を低域側にシフトさせた符号化データに変換して外部に送出するものである。
【0066】
本実施例の構成について説明する。上述の第1実施例および第2実施例ではSB−ADPCM等の波形符号化方式を用いた場合であったが、本実施例ではハイブリッド符号化方式としてCELP(Code−Excited Linear
Prediction)符号化方式を用いた場合について説明する。
【0067】
図7は本実施例の電話機の一構成例を示すブロック図であり、一方の電話機の送信部410aと他方の電話機の受信部420bとを示す。なお、一方の電話機には他方の電話機の受信部420bと同様な構成の受信部を備え、他方の電話機には一方の電話機の送信部410aと同様な構成の送信部を備えているが、図に示すことを省略している。また、以下では、第1実施例および第2実施例と同様な構成については同一の符号を付し、その詳細な説明を省略する。
【0068】
図7に示すように、本実施例の一方の電話機は、音声データをCELP符号化方式により符号化したデータである符号化データを外部に送出する符号器13と、符号器13から受け取る符号化データの音声データの音声周波数を低域側にシフトさせる周波数変換器9とを送信部410aに備えている。また、CELP符号化方式により符号化した符号化データを復号化する復号器15を受信部に備えている。なお、CELP符号化方式については、例えば、特開平8−6597号公報に詳細に開示されている。
【0069】
次に、符号器13の構成について詳細に説明する。
【0070】
符号器13は、入力される音声データに近似した音声周波数特性を示す合成音声データを作成する線形予測符号化(LPC:Linear Predictive Coding)フィルタと、合成音声データと音声データとの誤差を最小にするための情報を保存する符合帳とを備えている。符号帳には、理想的な音源の情報である音源データが格納された音源符号帳と、過去に入力された音声データの情報である適応データが格納された適応符号帳と、上記音源データおよび適応データに乗算するための利得の情報である利得データが格納された利得符号帳とがある。
【0071】
なお、以下では、音源符号帳内の音源データについての識別子を音源符号帳インデックスと称し、適応符号帳内の適応データについての識別子を適応符号帳インデックスと称し、利得符号帳内の利得データについての識別子を利得符号帳インデックスと称する。また、音源符号帳インデックス、適応符号帳インデックス、および利得符号帳インデックスの情報を含む信号を励振信号と称する。
【0072】
また、符号器13は、LPCフィルタにより作成した合成音声データと、合成音声データに対応して合成音声データを特定するための合成音声識別子である線形予測係数VQ(Vector Quantization)インデックス(以下、単に「VQインデックス」と称する)とが記述された音声スペクトル変換テーブルを格納している。
【0073】
符号器13は、音声データを受信すると、LPCフィルタにより作成した合成音声データを特定するためのVQインデックスを音声スペクトル変換テーブルから選択する。続いて、VQインデックスと音声データとの誤差が最小になるように上記各符号帳からインデックスを選択して励振信号を作成し、VQインデックスと励振信号とを合成した符号化データを作成する。
【0074】
なお、復号器15は、上記音声スペクトル変換テーブル、音源符号帳、適応符号帳および利得符号帳とを格納している。そして、受信するVQインデックスで音声スペクトル変換テーブルから音声周波数特性を特定し、さらに、受信する励振信号で各種符号帳から音源データ、適応データ、および利得データを特定して音声データを作成し、音声データをD/A変換器7に送出する。
【0075】
次に、上記周波数変換器9の構成について詳細に説明する。
【0076】
図8は図7に示した周波数変換器の一構成例を示すブロック図である。
【0077】
周波数変換器9は、入力される符号化データをVQインデックスと励振信号に分離するインデックス分離部91と、VQインデックスで特定される音声周波数特性の各音声周波数をシフトさせた音声周波数特性を示す周波数変換VQインデックスに変換する線形予測フィルタ係数VQインデックス変換部(以下、単に「VQインデックス変換部」と称する)92と、周波数変換VQインデックスと励振信号を合成するインデックス合成部93とを有する構成である。
【0078】
VQインデックス変換部92は、VQインデックスから特定される音声周波数特性の各音声周波数を所定の倍率で高域側から低域側にシフトさせるために、VQインデックス変換テーブルを格納している。VQインデックス変換テーブルには、VQインデックスに対応して周波数変換VQインデックスが記述されている。上記所定の倍率は1より小さい正の値である。
【0079】
VQインデックス変換部92は、インデックス分離部91からVQインデックスを受け取ると、VQインデックス変換テーブルでVQインデックスに対応する周波数変換VQインデックスを選択してインデックス合成部93に送出する。
【0080】
インデックス合成部93は、VQインデックス変換部92から受け取った周波数変換VQインデックスと、インデックス分離部91から受け取った励振信号とを合成して周波数変換符号化データを作成し、周波数変換符号化データを伝送路4を介して外部に送出する。
【0081】
次に、上述した構成の電話機の動作手順を説明する。なお、所定の倍率は0.8とする。また、以下では、第1実施例および第2実施例の電話機と同様な動作についての詳細な説明は省略する。
【0082】
送信部410aの符号器13は、A/D変換器2から音声データを受け取ると、LPCフィルタにより作成した合成音声データを特定するためのVQインデックスを音声スペクトル変換テーブルから選択する。続いて、VQインデックスと音声データとの誤差が最小になるように各符号帳からインデックスを選択して励振信号を作成し、VQインデックスと励振信号とを合成した符号化データを周波数変換器9に送出する。
【0083】
図9は周波数変換器9の動作手順を示すフローチャートである。
【0084】
図9に示すように、周波数変換器9のインデックス分離部91は、符号器13から符号化データを受け取ると、符号化データをVQインデックスと、音源符号帳インデックス、適応符号帳インデックス、および利得符号帳インデックスを含む励振信号に分離し(ステップSB1)、続いて、VQインデックスをVQインデックス変換部92に送出し、励振信号をインデックス合成部93に送出する。
【0085】
VQインデックス変換部92は、インデックス分離部91からVQインデックスを受け取ると、VQインデックス変換テーブルでVQインデックスに対応する周波数変換VQインデックスを選択してインデックス合成部93に送出する(ステップSB2)。ここで選択された周波数変換VQインデックスは、入力されたVQインデックスにより特定される音声周波数特性の各音声周波数が0.8倍され、音声周波数が高域側から低域側にシフトした音声周波数特性を示すものである。
【0086】
インデックス合成部93は、VQインデックス変換部92から受け取った周波数変換VQインデックスと、インデックス分離部91から受け取った励振信号とを合成して周波数変換符号化データを作成し(ステップSB3)、周波数変換符号化データを伝送路4を介して他の電話機の復号器15に送信する(ステップSB4)。
【0087】
復号器15は、一方の電話機の周波数変換器9から周波数変換VQインデックスと励振信号を受信すると、周波数変換VQインデックスで音声スペクトル変換テーブルから音声周波数特性を特定し、励振信号で各種符号帳から音源データ、適応データ、および利得データを特定して音声データを作成して、音声データをD/A変換器7に送出する。
【0088】
D/A変換器7は、復号器15から音声データを受け取ると、デジタル信号からアナログ信号に変換し、アナログ信号の音声信号をスピーカ8に送出する。スピーカ8は、D/A変換器7から音声信号を受け取ると、音声信号を電気音響変換して、マイク1で入力された音声についての音声周波数特性の各音声周波数が0.8倍された音声で出力する。
【0089】
本実施例では、送信部に上述の周波数変換器9を備えることで、音声周波数を高域側から低域側にシフトした音声周波数特性を示す周波数変換符号化データが他の電話機に送信される。そのため、他の電話機の復号器で復号された音声データによる音声の音声周波数成分が低域側にシフトし、高域側音声周波数の信号レベルが大きい音声について、年輩者の聞き間違いを低減できる。
【0090】
また、VQインデックス変換部92はVQインデックス変換テーブルを備えているため、音声周波数特性の各音声周波数を低域側にシフトするためのインデックスを容易に特定できる。そのため、周波数変換がより速く行われ、よりスムーズに通話できる。
【0091】
さらに、所定の倍率を1より小さい正の値にすることで、高域側の音声周波数ほど低域側に大きくシフトできる。一方、所定の倍率を1より大きい正の値にすれば、低域側の音声周波数ほど高域側に大きくシフトすることもできる。この場合、低域側の音声周波数の音声を聞き取りずらい人には、音声が聞き取りやすくなる。
【0092】
なお、上記周波数変換器9を電話機の受信部に備えてもよい。
【0093】
図10は図8に示した周波数変換器を受信部に備えた電話機の構成例を示すブロック図であり、一方の電話機の送信部510aと他方の電話機の受信部520bとを示す。
【0094】
図10において、受信部520bの周波数変換器9は伝送路4を介して符号化データを受信すると、上述のようにして、VQインデックス変換テーブルで符号化データに含まれるVQインデックスに対応する周波数変換VQインデックスを選択して周波数変換符号化データを作成し、周波数変換符号化データを復号器15に送出する。このように受信部に上述の周波数変換器9を備えることで、通信先の電話機の送信部に周波数変換器を備えていなくても、音声周波数特性の各音声周波数に所定の倍率を乗算した音声周波数特性を示す周波数変換符号化データが復号器15に送信される。
【0095】
なお、第3実施例において、周波数変換器9を符号器13および復号器15のいずれか一方に備えるようにしてもよい。
【0096】
また、上記第1実施例乃至第3実施例を、相互に無線通信が可能な無線送受信部を備えた携帯型の電話機に適用してもよい。
【0097】
【発明の効果】
本発明は以上説明したように構成されているので、以下に記載する効果を奏する。
【0098】
本発明では、入力された音声信号の音声周波数を低域側にシフトして出力する周波数変換器を備え、高域側音声周波数成分を含む音声がマイクから入力されると、高域側音声周波数成分が低域側にシフトされた音声が出力される。そのため、年輩者にとって聞き取りずらい高域側音声周波数成分が低域側にシフトされ、従来のような聞き間違えが低減し、通話者同士の意思の疎通がスムーズになる。
【0099】
また、年輩者に限らず、高域側の音声周波数の音声を聞き取りずらい人に対しても有効である。
【0100】
さらに、音声データに近似した音声周波数特性を示す合成音声データを特定するためのVQインデックスと、このVQインデックスに対応した周波数変換VQインデックスを含むテーブルを予め格納することで、受信した符号化データにおける音声周波数特性の各音声周波数に所定の倍率を乗算した音声周波数特性の情報を含む符号化データが容易に作成される。そのため、周波数変換がより速く行われ、よりスムーズに通話できる。
【図面の簡単な説明】
【図1】本発明の電話機の一構成例を示すブロック図である。
【図2】本発明の周波数変換器の一構成例を示すブロック図である。
【図3】図2に示した周波数変換器の動作手順を示すブロック図である。
【図4】周波数変換前の周波数特性データを示すグラフである。
【図5】図4に示した周波数特性データの周波数変換後を示すグラフである。
【図6】本発明の第2実施例の電話機の一構成例を示すブロック図である。
【図7】本発明の第3実施例の電話機の一構成例を示すブロック図である。
【図8】図7に示した周波数変換器の一構成例を示すブロック図である。
【図9】図8に示した周波数変換器の動作手順を示すフローチャートである。
【図10】図8に示した周波数変換器を受信部に備えた電話機の一構成例を示すブロック図である。
【図11】従来の電話機の一構成例を示すブロック図である。
【符号の説明】
1 マイク
2 A/D変換器
3、13 符号器
4 伝送路
5、15 復号器
6、9 周波数変換器
7 D/A変換器
8 スピーカ
31 FFT回路
32 補間回路
33 IFFT回路
91 インデックス分離部
92 線形予測フィルタ係数VQインデックス変換部
93 インデックス合成部
120b、220b、420b、520b 受信部
210a、310a、410a、510a 送信部
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a telephone for transmitting and receiving voice data, a telephone call method, and a voice frequency conversion method.
[0002]
[Prior art]
A conventional telephone will be described.
[0003]
FIG. 11 is a block diagram showing a configuration example of a conventional telephone, showing a transmitting unit 210a of one telephone and a receiving unit 220b of the other telephone.
[0004]
A conventional telephone has a configuration including a transmission unit 210 and a reception unit 220. As shown in FIG. 11, the transmission unit 210a includes a microphone 1 for inputting audio, an A / D converter 2 for converting an analog signal into a digital signal, and an encoder 3 for encoding a digital signal. ing. The receiving unit 220b includes a decoder 5 for decoding encoded data, a D / A converter 7 for converting a digital signal into an analog signal, and a speaker 8 serving as audio output means for outputting audio. I have. The encoder 3 provided in the transmission unit 210a of one telephone and the decoder 5 provided in the reception unit 220b of the other telephone are communicably connected via the transmission path 4.
[0005]
Note that the receiving unit 220a of one telephone has the same configuration as the receiving unit 220b, and the transmitting unit 210b of the other telephone has the same configuration as the transmitting unit 210a. ing.
[0006]
The operation of the telephone having the above configuration will be described.
[0007]
In FIG. 11, when the voice of the caller is input to the microphone 1 of the transmission unit 210a, the microphone 1 converts the voice into an electric signal, and converts the voice signal, which is the voice data of the analog signal, to the A / D converter 2. Send out. Upon receiving the audio signal from the microphone 1, the A / D converter 2 samples the audio signal at a predetermined time, converts the audio signal into audio digital data, which is audio data of a digital signal, and sends it to the encoder 3. Upon receiving the audio digital data from the A / D converter 2, the encoder 3 encodes the audio digital data, and transmits the encoded data to the decoder 5 via the transmission path 4.
[0008]
When receiving the encoded data from the encoder 3, the decoder 5 decodes the encoded data and sends out the audio digital data to the D / A converter 7. Upon receiving the audio digital data from the decoder 5, the D / A converter 7 converts the audio digital data of the digital signal into an analog audio signal and sends the audio signal to the speaker 8. When receiving the audio signal from the D / A converter 7, the speaker 8 converts the audio signal to electroacoustic and outputs the audio signal as a voice (for example, see Patent Document 1).
[0009]
As another configuration of a telephone, a telephone provided with a means for making it easy to hear a voice is disclosed (for example, see Patent Document 2).
[0010]
[Patent Document 1]
JP 2001-285409 A
[Patent Document 2]
JP 2002-244686 A
[0011]
[Problems to be solved by the invention]
The conventional telephone described above has the following problems.
[0012]
Elders are generally more difficult to hear at higher audio frequencies. In particular, the tendency is stronger in telephone calls. Therefore, for example, a person's last name “Kato” may be mistaken for “Sato”. This is considered to be due to the fact that among the voice frequency components of the vowels “A” and “A” of “K” and “A”, there is a maximum portion of the amplitude near 2.5 KHz on the high frequency side. Then, when such mistakes in the number of hearings increase, there is a problem that communication between the callers is not smoothly performed.
[0013]
In recent years, in response to this problem, Japanese Patent Application Laid-Open No. 2002-244686 describes a "voice processing method, a telephone and a relay station using the same", in which the higher the treble, the greater the amount of frequency conversion to the lower frequency range. Technology proposals have been made. According to this publication, a frequency is detected from a signal received from a transmission line, and an audio signal frequency-shifted by a frequency conversion unit is reproduced by an audio circuit unit. This configuration is an effective means for an encoding system in which frequency characteristics can be easily detected at the time of reception, but is a codec (codec) such as μ-law or adaptive differential pulse code modulation (ADPCM) used in general public networks. / Decode).
[0014]
The present invention has been made in order to solve the problems of the conventional technology as described above, and a telephone, a telephone call method, and a voice frequency conversion method for reducing erroneous listening of voice including voice frequency components which are difficult to hear. The purpose is to provide.
[0015]
[Means for Solving the Problems]
The telephone of the present invention for achieving the above object develops audio data received from the outside into audio frequency components, and creates frequency conversion data which is audio data obtained by multiplying each audio frequency component by a predetermined magnification. This is a configuration having a frequency converter that sends out to audio output means for outputting audio.
[0016]
In addition, the telephone of the present invention develops voice data input by a caller into voice frequency components, creates frequency conversion data that is voice data obtained by multiplying each voice frequency component by a predetermined magnification, and sends the data to the outside. This is a configuration having a frequency converter.
[0017]
Further, in the telephone of the present invention, the frequency converter is
A Fourier transform circuit that expands the audio data into combination data including the audio frequency component and its signal level;
An interpolation circuit that performs frequency conversion by multiplying each of the audio frequency components by the predetermined magnification while maintaining a signal level for the combination data received from the Fourier transform circuit,
An inverse Fourier transform circuit that receives the interpolator and creates the frequency transform data from the frequency-converted combination data,
May be provided.
[0018]
Further, the telephone according to the present invention may further include a synthesized voice identifier for specifying synthesized voice data indicating voice frequency characteristics similar to the voice data, and each voice frequency component of the voice frequency characteristics of the synthesized voice data corresponding to the synthesized voice identifier. A table containing a frequency conversion synthesized speech identifier indicating a voice frequency characteristic multiplied by a predetermined magnification is stored, and the frequency conversion synthesized speech identifier corresponding to the synthesized speech identifier included in the encoded data obtained by encoding the speech data Is selected from the table, and a frequency converter for generating frequency conversion encoded data including the frequency conversion synthesized speech identifier is provided.
[0019]
In this case, the frequency converter comprises:
The synthesized speech identifier included in the encoded data, and an index separation for separating an excitation signal for minimizing an error between synthesized speech data of the synthesized speech identifier and speech data of the encoded data from the encoded data. Department and
A table including the synthesized speech identifier and a frequency conversion synthesized speech identifier corresponding to the synthesized speech identifier is stored, and the frequency conversion synthesized speech identifier corresponding to the synthesized speech identifier received from the index separation unit is selected from the table. A conversion unit;
An index synthesizing unit that synthesizes the frequency conversion synthesized voice signal received from the conversion unit and the excitation signal received from the index separation unit to create the frequency conversion encoded data,
May be provided.
[0020]
Further, in the telephone according to the present invention, the predetermined magnification may be a positive value smaller than one.
[0021]
On the other hand, the call method of the present invention for achieving the above object is to develop audio data received from the outside into audio frequency components,
Create frequency conversion data which is audio data obtained by multiplying each audio frequency component by a predetermined magnification,
The frequency conversion data is sent to audio output means for outputting audio.
[0022]
Further, the call method of the present invention expands voice data by a caller's input into voice frequency components,
Create frequency conversion data which is audio data obtained by multiplying each audio frequency component by a predetermined magnification,
The frequency conversion data is sent to the outside.
[0023]
Further, in the above-mentioned communication method of the present invention, the predetermined magnification may be a positive value smaller than 1.
[0024]
Further, the speech frequency conversion method of the present invention for achieving the above object comprises a synthesized speech identifier for specifying synthesized speech data having speech frequency characteristics similar to speech data and the synthesized speech identifier corresponding to the synthesized speech identifier. Providing a table including a frequency conversion synthesized voice identifier indicating a voice frequency characteristic obtained by multiplying each voice frequency component of the voice frequency characteristics of the data by a predetermined magnification,
Selecting the frequency conversion synthesized speech identifier corresponding to the synthesized speech identifier included in the encoded data obtained by encoding the speech data from the table,
The frequency conversion encoded data including the frequency conversion synthesized speech identifier is created.
[0025]
(Action)
According to the present invention, by multiplying the audio frequency component of the audio data by a predetermined magnification, the audio frequency is shifted to the frequency range where the audio is easy to hear, and the audio converted to the audio frequency that is easy to hear is output from the audio output unit.
[0026]
Further, in the present invention, since the audio frequency component of the audio data is multiplied by the predetermined magnification, the audio data converted to a frequency that is easy to hear is transmitted to the outside. Therefore, even if the telephone at the communication destination does not have a function of converting the frequency of the received voice data, it can output voice converted to a frequency that is easy to hear.
[0027]
Further, in the present invention, since the audio data is once expanded into audio frequency components, and each audio frequency is multiplied by a predetermined magnification and frequency-converted, the audio frequency can be easily shifted to a frequency region where the audio frequency is easy to hear.
[0028]
Further, according to the present invention, since the table including the synthesized speech identifier and the frequency conversion synthesized speech identifier is provided, the frequency conversion synthesized speech identifier indicating the audio frequency characteristic obtained by multiplying each audio frequency of the audio frequency characteristic by a predetermined magnification can be easily obtained. Is specified.
[0029]
Further, according to the present invention, by multiplying the audio frequency by a positive value smaller than 1 as a predetermined magnification, audio data that is shifted to a lower frequency side as the audio frequency is higher is output. For this reason, it is possible to reduce listening mistakes that are likely to occur in voices having a high signal level of the high-frequency side voice frequency.
[0030]
BEST MODE FOR CARRYING OUT THE INVENTION
The telephone according to the present invention is characterized in that, by shifting the audio frequency of audio data to the lower frequency side, the audio frequency component in the higher frequency area, which is likely to be erroneously heard, is converted to the lower frequency side and output.
[0031]
(First embodiment)
A first embodiment of the telephone according to the present invention will be described. In the following, the same components as those in the related art are denoted by the same reference numerals, and detailed description thereof will be omitted.
[0032]
FIG. 1 is a block diagram showing one configuration example of the telephone according to the present embodiment.
[0033]
In the telephone of this embodiment, the transmitting unit 210a has the same configuration as the conventional one, but the receiving unit 120b has a configuration in which the frequency converter 6 is provided between the decoder 5 and the D / A converter 7.
[0034]
Next, the frequency converter 6 will be described.
[0035]
FIG. 2 is a block diagram illustrating a configuration example of the frequency converter 6.
[0036]
As shown in FIG. 2, the frequency converter 6 includes an FFT (Fast Fourier Transform) circuit 31 for expanding audio data into audio frequency components, and an interpolation circuit for multiplying each of the expanded audio frequency components by a predetermined magnification. 32 and an IFFT (Inverse Fast Fourier) for creating frequency-converted data obtained by converting frequency-converted audio frequency components into audio data.
(Transform) circuit 33.
[0037]
The FFT circuit 31 develops the data into combination data composed of the frequency and the signal level by fast Fourier transform in order to check what frequency component is included in the audio digital data received every predetermined time.
[0038]
Upon receiving the combination data, the interpolation circuit 32 multiplies the audio frequency by a predetermined magnification while maintaining the signal level of each combination data to convert the audio data to an audio frequency shifted to a lower frequency side. Subsequently, combination data for supplementing the converted audio frequencies is created. Here, the predetermined magnification is a positive value smaller than 1 in order to shift the frequency to the lower frequency side.
[0039]
Upon receiving the frequency-converted combination data, the IFFT circuit 33 performs inverse Fourier transform to generate frequency conversion data obtained by converting the frequency-converted combination data into audio digital data.
[0040]
Next, an operation procedure of the telephone having the above configuration will be described.
[0041]
In FIG. 1, when a caller operates one telephone and can talk to the other telephone, a voice is input to the microphone 1 of the transmitting unit 210a. When a voice is input, the microphone 1 converts the voice into an electric signal, and sends out the converted voice signal to the A / D converter 2. When the A / D converter 2 receives the audio signal from the microphone 1, the A / D converter 2 converts the audio signal into audio digital data sampled at 10 KHz and sends it to the encoder 3. The encoder 3 encodes the audio digital data received from the A / D converter 2, and transmits the encoded data to the receiving unit 120b provided in another telephone via the transmission line 4.
[0042]
When receiving the encoded data from the encoder 3, the decoder 5 of the receiving unit 120 b provided in the communication destination telephone decodes the encoded data and sends out the audio digital data to the frequency converter 6.
[0043]
FIG. 3 is a flowchart showing the operation procedure of the frequency converter 6.
[0044]
As shown in FIG. 3, when the frequency converter 6 receives the audio digital data from the decoder 5 every predetermined time, the FFT circuit 31 divides the 10 kHz frequency region of the audio digital data by 512 points into 19.5 Hz. Fast Fourier transform is performed at the resolution of (1) to convert to frequency components (step SA1). After the conversion, the combination data including the frequency and the signal level is sent to the interpolation circuit 32 (step SA2). Upon receiving the combination data from the FFT circuit 31, the interpolation circuit 32 converts the frequency into a frequency shifted to a lower frequency side by multiplying the frequency by a predetermined magnification while maintaining the signal level of each combination data (step SA3). Subsequently, combination data for compensating for the frequency interval after the conversion is created (step SA4), and the combination data is sent to the IFFT circuit 33. Upon receiving the combination data from the interpolation circuit 32, the IFFT circuit 33 performs inverse Fourier transform on the combination data to create frequency conversion data (step SA5), and sends the frequency conversion data to the D / A converter 7 (step SA6). ).
[0045]
Upon receiving the frequency conversion data from the frequency converter 6, the D / A converter 7 converts the frequency conversion data from a digital signal to an analog signal and sends an analog audio signal to the speaker 8 as in the related art. When the speaker 8 receives the audio signal from the D / A converter 7, the speaker 8 performs electroacoustic conversion on the audio signal and outputs the audio signal.
[0046]
Next, the frequency conversion by the interpolation circuit 32 will be specifically described in the case of frequency conversion of frequency characteristic data.
[0047]
FIG. 4 is a graph showing an example of the frequency characteristic data, and FIG. 5 is a graph showing the frequency characteristic data shown in FIG. 4 after frequency conversion. The horizontal axis of the graph indicates the frequency [Hz], and the vertical axis indicates the signal level [dB].
[0048]
The graph shown in FIG. 5 is obtained by multiplying each audio frequency by 0.8 as a predetermined magnification while keeping the signal level, and plotting the combined data including the audio frequency and its signal level shown in FIG. . Here, attention is paid to the frequency conversion of the local maximums near the audio frequencies of 1.1 KHz and 4.5 KHz shown in FIG. As shown in FIG. 5, the local maximum at a frequency of about 1.1 KHz has a converted audio frequency of 0.9 KHz, and has moved to the lower side by 0.2 KHz. On the other hand, as shown in FIG. 5, the converted maximum audio frequency of the local maximum near the audio frequency of 4.5 KHz is 3.6 KHz, and is shifted to the lower side by 0.9 KHz.
[0049]
As described above, the entire waveform shown in FIG. 4 is shifted to the left of the graph at the same magnification to become the waveform shown in FIG. Also, the higher the audio frequency, the greater the frequency shifts to the lower frequency side. In this case, the ratio between the maximum parts of the audio frequency shown in FIG. 4 is the same in the waveform shown in FIG.
[0050]
In the present embodiment, since the receiving unit is provided with the above-described frequency converter 6, the audio frequency component of the audio digital data is shifted to the low frequency side, so that the audio frequency is shifted from the high frequency side to the low frequency side. Sound is output from the speaker. For this reason, it is possible to reduce mistakes in listening by seniors with respect to voice having a high signal level of the high-frequency side voice frequency.
[0051]
Further, since the audio digital data is once expanded into audio frequency components and then subjected to frequency conversion, the audio frequency can be easily shifted to a lower frequency side.
[0052]
Further, by setting the predetermined magnification to a positive value smaller than 1, a higher audio frequency can be shifted to a lower frequency side. On the other hand, if the predetermined magnification is set to a positive value larger than 1, the audio frequency on the lower frequency side can be shifted to the higher frequency side more. In this case, the voice is easily heard by a person who has difficulty in hearing the voice of the low frequency side audio frequency.
[0053]
(Second embodiment)
In this embodiment, the frequency converter 6 of the first embodiment is provided on the transmitting side.
[0054]
This embodiment will be described. The same components as those in the first embodiment are denoted by the same reference numerals, and detailed description thereof will be omitted.
[0055]
FIG. 6 is a block diagram showing a configuration example of a telephone according to the second embodiment.
[0056]
In the telephone of this embodiment, the receiving unit 220b has the same configuration as the conventional telephone, but the configuration of the transmitting unit 310 is different. As shown in FIG. 6, the transmission unit 310a has a configuration in which the frequency converter 6 is provided between the A / D converter 2 and the encoder 3.
[0057]
The operation of the telephone according to the present embodiment will be described.
[0058]
In FIG. 6, when the caller operates one of the telephones and becomes able to talk with the other telephone, a voice is input to the microphone 1 of the transmitting unit 310a. When a voice is input, the microphone 1 sends the voice signal to the A / D converter 2. When the A / D converter 2 receives the audio signal from the microphone 1, the A / D converter 2 sends audio digital data obtained by converting the audio signal from an analog signal to a digital signal to the frequency converter 6. Upon receiving the audio digital data from the A / D converter 2, the frequency converter 6 expands the audio digital data into audio frequency components and shifts the audio frequency to a lower frequency band, as in the first embodiment. The generated frequency conversion data is sent to the encoder 3.
[0059]
Thereafter, as in the first embodiment, the encoder 3 encodes the frequency conversion data received from the frequency converter 6, and transmits the encoded data via the transmission line 4 to the receiving unit 220b provided in another telephone. Send to
[0060]
In this embodiment, since the transmission unit is provided with the frequency converter 6 shown in the first embodiment, the audio frequency component of the audio digital data to be transmitted to the telephone at the communication destination is shifted to a lower frequency side. The digital audio data whose frequency is shifted from the high frequency side to the low frequency side is encoded and transmitted to the telephone at the communication destination. Therefore, even if the receiving telephone does not include the frequency converter in the receiving unit, the telephone outputs the audio whose audio frequency is shifted from the high frequency side to the low frequency side, and the signal level of the high frequency audio frequency is large. About, it is possible to reduce mistakes in listening by seniors.
[0061]
In the first and second embodiments, the encoding method used in the encoder 3 and the decoder 5 is, for example, ITU-T G.264. 722 SB-ADPCM can be used.
[0062]
In the first and second embodiments, the FFT circuit 31 is used as the frequency expanding means constituting the frequency converter 6, but a discrete Fourier transform (DFT) circuit may be used. The IFFT circuit 33 may be an inverse discrete Fourier transform (IDFT) circuit.
[0063]
Further, in the first and second embodiments, the frequency converter 6 creates the frequency conversion data from the audio digital data. However, the frequency converter 6 may create the frequency conversion data from the audio signal.
[0064]
Furthermore, in the first and second embodiments, the audio data transmitted and received between the telephones is digital audio data, but may be an audio signal. Although audio digital data is encoded and transmitted, it may be transmitted and received without encoding.
[0065]
(Third embodiment)
In the present embodiment, information indicating audio frequency characteristics is extracted from encoded data, converted into encoded data in which each audio frequency is shifted to a lower frequency side, and transmitted to the outside.
[0066]
The configuration of the present embodiment will be described. In the first and second embodiments described above, the case where a waveform coding method such as SB-ADPCM is used, but in this embodiment, CELP (Code-Excited Linear) is used as a hybrid coding method.
A description will be given of a case in which a Prediction coding method is used.
[0067]
FIG. 7 is a block diagram showing one configuration example of the telephone according to the present embodiment, and shows a transmitting unit 410a of one telephone and a receiving unit 420b of the other telephone. Note that one of the telephones has a receiving unit having the same configuration as the receiving unit 420b of the other telephone, and the other telephone has a transmitting unit of the same configuration as the transmitting unit 410a of the one telephone. Are omitted. In the following, the same components as those in the first and second embodiments are denoted by the same reference numerals, and detailed description thereof will be omitted.
[0068]
As shown in FIG. 7, one of the telephone sets according to the present embodiment includes an encoder 13 for transmitting encoded data, which is data obtained by encoding voice data by a CELP encoding method, to the outside, and an encoding device for receiving the encoded data from the encoder 13. The transmission unit 410a includes a frequency converter 9 that shifts the audio frequency of the audio data of the data to a lower frequency side. Further, the receiving unit includes a decoder 15 for decoding the encoded data encoded by the CELP encoding method. The CELP coding method is disclosed in detail in, for example, Japanese Patent Application Laid-Open No. H8-6597.
[0069]
Next, the configuration of the encoder 13 will be described in detail.
[0070]
The encoder 13 includes a linear predictive coding (LPC) filter that creates synthesized speech data having speech frequency characteristics similar to the input speech data, and minimizes an error between the synthesized speech data and the speech data. And a codebook for storing information to be performed. In the codebook, an excitation codebook in which excitation data that is information of ideal excitation is stored, an adaptive codebook in which adaptive data that is information of speech data input in the past is stored, and the excitation data and There is a gain codebook that stores gain data that is gain information for multiplying adaptive data.
[0071]
In the following, an identifier for excitation data in an excitation codebook is referred to as an excitation codebook index, an identifier for adaptive data in an adaptive codebook is referred to as an adaptive codebook index, and gain data in a gain codebook is referred to as an index. The identifier is called a gain codebook index. A signal including information on the excitation codebook index, the adaptive codebook index, and the gain codebook index is referred to as an excitation signal.
[0072]
The encoder 13 also generates synthesized speech data created by the LPC filter and a linear prediction coefficient VQ (Vector Quantization) index (hereinafter simply referred to as a synthesized speech data) for identifying the synthesized speech data corresponding to the synthesized speech data. (Referred to as “VQ index”).
[0073]
Upon receiving the voice data, the encoder 13 selects a VQ index for specifying the synthesized voice data created by the LPC filter from the voice spectrum conversion table. Subsequently, an excitation signal is created by selecting an index from each of the above codebooks so that an error between the VQ index and the audio data is minimized, and encoded data in which the VQ index and the excitation signal are combined is created.
[0074]
The decoder 15 stores the speech spectrum conversion table, the excitation codebook, the adaptive codebook, and the gain codebook. Then, the voice frequency characteristic is specified from the voice spectrum conversion table by the received VQ index, and the sound source data, the adaptive data, and the gain data are specified from the various codebooks by the received excitation signal, and the voice data is created. The data is sent to the D / A converter 7.
[0075]
Next, the configuration of the frequency converter 9 will be described in detail.
[0076]
FIG. 8 is a block diagram showing a configuration example of the frequency converter shown in FIG.
[0077]
The frequency converter 9 separates the input coded data into a VQ index and an excitation signal, and an index separating unit 91, and a frequency indicating a voice frequency characteristic obtained by shifting each voice frequency of a voice frequency characteristic specified by the VQ index. The configuration includes a linear prediction filter coefficient VQ index conversion unit (hereinafter, simply referred to as “VQ index conversion unit”) 92 for converting to a conversion VQ index, and an index synthesis unit 93 for synthesizing the frequency conversion VQ index and the excitation signal. .
[0078]
The VQ index conversion unit 92 stores a VQ index conversion table for shifting each audio frequency of the audio frequency characteristic specified from the VQ index from a high frequency side to a low frequency side at a predetermined magnification. The VQ index conversion table describes frequency conversion VQ indexes corresponding to the VQ indexes. The predetermined magnification is a positive value smaller than one.
[0079]
Upon receiving the VQ index from the index separation section 91, the VQ index conversion section 92 selects a frequency conversion VQ index corresponding to the VQ index in the VQ index conversion table and sends it to the index synthesis section 93.
[0080]
The index synthesizing unit 93 synthesizes the frequency conversion VQ index received from the VQ index conversion unit 92 and the excitation signal received from the index separation unit 91 to create frequency conversion encoded data, and transmits the frequency conversion encoded data. It is sent to the outside via the path 4.
[0081]
Next, an operation procedure of the telephone having the above configuration will be described. Note that the predetermined magnification is 0.8. In the following, a detailed description of the same operations as those of the telephones of the first and second embodiments will be omitted.
[0082]
Upon receiving the audio data from the A / D converter 2, the encoder 13 of the transmitting unit 410a selects a VQ index for specifying the synthesized audio data created by the LPC filter from the audio spectrum conversion table. Subsequently, an excitation signal is created by selecting an index from each codebook so that an error between the VQ index and the audio data is minimized, and the encoded data obtained by combining the VQ index and the excitation signal is transmitted to the frequency converter 9. Send out.
[0083]
FIG. 9 is a flowchart showing the operation procedure of the frequency converter 9.
[0084]
As shown in FIG. 9, when receiving the encoded data from the encoder 13, the index separating unit 91 of the frequency converter 9 converts the encoded data into a VQ index, an excitation codebook index, an adaptive codebook index, and a gain code. It is separated into an excitation signal including a book index (step SB1). Subsequently, the VQ index is sent to the VQ index conversion unit 92, and the excitation signal is sent to the index synthesis unit 93.
[0085]
Upon receiving the VQ index from the index separation unit 91, the VQ index conversion unit 92 selects a frequency conversion VQ index corresponding to the VQ index in the VQ index conversion table and sends it to the index synthesis unit 93 (step SB2). The frequency conversion VQ index selected here is obtained by multiplying each audio frequency of the audio frequency characteristic specified by the input VQ index by 0.8, and shifting the audio frequency from the high frequency side to the low frequency side. It is shown.
[0086]
The index synthesizing unit 93 synthesizes the frequency conversion VQ index received from the VQ index conversion unit 92 and the excitation signal received from the index separation unit 91 to create frequency conversion encoded data (step SB3). The encrypted data is transmitted to the decoder 15 of another telephone via the transmission line 4 (step SB4).
[0087]
When the decoder 15 receives the frequency conversion VQ index and the excitation signal from the frequency converter 9 of one of the telephones, the decoder 15 specifies the audio frequency characteristics from the audio spectrum conversion table using the frequency conversion VQ index, and uses the excitation signal to generate the sound source from various codebooks. The audio data is created by specifying the data, the adaptation data, and the gain data, and the audio data is sent to the D / A converter 7.
[0088]
Upon receiving the audio data from the decoder 15, the D / A converter 7 converts the digital signal into an analog signal and sends out the analog audio signal to the speaker 8. Upon receiving the audio signal from the D / A converter 7, the speaker 8 performs electroacoustic conversion on the audio signal, and the audio having the audio frequency characteristics of the audio input by the microphone 1 multiplied by 0.8. To output.
[0089]
In the present embodiment, by providing the above-described frequency converter 9 in the transmission unit, the frequency conversion coded data indicating the audio frequency characteristic in which the audio frequency is shifted from the high frequency side to the low frequency side is transmitted to another telephone. . For this reason, the audio frequency component of the audio due to the audio data decoded by the decoder of the other telephone shifts to the low frequency side, and the elderly person can reduce mistakes in the audio with a large signal level of the high frequency audio frequency.
[0090]
Further, since the VQ index conversion unit 92 includes the VQ index conversion table, it is possible to easily specify an index for shifting each audio frequency of the audio frequency characteristic to the lower frequency side. Therefore, the frequency conversion is performed faster, and the call can be performed more smoothly.
[0091]
Further, by setting the predetermined magnification to a positive value smaller than 1, a higher audio frequency can be shifted to a lower frequency side. On the other hand, if the predetermined magnification is set to a positive value larger than 1, the audio frequency on the lower frequency side can be shifted to the higher frequency side more. In this case, the voice is easily heard by a person who has difficulty in hearing the voice of the low frequency side audio frequency.
[0092]
Note that the frequency converter 9 may be provided in a receiving unit of the telephone.
[0093]
FIG. 10 is a block diagram showing a configuration example of a telephone provided with the frequency converter shown in FIG. 8 in a receiving unit, and shows a transmitting unit 510a of one telephone and a receiving unit 520b of the other telephone.
[0094]
In FIG. 10, when the frequency converter 9 of the receiving unit 520b receives the encoded data via the transmission path 4, as described above, the frequency converter 9 corresponding to the VQ index included in the encoded data in the VQ index conversion table is used. The VQ index is selected to create frequency conversion encoded data, and the frequency conversion encoded data is sent to the decoder 15. Thus, by providing the above-described frequency converter 9 in the receiving unit, even if the transmitting unit of the communication destination telephone does not include the frequency converter, the audio obtained by multiplying each audio frequency of the audio frequency characteristic by a predetermined magnification is used. The frequency conversion encoded data indicating the frequency characteristics is transmitted to the decoder 15.
[0095]
In the third embodiment, the frequency converter 9 may be provided in one of the encoder 13 and the decoder 15.
[0096]
Further, the first to third embodiments may be applied to a portable telephone provided with a wireless transmission / reception unit capable of wireless communication with each other.
[0097]
【The invention's effect】
Since the present invention is configured as described above, the following effects can be obtained.
[0098]
The present invention includes a frequency converter that shifts an audio frequency of an input audio signal to a low frequency side and outputs the shifted audio frequency. When audio including a high frequency audio frequency component is input from a microphone, the high frequency audio frequency A sound whose component is shifted to the lower frequency side is output. For this reason, the high-frequency sound frequency components that are difficult for the elderly to hear are shifted to the low-frequency side, so that mistakes in the conventional listening are reduced, and the communication between the callers becomes smooth.
[0099]
Further, the present invention is effective not only for the elderly but also for those who have difficulty in hearing the sound of the high-frequency sound frequency.
[0100]
Further, by storing in advance a table including a VQ index for specifying synthesized voice data indicating voice frequency characteristics similar to voice data and a frequency conversion VQ index corresponding to the VQ index, the received coded data Encoded data including information on audio frequency characteristics obtained by multiplying each audio frequency of the audio frequency characteristics by a predetermined magnification is easily created. Therefore, the frequency conversion is performed faster, and the call can be performed more smoothly.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration example of a telephone according to the present invention.
FIG. 2 is a block diagram illustrating a configuration example of a frequency converter according to the present invention.
FIG. 3 is a block diagram showing an operation procedure of the frequency converter shown in FIG.
FIG. 4 is a graph showing frequency characteristic data before frequency conversion.
FIG. 5 is a graph showing the frequency characteristic data shown in FIG. 4 after frequency conversion.
FIG. 6 is a block diagram illustrating a configuration example of a telephone according to a second embodiment of the present invention.
FIG. 7 is a block diagram showing a configuration example of a telephone according to a third embodiment of the present invention.
FIG. 8 is a block diagram illustrating a configuration example of a frequency converter illustrated in FIG. 7;
9 is a flowchart showing an operation procedure of the frequency converter shown in FIG.
10 is a block diagram showing a configuration example of a telephone provided with the frequency converter shown in FIG. 8 in a receiving unit.
FIG. 11 is a block diagram showing a configuration example of a conventional telephone.
[Explanation of symbols]
1 microphone
2 A / D converter
3,13 encoder
4 Transmission line
5, 15 decoder
6, 9 frequency converter
7 D / A converter
8 Speaker
31 FFT circuit
32 interpolation circuit
33 IFFT circuit
91 Index separation unit
92 Linear prediction filter coefficient VQ index converter
93 Index Synthesizer
120b, 220b, 420b, 520b Receiver
210a, 310a, 410a, 510a Transmitter

Claims (10)

外部から受信した音声データを音声周波数成分に展開し、該各音声周波数成分に所定の倍率を乗算した音声データである周波数変換データを作成して音声を出力するための音声出力手段に送出する周波数変換器を有する電話機。The audio data received from the outside is expanded into audio frequency components, frequency conversion data which is audio data obtained by multiplying each audio frequency component by a predetermined magnification, and transmitted to audio output means for outputting audio. Telephone with converter. 通話者の入力による音声データを音声周波数成分に展開し、該各音声周波数成分に所定の倍率を乗算した音声データである周波数変換データを作成して外部に送出する周波数変換器を有する電話機。A telephone having a frequency converter that expands voice data input by a caller into voice frequency components, generates frequency conversion data that is voice data obtained by multiplying each voice frequency component by a predetermined magnification, and sends the data to the outside. 前記周波数変換器は、
前記音声データを、前記音声周波数成分およびその信号レベルからなる組み合わせデータに展開するフーリエ変換回路と、
前記フーリエ変換回路から受信する前記組み合わせデータについて信号レベルを維持したまま、前記各音声周波数成分に前記所定の倍率を乗算して周波数変換する補間回路と、
前記補間回路から受信する、周波数変換後の組み合わせデータから前記周波数変換データを作成する逆フーリエ変換回路と、
を有する請求項1または2記載の電話機。
The frequency converter,
A Fourier transform circuit that expands the audio data into combination data including the audio frequency component and its signal level;
An interpolation circuit that performs frequency conversion by multiplying each of the audio frequency components by the predetermined magnification while maintaining a signal level for the combination data received from the Fourier transform circuit,
An inverse Fourier transform circuit that receives the interpolator and creates the frequency transform data from the frequency-converted combination data,
The telephone according to claim 1 or 2, further comprising:
音声データに近似した音声周波数特性を示す合成音声データを特定するための合成音声識別子と該合成音声識別子に対応した該合成音声データの音声周波数特性の各音声周波数成分に所定の倍率を乗算した音声周波数特性を示す周波数変換合成音声識別子を含むテーブルが格納され、前記音声データを符号化した符号化データに含まれる前記合成音声識別子に対応する前記周波数変換合成音声識別子を前記テーブルから選択し、該周波数変換合成音声識別子を含む周波数変換符号化データを作成する周波数変換器を有する電話機。Synthesized voice identifier for specifying synthesized voice data indicating voice frequency characteristics similar to voice data, and voice obtained by multiplying each voice frequency component of the voice frequency characteristics of the synthesized voice data corresponding to the synthesized voice identifier by a predetermined magnification. A table including a frequency conversion synthesized voice identifier indicating a frequency characteristic is stored, and the frequency conversion synthesized voice identifier corresponding to the synthesized voice identifier included in the encoded data obtained by encoding the voice data is selected from the table. A telephone having a frequency converter for creating frequency conversion encoded data including a frequency conversion synthesized speech identifier. 前記周波数変換器は、
前記符号化データに含まれる前記合成音声識別子、および該合成音声識別子の合成音声データと該符号化データの音声データとの誤差を最小にするための励振信号を該符号化データから分離するインデックス分離部と、
前記合成音声識別子と該合成音声識別子に対応した周波数変換合成音声識別子を含むテーブルが格納され、前記インデックス分離部から受信する前記合成音声識別子に対応する前記周波数変換合成音声識別子を前記テーブルから選択する変換部と、
前記変換部から受信する周波数変換合成音声信号と前記インデックス分離部から受信する前記励振信号とを合成して前記周波数変換符号化データを作成するインデックス合成部と、
を有する請求項4記載の電話機。
The frequency converter,
The synthesized speech identifier included in the encoded data, and an index separation for separating an excitation signal for minimizing an error between synthesized speech data of the synthesized speech identifier and speech data of the encoded data from the encoded data. Department and
A table including the synthesized speech identifier and a frequency conversion synthesized speech identifier corresponding to the synthesized speech identifier is stored, and the frequency conversion synthesized speech identifier corresponding to the synthesized speech identifier received from the index separation unit is selected from the table. A conversion unit;
An index synthesizing unit that synthesizes the frequency conversion synthesized voice signal received from the conversion unit and the excitation signal received from the index separation unit to create the frequency conversion encoded data,
The telephone according to claim 4, comprising:
前記所定の倍率は1より小さい正の値である請求項1乃至5のいずれか1項記載の電話機。The telephone according to any one of claims 1 to 5, wherein the predetermined magnification is a positive value smaller than one. 外部から受信した音声データを音声周波数成分に展開し、
前記各音声周波数成分に所定の倍率を乗算した音声データである周波数変換データを作成し、
前記周波数変換データを音声を出力するための音声出力手段に送出する通話方法。
Expands audio data received from outside into audio frequency components,
Create frequency conversion data which is audio data obtained by multiplying each audio frequency component by a predetermined magnification,
A communication method for transmitting the frequency conversion data to audio output means for outputting audio.
通話者の入力による音声データを音声周波数成分に展開し、
前記各音声周波数成分に所定の倍率を乗算した音声データである周波数変換データを作成し、
前記周波数変換データを外部に送出する通話方法。
Expands voice data from the input of the caller into voice frequency components,
Create frequency conversion data which is audio data obtained by multiplying each audio frequency component by a predetermined magnification,
A communication method for transmitting the frequency conversion data to the outside.
前記所定の倍率は1より小さい正の値である請求項7または8記載の通話方法。9. The communication method according to claim 7, wherein the predetermined magnification is a positive value smaller than one. 音声データに近似した音声周波数特性を示す合成音声データを特定するための合成音声識別子と該合成音声識別子に対応した該合成音声データの音声周波数特性の各音声周波数成分に所定の倍率を乗算した音声周波数特性を示す周波数変換合成音声識別子を含むテーブルを設け、
前記音声データを符号化した符号化データに含まれる前記合成音声識別子に対応する前記周波数変換合成音声識別子を前記テーブルから選択し、
前記周波数変換合成音声識別子を含む周波数変換符号化データを作成する音声周波数変換方法。
Synthesized voice identifier for specifying synthesized voice data indicating voice frequency characteristics similar to voice data, and voice obtained by multiplying each voice frequency component of the voice frequency characteristics of the synthesized voice data corresponding to the synthesized voice identifier by a predetermined magnification. Provide a table including a frequency conversion synthesized speech identifier indicating the frequency characteristics,
Selecting the frequency conversion synthesized speech identifier corresponding to the synthesized speech identifier included in the encoded data obtained by encoding the speech data from the table,
A voice frequency conversion method for generating frequency conversion encoded data including the frequency conversion synthesized voice identifier.
JP2003160759A 2002-12-19 2003-06-05 Telephone set, telephone calling method, and voice frequency converting method Pending JP2004246313A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003160759A JP2004246313A (en) 2002-12-19 2003-06-05 Telephone set, telephone calling method, and voice frequency converting method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002368177 2002-12-19
JP2003160759A JP2004246313A (en) 2002-12-19 2003-06-05 Telephone set, telephone calling method, and voice frequency converting method

Publications (1)

Publication Number Publication Date
JP2004246313A true JP2004246313A (en) 2004-09-02

Family

ID=33031701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003160759A Pending JP2004246313A (en) 2002-12-19 2003-06-05 Telephone set, telephone calling method, and voice frequency converting method

Country Status (1)

Country Link
JP (1) JP2004246313A (en)

Similar Documents

Publication Publication Date Title
US7330812B2 (en) Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
EP2224429B1 (en) Embedded silence and background noise compression
US8340959B2 (en) Method and apparatus for transmitting wideband speech signals
JP2001500344A (en) Method and apparatus for improving the sound quality of a tandem vocoder
JP2010016828A (en) Enhanced conversion of wideband signas to narrowband signal
JP2000165483A (en) Method for adjusting audio output of digital telephone and digital telephone for adjusting audio output in accordance with individual auditory spectrum of user
JPH11126098A (en) Voice synthesizing method and device therefor, band width expanding method and device therefor
KR20000028984A (en) Method intended to generate a wideband signal based on a narrowband signal, apparatus for realizing such a method and telephony equipment including such apparatus
JPH0962299A (en) Code exciting linear predictive coding device
WO2008110870A2 (en) Speech coding system and method
JPH0946233A (en) Sound encoding method/device and sound decoding method/ device
JP2000356995A (en) Voice communication system
JP2004246313A (en) Telephone set, telephone calling method, and voice frequency converting method
JP4373693B2 (en) Hierarchical encoding method and hierarchical decoding method for acoustic signals
JPH10240283A (en) Voice processor and telephone system
JP5255358B2 (en) Audio transmission system
JP6713424B2 (en) Audio decoding device, audio decoding method, program, and recording medium
JP2000134162A (en) Method and system for extending bandwidth
JPH0946268A (en) Digital sound communication equipment
JP3279288B2 (en) Digital mobile communication system
JP2017203844A (en) Encoder, decoder and communication system
JP2003223194A (en) Mobile radio terminal device and error compensating circuit
JP2000078246A (en) Radio telephone system
JPH0713593A (en) Speech processing system
CN115002751A (en) Encryption and decryption method and encryption and decryption earphone

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20050301

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050708

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060201

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060606