[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2010286677A - 通話区間検出装置、その方法、プログラム - Google Patents

通話区間検出装置、その方法、プログラム Download PDF

Info

Publication number
JP2010286677A
JP2010286677A JP2009140550A JP2009140550A JP2010286677A JP 2010286677 A JP2010286677 A JP 2010286677A JP 2009140550 A JP2009140550 A JP 2009140550A JP 2009140550 A JP2009140550 A JP 2009140550A JP 2010286677 A JP2010286677 A JP 2010286677A
Authority
JP
Japan
Prior art keywords
call
section
time
voice
interval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009140550A
Other languages
English (en)
Other versions
JP4918118B2 (ja
Inventor
Takaaki Fukutomi
隆朗 福冨
Tasuku Shinozaki
翼 篠崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009140550A priority Critical patent/JP4918118B2/ja
Publication of JP2010286677A publication Critical patent/JP2010286677A/ja
Application granted granted Critical
Publication of JP4918118B2 publication Critical patent/JP4918118B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】複数の通話端末装置間で行われる通話の通話区間を簡易な構成で正確に検出できるようにする。
【解決手段】何れかの通話端末装置を基準とした送話側チャネルと受話側チャネルの音声信号が入力される音声入力部11と、チャネル毎の音声区間と非音声区間を検出する音声検出部12と、複数チャネルの音声区間と非音声区間の情報より通話区間を検出する通話区間検出部13と、通話の開始を推測できるイベント音の存在を検出するマッチング部14と、通話区間修正部15とを備える。通話区間修正部15はイベント音が検出された時、その検出時刻で通話区間を分割し、さらに通話確定時刻が最初に検出されたイベント音の検出時刻より前で、分割により生成された一番目の通話区間と直前通話の通話区間の時間差が一定時間T1以内の時に、それら両通話区間を結合する。
【選択図】図1

Description

この発明は複数の通話端末装置間で行われる通話の通話区間を検出する技術に関する。
音声信号のみから音声区間を推定する従来の方法として、1チャネルの音声信号のみを観測し、音声区間を推定するものがある。例えば、非特許文献1に示す方法では、1チャネルの音声信号からその周期性成分及び非周期性成分のパワーを抽出し、それらの比に基づいて音声区間(音声が存在する時間区間)と非音声区間(音声が存在しない時間区間)とを推定する。このような方法を用いれば、音声信号中の音声区間と非音声区間とを細かく推定することができる。
しかし、このような方法では、複数の通話端末装置間で通話が開始されてから終了するまでの区間(「通話区間」という)を推定することができない。通話区間と音声区間とは別の概念であり、通話区間に音声区間と非音声区間とが混在していることも多いからである。例えば、通話は話者間での発話のやり取りによって構成されるが、通常、発話と発話との間には非音声区間が存在する。また、1つの発話中に音声区間と非音声区間とが混在していることも多い。これに対し、非特許文献1には、1チャネルの音声信号から音声区間と非音声区間とを検出し、音声区間の開始時刻を通話区間の開始時刻とし、非音声区間が所定時間以上継続した時点を通話区間の終了時刻とし、通話区間を推定する方法も記載されている。
また、電話による通話の通話区間を推定する方法として、オンフック時とオフフック時に発生するわずかな音(「プチ」という音)を観測し、通話区間の開始と終了とを推定する方法がある。さらに、電話による通話の通話区間を推定する方法として、電話をかけた側の受話側チャネルで取得される呼び出し音(「プルルル」という音)や切断後の受話音(「プーッ、プーッ」という音)を観測し、通話区間の開始と終了とを推定する方法もある。
しかるに、1チャネルの音声信号から音声区間と非音声区間とを検出し、音声区間の開始時刻を通話区間の開始時刻とし、非音声区間が所定時間以上継続した時点を通話区間の終了時刻として通話区間を推定する方法の場合、発話以外の音声区間(例えば、咳払いや周囲雑音等)の開始時刻を通話区間の開始時刻として誤判定してしまう場合がある。また、この方法では1チャネルの音声信号のみを用いて通話区間を推定している。そのため、その推定に用いられたチャネルでは非音声区間が所定時間以上継続しているが他チャネルには音声区間が存在する状況(例えば、通話中に相手側の話を聞いている状況等)において、通話が終了したと誤判定してしまう場合もある。
また、オンフック時とオフフック時に発生するわずかな音を観測し、通話区間の開始と終了とを推定する方法の場合、発話者の咳・くしゃみその他の雑音をオンフック時とオフフック時に発生する音であると誤って認識してしまったり、オンフック時とオフフック時に発生する音を見過ごしてしまったりして、通話区間を正確に推定できない場合がある。さらに、電話機から送話音と受話音のみをマイクロホンを用いずに直接PCに取り込む場合には、オンフック時とオフフック時に発生する音を検出できない。
また、電話による通話の通話区間を推定する方式として、電話をかけた側の受話側チャネルで取得される呼び出し音や切断後の受話音を観測し、通話区間の開始と終了とを推定する方法には、呼び出し音や切断後の受話音を他の音声から聞き分けることが困難であり、その判定が確実とは言えないという問題点がある。また、この方法の場合、呼び出し音の後に通話が開始されずに終了した通話と通話が開始した通話の判断がつかない。
一方、電話による通話の通話区間を推定する方法として、複数チャネルの音声区間と非音声区間との情報を用いて通話区間を検出する方法が特許文献1に記載されている。
特許文献1に記載されている方法では、例えば或るチャネルで音声区間が検出された時、一定時間以内に別のチャネルに音声区間が存在した場合、少なくとも当該の音声区間までは通話区間に含まれると決定し、一定時間以内に別のチャネルで音声区間が検出されなかった場合、上記或るチャネルの音声区間の音声は通話の音声ではないと判断する。通話区間の終了時点の判定においては、或るチャネルの音声区間のある時点から、一定時間以内に何れのチャネルにも他の音声区間が存在しないならば通話区間の終了とする。
特開2008−216273号公報
石塚健太郎、中谷智広、「信号周期性成分・非周期性成分の比を用いた耐雑音音声区間検出」、日本音響学会講演論文集、2006年9月(1−2−18)
しかるに、上述した特許文献1に記載されているような複数チャネルの音声区間と非音声区間との情報を用いて通話区間を推定する方法では、例えば通話が終了していないが、複数チャネルにおいて非音声区間が所定時間以上続く場合(保留で相手を待たせている場合等)において、通話が終了したと誤判定してしまう。さらに、通話が終了したが、非音声区間が所定時間以上続く前に、新たな通話が開始した場合(通話終了後、すぐに着信し、通話が開始した場合等)においては通話の終了を見過ごしてしまう。
一方、例えばコールセンタにおける通話の通話区間検出ではオペレータによって通話の開始や終了を判断してもらう(例えば、通話を録音したい場合などに録音の開始や終了を手動で行ってもらう)方法もあるが、オペレータの業務フローの変更やオペレータの負担になってしまうという問題があり、自動的に通話区間を検出する方法が求められている。
さらに、コールセンタにおいて着呼(コール)を管理するCTI(Computer Telephony Integration)システムと連携すれば、正確に通話区間を検出することができるが、規模が大きくなり、導入コストが高くなる問題がある。オペレータの作業やCTIシステムとの連携なしに簡単、低コストで通話区間を検出する技術が必要である。
この発明の目的はこのような状況に鑑み、簡易な構成で、複数の通話端末装置間での通話の通話区間を正確に検出することができる技術を提供することにある。
この発明によれば、複数の通話端末装置間で行われる通話の通話区間を検出する通話区間検出装置は、何れかの通話端末装置を基準とした送話側チャネルの音声信号と受話側チャネルの音声信号とが入力される音声入力部と、音声入力部に入力された複数チャネルの音声信号を用い、チャネル毎の音声区間と非音声区間とを検出する音声検出部と、音声検出部が検出した複数チャネルの音声区間と非音声区間との情報を用い、通話区間を検出する通話区間検出部と、通話区間検出部により検出された上記通話区間に、通話の開始を推測できるイベント音が存在しているか否かを検出するマッチング部と、通話区間修正部とを備える。
通話区間修正部は、マッチング部によってイベント音が検出された時、その検出時刻で上記通話区間を分割し、さらに、通話区間検出部における上記通話区間の検出において通話であると判断した通話確定時刻がマッチング部において最初に検出されたイベント音の検出時刻より前の時刻であり、かつ上記分割により生成された一番目の通話区間の開始時刻と直前通話の通話区間の終了時刻との時間差が一定時間T1以内の時に、直前通話の通話区間と分割により生成された一番目の通話区間とを結合する。
この発明によれば、複数の通話端末装置間で行われる通話の通話区間を検出する通話区間検出方法は、何れかの通話端末装置を基準とした送話側チャネルの音声信号と受話側チャネルの音声信号とが入力される音声入力過程と、音声入力過程で入力された複数チャネルの音声信号を用い、チャネル毎の音声区間と非音声区間とを検出する音声検出過程と、音声検出過程で検出された複数チャネルの音声区間と非音声区間との情報を用い、通話区間を検出する通話区間検出過程と、通話区間検出過程で検出された上記通話区間に、通話の開始を推測できるイベント音が存在しているか否かを検出するマッチング過程と、通話区間修正過程とを備える。
通話区間修正過程は、マッチング過程によってイベント音が検出された時、その検出時刻で上記通話区間を分割する過程と、通話区間検出過程における上記通話区間の検出において通話であると判断した通話確定時刻がマッチング過程において最初に検出されたイベント音の検出時刻より前の時刻であり、かつ上記分割により生成された一番目の通話区間の開始時刻と直前通話の通話区間の終了時刻との時間差が一定時間T1以内の時に、直前通話の通話区間と分割により生成された一番目の通話区間とを結合する過程とを有する。
この発明によれば、複数チャネルの音声区間と非音声区間との情報を用いて検出した通話区間に対し、通話の開始を推測できるイベント音の情報と前後する通話区間の時間差情報と通話区間の検出において通話であると確定した時刻情報とを用いて、通話区間の結合と分割を行うことにより通話区間を修正するものとなっている。よって、例えばオペレータの作業やCTIシステムとの連携なしに簡単、低コストで、簡易な構成で通話区間を従来よりも正確に検出することができる。
この発明による通話区間検出装置の一実施例の機能構成を示すブロック図。 図1における通話区間検出部において取得される時刻を説明するための図。 図1におけるマッチング部において検出されるイベント音の情報を説明するための図。 図1における通話区間修正部において実行される修正処理の手順を示すフローチャート(その1)。 図1における通話区間修正部において実行される修正処理の手順を示すフローチャート(その2)。 図1における通話区間修正部において実行される修正処理の手順を示すフローチャート(その3)。 通話区間修正処理の具体例1を説明するための図。 通話区間修正処理の具体例2を説明するための図。 通話区間修正処理の具体例3を説明するための図。 通話区間修正処理の具体例4を説明するための図。 通話区間修正処理の具体例5を説明するための図。
この発明の実施形態を図面を参照して実施例により説明する。
図1はこの発明による通話区間検出装置の一実施例の機能構成を示したブロック図であり、この例では通話区間検出装置10は音声入力部11と音声検出部12と通話区間検出部13とマッチング部14と通話区間修正部15と制御部16と記憶部17とを備える。通話区間検出装置10は制御部16の制御のもと各処理を実行する。また、各データは逐一、記憶部17に記憶され、必要に応じて読み出される。
以下、2個の通話端末装置間で行われる通話の通話区間を検出する場合を例に説明する。
音声入力部11には何れかの通話端末装置を基準とした送話側チャネルの音声信号と受話側チャネルの音声信号とが入力される。例えば、オペレータと顧客とがそれぞれ電話機を用いて通話を行う場合には、送話側チャネルのオペレータの音声信号と受話側チャネルの顧客の音声信号とが音声入力部11に入力される。
音声検出部12は音声入力部11に入力された2チャネルの音声信号を用い、チャネル毎の音声区間と非音声区間とを検出する。具体的には、音声信号を逐次、所定の時間区間(フレーム)で切り出し、各フレームの音声信号が音声であるか非音声であるか(各フレームが音声区間であるか非音声区間であるか)をチャネル毎に判別する。この判別には、例えば非特許文献1等の公知の方法を用いることができる。
通話区間検出部13は音声検出部12で検出された2チャネルの音声区間と非音声区間との情報を用い、通話区間を検出する。この通話区間の検出には、例えば特許文献1等の公知の方法を用いることができる。
例えば、或るチャネルの音声区間の開始時刻を起点とし、当該起点から一定時間t1以内に別のチャネルの音声区間が存在しない場合に、上記或るチャネルの音声区間は通話区間ではないと判断し、当該起点から一定時間t1以内に別のチャネルの音声区間が存在する場合に、上記起点の時刻を通話区間の開始時刻として決定する。この場合、別のチャネルで音声が検出された時刻が通話確定時刻となる。
一方、通話区間の開始時刻以降の或る音声区間内の或る時点から一定時間t2以内に何れのチャネルにも他の音声区間が存在しないならば、当該或る音声区間の終了時刻を当該通話区間の終了時刻として決定し、当該或る音声区間内の或る時点から一定時間t2以内に何れかのチャネルに他の音声区間が存在するならば、少なくとも当該他の音声区間までが通話区間に含まれると決定する。
通話区間の開始時刻、終了時刻及び通話確定時刻は上記のようにして求めることができ、この例では図2に示したように2通話区間(通話区間A、通話区間B)の通話区間開始時刻(Ts1,Ts2)、通話区間終了時刻(Te1,Te2)及び通話確定時刻(Td1,Td2)をそれぞれ求めておく。
マッチング部14では通話区間検出部13により検出された通話区間に、呼び出し音や入電音(コールセンタでは入電時にIVR(Interactive Voice Response:音声自動応答装置)が送話側チャネルに電子音等を出す)等の通話の開始を推測できる音(「イベント音」という)が存在しているか否かを検出する。検出する方法としては、DPマッチングや確立モデルを用いた方法などが利用できる。
図3はマッチング部14によって検出されたイベント音を例示したものであり、マッチング部14はイベント音を検出した数(マッチング個数)Nm、検出した時刻(マッチング時刻)Tm1,Tm2,…を出力する。
通話区間修正部15では通話区間検出部13で得られた通話区間開始時刻(Ts1,Ts2)、通話区間終了時刻(Te1,Te2)及び通話確定時刻(Td1,Td2)と、マッチング部14で検出されたマッチング個数(Nm)、マッチング時刻(Tm1,Tm2,…)とに基づいて通話区間の結合・分割を行い、通話区間を修正する。
図4−1〜図4−3は通話区間修正部15における通話区間修正処理の手順を示したものであり、以下、処理手順を説明する。なお、図4−1〜図4−3はマッチング部14において通話区間Bにイベント音が存在している(マッチングしている)か否かを検出した場合の処理について示している。
まず、通話区間Bに一箇所でもイベント音がマッチングした(Nm≠0)かどうかを判断し(ステップS11)、イベント音がマッチングした場合はマッチングした時刻で通話区間Bを分割する(ステップS12)。分割によりNm+1個の通話区間が生成される。
分割により生成された一番目の通話区間B1に対しては直前時刻の通話区間との結合判定が行われ、即ち直前時刻に通話区間検出部13により推定された(検出された)通話区間Aが存在するか否かが判断される(ステップS13)。通話区間Aが存在する場合はこの直前通話の通話区間Aの終了時刻及び入力通話の通話区間Bの開始時刻の取得が行われ(ステップS14)、それら終了時刻と開始時刻の時間差が一定時間T1以内か否かが判断される(ステップS15)。
直前通話の通話区間Aの終了時刻と入力通話の通話区間Bの開始時刻の時間差が一定時間T1以内の時、入力通話の通話確定時刻の取得が行われ(ステップS16)、通話確定時刻が最初に検出されたイベント音のマッチング時刻より前の時刻であるか否かが判断される(ステップS17)。通話確定時刻が最初に検出されたイベント音のマッチング時刻より前の時刻の場合、直前通話の通話区間Aと入力通話の通話区間(分割された一番目の通話区間)B1とを結合する(ステップS18)。結合に際しては通話区間Aと通話区間B1の間の時間分だけ、無音区間を挿入し、これにより通話区間Aと通話区間B1とが結合された新たな通話区間A−newが確定する(ステップS19)。
ステップS13において、通話区間B1の直前時刻に通話区間Aが存在していないと判断した時は通話区間B1はそのまま確定される(ステップS21)。また、ステップS15において、直前通話の通話区間Aの終了時刻と入力通話の通話区間Bの開始時刻の時間差がT1より大きいと判断した時、通話区間A及び通話区間B1は結合されることなく、それぞれ確定される(ステップS22)。
また、ステップS17において、通話確定時刻が最初に検出されたイベント音のマッチング時刻より後の時刻であると判断した時は、通話区間Aは確定され、通話区間B1は削除される(ステップS23)。この場合、通話区間B1は会話が始まっていない不要な区間とみなされる。
なお、ステップS12の分割により生成された2〜Nm番目の通話区間B2〜BNmはそのまま確定され(ステップS25)、Nm+1番目の通話区間BNm+1は次時刻の通話区間が来た時の直前時刻の通話区間とするため、未確定となる(ステップS26)。
一方、ステップS11で通話区間Bにイベント音が検出されず、マッチングなしと判断した時は、直前時刻に通話区間Aが存在するか否かが判断され(ステップS31)、存在する場合は直前通話の通話区間Aの終了時刻と入力通話の通話区間Bの開始時刻の取得が行われる(ステップS32)。そして、それら終了時刻と開始時刻の時間差が一定時間T1以内か否かが判断される(ステップS33)。
直前通話の通話区間Aの終了時刻と入力通話の通話区間Bの開始時刻の時間差が一定時間T1以内の時、直前通話の通話区間Aと入力通話の通話区間Bとを結合する(ステップS34)。結合に際しては通話区間Aと通話区間Bの間の時間分だけ、無音区間を挿入し、これにより通話区間Aと通話区間Bとが結合された新たな通話区間A−newが生成される。この通話区間A−newは次時刻の通話区間が来た時の直前時刻の通話区間とするため、未確定となる(ステップS35)。
ステップS31において、通話区間Bの直前時刻に通話区間Aが存在していないと判断した時は、次時刻の通話区間が来た時の直前時刻の通話区間とするため、通話区間Bは未確定となる(ステップS36)。また、ステップS33において、直前通話の通話区間Aの終了時刻と入力通話の通話区間Bの開始時刻の時間差がT1より大きいと判断した時、通話区間AとBは結合されず、通話区間Aはそのまま確定される。通話区間Bは次時刻の通話区間が来た時の直前時刻の通話区間とするため、未確定となる(ステップS37)。
通話区間修正部15では以上説明したような手順により、通話区間の修正処理(結合・分割)が行われる。以下、具体例を上げ、図面を参照して上記修正処理をさらに説明する。
〈例1〉
通話区間Bに一つのイベント音(入電音等)がマッチングされ、通話確定時刻がマッチング時刻よりも前の時刻であり、直前の通話区間Aと時間的に近接している場合(図5)
⇒ 通話区間Bをマッチング時刻Tm1で分割する。直前時刻の通話区間Aの終了時刻と通話区間Bの開始時刻との時間差がT1以内であり、さらに通話確定時刻Td2が最初にマッチングした時刻Tm1より前の時刻にあるので、分割した前方の区間と通話区間Aとを結合し、通話区間A−newを作る。通話区間A−newは修正された通話区間として確定する。
分割された後方の通話区間B−newは次時刻の通話区間Cと、両通話区間の時間差、通話確定時刻の条件を判定の上、その判定に応じて結合を行う。図5では通話区間B−newと通話区間Cとが結合され、通話区間B−new2と通話区間C−newが生成された状態を示している。
〈例2〉
通話区間Bに一つのイベント音がマッチングされ、通話確定時刻がマッチング時刻よりも後の時刻であり、直前の通話区間と時間的に近接している場合(図6)
⇒ 通話区間Bをマッチング時刻Tm1で分割する。直前時刻の通話区間Aの終了時刻と通話区間Bの開始時刻との時間差がT1以内であるが、通話確定時刻Td2が最初にマッチングした時刻Tm1よりも後であるので、通話区間の結合は行われない。
この場合、通話区間Aはそのまま確定され、分割された後方の通話区間B−newは次時刻の通話区間との結合判定を行うことになる。また、分割された前方の通話区間は会話の行われていない湧き出し区間として区別することができ、この湧き出し区間は削除される。
〈例3〉
通話区間Bが直前の通話区間Aと時間的に離れている場合(図7)
⇒ マッチング箇所が存在する場合はマッチング時間で通話区間を分割する。直前時刻の通話区間Aの終了時刻と通話区間Bの開始時刻との時間差がT1よりも大きいため、通話区間の結合は行わない。図7はマッチング箇所が存在しなかった場合を示している。
〈例4〉
一箇所もマッチングしなかった場合(図8)
⇒ マッチングした数が0なので、通話区間の分割は行われない。直前時刻の通話区間Aの終了時刻と通話区間Bの開始時刻との時間差を判定して、時間差がT1以内であれば結合し、T1より大きければ結合しない。
図8に示したように通話区間Aと通話区間Bを結合した場合は通話区間A−newが次時刻の通話区間が入力された際の直前時刻の通話区間となる。結合しなかった場合は通話区間Bが次時刻の通話区間が入力された際の直前時刻の通話区間となる。
〈例5〉
複数箇所でマッチングした場合(図9)
⇒ マッチングした時刻Tm1,Tm2,Tm3で通話区間Bを分割する。この時、直前通話の通話区間Aの終了時刻と通話区間Bの開始時刻との時間差がT1以内であり、かつ通話区間Bの通話確定時刻Td2がTm1よりも前の時刻であった場合には通話区間Aと通話区間BのTm1以前の区間を結合する。もし、上記条件に反する場合には結合は行わない。
ここで、最後にマッチングした時刻Tm3以前の通話区間(通話区間B1,B2及び通話区間A−new又はA)に関しては確定する。最後にマッチングした時刻Tm3以降の通話区間B3に関しては次時刻の通話区間との結合判定をするため、未確定とする。なお、図9では通話区間B3と次時刻の通話区間Cとが結合され、通話区間B3−newと通話区間C−newが生成された状態を示している。
以上説明したように、この例では複数チャネルの音声区間と非音声区間との情報を用いて推定した通話区間に対し、入電音や呼び出し音等のイベント音の情報(検出時刻)と前後する通話区間の時間差情報と複数チャネルに音声区間が初めて検出された時刻情報(通話確定時刻)とを用いて通話区間の結合と分割を行うことにより通話区間を修正するものとなっており、これにより通話区間を正確に検出することができるものとなっている。なお、上述した処理手順では通話区間の分割と結合は分割した後に結合するものとして説明しているが、結合した後に分割する手順としてもよい。
通話区間検出装置10は例えばコンピュータによって実現することができ、上述した各部の処理内容はプログラムによって記述され、このプログラムをコンピュータで実行することにより上記処理機能がコンピュータ上で実現される。

Claims (9)

  1. 複数の通話端末装置間で行われる通話の通話区間を検出する通話区間検出装置であって、
    何れかの上記通話端末装置を基準とした送話側チャネルの音声信号と受話側チャネルの音声信号とが入力される音声入力部と、
    上記音声入力部に入力された複数チャネルの音声信号を用い、チャネル毎の音声区間と非音声区間とを検出する音声検出部と、
    上記音声検出部が検出した複数チャネルの音声区間と非音声区間との情報を用い、通話区間を検出する通話区間検出部と、
    上記通話区間検出部により検出された上記通話区間に、通話の開始を推測できるイベント音が存在しているか否かを検出するマッチング部と、
    通話区間修正部とを備え、
    上記通話区間修正部は、上記マッチング部によって上記イベント音が検出された時、その検出時刻で上記通話区間を分割し、
    さらに、上記通話区間修正部は、上記通話区間検出部における上記通話区間の検出において通話であると判断した通話確定時刻が上記マッチング部において最初に検出された上記イベント音の検出時刻より前の時刻であり、かつ上記分割により生成された一番目の通話区間の開始時刻と直前通話の通話区間の終了時刻との時間差が一定時間T1以内の時に、上記直前通話の通話区間と上記分割により生成された一番目の通話区間とを結合することを特徴とする通話区間検出装置。
  2. 請求項1記載の通話区間検出装置において、
    上記通話区間修正部は、上記マッチング部によって上記イベント音が検出されず、かつ上記通話区間の開始時刻と直前通話の通話区間の終了時刻との時間差が一定時間T1以内の時に、上記直前通話の通話区間と上記通話区間とを結合することを特徴とする通話区間検出装置。
  3. 請求項1又は2記載の通話区間検出装置において、
    上記通話区間修正部は、上記通話確定時刻が上記イベント音の検出時刻より後の時刻であり、かつ上記分割により生成された通話区間の開始時刻と直前通話の通話区間の終了時刻との時間差が一定時間T1以内の時に、その開始時刻が一定時間T1以内である分割により生成された通話区間を削除することを特徴とする通話区間検出装置。
  4. 請求項1又は2記載の通話区間検出装置において、
    上記通話区間修正部は、通話区間の上記結合時、結合する両通話区間の間の時間分だけ無音区間を挿入することを特徴とする通話区間検出装置。
  5. 複数の通話端末装置間で行われる通話の通話区間を検出する通話区間検出方法であって、
    何れかの上記通話端末装置を基準とした送話側チャネルの音声信号と受話側チャネルの音声信号とが入力される音声入力過程と、
    上記音声入力過程で入力された複数チャネルの音声信号を用い、チャネル毎の音声区間と非音声区間とを検出する音声検出過程と、
    上記音声検出過程で検出された複数チャネルの音声区間と非音声区間との情報を用い、通話区間を検出する通話区間検出過程と、
    上記通話区間検出過程で検出された上記通話区間に、通話の開始を推測できるイベント音が存在しているか否かを検出するマッチング過程と、
    通話区間修正過程とを備え、
    上記通話区間修正過程は、
    上記マッチング過程によって上記イベント音が検出された時、その検出時刻で上記通話区間を分割する過程と、
    上記通話区間検出過程における上記通話区間の検出において通話であると判断した通話確定時刻が上記マッチング過程において最初に検出された上記イベント音の検出時刻より前の時刻であり、かつ上記分割により生成された一番目の通話区間の開始時刻と直前通話の通話区間の終了時刻との時間差が一定時間T1以内の時に、上記直前通話の通話区間と上記分割により生成された一番目の通話区間とを結合する過程とを有することを特徴とする通話区間検出方法。
  6. 請求項5記載の通話区間検出方法において、
    上記通話区間修正過程は、上記マッチング過程によって上記イベント音が検出されず、かつ上記通話区間の開始時刻と直前通話の通話区間の終了時刻との時間差が一定時間T1以内の時に、上記直前通話の通話区間と上記通話区間とを結合する過程を有することを特徴とする通話区間検出方法。
  7. 請求項5又は6記載の通話区間検出方法において、
    上記通話区間修正過程は、上記通話確定時刻が上記イベント音の検出時刻より後の時刻であり、かつ上記分割により生成された通話区間の開始時刻と直前通話の通話区間の終了時刻との時間差が一定時間T1以内の時に、その開始時刻が一定時間T1以内である分割により生成された通話区間を削除する過程を有することを特徴とする通話区間検出方法。
  8. 請求項5又は6記載の通話区間検出方法において、
    上記通話区間修正過程は、通話区間の上記結合時、結合する両通話区間の間の時間分だけ無音区間を挿入する過程を有することを特徴とする通話区間検出方法。
  9. 請求項5乃至8記載の何れかの通話区間検出方法の各過程をコンピュータに実行させるための通話区間検出プログラム。
JP2009140550A 2009-06-11 2009-06-11 通話区間検出装置、その方法、プログラム Active JP4918118B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009140550A JP4918118B2 (ja) 2009-06-11 2009-06-11 通話区間検出装置、その方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009140550A JP4918118B2 (ja) 2009-06-11 2009-06-11 通話区間検出装置、その方法、プログラム

Publications (2)

Publication Number Publication Date
JP2010286677A true JP2010286677A (ja) 2010-12-24
JP4918118B2 JP4918118B2 (ja) 2012-04-18

Family

ID=43542418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009140550A Active JP4918118B2 (ja) 2009-06-11 2009-06-11 通話区間検出装置、その方法、プログラム

Country Status (1)

Country Link
JP (1) JP4918118B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104700830A (zh) * 2013-12-06 2015-06-10 中国移动通信集团公司 一种语音端点检测方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60250760A (ja) * 1984-05-28 1985-12-11 Tamura Electric Works Ltd 機能電話機
JP2001186244A (ja) * 1999-12-27 2001-07-06 Hitachi Ltd 通話録音装置
JP2008053874A (ja) * 2006-08-23 2008-03-06 D & M Holdings Inc 音声記録再生装置
JP2008216273A (ja) * 2007-02-28 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> 通話区間検出装置、その方法、プログラム及び記録媒体
JP2009218764A (ja) * 2008-03-10 2009-09-24 Panasonic Corp 補聴器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60250760A (ja) * 1984-05-28 1985-12-11 Tamura Electric Works Ltd 機能電話機
JP2001186244A (ja) * 1999-12-27 2001-07-06 Hitachi Ltd 通話録音装置
JP2008053874A (ja) * 2006-08-23 2008-03-06 D & M Holdings Inc 音声記録再生装置
JP2008216273A (ja) * 2007-02-28 2008-09-18 Nippon Telegr & Teleph Corp <Ntt> 通話区間検出装置、その方法、プログラム及び記録媒体
JP2009218764A (ja) * 2008-03-10 2009-09-24 Panasonic Corp 補聴器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104700830A (zh) * 2013-12-06 2015-06-10 中国移动通信集团公司 一种语音端点检测方法及装置

Also Published As

Publication number Publication date
JP4918118B2 (ja) 2012-04-18

Similar Documents

Publication Publication Date Title
US8345849B2 (en) Telecommunications endpoint that prompts a user to focus on a monitored call
US7881460B2 (en) Configuration of echo cancellation
KR101626438B1 (ko) 오디오 데이터 프로세싱을 위한 방법, 디바이스, 및 시스템
US8660248B2 (en) Method and structure for controlling incoming communication notification
EP2973559B1 (en) Audio transmission channel quality assessment
CN110896509A (zh) 耳机佩戴状态确定方法、电子设备控制方法及电子设备
JP6408020B2 (ja) 遠隔会議における知覚的に連続的な混合
US8488805B1 (en) Providing background audio during telephonic communication
US20180350378A1 (en) Detecting and reducing feedback
CN105741862A (zh) 一种移动终端音频录入的方法和装置及移动终端
CN112492112B (zh) 一种基于对讲系统的回音消除方法和装置
US7171004B2 (en) Room acoustics echo meter for voice terminals
JP3328570B2 (ja) ハンズフリー装置
US20090097625A1 (en) Method of and System for Controlling Conference Calls
JP4918118B2 (ja) 通話区間検出装置、その方法、プログラム
JP2010199741A (ja) 携帯電話端末装置
JP2009027239A (ja) 通信会議装置
US6954522B2 (en) Caller identifying information encoded within embedded digital information
JP2009153053A (ja) 音声推定方法及びそれを用いた携帯端末
KR20050104783A (ko) 이동 통신 단말기의 전화 알람 방법
JP3773917B2 (ja) 携帯通信装置、通信方法
TW201530537A (zh) 電話語音輸出之方法及耳機
JP5321687B2 (ja) 音声通話装置
KR100752294B1 (ko) 이동 단말기에서 배경음을 제공하는 방법 및 장치
Gierlich et al. Background Noise Transmission and Comfort Noise Insertion: The Influence of Signal Processing on" Speech"-Quality in Complex Telecommunication Scenarios

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110720

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120127

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150203

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4918118

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350