JP3977784B2 - Real-time packet processing apparatus and method - Google Patents
Real-time packet processing apparatus and method Download PDFInfo
- Publication number
- JP3977784B2 JP3977784B2 JP2003200000A JP2003200000A JP3977784B2 JP 3977784 B2 JP3977784 B2 JP 3977784B2 JP 2003200000 A JP2003200000 A JP 2003200000A JP 2003200000 A JP2003200000 A JP 2003200000A JP 3977784 B2 JP3977784 B2 JP 3977784B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- packet
- frames
- decoding
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Detection And Prevention Of Errors In Transmission (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、受信したパケットに含まれるフレームのデータをリアルタイムで処理するリアルタイムパケット処理装置及びその方法に関するものである。
【0002】
【従来の技術】
従来、電子機器のディジタル化に伴い、情報通信においては転送対象となる情報をパケット化して転送することが一般的に行われている。例えば、音声信号を転送する場合には、送信側では、所定のサンプリング周波数にてサンプリングした音声データを所定量ずつ別個のパケットに分散して収納し、パケット単位で転送を行っている。受信側においては、受信したパケットから音声データを取りだし、取り出した音声データを繋ぎ合わせて再生処理したりミキシング処理したりする。
【0003】
即ち、上記のようなパケット通信を行う電子機器では、送信側においては1パケット分のデータが得られた段階でパケットを形成して送信する処理を行い、受信側では受け取ったパケットに収納されているデータの再生に要する時間毎にパケット内のデータを読み出す処理を行っている。これにより、受信側では、例えば音声データのリアルタイム転送の場合、分割して受け取った複数のパケットから連続した音声を再生処理したりミキシング処理したりすることができる。
【0004】
この様なパケット通信は、ほとんどの場合コンピュータ装置を使用して行っており、例えば、無線通信を利用した携帯型電話機やインターネット等の通信網を利用した周知のIP電話、配信サーバから音楽などのコンテンツをユーザ端末装置に配信するシステム、及び遠隔会議システムなどに用いられている。
【0005】
例えば、フレーム間予測を用いた音声符号化方式(予測符号化方式)には、ITU標準のG.729、G.723.1、G.722.1等がある。
【0006】
これらの符号化方式は、送信装置側の符号化処理部の内部バッファに格納されている相関データと、受信装置側の復号化処理部の内部バッファに格納されている相関データが一致していなければ正しい音響信号を復元できないという制約がある。尚、上記相関データとは、上記G.729、G.723.1、G.722.1に記載されている予測符号化方式に用いるデータである。
【0007】
例えば、送信装置側の復号化処理部で音声フレーム0,1,2,3を符号化して、パケット0,1,2,3に各フレームを含めて送信した場合には、パケットの受信順序に関わらず受信装置側の復号化処理部でも、符号化処理部が符号化したのと同じようにフレーム0,1,2,3の順序で復号化処理を行わなければ、各フレームを符号化した時点の符号化処理部の相関データと、当該フレームを復号化する際の復号化処理部の相関データが一致しなくなり、正しい復号波形を得ることができない。
【0008】
また、転送中にパケットが消失した場合には受信装置においてパケットの消失補償(PLC:Pauqtte Loss Concealment)処理が行われる場合がある。
【0009】
尚、パケット消失補償処理としては、G.711Appendix1やG.729の標準でもたれている方式が知られている。
【0010】
【特許文献1】
特開2000−83050号公報
【非特許文献1】
ITU−T Recommendation G.729
【非特許文献2】
ITU−T Recommendation G.723.1
【非特許文献3】
ITU−T Recommendation G.722.1
【非特許文献4】
ITU−T Recommendation G.711 Appendix 1
【0011】
【発明が解決しようとする課題】
前述した音声符号化方式(予測符号化方式)における制約により、パケットの消失が起こった場合等には、消失したフレームを復号化処理部の入力として復号化処理部の相関データを更新することができないため、消失後正しく受信したパケット内のフレームを復号化する際に、送信装置側の符号化処理部の相関データと、受信装置側の復号化処理部の相関データが不一致となり、音声フレームを正しく復元できない場合がある。
【0012】
上記の従来方式では、上記のようなパケット消失や遅延に起因する相関データの不一致に関して特に対処を行わないため、再生音声に知覚可能な品質の劣化を生じていた。
【0013】
また、前述のような予測符号化方式を用いた場合に制約条件があるにもかかわらず、VoIP等のアプリケーションにおいては、送信装置側が送信した全ての音声パケットが正しく受信装置側に到着する保証はない。例えば、通信網等においてパケットが消失した場合には容易に符号化処理部と復号化処理部の相関データの不一致が生じるし、通信セッションの確立に際して、送信装置側が送信した先頭のパケットから正しく受信装置側に到着するとは限らないため、通信の初期の段階から符号化処理部と復号化処理部の相関データが不一致のまま通信が継続してしまうという問題がある。
【0014】
本発明の目的は上記の問題点に鑑み、音声パケットの到着状況に応じてパケットが消失したときや遅延したときに符号化処理部と復号化処理部の相関データの不一致を最小限に抑えてフレームを適切に補間し、品質劣化を低減して音声再生することができるリアルタイムパケット処理装置及びその方法を提供することである。
【0015】
【課題を解決するための手段】
一般的に符号化処理部、復号化処理部に用いられる予測は数フレームの間の相関を用いており、符号化処理部と復号化処理部の内部状態が不一致となった時点から数フレームの間は正しい音響信号を復元することができず、再生音声に知覚可能な品質の劣化が生じる。
【0016】
しかし、符号化処理部と復号化処理部の相関データに不一致が生じた場合にも、受信フレームを正しい順序で数フレーム復号した後には相関データは次第に一致してくるため、結果として復号した波形の品質の劣化は、連続して正しいフレームを復号するに従って次第に収まってくる。
【0017】
本発明では、符号化処理部、復号化処理部の相関データに不一致が生じた場合に、最初の数フレームの音声をあえて再生しないことによって品質が劣化した音声を再生せず、受聴品質を向上するリアルタイムパケット処理装置及びその方法を提案する。
【0018】
本発明では、連続した入力音声信号を所定周期毎に切り取り、該切り取った信号を前記周期よりも短い所定のサンプリング時間毎にサンプリングして得られた複数のサンプリングデータを符号化処理部によって符号化してなるフレームを生成すると共に該フレーム毎に該フレームを含むパケットを生成して順次送信する送信装置から通信網を介して受信装置によって前記パケットを受信し、前記受信装置により、前記受信したパケットに含まれる前記フレームを復号化処理部により復号化し、該復号化したフレームに含まれるサンプリングデータに対して音声再生処理を施す予測符号化方式を用いたリアルタイムパケット処理において、前記受信装置は、前記送信装置から受信したパケットをバッファに格納して、前記バッファから入力したパケットに含まれるフレームを復号化する際に符号化されたフレームを分析し該分析結果を相関データとして保持し、前記復号化処理部による復号処理を行う際に処理対象となるフレームが連続していないときに、不連続となったフレームからN個のフレームに対して前記復号化処理部における復号化のみを行い、復号化したN個のフレームに対して前記音声再生処理を施さずに、前記N個のフレームの次のフレームから前記保持している相関データを用いて復号化を行って前記音声再生処理を施す。さらに、前記受信装置は、前記バッファに格納されているパケットの数が所定数を越えたときに、前記バッファに格納されている連続した所定数の破棄対象となるパケットのうちの最後のN個のフレーム以外のパケットを破棄すると共に、前記最後のN個のフレームは復号のみを行い、これに続くM個のパケットのフレームに対して無音状態から徐々に音量を増加させるフェードイン処理を施し、前記破棄したパケットの前のM個のパケットのフレーム対して徐々に無音まで音量を低下させるフェードアウト処理を施す。
【0019】
本発明によれば、前記復号化処理部による復号処理を行う際に処理対象となるフレームが連続していないときは、不連続となったフレームからN個のフレームに対して前記復号化処理部における復号化のみが行われ、復号化したN個のフレームに対して前記音声再生処理を施さずに、前記N個のフレームの次のフレームから前記保持している相関データを用いて復号化を行って前記音声再生処理が施される。前記N個のフレームに対して復号化処理のみが行われることにより、復号化を行う際に復号化処理部において用いる相関データを、送信装置側の符号化処理部における相関データと完全に一致若しくはほぼ一致させることができ、前記N個のフレームの次のフレームから適切な音声再生処理を行うことができる。
【0020】
また、本発明では、前記受信装置は、前記復号化処理部による復号処理を行う際に処理対象となるフレームが連続していないときに、不連続となったフレームからN個のフレームに対して前記復号化処理部における復号化を行い、復号化した前記N個のフレームに対して音量を低下させた前記音声再生処理を施す。
【0021】
本発明によれば、前記復号化処理部による復号処理を行う際に処理対象となるフレームが連続していないときは、不連続となったフレームからN個のフレームに対して前記復号化処理部における復号化が行われた後、復号化した前記N個のフレームに対して音量を低下させた前記音声再生処理が施される。
【0022】
このとき、上記と同様に、前記N個のフレームに対して復号化処理が行われることにより、復号化を行う際に復号化処理部において用いる相関データを、送信装置側の符号化処理部における相関データと完全に一致若しくはほぼ一致させることができる。さらに、前記N個のフレームに対して音量を低下させた音声再生処理が施されるので、この遷移部分で異音が生じることが無く、音声品質の劣化が低減される。
【0023】
また、本発明では、前記受信装置は、前記送信装置から受信したパケットをバッファに格納して、前記バッファから入力したパケットに含まれるフレームを復号化する際に、前記バッファに格納されているパケットの数が所定数を越えたときに、前記バッファに格納されている連続した所定数の破棄対象となるパケットのうちの最後のN個のフレーム以外のパケットを破棄すると共に、前記最後のN個のフレームは復号化のみを行い、これに続くM個のパケットのフレームに対して無音状態から徐々に音量を増加させるフェードイン処理を施し、前記破棄したパケットの前のM個のパケットのフレーム対して徐々に無音まで音量を低下させるフェードアウト処理を施す。
【0024】
本発明によれば、受信装置のバッファに蓄積されたパケットの数が所定数を越えたときは、音声再生処理に遅延が生じるため、バッファに格納されている連続した所定数の破棄対象となるパケットのうちの最後のN個のフレーム以外のパケットが破棄される。
【0025】
これにより、前記M個のフレームに対して無音状態から徐々に音量を増加させるフェードイン処理が施されるので、受信装置において音声再生する際に、無音状態から有音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることが無く、音声品質の劣化が低減される。
【0026】
さらに、不連続となる前のM個のフレーム対して徐々に無音まで音量を低下させるフェードアウト処理が施されるので、有音状態から無音状態になる部分の音声レベルが徐々に減少されるため、受信装置において音声再生する際に、有音状態から無音状態に遷移する部分で音声波形が不連続となることがないので、この遷移部分で異音が生じることがなく、音声品質の劣化が低減される。
【0027】
さらにまた、破棄対象となるパケットのフレームのうちの最後のN個のフレームに対して復号化のみが施されるため、送信側の符号化処理部と受信側の復号化処理部において予測符号化方式で用いられる相関データを完全に一致或いはほぼ一致させることができる。
【0028】
また、本発明では、前記受信装置は、前記パケットに含まれるシーケンス番号に基づいて、該シーケンス番号が不連続になったときに、前記フレームが不連続となったと判定する。
【0029】
本発明によれば、受信装置により、前記パケットに含まれるシーケンス番号に基づいて、該シーケンス番号が不連続になったときに、前記フレームが不連続となったと判定される。
【0030】
また、本発明では、前記受信装置は、前記フェードアウト処理を施したフレームと前記フェードイン処理を施したフレームとを重ねて音声再生する。
【0031】
本発明によれば、前記フェードアウト処理を施したフレームと前記フェードイン処理を施したフレームとが重ねられて音声再生されるので、不連続になる部分において無音状態が生じることがなく、音声品質の劣化がさらに低減される。
【0032】
【発明の実施の形態】
以下、図面に基づいて本発明の一実施形態を説明する。
【0033】
(第1実施形態)
図1は本発明の第1実施形態におけるリアルタイムパケット処理装置の機能構成を示すブロック図、図2は本発明の第1実施形態における音声パケット送信装置による音声信号のパケット化を説明する図、図3は本発明の第1実施形態において用いているリアルタイム転送プロトコル(以下、RTPと称する)ヘッダを説明する図である。図において1は音声パケット送信装置(以下、単に送信装置と称する)、2は音声パケット受信装置(以下、単に受信装置と称する)、3はインターネット等の通信網である。本実施形態では、一例として、通信網3を介して送信装置1からUDP/IPを用いて音声パケットをリアルタイムで受信装置2に転送する装置に関して説明する。
【0034】
送信装置1は、周知のコンピュータ装置から構成され、予め設定されているプログラムによって動作し、音声入力部11と、アナログ/ディジタル(A/D)変換部12、符号化処理部13、パケット生成部14、送信部15とから構成されている。これらの送信装置1を構成する各部分は、ハードウェア及びソフトウェアの両方によって構成されている。
【0035】
受信装置2は、周知のコンピュータ装置から構成され、予め設定されているプログラムによって動作し、受信部21と、パケット解析部22、復号化処理部23、ディジタル/アナログ(D/A)変換部24、音声出力部25とから構成されている。これらの受信装置2を構成する各部分は、ハードウェア及びソフトウェアの両方によって構成されている。
【0036】
音声入力部11は音声信号を図2に示すようなアナログ電気信号4に変換してA/D変換部12に出力し、A/D変換部12によって所定のサンプリングタイムでディジタル信号に変換された音声データ(サンプル)が符号化処理部13に備わるデータバッファ(図示せず)に順次格納される。
【0037】
また、図2に示すように、符号化処理部13のデータバッファに格納された音声データは、符号化処理部13によって所定周期T毎に切り取られ音声データフレーム31とされ、先頭から順に1フレームずつ順送りにパケット30が生成されて送信される。
【0038】
符号化処理部13は、A/D変換部12から入力した符号化対象となる音声データフレームの符号化処理を行うが、符号化処理を行うに際して前のフレームを符号化した結果の内部状態を内部バッファ13aに保持し、過去からの予測を行うことで符号化利得を向上させている。
【0039】
本実施例においては、パケット消失により送信装置1の符号化処理部13と受信装置2の復号化処理部23における相関データの不一致による品質劣化を低減するために、無音状態から有音状態に変化した場合に、符号化処理部13の内部バッファ13aをリセットして初期値を用いることにより伝送誤りによる品質低下の発生を低減している。
【0040】
さらに、符号化処理部13は、分析結果に基づいて符号化対象となる音声データフレームを符号化してパケット生成部14に送出する。
【0041】
パケット生成部14は、符号化処理部13から入力した符号化された音声データを含むRTPパケットを生成して送信部15へ送出する。このときのRTPパケットには図3に示すようなRTPヘッダが付加される。
【0042】
RTPヘッダには、周知のように、2ビットのVersion情報Vと、1ビットのPadding情報P、1ビットのExtension情報X、3ビットのCSRC−Count情報CC、1ビットのMarker情報(以下、マーカービットと称する)M、7ビットのPayload−Type情報PT、16ビットのシーケンス番号(順序番号:Sequence Number)、32ビットのタイムスタンプ(Timestamp)、32ビットの同期信号元(SSRC)識別子、32ビットの寄与送信元(CSRC)識別子等が含まれている。
【0043】
また、本実施形態では、無音状態であってパケット送信を停止していた後に有音状態になって最初に送信するパケットのマーカービットMを「1」に設定し、その他のパケットのマーカービットMを「0」に設定する。
【0044】
送信部15は、パケット生成部14から入力したRTPパケットを通信網3を介して受信装置2に送信する。
【0045】
一方、受信装置2の受信部21は、通信網3を介して送信装置1から送信されたRTPパケットを受信しパケット解析部22に送出する。
【0046】
パケット解析部22は、受信部21から入力したRTPパケットを解析してヘッダ部と符号化された音声データフレームに分離すると共に、ヘッダ部の内容を解析し、RTPタイムスタンプに基づいて、送信された順番に符号化された音声データフレームを復号化処理部23に出力する。さらに、パケット解析部22は、RTPヘッダのマーカービットMの値を復号化処理部23に通知する。
【0047】
復号化処理部23は、パケット解析部22から入力した符号化された音声データフレームを復号してディジタル音声データに変換し、このディジタル音声データをD/A変換部23に出力する。
【0048】
また、復号化処理部23は、復号化を行う際に、符号化された音声データフレームを分析しその分析結果を内部バッファ23aに一時記憶すると共に、データ分析を行う際に、内部バッファ23aに一時記憶されている分析結果或いは予め設定されている分析初期値を参照してデータ分析を行う。ここで、内部バッファ23に一時記憶されている1フレーム前の分析結果を用いることにより前後のフレーム間の相関を考慮した最適な分析及び復号を行えるようにしている。
【0049】
D/A変換部23は、復号化処理部23によって復号して得られたディジタル音声データを入力してアナログ音声信号に変換して音声出力部24に出力する。
【0050】
音声出力部24は、D/A変換部23から入力したアナログ音声データを音声に変換して出力する。
【0051】
次に、上記構成よりなる本実施形態におけるリアルタイムパケット処理装置の動作を説明する。
【0052】
VoIP通信において、受信装置2側の受け入れ準備が完了する前に送信装置1側が音声パケットの送出を始める場合がある。この様な場合には、受信装置2側では通信開始直後のパケットを正しく受信することができず、先頭の数パケットを取りこぼすことになる。
【0053】
この場合には、送信装置1側の符号化処理部13における内部バッファ13aに格納されている相関データと、受信装置2側の復号化処理部23における内部バッファ23aに格納されている相関データが不一致となり、正しい音声信号を生成することができない。
【0054】
本実施形態では、例えば符号化方式として前述したG.729を用いた場合を一例として説明する。この場合、1フレームが10msであるので、10ms分の音声1フレームを1パケットとした場合について説明する。また、以降の各実施形態でも同様の条件を例にとって記述する。
【0055】
RTP/RTCPを用いてVoIP音声パケット通信を行う場合に、送信装置1が最初に送ったパケットのシーケンス番号を知ることができないため、受信装置2側では最初に受け取ったパケットが、送信装置1が最初に送出したパケットであるかどうかわからない。
【0056】
このため、送信装置1の符号化処理部13における内部バッファの相関データをリセットした状態で生成した最初の符号化フレームが含まれているかどうか知ることができない。
【0057】
受信装置2において、送信装置1が送出したパケットのうち、先頭の数パケットを受信できなかったにもかかわらず何も付加的な処理を行わず、受け取ったパケットに含まれる音声フレームをそのまま復号して再生すると、先頭部分で符号化処理部と復号化処理部の相関データの不一致に起因する再生音声の品質劣化が生じる場合がある。
【0058】
この問題を回避するため、第1実施形態では、通信開始から数パケットについては、復号化処理は行うが、復号化処理したフレームの音声再生は行わず、フレームの信号波形が安定するまで数フレーム復号化処理を行った後でフェードイン処理を用いて再生している。
【0059】
例えば、図4に示す一例では、送信装置1はシーケンス番号が0番のフレームを含むパケットから順に送信しているが、受信装置2側では受信を開始した後にシーケンス番号が3番のパケットから受信している。この場合、受信装置2は、受信できた最初のN個のパケットに含まれるN個のフレームについては復号化処理を行うのみとする。これにより、正常に復号化するための相関データを復号化処理部23の内部バッファ23aに蓄積している。ここでは、N=2としてシーケンス番号が3番と4番の2つのパケットについて復号化処理を行うのみで、音声再生を行わずに相関データを内部バッファ23aに蓄積している。
【0060】
さらに、受信装置2は、上記シーケンス番号が3番と4番のフレームに続くM個のパケットのフレームについては復号化処理を施した後、音声再生する際にフェードイン処理を施す。ここでは、M=2としてシーケンス番号が5番と6番のパケットのフレームに関してフェードイン処理を施している。シーケンス番号が7番以降のパケットのフレーム関しては通常通りの復号化処理と音声再生処理を施す。尚、以下の説明においてN個及びM個はそれぞれ0以上の数であり且つN+Mが1以上となる数であればよい。
【0061】
前述したように本実施形態によれば、先頭の音声パケットを受信できなかったときに、品質劣化を低減して音声再生することができる。
【0062】
(第2実施形態)
次に、本発明の第2実施形態を説明する。
【0063】
第2実施形態では、送信装置1の符号化処理部13における内部バッファ13aと受信装置2の復号化処理部23における内部バッファ23aに格納されている相関データの状態不一致が、ネットワーク通信網3におけるパケット消失に起因して生じる場合について説明する。尚、第2実施形態における装置構成は第1実施形態と同様である。
【0064】
パケットが消失した場合には、消失したパケットに含まれるフレームを復号化処理することができないため、送信装置1側の符号化処理部13の符号化器の内部バッファ13aと受信装置2側の復号化処理部23の復号化器の内部バッファ23aに格納されている相関データに関して状態の不一致が生じる。
【0065】
このような内部バッファ13a,23aに格納されている相関データに関する状態の不一致を生じる場合、本実施形態では、パケット消失の直後のフレームを復号化してすぐに再生するのではなく、パケット消失後に受信した数パケットのフレームについては復号化処理は行うが音声再生は行わず、フレームの信号波形が安定するまで数フレーム符号化処理を行った後でフェードイン処理を行い再生している。
【0066】
以下に上記の内容を実現するための動作に関して図5を参照して説明する。
【0067】
受信装置2は、受信部21及びパケット解析部22において受信パケットに含まれるシーケンス番号を用いて、シーケンス番号が1番と2番のパケットの消失を知ることができる。
【0068】
受信装置2は、シーケンス番号が1番と2番のパケットの消失を知った場合に、消失したこれらのパケットのフレーム分の無音を生成して再生する。
【0069】
さらに、本実施形態では、受信装置2は消失したシーケンス番号が1番と2番のパケットのフレームの次に受信したパケットのフレームを復号化処理する前に、復号化処理部23の内部バッファ23aを初期化(リセット)する。
【0070】
次に、受信装置2は、受信したシーケンス番号が3番以降のパケットの復号化処理を開始するが、Nフレームの間は復号化するのみで再生は行わない。即ち、シーケンス番号が3番と4番の2つのパケットのフレームは復号化するのみで音声再生は行わない。
【0071】
これに続くM個のフレームは復号化処理して得られた音声信号を音量0から次第に音量を増加させるフェードイン処理を施して再生する。即ち、シーケンス番号が3番と4番の2つのパケットのフレームについては、復号化処理して得られた音声信号を音量0から次第に音量を増加させるフェードイン処理を施して再生する。
【0072】
N+M個のフレームの後、すなわちシーケンス番号が7番のパケット以降のパケットのフレームは、復号化処理して得られた音声信号をそのまま通常通り再生する。
【0073】
上記第2実施形態によれば、音声パケットの到着状況に応じてパケットが消失したときに、品質劣化を低減して音声再生することができる。
【0074】
(第3実施形態)
次に、本発明の第3実施形態を説明する。尚、第3実施形態における装置構成は、前述した第1実施形態と同様である。
【0075】
第3実施形態では、パケット通信において、IPパケットが一度に大量に到着した場合には、受信装置の受信部21にあるFIFOバッファ内にパケットが溜まりすぎて、受信パケットの一部を破棄する必要が生じる場合について説明する。
【0076】
このようなときに受信パケットの一部を破棄し、受信した全てのパケットに含まれる音声フレームを復号処理しない場合には、送信装置1の符号化処理部13における内部バッファ13aに格納されている相関データと受信装置2の復号化処理部23における内部バッファ23aに格納されている相関データとの間に状態の不一致が生じる。
【0077】
また、破棄する予定のフレームについても全て復号化処理を行うことは演算処理の負荷を考慮した場合には許容できない場合が多い。
【0078】
第3実施形態では、上記のような場合に全てのフレームを復号化処理しないことに起因する音声品質劣化を低減する例を示す。
【0079】
また、第3実施形態では、M個のフレームを境界フレームとして設け、クロスフェードすることで音声波形の不連続性をなくし、品質の劣化を低減している。
【0080】
ここで、破棄するフレーム数が非常に少ない場合には、破棄するフレームも含めて全てのフレームを復号化処理しても良い。例えば、破棄すべきフレーム数X<Nとなる場合に全てのフレームを復号化処理するようにすることができる。
【0081】
次に、上記の処理の具体例について図6を参照して説明する。
【0082】
図6に示す具体例では、受信部22のFIFOバッファに多数のパケットが溜まりすぎたためシーケンス番号が11番から14番のパケットを破棄したいときの処理を示す。
【0083】
このとき、シーケンス番号が11番と12番のパケットは破棄する。また、シーケンス番号が9番と10番のパケットのフレームを境界フレームとして、これらのフレームの復号化処理を行った後、これらの境界フレーム対して徐々に無音まで音量を低下させるフェードアウト処理を施す。
【0084】
さらに、シーケンス番号が13番のパケットのフレームを復号化処理する前に、復号化処理部23の内部バッファ23aを初期化(リセット)する。
【0085】
また、シーケンス番号が13番と14番のパケットについては復号化処理を施して、復号化処理部23の内部バッファ23aに格納されている相関データを更新する。しかし、復号化処理されたシーケンス番号が13番と14番のパケットのフレームについては音声再生しない。
【0086】
また、これに続くM個のフレームを境界フレームとし、これらのフレームを復号化処理して得られた音声信号を音量0から次第に音量を増加させるフェードイン処理を施して再生する。即ち、シーケンス番号が15番と16番のパケットのフレームについては、復号化処理して得られた音声信号を音量0から次第に音量を増加させるフェードイン処理を施す。
【0087】
さらに、シーケンス番号が9,10番のフレームと15,16番のフレームとを重ねてクロスフェードした状態で音声再生する。
【0088】
シーケンス番号が17番のパケット以降のパケットのフレームは、復号化処理して得られた音声信号をそのまま通常通り再生する。
【0089】
上記第3実施形態によれば、IPパケットが一度に大量に到着し、受信装置2の受信部21にあるFIFOバッファ内にパケットが溜まりすぎて、受信パケットの一部を破棄したときにも、品質劣化を低減して音声再生することができる。
【0090】
(第4実施形態)
次に、本発明の第4実施形態を説明する。
【0091】
図7は本発明の第4実施形態における音声パケット通信システムの機能構成を示すブロック図である。図において、前述した第1実施形態と同一構成部分は同一符号をもって表しその説明を省略する。また、第4実施形態と第1実施形態との相違点は、受信装置2に消失補償処理部26と混合器27を設けたことである。
【0092】
第4実施形態では、第2実施形態に示したパケットが消失した場合の処理を拡張して、パケット消失補償処理を行う場合の例を説明する。
【0093】
パケットが消失した場合には、消失したパケットに含まれるフレームを復号化処理して復号化器の内部状態を更新することができないため、送信装置1側の符号化処理部13で当該フレームを符号化した時点の相関データと、当該フレームを復号化する復号化処理部23の内部バッファ23aに格納されている相関データとの間に状態の不一致が生じる。
【0094】
受信装置2は、受信部21とパケット解析部22において受信パケットに含まれるシーケンス番号を用いて、パケットの消失を知ることができる。本実施形態では、シーケンス番号が1番と2番のパケットが消失した場合を一具体例として図8を参照して説明する。
【0095】
これらのパケットの消失を知った場合に、受信装置2は、消失補償処理部26において第1再生処理を行うと共に復号化処理部24において第2再生処理を行い、消失補償処理部26からの出力信号と復号化処理部24からの出力信号を混合機27によって混合してD/A変換部24に入力する。
【0096】
即ち、受信装置2は、パケットの消失を知った場合に、正常に受信した最後のパケットに含まれる最後のフレームを復号化した後の復号化処理部23の内部バッファ23aに格納されている相関データを、消失補償処理部26の内部バッファ26aにコピーする。
【0097】
消失補償処理部26では、第1再生処理を行う。この第1再生処理では、内部バッファ26aにコピーされた相関データを用いて、消失したフレームの代わりに再生されるべき音声波形を擬似生成して補間すると共に、補間したフレームに続くN個のフレームを擬似生成して復号化処理し、これに続くM個のフレームを擬似生成して復号化すると共にフェードアウト処理を施して、混合部27を介してD/A変換部24に出力する。
【0098】
復号化処理部23では、第2再生処理を行う。この第2再生処理では、消失していない次のパケットのフレームを復号化処理する前に、内部バッファ23aを初期化(リセット)する。
【0099】
次に、復号化処理部23は、受信したパケットの復号化処理を開始するが、最初のN個のフレームの間は復号化するのみで再生は行わない。このN個のフレームに続くM個のフレームには復号化処理部24において復号化処理して得られた音声信号を0から次第に音量を増加させるフェードイン処理を施す。
【0100】
復号化処理部24においてフェードイン処理を施されたものと、消失補償処理部で生成された音声波形をフェードアウト処理したものを合成し(クロスフェード)、再生する。
【0101】
また、復号化処理部23においては、内部バッファ23aを初期化(リセット)した後のN+M個のフレームに続くフレームに対しては、通常通りの復号化処理を施し、この復号化された音声信号はそのまま通常通り再生される。
【0102】
次に、上記の処理の具体例について図8を参照して説明する。
【0103】
図8に示す具体例では、受信装置2は、シーケンス番号が1番と2番のパケットの消失を知った場合に、正常に受信したシーケンス番号が0番のパケットに含まれるフレームを復号化した後の復号化処理部23の内部バッファ23aに格納されている相関データを、消失補償処理部26の内部バッファ26aにコピーする。
【0104】
消失補償処理部26では、第1再生処理として、内部バッファ26aにコピーされた相関データを用いて、消失したシーケンス番号が1番と2番のパケットのフレームの代わりに再生されるべき1’番と2’番のフレーム及びこれに続く3’〜6’番のフレームの音声波形を擬似生成して補間すると共に、補間した1’〜4’番のフレームに対しては復号化処理のみを施し、これに続くシーケンス番号が5’番と6’番のパケットのフレームに対しては復号化すると共にフェードアウト処理を施して音声波形を生成し、混合部27を介してD/A変換部24に出力する。
【0105】
復号化処理部23では、第2再生処理として、受信したシーケンス番号が3番のパケットのフレームを復号化処理する前に、内部バッファ23aを初期化(リセット)する。
【0106】
次に、復号化処理部23は、受信したシーケンス番号が3番と4番のパケットのフレームは復号化するのみで再生は行わない。これにより、復号化処理部23の内部バッファ23aに格納されている相関データが正常なものとなる。
【0107】
また、シーケンス番号が5番と6番のパケットのフレームには復号化処理部24において復号化処理して得られた音声信号を0から次第に音量を増加させるフェードイン処理を施して、混合部27を介してD/A変換部24に出力する。
【0108】
これにより、混合部27によって復号化処理部23においてフェードイン処理を施されたものと、消失補償処理部26においてフェードアウト処理を施されたものが合成(クロスフェード)され、再生される。
【0109】
また、復号化処理部23においては、シーケンス番号が7番以降のパケットのフレームに対しては、通常通りの復号化処理を施す。この復号化された音声信号はそのまま通常通り再生される。
【0110】
上記第4実施形態によれば、通信網3においてパケットが消失したときにも、品質劣化を低減して音声再生することができる。
【0111】
(第5実施形態)
次に、本発明の第5実施形態を説明する。尚、第5実施形態における装置構成は前述した第4実施形態と同様である。
【0112】
第5実施形態では、図9に示すように、シーケンス番号が0番のパケットを受信した後、このパケットに続くシーケンス番号が1番のパケットが遅延したために、消失補償処理部26において、1’番及び2’番のフレームを擬似生成して再生する場合の処理を説明する。
【0113】
受信装置2は、受信部21、パケット解析部22において、受信すべきパケットが遅延していることを知ることができる。本実施形態では、シーケンス番号が1番のパケット以降が遅延した場合を一具体例として図9を参照して説明する。
【0114】
パケットの遅延を契機に受信装置2は、消失補償処理部26において第1再生処理を行うと共に復号化処理部24において第2再生処理を行い、消失補償処理部26からの出力信号と復号化処理部24からの出力信号を混合機27によって混合してD/A変換部24に入力する。
【0115】
即ち、受信装置2は、パケットの遅延を知った時に、正常に受信した最後のパケットに含まれる最後のフレームを復号化した後の復号化処理部23の内部バッファ23aに格納されている相関データを、消失補償処理部26の内部バッファ26aにコピーする。
【0116】
消失補償処理部26では、第1再生処理を行う。この第1再生処理では、内部バッファ26aにコピーされた相関データを用いて、遅延して受信できていないフレームの代わりに遅延時間内に存在すべきフレームの音声波形を生成して補間すると共に、補間したフレームに続くN個のフレームを擬似生成すると共にこれらN個のフレームに対してフェードアウト処理を施して、混合部27を介してD/A変換部24に出力する。
【0117】
復号化処理部23では、第2再生処理を行う。この第2再生処理では、遅延して受信したシーケンス番号が1番以降のパケットの復号化処理を開始する。このとき、先頭のN個のパケットのフレームは復号化した後に、復号化処理して得られた音声信号を0から次第に音量を増加させるフェードイン処理を施す。
【0118】
さらに、復号化処理部23においてフェードイン処理を施されたものと、消失補償処理部26で生成されたフェードアウト処理した音声波形を混合部27によって合成し(クロスフェード)、再生する。
【0119】
また、復号化処理部23においては、シーケンス番号が3番以降のパケットのフレームに対しては、通常通りの復号化処理を施し、この復号化された音声信号はそのまま通常通り再生される。
【0120】
次に、上記の処理の具体例について図9を参照して説明する。
【0121】
図9に示す具体例では、受信装置2は、シーケンス番号が1番以降のパケットの遅延を知った場合に、復号化処理部23によって、正常に受信したシーケンス番号が0番のパケットに含まれるフレームを復号化した後の復号化処理部23の内部バッファ23aに格納されている相関データを、消失補償処理部26の内部バッファ26aにコピーする。
【0122】
消失補償処理部26は、内部バッファ26aに格納されている相関データを用いて遅延時間内に存在しなければならないパケットに含まれるフレームの代わりに再生すべきフレーム1’,2’の音声信号を擬似生成する。
【0123】
次に、パケット1,2が遅れて到着する。
【0124】
復号化処理部23では、シーケンス番号が0番のパケットに含まれるフレームを復号化処理した直後の内部バッファ23aに相関データが保持されているため、この相関データを用いてシーケンス番号が1番と2番のパケットに含まれるフレームを復号化処理すれば、符号化処理部13の内部バッファ13aに格納されている相関データと復号化処理部23の内部バッファ23aに格納されている相関データの不一致は生じない。
【0125】
さらに、符号化処理部23は、シーケンス番号が1番と2番のパケットのフレームを復号化した後に、復号化処理して得られた音声信号を0から次第に音量を増加させるフェードイン処理を施して混合部27を介してD/A変換部24に出力する。
【0126】
一方、消失補償処理部26では、再生される音声信号波形が不連続になることに起因する音声品質の劣化を避けるために、N個(ここではN=2)の擬似フレーム3’,4’の音声信号を生成して混合部27を介してD/A変換部24に出力する。
【0127】
これにより、符号化処理部23から出力されたシーケンス番号が1番と2番のパケットに含まれるフレームを復号した音声信号波形と、消失補償処理部26から出力された擬似フレーム3’,4’の音声信号とが混合部27によって混合されてクロスフェード処理が施され、これがD/A変換部24に出力される。
【0128】
また、復号化処理部23においては、シーケンス番号が3番以降のパケットのフレームに対しては、通常通りの復号化処理を施す。この復号化された音声信号はそのまま通常通り再生される。
【0129】
上記第5実施形態によれば、通信網3においてパケットが遅延したときにも、品質劣化を低減して音声再生することができる。
【0130】
(第6実施形態)
次に、本発明の第6実施形態を図10を参照して説明する。尚、第6実施形態における装置構成は前述した第4,5実施形態と同様である。
【0131】
第6実施形態では、図10に示すように、前述した第5実施形態の処理に代えて、復号化処理部23において、シーケンス番号が1番と2番のパケットを破棄し、シーケンス番号が3番と4番のパケットに含まれるフレームを復号化処理してさらにフェードイン処理を施し、このフェードイン処理した音声信号と、消失補償処理部26によって生成した擬似フレーム3’,4’の音声信号とを混合部27によって合成することによりクロスフェードして出力するようにした。
【0132】
上記第6実施形態によっても第5実施形態と同様に、通信網3においてパケットが遅延したときにも、品質劣化を低減して音声再生することができる。
【0133】
(第7実施形態)
次に、本発明の第7実施形態を説明する。
【0134】
図11は本発明の第7実施形態における音声パケット通信システムの受信装置を示すブロック図である。図において、前述した第4実施形態と同一構成部分は同一符号をもって表しその説明を省略する。また、第7実施形態と第4実施形態との相違点は、第4実施形態における消失補償処理部26に代えて内部バッファ状態保持部28を設けると共に混合部28を除去したことである。
【0135】
上記構成によっても第5実施形態と同様の処理を行うことができる。即ち、G.729等の場合のように復号化処理部23と消失補償処理部26が実質的に同一であるような場合には、復号化処理部23の内部バッファ23aに格納されている相関データを、内部バッファ状態保持部28に一時的にコピーして保存しておき、遅延してきた次のフレームを復号する場合には、保持しておいた相関データを用いて復号を始めることで、同様の処理を行うことができる。
【0136】
この場合にはシーケンス番号が0番のパケットに含まれるフレームを復号化処理した直後に、復号化処理部23の内部バッファ23aに格納されている相関データを内部バッファ状態保持部28にコピーして保持し、上記消失補償処理部26の処理と同様に1’番から4’番までの擬似フレームを生成する。
【0137】
次いで、遅延して受信したシーケンス番号が1番のパケットに含まれるフレームを復号化処理する場合には、内部バッファ状態保持部28に保持されている相関データを復号化処理部26の内部バッファ23aにコピーして復帰してから復号化処理を行う。
【0138】
上記第7実施形態によっても第5実施形態と同様に、通信網3においてパケットが遅延したときにも、品質劣化を低減して音声再生することができる。
【0139】
尚、前述した各実施形態は本発明の一具体例であって、本発明が上記実施形態にのみ限定されることはない。
【0140】
また、前後のパケットが入れ替わった状態でパケットを受信し、これらのパケットのフレームを復号化せざるおえない場合にも、本発明の手法を適用可能であることは言うまでもないことである。
【0141】
【発明の効果】
以上説明したように本発明のリアルタイムパケット処理装置及びその方法によれば、復号化処理部による復号処理を行う際に処理対象となるフレームが連続していないときは、不連続となったフレームからN個のフレームに対して復号化処理部における復号化のみが行われて復号化したN個のフレームに対して音声再生処理を施さずに前記N個のフレームの次のフレームから音声再生処理が施される、或いは、不連続となったフレームからN個のフレームに対して復号化が行われ該復号化した前記N個のフレームに対して音量を低下させた音声再生処理が施されるため、復号化を行う際に復号化処理部において用いる相関データを、送信装置側の符号化処理部における相関データと一致させることができ、前記N個のフレームの次のフレームから適切な音声再生処理を行うことができるという非常に優れた効果を奏するものである。
【図面の簡単な説明】
【図1】本発明の第1実施形態におけるリアルタイムパケット処理装置の機能構成を示すブロック図
【図2】本発明の第1実施形態における音声パケット送信装置による音声信号のパケット化を説明する図
【図3】本発明の第1実施形態において用いているリアルタイム転送プロトコルヘッダを説明する図
【図4】本発明の第1実施形態におけるリアルタイムパケット処理装置の処理を説明するタイミングチャート
【図5】本発明の第2実施形態におけるリアルタイムパケット処理装置の処理を説明するタイミングチャート
【図6】本発明の第3実施形態におけるリアルタイムパケット処理装置の処理を説明するタイミングチャート
【図7】本発明の第4実施形態におけるリアルタイムパケット処理装置の機能構成を示すブロック図
【図8】本発明の第4実施形態におけるリアルタイムパケット処理装置の処理を説明するタイミングチャート
【図9】本発明の第5実施形態におけるリアルタイムパケット処理装置の処理を説明するタイミングチャート
【図10】本発明の第6実施形態におけるリアルタイムパケット処理装置の処理を説明するタイミングチャート
【図11】本発明の第7実施形態におけるリアルタイムパケット処理装置の受信装置の機能構成を示すブロック図
【符号の説明】
1…送信装置、2…受信装置、3…通信網、11…音声入力部、12…アナログ/ディジタル(A/D)変換部、13…符号化処理部、13a…内部バッファ、14…パケット生成部、15…送信部、21…受信部、22…パケット解析部、23…復号化処理部、23a…内部バッファ、24…ディジタル/アナログ(D/A)変換部、25…音声出力部、26…消失補償処理部、26a…内部バッファ、27…混合部、28…内部バッファ状態保持部。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a real-time packet processing apparatus and method for processing frame data contained in a received packet in real time.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, along with the digitization of electronic devices, information to be transferred is generally packetized and transferred in information communication. For example, in the case of transferring an audio signal, on the transmitting side, audio data sampled at a predetermined sampling frequency is distributed and stored in separate packets by a predetermined amount and transferred in units of packets. On the receiving side, the audio data is extracted from the received packet, and the extracted audio data is connected and played back or mixed.
[0003]
That is, in an electronic device that performs packet communication as described above, the transmission side performs processing to form and transmit a packet when one packet of data is obtained, and the reception side stores the packet in the received packet. A process of reading data in the packet is performed every time required for reproducing the data. Thereby, on the receiving side, for example, in the case of real-time transfer of audio data, it is possible to perform reproduction processing or mixing processing on continuous audio from a plurality of dividedly received packets.
[0004]
Such packet communication is almost always performed using a computer device. For example, a mobile phone using wireless communication, a well-known IP phone using a communication network such as the Internet, music from a distribution server, etc. It is used in a system for distributing content to a user terminal device, a remote conference system, and the like.
[0005]
For example, a speech coding method (predictive coding method) using inter-frame prediction is ITU standard G.264. 729, G.G. 723.1, G.M. 722.1.
[0006]
In these encoding schemes, the correlation data stored in the internal buffer of the encoding processing unit on the transmitting device side and the correlation data stored in the internal buffer of the decoding processing unit on the receiving device side must match. There is a restriction that a correct acoustic signal cannot be restored. The correlation data is the G. 729, G.G. 723.1, G.M. This is data used in the predictive coding method described in 722.1.
[0007]
For example, when
[0008]
In addition, when a packet is lost during transfer, a packet loss compensation (PLC) process may be performed in the receiving apparatus.
[0009]
As packet loss compensation processing, G.I. 711
[0010]
[Patent Document 1]
JP 2000-83050 A
[Non-Patent Document 1]
ITU-T Recommendation G. 729
[Non-Patent Document 2]
ITU-T Recommendation G. 723.1
[Non-Patent Document 3]
ITU-T Recommendation G. 722.1
[Non-Patent Document 4]
ITU-T Recommendation G. 711
[0011]
[Problems to be solved by the invention]
When the packet loss occurs due to the restriction in the speech coding method (predictive coding method) described above, the correlation data of the decoding processing unit may be updated using the lost frame as an input to the decoding processing unit. Therefore, when decoding a frame in a packet correctly received after erasure, the correlation data of the encoding processing unit on the transmitting device side and the correlation data of the decoding processing unit on the receiving device side are inconsistent, and the audio frame is It may not be restored correctly.
[0012]
In the above-described conventional method, since no special measures are taken for correlation data mismatch caused by packet loss or delay as described above, degradation in perceivable quality occurs in reproduced speech.
[0013]
In addition, in the case of an application such as VoIP, there is no guarantee that all voice packets transmitted from the transmitting device side will correctly arrive at the receiving device side, even though there are restrictions when using the predictive coding method as described above. Absent. For example, when a packet is lost in a communication network or the like, the correlation data of the encoding processing unit and the decoding processing unit easily mismatch, and when the communication session is established, it is correctly received from the first packet transmitted by the transmitting device. Since it does not always arrive at the apparatus side, there is a problem that communication continues from the initial stage of communication with the correlation data of the encoding processing unit and the decoding processing unit being inconsistent.
[0014]
In view of the above problems, the object of the present invention is to minimize the mismatch of correlation data between the encoding processing unit and the decoding processing unit when the packet is lost or delayed according to the arrival state of the voice packet. It is an object to provide a real-time packet processing apparatus and method capable of appropriately interpolating frames and reproducing sound with reduced quality deterioration.
[0015]
[Means for Solving the Problems]
In general, the prediction used in the encoding processing unit and the decoding processing unit uses a correlation between several frames, and several frames from the point in time when the internal states of the encoding processing unit and the decoding processing unit do not match. During this time, a correct acoustic signal cannot be restored, and perceived quality degradation occurs in the reproduced sound.
[0016]
However, even if there is a mismatch in the correlation data between the encoding processing unit and the decoding processing unit, the correlation data gradually matches after decoding the received frames in several frames in the correct order, and as a result the decoded waveform The quality degradation gradually decreases as the correct frames are successively decoded.
[0017]
In the present invention, when there is a mismatch in the correlation data of the encoding processing unit and the decoding processing unit, the audio whose quality is deteriorated by not reproducing the audio of the first few frames is not reproduced and the listening quality is improved. A real-time packet processing apparatus and a method thereof are proposed.
[0018]
In the present invention, a continuous input audio signal is cut out at predetermined intervals, and a plurality of sampling data obtained by sampling the cut signals at predetermined sampling times shorter than the cycle is encoded by an encoding processing unit. A packet including the frame is generated for each frame, and the packet is received by a receiver via a communication network from a transmitter that sequentially transmits the frame, and the received packet is received by the receiver In the real-time packet processing using a predictive encoding method in which the frame included is decoded by a decoding processing unit, and audio reproduction processing is performed on sampling data included in the decoded frame, the receiving device includes:A packet received from the transmission device is stored in a buffer and included in a packet input from the buffer.Analyzing the encoded frame when decoding the frame, holding the analysis result as correlation data, and when performing the decoding process by the decoding processing unit, when the frame to be processed is not continuous, Only the decoding processing unit performs decoding on N frames from the discontinuous frames, and the N frames without performing the audio reproduction processing on the decoded N frames. The audio reproduction processing is performed by decoding the stored correlation data from the next frame.Further, the receiving device is configured such that when the number of packets stored in the buffer exceeds a predetermined number, the last N packets among a predetermined number of consecutive packets to be discarded stored in the buffer. A packet other than that frame is discarded, the last N frames are only decoded, and the subsequent M packet frames are subjected to a fade-in process for gradually increasing the volume from the silent state, A fade-out process for gradually reducing the sound volume to silence is performed on the frame of M packets before the discarded packet.
[0019]
According to the present invention, when the frame to be processed is not continuous when performing the decoding process by the decoding processing unit, the decoding processing unit is applied to N frames from discontinuous frames. Only the decoding is performed, and without performing the sound reproduction process on the decoded N frames, the decoding is performed using the held correlation data from the next frame of the N frames. And the audio reproduction process is performed. Since only the decoding process is performed on the N frames, the correlation data used in the decoding processing unit when decoding is completely matched with the correlation data in the encoding processing unit on the transmission device side or It is possible to substantially match, and appropriate audio reproduction processing can be performed from the next frame of the N frames..
[0020]
MaFurther, in the present invention, the receiving apparatus performs the processing on the N frames from the discontinuous frames when the frames to be processed are not continuous when performing the decoding process by the decoding processing unit. Decoding in the decoding processing unit is performed, and the audio reproduction processing with the volume reduced is performed on the decoded N frames.
[0021]
According to the present invention, when the frame to be processed is not continuous when performing the decoding process by the decoding processing unit, the decoding processing unit is applied to N frames from discontinuous frames. After the decoding in step S3 is performed, the sound reproduction process with the volume reduced is performed on the decoded N frames.
[0022]
At this time, similarly to the above, the decoding processing is performed on the N frames, so that the correlation data used in the decoding processing unit when decoding is performed in the encoding processing unit on the transmission device side. The correlation data can be completely matched or almost matched. Further, since the sound reproduction processing with a reduced volume is performed on the N frames, no abnormal sound is generated at this transition portion, and deterioration of sound quality is reduced..
[0023]
MaIn the present invention, the reception device stores the packet received from the transmission device in the buffer, and decodes the frame included in the packet input from the buffer, and stores the packet stored in the buffer. When the number of frames exceeds a predetermined number, packets other than the last N frames of a predetermined number of consecutive packets to be discarded stored in the buffer are discarded, and the last N Only the frame is decoded, and a fade-in process for gradually increasing the volume from the silent state is performed on the subsequent frame of M packets, and the frame of the M packets before the discarded packet is subjected to fade-in processing. Apply fade-out processing to gradually reduce the volume to silence.
[0024]
According to the present invention, when the number of packets accumulated in the buffer of the receiving apparatus exceeds a predetermined number, a delay occurs in the audio reproduction processing, so that a predetermined number of consecutive discards stored in the buffer are targeted for discarding. Packets other than the last N frames of the packets are discarded.
[0025]
Thus, since the fade-in process for gradually increasing the volume from the silent state is performed on the M frames, the voice is reproduced at the portion where the transition is made from the silent state to the voiced state when the voice is reproduced in the receiving device. Since the waveform does not become discontinuous, abnormal noise does not occur in this transition portion, and deterioration of voice quality is reduced.
[0026]
Furthermore, since the fade-out process for gradually reducing the sound volume to silence is performed on the M frames before becoming discontinuous, the sound level of the part from the sounded state to the silent state is gradually reduced. When audio is played back by the receiver, the audio waveform does not become discontinuous at the transition from the voiced state to the silent state, so no abnormal noise is generated at this transition and the degradation of voice quality is reduced. Is done.
[0027]
Furthermore, since only the last N frames of the frame of the packet to be discarded are decoded, predictive coding is performed in the encoding processing unit on the transmission side and the decoding processing unit on the reception side. Correlation data used in the method can be completely matched or almost matched.
[0028]
In the present invention, the receiving device determines that the frame is discontinuous when the sequence number becomes discontinuous based on the sequence number included in the packet.
[0029]
According to the present invention, based on the sequence number included in the packet, the receiving device determines that the frame is discontinuous when the sequence number becomes discontinuous.
[0030]
In the present invention, the receiving apparatus reproduces audio by superimposing the frame subjected to the fade-out process and the frame subjected to the fade-in process.
[0031]
According to the present invention, since the frame subjected to the fade-out process and the frame subjected to the fade-in process are overlapped and reproduced by sound, a silent state does not occur in a discontinuous portion, and the sound quality is improved. Degradation is further reduced.
[0032]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
[0033]
(First embodiment)
FIG. 1 is a block diagram showing a functional configuration of a real-time packet processing apparatus according to the first embodiment of the present invention. FIG. 2 is a diagram for explaining packetization of a voice signal by a voice packet transmitting apparatus according to the first embodiment of the present invention. 3 is a diagram for explaining a real-time transfer protocol (hereinafter referred to as RTP) header used in the first embodiment of the present invention. In the figure, 1 is a voice packet transmitting device (hereinafter simply referred to as a transmitting device), 2 is a voice packet receiving device (hereinafter simply referred to as a receiving device), and 3 is a communication network such as the Internet. In the present embodiment, as an example, a description will be given of an apparatus that transfers voice packets from the
[0034]
The
[0035]
The receiving
[0036]
The
[0037]
Also, as shown in FIG. 2, the audio data stored in the data buffer of the
[0038]
The
[0039]
In this embodiment, in order to reduce quality degradation due to mismatch of correlation data in the
[0040]
Further, the
[0041]
The
[0042]
As is well known, the RTP header includes a 2-bit version information V, a 1-bit padding information P, a 1-bit extension information X, a 3-bit CSRC-Count information CC, a 1-bit Marker information (hereinafter referred to as a marker). M, 7-bit Payload-Type information PT, 16-bit sequence number (sequence number: Sequence Number), 32-bit time stamp (Timestamp), 32-bit synchronization signal source (SSRC) identifier, 32 bits , A contributing transmission source (CSRC) identifier or the like.
[0043]
In the present embodiment, the marker bit M of the first packet to be transmitted after entering the voiced state after stopping the packet transmission in the silent state is set to “1”, and the marker bit M of the other packet is set. Is set to “0”.
[0044]
The
[0045]
On the other hand, the
[0046]
The
[0047]
The
[0048]
Further, the
[0049]
The D /
[0050]
The
[0051]
Next, the operation of the real-time packet processing apparatus according to the present embodiment having the above configuration will be described.
[0052]
In VoIP communication, the sending
[0053]
In this case, the correlation data stored in the
[0054]
In the present embodiment, for example, G. A case where 729 is used will be described as an example. In this case, since one frame is 10 ms, a case where one frame of 10 ms worth of audio is assumed to be one packet will be described. In the following embodiments, the same condition is described as an example.
[0055]
When performing VoIP voice packet communication using RTP / RTCP, it is impossible to know the sequence number of the packet sent first by the
[0056]
For this reason, it cannot be known whether or not the first encoded frame generated in a state where the correlation data of the internal buffer in the
[0057]
The receiving
[0058]
In order to avoid this problem, in the first embodiment, the decoding process is performed for several packets from the start of communication, but the decoded frame is not played back, and several frames until the signal waveform of the frame is stabilized. After the decryption process is performed, reproduction is performed using a fade-in process.
[0059]
For example, in the example shown in FIG. 4, the transmitting
[0060]
Further, the receiving
[0061]
As described above, according to the present embodiment, when the leading voice packet cannot be received, the voice can be reproduced with reduced quality deterioration.
[0062]
(Second Embodiment)
Next, a second embodiment of the present invention will be described.
[0063]
In the second embodiment, the state mismatch of the correlation data stored in the
[0064]
When a packet is lost, the frame included in the lost packet cannot be decoded, so the
[0065]
In the case where such a state mismatch regarding the correlation data stored in the
[0066]
The operation for realizing the above contents will be described below with reference to FIG.
[0067]
Using the sequence numbers included in the received packets in the receiving
[0068]
When receiving the loss of the packets with the
[0069]
Further, in the present embodiment, the receiving
[0070]
Next, the receiving
[0071]
Subsequent M frames are reproduced by performing a fade-in process for gradually increasing the sound volume from the
[0072]
After N + M frames, that is, for the frames of packets with
[0073]
According to the second embodiment, when a packet is lost depending on the arrival state of a voice packet, it is possible to reproduce voice while reducing quality degradation.
[0074]
(Third embodiment)
Next, a third embodiment of the present invention will be described. The apparatus configuration in the third embodiment is the same as that in the first embodiment described above.
[0075]
In the third embodiment, in packet communication, when a large number of IP packets arrive at one time, the packets are accumulated in the FIFO buffer in the receiving
[0076]
In such a case, when a part of the received packet is discarded and the audio frame included in all received packets is not decoded, it is stored in the
[0077]
Also, it is often unacceptable to perform the decoding process for all frames to be discarded in consideration of the processing load.
[0078]
In the third embodiment, an example is shown in which voice quality deterioration caused by not decoding all frames in the above case is reduced.
[0079]
In the third embodiment, M frames are provided as boundary frames, and crossfading is performed to eliminate the discontinuity of the speech waveform and reduce quality degradation.
[0080]
Here, when the number of discarded frames is very small, all the frames including the discarded frames may be decoded. For example, when the number of frames to be discarded X <N, all frames can be decoded.
[0081]
Next, a specific example of the above processing will be described with reference to FIG.
[0082]
The specific example shown in FIG. 6 shows processing when it is desired to discard packets having
[0083]
At this time, packets with
[0084]
Further, the
[0085]
Also, the packets with
[0086]
Further, M frames subsequent to this are used as boundary frames, and an audio signal obtained by decoding these frames is subjected to fade-in processing for gradually increasing the volume from
[0087]
Further, sound is reproduced in a state where the frames of the
[0088]
The frame of the packet after the packet with the sequence number of 17 reproduces the audio signal obtained by decoding as usual.
[0089]
According to the third embodiment, even when a large number of IP packets arrive at one time and packets accumulate too much in the FIFO buffer in the receiving
[0090]
(Fourth embodiment)
Next, a fourth embodiment of the present invention will be described.
[0091]
FIG. 7 is a block diagram showing a functional configuration of a voice packet communication system according to the fourth embodiment of the present invention. In the figure, the same components as those in the first embodiment are denoted by the same reference numerals, and the description thereof is omitted. Further, the difference between the fourth embodiment and the first embodiment is that the
[0092]
In the fourth embodiment, an example in which the packet loss compensation process is performed by extending the process when the packet shown in the second embodiment is lost will be described.
[0093]
When a packet is lost, the frame included in the lost packet cannot be decoded and the internal state of the decoder cannot be updated. Therefore, the
[0094]
The receiving
[0095]
When receiving the loss of these packets, the receiving
[0096]
That is, when the receiving
[0097]
The erasure
[0098]
The
[0099]
Next, the
[0100]
A signal that has been subjected to the fade-in process in the
[0101]
Further, in the
[0102]
Next, a specific example of the above processing will be described with reference to FIG.
[0103]
In the specific example shown in FIG. 8, when the receiving
[0104]
In the erasure
[0105]
In the
[0106]
Next, the
[0107]
In addition, the frames of the packets with the
[0108]
As a result, the signal that has been subjected to the fade-in process in the
[0109]
Further, the
[0110]
According to the fourth embodiment, even when a packet is lost in the
[0111]
(Fifth embodiment)
Next, a fifth embodiment of the present invention will be described. In addition, the apparatus structure in 5th Embodiment is the same as that of 4th Embodiment mentioned above.
[0112]
In the fifth embodiment, as shown in FIG. 9, after the packet with the
[0113]
The receiving
[0114]
In response to the packet delay, the receiving
[0115]
That is, when the receiving
[0116]
The erasure
[0117]
The
[0118]
Further, the audio waveform subjected to the fade-in process in the
[0119]
Further, in the
[0120]
Next, a specific example of the above processing will be described with reference to FIG.
[0121]
In the specific example shown in FIG. 9, when the receiving
[0122]
The erasure
[0123]
Next,
[0124]
In the
[0125]
Furthermore, the
[0126]
On the other hand, in the erasure
[0127]
As a result, the audio signal waveform obtained by decoding the frames included in the packets having the
[0128]
Further, the
[0129]
According to the fifth embodiment, even when a packet is delayed in the
[0130]
(Sixth embodiment)
Next, a sixth embodiment of the present invention will be described with reference to FIG. In addition, the apparatus structure in 6th Embodiment is the same as that of 4th and 5th Embodiment mentioned above.
[0131]
In the sixth embodiment, as shown in FIG. 10, instead of the process of the fifth embodiment described above, the
[0132]
Also in the sixth embodiment, as in the fifth embodiment, even when a packet is delayed in the
[0133]
(Seventh embodiment)
Next, a seventh embodiment of the present invention will be described.
[0134]
FIG. 11 is a block diagram showing a receiving apparatus of a voice packet communication system according to the seventh embodiment of the present invention. In the figure, the same components as those of the fourth embodiment described above are denoted by the same reference numerals, and description thereof is omitted. The difference between the seventh embodiment and the fourth embodiment is that an internal buffer state holding unit 28 is provided in place of the erasure
[0135]
Also with the above configuration, the same processing as in the fifth embodiment can be performed. That is, G. When the
[0136]
In this case, immediately after decoding the frame included in the packet with the
[0137]
Next, when decoding the frame included in the packet with the
[0138]
Also in the seventh embodiment, as in the fifth embodiment, even when a packet is delayed in the
[0139]
Each embodiment mentioned above is an example of the present invention, and the present invention is not limited only to the above-mentioned embodiment.
[0140]
It goes without saying that the method of the present invention can also be applied to cases where packets are received in a state where the preceding and succeeding packets are switched and the frames of these packets have to be decoded.
[0141]
【The invention's effect】
As described above, according to the real-time packet processing apparatus and the method of the present invention, when the frames to be processed are not continuous when performing the decoding process by the decoding processing unit, Only the decoding processing unit performs decoding on the N frames, and the audio reproduction processing is performed from the next frame of the N frames without performing the audio reproduction processing on the decoded N frames. Since the decoding is performed on the N frames from the discontinuous frames, and the sound reproduction processing with the volume reduced is performed on the decoded N frames. The correlation data used in the decoding processing unit when decoding can be matched with the correlation data in the encoding processing unit on the transmission device side, and the next frame of the N frames In which exhibits the excellent effect that it is possible to perform et appropriate audio reproduction process.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a functional configuration of a real-time packet processing apparatus according to a first embodiment of the present invention.
FIG. 2 is a diagram for explaining packetization of a voice signal by the voice packet transmitting apparatus according to the first embodiment of the present invention.
FIG. 3 is a diagram for explaining a real-time transfer protocol header used in the first embodiment of the present invention.
FIG. 4 is a timing chart illustrating processing of the real-time packet processing device according to the first embodiment of the present invention.
FIG. 5 is a timing chart for explaining processing of the real-time packet processing device according to the second embodiment of the present invention.
FIG. 6 is a timing chart for explaining processing of the real-time packet processing device according to the third embodiment of the present invention.
FIG. 7 is a block diagram showing a functional configuration of a real-time packet processing device according to a fourth embodiment of the present invention.
FIG. 8 is a timing chart illustrating processing of a real-time packet processing device according to the fourth embodiment of the present invention.
FIG. 9 is a timing chart illustrating processing of the real-time packet processing device according to the fifth embodiment of the present invention.
FIG. 10 is a timing chart illustrating processing of a real-time packet processing device according to a sixth embodiment of the present invention.
FIG. 11 is a block diagram showing a functional configuration of a receiving device of a real-time packet processing device according to a seventh embodiment of the present invention.
[Explanation of symbols]
DESCRIPTION OF
Claims (8)
前記送信装置から受信したパケットを格納するバッファと、
前記バッファから入力したパケットに含まれるフレームを復号化する際に符号化されたフレームを分析し該分析結果を相関データとして保持する手段と、
前記復号化処理部による復号処理を行う際に処理対象となるフレームが連続しているか否かを判定する手段と、
前記判定の結果、前記復号処理対象となるフレームが連続していないときに、不連続となったフレームからN個のフレームに対して前記復号化処理部における復号化のみを行い、復号化したN個のフレームに対して前記音声再生処理を施さずに、前記N個のフレームの次のフレームから前記保持している相関データを用いて復号化を行って前記音声再生処理を施す手段と、
前記バッファに格納されているパケットの数が所定数を越えたときに、前記バッファに格納されている連続した所定数の破棄対象となるパケットのうちの最後のN個のフレーム以外のパケットを破棄する手段と、
前記最後のN個のフレームは復号化のみを行い、これに続くM個のパケットのフレームに対して無音状態から徐々に音量を増加させるフェードイン処理を施す手段と、
前記破棄したパケットの前のM個のパケットのフレーム対して徐々に無音まで音量を低下させるフェードアウト処理を施す手段とを備えている
ことを特徴とするリアルタイムパケット処理装置。A frame formed by encoding a plurality of sampling data obtained by cutting a continuous input audio signal every predetermined cycle and sampling the cut signal every predetermined sampling time shorter than the cycle by an encoding processing unit. And generating the packet including the frame for each frame and receiving the packet by a receiving device via a communication network from a transmitting device that sequentially transmits the frame, and the frame included in the received packet by the receiving device In a real-time packet processing apparatus using a predictive coding method for decoding audio data by a decoding processing unit and performing audio reproduction processing on sampling data included in the decoded frame,
A buffer for storing packets received from the transmitting device;
Means for analyzing a frame encoded when decoding a frame included in a packet input from the buffer and holding the analysis result as correlation data;
Means for determining whether or not the frames to be processed are continuous when performing the decoding process by the decoding processing unit;
As a result of the determination, when the frames to be decoded are not continuous, the decoding processing unit only performs decoding on N frames from the discontinuous frames, and the decoded N Means for performing the audio reproduction processing by performing decoding using the held correlation data from the next frame of the N frames without performing the audio reproduction processing on the frames ;
When the number of packets stored in the buffer exceeds a predetermined number, discard a packet other than the last N frames among a predetermined number of consecutive packets to be discarded stored in the buffer. Means to
Means for performing a fade-in process in which the last N frames are only decoded, and the volume of the subsequent M packets is gradually increased from a silent state;
A real-time packet processing apparatus comprising: means for performing a fade-out process for gradually reducing the volume of the M packets before the discarded packet to a silent state .
前記送信装置から受信したパケットを格納するバッファと、
前記バッファから入力したパケットに含まれるフレームを復号化する際に符号化されたフレームを分析し該分析結果を相関データとして保持する手段と、
前記復号化処理部による復号処理を行う際に処理対象となるフレームが連続しているか否かを判定する手段と、
前記判定の結果、前記復号処理対象となるフレームが連続していないときに、不連続となったフレームからN個のフレームに対して前記復号化処理部における復号化を行った後、前記復号化した前記N個のフレームに対して音量を低下させた前記音声再生処理を施し、前記N個のフレームの次のフレームから前記保持している相関データを用いて復号化を行って前記音声再生処理を施す手段と、
前記バッファに格納されているパケットの数が所定数を越えたときに、前記バッファに 格納されている連続した所定数の破棄対象となるパケットのうちの最後のN個のフレーム以外のパケットを破棄する手段と、
前記最後のN個のフレームは復号化のみを行い、これに続くM個のパケットのフレームに対して無音状態から徐々に音量を増加させるフェードイン処理を施す手段と、
前記破棄したパケットの前のM個のパケットのフレーム対して徐々に無音まで音量を低下させるフェードアウト処理を施す手段とを備えている
ことを特徴とするリアルタイムパケット処理装置。A frame formed by encoding a plurality of sampling data obtained by cutting a continuous input audio signal every predetermined cycle and sampling the cut signal every predetermined sampling time shorter than the cycle by an encoding processing unit. And generating the packet including the frame for each frame and receiving the packet by a receiving device via a communication network from a transmitting device that sequentially transmits the frame, and the frame included in the received packet by the receiving device In a real-time packet processing apparatus using a predictive coding method for decoding audio data by a decoding processing unit and performing audio reproduction processing on sampling data included in the decoded frame,
A buffer for storing packets received from the transmitting device;
Means for analyzing a frame encoded when decoding a frame included in a packet input from the buffer and holding the analysis result as correlation data;
Means for determining whether or not the frames to be processed are continuous when performing the decoding process by the decoding processing unit;
As a result of the determination, when the frames to be decoded are not continuous, the decoding processing unit performs decoding on N frames from discontinuous frames, and then performs the decoding The audio reproduction processing is performed by performing the audio reproduction processing with the volume reduced on the N frames, and performing decoding using the held correlation data from the next frame of the N frames. Means for applying ,
When the number of packets stored in the buffer exceeds a predetermined number, discard a packet other than the last N frames among a predetermined number of consecutive packets to be discarded stored in the buffer. Means to
Means for performing a fade-in process in which the last N frames are only decoded, and the volume of the subsequent M packets is gradually increased from a silent state;
A real-time packet processing apparatus comprising: means for performing a fade-out process for gradually reducing the volume of the M packets before the discarded packet to a silent state .
ことを特徴とする請求項1又は請求項2に記載のリアルタイムパケット処理装置。The said determination means has a means to determine that the said frame became discontinuous based on the sequence number contained in the said packet, when this sequence number becomes discontinuous. Item 3. The real-time packet processing device according to Item 2.
ことを特徴とする請求項1又は請求項2に記載のリアルタイムパケット処理装置。The real-time packet processing apparatus according to claim 1, further comprising a unit that reproduces audio by superimposing the frame subjected to the fade-out process and the frame subjected to the fade-in process.
前記受信装置は、前記送信装置から受信したパケットをバッファに格納して、前記バッファから入力したパケットに含まれるフレームを復号化する際に、符号化されたフレームを分析し該分析結果を相関データとして保持すると共に、前記復号化処理部による復号処理を行う際に処理対象となるフレームが連続していないときに、不連続となったフレームからN個のフレームに対して前記復号化処理部における復号化のみを行い、復号化したN個のフレームに対して前記音声再生処理を施さずに、前記N個のフレームの次のフレームから前記保持している相関データを用いて復号化を行って前記音声再生処理を施し、前記バッファに格納されているパケットの数が所定数を越えたときに、前記バッファに格納されている連続した所定数の破棄対象となるパケットのうちの最後のN個のフレーム以外のパケットを破棄すると共に、前記最後のN個のフレームは復号のみを行い、これに続くM個のパケットのフレームに対して無音状態から徐々に音量を増加させるフェードイン処理を施し、前記破棄したパケットの前のM個のパケットのフレーム対して徐々に無音まで音量を低下させるフェードアウト処理を施す
ことを特徴とするリアルタイムパケット処理方法。A frame formed by encoding a plurality of sampling data obtained by cutting a continuous input audio signal every predetermined cycle and sampling the cut signal every predetermined sampling time shorter than the cycle by an encoding processing unit. And generating the packet including the frame for each frame and receiving the packet by a receiving device via a communication network from a transmitting device that sequentially transmits the frame, and the frame included in the received packet by the receiving device In a real-time packet processing method using a predictive coding method for decoding audio data by a decoding processing unit and performing audio reproduction processing on sampling data included in the decoded frame,
The receiving device stores the packet received from the transmitting device in a buffer, decodes the frame included in the packet input from the buffer , analyzes the encoded frame, and correlates the analysis result with the correlation data. And when the decoding process by the decoding processing unit is not continuous, the decoding processing unit applies to N frames from discontinuous frames when the frames to be processed are not continuous. Only decoding is performed, and the audio reproduction processing is not performed on the decoded N frames, and decoding is performed using the correlation data held from the next frame of the N frames. and facilities the audio reproduction process, when the number of packets stored in the buffer exceeds a predetermined number, discarding a predetermined number of successive stored in the buffer The packets other than the last N frames of the packets to be processed are discarded, and the last N frames are only decoded, and the subsequent M frames are gradually changed from the silent state. A real-time packet processing method , wherein a fade-in process for increasing the volume is performed, and a fade-out process for gradually decreasing the volume to a silence is applied to a frame of M packets before the discarded packet.
前記受信装置は、前記送信装置から受信したパケットをバッファに格納して、前記バッファから入力したパケットに含まれるフレームを復号化する際に、符号化されたフレームを分析し該分析結果を相関データとして保持すると共に、前記復号化処理部による復号処理を行う際に処理対象となるフレームが連続していないときに、不連続となったフレームからN個のフレームに対して前記復号化処理部における復号化を行った後、前記復号化した前記N個のフレームに対して音量を低下させた前記音声再生処理を施し、前記N個のフレームの次のフレームから前記保持している相関データを用いて復号化を行って前記音声再生処理を施し、前記バッファに格納されているパケットの数が所定数を越えたときに、前記バッファに格納されている連続した所定数の破棄対象となるパケットのうちの最後のN個のフレーム以外のパケットを破棄すると共に、前記最後のN個のフレームは復号のみを行い、これに続くM個のパケットのフレームに対して無音状態から徐々に音量を増加させるフェードイン処理を施し、前記破棄したパケットの前のM個のパケットのフレーム対して徐々に無音まで音量を低下させるフェードアウト処理を施す
ことを特徴とするリアルタイムパケット処理方法。A frame formed by encoding a plurality of sampling data obtained by cutting a continuous input audio signal every predetermined cycle and sampling the cut signal every predetermined sampling time shorter than the cycle by an encoding processing unit. And generating the packet including the frame for each frame and receiving the packet by a receiving device via a communication network from a transmitting device that sequentially transmits the frame, and the frame included in the received packet by the receiving device In a real-time packet processing method using a predictive coding method for decoding audio data by a decoding processing unit and performing audio reproduction processing on sampling data included in the decoded frame,
The receiving device stores the packet received from the transmitting device in a buffer, decodes the frame included in the packet input from the buffer , analyzes the encoded frame, and correlates the analysis result with the correlation data. And when the decoding process by the decoding processing unit is not continuous, the decoding processing unit applies to N frames from discontinuous frames when the frames to be processed are not continuous. After decoding, the audio reproduction processing with a reduced volume is performed on the decoded N frames, and the held correlation data is used from the next frame of the N frames. performs decoding by facilities the audio reproduction processing Te, when the number of packets stored in the buffer exceeds a predetermined number, is stored in the buffer A packet other than the last N frames of the predetermined number of packets to be discarded is discarded, and the last N frames are only decoded, and the frames of M packets that follow this are decoded. A real-time process in which a fade-in process for gradually increasing the volume from a silent state is performed, and a fade-out process for gradually decreasing the volume to a silence is performed on a frame of M packets before the discarded packet. Packet processing method.
ことを特徴とする請求項5又は請求項6に記載のリアルタイムパケット処理方法。The receiving device, based on the sequence number included in the packet, when the sequence number becomes discontinuous, claim 5 or claim, characterized in that determines that the frame is discontinuous 6 The real-time packet processing method described in 1.
ことを特徴とする請求項5又は請求項6に記載のリアルタイムパケット処理方法。7. The real-time packet processing method according to claim 5 , wherein the receiving device reproduces audio by superimposing the frame subjected to the fade-out process and the frame subjected to the fade-in process. 8.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003200000A JP3977784B2 (en) | 2003-07-22 | 2003-07-22 | Real-time packet processing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003200000A JP3977784B2 (en) | 2003-07-22 | 2003-07-22 | Real-time packet processing apparatus and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005043423A JP2005043423A (en) | 2005-02-17 |
JP3977784B2 true JP3977784B2 (en) | 2007-09-19 |
Family
ID=34260583
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003200000A Expired - Lifetime JP3977784B2 (en) | 2003-07-22 | 2003-07-22 | Real-time packet processing apparatus and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3977784B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102006030977A1 (en) * | 2006-07-03 | 2008-02-07 | Deutsche Thomson-Brandt Gmbh | Data transmission method and apparatus for carrying out the method |
JP5056049B2 (en) * | 2007-02-16 | 2012-10-24 | 日本電気株式会社 | Audio data decoding device |
JP4629126B2 (en) * | 2008-05-08 | 2011-02-09 | 三菱電機株式会社 | Message relay device |
US20110196673A1 (en) * | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
JP2016126037A (en) * | 2014-12-26 | 2016-07-11 | ソニー株式会社 | Signal processing device, signal processing method, and program |
-
2003
- 2003-07-22 JP JP2003200000A patent/JP3977784B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005043423A (en) | 2005-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7453897B2 (en) | Network media playout | |
JP4367657B2 (en) | Voice communication method and apparatus | |
US8208460B2 (en) | Method and system for in-band signaling of multiple media streams | |
US20070140510A1 (en) | Method and apparatus for remote real time collaborative acoustic performance and recording thereof | |
US20060083163A1 (en) | Method and apparatus to adaptively manage end-to-end voice over Internet protocol (VoIP) media latency | |
CN108111997A (en) | Bluetooth equipment audio synchronization method and system | |
US20100280832A1 (en) | Packet Generator | |
US8514945B2 (en) | IP stream tramsmitting/receiving system, IP stream receiving device and receiving process timing synchronization method used for the same | |
JP3977784B2 (en) | Real-time packet processing apparatus and method | |
JPWO2009008220A1 (en) | Voice packet receiving apparatus, voice packet receiving method, and program | |
JP4042396B2 (en) | Data communication system, data transmission apparatus, data reception apparatus and method, and computer program | |
JP2004159101A (en) | Data transmission method, data transmitter, data receiver, and data transmission system | |
JP4218456B2 (en) | Call device, call method, and call system | |
US7894486B2 (en) | Method for depacketization of multimedia packet data | |
US6525253B1 (en) | Transmission of musical tone information | |
JP3906678B2 (en) | Data communication system, data transmission apparatus, data reception apparatus and method, and computer program | |
JP4454255B2 (en) | Voice / fax communication system, voice / fax receiver, and fluctuation absorbing buffer amount control method | |
JP4050961B2 (en) | Packet-type voice communication terminal | |
JP2005045739A (en) | Apparatus, method and system for telephone conversation | |
KR100875936B1 (en) | Method and apparatus for matching variable-band multicodec voice quality measurement interval | |
KR100632509B1 (en) | Audio and video synchronization of video player | |
KR100939128B1 (en) | Apparatus and method for performing video communication | |
JP4911579B2 (en) | Terminal, program and method for storing or playing back stream for analysis | |
JP4820877B2 (en) | Information data receiving apparatus, information data receiving method, information data receiving program, and recording medium storing information data receiving program | |
JP2006279809A (en) | Apparatus and method for voice reproducing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070502 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070619 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070621 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100629 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3977784 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100629 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110629 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120629 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130629 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140629 Year of fee payment: 7 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |