JP2007318283A - Packet communication system, data receiver - Google Patents
Packet communication system, data receiver Download PDFInfo
- Publication number
- JP2007318283A JP2007318283A JP2006143706A JP2006143706A JP2007318283A JP 2007318283 A JP2007318283 A JP 2007318283A JP 2006143706 A JP2006143706 A JP 2006143706A JP 2006143706 A JP2006143706 A JP 2006143706A JP 2007318283 A JP2007318283 A JP 2007318283A
- Authority
- JP
- Japan
- Prior art keywords
- packet
- video
- audio
- amount
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
本発明は、パケット通信システム、及びデータ受信機器に関する。 The present invention relates to a packet communication system and a data receiving device.
通信回線を通じて映像および音声を送受信するシステム、たとえばTV会議システムにおいて、話者の口の動きとスピーカから再生される声を同期させることは通話の違和感を無くすために重要であり、映像と音声とを同期させる、いわゆるリップシンク調整が行われている。 In a system that transmits and receives video and audio over a communication line, such as a TV conference system, it is important to synchronize the movement of the speaker's mouth and the voice reproduced from the speaker in order to eliminate the uncomfortable feeling of the call. So-called lip sync adjustment is performed.
例えば、映像信号の遅延量を検出し、遅延量に合わせて音声信号の遅延量を変化させることにより、画質や画像の変化に対して常に映像と音声の出力タイミングを合わせる方法が提案されている(例えば、特許文献1参照)。 For example, a method has been proposed in which the output timing of video and audio is always matched to changes in image quality and images by detecting the delay amount of the video signal and changing the delay amount of the audio signal in accordance with the delay amount. (For example, refer to Patent Document 1).
また、例えば、映像信号と音声信号にそれぞれ同時刻にタイミング信号を記録して別々の回線で送信し、受信側で受信した映像信号に記録されたタイミング信号と同時刻に記録されたタイミング信号を持つ音声信号を映像信号に合わせて再生する方法が提案されている(例えば、特許文献2参照)。 Also, for example, the timing signal recorded at the same time as the timing signal recorded on the video signal received on the receiving side is recorded on the video signal and the audio signal at the same time and transmitted on separate lines. There has been proposed a method of reproducing an audio signal possessed by a video signal (for example, see Patent Document 2).
しかしながら、特許文献1、特許文献2では音声信号を映像信号に合わせて再生するので、音声信号が映像信号に対し遅れると音が途切れ、聞き苦しい再生になるという課題があった。 However, in Patent Documents 1 and 2, since the audio signal is reproduced in accordance with the video signal, there is a problem that if the audio signal is delayed with respect to the video signal, the sound is interrupted and the reproduction is difficult to hear.
このような課題に対応するため、それぞれ同時期に発生した映像信号と音声信号に、同じ一意なマークを付与してパケット化して送信し、受信側で音声パケットより遅れた映像パケットを廃棄することにより、音声の品質を保ちながら音声と映像を同期させて再生する方法が提案されている(例えば、特許文献3参照)。
しかしながら、特許文献3の方法では音声パケットが映像パケットより遅れた場合、音声パケットの再生を優先するので、音声は再生されるが映像が全く再生されないという課題がある。 However, in the method of Patent Document 3, when the audio packet is delayed from the video packet, priority is given to the reproduction of the audio packet, so that the audio is reproduced but the video is not reproduced at all.
本発明は、上記課題に鑑みてなされたものであって、音声パケットが映像パケットより遅れた場合でも、音声の品質を保ちながら映像を音声と同期させて再生可能なパケット通信システム、及びデータ受信機器を提供することを課題とする。 The present invention has been made in view of the above problems, and a packet communication system capable of reproducing video in synchronization with audio while maintaining the quality of the audio even when the audio packet is delayed from the video packet, and data reception It is an object to provide a device.
1.
映像信号をパケット化して映像パケットにする映像パケットエンコーダと、
音声信号をパケット化して音声パケットにする音声パケットエンコーダと、
映像パケットと音声パケットに時刻情報を付与するタイムスタンプ付与部と、
前記時刻情報を付与された映像パケットと音声パケットを順次送信する送信部と、を備えたデータ送信機器と、
伝送回線を介して送信された前記映像パケットと前記音声パケットを受信する受信部と、
前記受信部が受信した前記映像パケットを順次蓄積する映像ジッタバッファと、
前記受信部が受信した前記音声パケットを順次蓄積する音声ジッタバッファと、
前記映像パケットをデコードして再生する映像パケットデコーダと、
前記音声パケットをデコードして再生する音声パケットデコーダと、
前記時刻情報を検出する時刻情報検出手段と、
前記時刻情報検出手段が検出した前記時刻情報に基づいて、前記映像パケットデコーダと、前記音声パケットデコーダに再生を指令する再生制御手段と、を備えたデータ受信機器と、
を有するパケット通信システムにおいて、
前記データ受信機器は、
前記映像ジッタバッファに蓄積された映像パケットの量を検出する蓄積量検出手段と、
前記音声パケットデコーダで再生する音声パケットの情報量を算出する情報量算出手段と、
前記情報量算出手段が算出した情報量を判定する情報量判定手段とを有し、
前記再生制御手段は、
前記蓄積量検出手段の検出した映像パケットの量に応じて、前記情報量判定手段が所定値以下の情報量であると判定した音声パケットに関しその再生時間を変更することを特徴とするパケット通信システム。
1.
A video packet encoder that packetizes video signals into video packets;
A voice packet encoder that packetizes voice signals into voice packets;
A time stamp giving unit for giving time information to video packets and audio packets;
A data transmission device comprising: a transmission unit that sequentially transmits the video packet and the audio packet to which the time information is attached;
A receiving unit for receiving the video packet and the audio packet transmitted via a transmission line;
A video jitter buffer for sequentially storing the video packets received by the receiver;
A voice jitter buffer for sequentially storing the voice packets received by the receiver;
A video packet decoder for decoding and reproducing the video packet;
An audio packet decoder for decoding and reproducing the audio packet;
Time information detecting means for detecting the time information;
Based on the time information detected by the time information detection means, a data receiving device comprising the video packet decoder, and a reproduction control means for instructing the audio packet decoder to reproduce,
In a packet communication system having
The data receiving device is:
Accumulated amount detecting means for detecting the amount of image packets accumulated in the image jitter buffer;
An information amount calculating means for calculating an information amount of an audio packet to be reproduced by the audio packet decoder;
An information amount determination means for determining the information amount calculated by the information amount calculation means;
The reproduction control means includes
A packet communication system characterized in that, according to the amount of video packets detected by the accumulated amount detection means, the reproduction time of the audio packet determined by the information amount determination means to be an information amount equal to or less than a predetermined value is changed. .
2.
前記再生制御手段は、
前記蓄積量検出手段が検出した映像パケットの量が所定値以上のとき、
前記情報量判定手段が所定値以下の情報量であると判定した音声パケットの再生を行わず、情報量が所定値以上の音声パケットを順次再生することを特徴とする1に記載のパケット通信システム。
2.
The reproduction control means includes
When the amount of video packets detected by the accumulated amount detection means is a predetermined value or more,
2. The packet communication system according to 1, wherein voice packets whose information amount is equal to or greater than a predetermined value are sequentially reproduced without reproducing the voice packet determined by the information amount determination means as being an information amount equal to or smaller than a predetermined value. .
3.
前記再生制御手段は、
再生する音声パケットより古い時刻情報を有する前記映像ジッタバッファに蓄積された映像パケットを、廃棄することを特徴とする2に記載のパケット通信システム。
3.
The reproduction control means includes
3. The packet communication system according to 2, wherein a video packet stored in the video jitter buffer having time information older than an audio packet to be reproduced is discarded.
4.
前記再生制御手段は、
前記蓄積量検出手段が検出した映像パケットの量が所定値以下のとき、
前記情報量判定手段が所定値以下の情報量であると判定した音声パケットの再生を前記映像パケットの量に応じて繰り返した後、次の音声パケットを順次再生することを特徴とする1に記載のパケット通信システム。
4).
The reproduction control means includes
When the amount of video packets detected by the accumulated amount detection means is below a predetermined value,
2. The reproduction of audio packets determined by the information amount determination means to be an information amount of a predetermined value or less is repeated according to the amount of video packets, and then the next audio packets are sequentially reproduced. Packet communication system.
5.
前記情報量算出手段は、前記音声信号の平均値に基づいて前記情報量を算出することを特徴とする1乃至4の何れか1項に記載のパケット通信システム。
5).
The packet communication system according to any one of claims 1 to 4, wherein the information amount calculation means calculates the information amount based on an average value of the audio signal.
6.
前記情報量算出手段は、前記音声信号の各周波数成分を算出し、前回までに算出した音声パケットの各周波数成分の値との加算平均値と、今回算出した各周波数成分の値との差分に基づいて前記情報量を算出することを特徴とする1乃至4の何れか1項に記載のパケット通信システム。
6).
The information amount calculation means calculates each frequency component of the audio signal, and calculates the difference between the addition average value of each frequency component value of the audio packet calculated up to the previous time and the value of each frequency component calculated this time. The packet communication system according to any one of 1 to 4, wherein the information amount is calculated based on the information.
7.
映像パケットと音声パケットを受信する受信部と、
前記受信部が受信した前記映像パケットを順次蓄積する映像ジッタバッファと、
前記受信部が受信した前記音声パケットを順次蓄積する音声ジッタバッファと、
前記映像パケットをデコードして再生する映像パケットデコーダと、
前記音声パケットをデコードして再生する音声パケットデコーダと、
前記映像パケットと前記音声パケットに付与された時刻情報を検出する時刻情報検出手段と、
前記時刻情報検出手段が検出した前記時刻情報に基づいて、前記映像パケットデコーダと、前記音声パケットデコーダに再生を指令する再生制御手段と、を備えたデータ受信機器において、
前記データ受信機器は、
前記映像ジッタバッファに蓄積された映像パケットの量を検出する蓄積量検出手段と、
前記音声パケットデコーダで再生する音声パケットの情報量を算出する情報量算出手段と、
前記情報量算出手段が算出した情報量を判定する情報量判定手段とを有し、
前記再生制御手段は、
前記蓄積量検出手段の検出した映像パケットの量に応じて、前記情報量判定手段が所定値以下の情報量であると判定した音声パケットに関しその再生時間を変更することを特徴とするデータ受信機器。
7).
A receiver for receiving video packets and audio packets;
A video jitter buffer for sequentially storing the video packets received by the receiver;
A voice jitter buffer for sequentially storing the voice packets received by the receiver;
A video packet decoder for decoding and reproducing the video packet;
An audio packet decoder for decoding and reproducing the audio packet;
Time information detecting means for detecting time information attached to the video packet and the audio packet;
In a data receiving device comprising: the video packet decoder based on the time information detected by the time information detection means; and a reproduction control means for instructing the audio packet decoder to reproduce,
The data receiving device is:
Accumulated amount detecting means for detecting the amount of image packets accumulated in the image jitter buffer;
An information amount calculating means for calculating an information amount of an audio packet to be reproduced by the audio packet decoder;
An information amount determination means for determining the information amount calculated by the information amount calculation means;
The reproduction control means includes
A data receiving device characterized in that, according to the amount of video packets detected by the accumulated amount detecting means, the reproduction time of the audio packet determined by the information amount determining means to be an information amount equal to or less than a predetermined value is changed. .
8.
前記再生制御手段は、
前記蓄積量検出手段が検出した映像パケットの量が所定値以上のとき、
前記情報量判定手段が所定値以下の情報量であると判定した音声パケットの再生を行わず、情報量が所定値以上の音声パケットを順次再生することを特徴とする7に記載のデータ受信機器。
8).
The reproduction control means includes
When the amount of video packets detected by the accumulated amount detection means is a predetermined value or more,
8. The data receiving apparatus according to claim 7, wherein the information packet determining unit sequentially reproduces the voice packets having the information amount equal to or greater than the predetermined value without reproducing the voice packets determined to be the information amount equal to or smaller than the predetermined value. .
9.
前記再生制御手段は、
再生する音声パケットより古い時刻情報を有する前記映像ジッタバッファに蓄積された映像パケットを、廃棄することを特徴とする8に記載のデータ受信機器。
9.
The reproduction control means includes
9. The data receiving apparatus according to 8, wherein the video packet stored in the video jitter buffer having time information older than the audio packet to be reproduced is discarded.
10.
前記再生制御手段は、
前記蓄積量検出手段が検出した映像パケットの量が所定値以下のとき、
前記情報量判定手段が所定値以下の情報量であると判定した音声パケットの再生を前記映像パケットの量に応じて繰り返した後、次の音声パケットを順次再生することを特徴とする7に記載のデータ受信機器。
10.
The reproduction control means includes
When the amount of video packets detected by the accumulated amount detection means is below a predetermined value,
8. The reproduction of an audio packet determined by the information amount determination unit to be an information amount equal to or less than a predetermined value is repeated according to the amount of the video packet, and then the next audio packet is sequentially reproduced. Data receiving equipment.
11.
前記情報量算出手段は、音声信号の平均値に基づいて前記情報量を算出することを特徴とする7乃至10の何れか1項に記載のデータ受信機器。
11.
11. The data receiving device according to claim 7, wherein the information amount calculation unit calculates the information amount based on an average value of an audio signal.
12.
前記情報量算出手段は、前記音声信号の各周波数成分を算出し、前回までに算出した音声パケットの各周波数成分の値との加算平均値と、今回算出した各周波数成分の値との差分に基づいて前記情報量を算出することを特徴とする7乃至10の何れか1項に記載のデータ受信機器。
12
The information amount calculation means calculates each frequency component of the audio signal, and calculates the difference between the addition average value of each frequency component value of the audio packet calculated up to the previous time and the value of each frequency component calculated this time. 11. The data receiving device according to any one of 7 to 10, wherein the information amount is calculated based on the information amount.
本発明によれば、音声パケットと映像パケットの遅延時間の差を、情報量の少ない音声パケットの再生時間を変更することにより調整するので、音声パケットが映像パケットより遅れた場合でも、音声の品質を保ちながら映像を音声と同期させて再生可能なパケット通信システム、及びデータ受信機器を提供することができる。 According to the present invention, the difference between the delay times of the audio packet and the video packet is adjusted by changing the playback time of the audio packet with a small amount of information. Therefore, even if the audio packet is delayed from the video packet, the audio quality Thus, it is possible to provide a packet communication system and a data receiving device that can reproduce video while synchronizing with audio while maintaining video.
以下、実施形態により本発明を詳しく説明するが、本発明はこれに限定されるものではない。 Hereinafter, the present invention will be described in detail with reference to embodiments, but the present invention is not limited thereto.
図1は本発明におけるパケット通信システムの一例を示すブロック図である。 FIG. 1 is a block diagram showing an example of a packet communication system according to the present invention.
図1(a)は全体構成を示すブロック図、図1(b)はメインマイコン部713の詳細なブロック図である。
FIG. 1A is a block diagram showing the overall configuration, and FIG. 1B is a detailed block diagram of the
図1(a)のデータ送信装置701とデータ受信装置702は伝送回線717に接続されている。データ送信装置701は入力された映像と音声を音声パケットと映像パケットにエンコードして伝送回線717に送信し、伝送回線717を介して音声パケットと映像パケットを受信したデータ受信装置702は映像と音声を再生する。
A
データ送信装置701は、音声入力部703、音声パケットエンコーダ704、映像パケットエンコーダ705、映像入力部706、タイムスタンプ付与部707、送信部708から構成される。
The
音声入力部703から入力された音声信号は音声パケットエンコーダ704でパケット化され、音声パケットになる。また、映像入力部706から入力された映像信号は映像パケットエンコーダ705でパケット化され、映像パケットになる。音声パケットと映像パケットは、次にタイムスタンプ付与部707に入力され、タイムスタンプ付与部707は入力された時刻の時刻情報をタイムスタンプとして音声パケットと映像パケットに記録する。送信部708はタイムスタンプを付与された音声パケットと映像パケットを伝送回線717に送信する。
The voice signal input from the
伝送回線717は有線ネットワーク、又は、無線ネットワークであり、インターネット、イントラネットの何れでも良い。また、映像パケットと音声パケットの伝送回線717内の伝送経路は同じ経路に限定されるものではなく、別々の経路でデータ受信装置702に送信されて良い。
The
データ受信装置702は、音声出力部709、音声パケットデコーダ部710、映像パケットデコーダ部711、映像出力部712、メインマイコン部713、受信部714、映像ジッタバッファ715、音声ジッタバッファ716から構成されている。
The
受信部714で伝送回線717を介して受信した音声パケットと映像パケットは、それぞれ音声ジッタバッファ716と映像ジッタバッファ715に順次記憶される。音声ジッタバッファ716と映像ジッタバッファ715は、伝送回線717を介して受信する音声パケットと映像パケットの到着時間のバラツキを補正するために設けられたバッファメモリであり、受信した音声パケットと映像パケットは、音声ジッタバッファ716と映像ジッタバッファ715にそれぞれ一旦蓄えられる。
Audio packets and video packets received by the receiving
音声パケットデコーダ部710、映像パケットデコーダ部711は、それぞれパケット化された音声パケットと映像パケットをデコードし、デコードした音声信号と映像信号を再生し、それぞれ音声出力部709、映像出力部712から出力する。
The audio
次に、図1(b)を用いてメインマイコン部713について説明する。
Next, the
メインマイコン部713は、マイクロコンピュータを備えて構成される。すなわち、メインマイコン部713は、各種演算処理を行うCPU(Central Processing Unit)20と、演算を行うための作業領域となるRAM21と、制御プログラム等が記憶されるROM22とを備え、データ受信装置702の各処理部の動作を統括的に制御する。不揮発性メモリであるROM22としては、例えば、データの電気的な書き換えが可能なEEPROMが採用される。
The
本実施形態のCPU20は、時刻情報検出部10、再生制御部11、蓄積量検出部12、情報量算出部13、情報量判定部14を有している。時刻情報検出部10、再生制御部11、蓄積量検出部12、情報量算出部13、情報量判定部14は、本発明の時刻情報検出手段、再生制御手段、蓄積量検出手段、情報量算出手段、情報量判定手段である。
The
時刻情報検出部10は映像パケット、音声パケットのタイムスタンプから時刻情報を検出する。 The time information detection unit 10 detects time information from time stamps of video packets and audio packets.
再生制御部11は、時刻情報検出部10が検出した時刻情報に基づいて、映像パケットデコーダ711と、音声パケットデコーダ710にデコードと再生を指令する。
The
蓄積量検出部12は、映像ジッタバッファ715に蓄積された映像パケットの量を検出する。映像ジッタバッファ715には映像パケットが順に蓄積されるので、蓄積量検出部12は、映像ジッタバッファ715に蓄積された先頭の映像パケットのアドレスから映像ジッタバッファ715に蓄積された映像パケットの量を検出できる。
The accumulation
情報量算出部13は音声パケットの情報量を算出し、情報量判定部14は算出した情報量が所定値以下か、否か、判定する。情報量は、例えば音声信号のレベルであり、所定値は無音状態と判定できるレベルである。このように音声信号のレベルが低い場合は、情報量も低く重要な情報が含まれない、と考えられる。
The information
本実施形態では、データ送信装置701は、一例として、15fpsの動画の1コマ毎の静止画をパケット化して映像パケットとして送信し、20msec分の音声をパケット化して音声パケットにするものとする。また、タイムスタンプ付与部707は内蔵するクロックにより得た時刻情報を、映像パケットと音声パケットにタイムスタンプとして付与し、送信部708からデータ受信装置702に送信するものとして以下の処理を説明する。
In this embodiment, as an example, the
本実施形態のCPU20の処理について、具体的な例を説明する。
A specific example of the processing of the
再生制御部11は、受信した音声パケットが音声ジッタバッファ716に所定量蓄えられるまで再生を開始しない。例えば、再生制御部11は、蓄積量検出部12が検出した音声ジッタバッファ716に蓄積された音声パケットの量が、音声ジッタバッファ716の記憶容量の50%に達した時点から再生を開始する。
The
再生制御部11の再生制御は、時刻情報検出部10が検出した音声パケットのタイムスタンプに記されている時刻情報を基準にしている。再生制御部11は、再生しようとする音声パケットの時刻情報から、その音声の再生中に再生すべき映像パケットを映像ジッタバッファ715から検索して映像パケットデコーダ部711に送り、映像を再生する。
The reproduction control of the
例えば、これから再生しようとする音声パケットAのタイムスタンプがT1であるとすると、この音声の再生中に再生すべき映像パケットはT1+20msecの範囲のタイムスタンプを持つ映像パケットである。例えば、メインマイコン部713が映像ジッタバッファ715からT1+10msecのタイムスタンプを持つ映像パケットAを検索したとすると、再生制御部11は、音声パケットAの再生を開始してから10秒後に映像パケットデコーダ部711で映像パケットAの映像を再生するように制御する。このようにして、再生制御部11は音声と映像の同期処理を行う。
For example, if the time stamp of the audio packet A to be reproduced is T1, the video packet to be reproduced during the reproduction of the audio is a video packet having a time stamp in the range of T1 + 20 msec. For example, if the
ネットワークの伝搬遅延や、データ受信装置702のデータ処理時間の影響により、音声ジッタバッファ716、映像ジッタバッファ715がアンダーフローやオーバフローを起こす場合がある。図2を用いてこの現象について説明する。
The
図2はアンダーフロー、オーバフローを模式的に説明する説明図である。図2において715は映像ジッタバッファ715に蓄えられた映像パケットの状態、716は音声ジッタバッファ716に蓄えられた音声パケットの状態を模式的に表す図である。図2の715、716の外形はそれぞれ音声ジッタバッファ716、映像ジッタバッファ715の最大メモリ容量を表している。横軸はメモリアドレスであり、音声パケット、映像パケットは図2の左端のメモリアドレスから順にFIFO(First In First Out)で蓄積される。斜線部は音声パケット、映像パケットが音声ジッタバッファ716、映像ジッタバッファ715に蓄積されている部分を表している。したがって、図2の左側の矢印方向に蓄積された音声パケット、映像パケットほど「新しい」パケットであり、右側の矢印方向に蓄積された音声パケット、映像パケットほど「古い」パケットである。
FIG. 2 is an explanatory diagram for schematically explaining underflow and overflow. In FIG. 2, 715 is a diagram schematically illustrating the state of the video packet stored in the
図2(a)はオーバーフローの状態を説明する説明図である。 FIG. 2A is an explanatory diagram for explaining an overflow state.
図2(a)では音声ジッタバッファ716に蓄積された音声パケットより、映像ジッタバッファ715に映像パケットが多く蓄積されている状態を示している。矢印A1は次に再生する先頭の音声パケットを示している。一方、矢印A1で示す音声パケットの時刻情報に対応する映像パケットは、矢印V1で示す映像パケットであり、矢印V1より右側には映像ジッタバッファ715には再生されないまま古い映像パケットが残っている。
FIG. 2A shows a state in which more video packets are stored in the
このような現象は、例えば、映像パケットデコーダ部71の処理時間がタイムスタンプに記されている時間間隔より長くなった場合などであり、この場合処理が追いつかず映像ジッタバッファ715に映像パケットがどんどんたまっていくので、オーバーフローを生じる。
Such a phenomenon is, for example, when the processing time of the video packet decoder unit 71 is longer than the time interval described in the time stamp. In this case, the processing cannot catch up and video packets are steadily stored in the
図2(b)では映像ジッタバッファ715に蓄積された映像パケットより、音声ジッタバッファ716に蓄積された音声パケットが多く蓄積されている状態を示している。矢印A2は次に再生する先頭の音声パケットを示している。一方、矢印A2で示す音声パケットの時刻情報に対応する映像パケットは、矢印V2で示す先頭の映像パケットであり、映像ジッタバッファ715に蓄積されている映像パケットが少ない状態を示している。
FIG. 2B shows a state where more audio packets are stored in the
このような現象は、例えば、当初遅滞なく到達していた映像パケットが、ネットワークが混雑してきたため、パケット到達に遅延が生じた場合である。この場合、映像ジッタバッファ715に蓄積された映像パケットが枯渇し、再生すべき映像パケットがなくなる、という状況に陥る。
Such a phenomenon is, for example, the case where a video packet that has arrived without delay initially has a delay in reaching the packet because the network is congested. In this case, the video packets stored in the
このようなアンダーフロー、オーバーフローは、IPネットワーク経由でデータの送受信を行っているため避けられない現象である。また、エンコーダー、デコーダーの処理時間の個体差により発生する。 Such underflow and overflow are phenomena that cannot be avoided because data is transmitted and received via the IP network. It also occurs due to individual differences in the processing time of the encoder and decoder.
次に、本実施形態においてアンダーフロー、オーバーフローのおそれが発生したときの処理について説明する。 Next, processing when there is a possibility of underflow or overflow in the present embodiment will be described.
図3はメインマイコン部713による再生制御の流れを示すフローチャート処理である。
FIG. 3 is a flowchart process showing the flow of reproduction control by the
図3のフローチャートでは、受信した音声パケットの数が、例えば音声ジッタバッファ716の記憶容量の50%に達し、再生を開始してからの処理について説明する。
In the flowchart of FIG. 3, processing after the number of received voice packets reaches 50% of the storage capacity of the
S101:最も古い時刻情報を持つ音声パケットをデコードするステップである。 S101: Decoding a voice packet having the oldest time information.
再生制御部11は、時刻情報検出部10に指令して音声ジッタバッファ716に記憶されている最も古い時刻情報を有する音声パケットを検索し、検索した音声パケットを音声パケットデコーダ部710に送り、音声パケットデコーダ部710は該音声パケットをデコードして音声データにする。
The
S500:デコードした音声パケットの情報量を算出するステップである。 S500: This is a step of calculating the information amount of the decoded voice packet.
情報量算出部13は、デコードした音声パケットの情報量を算出するサブルーチンをコールし、音声パケットの情報量の値を得る。例えば会議中に発言が活発に行われているときは音声パケットの情報量が多く、発言が途切れてほぼ無音状態になったり、空調の音など背景音だけが聞こえる場合などは情報量が少ない。音声データから情報量算出するアルゴリズムについては後に詳しく説明する。
The information
S102:音声の再生を開始するステップである。 S102: This is a step of starting audio reproduction.
再生制御部11は、音声パケットデコーダ部710に指令し、デコードした音声データを再生して音声出力部709から出力する。
The
S103:再生中の音声と同期する映像パケットを検索するステップである。 S103: This is a step of searching for a video packet synchronized with the audio being reproduced.
例えば、音声パケットAの再生時間が20msec、タイムスタンプがT1であるとすると、この音声の再生中に再生すべき映像パケットはT1+20msecの範囲のタイムスタンプを持つ映像パケットである。再生制御部11は、時刻情報検出部10に指令して映像ジッタバッファ715でこの範囲のタイムスタンプを持つ映像パケットを検索する。
For example, if the reproduction time of the audio packet A is 20 msec and the time stamp is T1, the video packet to be reproduced during the reproduction of the audio is a video packet having a time stamp in the range of T1 + 20 msec. The
同期する映像パケットが無い場合、(ステップS103;No)、ステップS122に進む。 When there is no video packet to be synchronized (step S103; No), the process proceeds to step S122.
同期する映像パケットが無い場合は、映像ジッタバッファ715はアンダーフロー状態であるのでステップS122に進む。
If there is no video packet to be synchronized, the
同期する映像パケットがある場合、(ステップS103;Yes)、ステップS104に進む。 If there is a video packet to be synchronized (step S103; Yes), the process proceeds to step S104.
S104:映像パケットが映像ジッタバッファ715においてオーバーフローのおそれがあるか、否か判定するステップである。
S104: A step of determining whether or not there is a possibility that the video packet may overflow in the
蓄積量検出部12は、映像ジッタバッファ715に蓄積されている映像パケットの先頭アドレスを調べて、蓄積量を検出する。再生制御部11は、所定値と比較し映像ジッタバッファ715においてオーバーフローのおそれがあるか、否か判定する。例えば、所定値は70%であり、映像ジッタバッファ715に蓄積されている映像パケットが70%以上の場合、オーバーフローのおそれがある、と判定する。
The
オーバーフローのおそれが無い場合、(ステップS104;No)、ステップS105に進む。 If there is no risk of overflow (step S104; No), the process proceeds to step S105.
オーバーフローのおそれがある場合、(ステップS104;Yes)、ステップS108に進む。 If there is a possibility of overflow (step S104; Yes), the process proceeds to step S108.
S108:映像パケットを再生するステップである。 S108: This is a step of reproducing the video packet.
再生制御部11は、ステップS103で検索した映像パケットを、デコードし所定のタイミングで再生するよう映像パケットデコーダ部711に指令する。
The
S109:古い映像パケットを廃棄するステップである。 S109: This is a step of discarding old video packets.
再生制御部11は、映像ジッタバッファ715に蓄積されている映像パケットのうち現在再生中の音声パケットより古い映像パケットを廃棄する。オーバーフローのおそれがある場合は、映像の再生が遅れ古い映像パケットがどんどん蓄積していくので、再生されない古い映像パケットを廃棄する。
The
S110:音声の情報量は所定値以下か、否か、判定するステップである。 S110: A step of determining whether or not the amount of audio information is equal to or less than a predetermined value.
情報量判定部14は、ステップS500で算出した音声の情報量の値が所定値以下か、否か、判定する。所定値は例えば無音状態や背景音のみが聞こえている状態を判定する閾値であり、使用環境に応じて予め設定する。
The information
所定値以上の場合、(ステップS110;No)、ステップS112に進む。 If it is greater than or equal to the predetermined value (step S110; No), the process proceeds to step S112.
音声の再生を継続し、ステップS112に進む。 The audio reproduction is continued, and the process proceeds to step S112.
所定値以下の場合、(ステップS110;Yes)、ステップS111に進む。 If the value is equal to or smaller than the predetermined value (step S110; Yes), the process proceeds to step S111.
S111:音声再生を中止するステップである。 S111: This is a step of stopping audio reproduction.
再生制御部11は、音声パケットデコーダ部710に音声再生を中止するよう指令し、次のステップS112に進む。この場合、音声パケットの到着が遅れているので、音声の遅延が大きく、例えば会話を行うときの違和感が大きい。そのため、情報量の少ない、例えば無音状態や背景音のみが聞こえている音声パケットの再生を中止し、音声の遅延を減少させるようにしている。このようにすると、聞いている人にとって違和感が少なく、また重要な情報を聞き漏らすことなく、音声の遅延時間を短縮できる。
The
S105:映像パケットが映像ジッタバッファ715においてアンダーフローのおそれがあるか、否か判定するステップである。
S105: This is a step of determining whether or not the video packet is likely to underflow in the
蓄積量検出部12は、映像ジッタバッファ715に蓄積されている映像パケットの先頭アドレスを調べて、映像ジッタバッファ715に蓄積された映像パケットの蓄積量を検出する。再生制御部11は、所定値と比較しアンダーフローのおそれがあるか、否か判定する。例えば、所定値は30%であり、再生制御部11は、映像ジッタバッファ715に蓄積されている映像パケットが30%以下の場合はオーバーフローのおそれ有りと判定する。
The accumulation
アンダーフローのおそれが無い場合、(ステップS105;No)、ステップS130に進む。 When there is no possibility of underflow (step S105; No), the process proceeds to step S130.
アンダーフローのおそれがある場合、(ステップS105;Yes)、ステップS121に進む。 If there is a possibility of underflow (step S105; Yes), the process proceeds to step S121.
S130:映像パケットを再生するステップである。 S130: This is a step of reproducing a video packet.
再生制御部11は、ステップS103で検索した映像パケットを、デコードし所定のタイミングで再生するよう映像パケットデコーダ部711に指令する。次にステップS112に進む。
The
S121:映像パケットを再生するステップである。 S121: This is a step of reproducing a video packet.
再生制御部11は、ステップS103で検索した映像パケットを、デコードし所定のタイミングで再生するよう映像パケットデコーダ部711に指令する。
The
S122:音声の情報量は所定値以下か、否か、判定するステップである。 S122: This is a step of determining whether or not the amount of audio information is a predetermined value or less.
再生制御部11は、ステップS500で算出した音声データの情報量の値が所定値以下か、否か、判定する。所定値は例えば無音状態や背景音のみが聞こえている状態を判定する閾値であり、使用環境に応じて予め設定する。
The
所定値以上の場合、(ステップS122;No)、ステップS112に進む。 If it is equal to or greater than the predetermined value (step S122; No), the process proceeds to step S112.
音声の再生を継続し、ステップS112に進む。 The audio reproduction is continued, and the process proceeds to step S112.
所定値以下の場合、(ステップS122;Yes)、ステップS123に進む。 If it is equal to or smaller than the predetermined value (step S122; Yes), the process proceeds to step S123.
S123:音声を繰り返し再生するステップである。 S123: This is a step of repeatedly reproducing the sound.
再生制御部11は、ステップS122で所定量以下の情報量の音声データと判定された音声データを、映像パケットが映像ジッタバッファ715に所定量蓄積されるまで、音声パケットデコーダ710に繰り返し再生するように指令する。この場合、映像パケットの到着が音声パケットの到着より遅れているので、情報量の少ない、例えば無音状態や背景音のみが聞こえている音声パケットを繰り返して再生し、映像パケットが映像ジッタバッファ715に所定量蓄積されるまで待つ。メインマイコン部713は、映像パケットが映像ジッタバッファ715に所定量蓄積されたことを蓄積量検出部12が検出すると、ステップ112に進む。
The
S112:次の音声パケットがあるか、否か、判定するステップである。 S112: A step of determining whether or not there is a next voice packet.
再生制御部11は、音声ジッタバッファ716を検索し、次に再生する音声パケットを検索する。
The
音声パケットがある場合、(ステップS112;Yes)、ステップS101に戻る。 If there is a voice packet (step S112; Yes), the process returns to step S101.
ステップS101に戻り、次の音声パケットを再生する。 Returning to step S101, the next voice packet is reproduced.
音声パケットがない場合、(ステップS112;No)、終了する。 When there is no voice packet (step S112; No), the process ends.
このように、情報量の少ない、例えば無音状態や背景音のみが聞こえている音声パケットの再生を中止、または繰り返し再生することにより音声の実時間からの遅延時間を調整し、映像ジッタバッファ715に蓄積されている映像パケットの量を一定量にして音声と同期させる映像パケットを確保しているので、重要な音声情報が損なわれることが無く、通話者が再生された音声に違和感を感じることが少ないパケット通信システムを提供できる。
In this way, the delay time from the real time of the audio is adjusted by stopping or repeating the reproduction of the audio packet with a small amount of information, for example, the silent state or the background sound only heard, and the
次に、図4、図5を用いてステップS500で説明した音声の情報量を算出するルーチンについて説明する。 Next, the routine for calculating the amount of audio information described in step S500 will be described with reference to FIGS.
図4は本発明の音声の情報量算出ルーチンの第1の実施形態である。 FIG. 4 shows a first embodiment of the audio information amount calculation routine of the present invention.
S501:音声信号の平均信号レベルを算出する。 S501: The average signal level of the audio signal is calculated.
情報量算出部13は、音声パケットデコーダ710がデコードした音声データの平均信号レベルを算出し、この値を音声の情報量とする。
The information
例えば、音声データが12bitであり、完全な無音状態がデジタル値0だとする。ステップS500で算出した平均値がデジタル値80だったとすると、デジタル値80が音声の情報量の値である。例えばステップS110で判定する所定値が100だとすると、音声の情報量の値が80の場合は、無音状態と判定される。 For example, it is assumed that the audio data is 12 bits and the complete silence state is a digital value of 0. If the average value calculated in step S500 is a digital value 80, the digital value 80 is the value of the amount of audio information. For example, if the predetermined value determined in step S110 is 100, if the value of the audio information amount is 80, it is determined that there is no sound.
図5は本発明の音声の情報量算出ルーチンの第2の実施形態である。 FIG. 5 shows a second embodiment of the sound information amount calculation routine of the present invention.
S601:音声信号を周波数変換する。 S601: Frequency conversion of an audio signal is performed.
情報量算出部13は、音声パケットデコーダ710がデコードした音声データを周波数変換し、各周波数毎の信号レベルの値を求める。
The information
S602:前回までの値と加算平均する。 S602: Addition averaging with the previous value.
メインマイコン部713は、内蔵するメモリに記憶されている前回までの各周波数毎の信号レベルの値と今回の値に重み付けをして加算し、各周波数毎の平均値を求める。
The
このように毎回の周波数分布の加算平均を算出すると、常に同じ音を発生している、例えば空調の音などの背景音の周波数分布の平均値が算出される。 When the addition average of the frequency distribution of each time is calculated in this way, the average value of the frequency distribution of the background sound such as the air-conditioning sound that always generates the same sound is calculated.
S603:加算平均値と今回の値の差分を算出する。 S603: The difference between the addition average value and the current value is calculated.
情報量算出部13は、ステップS602で求めた各周波数毎の加算平均値と今回の値との差分を算出する。
The information
S604:周波数毎の差分の総和を算出する。 S604: The sum of the differences for each frequency is calculated.
情報量算出部13は、ステップS603で求めた各周波数毎の差分の総和を算出する。
The information
ステップS604で求めた総和の値を情報量とし、もとのルーチンに戻る。 The sum total obtained in step S604 is used as the information amount, and the process returns to the original routine.
例えば、情報量が低い無音状態が続いて居る場合は、このようにして算出した値は0であり、一方、会議などで複数の人が発言する場合は周波数分布が毎回異なることが多いので、得られた値は大きくなる。 For example, when there is a silent state with a low amount of information, the value calculated in this way is 0. On the other hand, when multiple people speak in a meeting or the like, the frequency distribution is often different each time. The value obtained is large.
以上このように、本発明によれば、音声パケットが映像パケットより遅れた場合でも、音声の品質を保ちながら映像を音声と同期させて再生可能なパケット通信システム、及びデータ受信機器を提供できる。 As described above, according to the present invention, it is possible to provide a packet communication system and a data receiving device capable of reproducing video in synchronization with audio while maintaining audio quality even when the audio packet is delayed from the video packet.
10 時刻情報検出部
11 再生制御部
12 蓄積量検出部
13 情報量算出部
14 情報量判定部
20 CPU
21 RAM
22 ROM
701 データ送信機器
713 メインマイコン部
702 データ受信機器
717 伝送回線
DESCRIPTION OF SYMBOLS 10 Time
21 RAM
22 ROM
701
Claims (12)
音声信号をパケット化して音声パケットにする音声パケットエンコーダと、
映像パケットと音声パケットに時刻情報を付与するタイムスタンプ付与部と、
前記時刻情報を付与された映像パケットと音声パケットを順次送信する送信部と、を備えたデータ送信機器と、
伝送回線を介して送信された前記映像パケットと前記音声パケットを受信する受信部と、
前記受信部が受信した前記映像パケットを順次蓄積する映像ジッタバッファと、
前記受信部が受信した前記音声パケットを順次蓄積する音声ジッタバッファと、
前記映像パケットをデコードして再生する映像パケットデコーダと、
前記音声パケットをデコードして再生する音声パケットデコーダと、
前記時刻情報を検出する時刻情報検出手段と、
前記時刻情報検出手段が検出した前記時刻情報に基づいて、前記映像パケットデコーダと、前記音声パケットデコーダに再生を指令する再生制御手段と、を備えたデータ受信機器と、
を有するパケット通信システムにおいて、
前記データ受信機器は、
前記映像ジッタバッファに蓄積された映像パケットの量を検出する蓄積量検出手段と、
前記音声パケットデコーダで再生する音声パケットの情報量を算出する情報量算出手段と、
前記情報量算出手段が算出した情報量を判定する情報量判定手段とを有し、
前記再生制御手段は、
前記蓄積量検出手段の検出した映像パケットの量に応じて、前記情報量判定手段が所定値以下の情報量であると判定した音声パケットに関しその再生時間を変更することを特徴とするパケット通信システム。 A video packet encoder that packetizes video signals into video packets;
A voice packet encoder that packetizes voice signals into voice packets;
A time stamp giving unit for giving time information to video packets and audio packets;
A data transmission device comprising: a transmission unit that sequentially transmits the video packet and the audio packet to which the time information is attached;
A receiving unit for receiving the video packet and the audio packet transmitted via a transmission line;
A video jitter buffer for sequentially storing the video packets received by the receiver;
A voice jitter buffer for sequentially storing the voice packets received by the receiver;
A video packet decoder for decoding and reproducing the video packet;
An audio packet decoder for decoding and reproducing the audio packet;
Time information detecting means for detecting the time information;
Based on the time information detected by the time information detection means, a data receiving device comprising the video packet decoder, and a reproduction control means for instructing the audio packet decoder to reproduce,
In a packet communication system having
The data receiving device is:
Accumulated amount detecting means for detecting the amount of image packets accumulated in the image jitter buffer;
An information amount calculating means for calculating an information amount of an audio packet to be reproduced by the audio packet decoder;
An information amount determination means for determining the information amount calculated by the information amount calculation means;
The reproduction control means includes
A packet communication system characterized in that, according to the amount of video packets detected by the accumulated amount detection means, the reproduction time of the audio packet determined by the information amount determination means to be an information amount equal to or less than a predetermined value is changed. .
前記蓄積量検出手段が検出した映像パケットの量が所定値以上のとき、
前記情報量判定手段が所定値以下の情報量であると判定した音声パケットの再生を行わず、情報量が所定値以上の音声パケットを順次再生することを特徴とする請求項1に記載のパケット通信システム。 The reproduction control means includes
When the amount of video packets detected by the accumulated amount detection means is a predetermined value or more,
2. The packet according to claim 1, wherein voice packets whose information amount is equal to or greater than a predetermined value are sequentially reproduced without reproducing the voice packets determined as having an information amount equal to or smaller than a predetermined value. Communications system.
再生する音声パケットより古い時刻情報を有する前記映像ジッタバッファに蓄積された映像パケットを、廃棄することを特徴とする請求項2に記載のパケット通信システム。 The reproduction control means includes
3. The packet communication system according to claim 2, wherein the video packet stored in the video jitter buffer having time information older than the audio packet to be reproduced is discarded.
前記蓄積量検出手段が検出した映像パケットの量が所定値以下のとき、
前記情報量判定手段が所定値以下の情報量であると判定した音声パケットの再生を前記映像パケットの量に応じて繰り返した後、次の音声パケットを順次再生することを特徴とする請求項1に記載のパケット通信システム。 The reproduction control means includes
When the amount of video packets detected by the accumulated amount detection means is below a predetermined value,
2. The audio packet determined by the information amount determination means to be an information amount equal to or less than a predetermined value is repeated according to the amount of the video packet, and then the next audio packet is sequentially reproduced. The packet communication system described in 1.
前記受信部が受信した前記映像パケットを順次蓄積する映像ジッタバッファと、
前記受信部が受信した前記音声パケットを順次蓄積する音声ジッタバッファと、
前記映像パケットをデコードして再生する映像パケットデコーダと、
前記音声パケットをデコードして再生する音声パケットデコーダと、
前記映像パケットと前記音声パケットに付与された時刻情報を検出する時刻情報検出手段と、
前記時刻情報検出手段が検出した前記時刻情報に基づいて、前記映像パケットデコーダと、前記音声パケットデコーダに再生を指令する再生制御手段と、を備えたデータ受信機器において、
前記データ受信機器は、
前記映像ジッタバッファに蓄積された映像パケットの量を検出する蓄積量検出手段と、
前記音声パケットデコーダで再生する音声パケットの情報量を算出する情報量算出手段と、
前記情報量算出手段が算出した情報量を判定する情報量判定手段とを有し、
前記再生制御手段は、
前記蓄積量検出手段の検出した映像パケットの量に応じて、前記情報量判定手段が所定値以下の情報量であると判定した音声パケットに関しその再生時間を変更することを特徴とするデータ受信機器。 A receiver for receiving video packets and audio packets;
A video jitter buffer for sequentially storing the video packets received by the receiver;
A voice jitter buffer for sequentially storing the voice packets received by the receiver;
A video packet decoder for decoding and reproducing the video packet;
An audio packet decoder for decoding and reproducing the audio packet;
Time information detecting means for detecting time information attached to the video packet and the audio packet;
In a data receiving device comprising: the video packet decoder based on the time information detected by the time information detection means; and a reproduction control means for instructing the audio packet decoder to reproduce,
The data receiving device is:
Accumulated amount detecting means for detecting the amount of image packets accumulated in the image jitter buffer;
An information amount calculating means for calculating an information amount of an audio packet to be reproduced by the audio packet decoder;
An information amount determination means for determining the information amount calculated by the information amount calculation means;
The reproduction control means includes
A data receiving device characterized in that, according to the amount of video packets detected by the accumulated amount detecting means, the reproduction time of the audio packet determined by the information amount determining means to be an information amount equal to or less than a predetermined value is changed. .
前記蓄積量検出手段が検出した映像パケットの量が所定値以上のとき、
前記情報量判定手段が所定値以下の情報量であると判定した音声パケットの再生を行わず、情報量が所定値以上の音声パケットを順次再生することを特徴とする請求項7に記載のデータ受信機器。 The reproduction control means includes
When the amount of video packets detected by the accumulated amount detection means is a predetermined value or more,
8. The data according to claim 7, wherein the voice packet whose information amount is equal to or greater than the predetermined value is sequentially reproduced without reproducing the voice packet determined as having the information amount equal to or smaller than the predetermined value. Receiver equipment.
再生する音声パケットより古い時刻情報を有する前記映像ジッタバッファに蓄積された映像パケットを、廃棄することを特徴とする請求項8に記載のデータ受信機器。 The reproduction control means includes
9. The data receiving apparatus according to claim 8, wherein the video packet stored in the video jitter buffer having time information older than the audio packet to be reproduced is discarded.
前記蓄積量検出手段が検出した映像パケットの量が所定値以下のとき、
前記情報量判定手段が所定値以下の情報量であると判定した音声パケットの再生を前記映像パケットの量に応じて繰り返した後、次の音声パケットを順次再生することを特徴とする請求項7に記載のデータ受信機器。 The reproduction control means includes
When the amount of video packets detected by the accumulated amount detection means is below a predetermined value,
8. The reproduction of audio packets determined by the information amount determination means to be an information amount of a predetermined value or less is repeated according to the amount of video packets, and then the next audio packets are sequentially reproduced. The data receiving device described in 1.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006143706A JP2007318283A (en) | 2006-05-24 | 2006-05-24 | Packet communication system, data receiver |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006143706A JP2007318283A (en) | 2006-05-24 | 2006-05-24 | Packet communication system, data receiver |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007318283A true JP2007318283A (en) | 2007-12-06 |
Family
ID=38851776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006143706A Pending JP2007318283A (en) | 2006-05-24 | 2006-05-24 | Packet communication system, data receiver |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007318283A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015156584A (en) * | 2014-02-20 | 2015-08-27 | 富士通株式会社 | Moving image sound synchronization apparatus, moving image sound synchronization method, and computer program for moving image sound synchronization |
JP2018515979A (en) * | 2015-08-05 | 2018-06-14 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | Communication processing method and electronic apparatus |
-
2006
- 2006-05-24 JP JP2006143706A patent/JP2007318283A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015156584A (en) * | 2014-02-20 | 2015-08-27 | 富士通株式会社 | Moving image sound synchronization apparatus, moving image sound synchronization method, and computer program for moving image sound synchronization |
JP2018515979A (en) * | 2015-08-05 | 2018-06-14 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | Communication processing method and electronic apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10147415B2 (en) | Artificially generated speech for a communication session | |
US8279884B1 (en) | Integrated adaptive jitter buffer | |
JP5957760B2 (en) | Video / audio processor | |
JP5026167B2 (en) | Stream transmission server and stream transmission system | |
RU2423009C1 (en) | Method and device to measure synchronisation of talk spurts reproduction within sentence without impact at audibility | |
JP4782973B2 (en) | Audio and video signal synchronization | |
JP4475650B2 (en) | Method and system for resynchronizing a drifted data stream with minimal perceptible artifacts | |
CN107113283B (en) | Method for handling problematic patterns in a low-latency multimedia streaming environment | |
JP2009076952A (en) | Tv conference apparatus and method | |
JP4076981B2 (en) | Communication terminal apparatus and buffer control method | |
JP2007318283A (en) | Packet communication system, data receiver | |
JP2004214755A (en) | Dynamic coding rate revision method and apparatus thereof | |
JP2002271391A (en) | Dynamic jitter buffer control method | |
JP3833490B2 (en) | Apparatus and method for absorbing delay jitter generated in data transmission | |
JP2008092161A (en) | Communication terminal, multimedia reproduction control method, and program | |
BR112020000807A2 (en) | receiving and transmitting units, receiving and transmitting methods, and, program. | |
KR102422794B1 (en) | Playout delay adjustment method and apparatus and time scale modification method and apparatus | |
JP4050961B2 (en) | Packet-type voice communication terminal | |
JP2011087074A (en) | Output controller of remote conversation system, method thereof, and computer executable program | |
JP2005005825A (en) | Voice/fax communication system, voice/fax receiving apparatus, and fluctuation absorption buffer amount control method | |
JP7576991B2 (en) | Data transmission/reception device and program equipped in robot | |
JP4667811B2 (en) | Voice communication apparatus and voice communication method | |
JP2007312265A (en) | Voice packet communication system and speech reproducer | |
JP2005064873A (en) | Jitter buffer control method, and ip telephone set | |
JP4820877B2 (en) | Information data receiving apparatus, information data receiving method, information data receiving program, and recording medium storing information data receiving program |