JP7576991B2 - Data transmission/reception device and program equipped in robot - Google Patents
Data transmission/reception device and program equipped in robot Download PDFInfo
- Publication number
- JP7576991B2 JP7576991B2 JP2021016019A JP2021016019A JP7576991B2 JP 7576991 B2 JP7576991 B2 JP 7576991B2 JP 2021016019 A JP2021016019 A JP 2021016019A JP 2021016019 A JP2021016019 A JP 2021016019A JP 7576991 B2 JP7576991 B2 JP 7576991B2
- Authority
- JP
- Japan
- Prior art keywords
- data transmission
- reception device
- transmission
- time information
- reception
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005540 biological transmission Effects 0.000 title claims description 565
- 238000012545 processing Methods 0.000 claims description 145
- 238000000034 method Methods 0.000 claims description 53
- 230000008569 process Effects 0.000 claims description 51
- 238000012546 transfer Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 230000001934 delay Effects 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 101150012579 ADSL gene Proteins 0.000 description 2
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 2
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 208000025721 COVID-19 Diseases 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Landscapes
- Computer And Data Communications (AREA)
Description
本発明は、発話を行うロボットに備えたデータ送受信装置及びプログラムに関する。 The present invention relates to a data transmission/reception device and program for a robot that can speak.
従来、人と一緒にテレビを視聴するテレビ視聴ロボットが知られている(例えば、非特許文献1を参照)。このテレビ視聴ロボットは、周辺のテレビ及び人を検出し、番組に関連する発話文を生成して発話する。これにより、人は、テレビ視聴ロボットの発話を聞くことで、一人でテレビを視聴している場合であっても、複数人で視聴しているかのようにテレビ視聴を楽しむことができる。 Conventionally, a television-watching robot that watches television together with a person is known (see, for example, Non-Patent Document 1). This television-watching robot detects nearby televisions and people, and generates and speaks utterances related to the program. In this way, by listening to the television-watching robot's utterances, a person can enjoy watching television as if they were watching with multiple people, even if they are watching alone.
また、テレビ視聴ロボット(以下、「ロボット」という。)の発話に伴い、人同士の会話の活性化効果及びテレビ視聴への影響等を検証するためのロボット開発が進められている(例えば、非特許文献2を参照)。これは、「人が2人及びロボットが1体」の組み合わせでテレビを視聴している状態において、ロボットが番組に関連するキーワードを発話することで、検証を行うものである。 In addition, a television viewing robot (hereafter referred to as "robot") is being developed to verify the effect of speech on stimulating conversations between people and the impact on television viewing (see, for example, Non-Patent Document 2). This verification is carried out by having the robot speak keywords related to the program while watching television with a combination of "two people and one robot."
一方、新型コロナウイルス感染症の流行による外出自粛及びソーシャルディスタンスをとること等が新しい生活習慣として定着するに連れて、友人または知人等の複数の人がテレビを一緒に視聴する機会が減る傾向にあることが予想される。このため、前述の非特許文献2のロボット開発においては、「人が2人及びロボットが1体」の組み合わせの機会が減ることを考慮する必要がある。
On the other hand, as the COVID-19 pandemic leads people to refrain from going out and maintain social distance, it is expected that there will be fewer opportunities for multiple people, such as friends or acquaintances, to watch television together. For this reason, in developing the robot described in Non-Patent
また、新しい生活習慣では、人同士のコミュニケーション手段として、Zoom(登録商標)等のインターネットを介したリモート会議ツールが急速に普及している。 In addition, as part of our new lifestyle habits, internet-based remote conferencing tools such as Zoom (registered trademark) are rapidly becoming popular as a means of communication between people.
これらを考慮すると、「人が1人及びロボットが1体」の組み合わせと別の「人が1人及びロボットが1体」の組み合わせとのペアにおいて、人同士がインターネットを介して会話する環境形態を想定することができる。 Taking these factors into consideration, we can imagine an environment in which people communicate with each other over the Internet in pairs of "one human and one robot" and "one human and one robot."
具体的には、離れた場所にいる2つの組み合わせのペアにおいて、同じテレビ番組または動画を視聴しながら会話を楽しみ、さらに、ロボットが視聴中の番組内容等に関連する発話を行うことで、人同士の会話をさらに弾ませる状態を想定することができる。 Specifically, it is possible to imagine a situation in which two pairs of people in different locations enjoy a conversation while watching the same television program or video, and the robot makes utterances related to the content of the program being watched, further encouraging conversation between the people.
前述の非特許文献2には、ロボットに視聴中の番組内容に関する発話を行わせる手段が記載されている。この発話手段は、Microsoft Azure(AZURE(登録商標))またはAmazon Web Services(アマゾンウェブサービス(登録商標))等のクラウドサービスを用いて、視聴中の番組の映像に関するキャプション生成、有名人検索及び画像ラベル検出を並列に行う。そして、発話手段は、これらの結果に基づいて、予め用意したキーワード辞書に含まれる単語をキーワードとして出力する。
The aforementioned
すなわち、ロボットからクラウドサービスへの上り回線には映像が送信され、クラウドサービスからロボットへの下り回線にはキャプション、有名人名及び画像ラベル等のテキスト情報(映像に関連するキーワード)が送信される。この場合、上り回線のトラフィック量は大きく、下り回線のトラフィックは小さいという特徴がある。 That is, video is transmitted on the upstream line from the robot to the cloud service, and text information such as captions, celebrity names, and image labels (keywords related to the video) is transmitted on the downstream line from the cloud service to the robot. In this case, the traffic volume on the upstream line is large, while the traffic on the downstream line is small.
前述の「人が1人及びロボットが1体」の組み合わせと別の「人が1人及びロボットが1体」の組み合わせとのペアからなる環境形態においては、各組み合わせは、同じ番組または動画を視聴する。このため、各組み合わせのロボットは、上り回線を用いてクラウドサービスに対し、同じ映像ファイルを送信する。これでは、クラウドサービスにかかるコストの観点から、無駄が生じることとなる。 In an environment consisting of a pair of the aforementioned combination of "one human and one robot" and another combination of "one human and one robot," each combination watches the same program or video. For this reason, the robots in each combination send the same video file to the cloud service using the upstream line. This creates waste in terms of the costs associated with the cloud service.
この問題を解決するために、一方のロボットが、映像ファイルをクラウドサービスへ送信してテキスト情報を受信し、受信したテキスト情報を他方のロボットへ送信する手法が想定される。これにより、クラウドサービスにかかるコストを半減することができる。 To solve this problem, one robot could send a video file to a cloud service, receive text information, and then send the received text information to the other robot. This could halve the cost of cloud services.
しかしながら、一方のロボットのインターネット接続環境と、他方のロボットのインターネット接続環境とが異なる場合には、両ロボット間でテキスト情報の共有が遅れ、視聴中の映像とロボットの発話内容とがずれてしまう可能性がある。 However, if the Internet connection environment of one robot is different from that of the other robot, there may be a delay in sharing text information between the two robots, which could result in a mismatch between the video being viewed and what the robot is saying.
例えば、一方のロボットが、映像ファイルをクラウドサービスへ送信してテキスト情報を受信し、テキスト情報を他方のロボットへ送信する状況において、一方のロボットに接続されたインターネットサービスプロバイダ等で輻輳が生じた場合を想定する。 For example, consider a situation in which one robot sends a video file to a cloud service, receives text information, and then sends the text information to another robot, and congestion occurs at an Internet service provider connected to one of the robots.
この場合、一方のロボットから送信された映像ファイルのクラウドサービスへの到着が遅れてしまい、一方のロボットによるテキスト情報の受信が遅れ、他方のロボットによる一方のロボットからのテキスト情報の受信も遅れてしまう。結果として、両ロボット間でテキスト情報の共有が遅れ、ロボットの発話のタイミングが遅れてしまう。 In this case, the video file sent from one robot will arrive late at the cloud service, which will cause a delay in the receipt of text information by one robot, and a delay in the receipt of text information from the other robot by the other robot. As a result, the sharing of text information between the two robots will be delayed, causing a delay in the timing of the robot's speech.
このロボットの発話内容は、人が以前の時間に視聴した映像に関するものであるため、発話のタイミングが遅れれば遅れるほど、視聴中の映像に対して的はずれとなってしまい、人同士の会話の活性化効果が得られ難いという課題があった。 The content of the robot's speech is related to the video that the person has previously viewed, so the later the timing of the speech, the more irrelevant it becomes to the video being viewed, making it difficult to stimulate conversation between people.
そこで、本発明は前記課題を解決するためになされたものであり、その目的は、クラウドサービスにかかるコストを低減すると共に、ロボットの発話のタイミングの遅れを抑制可能なデータ送受信装置及びプログラムを提供することにある。 The present invention has been made to solve the above problems, and its purpose is to provide a data transmission/reception device and program that can reduce the cost of cloud services and suppress delays in the timing of a robot's speech.
前記課題を解決するために、請求項1のデータ送受信装置は、第1の場所に、第1のディスプレイに表示された映像を視聴する第1のユーザ、及び前記映像に関連するキーワードに基づいた発話を行う第1のロボットが存在し、前記第1の場所とは異なる第2の場所に、第2のディスプレイに表示された前記映像を視聴する第2のユーザ、及び前記映像に関連する前記キーワードに基づいた発話を行う第2のロボットが存在し、前記第1のユーザ及び前記第2のユーザが同一の前記キーワードに基づいた発話を聞いて会話を行う際の、前記第1のロボットに備えたデータ送受信装置と、前記第2のロボットに備えた遠隔データ送受信装置と、クラウドサーバとがインターネットを介して接続されるデータ送受信システムの下で、前記データ送受信装置及び前記遠隔データ送受信装置のそれぞれが、前記映像のデータファイルを映像ファイルとして取得し、前記映像ファイルを前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信する場合の前記データ送受信装置において、前記第1のユーザによる発声のデータファイルを第1の発声ファイルとして取得し、前記第1の発声ファイルを前記遠隔データ送受信装置へ送信し、前記遠隔データ送受信装置から、前記第2のユーザによる発声のデータファイルを第2の発声ファイルとして受信し、前記映像ファイルを前記クラウドサーバへ送信してから前記キーワードを受信するまでの間の、当該データ送受信装置における前記インターネットの混雑度合いを反映した時間情報Taを算出し、前記時間情報Taを前記遠隔データ送受信装置へ送信し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置における前記インターネットの混雑度合いを反映した時間情報Tbを受信し、前記時間情報Ta及び前記時間情報Tbに基づいて、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断した場合、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信する送受信処理部と、前記送受信処理部により受信された前記第2の発声ファイルを再生する発声再生部と、前記送受信処理部により受信された前記キーワードに基づいた発話文を再生する発話文再生部と、を備えたことを特徴とする。
In order to solve the above problem, the data transmission/reception device of
また、請求項2のデータ送受信装置は、請求項1に記載のデータ送受信装置において、前記送受信処理部が、前記時間情報Tbから前記時間情報Taを減算することで、時間情報Tを求め、前記時間情報Tの値が0よりも小さい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断し、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信する第1の処理を行い、前記時間情報Tの値が0よりも大きい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも低いと判断し、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信する第2の処理を行い、前記時間情報Tの値が0である場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置と同じであると判断し、前記第1の処理または前記第2の処理を行う、ことを特徴とする。
The data transmission/reception device of
また、請求項3のデータ送受信装置は、請求項2に記載のデータ送受信装置において、前記送受信処理部が、前記時間情報Tの値が0よりも小さい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断し、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信し、予め設定された時間待機した後に、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信する前記第1の処理を行う、ことを特徴とする。
The data transmission/reception device of
また、請求項4のデータ送受信装置は、請求項1に記載のデータ送受信装置において、前記送受信処理部が、前記時間情報Tbから前記時間情報Taを減算することで、時間情報Tを求め、前記時間情報Tの値が0よりも小さい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断し、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信し、予め設定された値をNとして時間Nの間待機した後に、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信し、前記時間情報Taを算出し、前記映像ファイルを取得したときから前記時間Nの間待機した後に、前記遠隔データ送受信装置から前記時間情報Tbを受信し、前記時間情報Tを求める第3の処理を行い、前記時間情報Tの値が0よりも大きい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも低いと判断し、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信し、前記時間情報Taを算出し、前記映像ファイルを取得したときから前記時間Nの間待機した後に、前記遠隔データ送受信装置から前記時間情報Tbを受信し、前記時間情報Tを求める第4の処理を行い、前記時間情報Tの値が0である場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置と同じであると判断し、前記第3の処理または前記第4の処理を行う、ことを特徴とする。
In addition, the data transmission/reception device of
また、請求項5のデータ送受信装置は、請求項4に記載のデータ送受信装置において、前記送受信処理部が、前記時間情報Tの絶対値が予め設定された閾値よりも大きい場合、前記時間Nを、予め設定された前記値よりも大きい値に設定し、前記時間情報Tの絶対値が前記閾値以下である場合、予め設定された前記値を前記時間Nに設定する、ことを特徴とする。
The data transmission/reception device of claim 5 is the data transmission/reception device of
また、請求項6のデータ送受信装置は、請求項1から5までのいずれか一項に記載のデータ送受信装置において、前記発話文再生部が、前記発話文の再生を開始する際に、前記送受信処理部により前記第1の発声ファイルが取得中である場合、前記第1の発声ファイルの取得が完了するまで待機し、または前記発声再生部により前記第2の発声ファイルが再生中である場合、前記第2の発声ファイルの再生が完了するまで待機し、待機した後に前記発話文を再生する、ことを特徴とする。
The data transmission/reception device of claim 6 is a data transmission/reception device according to any one of
さらに、請求項7のプログラムは、コンピュータを、請求項1から6までのいずれか一項に記載のデータ送受信装置として機能させることを特徴とする。
Furthermore, the program of claim 7 is characterized in that it causes a computer to function as a data transmission/reception device according to any one of
以上のように、本発明によれば、クラウドサービスにかかるコストを低減すると共に、ロボットの発話のタイミングの遅れを抑制することができる。 As described above, the present invention can reduce the cost of cloud services and suppress delays in the timing of a robot's speech.
以下、本発明を実施するための形態について図面を用いて詳細に説明する。
〔データ送受信システム〕
まず、データ送受信システムについて説明する。図1は、本発明の実施形態によるデータ送受信装置を含むデータ送受信システムを説明する概念図である。
Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.
[Data transmission and reception system]
First, a data transmission/reception system will be described. Fig. 1 is a conceptual diagram illustrating a data transmission/reception system including a data transmission/reception device according to an embodiment of the present invention.
このデータ送受信システム1は、場所A(第1の場所)に設置されたデータ送受信装置2、場所B(第2の場所)に設置されたデータ送受信装置(遠隔データ送受信装置)3、及びクラウド上に設置されたクラウドサーバ4を備えて構成される。データ送受信装置2,3及びクラウドサーバ4は、インターネット30を介して接続される。
This data transmission/
場所Aは、データ送受信装置2を備えたロボット(第1のロボット)11、人(第1のユーザ)12及びディスプレイ(第1のディスプレイ)13が存在する環境である。場所Bは、データ送受信装置3を備えたロボット(第2のロボット)21、人(第2のユーザ)22及びディスプレイ(第2のディスプレイ)23が存在する環境である。
Location A is an environment in which a robot (first robot) 11 equipped with a data transmission/
場所Aに存在するディスプレイ13及び場所Bに存在するディスプレイ23には、同一の映像が表示される。映像は、例えばテレビ番組、動画である。人12,22は、友人、知人、親子等の会話の対象人物である。
The same image is displayed on the
場所Aに存在する人12(及びロボット11)は、ディスプレイ13に表示された映像を視聴し、場所Bに存在する人22(及びロボット21)は、ディスプレイ23に表示された映像を視聴する。ロボット11は、ディスプレイ13に表示された映像に関連するキャプション、有名人名及び画像ラベル等のテキスト情報(以下、「キーワード」という。)に基づいた発話を行い、ロボット21は、ディスプレイ23に表示された映像に関連するキーワードに基づいた発話を行う。
Person 12 (and robot 11) in location A watches the video displayed on
人12は、ロボット11による映像(ディスプレイ13に表示された映像)に関連するキーワードに基づいた発話を聞きながら、遠隔の場所Bに存在する人22と会話を行う。同様に、人22は、ロボット21による映像(ディスプレイ23に表示された映像)に関連するキーワードに基づいた発話を聞きながら、遠隔の場所Aに存在する人12と会話を行う。つまり、人12,22は、それぞれロボット11,21による同一の映像に関連する同一のキーワードに基づいた発話を聞きながら、会話を行う。
データ送受信装置2は、データ送受信装置3よりもインターネット30の接続環境が良い場合(混雑度合いが低い場合)、ディスプレイ13に表示された映像に関する映像ファイルを、インターネット30を介してクラウドサーバ4へ送信する。そして、データ送受信装置2は、クラウドサーバ4から映像ファイルの映像に関連するキーワードを受信する。データ送受信装置2は、受信したキーワード及び人12の発声ファイル(第1の発声ファイル)等を、インターネット30を介してデータ送受信装置3へ送信する。
When the connection environment of the Internet 30 is better (less congested) than that of the data transmission/
一方、データ送受信装置2は、データ送受信装置3よりもインターネット30の接続環境が良くない場合(混雑度合いが高い場合)、データ送受信装置3から、映像ファイルの映像に関連するキーワードを受信する。また、データ送受信装置2は、データ送受信装置3から人22の発声ファイル(第2の発声ファイル)等を受信する。
On the other hand, when the connection environment of the
データ送受信装置2は、クラウドサーバ4またはデータ送受信装置3からキーワードを受信すると、キーワードに基づいた発話文をロボット11の発話として再生し、データ送受信装置3から人22の発声ファイルを受信すると、人22の発声を再生する。
When the data transmission/
これにより、場所Aに存在する人12は、ディスプレイ13に表示された映像に関連するキーワードに基づいた発話をロボット11の発話として聞くことができ、場所Bに存在する人22の発声も聞くことができる。つまり、人12は、映像に関連する情報を得ながら、人22と会話を行うことができる。
As a result,
データ送受信装置3は、データ送受信装置2と同様の処理を行う。これにより、場所Bに存在する人22は、ディスプレイ23に表示された映像に関連するキーワードに基づいた発話をロボット21の発話として聞くことができ、場所Aに存在する人12の発声も聞くことができる。つまり、人22は、映像に関連する情報を得ながら、人12と会話を行うことができる。データ送受信装置2,3の詳細については後述する。
The data transmission/
クラウドサーバ4は、データ送受信装置2から送信された映像ファイルを、インターネット30を介して受信し、例えばキャプション生成、有名人検索、画像ラベル検出等を並列に処理する。そして、クラウドサーバ4は、処理結果の中から、例えば予め設定されたキーワード辞書に含まれる単語をキーワードとして設定し、映像ファイルの映像に関連するキーワードとして、映像ファイルを送信してきたデータ送受信装置2へ送信する。
The
クラウドサーバ4は、データ送受信装置3から映像ファイルを受信した場合も同様の処理を行い、映像ファイルの映像に関連するキーワードを、映像ファイルを送信してきたデータ送受信装置3へ送信する。
When the
〔データ送受信装置〕
次に、図1に示したデータ送受信装置2,3について詳細に説明する。図2は、本発明の実施形態によるデータ送受信装置2,3の構成例を示すブロック図である。
[Data transmission/reception device]
Next, a detailed description will be given of the data transmission/
このデータ送受信装置2は、映像取得部51、映像ファイル生成部52、発声取得部53、発声ファイル生成部54、遠隔発声再生部(発声再生部)55、発話文生成部56、テンプレート保持部57、発話文再生部58及び送受信処理部59を備えている。尚、データ送受信装置3の構成は、図2に示すデータ送受信装置2の構成と同様である。
This data transmission/
映像取得部51は、ディスプレイ13に表示された映像のデータを取得するカメラであり、映像のデータを取得して映像ファイル生成部52に転送する。映像ファイル生成部52は、映像取得部51から転送された映像のデータを入力し、クラウドサーバ4が処理する映像ファイル形式の映像のデータファイルを生成し、これを映像ファイルとして送受信処理部59に出力する。映像ファイル形式は、例えばMP4である。
The
発声取得部53は、人12の発声を取得するマイクであり、発声のデータを取得して発声ファイル生成部54に転送する。発声ファイル生成部54は、発声取得部53から転送された発声のデータを入力し、一般的な音声ファイル形式の発声のデータファイルを生成し、これを発声ファイルとして送受信処理部59に出力する。音声ファイル形式は、例えばMP3である。
The
遠隔発声再生部55は、送受信処理部59から転送された後述する遠隔発声ファイルを入力し、遠隔発声ファイルを再生する。
The remote
遠隔発声ファイルは、場所Bに存在する人22の発声のデータから生成された発声ファイルである。これにより、場所Aに存在する人12は、場所Bに存在する人22の発声を聞くことができる。
The remote speech file is a speech file generated from speech data of
尚、遠隔発声再生部55は、スピーカの機能を有するようにしてもよい。この場合、場所Bに存在する人22の発声が、ロボット11に備えたデータ送受信装置2の遠隔発声再生部55からなされることとなる。
The remote
また、遠隔発声再生部55は、スピーカの機能を有していなくてもよい。この場合のスピーカは、データ送受信装置2とは独立して外部に設置される。遠隔発声再生部55は、例えばブルートゥース(登録商標)等の通信手段を介して、遠隔発声ファイルを外部のスピーカへ送信し、外部のスピーカは、遠隔発声ファイルを受信して再生を行う。外部のスピーカとしては、例えばスマートフォン、タブレット等のモバイル端末のスピーカ機能が用いられる。モバイル端末は、場所Bに存在する人22の顔を画面表示しながら、人22の発声の遠隔発声ファイルを受信して再生を行うようにしてもよい。
The remote
これにより、場所Bに存在する人22の発声が、ロボット11とは離れた箇所に設置されたスピーカからなされることとなり、人12は、場所Bに存在する人22の発声と、ロボット11の発話とを容易に区別することができる。
As a result, the speech of
発話文生成部56は、送受信処理部59から転送されたキーワード(映像ファイルの映像に関連するキーワード)を入力すると共に、テンプレート保持部57からテンプレートを読み出し、キーワード及びテンプレートを組み合わせることで、発話文を生成する。そして、発話文生成部56は、発話文を発話文再生部58に出力する。
The utterance
テンプレート保持部57は、文章の述語等のテンプレートを保持する。発話文再生部58は、発話文生成部56から発話文を入力し、発話文を再生する。これにより、場所Aに存在する人12は、場所Aに存在するロボット11の発話(ディスプレイ13に表示された映像に関する情報)を聞くことができる。
The
例えば発話文生成部56が入力したキーワードがドラマの出演者名「〇○××」であり、テンプレートが「ですよ」である場合、発話文生成部56は、発話文「○○××ですよ」を生成する。テンプレート保持部57は、例えば「ですよ」、「ですか」、「だね」等のテンプレートを保持する。
For example, if the keyword input to the
尚、発話文生成部56による発話文生成処理としては、例えば以下の非特許文献に記載された技術が用いられる。
[非特許文献]
金子豊、外2名、“テレビ視聴ロボットにおける字幕文内キーワードに基づく発話生成手法”、[online]、映像情報メディア学会、[令和3年1月11日検索]、インターネット<https://www.jstage.jst.go.jp/article/iteac/2017/0/2017_32B-4/_pdf>
The speech sentence generation process by the speech
[Non-Patent Literature]
Yutaka Kaneko and two others, "A method for generating speech based on keywords in subtitles for a television viewing robot," [online], Institute of Image Information and Television Engineers, [searched on January 11, 2021], Internet <https://www.jstage.jst.go.jp/article/iteac/2017/0/2017_32B-4/_pdf>
また、発話文生成部56は、テンプレート保持部57に保持されたテンプレートをランダムに選択し、キーワード及びテンプレートを組み合わせることで、発話文を生成するようにしてもよい。
The utterance
送受信処理部59は、映像ファイル生成部52から映像ファイルを入力すると共に、発声ファイル生成部54から発声ファイルを入力する。送受信処理部59は、発声ファイルをデータ送受信装置3へ送信し、データ送受信装置3から遠隔発声ファイルを受信し、遠隔発声ファイルを遠隔発声再生部55に転送する。
The transmission/
送受信処理部59は、映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信することで、ラウンドトリップタイムに相当する時間情報Taを算出する。そして、送受信処理部59は、時間情報Ta(遠隔時間情報Tb)をデータ送受信装置3へ送信する。時間情報Taは、データ送受信装置2におけるインターネット30の混雑度合いを反映した情報である。
The transmission/
送受信処理部59は、データ送受信装置3から、データ送受信装置3におけるラウンドトリップタイムに相当する遠隔時間情報Tbを受信する。そして、送受信処理部59は、遠隔時間情報Tbから時間情報Taを減算し、減算結果に基づいてデータ送受信装置2,3間のインターネット30の混雑度合いを判定する。遠隔時間情報Tbは、データ送受信装置3におけるインターネット30の混雑度合いを反映した情報である。
The transmission/
送受信処理部59は、当該データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも低いと判定した場合、クラウドサーバ4への映像ファイルの送信処理、及びクラウドサーバ4からのキーワードの受信処理を継続する。送受信処理部59は、クラウドサーバ4から受信したキーワードを発話文生成部56に転送し、データ送受信装置3からのリクエストに従い、キーワードをデータ送受信装置3へ送信する。
When the transmission/
一方、送受信処理部59は、当該データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも高いと判定した場合、クラウドサーバ4への映像ファイルの送信処理を停止する。そして、送受信処理部59は、データ送受信装置3へリクエストを送信することで、データ送受信装置3からキーワードを受信し、キーワードを発話文生成部56に転送する。
On the other hand, if the transmission/
〔送受信処理部59〕
次に、図2に示したデータ送受信装置2,3に備えた送受信処理部59について詳細に説明する。図3は、送受信処理部59の構成例を示すブロック図である。
[Transmission and reception processing unit 59]
Next, a detailed description will be given of the transmission/
この送受信処理部59は、映像ファイル取得部60、キーワード転送部61、時計62、時間算出部63、時間比較部64、遠隔発声ファイル受信部65、キーワード受信時刻取得部66、キーワード受信部67、キーワード送信部68、映像ファイル送信時刻取得部69、送信制御部70、発声ファイル送信部71、映像ファイル送信部72、遠隔時間情報取得部73及び時間情報送信部74を備えている。
This transmission/
映像ファイル取得部60は、映像ファイル生成部52から映像ファイルを取得し、映像ファイルを映像ファイル送信部72に転送する。これにより、映像ファイルは、映像ファイル送信部72からクラウドサーバ4へ送信される。
The video
キーワード転送部61は、キーワード受信部67からキーワードを入力し、キーワードを発話文生成部56に転送する。キーワードは、キーワード受信部67によりクラウドサーバ4または遠隔の場所Bに設置されたデータ送受信装置3から受信される。
The
これにより、キーワードは、ディスプレイ13に表示されている映像に関連するキーワードとして、発話文生成部56、テンプレート保持部57及び発話文再生部58により、ロボット11の発話文として再生される。
As a result, the keyword is reproduced as an utterance sentence for the
時計62は、当該データ送受信装置2における時刻をカウントする。時間算出部63は、映像ファイル送信時刻取得部69から送信開始時刻t1を入力すると共に、キーワード受信時刻取得部66から受信完了時刻t2を入力する。送信開始時刻t1は、映像ファイル送信部72が映像ファイルをクラウドサーバ4へ送信した時刻であり、受信完了時刻t2は、キーワード受信部67がキーワードをクラウドサーバ4から受信した時刻である。
The
時間算出部63は、以下の式にて、受信完了時刻t2から送信開始時刻t1を減算することで、当該データ送受信装置2が映像ファイルを送信してからキーワードを受信するまでの間の時間情報Ta(ラウンドトリップタイムに相当)を求める。そして、時間算出部63は、時間情報Taを時間比較部64に出力する。
[数1]
Ta=t2-t1 ・・・(1)
The
[Equation 1]
Ta=t2-t1...(1)
時間比較部64は、時間算出部63から時間情報Taを入力すると共に、遠隔時間情報取得部73から遠隔時間情報Tbを入力する。遠隔時間情報Tbは、遠隔の場所Bに設置されたデータ送受信装置3において、当該データ送受信装置2と同様の処理により前記式(1)にて算出された時間情報Taであり、遠隔時間情報取得部73によりデータ送受信装置3から受信される。
The
時間比較部64は、以下の式にて、遠隔時間情報Tbから時間情報Taを減算することで、当該データ送受信装置2におけるインターネット30の混雑度合いを判定するための時間情報T(混雑度合い判定用時間情報T)を求める。
[数2]
T=Tb-Ta ・・・(2)
The
[Equation 2]
T=Tb-Ta...(2)
時間比較部64は、混雑度合い判定用時間情報Tを送信制御部70に出力し、時間情報Taを時間情報送信部74に転送する。時間情報Taは、時間情報送信部74によりデータ送受信装置3へ送信され、データ送受信装置3は、当該時間情報Taを遠隔時間情報Tbとして受信する。
The
遠隔発声ファイル受信部65は、データ送受信装置3から人22の発声のデータファイルを遠隔発声ファイルとして受信し、遠隔発声ファイルを遠隔発声再生部55に転送する。
The remote speech
これにより、遠隔発声ファイルは、遠隔発声再生部55により、遠隔の場所Bに存在する人22の発声として再生される。
As a result, the remote speech file is played by the remote
キーワード受信時刻取得部66は、キーワード受信部67から、クラウドサーバ4から受信したキーワードの受信タイミングを示す受信完了を入力する。そして、キーワード受信時刻取得部66は、受信完了を入力したときの時刻を時計62から取得し、当該時刻を受信完了時刻t2に設定し、受信完了時刻t2を時間算出部63に出力する。
The keyword reception
キーワード受信部67は、クラウドサーバ4からキーワードを受信した場合、その受信タイミングを示す受信完了をキーワード受信時刻取得部66に出力すると共に、キーワードをキーワード転送部61及びキーワード送信部68に出力する。
When the
キーワード受信部67は、送信制御部70から送信停止指示または送信再開指示を入力する。送信停止指示及び送信再開指示の詳細については後述する。キーワード受信部67は、送信停止指示を入力した場合、例えばキーワードの送信のリクエストをデータ送受信装置3へ送信し、データ送受信装置3からキーワードを受信し、キーワードをキーワード転送部61に出力する。
The
この場合、データ送受信装置3は、データ送受信装置2から当該リクエストを受信すると、当該データ送受信装置3のキーワード送信部68は、クラウドサーバ4から受信したキーワードをデータ送受信装置2へ送信する。
In this case, when the data transmission/
一方、キーワード受信部67は、送信制御部70から送信再開指示を入力した場合、前述のデータ送受信装置3へのリクエストの送信処理を停止する。そして、キーワード受信部67は、映像ファイル送信部72により映像ファイルがクラウドサーバ4へ送信された後、クラウドサーバ4からキーワードを受信し、キーワードをキーワード転送部61及びキーワード送信部68に出力する。
On the other hand, when the
キーワード送信部68は、キーワード受信部67からキーワードを入力し、キーワードをデータ送受信装置3へ送信する。これにより、クラウドサーバ4から受信したキーワードが、データ送受信装置2からデータ送受信装置3へ送信される。
The
映像ファイル送信時刻取得部69は、映像ファイル送信部72から、クラウドサーバ4へ映像ファイルを送信した送信タイミングを示す送信開始を入力する。そして、映像ファイル送信時刻取得部69は、送信開始を入力したときの時刻を時計62から取得し、当該時刻を送信開始時刻t1に設定し、送信開始時刻t1を時間算出部63に出力する。
The video file transmission
送信制御部70は、時間比較部64から混雑度合い判定用時間情報Tを入力し、混雑度合い判定用時間情報Tに基づいて、当該データ送受信装置2における混雑度合いを判定する。このデータ送受信装置2における混雑度合いには、当該データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも高い場合、低い場合、及びデータ送受信装置3と同じ場合の3状態がある。
The
送信制御部70は、混雑度合いが高いと判定した場合、映像ファイルの送信処理を停止することを示す送信停止指示を映像ファイル送信部72及びキーワード受信部67に出力する。そして、送信制御部70は、時計62から時刻を取得しながら、予め設定された値をNとして時間Nの間待機し、時間N経過後に、映像ファイルの送信処理を再開することを示す送信再開指示を映像ファイル送信部72及びキーワード受信部67に出力する。
When the
図4は、送信制御部70の処理例を示すフローチャートである。送信制御部70は、時間比較部64から混雑度合い判定用時間情報Tを入力したか否かを判定する(ステップS401)。
Figure 4 is a flowchart showing an example of processing by the
送信制御部70は、ステップS401において、混雑度合い判定用時間情報Tを入力していない場合(ステップS401:N)、混雑度合い判定用時間情報Tを入力するまで待つ。一方、送信制御部70は、ステップS401において、混雑度合い判定用時間情報Tを入力した場合(ステップS401:Y)、ステップS402へ移行する。
If the
送信制御部70は、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)、0よりも大きい(T>0、すなわちTb>Ta)、または0である(T=0、すなわちTb=Ta)を判定する(ステップS402)。
The
送信制御部70は、ステップS402において、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)と判定した場合、送信停止指示を映像ファイル送信部72及びキーワード受信部67に出力する(ステップS403)。
If the
これにより、当該データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも高いものと判断される。つまり、当該データ送受信装置2のラウンドトリップタイムがデータ送受信装置3のラウンドトリップタイムよりも大きいものと判断される。そして、当該データ送受信装置2からクラウドサーバ4への映像ファイルの送信処理が停止し、データ送受信装置3からクラウドサーバ4への映像ファイルの送信処理が行われる。
As a result, the degree of congestion on the
送信制御部70は、ステップS403から移行して、送信停止指示を出力してからの経過時間を時計62から特定する。そして、送信制御部70は、時計62の時刻に基づいて、予め設定された値をNとして時間N(キーワード受信部67が遠隔時間情報Tbの送信のリクエストをデータ送受信装置3へ送信してから時間N)の間待機する(ステップS404)。予め設定された時間Nは、例えば10秒、60秒である。そして、送信制御部70は、経過時間が時間Nに到達したときに、送信再開指示を映像ファイル送信部72及びキーワード受信部67に出力する(ステップS405)。
The
これにより、データ送受信装置2,3におけるインターネット30の混雑度合いの変化に伴い、映像ファイルを送信してキーワードを受信するデータ送受信装置2,3を切り替えることができる。すなわち、混雑度合いの低い方のデータ送受信装置2,3は、時間N毎に、映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信することとなる。
As a result, the data transmission/
一方、送信制御部70は、ステップS402の処理において、混雑度合い判定用時間情報Tが0よりも大きい(T>0、すなわちTb>Ta)と判定した場合、映像ファイル送信部72及びキーワード受信部67に対する通知を行わない。
On the other hand, if the
尚、送信制御部70は、映像ファイルの送信処理を継続することを示す送信継続指示を映像ファイル送信部72及びキーワード受信部67に出力するようにしてもよい。
The
これにより、当該データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも低いものと判断される。つまり、当該データ送受信装置2のラウンドトリップタイムがデータ送受信装置3のラウンドトリップタイムよりも小さいものと判断される。そして、当該データ送受信装置2からクラウドサーバ4への映像ファイルの送信処理が継続することとなる。
As a result, the degree of congestion on the
一方、送信制御部70は、ステップS402において、混雑度合い判定用時間情報Tが0である(T=0、すなわちTb=Ta)と判定した場合、前回と同じ処理を行う(ステップS406)。
On the other hand, if the
つまり、送信制御部70は、前回のステップS402の処理において、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)と判定した場合、前述のステップS403~S405の処理を行う。一方、送信制御部70は、前回のステップS402の処理において、混雑度合い判定用時間情報Tが0よりも大きい(T>0、すなわちTb>Ta)と判定した場合、映像ファイル送信部72及びキーワード受信部67に対する通知を行わない。
In other words, if the
これにより、当該データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3と同じであるものと判断される。つまり、当該データ送受信装置2のラウンドトリップタイムとデータ送受信装置3のラウンドトリップタイムとが同じであると判断される。そして、前回の処理と同様に、データ送受信装置3からクラウドサーバ4への映像ファイルの送信処理が行われるか、または、当該データ送受信装置2からクラウドサーバ4への映像ファイルの送信処理が行われる。
As a result, it is determined that the congestion level of the
尚、送信制御部70は、ステップS402において、混雑度合い判定用時間情報Tが0である(T=0、すなわちTb=Ta)と判定した場合、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)ときの処理、または混雑度合い判定用時間情報Tが0よりも大きい(T>0、すなわちTb>Ta)ときの処理のうちのいずれか一方を行うようにすればよい。例えば送信制御部70は、これらの処理のうち予め設定された処理を行う。
When the
図3に戻って、発声ファイル送信部71は、発声ファイル生成部54から発声ファイルを入力し、発声ファイルをデータ送受信装置3へ送信する。
Returning to FIG. 3, the voice
これにより、人12の発声ファイルはデータ送受信装置3へ送信され、データ送受信装置3は、人12の発声ファイルを遠隔発声ファイルとして受信する。
As a result, the voice file of
映像ファイル送信部72は、映像ファイル取得部60から映像ファイルを入力すると共に、送信制御部70から送信停止指示または送信再開指示を入力する。映像ファイル送信部72は、初期処理の際に、映像ファイルをクラウドサーバ4へ送信する。そして、映像ファイル送信部72は、初期処理の後の時間N毎のタイミングで、映像ファイルをクラウドサーバ4へ送信する処理、送信停止指示を入力した場合の処理、または送信再開指示を入力した場合の映像ファイルをクラウドサーバ4へ送信する処理を行う。
The video
映像ファイル送信部72は、初期処理の後の時間N毎のタイミングで、送信制御部70から送信停止指示を入力した場合、クラウドサーバ4への映像ファイルの送信処理を停止する。一方、映像ファイル送信部72は、初期処理の後の時間N毎のタイミングで、送信制御部70から送信再開指示を入力した場合、クラウドサーバ4への映像ファイルの送信処理を再開する。映像ファイル送信部72は、映像ファイルをクラウドサーバ4へ送信したときに、送信開始を映像ファイル送信時刻取得部69に出力する。
When the video
遠隔時間情報取得部73は、時計62の時刻に基づいて、後述する図5に示す当該送受信処理部59による処理のスタート(ステップS501の処理)から時間N経過したときに、例えば遠隔時間情報Tbの送信のリクエストをデータ送受信装置3へ送信する。そして、遠隔時間情報取得部73は、データ送受信装置3から遠隔時間情報Tbを受信し、遠隔時間情報Tbを時間比較部64に転送する。前述のとおり、遠隔時間情報Tbは、データ送受信装置3において、当該データ送受信装置2と同様の処理により前記式(1)にて算出された時間情報Taである。
The remote time
時間情報送信部74は、時間比較部64から時間情報Taを入力し、例えばデータ送受信装置3からの遠隔時間情報Tbの送信のリクエストに従い、時間情報Taをデータ送受信装置3へ送信する。これにより、時間情報Taはデータ送受信装置3へ送信され、データ送受信装置3は、時間情報Taを遠隔時間情報Tbとして受信する。この場合、データ送受信装置3は、後述する図5に示すデータ送受信装置3の送受信処理部59による処理のスタート(ステップS501の処理)から時間N経過したときに、遠隔時間情報Tbの送信のリクエストを当該データ送受信装置2へ送信する。
The time
(送受信処理部59による映像ファイルの送信、送信停止及び送信再開処理等)
次に、図3に示した送受信処理部59による映像ファイルの送信、送信停止及び送信再開処理等について説明する。図5は、送受信処理部59によるこれらの処理の例を説明するフローチャートであり、図6は、そのタイミングを説明する図である。
(Transmission of video files, transmission stop, transmission restart processing, etc. by the transmission/reception processing unit 59)
Next, a description will be given of the transmission, transmission stop, and transmission restart processes of a video file by the transmission/
図6に示すように、送受信処理部59は、予め設定された時間Nを単位として、時間Nの区間毎に「映像ファイル送信」、「送信停止」及び「送信再開」のうちのいずれかの処理にて動作する。
As shown in FIG. 6, the transmission/
尚、図1に示したデータ送受信システム1において、データ送受信装置2の送受信処理部59による動作と、データ送受信装置3の送受信処理部59による動作とは、同期しているものとする。データ送受信装置2及びデータ送受信装置3は、例えばNTP(Network Time Protocol)を用いてそれぞれの時計62を合わせる等して同期を実現し、両装置の送受信処理部59による処理のスタートのタイミングを合わせる。
In the data transmission/
送受信処理部59は、当該送受信処理部59の処理をスタートすると、映像ファイル生成部52から映像ファイルを取得し(ステップS501)、映像ファイルをクラウドサーバ4へ送信する(ステップS502)。送受信処理部59は、映像ファイルを送信したときの時刻を送信開始時刻t1として取得する(ステップS503)。
When the transmission/
送受信処理部59は、クラウドサーバ4からキーワードを受信し(ステップS504)、キーワードを受信したときの時刻を受信完了時刻t2として取得する(ステップS505)。そして、送受信処理部59は、前記式(1)にて、受信完了時刻t2から送信開始時刻t1を減算することで時間情報Taを求める(ステップS506)。
The transmission/
送受信処理部59は、当該処理のスタート(ステップS501における映像ファイルを取得して)から時間Nの間待機する(ステップS507)。そして、送受信処理部59は、時間Nが経過したときに、遠隔時間情報Tbの送信のリクエストをデータ送受信装置3へ送信し、遠隔時間情報Tbを受信する(ステップS508)。
The transmission/
送受信処理部59は、遠隔時間情報Tbから時間情報Taを減算することで、混雑度合い判定用時間情報Tを求める(ステップS509)。送受信処理部59は、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)、0よりも大きい(T>0、すなわちTb>Ta)、または0である(T=0、すなわちTb=Ta)を判定する(ステップS510)。このステップS510の処理は、図4のステップS402に対応している。この場合のステップS501~S510の処理の区間は、図6の時刻0~時刻Nまでの間の区間に相当し、「映像ファイル送信」の動作が行われる。
The transmission/
送受信処理部59は、ステップS510において、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)と判定した場合、クラウドサーバ4への映像ファイルの送信処理を停止する(ステップS511)。このステップS511及び後述するステップS513の処理は、図4のステップS403~S405に対応している。
If the transmission/
送受信処理部59は、キーワードの送信のリクエストをデータ送受信装置3へ送信し、データ送受信装置3からキーワードを受信する(ステップS512)。
The transmission/
送受信処理部59は、ステップS508における遠隔時間情報Tbの送信のリクエストをデータ送受信装置3へ送信してから時間Nの間待機する(ステップS513)。そして、送受信処理部59は、時間Nが経過したときに、当該送受信処理部59の処理が完了していない場合(ステップS515:N)、スタートへ移行して送信を再開し、ステップS501~S510の処理を行う。
The transmission/
この場合のステップS511~S513の処理の区間は、図6の時刻N~時刻2Nまでの間の区間に相当し、「送信停止」の動作が行われる。そして、その後のステップS501~S510の処理の区間は、図6の時刻2N~時刻3Nまでの間の区間に相当し、「送信再開」の動作が行われる。
In this case, the processing period from steps S511 to S513 corresponds to the period from time N to
一方、送受信処理部59は、ステップS510において、混雑度合い判定用時間情報Tが0よりも大きい(T>0、すなわちTb>Ta)と判定し、当該送受信処理部59の処理が完了していない場合(ステップS515:N)、スタートへ移行する。そして、送受信処理部59は、ステップS501~S510の処理を行う。この場合のステップS501~S510の処理の区間は、図6の時刻3N~時刻4Nまでの間の区間に相当し、「映像ファイル送信」の動作が行われる。
On the other hand, in step S510, the transmission/
また、送受信処理部59は、ステップS510において、混雑度合い判定用時間情報Tが0である(T=0、すなわちTb=Ta)と判定した場合、前回と同じ処理を行う(ステップS514)。
In addition, if the transmission/
つまり、送受信処理部59は、前回のステップS510の処理において、混雑度合い判定用時間情報Tが0よりも小さい(T<0、すなわちTb<Ta)と判定した場合、前述のステップS511~S513の処理を行う。一方、送受信処理部59は、前回のステップS510の処理において、混雑度合い判定用時間情報Tが0よりも大きい(T>0、すなわちTb>Ta)と判定した場合、ステップS515へ移行する。
In other words, if the transmission/
図6の例では、前回のステップS510の処理において、混雑度合い判定用時間情報Tが0よりも大きい(T>0、すなわちTb>Ta)と判定されている。このため、送受信処理部59は、ステップS515へ移行し、当該送受信処理部59の処理が完了していない場合(ステップS515:N)、スタートへ移行して送信を継続し、ステップS501~S510の処理を行う。この場合のステップS501~S510の処理の区間は、図6の時刻4N~時刻5Nまでの間の区間に相当し、「映像ファイル送信」の動作が行われる。
In the example of FIG. 6, in the previous processing of step S510, it was determined that the congestion degree determination time information T was greater than 0 (T>0, i.e. Tb>Ta). Therefore, the transmission/
このように、図1に示したデータ送受信システム1において、データ送受信装置2,3に備えたそれぞれの送受信処理部59は、時間Nの区間毎に「映像ファイル送信」、「送信停止」及び「送信再開」のうちのいずれかの処理にて独立して動作する。この場合の動作は同期している。
In this way, in the data transmission/
それぞれの送受信処理部59は、初期処理の時間Nの区間において「映像ファイル送信」の処理にて動作する。そして、送受信処理部59は、前記式(2)にて、自らの装置におけるインターネット30の混雑度合いを示す混雑度合い判定用時間情報Tを算出する。
Each transmission/
送受信処理部59は、混雑度合い判定用時間情報Tに基づき、自らの装置が他の装置よりも混雑度合いが低いと判定した場合、「映像ファイル送信」の処理にて動作を継続する。一方、送受信処理部59は、自らの装置が他の装置よりも混雑度合いが高いと判定した場合、映像ファイルの送信処理を停止する「送信停止」、及び送信処理を再開する「送信再開」の処理にて動作する。
When the transmission/
図7は、データ送受信装置2,3による映像ファイルのアップロード送信期間を説明するイメージ図であり、本発明の実施形態の効果を説明する図でもある。
Figure 7 is an image diagram explaining the upload transmission period of a video file by the data transmission/
前述のとおり、データ送受信装置2,3は、それぞれ映像ファイルをクラウドサーバ4へ送信する役割を担っている。映像ファイルをクラウドサーバ4へ送信する役割を担う期間(映像ファイルの送信期間)には、図7に示すとおり、両装置が同時に当該役割を担う期間T1,T3,T5、及びいずれか一方の装置が当該役割を担う期間T2,T4,T6がある。
As described above, data transmission/
映像ファイルを送信する役割を担うか否かは、データ送受信装置2,3が接続されるインターネット30の混雑度合いに基づいて判断される。インターネット30の混雑度合いは、映像ファイルの送信を開始してからキーワードを受信するまでの間の時間を基準として、前記式(2)の混雑度合い判定用時間情報Tに基づき判断される(図4のステップS402、図5のステップS510)。
Whether or not the data transmission/
一方で、インターネット30の輻輳状況は時々刻々と変化するため、映像ファイルの送信を停止した後、時間Nが経過したときに送信停止が解除され、送信が再開される(図4のステップS403~S405、図5のステップS511,S513)。そして、インターネット30の混雑度合いが判断される。このような動作が繰り返される。
However, since the congestion status of the
期間T1,T3,T5は、データ送受信装置2,3が映像ファイルを同時に送信する期間である。期間T2,T4は、データ送受信装置3のみが映像ファイルを送信する期間であり、データ送受信装置2は映像ファイルを送信しない。また、期間T6は、データ送受信装置2のみが映像ファイルを送信する期間であり、データ送受信装置3は映像ファイルを送信しない。
Periods T1, T3, and T5 are periods during which data transmission/
図7に示した期間T2,T4,T6は、このような動作により、アップロードトラフィックの発生が低減されることを示している。これにより、データ送受信装置2,3の両方から常に映像ファイルを送信する必要はなく、いずれか一方から映像ファイルを送信すれば済み、期間T2,T4,T6において、クラウドサービスにかかるコストを低減することができる。
Time periods T2, T4, and T6 shown in FIG. 7 show that such operations reduce the generation of upload traffic. This eliminates the need to constantly send video files from both data transmission/
図8は、両方のデータ送受信装置2,3のアップロードトラフィックが発生する期間T1,T3,T5のデータフロー(a)を説明する図である。期間T1,T3,T5は、初期処理の期間(両データ送受信装置2,3にて「映像ファイル送信」の期間)、または、データ送受信装置2,3の一方における「送信再開」の期間及び他方における「映像ファイル送信」の期間である。
Figure 8 is a diagram explaining data flow (a) during periods T1, T3, and T5 when upload traffic occurs in both data transmission/
期間T1,T3,T5においては、データ送受信装置2,3は、映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信する。また、データ送受信装置2,3は、対応するデータ送受信装置3,2から、データ送受信装置3,2における時間情報Taを遠隔時間情報Tbとして受信する。さらに、データ送受信装置2,3は、発声ファイルを遠隔発声ファイルとし、対応するデータ送受信装置3,2へ送信する。
During periods T1, T3, and T5, the data transmission/
図9は、一方のデータ送受信装置2のアップロードトラフィックが発生しない期間T2,T4のデータフロー(b)を説明する図である。期間T2,T4は、データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも高いと判定された場合の期間である。つまり、データ送受信装置2における「送信停止」の期間、データ送受信装置3における「映像ファイル送信」の期間である。
Figure 9 is a diagram explaining the data flow (b) during periods T2 and T4 when no upload traffic occurs in one data transmission/
期間T2,T4において、データ送受信装置3は、映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信し、キーワードをデータ送受信装置2へ送信する。この場合、データ送受信装置2は、映像ファイルを送信せず、データ送受信装置3からキーワードを受信する。また、データ送受信装置3は、データ送受信装置2から、データ送受信装置2における時間情報Taを遠隔時間情報Tbとして受信する。さらに、データ送受信装置2,3は、発声ファイルを遠隔発声ファイルとして、対応するデータ送受信装置3,2へ送信する。
During periods T2 and T4, the data transmission/
図10は、他方のデータ送受信装置3のアップロードトラフィックが発生しない期間T6のデータフロー(c)を説明する図である。期間T6は、データ送受信装置2におけるインターネット30の混雑度合いがデータ送受信装置3よりも低いと判定された場合の期間である。つまり、データ送受信装置2における「映像ファイル送信」の期間、データ送受信装置3における「送信停止」の期間である。
Figure 10 is a diagram explaining the data flow (c) during period T6 when no upload traffic occurs in the other data transmission/
期間T6において、データ送受信装置2は、映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信し、キーワードをデータ送受信装置3へ送信する。この場合、データ送受信装置3は、映像ファイルを送信せず、データ送受信装置2からキーワードを受信する。また、データ送受信装置2は、データ送受信装置3から、データ送受信装置3における時間情報Taを遠隔時間情報Tbとして受信する。さらに、データ送受信装置2,3は、発声ファイルを遠隔発声ファイルとして、対応するデータ送受信装置3,2へ送信する。
During period T6, the data transmission/
以上のように、本発明の実施形態のデータ送受信装置2によれば、映像取得部51は、ディスプレイ13に表示された映像のデータを取得し、映像ファイル生成部52は、所定の映像ファイル形式の映像ファイルを生成する。発声取得部53は、人12の発声のデータを取得し、発声ファイル生成部54は、所定の音声ファイル形式の発声ファイルを生成する。
As described above, according to the data transmission/
送受信処理部59は、映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信することで、当該データ送受信装置2におけるラウンドトリップタイムに相当する時間情報Taを算出する。また、送受信処理部59は、発声ファイルをデータ送受信装置3へ送信し、データ送受信装置3から遠隔発声ファイルを受信する。
The transmission/
送受信処理部59は、当該送受信処理部59の処理のスタート時から時間Nだけ待機した後、データ送受信装置3から、データ送受信装置3におけるラウンドトリップタイムに相当する遠隔時間情報Tbを受信する。そして、送受信処理部59は、遠隔時間情報Tbから時間情報Taを減算することで、混雑度合い判定用時間情報Tを算出する。
The transmission/
送受信処理部59は、混雑度合い判定用時間情報T<0の場合、クラウドサーバ4への映像ファイルの送信処理を停止し、データ送受信装置3からキーワードを受信し、時間Nの間待機した後、映像ファイルの送信処理を再開する。一方、送受信処理部59は、混雑度合い判定用時間情報T>0の場合、クラウドサーバ4への映像ファイルの送信処理を継続する。また、送受信処理部59は、混雑度合い判定用時間情報T=0の場合、前回と同じ処理を行う。
When the time information for determining the degree of congestion T<0, the transmission/
遠隔発声再生部55は、送受信処理部59が受信した遠隔発声ファイルを再生する。これにより、場所Aに存在する人12は、遠隔の場所Bに存在する人22の発声を聞くことができる。発話文生成部56は、送受信処理部59が受信したキーワードに基づいた発話文を生成し、発話文再生部58は、発話文を再生する。これにより、場所Aに存在する人12は、キーワードに基づいた発話文を聞くことができ、視聴している映像に関連する情報を得ることができる。
The remote
このように、インターネット30の混雑度合いの低いデータ送受信装置2,3のいずれか一方から映像ファイルが送信され、混雑度合いの高い他方からは映像ファイルが送信されない。このため、データ送受信装置2,3の両方から常に映像ファイルを送信する必要はなく、図7に示した期間T2,T4,T6のように、いずれか一方のみから映像ファイルを送信する期間が存在することとなる。つまり、映像ファイルをクラウドサーバ4へ送信するアップロードトラフィックの発生を低減することができ、クラウドサービスにかかるコストを低減することができる。
In this way, a video file is transmitted from one of the data transmission/
また、本発明の実施形態では、インターネット30の混雑度合いの低いデータ送受信装置2,3のいずれか一方が映像ファイルをクラウドサーバ4へ送信し、クラウドサーバ4からキーワードを受信して他方へ転送するようにした。このキーワードは、映像ファイルのように大容量ではない。このため、データ送受信装置2,3は、混雑度合いの低いインターネット30の環境の下でキーワードを迅速に取得することができ、キーワードの受信遅れに伴うロボット11,21による発話のタイミングの遅れを抑制することができる。つまり、ロボット11,21は、ディスプレイ13,23に表示される同一の映像に対してさほど遅れることなく迅速なタイミングで、当該ロボット11,21間でほぼ同時に、映像に関連する同じキーワードに基づいた発話を行うことができる。
In addition, in an embodiment of the present invention, one of the data transmission/
このため、人12,22の会話とロボット11,21の発話とは、大きくずれることがなく、ロボット11,21の発話から受ける違和感を緩和することができ、同一の映像を視聴している人12,22間で会話の活性化を図ることができる。
As a result, there is no significant discrepancy between the conversation between the
以上、実施形態を挙げて本発明を説明したが、本発明は前記実施形態に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。 The present invention has been described above using embodiments, but the present invention is not limited to the above embodiments and can be modified in various ways without departing from the technical concept thereof.
(時間情報Ta及び遠隔時間情報Tbに基づく混雑度合いの判定)
例えば前記実施形態において、データ送受信装置2の送受信処理部59の送信制御部70は、混雑度合い判定用時間情報Tに基づいて、当該データ送受信装置2における混雑度合いを判定するようにした。これに対し、送信制御部70は、時間情報Ta及び遠隔時間情報Tbに基づいて、当該データ送受信装置2における混雑度合いを判定するようにしてもよい。
(Determination of the degree of congestion based on time information Ta and remote time information Tb)
For example, in the above embodiment, the
(場所Aにおける人12,22の発声及びロボット11の発話の重なりの回避)
また、前記実施形態において、データ送受信装置2の発声取得部53は、場所Aに存在する人12の発声のデータを取得するようにした。また、遠隔発声再生部55は、遠隔の場所Bに存在する人22の発声の遠隔発声ファイルを再生し、発話文再生部58は、映像に関連するキーワードに基づいた発話文を再生するようにした。
(Avoiding overlapping of speech between
In the embodiment, the
ここで、人12の発声とキーワードに基づいた発話文の再生とが同時に行われる場合があり、また、人22の発声の遠隔発声ファイルの再生とキーワードに基づいた発話文の再生とが同時に行われる場合もある。これでは、人12は、当該人12の発声とロボット11の発話とが重なってしまい、ロボット11の発話を聞くことができない可能性があり、また、人22の発声とロボット11の発話とが重なってしまい、これらを聞き分けることができない可能性がある。
Here, the speech of
この問題を解決するために、発声取得部53は、人12の発声のデータを取得しているときに、取得中であることを示す信号(取得中信号)を発話文再生部58に出力する。また、遠隔発声再生部55は、人22の発声の遠隔発声ファイルを再生しているときに、再生中であることを示す信号(再生中信号)を発話文再生部58に出力する。
To solve this problem, when the
発話文再生部58は、発話文の再生を開始する際に、発声取得部53から取得中信号を入力している場合、取得中信号を入力しなくなるまで待機する。また、発話文再生部58は、発話文の再生を開始する際に、遠隔発声再生部55から再生中信号を入力している場合、再生中信号を入力しなくなるまで待機する。そして、発話文再生部58は、待機後に取得中信号及び再生中信号を入力していない場合、発話文の再生を開始する。
When the spoken
これにより、発話文再生部58による発話文の再生は、発声取得部53による人12の発声のデータの取得が完了するまで待った後に行われ、また、遠隔発声再生部55による人22の発声の遠隔発声ファイルの再生が完了するまで待った後に行われる。
As a result, the spoken sentence is played back by the spoken
つまり、人12,22の発声及びロボット11の発話の時間的な重なりを回避することができる。したがって、人12は、ロボット11の発話及び人22の発声を確実に聞くことができ、映像を視聴している人12,22間の会話の活性化を一層図ることができる。
In other words, it is possible to avoid a time overlap between the speech of the
(時間Nの変更)
また、前記実施形態において、データ送受信装置2の送受信処理部59の送信制御部70は、予め設定された時間Nを単位として、時間Nの区間毎に「映像ファイル送信」、「送信停止」及び「送信再開」のうちのいずれかの処理にて動作するようにした。この場合の時間Nは固定であるが、可変とするようにしてもよい。
(Change in Time N)
In the above embodiment, the
例えば送信制御部70は、混雑度合い判定用時間情報Tの絶対値が予め設定された閾値よりも大きい場合、予め設定された時間Nよりも大きい値を新たな時間Nに設定する。その後、送信制御部70は、混雑度合い判定用時間情報Tの絶対値が前記閾値以下に変化した場合、元の時間N(予め設定された時間N)に戻す。
For example, if the absolute value of the time information T for determining the degree of congestion is greater than a preset threshold, the
また、送信制御部70は、混雑度合い判定用時間情報Tの絶対値と複数の異なる閾値とを用いた閾値処理にて、予め設定された時間Nよりも大きい値を新たな時間Nに設定することで、新たな時間Nを閾値に応じて段階的に変化させるようにしてもよい。また、送信制御部70は、新たな時間Nが混雑度合い判定用時間情報Tの絶対値に比例するように、予め設定された時間Nと所定の最大値との間で、新たなNを変化させるようにしてもよい。
The
これにより、例えば場所Aに設置されたデータ送受信装置2に接続されるインターネット30の回線と、場所Bに設置されたデータ送受信装置3に接続されるインターネット30の回線とが異なり、回線速度の差が明らかである場合(例えば一方が光回線、他方がADSLの場合)、インターネット30の混雑度合いを判定する頻度を低くすることとができる。つまり、回線速度の差が明らかな場合は、映像ファイルを送信してキーワードを受信し、混雑度合い判定用時間情報Tを算出する等の「映像ファイル送信」、「送信停止」及び「送信再開」の処理の頻度を低くし、データ送受信装置2,3の処理負荷を低減することができる。
As a result, for example, when the line of the
尚、データ送受信装置2,3は、設定した新たな時間Nをメモリに記憶するようにしてもよい。この場合、データ送受信装置2,3によるデータ送受信システム1の処理が再開したときに、データ送受信装置2,3は、メモリから新たな時間Nを読み出し、新たな時間Nを用いて、「映像ファイル送信」の処理を開始する。
The data transmission/
ここで、データ送受信装置2,3に接続されたインターネット30の回線が光回線、ADSL等のように固定である場合には、それぞれのインターネット30の環境の優劣は明確であり、混雑度合いはさほど変化しない。このため、データ送受信装置2,3は、インターネット30の環境の優劣を反映した新たな時間Nをメモリに記憶しておくことで、当該新たな時間Nを、処理の開始から用いることができ、効率的な処理を実現することができる。
Here, if the
(キーワードに基づいた発話文の送受信)
また、前記実施形態において、データ送受信装置2の送受信処理部59は、クラウドサーバ4からキーワードを受信した場合、受信したキーワードをデータ送受信装置3へ送信するようにした。これに対し、送受信処理部59は、キーワードの代わりに、発話文生成部56により生成された発話文をデータ送受信装置3へ送信するようにしてもよい。
(Transmitting and receiving spoken sentences based on keywords)
In the above embodiment, when the transmission/
具体的には、データ送受信装置2の送受信処理部59のキーワード受信部67は、クラウドサーバ4からキーワードを受信した場合、キーワードを、キーワード転送部61を介して発話文生成部56に出力する。発話文生成部56は、キーワード受信部67からキーワード転送部61を介してキーワードを入力し、キーワードに基づいて発話文を生成し、キーワードに基づいた発話文を、送受信処理部59に備えた発話文送信部(図3には図示せず)に出力する。発話文送信部は、発話文生成部56からキーワードに基づいた発話文を入力してデータ送受信装置3へ送信する。
Specifically, when the
また、データ送受信装置3がクラウドサーバ4から受信したキーワードに基づいて発話文を生成した場合には、データ送受信装置2の送受信処理部59の発話文受信部(図3には図示せず)は、データ送受信装置3からキーワードに基づいた発話文を受信する。そして、発話文受信部は、キーワードに基づいた発話文を発話文再生部58に出力する。発話文再生部58は、発話文受信部から入力したキーワードに基づいた発話文を再生する。
In addition, when the data transmission/
これにより、キーワードと同様に、発話文自体のデータ量は少ないため、回線が混雑することはない。また、データ送受信装置2は、データ送受信装置3からキーワードに基づいた発話文を受信した場合には、これをそのまま再生すればよく、キーワードから発話文を生成する必要がないため、処理負荷を低減することができる。尚、データ送受信装置3についてもデータ送受信装置2と同様の処理が行われる。
As a result, as with keywords, the amount of data in the spoken sentence itself is small, so the lines do not become congested. Furthermore, when the data transmission/
尚、本発明の実施形態によるデータ送受信装置2,3のハードウェア構成としては、通常のコンピュータを使用することができる。データ送受信装置2,3は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。
In addition, a normal computer can be used as the hardware configuration of the data transmission/
データ送受信装置2,3に備えた映像取得部51、映像ファイル生成部52、発声取得部53、発声ファイル生成部54、遠隔発声再生部55、発話文生成部56、テンプレート保持部57、発話文再生部58及び送受信処理部59の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。
The functions of the
これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD-ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。 These programs are stored in the storage medium and are read and executed by the CPU. In addition, these programs can be distributed by storing them on storage media such as magnetic disks (floppy disks, hard disks, etc.), optical disks (CD-ROMs, DVDs, etc.), and semiconductor memories, and can also be transmitted and received via a network.
1 データ送受信システム
2 データ送受信装置
3 データ送受信装置(遠隔データ送受信装置)
4 クラウドサーバ
11 ロボット(第1のロボット)
12 人(第1のユーザ)
13 ディスプレイ(第1のディスプレイ)
21 ロボット(第2のロボット)
22 人(第2のユーザ)
23 ディスプレイ(第2のディスプレイ)
30 インターネット
51 映像取得部
52 映像ファイル生成部
53 発声取得部
54 発声ファイル生成部
55 遠隔発声再生部(発声再生部)
56 発話文生成部
57 テンプレート保持部
58 発話文再生部
59 送受信処理部
60 映像ファイル取得部
61 キーワード転送部
62 時計
63 時間算出部
64 時間比較部
65 遠隔発声ファイル受信部
66 キーワード受信時刻取得部
67 キーワード受信部
68 キーワード送信部
69 映像ファイル送信時刻取得部
70 送信制御部
71 発声ファイル送信部
72 映像ファイル送信部
73 遠隔時間情報取得部
74 時間情報送信部
t1 送信開始時刻
t2 受信完了時刻
Ta 時間情報
Tb 遠隔時間情報
T 混雑度合い判定用時間情報
1 Data transmission/
4
12 people (first user)
13 Display (first display)
21 Robot (Second Robot)
22 people (second users)
23 Display (second display)
30
56 Utterance
Claims (7)
前記データ送受信装置及び前記遠隔データ送受信装置のそれぞれが、前記映像のデータファイルを映像ファイルとして取得し、前記映像ファイルを前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信する場合の前記データ送受信装置において、
前記第1のユーザによる発声のデータファイルを第1の発声ファイルとして取得し、前記第1の発声ファイルを前記遠隔データ送受信装置へ送信し、前記遠隔データ送受信装置から、前記第2のユーザによる発声のデータファイルを第2の発声ファイルとして受信し、
前記映像ファイルを前記クラウドサーバへ送信してから前記キーワードを受信するまでの間の、当該データ送受信装置における前記インターネットの混雑度合いを反映した時間情報Taを算出し、前記時間情報Taを前記遠隔データ送受信装置へ送信し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置における前記インターネットの混雑度合いを反映した時間情報Tbを受信し、
前記時間情報Ta及び前記時間情報Tbに基づいて、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断した場合、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信する送受信処理部と、
前記送受信処理部により受信された前記第2の発声ファイルを再生する発声再生部と、
前記送受信処理部により受信された前記キーワードに基づいた発話文を再生する発話文再生部と、
を備えたことを特徴とするデータ送受信装置。 A data transmission and reception system in which a data transmission and reception device provided in the first robot, a remote data transmission and reception device provided in the second robot, and a cloud server are connected via the Internet, in which a first user watching a video displayed on a first display and a first robot making an utterance based on a keyword related to the video are present in a first location, and a second user watching the video displayed on a second display and a second robot making an utterance based on the keyword related to the video are present in a second location different from the first location, and the first user and the second user listen to the utterance based on the same keyword and have a conversation,
In a case where each of the data transmission/reception device and the remote data transmission/reception device acquires a data file of the video as a video file, transmits the video file to the cloud server, and receives the keyword from the cloud server,
acquiring a data file of an utterance by the first user as a first utterance file, transmitting the first utterance file to the remote data transceiver device, and receiving a data file of an utterance by the second user from the remote data transceiver device as a second utterance file;
calculating time information Ta reflecting a degree of congestion of the Internet at the data transmission/reception device from the time when the video file is transmitted to the cloud server until the keyword is received, transmitting the time information Ta to the remote data transmission/reception device, and receiving time information Tb reflecting the degree of congestion of the Internet at the remote data transmission/reception device from the remote data transmission/reception device;
a transmission/reception processing unit that, when determining based on the time information Ta and the time information Tb that the degree of congestion of the Internet at the data transmission/reception device is higher than that at the remote data transmission/reception device, stops transmitting the video file to the cloud server and receives from the remote data transmission/reception device the keyword that the remote data transmission/reception device has received from the cloud server;
a voice reproduction unit that reproduces the second voice file received by the transmission/reception processing unit;
a speech sentence reproducing unit that reproduces a speech sentence based on the keyword received by the transmission/reception processing unit;
A data transmitting/receiving device comprising:
前記送受信処理部は、
前記時間情報Tbから前記時間情報Taを減算することで、時間情報Tを求め、
前記時間情報Tの値が0よりも小さい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断し、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信する第1の処理を行い、
前記時間情報Tの値が0よりも大きい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも低いと判断し、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信する第2の処理を行い、
前記時間情報Tの値が0である場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置と同じであると判断し、前記第1の処理または前記第2の処理を行う、ことを特徴とするデータ送受信装置。 2. The data transmission/reception device according to claim 1,
The transmission/reception processing unit includes:
The time information Ta is subtracted from the time information Tb to obtain the time information T;
If the value of the time information T is smaller than 0, it is determined that the degree of congestion of the Internet at the data transmission/reception device is higher than that at the remote data transmission/reception device, and a first process is performed to stop transmitting the video file to the cloud server and to receive from the remote data transmission/reception device the keyword that the remote data transmission/reception device received from the cloud server;
If the value of the time information T is greater than 0, it is determined that the congestion level of the Internet in the data transmission/reception device is lower than that of the remote data transmission/reception device, and a second process is performed to acquire the video file, transmit the video file to the cloud server, and receive the keyword from the cloud server.
A data transmission/reception device characterized in that, when the value of the time information T is 0, the degree of congestion of the Internet in the data transmission/reception device is determined to be the same as that of the remote data transmission/reception device, and the first processing or the second processing is performed.
前記送受信処理部は、
前記時間情報Tの値が0よりも小さい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断し、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信し、予め設定された時間待機した後に、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信する前記第1の処理を行う、ことを特徴とするデータ送受信装置。 3. The data transmission/reception device according to claim 2,
The transmission/reception processing unit includes:
When the value of the time information T is smaller than 0, the data transmission/reception device determines that the degree of congestion of the Internet is higher at the data transmission/reception device than at the remote data transmission/reception device, stops transmitting the video file to the cloud server, receives the keyword that the remote data transmission/reception device received from the cloud server from the remote data transmission/reception device, waits for a predetermined time, and then acquires the video file and transmits it to the cloud server, and performs the first processing of receiving the keyword from the cloud server.
前記送受信処理部は、
前記時間情報Tbから前記時間情報Taを減算することで、時間情報Tを求め、
前記時間情報Tの値が0よりも小さい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも高いと判断し、前記映像ファイルの前記クラウドサーバへの送信を停止し、前記遠隔データ送受信装置から、前記遠隔データ送受信装置が前記クラウドサーバから受信した前記キーワードを受信し、予め設定された値をNとして時間Nの間待機した後に、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信し、前記時間情報Taを算出し、前記映像ファイルを取得したときから前記時間Nの間待機した後に、前記遠隔データ送受信装置から前記時間情報Tbを受信し、前記時間情報Tを求める第3の処理を行い、
前記時間情報Tの値が0よりも大きい場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置よりも低いと判断し、前記映像ファイルを取得して前記クラウドサーバへ送信し、前記クラウドサーバから前記キーワードを受信し、前記時間情報Taを算出し、前記映像ファイルを取得したときから前記時間Nの間待機した後に、前記遠隔データ送受信装置から前記時間情報Tbを受信し、前記時間情報Tを求める第4の処理を行い、
前記時間情報Tの値が0である場合、当該データ送受信装置における前記インターネットの混雑度合いが前記遠隔データ送受信装置と同じであると判断し、前記第3の処理または前記第4の処理を行う、ことを特徴とするデータ送受信装置。 2. The data transmission/reception device according to claim 1,
The transmission/reception processing unit includes:
The time information Ta is subtracted from the time information Tb to obtain the time information T;
If the value of the time information T is smaller than 0, it is determined that the degree of congestion of the Internet at the data transmission/reception device is higher than that of the remote data transmission/reception device, and transmission of the video file to the cloud server is stopped. From the remote data transmission/reception device, the remote data transmission/reception device receives the keyword that the remote data transmission/reception device received from the cloud server, and after waiting for a time N, where N is a preset value, acquires the video file and transmits it to the cloud server, receives the keyword from the cloud server, calculates the time information Ta, and after waiting for the time N from the time the video file was acquired, receives the time information Tb from the remote data transmission/reception device, and performs a third process to obtain the time information T.
If the value of the time information T is greater than 0, it is determined that the degree of congestion of the Internet at the data transmission/reception device is lower than that of the remote data transmission/reception device, the video file is acquired and transmitted to the cloud server, the keyword is received from the cloud server, the time information Ta is calculated, and after waiting for the time N from the time when the video file was acquired, the time information Tb is received from the remote data transmission/reception device, and a fourth process is performed to determine the time information T;
A data transmission/reception device characterized in that, when the value of the time information T is 0, the degree of congestion of the Internet in the data transmission/reception device is determined to be the same as that of the remote data transmission/reception device, and the third process or the fourth process is performed.
前記送受信処理部は、
前記時間情報Tの絶対値が予め設定された閾値よりも大きい場合、前記時間Nを、予め設定された前記値よりも大きい値に設定し、前記時間情報Tの絶対値が前記閾値以下である場合、予め設定された前記値を前記時間Nに設定する、ことを特徴とするデータ送受信装置。 5. The data transmission/reception device according to claim 4,
The transmission/reception processing unit includes:
A data transmission/reception device characterized in that, when the absolute value of the time information T is greater than a predetermined threshold, the time N is set to a value greater than the predetermined value, and when the absolute value of the time information T is equal to or less than the threshold, the time N is set to the predetermined value.
前記発話文再生部は、
前記発話文の再生を開始する際に、前記送受信処理部により前記第1の発声ファイルが取得中である場合、前記第1の発声ファイルの取得が完了するまで待機し、または前記発声再生部により前記第2の発声ファイルが再生中である場合、前記第2の発声ファイルの再生が完了するまで待機し、待機した後に前記発話文を再生する、ことを特徴とするデータ送受信装置。 6. The data transmission/reception device according to claim 1,
The spoken sentence reproducing unit
A data transmission/reception device characterized in that, when starting playback of the spoken sentence, if the first vocalization file is being acquired by the transmission/reception processing unit, the device waits until the acquisition of the first vocalization file is completed, or, if the second vocalization file is being played by the vocalization playback unit, the device waits until the playback of the second vocalization file is completed, and plays the spoken sentence after waiting.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021016019A JP7576991B2 (en) | 2021-02-03 | 2021-02-03 | Data transmission/reception device and program equipped in robot |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021016019A JP7576991B2 (en) | 2021-02-03 | 2021-02-03 | Data transmission/reception device and program equipped in robot |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022119055A JP2022119055A (en) | 2022-08-16 |
JP7576991B2 true JP7576991B2 (en) | 2024-11-01 |
Family
ID=82844988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021016019A Active JP7576991B2 (en) | 2021-02-03 | 2021-02-03 | Data transmission/reception device and program equipped in robot |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7576991B2 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020202354A1 (en) | 2019-03-29 | 2020-10-08 | 本田技研工業株式会社 | Communication robot, control method for same, information processing server, and information processing method |
-
2021
- 2021-02-03 JP JP2021016019A patent/JP7576991B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020202354A1 (en) | 2019-03-29 | 2020-10-08 | 本田技研工業株式会社 | Communication robot, control method for same, information processing server, and information processing method |
Non-Patent Citations (1)
Title |
---|
萩尾勇太,他9名,人と一緒にテレビを視聴するコミュニケーションロボットの試作と検証,電子情報通信学会技術研究報告 Vol.119 No.445,日本,一般社団法人電子情報通信学会,2020年02月26日,第119巻,第445号,pp.7-12 |
Also Published As
Publication number | Publication date |
---|---|
JP2022119055A (en) | 2022-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10067937B2 (en) | Determining delay for language translation in video communication | |
JP6640359B2 (en) | Wireless audio sync | |
US9325809B1 (en) | Audio recall during voice conversations | |
US20170034263A1 (en) | Synchronized Playback of Streamed Audio Content by Multiple Internet-Capable Portable Devices | |
US10732924B2 (en) | Teleconference recording management system | |
CN109168059B (en) | Lip sound synchronization method for respectively playing audio and video on different devices | |
JP7149323B2 (en) | Method and apparatus for synchronizing application consumption of remote data | |
US10805664B2 (en) | Wireless audio synchronization | |
JP5394307B2 (en) | Synchronized playback system, synchronized playback method, and synchronized playback program | |
JP7576991B2 (en) | Data transmission/reception device and program equipped in robot | |
JP4190946B2 (en) | Composite content synchronous delivery method, server, and program | |
WO2018224839A2 (en) | Methods and systems for generating a reaction video | |
WO2018173312A1 (en) | Virtual reality viewing system, reproduction synchronizing method, and virtual reality viewing program | |
US12113937B2 (en) | Systems and methods for improved audio/video conferences | |
JP2020174378A (en) | Synchronization of media rendering in heterogeneous networking environment | |
JP5340880B2 (en) | Output control device for remote conversation system, method thereof, and computer-executable program | |
JP2009010581A (en) | Reception system, receiver and program, for receiving and simultaneously reproducing a different kind of synchronized streaming data | |
US11089164B2 (en) | Teleconference recording management system | |
US9548998B1 (en) | Asynchronous communication system architecture | |
US20070248170A1 (en) | Transmitting Apparatus, Receiving Apparatus, and Reproducing Apparatus | |
JP2010218013A (en) | Data distribution system | |
JP2005295343A (en) | Television broadcast complementation system, terminal, television broadcast complementation method, and computer program | |
US20230379285A1 (en) | Synchronized conversation space commands in a social messaging platform | |
JP2011223323A (en) | Interactive service provision system, interactive service provision device, moving image provision device, interactive service provision method, and moving image provision program | |
JP2007318283A (en) | Packet communication system, data receiver |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240917 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240927 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241022 |