WO2014178219A1

WO2014178219A1 - 情報処理装置および情報処理方法

Info

Publication number: WO2014178219A1
Application number: PCT/JP2014/054573
Authority: WO
Inventors: 周藤　泰広; 北野　宏明; 翔太朗寳理; 大二伊藤; 哲夏目; 大島　浩一; 弘也水村; 良浩高木; 康夫佐久間
Original assignee: ソニー株式会社
Priority date: 2013-04-30
Filing date: 2014-02-25
Publication date: 2014-11-06
Also published as: US10075544B2; JPWO2014178219A1; CN104135694A; EP2993907A1; EP2993907A4; JP6384474B2; US20160112524A1; CN104135694B; CN105144736A; CN203933870U

Abstract

【課題】コンテンツに対するユーザのアクティビティによって発生した情報を、コンテンツに関連付けて有効に活用する。【解決手段】コンテンツ再生中のユーザによるアクティビティを検出するアクティビティ検出部と、上記アクティビティに関する情報に基づいてタグ情報を生成するタグ生成部と、上記タグ情報を上記アクティビティに対応する上記コンテンツ内の１または複数の位置に関連付けるタグ関連付け部とを備える情報処理装置が提供される。

Description

情報処理装置および情報処理方法

　本開示は、情報処理装置および情報処理方法に関する。

　例えば放送されるテレビ番組のように、元来一方的なものであったコンテンツの視聴体験は、近年のコンテンツ提供手段の多様化と、ソーシャルメディアなどの情報発信手段の普及とによって、視聴者がコンテンツに対して何らかのアクティビティを実行する双方向的なものになりつつある。例えば、特許文献１には、放送中の番組の視聴者に対して外部の投稿サイトへの投稿コメントを提示することによって双方向的な視聴体験を提供する技術が記載されている。

特開２０１３－１２９５５号公報

　上記の例のように双方向的なコンテンツの視聴体験が実現されつつある結果、ネットワーク上でコンテンツに対するユーザのアクティビティによって膨大な情報が発生している。例えば特許文献１の例のようにユーザがコンテンツに対して入力したコメントや、ユーザがコンテンツの内容に関して実行したＷｅｂ検索の結果、ユーザがコンテンツの内容に触発されて視聴した他のコンテンツなどの情報の多くは、ネットワーク上のサーバや端末装置の中に蓄積されているが、元のコンテンツに関連付けて活用されていはいない。

　そこで、本開示では、コンテンツに対するユーザのアクティビティによって発生した情報を、コンテンツに関連付けて有効に活用することを可能にする、新規かつ改良された情報処理装置および情報処理方法を提案する。

　本開示によれば、コンテンツ再生中のユーザによるアクティビティを検出するアクティビティ検出部と、上記アクティビティに関する情報に基づいてタグ情報を生成するタグ生成部と、上記タグ情報を上記アクティビティに対応する上記コンテンツ内の１または複数の位置に関連付けるタグ関連付け部とを備える情報処理装置が提供される。

　また、本開示によれば、コンテンツ再生中のユーザによるアクティビティを検出することと、上記アクティビティに関する情報に基づいてタグ情報を生成することと、上記タグ情報を上記アクティビティに対応する上記コンテンツ内の１または複数の位置に関連付けることとを含む情報処理方法が提供される。

　以上説明したように本開示によれば、コンテンツに対するユーザのアクティビティによって発生した情報を、コンテンツに関連付けて有効に活用することができる。

本開示の第１の実施形態に係るシステムの概要について説明するための図である。図１に示したシステムにおける情報のフローの例を示す図である。本開示の第１の実施形態に係る各装置の概略的な機能構成を示すブロック図である。本開示の第１の実施形態におけるホーム画面の表示例を示す図である。本開示の第１の実施形態におけるホーム画面の表示例を示す図である。本開示の第１の実施形態における再生画面の表示例を示す図である。本開示の第１の実施形態における再生画面の表示例を示す図である。本開示の第１の実施形態における再生画面と他の画面との連携の例を示す図である。本開示の第１の実施形態における再生画面で画面内位置を指定する場合の表示例を示す図である。本開示の第１の実施形態における再生画面でコミュニケーションサービスが提供される場合の表示例を示す図である。本開示の第２の実施形態に係る各装置の概略的な機能構成を示すブロック図である。本開示の第２の実施形態における再生画面の表示例を示す図である。本開示の第２の実施形態における再生画面の表示例を示す図である。本開示の第２の実施形態におけるタグカテゴリ情報表示の例を示す図である。本開示の第２の実施形態におけるタグカテゴリ情報表示の表示プロセスの例を示すフローチャートである。本開示の第３の実施形態に係る各装置の概略的な機能構成を示すブロック図である。情報処理装置のハードウェア構成を説明するためのブロック図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　なお、説明は以下の順序で行うものとする。
　１．第１の実施形態
　　１－１．システムの概要
　　１－２．機能構成
　　１－３．画面表示例
　２．第２の実施形態
　３．第３の実施形態
　４．ハードウェア構成
　５．補足

　（１．第１の実施形態）
　（１－１．システムの概要）
　図１は、本開示の第１の実施形態に係るシステムの概要について説明するための図である。図１を参照すると、本実施形態に係るシステム１０は、サーバ１００とクライアント２００とを含む。サーバ１００とクライアント２００とは、いずれも後述する情報処理装置のハードウェア構成によって実現され、有線または無線の各種ネットワークによって互いに接続される。なお、サーバ１００は、必ずしも単一の情報処理装置によって実現されなくてもよく、ネットワークによって互いに接続された複数の情報処理装置の協働によって実現されてもよい。

　まず、サーバ１００は、クライアント２００に対して視聴可能なコンテンツを提示する（Ｓ１０１）。クライアント２００のユーザは、提示されたコンテンツの中から視聴したいコンテンツを選択し、サーバ１００にリクエストを送信する（Ｓ１０３）。リクエストを受信したサーバ１００は、例えば動画配信サーバなどのコンテンツプロバイダ５０にリクエストを転送し（Ｓ１０５）、クライアント２００のユーザからリクエストされたコンテンツを取得する（Ｓ１０７）。

　サーバ１００は、コンテンツプロバイダ５０から取得したコンテンツをクライアント２００に提供する（Ｓ１０９）にあたって、タグ情報を一緒に提供する（Ｓ１１１）。タグ情報は、例えばサーバ１００が同じコンテンツを視聴した他のユーザのアクティビティに基づいて生成した情報であり、少なくともコンテンツの再生位置に関連付けられている。ここでいうユーザのアクティビティは、例えばコンテンツの再生中にコメントを投稿したり、Ｗｅｂ検索を実行したり、写真や映像などの他のコンテンツを視聴したりすることでありうる。本実施形態では、こうしたユーザのアクティビティに基づいて生成されたタグ情報がコンテンツとともに提示される。クライアント２００のユーザは、タグ情報を選択することによって、例えばコンテンツに関連する情報に容易にアクセスできたり、コンテンツに対する他のユーザの受け取り方を知ることができる。

　クライアント２００のユーザによっていずれかのタグ情報が選択された場合（Ｓ１１３）、サーバ１００は、例えば選択されたタグ情報に含まれるＵＲＬ（Uniform　Resource　Locator）を用いてＷＷＷ（World　Wide　Web）６０にアクセスし（Ｓ１１５）、Ｗｅｂページのスナップショットを取得する（Ｓ１１７）。取得されたスナップショットは、クライアント２００に送信される（Ｓ１１９）。また、タグ情報に他のユーザのコメントや他のコンテンツ（Ｖｉｄｅｏ）が含まれる場合、同様にサーバ１００はこれらの情報をクライアント２００に提供する（Ｓ１２１）。

　また、クライアント２００のユーザは、コンテンツに対してコメントを入力することができる（Ｓ１２３）。サーバ１００は、クライアント２００から受信した新たなコメントに基づいて、さらにタグ情報を生成する。さらに、クライアント２００のユーザによるコンテンツに対する他のアクティビティ、例えばコンテンツの内容に関して実行したＷｅｂ検索の結果や、他のコンテンツの視聴などの情報も、コメントと同様にサーバ１００に送信されうる。サーバ１００はこれらの情報に基づいて新たなタグ情報を生成してコンテンツに追加で関連付ける。

　さらに、サーバ１００は、クライアント２００に対して、コンテンツ自体の提供とは別に、他のユーザのコメントやコンテンツのリコメンド、ランキングなどの情報を提供してもよい（Ｓ１２５～Ｓ１２９）。こうした情報によって、例えばクライアント２００のユーザが視聴するコンテンツを選択しやすくすることができる。

　図２は、図１に示したシステムにおける情報のフローの例を示す図である。図２を参照すると、本実施形態に係るシステム１０では、大きく分けて、コンテンツ選択（Ｓ２０１～Ｓ２１３）、リコメンド（Ｓ２１５～Ｓ２２１）、およびサブ情報（Ｓ２２３～Ｓ２３１）のフローが発生しうる。

　まず、クライアント２００においてユーザがコンテンツ視聴のためのアプリケーションを起動（Ｓ２０１）すると、ホーム画面（Ｓ２０３）が表示される。ホーム画面には、キュレータリスト（Ｓ２０５）および／またはグループリスト（Ｓ２０７）が表示される。本実施形態において、キュレータは、システム１０を介して提供されるコンテンツを整理する役割を担うユーザである。キュレータは、例えば多数あるコンテンツの中から自らの好みに従ってコンテンツを収集する。ユーザがキュレータリスト（Ｓ２０５）の中からいずれかのキュレータを選択すると、そのキュレータが収集したコンテンツのリスト（Ｓ２０９）が表示される。一般のユーザは、好みが近いキュレータをフォローすることによって、好みに合うコンテンツにアクセスすることが容易になる。

　一方、本実施形態において、グループは、上記のキュレータとフォロワーのような従属関係ではなく、各ユーザが対等な関係で形成されるグループである。システム１０では、例えばグループに属する複数のユーザが視聴したり、ポジティブに評価したりしたコンテンツが収集されうる。グループは、例えば友人同士などのユーザが意図的に設定した社会的なグループであってもよいし、コンテンツの視聴履歴や後述するタグ情報の収集などによって好みが似ていること推定されるユーザが自動的に分類されるグループであってもよい。ユーザがグループリスト（Ｓ２０７）の中からいずれかのグループを選択すると、そのグループに関連付けて収集されたコンテンツのリスト（Ｓ２０９）が表示される。ユーザは、グループリストを介して、例えば友人が視聴したコンテンツや、好みが似た他のユーザが視聴したコンテンツなどに容易にアクセスすることができる。

　ユーザがコンテンツのリスト（Ｓ２０９）の中からいずれかのコンテンツを選択すると、そのコンテンツの再生画面（Ｓ２１１）が表示される。再生画面に表示されるホームボタン（Ｓ２１３）を選択することで、ユーザはホーム画面（Ｓ２０３）に戻ることができる。なお、例えば以前にアプリケーションがコンテンツの視聴途中で終了した場合や、最初に視聴するコンテンツが予め設定されている場合などには、アプリケーションの起動（Ｓ２０１）に続いて自動的にコンテンツの再生画面（Ｓ２１１）が表示されてもよい。

　コンテンツの再生画面（Ｓ２１１）には、再生中のコンテンツに加えてリコメンドに関する情報が表示されうる。図示された例では、再生画面にソーシャルメディアからのリコメンド情報（Ｓ２１５）が表示される。また、再生画面には同じコンテンツを視聴した友人の情報（Ｓ２１７）も表示されうる。さらに、ユーザは、再生画面に表示されたボタンなどを用いて、コンテンツに対するポジティブな評価（Ｓ２１９“Ｎｉｃｅ！”）を入力することもできる。ポジティブな評価が入力された場合、そのコンテンツについてのリコメンド（Ｓ２２１）が実行されうる。リコメンドは、例えばユーザと同じグループに属する他のユーザに対して実行されてもよく、ユーザがキュレータである場合にはそのフォロワーに対して実行されてもよい。このとき、同じコンテンツを視聴した友人の情報（Ｓ２１７）に基づいて、既にそのコンテンツを視聴したユーザはリコメンドの対象から除外されてもよい。

　また、コンテンツの再生画面（Ｓ２１１）には、再生中のコンテンツに加えてタグ情報（Ｓ２２３）が表示されうる。図示された例では、ユーザによるソーシャルメディアなどへのコメントの投稿（Ｓ２２５）およびＷｅｂなどの検索（Ｓ２２７）によってタグ情報が生成されている。このようなタグ情報の生成については、後で詳しく説明する。タグ情報や、検索によって得られたＵＲＬリスト（Ｓ２２９）などは、サブ情報（Ｓ２３１）としてコンテンツに関連付けて再生画面（Ｓ２１１）に表示されてもよい。

　（１－２．機能構成）
　図３は、本開示の第１の実施形態に係る各装置の概略的な機能構成を示すブロック図である。以下、図３を参照して、各装置の機能構成について説明する。なお、図示されている機能構成は本実施形態の説明のために簡略化されており、各装置は図示されていない機能構成をさらに含んでもよい。図示されていない機能構成は、各装置の一般的な機能構成として既に知られたものでありうるため、詳細な説明は省略する。

　　（サーバ）
　サーバ１００は、通信部１１０と、再生制御部１２０と、タグＤＢ１３０と、タグ情報表示制御部１４０と、アクティビティ検出部１５０と、タグ生成部１６０と、タグ関連付け部１７０と、コミュニケーションサービス提供部１８０とを含む。

　通信部１１０は、例えば通信装置によって実現され、有線または無線の各種ネットワークを介してクライアント２００と通信する。また、通信部１１０は、ネットワークを介して上述したコンテンツプロバイダ５０やＷＷＷ６０などとも通信し、コンテンツデータなどを取得する。通信部１１０は、受信したコンテンツデータを再生制御部１２０に提供し、再生制御部１２０の制御に従ってコンテンツデータをクライアント２００に送信する。また、通信部１１０は、タグ情報表示制御部１４０の制御に従って、タグ情報を表示するためのデータをクライアント２００に送信する。さらに、通信部１１０は、クライアント２００のユーザがコンテンツに対して実行した各種のアクティビティに関連してクライアント２００の通信部２１０が送受信する情報を傍受してアクティビティ検出部１５０に提供する。また、通信部１１０は、コミュニケーションサービス提供部１８０によって提供されるサービスに関する情報をクライアント２００との間で送受信する。

　再生制御部１２０は、例えばＣＰＵなどのプロセッサがメモリに格納されたプログラムに従って動作することによって実現され、通信部１１０が取得したコンテンツデータの再生を制御する。例えば、再生制御部１２０は、クライアント２００のユーザによって別途の操作がされない場合には、コンテンツプロバイダ５０から取得したコンテンツを最初から順次再生しうる。ここで、例えば、後述するタブ情報表示制御部１４０によってコンテンツについて生成されたタグ情報がコンテンツの再生画面に表示され、クライアント２００のユーザが表示されたタグ情報を選択したような場合、再生制御部１２０はコンテンツを当該タグ情報に対応する再生位置から再生してもよい。また、後述するコミュニケーションサービス提供部１８０によってタグ情報に関連するコミュニケーションサービスが提供されている場合、再生制御部１２０は、コンテンツを当該タグ情報に対応する再生位置を含む範囲で繰り返し再生してもよい。また、再生制御部１２０は、コンテンツを選択するためのホーム画面を表示させてもよい。

　タグＤＢ１３０は、例えばストレージ装置によって実現され、コンテンツについて生成されたタグ情報を格納する。タグ情報は、例えば後述するタグ生成部１６０によって生成され、タグ関連付け部１７０によって少なくともコンテンツの再生位置に関連付けられた上で、タグＤＢ１３０に格納される。また、タグ情報は、初期設定として用意されたものを含んでもよい。タグ情報は、例えばテキストを含みうる他、Ｗｅｂページや他のコンテンツなどへのリンクやサムネイルなどを含んでもよい。例えば、コンテンツの再生位置がタイムスタンプによって定義される場合、タグ情報は「タイムスタンプ１ｈ２３ｍ４５ｓ６７８に関連付けられたタグ情報」として記録されうる。なお、タグ情報が関連付けられる再生位置は、範囲として定義されてもよい。さらに、タグ情報は、コンテンツが映像コンテンツである場合、映像コンテンツの画面内位置に関連付けられてもよい。この場合、タグ情報は例えば「（Ｘ，Ｙ，Ｔ）＝（０．１２３，０．４５６，１ｈ２３ｍ４５ｓ６７８）に関連付けられたタグ情報」として記録されうる。この例において、Ｘは画面内の横位置、Ｙは画面内の縦位置、Ｔはタイムスタンプを表す。なお、ＸおよびＹのような画面内位置は、例えばクライアント２００ごとの再生画面のサイズの相違を考慮して、正規化した値で記録されてもよい。タグ情報が関連付けられる画面内位置も、範囲または領域として定義されうる。

　タグ情報表示制御部１４０は、例えばＣＰＵなどのプロセッサがメモリに格納されたプログラムに従って動作することによって実現され、タグＤＢ１３０から読み出されたタグ情報を、コンテンツの再生画面に表示させる。例えば、タグ情報表示制御部１４０は、タグ情報を、関連付けられた再生位置ごとに配列して再生画面に表示させてもよい。このとき、タグ情報表示制御部１４０は、互いに近接する再生位置に関連付けられたタグ情報をグループ化して表示させてもよい。また、タグ情報が画面内位置にも関連付けられている場合、タグ情報表示制御部１４０は、同じまたは近接する再生位置に関連付けられているが異なる画面内位置に関連付けられたタグ情報を別々に表示させてもよい。また、タグ情報表示制御部１４０は、タグ情報を選択可能なアイコンとして再生画面に表示させうる。アイコンは、例えば、タグ情報に関連付けられた再生位置でのコンテンツのキャプチャ画像や、タグ情報に含まれる情報の種類を示すアイコンなどを含みうる。クライアント２００のユーザがタグ情報のアイコンを選択した場合、タグ情報表示制御部１４０は、当該タグ情報とともにグループ化されたタグ情報を個別に表示する画面を再生画面に別途表示させてもよい。また、上記のように、このとき、再生制御部１２０によって、コンテンツが選択されたタグ情報の再生位置にジャンプして再生されてもよい。なお、タグ情報表示制御部１４０によるタグ情報の表示の具体的な例については後述する。

　アクティビティ検出部１５０は、例えばＣＰＵなどのプロセッサがメモリに格納されたプログラムに従って動作することによって実現され、コンテンツ再生中のユーザによるアクティビティを検出する。より具体的には、アクティビティ検出部１５０は、通信部１１０を介して、コンテンツが再生されているクライアント２００との間で送受信された情報を傍受し、その情報に基づいて、クライアント２００でコンテンツの再生中にユーザが実行したアクティビティを検出する。例えば、アクティビティ検出部１５０によって検出されるアクティビティは、ユーザによるコメントの投稿を含みうる。コメントは、例えばサーバ１００によって提供されるサービス上で投稿されてもよいし、他のソーシャルメディアに投稿されてもよい。また、アクティビティ検出部１５０によって検出されるアクティビティは、ユーザによる再生中のコンテンツ以外の情報へのアクセスを含んでもよい。ここでアクセスされる情報は、例えばＷｅｂページであってもよく、また別のコンテンツであってもよい。これらの情報は、例えばユーザがキーワード検索を実行することによってアクセスされうる。さらに、アクティビティ検出部１５０は、後述するコミュニケーションサービス提供部１８０によって提供されるコミュニケーションサービスにおけるユーザの発言をアクティビティとして検出してもよい。

　タグ生成部１６０は、例えばＣＰＵなどのプロセッサがメモリに格納されたプログラムに従って動作することによって実現され、アクティビティ検出部１５０によって検出されたアクティビティに関する情報に基づいて新たなタグ情報を生成する。上記の通り、生成されるタグ情報は、例えばテキストを含みうる他、Ｗｅｂページや他のコンテンツなどへのリンクやサムネイルなどを含みうる。タグ生成部１６０は、かかるタグ情報を、検出されたユーザのアクティビティに関する各種のログを解析することによって生成しうる。例えば、クライアント２００でコンテンツの再生中にユーザがコメントを投稿したり、コミュニケーションサービスにおいて発言したりした場合、アクティビティ検出部１５０は投稿されたコメントまたは発言の情報を取得し、タグ生成部１６０はコメントをテキストとして含むタグ情報を生成しうる。また、例えば、クライアント２００でコンテンツの再生中にユーザがＷｅｂ検索を実行した場合、アクティビティ検出部１５０は検索クエリや検索結果の情報を取得し、タグ生成部１６０は検索クエリに含まれるキーワードのテキストと検索結果のＷｅｂページのリンクやスナップショットとを含むタグ情報を生成しうる。さらに、例えば、クライアント２００でコンテンツの再生中にユーザが他のコンテンツを再生した場合、アクティビティ検出部１５０は再生された他のコンテンツのアドレスまたは他のコンテンツ自体の情報を取得し、タグ生成部１６０は他のコンテンツへのリンクまたは他のコンテンツ自体を含むタグ情報を生成しうる。なお、リンクや他のコンテンツは、例えばコメント投稿時のユーザ操作によって明示的に添付されてもよい。

　タグ関連付け部１７０は、例えばＣＰＵなどのプロセッサがメモリに格納されたプログラムに従って動作することによって実現され、タグ生成部１６０によって生成されたタグ情報を、タグ情報の元になったアクティビティに対応するコンテンツの再生位置に関連付ける。タグ関連付け部１７０によってコンテンツに関連付けられたタグ情報は、例えばタグＤＢ１３０に格納されてもよく、またタグ情報表示制御部１４０に提供されてクライアント２００でリアルタイムに表示されてもよい。例えば、タグ情報が関連付けられる再生位置は、コメントが投稿された時や、Ｗｅｂ検索が実行された時、他のコンテンツの再生が開始された時のコンテンツ（元々再生されているコンテンツ）の再生位置でありうる。あるいは、ユーザがコメントの入力を開始した時や、Ｗｅｂ検索のためのキーワードの入力を開始した時、他のコンテンツの再生のためのアプリケーションを起動した時などが特定可能であれば、それらに対応する再生位置にタグ情報が関連付けられてもよい。なお、タグ関連付け部１７０は、複数のタグ情報について特定された再生位置が互いに近接している場合、これらのタグ情報を共通する再生位置に関連付けてもよい。また、上述のように本実施形態においてタグ情報は映像コンテンツの画面内位置にも関連付けられうる。タグ関連付け部１７０は、例えばユーザがアクティビティにおいて明示的に指定した画面内位置にタグ情報を関連付ける。ここで、画面内位置は範囲または領域として指定されてもよい。あるいは、例えばユーザがクライアント２００でＨＭＤ（Head　Mounted　Display）などを用いてコンテンツを視聴しており、視線検出などを利用してコンテンツの再生画面におけるユーザの注視領域が検出可能である場合、タグ関連付け部１７０は、検出された注視領域に基づいてタグ情報を関連付ける画面内位置を決定してもよい。

　コミュニケーションサービス提供部１８０は、例えばＣＰＵなどのプロセッサがメモリに格納されたプログラムに従って動作することによって実現され、複数のクライアント２００のユーザにコミュニケーションサービスを提供する。提供されるコミュニケーションサービスは、例えばユーザ間で発言を交換するチャットのようなものでありうる。例えば、コミュニケーションサービス提供部１８０は、同じコンテンツの近接する再生位置（および／または近接する画面内位置）に関連付けられるタグ情報の元になるアクティビティを実行した複数のユーザにコミュニケーションサービスを提供しうる。より具体的には、コミュニケーションサービス提供部１８０は、例えばこれらのユーザが参加するチャットルームを開設する。チャットルームに入室したユーザは、例えば後述する再生画面内の別画面において発言を交換することが可能である。発言には、例えばＷｅｂページや他のコンテンツなどへのリンクが付加されていてもよい。こうしたチャットルームでのユーザの発言や、発言に付加されたリンクなどの情報も、アクティビティ検出部１５０によってコンテンツ再生中のアクティビティとして検出されうる。また、ユーザがチャットルームを利用している間、再生制御部１２０が対象の再生位置を含む範囲でコンテンツを繰り返し再生してもよい。

　　（クライアント）
　クライアント２００は、通信部２１０と、表示制御部２２０と、表示部２３０と、音声制御部２４０と、音声出力部２５０と、操作部２６０とを含む。クライアント２００は、例えば、各種のＰＣ（Personal　Computer）、タブレット端末、スマートフォン、ゲーム機、メディアプレーヤなど、ユーザがコンテンツを視聴することが可能な各種の端末装置でありうる。

　通信部２１０は、例えば通信装置によって実現され、有線または無線の各種ネットワークを介してサーバ１００と通信する。通信部２１０は、コンテンツデータをサーバ１００から受信して、表示制御部２２０および音声制御部２４０に提供する。また、通信部２１０は、コンテンツに関するタグ情報を表示するためのデータをサーバ１００から受信して、表示制御部２２０に提供する。さらに、通信部２１０は、コンテンツの再生中にユーザが操作部２６０に与えた操作入力に従ってデータを送受信する。例えば、通信部２１０は、操作部２６０に与えられた検索の操作入力（検索キーワードの入力および検索実行の指示）に従って検索クエリを送信し、検索結果のＷｅｂページや他のコンテンツなどの情報を受信する。また、例えば、通信部２１０は、操作部２６０に与えられたコメント投稿の操作入力（コメントのテキスト入力および投稿実行の指示）に従ってサーバ１００またはソーシャルメディアのサーバなどにコメントを送信する。このようにしてコンテンツの再生中に通信部２１０が送受信するデータは、サーバ１００の通信部１１０を介して他のサーバなどとやりとりされる。上述の通り、サーバ１００の通信部１１０は、このときに送受信されるデータを傍受することによって、ユーザがコンテンツに対して実行した各種のアクティビティに関する情報をアクティビティ検出部１５０に提供する。

　表示制御部２２０は、例えばＣＰＵなどのプロセッサがメモリに格納されたプログラムに従って動作することによって実現され、例えばＬＣＤまたは有機ＥＬディスプレイなどの各種の表示装置によって実現される表示部２３０における画像の表示を制御する。表示制御部２２０は、通信部２１０から、コンテンツデータと、コンテンツに関するタグ情報を表示するためのデータと、ユーザが操作部２６０に与えた操作入力に従って受信されたデータとを取得する。これらのデータに基づいて、表示制御部２２０は、表示部２３０に、コンテンツの再生画面を表示させる。再生画面は、例えば、コンテンツ画像と、コンテンツ画像の周辺に表示されるタグ情報のアイコンとを含みうる。また、表示制御部２２０は、ユーザがコンテンツに対する各種のアクティビティを実行するための画面を、再生画面の中に、または再生画面とは別に表示させてもよい。表示制御部２２０は、例えば、ユーザがコメントを入力するためのコメント入力欄や、検索キーワードを入力するためのキーワード入力欄、および／またはアクティビティの対象になる画面内位置を指定するための操作要素などを表示させる。また、表示制御部２２０は、サーバ１００から取得したデータに基づいて表示部２３０にホーム画面を表示させてもよい。なお、表示制御部２２０が表示部２３０に表示させる画面の例については、後にさらに詳しく説明する。

　音声制御部２４０は、例えばＣＰＵなどのプロセッサがメモリに格納されたプログラムに従って動作することによって実現され、例えばスピーカなどによって実現される音声出力部２５０における音声の出力を制御する。音声制御部２４０は、通信部２１０から取得したコンテンツデータに基づいて、音声出力部２５０からコンテンツ音声を出力させる。コンテンツ音声は、表示部２３０に表示されるコンテンツ画像に連動する音声である。また、音声制御部２４０は、ユーザが操作部２６０に与えた操作入力に従って受信されたデータを通信部２１０から取得し、このデータに基づいて音声出力部２５０から音声を出力させてもよい。なお、本実施形態ではコンテンツが映像コンテンツである場合を例として説明しているが、他の実施形態では、再生されるコンテンツや再生中のユーザのアクティビティによって取得されるコンテンツが、音楽コンテンツなど画像を含まないコンテンツであってもよい。そのようなコンテンツは主に音声制御部２４０および音声出力部２５０を介して出力されうる。

　操作部２６０は、例えばタッチパネル、マウス、またはキーボードのような各種の入力装置によって実現され、ユーザによる操作入力を取得する。取得された操作入力に基づいて、例えば通信部２１０を介してサーバ１００を含む各種サーバに情報が送信される。これによって、例えば再生するコンテンツの選択や、コンテンツ再生の開始および終了などが制御されうる。また、コンテンツ再生中に操作部２６０によって取得された検索の操作入力（検索キーワードの入力および検索実行の指示）やコメント投稿の操作入力（コメントのテキスト入力および投稿実行の指示）なども、通信部２１０を介して各種サーバに送信されうる。また、操作部２６０が取得した操作入力は、表示制御部２２０または音声制御部２４０に提供され、表示部２３０に表示される画像または音声出力部２５０から出力される音声の制御に用いられてもよい。

　（１－３．画面表示例）
　　（ホーム画面）
　図４および図５は、本開示の第１の実施形態におけるホーム画面の表示例を示す図である。ホーム画面は、例えばクライアント２００でユーザがコンテンツ視聴のためのアプリケーションを起動したときに、表示制御部２２０の制御によって表示部２３０に表示されうる。

　図４を参照すると、ホーム画面１０００には、コンテンツアイコン１００１が表示される。コンテンツアイコン１００１は、例えばコンテンツのサムネイルまたはスナップショットなどの画像であり、キュレータ領域１００３、またはグループ領域１００５に区分して配置される。キュレータ領域１００３には、上述したキュレータによって収集されたコンテンツのコンテンツアイコン１００１が表示される。グループ領域１００５には、上述したユーザのグループについて収集されたコンテンツのコンテンツアイコン１００１が表示される。これらの領域は、上述したキュレータリストやグループリストとして機能しうる。図示された例では、キュレータ領域１００３およびグループ領域１００５がそれぞれ円形または楕円形で表示される。それぞれのキュレータ領域１００３およびグループ領域１００５は、例えばユーザがキュレータをフォローしている場合や、ユーザがグループに分類されている場合に大きく表示されうる。また、各領域は、ユーザがキュレータまたはグループについて収集されたコンテンツを視聴する頻度が高い場合や、キュレータの人気度が高い場合、ユーザとグループとの好みが近い場合などに大きく表示されてもよい。

　収集されたコンテンツが多い場合、各領域に配置されるコンテンツアイコン１００１は、各キュレータまたはグループについて収集されたコンテンツのうち、人気度や視聴回数などに応じて抽出された代表的なものであってもよい。例えばコンテンツに対してコメントなどの他のユーザからのアクティビティが多く検出されている場合、コンテンツアイコン１００１は光るなどのエフェクト１００７を伴って表示され、ユーザが「盛り上がっている」コンテンツを見つけることを容易にしてもよい。ユーザがいずれかの領域を選択すると、そのキュレータまたはグループに対応するコンテンツのリストが表示されうる。また、ユーザがコンテンツアイコン１００１を選択すると、直接的にそのコンテンツの視聴を開始することが可能であってもよい。

　図５に示すように、ユーザがキュレータ領域１００３またはグループ領域１００５を拡大すると、その領域に配置されたコンテンツアイコン１００１が拡大表示される。あるいは、領域に配置されたコンテンツが収集されたコンテンツの一部である場合、領域が拡大されたことによってその領域に配置される他のコンテンツについてのコンテンツアイコン１００１が新たに表示されてもよい。ある領域が拡大された場合、他の領域は縮小されたり、ホーム画面１０００の周辺部に移動されたりしうる。図示された例では、キュレータＡについてのキュレータ領域１００３ａが拡大されたために、キュレータＢについてのキュレータ領域１００３ｂ、およびグループ１，２についてのグループ領域１００５ａ，１００５ｂが縮小され、ホーム画面１０００の周辺部に移動されている。

　　（再生画面）
　図６および図７は、本開示の第１の実施形態における再生画面の表示例を示す図である。再生画面は、例えばクライアント２００でユーザがコンテンツ視聴のためのアプリケーションを起動し、上述したホーム画面１０００などを介して視聴するコンテンツを選択したときに、表示制御部２２０の制御によって表示部２３０に表示されうる。

　図６を参照すると、再生画面２０００には、コンテンツ画像２００１と、タグ一覧表示２００３と、タグ詳細表示２００５と、コメント入力欄２００７と、再生コントロール２００９と、ホームボタン２０１１と、リコメンド情報２０１３とが表示される。

　コンテンツ画像２００１は、サーバ１００が再生制御部１２０の制御に従ってクライアント２００に送信したデータに基づいて表示されるコンテンツの画像である。図示された例においてコンテンツは映像コンテンツであるが、上述のようにコンテンツは音楽コンテンツなど画像を含まないコンテンツであってもよい。その場合、コンテンツ画像２００１としては、例えば音楽コンテンツに対応してサーバ１００から提供されたイメージ画像、またはサーバ１００もしくはクライアント２００で生成された視覚エフェクト画像が表示されてもよく、再生画面２０００がコンテンツ画像２００１を含まなくてもよい。

　　（タグ一覧表示）
　タグ一覧表示２００３は、再生中のコンテンツ、すなわち図示された例ではコンテンツ画像２００１として表示されているコンテンツに関連付けられたタグ情報の一覧を表示する。本実施形態において、タグ情報の一覧を表示するためのデータは、サーバ１００のタグ情報表示制御部１４０によって提供される。上述のように、タグ情報表示制御部１４０は、既に生成されたタグ情報に加えてタグ関連付け部１７０新たにコンテンツに関連付けられたタグ情報に基づくデータを提供しうる。従って、再生画面２０００でコンテンツを視聴しているユーザ、または他のユーザのアクティビティに基づいて、タグ関連付け部１７０がコンテンツに新たなタグ情報を関連付けた場合、タグ情報表示制御部１４０から提供される新たなデータによって、タグ一覧表示２００３は新たなタグ情報を含む表示に動的に更新されうる。より具体的には、例えば、後述する種類アイコン２０２５が追加されたり、グループ内タグ数２０２７の数字が徐々に増えたりしてもよい。

　図示された例において、タグ一覧表示２００３では、タグ情報を示すアイコンとして、各タグ情報に関連付けられた再生位置でのコンテンツのキャプチャ画像２０２１が表示される。キャプチャ画像２０２１は、対応する再生位置を示すタイムスタンプ２０２３とともに表示されうる。また、キャプチャ画像２０２１には、タグ情報の種類アイコン２０２５が付加されていてもよい。図示された例において、タグ情報はテキスト（種類アイコン２０２５ｔ）、Ｗｅｂページへのリンク（種類アイコン２０２５ｗ）、および／または他のコンテンツへのリンク（種類アイコン２０２５ｖ）などを含みうる。種類アイコン２０２５の表示によって、ユーザは、各タグ情報がどのような種類の情報を含むかを容易に識別することができる。

　また、図示された例において、タグ一覧表示２００３では、タグ情報を示すアイコンが、互いに近接する再生位置に関連付けられている場合にはグループ化して表示される。このような場合、キャプチャ画像２０２１にグループ内タグ数２０２７の表示が付加されてもよい。例えば、タイムスタンプ２０２３が「０：２４」のキャプチャ画像２０２１ａにグループ内タグ数２０２７として「１８」が表示されている場合、この再生位置の近傍に関連付けられたタグ情報が１８件あることがわかる。このようにタグ情報がグループ化される場合、種類アイコン２０２５もキャプチャ画像２０２１に複数付加されうる。例えば、上記のキャプチャ画像２０２１ａには、種類アイコン２０２５ｔ，２０２５ｗ，２０２５ｖが表示されているため、１８件のタグ情報の中にテキストとＷｅｂページへのリンクと他のコンテンツへのリンクとが含まれることがわかる。

　　（タグ詳細表示）
　タグ詳細表示２００５は、タグ一覧表示２００３として表示されたタグ情報のアイコンが選択された場合に、当該タグ情報とともにグループ化されたタグ情報を個別に表示する。本実施形態では、タグ詳細表示２００５を表示するためのデータも、タグ一覧表示２００３と同様にサーバ１００のタグ情報表示制御部１４０によって提供されうる。上述のように、タグ情報表示制御部１４０は、既存のタグ情報に加えて、タグ関連付け部１７０によって新たにコンテンツに関連付けられたタグ情報に基づくデータを提供しうる。従って、再生画面２０００でコンテンツを視聴しているユーザ、または他のユーザのアクティビティに基づいてタグ生成部１６０が新たなタグ情報を生成した場合、タグ詳細表示２００５は新たなタグ情報を含む表示に更新されうる。より具体的には、例えば、コンテンツの再生中に新たなタグ情報が追加して表示されうる。

　ここで、図６に示した例では、ユーザがタグ一覧表示２００３として表示されたタグ情報のアイコンを選択していないため、タグ詳細表示２００５は空欄になっている。この場合に、タグ詳細表示２００５に代えて広告などが表示されてもよい。一方、図７に示した例では、ユーザがタグ一覧表示２００３として表示されたキャプチャ画像２０２１ａを選択したために、キャプチャ画像２０２１ａに対応するグループに含まれるタグ情報が、タグ詳細表示２００５として表示されている。上述のように、このとき、コンテンツ画像２００１として表示されているコンテンツの再生位置は、選択されたタグ情報の再生位置（図７の例ではタイムスタンプ「０：２４」）にジャンプしうる。

　図７の例において、タグ詳細表示２００５には、テキスト、Ｗｅｂページ、および他のコンテンツをそれぞれ含む３件のタグ情報表示２０２９ｔ，２０２９ｗ，２０２９ｖが表示されている。これらのタグの情報の種類を識別するために、タグ一覧表示２００３に表示された種類アイコン２０２５と同様の種類アイコン２０３１が表示されてもよい。

　Ｗｅｂページを含むタグ情報表示２０２９ｗでは、Ｗｅｂページのスナップショット２０３３が表示されうる。スナップショット２０３３にはＷｅｂページへのリンクが設定されており、ユーザはスナップショット２０３３の画像を選択することによってＷｅｂページへアクセス可能であってもよい。また、他のコンテンツを含むタグ情報表示２０２９ｖでは、他のコンテンツのサムネイル２０３５が表示されうる。サムネイル２０３５には他のコンテンツを再生するためのリンクが設定されており、ユーザはサムネイル２０３５を選択することによって他のコンテンツにアクセス可能であってもよい。この場合、他のコンテンツは、例えば再生画面２０００とは別の画面で再生されうる。別の実施形態では、例えば表示可能なタグ情報表示２０２９の数を増やすために、タグ詳細表示２００５の開始時にはスナップショット２０３３やサムネイル２０３５が表示されず、タグ情報表示２０２９が選択された場合に詳細情報としてスナップショット２０３３やサムネイル２０３５が表示されてもよい。

　上述の通り、キャプチャ画像２０２１ａに対応するグループには１８件のタグ情報が含まれ、図示された例のタグ詳細表示２００５には一度に表示されない。このような場合、タグ詳細表示２００５にはスクロールバー２０３７が表示され、上下方向に配列されたタグ情報表示２０２９をスクロールさせて閲覧することが可能であってもよい。タグ情報表示２０２９が配列される順番は、例えば時系列であってもよく、Ｗｅｂページやコンテンツのリンクへのアクセス数などによって決定される人気度順であってもよい。また、コンテンツに新たなタグ情報が関連付けられた場合、新たなタグ情報はタグ詳細表示２００５の一番上または一番下に追加されてもよい。

　また、後述する変形例の場合とは異なり、図７の例では、コンテンツの再生が、選択されたタグ情報の再生位置にジャンプした後はそのまま続行される。そこで、表示されているタグ情報がどのようなシーンについてのものであるかを示すために、タグ詳細表示２００５にキャプチャ画像２０３９（図７の例であればキャプチャ画像２０２１ａと同じ画像）が含まれてもよい。さらに、キャプチャ画像２０３９とともにジャンプボタン２０４１が表示されてもよい。ユーザがジャンプボタン２０４１を選択すると、コンテンツ画像２００１として表示されているコンテンツの再生位置が、キャプチャ画像２０３９に対応する再生位置、つまりタグ詳細表示２００５として表示されているタグ情報に対応する再生位置にジャンプする。

　　（ユーザのアクティビティに関する表示要素）
　コメント入力欄２００７は、テキスト入力欄２００７ａと投稿ボタン２００７ｂとを含み、再生中のコンテンツに対するユーザのコメントの投稿を受け付ける。コメント入力欄２００７を用いて投稿されたコメントは、例えばサーバ１００によって提供されるサービス上でのコメントとして処理されてもよく、他のソーシャルメディアでのコメントとして処理されてもよい。いずれの場合も、タグ生成部１６０が投稿されたコメントに基づいて新たなタグ情報を生成し、タグ関連付け部１７０が生成されたタグ情報をコンテンツに関連付けうる。このとき、タグ関連付け部１７０は、投稿ボタン２００７ｂの選択によってコメントの投稿が実行された時、またはテキスト入力欄２００７ａが選択されてテキスト入力が開始された時のコンテンツの再生位置を検出し、生成されたタグ情報をこの再生位置に関連付けてもよい。ユーザのコメント投稿によって新たに生成されたタグ情報が関連付けられた再生位置の近傍に、他のタグ情報が既に関連付けられている場合、ユーザのコメント投稿後、当該再生位置の近傍に関連付けられたタグ情報のグループが自動的にタグ詳細表示２００５に表示されてもよい。

　図８は、本開示の第１の実施形態における再生画面と他の画面との連携の例を示す図である。図８に示されるように、コメントの投稿と同様に、例えばＷｅｂブラウザ画面２１００ａを用いたＷｅｂ検索の結果や、Ｗｅｂブラウザ画面２１００ｂを用いた他のコンテンツ（映像コンテンツ）の再生も、サーバ１００でタグ生成部１６０が生成するタグ情報の元になりうる。このような処理のために、例えばＷｅｂブラウザ画面２１００が再生画面２０００と共通のサービスによって提供されてもよいし、通常のＷｅｂブラウザ画面２１００にサーバ１００によって提供されるサービスとの連携のためのプラグインが追加されてもよい。このようにして提供されるＷｅｂブラウザ画面２１００において入力された情報は、クライアント２００の通信部２１０によってサーバ１００を介して他のサーバなどに送信されうる。

　　（画面内位置の指定）
　図９は、本開示の第１の実施形態における再生画面で画面内位置を指定する場合の表示例を示す図である。図９を参照すると、再生画面２０００において、ユーザが、ポインタ２０４３を用いてコンテンツ画像２００１の画面内位置を指定した上で、コメント入力欄２００７でコンテンツに対するコメントを入力している。このような場合、サーバ１００のアクティビティ検出部１５０は、画面内位置の指定を含むアクティビティとしてユーザのコメント投稿を検出しうる。さらに、タグ関連付け部１７０は、タグ情報をコンテンツの再生位置に加えて画面内位置にも関連付ける。なお、画面内位置についても、再生位置と同様に、関連付けられる画面内位置が範囲または領域として定義されたり、近接した画面内位置に関連付けられたタグ情報がグループ化されたりしてもよい。

　ここで、画面内位置に関連付けられたタグ情報は、例えばタグ一覧表示２００３やタグ詳細表示２００５において、近接した再生位置で別の画面内位置に関連付けられたタグ情報や、画面内位置に関連付けられていないタグ情報とは区別して表示されうる。より具体的には、図９に示されるように、タグ一覧表示２００３で、タイムスタンプ２０２３が同じ（図９の例では「０：１２」）でも、対応付けられた画面内位置が異なるタグ情報にそれぞれ対応するキャプチャ画像２０２１ｂ，２０２１ｃが別々に表示される。キャプチャ画像２０２１ｂは画面全体に対応付けられたタグ情報を示し、キャプチャ画像２０２１ｃは画面内の一部、具体的には鳥が映っている領域に対応付けられたタグ情報を示す。画面の一部分に対応付けられたタグ情報を示すキャプチャ画像２０２１ｃは、コンテンツのキャプチャ画像から対応する画面内位置またはその近傍の画像を切り取ったものでありうる。上記の場合、タグ詳細表示２００５でも、タグ一覧表示２００３に対応して、近接した再生位置かつ近接した画面内位置のタグ情報が個別に表示されうる。

　　（その他の表示要素）
　再び図６を参照して、再生コントロール２００９は、再生画面２０００におけるコンテンツの再生の開始、停止、再生位置の移動などを制御するためのＧＵＩ（Graphical　User　Interface）部品である。ホームボタン２０１１は、コンテンツの視聴を中断または終了して上述したホーム画面１０００に遷移するためのボタンである。リコメンド情報２０１３は、例えばユーザがフォローしているキュレータや、ユーザと同じグループに属する他のユーザからのコンテンツのリコメンドを表示する。例えば、リコメンド情報２０１３として表示されたコンテンツのサムネイル２０４５を選択することによって、コンテンツ画像２００１として表示されるコンテンツがサムネイル２０４５として表示されたコンテンツに切り替わり、そのコンテンツの視聴を開始することが可能であってもよい。

　　（変形例）
　図１０は、本開示の第１の実施形態における再生画面でコミュニケーションサービスが提供される場合の表示例を示す図である。図１０を参照すると、再生画面３０００には、コンテンツ画像２００１と、タグ一覧表示２００３と、チャット画面３００１と、コメント入力欄２００７と、再生コントロール２００９と、ホームボタン２０１１と、リコメンド情報２０１３とが表示される。なお、チャット画面３００１以外については、上記の再生画面２０００と同様の構成要素であるため詳細な説明は省略する。

　本実施形態では、サーバ１００のコミュニケーションサービス提供部１８０の機能によって、例えばユーザがコメント入力欄２００７を用いてコンテンツ再生中にコメントを投稿し、そのコメントに基づいてコンテンツの再生位置に新たなタグ情報が関連付けられたた場合に、その近傍の再生位置にコメントを入力した他のユーザとの間で開設されるチャットルームにユーザが招待されうる。チャット画面３００１は、このチャットルームにおける各ユーザの発言のログを表示する。ユーザは、チャットルームに招待される前と同じくコメント入力欄２００７を用いて、チャットルームでの発言を投稿することが可能である。チャット画面３００１は、例えばそれまで表示されていたタグ詳細表示２００５の表示が変化することによって表示されてもよい。あるいは、再生画面３０００には最初からチャット画面３００１が表示され、ユーザがコメント入力欄２００７を用いてコメントを入力するまでは空欄であってもよい。

　上記の例において、ユーザが最初にコメント入力欄２００７を用いて投稿したコメントは、チャットルームにおけるそのユーザの最初の発言としてチャット画面３００１に表示されてもよい。また、ユーザがチャットルームに招待されるためのトリガは、コメントの投稿には限られず、例えば図８に示したようなＷｅｂ検索や他のコンテンツの再生などであってもよい。この場合、Ｗｅｂ検索の結果や他のコンテンツへのリンクが、ユーザの最初の発言としてチャット画面３００１に表示されてもよい。あるいは、コメントなどのアクティビティを実行したユーザにはチャット画面３００１のプレビューが提示され、プレビューを閲覧したユーザが希望した場合に限ってユーザがチャットルームに入室し、チャット画面３００１が表示されてもよい。

　上述の通り、チャット画面３００１に表示されている各ユーザの発言も、サーバ１００のアクティビティ検出部１５０によってアクティビティとして検出され、タグ生成部１６０によるタグ情報の生成の元になりうる。なお、ユーザのチャットルームにおける発言は、例えばＷｅｂページや他のコンテンツへのリンクなど、通常のコンテンツ視聴中のユーザのアクティビティと同様の情報を含みうる。

　ユーザがチャットルームに入室し、チャット画面３００１が再生画面３０００に表示されている間、サーバ１００の再生制御部１２０の制御によって、コンテンツ画像２００１として表示されているコンテンツの再生は、対象になる再生位置を含む範囲で繰り返されうる。タグ関連付け部１７０は、各ユーザの発言に基づいて生成されるタグ情報を、発言が繰り返し範囲の中のどの位置で入力されたかにかかわらず、チャットルームごとに共通の再生位置（図９の例では「０：２４」）に関連付けてもよい。コンテンツの視聴を先に進めたい場合、ユーザは、退室ボタン３００３を選択することによってチャットルームから退室し、通常のコンテンツの視聴に戻ることができる。

　以上で説明した本開示の第１の実施形態によれば、コンテンツ再生中のユーザによるアクティビティを検出し、検出されたアクティビティに関する情報に基づいてタグ情報を生成することによって、ユーザに別途のタグ情報入力の手間を感じさせることなく、大量の情報をコンテンツに関するタグ情報として収集することができる。また、生成されたタグ情報を、アクティビティに対応するコンテンツの再生位置および／または画面内位置に関連付けることによって、タグ情報がコンテンツの中の何に対するものであるのかが明確になり、上記のようにユーザのアクティビティによって無作為的に収集されたタグ情報であっても、そこから意味のある情報を読み取ることが容易になりうる。

　（２．第２の実施形態）
　次に、図１１～図１５を参照して、本開示の第２の実施形態について説明する。本実施形態では、コンテンツについて生成されるタグ情報が、必ずしもコンテンツの再生位置に関連付けられない。本実施形態において、タグ情報は、コンテンツ内の１または複数の位置に関連付けられる。なお、それ以外の点については第１の実施形態と同様であるため、共通する符号を付することによって重複した説明を省略する。

　（２－１．機能構成）
　図１１は、本開示の第２の実施形態に係る各装置の概略的な機能構成を示すブロック図である。図１１を参照すると、本実施形態に係るシステム２０は、サーバ３００とクライアント４００とを含む。サーバ３００とクライアント４００とは、いずれも後述する情報処理装置のハードウェア構成によって実現され、有線または無線の各種ネットワークによって互いに接続される。なお、サーバ３００は、必ずしも単一の情報処理装置によって実現されなくてもよく、ネットワークによって互いに接続された複数の情報処理装置の協働によって実現されてもよい。また、図示されている機能構成は本実施形態の説明のために簡略化されており、各装置は図示されていない機能構成をさらに含んでもよい。図示されていない機能構成は、各装置の一般的な機能構成として既に知られたものでありうるため、詳細な説明は省略する。

　　（サーバ）
　サーバ３００は、通信部１１０と、再生制御部１２０と、タグＤＢ３３０と、タグ情報表示制御部３４０と、アクティビティ検出部１５０と、タグ生成部１６０と、タグ関連付け部３７０と、コミュニケーションサービス提供部１８０とを含む。以下では、このうち上記の第１の実施形態とは異なる構成要素であるタグＤＢ３３０、タグ情報表示制御部３４０、およびタグ関連付け部３７０について特に説明する。

　　（タグＤＢ）
　タグＤＢ３３０は、例えばストレージ装置によって実現され、コンテンツについて生成されたタグ情報を格納する。タグ情報は、例えばタグ生成部１６０によって生成され、タグ関連付け部３７０によってコンテンツ内の１または複数の位置に関連付けられた上で、タグＤＢ３３０に格納される。また、タグ情報は、初期設定として用意されたものを含んでもよい。本実施形態におけるタグ情報は、例えばテキスト、またはＷｅｂページや他のコンテンツへのリンクもしくはサムネイルなどを含みうる点で、上記の第１の実施形態でタグＤＢ１３０に格納されるタグ情報と同様である。ただし、第１の実施形態との違いとして、本実施形態では、タグ情報はコンテンツ内の１または複数の位置に直接的または間接的に関連付けられていればよく、必ずしもコンテンツの再生位置に関連付けられていなくてもよい。

　ここで、本明細書における「コンテンツ内の１または複数の位置」および「コンテンツの再生位置」といった用語について、改めて説明する。本明細書における「コンテンツ」は、例えば映像や楽曲のように時間とともに進行するコンテンツでありうる。この場合、例えばタイムスタンプ（Ｔ）などを用いてコンテンツの再生位置を定義することが可能である。例えば、あるコンテンツについて、１または複数のタイムスタンプにタグ情報を関連付けることは、タグ情報をコンテンツ内の１または複数の位置に関連付けることでありうる。

　また、本明細書における「コンテンツ」は、例えば映像のように画面に表示されるコンテンツでもありうる。この場合、例えば横位置（Ｘ）や縦位置（Ｙ）などを用いてコンテンツの画面内位置を定義することが可能である。例えば、あるコンテンツについて、１または複数の画面内位置にタグ情報を関連付けることは、タグ情報をコンテンツ内の１または複数の位置に関連付けることでありうる。

　さらに、コンテンツが画面に表示される場合、タグ情報は被写体に関する情報に関連付けられてもよい。被写体は、例えば画面内のある領域（被写体の表示領域）に表示される人物または物などであり、視聴者に何らかの意味をもった画像部分として認識される。被写体は、例えば映像のような時間とともに進行し、かつ画面に表示されるコンテンツでは、一連のタイムスタンプ（複数の再生位置）において、表示領域を変化させながら（変化しない場合もある）表示されうる。従って、例えばタグ情報がある被写体を示す情報に関連付けられた場合、当該タグ情報は、コンテンツ内でその被写体の表示領域が存在する一連のタイムスタンプ（複数の再生位置）で、それぞれのタイムスタンプにおける被写体の表示領域（複数の画面内位置）に間接的に関連付けられるともいえる。

　このように、本実施形態では、コンテンツに含まれる情報の少なくとも一部（少なくとも一部の再生位置および／または少なくとも一部の画面内位置）に対して与えられる何らかの意味（例えば被写体）を示す情報に対してタグ情報を関連付けることが可能である。この場合、タグ情報は、コンテンツ内で当該意味が与えられる部分を示す１または複数の位置に間接的に関連付けられるともいえる。このような意味を示す情報を、本明細書ではタグ情報のカテゴリともいう。従って、本実施形態では、タグＤＢ３３０に格納されるタグ情報が、コンテンツ内の１または複数の位置に関連付けられており、より具体的には、タグ情報が、例えば再生位置、画面内位置、またはカテゴリのうちの１または複数に関連付けられるといえる。

　　（タグ情報表示制御部）
　タグ情報表示制御部３４０は、例えばＣＰＵなどのプロセッサがメモリに格納されたプログラムに従って動作することによって実現され、タグＤＢ３３０から読み出されたタグ情報を、コンテンツの再生画面に表示させる。コンテンツの再生画面におけるタグ情報の表示は、例えば上記の第１の実施形態と同様でありうるが、上述の通り本実施形態ではタグ情報が例えばカテゴリにも関連付けられうるため、例えばタグ情報表示制御部３４０は共通するカテゴリに関連付けられたタグ情報をグループ化して表示させてもよい。

　また、タグ情報表示制御部３４０は、新たに生成されるタグ情報が関連付けられるカテゴリを示すタグカテゴリ情報を、タグ情報の生成または登録に先立ってコンテンツの再生画面に表示させる。タグカテゴリ情報は、例えば、ユーザのアクティビティによってコンテンツの画面内位置が指定された場合に、当該アクティビティを含む一連のアクティビティによって生成されるタグ情報が関連付けられる情報（例えば被写体に関する情報）を前もって表示させるものでありうる。例えば、タグ情報表示制御部３４０は、タグカテゴリ情報として、当該画面内位置の近傍に位置する領域に表示される被写体の情報を表示する。当該被写体に既にタグ情報が関連付けられている場合、タグ情報表示制御部３４０は、それらのタグ情報をタグカテゴリ情報として表示させてもよい。なお、タグ情報表示制御部３４０によるタグカテゴリ情報の表示の具体的な例については後述する。

　　（タグ関連付け部）
　タグ関連付け部３７０は、例えばＣＰＵなどのプロセッサがメモリに格納されたプログラムに従って動作することによって実現され、タグ生成部１６０によって生成されたタグ情報を、タグ情報の元になったアクティビティに対応するコンテンツ内の１または複数の位置に直接的または間接的に関連付ける。タグ関連付け部３７０によってコンテンツに関連付けられたタグ情報は、例えばタグＤＢ３３０に格納されてもよく、またタグ情報表示制御部３４０に提供されてクライアント４００でリアルタイムに表示されてもよい。ここで、タグ情報を再生位置や画面内位置に関連付けるタグ関連付け部３７０の処理は、例えば上記の第１の実施形態におけるタグ関連付け部１７０と同様でありうる。

　さらに、タグ関連付け部３７０は、タグ情報をカテゴリに関連付けることによって、間接的にコンテンツ内の１または複数の位置に関連付けてもよい。タグ関連付け部３７０は、例えばユーザがアクティビティにおいて明示的に指定した画面内位置の近傍に表示された被写体を検出し、検出された被写体にタグ情報を関連付けてもよい。ここで、タグ情報表示制御部３４０が、検出された被写体などの情報をタグカテゴリ情報としてコンテンツの再生画面に表示させる場合、タグ関連付け部３７０は、タグカテゴリ情報に応じてユーザがさらに実行したアクティビティに基づいて、タグ情報に関連付けられる情報を決定してもよい。例えば、タグ関連付け部３７０は、ユーザがタグカテゴリ情報を参照した上でそのままコメント投稿などのアクティビティを実行した場合、タグカテゴリ情報として表示された情報にタグ情報を関連付ける。また、タグ関連付け部３７０は、例えばユーザがタグカテゴリ情報に対する修正を含むアクティビティを実行した場合、タグカテゴリ情報として表示された情報を当該アクティビティに従って修正した上でタグ情報に関連付ける。

　（２－２．画面表示例）
　　（再生画面）
　図１２および図１３は、本開示の第２の実施形態における再生画面の表示例を示す図である。本実施形態における再生画面４０００は、例えばクライアント２００でユーザがコンテンツ視聴のためのアプリケーションを起動し、第１の実施形態で説明したものと同様のホーム画面１０００などを介して視聴するコンテンツを選択したときに、表示制御部２２０の制御によって表示部２３０に表示されうる。

　図１２および図１３を参照すると、再生画面４０００には、コンテンツ画像２００１と、タグ一覧表示２００３と、タグカテゴリ情報４００５と、コメント入力欄２００７と、再生コントロール２００９と、ホームボタン２０１１と、リコメンド情報２０１３と、ポインタ４０１５とが表示される。以下では、このうち上記の第１の実施形態とは異なる構成要素であるタグカテゴリ情報４００５およびポインタ４０１５について特に説明する。

　タグカテゴリ情報４００５は、例えば、ユーザがポインタ４０１５を用いてコンテンツ画像２００１内の位置（画面内位置）を指定するアクティビティを実行した場合に、続くユーザのアクティビティに基づいて生成されうるタグ情報に関連付けられるカテゴリの情報を前もって提示する。例えば、図１２に示すように、ユーザがポインタ４０１５を用いてコンテンツ画像２００１内のある位置Ｐを指定した場合、タグ情報表示制御部３４０が位置Ｐの近傍に位置する（位置Ｐを含んでもよい）領域に表示されている被写体を検索し、検索の結果発見された被写体に関する情報をタグカテゴリ情報４００５として表示させてもよい。このとき、当該被写体に既に関連付けられているタグ情報がタグＤＢ３３０に格納されている場合、タグ情報表示制御部３４０は、それらのタグ情報をタグカテゴリ情報４００５においてタグ情報表示４０２９として表示させてもよい。

　上記の例において、位置Ｐの近傍に表示されている被写体が発見されなかった場合、タグ情報表示制御部３４０は、位置Ｐを基準にした所定のサイズの領域（例えば、位置Ｐを中心とする矩形領域）を被写体の表示領域に代わる領域として特定し、この領域を示す情報をタグカテゴリ情報４００５として表示させてもよい。このとき、当該領域に既に関連付けられているタグ情報がタグＤＢ３３０に格納されている場合、タグ情報表示制御部３４０は、それらのタグ情報をタグカテゴリ情報４００５においてタグ情報表示４０２９として表示させてもよい。このように、必ずしも被写体に関連づかないタグ情報の生成は、例えば、画像認識処理などによっては被写体の存在が検出されていないものの、ユーザにとっては何らかの意味を有するものが表示されている場合や、ユーザがコンテンツ画像２００１の背景（街並みや風景など）についてコメントを投稿する（そのコメントに基づいてタグ情報が生成される）場合などに有用でありうる。

　また、タグカテゴリ情報４００５は、例えば、ユーザがポインタ４０１５を用いてコンテンツ画像２００１の領域を指定するアクティビティを実行した場合（上述のように、コンテンツの画面内位置は範囲または領域として定義されうる）、続くユーザのアクティビティに基づいて生成されうるタグ情報に関連付けられる情報を提示してもよい。例えば、図１３に示すように、ユーザがポインタ４０１５を用いてコンテンツ画像２００１内の領域Ｑを指定した場合、タグ情報表示制御部３４０が、領域Ｑに含まれる（領域Ｑと部分的に重複してもよい）領域に表示されている被写体を検索し、検索の結果発見された被写体に関する情報をタグカテゴリ情報４００５として表示させる。このとき、当該被写体に既に関連付けられているタグ情報がタグＤＢ３３０に格納されている場合、タグ情報表示制御部３４０は、それらのタグ情報をタグカテゴリ情報４００５においてタグ情報表示４０２９として表示させてもよい。一方、領域Ｑに含まれる領域に表示されている被写体が発見されなかった場合、タグ情報表示制御部３４０は、上記の図１２の例と同様に、領域Ｑを基準にした所定のサイズの領域（領域Ｑそのものであってもよい）を被写体の表示領域に代わる領域として特定し、この領域を示す情報をタグカテゴリ情報４００５として表示させてもよい。

　　（タグカテゴリ情報表示）
　図１４は、本開示の第２の実施形態におけるタグカテゴリ情報表示の例を示す図である。図１２および図１３を参照して説明したように、本実施形態では、再生画面４０００において、ユーザのアクティビティに基づいて生成されるタグ情報に関連付けられる情報を提示するタグカテゴリ情報４００５が表示される。上記の説明では、ユーザのアクティビティによって指定されたコンテンツ画像２００１内の位置または領域について、その近傍に表示されている被写体が検索され、検索の結果発見された被写体に関する情報がタグカテゴリ情報４００５として表示された。

　しかしながら、実際には、例えば画像認識処理などによって検出された被写体は、必ずしも特定の人物または物として認識されているわけではない。従って、被写体であること、人物であること、または物であることは認識されているけれども、それが何であるか、誰であるかは特定されていない場合もある。以下では、そのような場合に対応したタグカテゴリ情報４００５の表示例について説明する。

　まず、何らかの被写体を含むコンテンツ画像２００１ａにおいて、ユーザのアクティビティによって位置Ｐが指定されたとする（Ｓ３０１）。このとき、クライアント４００の通信部２１０から、サーバ３００へ、コンテンツのタイムスタンプ（Ｔ）や位置Ｐの横位置および縦位置（Ｘ，Ｙ）の情報に加えて、位置Ｐの近傍の画像を示す情報が送信されうる（Ｓ３０３）。位置Ｐの近傍の画像を示す情報は、例えば、位置Ｐを基準にした所定のサイズの領域でコンテンツ画像２００１を切り出した画像データであってもよく、この画像データから抽出される特徴量に基づくデータであってもよい。

　上記の情報を受信したサーバ３００のタグ情報表示制御部３４０は、位置Ｐの近傍の領域に表示されている被写体を検索する（Ｓ３０５）。より具体的には、例えば、タグ情報表示制御部３４０は、コンテンツのタイムスタンプ（Ｔ）や位置Ｐの横位置および縦位置（Ｘ，Ｙ）の情報に基づいて、既にタグ情報が関連付けられている位置Ｐの近傍の被写体を検索してもよい。また、コンテンツ全体の被写体検出が既に実行されているような場合、タグ情報表示制御部３４０は、被写体検出の結果を参照してもよい。

　一方、既にタグ情報が関連付けられている位置Ｐの近傍の被写体がなく、また被写体検出もまだ実行されていないような場合、タグ情報表示制御部３４０は、クライアント４００から受信した位置Ｐの近傍の画像を示す情報に基づいて被写体の検索を実行する。例えば、タグ情報表示制御部３４０は、コンテンツ２００１を切り出した画像データ、または画像データから抽出される特徴量に基づくデータを用いて画像認識処理を実行することによって被写体を検出する。

　上記のような処理によって被写体が発見され、かつ被写体が認識された場合、タグ情報表示制御部３４０は、その被写体を示す情報をタグカテゴリ情報４００５としてクライアント４００において表示させる。一方、被写体は発見されたものの、それが何であるか、誰であるかが特定されなかった場合、タグ情報表示制御部３４０は、被写体が未識別であることを示す情報をタグカテゴリ情報４００５ａとしてクライアント４００において表示させる（Ｓ３０７）。

　図示された例では、被写体が人物であることは識別されたものの、それが誰であるかは特定されなかったため、タグカテゴリ情報４００５ａは、被写体が未識別の人物であることを示す「Ｗｈｏ　ｉｓ　ｔｈｉｓ？」というタイトル４０１７ａとともに表示される。タイトル４０１７ａは、ユーザによって上書きすることが可能であるような形態で表示されうる。ユーザは、その被写体が誰であるかを知っている場合、タイトル４０１７ａに上書きして人物名を入力し、その上でコメントを投稿することが可能である（Ｓ３０９）。

　上記のコメント投稿に基づいて、サーバ３００ではタグ情報が生成され、生成されたタグ情報は被写体に関連付けられる（Ｓ３１１）。このとき、タグ関連付け部３７０は、タグ情報が関連付けられた被写体を、ユーザによって入力された被写体名と、以前にクライアント４００から受信された位置Ｐの近傍の画像を示す情報とに関連付けて登録しうる。これによって、以降、コンテンツ内で類似した画像を含む画面内位置が指定された場合、タグ情報表示制御部３４０は上記で登録された被写体に関する情報をタグカテゴリ情報４００５として表示させることができる。

　上記のように、ユーザの入力に基づいて被写体名が設定される場合、ユーザによって異なる被写体名が入力される場合がありうる。また、例えば１人のユーザの入力に基づいて被写体名を設定するのは信頼性が低いと判断される場合もある。そのような場合に、タグ情報表示制御部３４０は、登録されている被写体名の信頼性が十分に高くないことを示す情報をタグカテゴリ情報４００５ｂとしてクライアント４００において表示させる（Ｓ３１３）。

　図示された例において、タグカテゴリ情報４００５ｂは、現在登録されている被写体名に「？」を付加することなどによって信頼性が高くないことを示すタイトル４０１７ｂを含みうる。この場合、タイトル４０１７ｂは、ユーザ（例えば、以前に被写体名を登録したユーザとは別のユーザ）によって上書きすることが可能であるような形態で表示されうる。ユーザは、その被写体が現在登録されている被写体名とは異なる人物であることを知っている場合、タイトル４０１７ｂに上書きして人物名を入力し、その上でコメントを投稿することが可能である（Ｓ３１５）。別の例として、タイトル４０１７ｂとして、複数の被写体名の候補が表示され、ユーザは候補の中から正しいと思う被写体名を選択した上でコメントを投稿することが可能であってもよい。

　タグ関連付け部３７０（またはタグ情報表示制御部３４０）は、コメント投稿に基づいてタグ情報を生成し、これを被写体に関連付けるとともに、例えば上記のような被写体名の修正入力の蓄積などに基づいて、登録された被写体名の信頼度および代替案の有無などを判定し、必要に応じて被写体名修正する（Ｓ３１７）。このような処理を経て、ある程度正しい被写体名称が判明したところで、タグ情報表示制御部３４０は、登録されている被写体名の信頼性がある程度高いことを示す情報をタグカテゴリ情報４００５ｃとしてクライアント４００において表示させる（Ｓ３１９）。

　図示された例において、タグカテゴリ情報４００５ｃは、現在登録されている被写体名を「？」などを付加せずに表示するタイトル４０１７ｃを含みうる。タイトル４０１７ｃは、ユーザによって簡単には上書きされないような形態で表示されうる。ただし、タイトル４０１７ｃについても、ユーザが疑義を呈示する手段が設けられてもよい。例えば、タグカテゴリ情報４００５ｃは疑義ボタン４０１９を含み、ユーザがタイトル４０１７ｃによって表示される被写体名が間違っていると思う場合には疑義ボタン４０１９を押下して正しいと思う被写体名を入力した上で、コメントを投稿することが可能であってもよい（Ｓ３２１）。この場合、疑義ボタン４０１９を用いて入力された被写体名は、例えばタグ関連付け部３７０（またはタグ情報表示制御部３４０）によって蓄積され、同様の修正提案がある程度蓄積された場合に被写体名が変更されるか、タグカテゴリ情報４００５ｂが表示される場合のように被写体名が未確定の状態に戻る。

　（２－３．処理フロー）
　図１５は、本開示の第２の実施形態におけるタグカテゴリ情報表示の表示プロセスの例を示すフローチャートである。

　まず、サーバ３００において、アクティビティ検出部１５０が、クライアント４００でコンテンツを視聴中のユーザによる、コンテンツ画像２００１内の位置Ｐを指定するアクティビティを取得する（Ｓ４０１）。ここで、アクティビティ検出部１５０によって取得される情報には、例えば、コンテンツのタイムスタンプ（Ｔ）や位置Ｐの横位置および縦位置（Ｘ，Ｙ）の情報に加えて、位置Ｐの近傍の画像を示す情報が含まれうる。タグ情報表示制御部３４０は、上記の情報を用いて、タグＤＢ３３０に格納されたタグ情報を検索する（Ｓ４０３）。より具体的には、タグ情報表示制御部３４０は、タイムスタンプ（Ｔ）ならびに横位置および縦位置（Ｘ，Ｙ）について、それぞれ所定の範囲内で近傍に位置する被写体の表示領域または画像内の領域に関連付けられたタグ情報を検索する。

　検索の結果、該当するタグ情報が発見された場合（Ｓ４０５のＹＥＳ）、タグ情報表示制御部３４０は、発見されたタグ情報に基づいてタグ情報表示４０２９を生成する（Ｓ４０７）。また、タグ情報表示制御部３４０は、発見されたタグ情報に関連付けられた被写体の名称に基づいてタイトル４０１７を生成する（Ｓ４０９）。タグ情報表示制御部３４０は、クライアント４００で表示されている再生画面４０００に、タグ情報表示４０２９およびタイトル４０１７を含むタグカテゴリ情報４００５を表示させる（Ｓ４１１）。

　一方、検索の結果、該当するタグ情報が発見されなかった場合（Ｓ４０５のＮＯ）、タグ情報表示制御部３４０は、アクティビティ検出部１５０によって取得された、位置Ｐの近傍の画像を示す情報に基づいて画像認識処理を実行する（Ｓ４１３）。ここで、画像認識処理の結果、被写体が人物であると認識された場合（Ｓ４１５のＹＥＳ）、タグ情報表示制御部３４０は、認識された人物に関連付けられたタグ情報をタグＤＢ３３０から検索する（Ｓ４１７）。上記のＳ４０３での検索との違いとして、Ｓ４１７では、タグ情報に関連付けられた被写体（人物）を条件として検索が実行されているため、タグ情報同士のタイムスタンプ（Ｔ）ならびに横位置および縦位置（Ｘ，Ｙ）は必ずしも共通しない。例えばこのような処理を介して、本実施形態では、タグ情報が、被写体を媒介としてコンテンツの複数の再生位置および複数の画面内位置に関連付けられうる。

　Ｓ４１７の検索の結果、該当するタグ情報が発見された場合（Ｓ４１９のＹＥＳ）、タグ情報表示制御部３４０は、発見されたタグ情報に基づいてタグ情報表示４０２９を生成する（Ｓ４０７）。また、タグ情報表示制御部３４０は、発見されたタグ情報に関連付けられた被写体（人物）の名称に基づいてタイトル４０１７を生成する（Ｓ４０９）。タグ情報表示制御部３４０は、クライアント４００で表示されている再生画面４０００に、タグ情報表示４０２９およびタイトル４０１７を含むタグカテゴリ情報４００５を表示させる（Ｓ４１１）。

　一方、Ｓ４１７の検索の結果、該当するタグ情報が発見されなかった場合（Ｓ４１９のＮＯ）、タグ情報表示制御部３４０は、被写体（人物）の名称に基づいてタイトル４０１７を生成する（Ｓ４０９）。なお、タグ情報表示制御部３４０は、被写体（人物）の名称が不明である場合、図１４に示した例のように「Ｗｈｏ　ｉｓ　ｔｈｉｓ？」などのタイトル４０１７を生成する。タグ情報表示制御部３４０は、クライアント４００で表示されている再生画面４０００に、タイトル４０１７を含むタグカテゴリ情報４００５を表示させる（Ｓ４１１）。この場合、続くユーザのアクティビティ（コメント投稿）に基づいて新たに生成されるタグ情報は、そのコンテンツにおいて、当該被写体（人物）に関連付けられる最初のタグ情報として扱われうる。

　画像認識処理の結果、被写体が人物ではなく（Ｓ４１５のＮＯ）、人物以外の物であると認識された場合（Ｓ４２１のＹＥＳ）、タグ情報表示制御部３４０は、認識された物に関連付けられたタグ情報をタグＤＢ３３０から検索する（Ｓ４１７）。Ｓ４１７以降の処理は、上記の被写体が人物である場合と同様である（被写体（物）の名称が不明である場合は、例えば、「Ｗｈａｔ　ｉｓ　ｔｈｉｓ？」などのタイトル４０１７が生成されうる）。

　一方、画像認識処理の結果、被写体が物であるとも認識されなかった場合（Ｓ４２１のＮＯ）、タグ情報表示制御部３４０は、位置Ｐを基準にした所定のサイズの領域をタグ情報に関連付けられる領域として特定し、この領域に関する情報を含むタグカテゴリ情報４００５を表示させる（Ｓ４２３）。この場合、画像認識処理によって検出されなかっただけで、実際にはその領域に被写体が表示されていることもありうるため、タグ情報表示制御部１４０は、タグカテゴリ情報４００５のタイトル４０１７として「Ｗｈａｔ　ｉｓ　ｔｈｉｓ？」などの文字列を表示させてもよい。

　以上で説明した本開示の第２の実施形態によれば、コンテンツ再生中のユーザのアクティビティに基づいて生成されるタグ情報が、単純にコンテンツの再生位置および／または画面内位置に関連付けられるのではなく、例えばコンテンツの被写体のようなカテゴリの情報に関連付けられることによってコンテンツの複数の再生位置および複数の画面内位置に間接的に関連付けられる。これによって、タグ情報を、コンテンツ内でユーザが何らかの意味を感じている一連の部分に関連付けることができ、タグ情報から意味のある情報を読み取ることが容易になりうる。

　なお、上記の例では、被写体などのカテゴリがコンテンツ内で設定されたが、カテゴリはコンテンツをまたいで設定されてもよい。例えば、あるコンテンツと他のコンテンツとで共通する被写体に関連付けられたタグ情報が、相互に参照可能であってもよい。この場合、例えば、タグ情報表示４０２９を表示するときに、ある被写体についてコンテンツの中で既に関連付けられたタグ情報が存在しなければ、他のコンテンツのタグ情報が表示されてもよい。

　（３．第３の実施形態）
　次に、図１６を参照して、本開示の第３の実施形態について説明する。本実施形態では、上記の第１または第２の実施形態ではサーバで実現されたアクティビティ検出部、タグ生成部およびタグ関連付け部の機能がクライアントで実現される。なお、各機能の詳細については第１または第２の実施形態と同様であるため、対応した符号を付することによって重複した説明を省略する。なお、以下の説明では第１の実施形態の構成を基にして説明するが、第２の実施形態の構成についても同様の変形が可能である。

　図１６は、本開示の第２の実施形態に係る各装置の概略的な機能構成を示すブロック図である。図１６を参照すると、本実施形態に係るシステム３０は、サーバ５００とクライアント６００とを含む。サーバ５００とクライアント６００とは、いずれも後述する情報処理装置のハードウェア構成によって実現され、有線または無線の各種ネットワークによって互いに接続される。なお、サーバ５００は、必ずしも単一の情報処理装置によって実現されなくてもよく、ネットワークによって互いに接続された複数の情報処理装置の協働によって実現されてもよい。また、図示されている機能構成は本実施形態の説明のために簡略化されており、各装置は図示されていない機能構成をさらに含んでもよい。図示されていない機能構成は、各装置の一般的な機能構成として既に知られたものでありうるため、詳細な説明は省略する。

　サーバ５００は、通信部１１０と、タグＤＢ１３０と、コミュニケーションサービス提供部１８０とを含む。本実施形態において、サーバ５００は、例えば、クライアント６００からのリクエストに従って動画配信サーバなどのコンテンツプロバイダ５０から取得したコンテンツをタグＤＢ１３０から読み出したタグ情報とともにクライアント６００に提供する機能と、クライアント６００からコンテンツに関して提供された新たなタグ情報をタグＤＢ１３０に格納する機能とを実現する。つまり、サーバ５００は、各クライアント６００で生成されたタグ情報をとりまとめる役割を果たす。また、サーバ５００は、コミュニケーションサービス提供部１８０の機能によって、同じコンテンツの近接する再生位置（および／または近接する画面内位置）に関連付けられるタグ情報を提供した複数のユーザにコミュニケーションサービスを提供してもよい。

　クライアント６００は、通信部２１０と、表示制御部２２０と、表示部２３０と、音声制御部２４０と、音声出力部２５０と、操作部２６０とに加えて、再生制御部１２０と、タグ情報表示制御部１４０と、アクティビティ検出部１５０と、タグ生成部１６０と、タグ関連付け部１７０とを含む。クライアント６００は、コンテンツ再生中のユーザによるアクティビティの検出と、アクティビティに関する情報に基づくタグ情報の生成と、タグ情報のコンテンツへの関連付けとをサーバ５００とは独立して実現する。このような本実施形態の構成によれば、例えばクライアント６００がコンテンツの再生中にサーバ５００と安定して通信できないような場合でも、ユーザのアクティビティに基づくタグ情報の生成および関連付けを実行することができる。

　より具体的には、再生制御部１２０は、通信部１１０が取得したコンテンツデータの再生を制御する。本実施形態において再生制御部１２０はクライアント６００に設けられるため、再生制御部１２０は表示制御部２２０および音声制御部２４０を制御しうる。タグ情報表示制御部１４０は、サーバ５００においてタグＤＢ１３０から読み出され、通信部１１０からクライアント６００の通信部２１０へと送信されたタグ情報を、対応するコンテンツの再生画面に表示させる。本実施形態においてタグ情報表示制御部１４０はクライアント６００に設けられるため、タグ情報表示制御部１４０は表示制御部２２０を制御しうる。アクティビティ検出部１５０は、操作部２６０が取得した操作入力に基づいて通信部２１０からサーバ５００などに送信される情報、および通信部２１０によってサーバ５００などから受信された情報を傍受し、その情報に基づいてユーザのアクティビティを検出する。なお、図中に破線で示すように、アクティビティ検出部１５０は、操作部２６０から直接的にユーザの操作入力の情報を取得してもよい。タグ関連付け部１７０は、タグ生成部１６０によって生成されてコンテンツに関連付けられたタグ情報を、通信部２１０からサーバ５００に送信する。サーバ５００では、受信されたタグ情報がタグＤＢ１３０に格納される。

　以上で説明したように、本開示の第３の実施形態では、第１または第２の実施形態と同様の機能が、第１または第２の実施形態とは異なる形でサーバとクライアントとに分散して実現される。このように、本開示の実施形態において、各機能をサーバとクライアントとのどちらで実現するかは自由に設定されうる。従って、本開示については、上記で説明した実施形態以外にも、さらに異なる形で各機能がサーバとクライアントとに分散して実現される各種の実施形態が可能である。

　（４．ハードウェア構成）
　次に、図１７を参照して、本開示の実施形態に係る情報処理装置のハードウェア構成について説明する。図１７は、情報処理装置のハードウェア構成を説明するためのブロック図である。図示された情報処理装置９００は、例えば、上記の実施形態におけるサーバやクライアントなどを実現しうる。

　情報処理装置９００は、ＣＰＵ（Central　Processing　unit）９０１、ＲＯＭ（Read　Only　Memory）９０３、およびＲＡＭ（Random　Access　Memory）９０５を含む。また、情報処理装置９００は、ホストバス９０７、ブリッジ９０９、外部バス９１１、インターフェース９１３、入力装置９１５、出力装置９１７、ストレージ装置９１９、ドライブ９２１、接続ポート９２３、通信装置９２５を含んでもよい。情報処理装置９００は、ＣＰＵ９０１に代えて、またはこれとともに、ＤＳＰ（Digital　Signal　Processor）またはＡＳＩＣ（Application　Specific　Integrated　Circuit）と呼ばれるような処理回路を有してもよい。

　ＣＰＵ９０１は、演算処理装置および制御装置として機能し、ＲＯＭ９０３、ＲＡＭ９０５、ストレージ装置９１９、またはリムーバブル記録媒体９２７に記録された各種プログラムに従って、情報処理装置９００内の動作全般またはその一部を制御する。ＲＯＭ９０３は、ＣＰＵ９０１が使用するプログラムや演算パラメータなどを記憶する。ＲＡＭ９０５は、ＣＰＵ９０１の実行において使用するプログラムや、その実行時のパラメータなどを一次記憶する。ＣＰＵ９０１、ＲＯＭ９０３、およびＲＡＭ９０５は、ＣＰＵバスなどの内部バスにより構成されるホストバス９０７により相互に接続されている。さらに、ホストバス９０７は、ブリッジ９０９を介して、ＰＣＩ（Peripheral　Component　Interconnect/Interface）バスなどの外部バス９１１に接続されている。

　入力装置９１５は、例えば、マウス、キーボード、タッチパネル、ボタン、またはスイッチなど、ユーザによって操作される装置である。入力装置９１５は、例えば、赤外線やその他の電波を利用したリモートコントロール装置であってもよいし、情報処理装置９００の操作に対応した携帯電話などの外部接続機器９２９であってもよい。入力装置９１５は、ユーザが入力した情報に基づいて入力信号を生成してＣＰＵ９０１に出力する入力制御回路を含む。ユーザは、この入力装置９１５を操作することによって、情報処理装置９００に対して各種のデータを入力したり処理動作を指示したりする。

　出力装置９１７は、取得した情報をユーザに対して視覚的または聴覚的に通知することが可能な装置で構成される。出力装置９１７は、例えば、ＬＣＤ（Liquid　Crystal　Display）、または有機ＥＬ（Electro-Luminescence）ディスプレイなどの表示装置、スピーカまたはヘッドホンなどの音声出力装置などでありうる。出力装置９１７は、情報処理装置９００の処理結果を、テキストまたは画像などの映像として出力したり、音声または音響などの音声として出力したりする。

　ストレージ装置９１９は、情報処理装置９００の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置９１９は、例えば、ＨＤＤ（Hard　Disk　Drive）などの磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス、または光磁気記憶デバイスなどにより構成される。このストレージ装置９１９は、ＣＰＵ９０１が実行するプログラムや各種データ、および外部から取得した各種のデータなどを格納する。

　ドライブ９２１は、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブル記録媒体９２７のためのリーダライタであり、情報処理装置９００に内蔵、あるいは外付けされる。ドライブ９２１は、装着されているリムーバブル記録媒体９２７に記録されている情報を読み出して、ＲＡＭ９０５に出力する。また、ドライブ９２１は、装着されているリムーバブル記録媒体９２７に記録を書き込む。

　接続ポート９２３は、機器を情報処理装置９００に直接接続するためのポートである。接続ポート９２３は、例えば、ＵＳＢ（Universal　Serial　Bus）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Small　Computer　System　Interface）ポートなどでありうる。また、接続ポート９２３は、ＲＳ－２３２Ｃポート、光オーディオ端子、ＨＤＭＩ（登録商標）（High-Definition　Multimedia　Interface）ポートなどであってもよい。接続ポート９２３に外部接続機器９２９を接続することで、情報処理装置９００と外部接続機器９２９との間で各種のデータが交換されうる。

　通信装置９２５は、例えば、通信ネットワーク９３１に接続するための通信デバイスなどで構成された通信インターフェースである。通信装置９２５は、例えば、有線または無線ＬＡＮ（Local　Area　Network）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、またはＷＵＳＢ（Wireless　USB）用の通信カードなどでありうる。また、通信装置９２５は、光通信用のルータ、ＡＤＳＬ（Asymmetric　Digital　Subscriber　Line）用のルータ、または、各種通信用のモデムなどであってもよい。通信装置９２５は、例えば、インターネットや他の通信機器との間で、ＴＣＰ／ＩＰなどの所定のプロトコルを用いて信号などを送受信する。また、通信装置９２５に接続される通信ネットワーク９３１は、有線または無線によって接続されたネットワークであり、例えば、インターネット、家庭内ＬＡＮ、赤外線通信、ラジオ波通信または衛星通信などである。

　以上、情報処理装置９００のハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて構成されていてもよいし、各構成要素の機能に特化したハードウェアにより構成されていてもよい。かかる構成は、実施する時々の技術レベルに応じて適宜変更されうる。

　（５．補足）
　本開示の実施形態は、例えば、上記で説明したような情報処理装置、システム、情報処理装置またはシステムで実行される情報処理方法、情報処理装置を機能させるためのプログラム、およびプログラムが記録された一時的でない有形の媒体を含みうる。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）コンテンツ再生中のユーザによるアクティビティを検出するアクティビティ検出部と、
　前記アクティビティに関する情報に基づいてタグ情報を生成するタグ生成部と、
　前記タグ情報を前記アクティビティに対応する前記コンテンツ内の１または複数の位置に関連付けるタグ関連付け部と
　を備える情報処理装置。
（２）前記アクティビティ検出部は、前記ユーザによるコメントの投稿を検出し、
　前記タグ生成部は、前記コメントに含まれるテキストに基づいて前記タグ情報を生成する、前記（１）に記載の情報処理装置。
（３）前記アクティビティ検出部は、前記ユーザによるソーシャルメディアへのコメントの投稿を検出する、前記（２）に記載の情報処理装置。
（４）前記アクティビティ検出部は、前記ユーザによる前記コンテンツ以外の情報へのアクセスを検出し、
　前記タグ生成部は、前記アクセスされた情報に基づいて前記タグ情報を生成する、前記（１）に記載の情報処理装置。
（５）前記タグ生成部は、前記アクセスされた情報へのリンクを含む前記タグ情報を生成する、前記（４）に記載の情報処理装置。
（６）共通する前記コンテンツ内の位置に関連付けられる複数のタグ情報にそれぞれ対応するアクティビティを実行した複数のユーザにコミュニケーションサービスを提供するコミュニケーションサービス提供部をさらに備える、前記（１）～（５）のいずれか１項に記載の情報処理装置。
（７）前記タグ関連付け部は、時間とともに進行する前記コンテンツ内の１または複数の再生位置に前記複数のタグ情報を関連付け、
　前記情報処理装置は、前記ユーザが前記コミュニケーションサービスを利用している間は前記コンテンツを前記１または複数の再生位置を含む範囲で繰り返し再生する再生制御部をさらに備える、前記（６）に記載の情報処理装置。
（８）前記アクティビティ検出部は、前記コミュニケーションサービスにおけるユーザの発言を検出し、
　前記タグ生成部は、前記発言に含まれるテキストに基づいてさらに前記タグ情報を生成する、前記（６）または（７）に記載の情報処理装置。
（９）前記コンテンツは、映像コンテンツであり、
　前記タグ関連付け部は、前記タグ情報を前記映像コンテンツの画面内位置に関連付ける、前記（１）～（８）のいずれか１項に記載の情報処理装置。
（１０）前記アクティビティ検出部は、前記画面内位置の指定を含む前記アクティビティを検出する、前記（９）に記載の情報処理装置。
（１１）前記タグ関連付け部は、前記タグ情報を前記画面内位置に対応する領域に関する情報に関連付ける、前記（９）に記載の情報処理装置。
（１２）前記領域は、被写体の表示領域を含み、
　前記タグ関連付け部は、前記タグ情報を前記被写体に関する情報に関連付ける、前記（１１）に記載の情報処理装置。
（１３）前記タグ情報が関連付けられる前記被写体に関する情報を前記コンテンツの再生画面に前もって表示させるタグ情報表示制御部をさらに備え、
　前記タグ関連付け部は、前記タグ情報表示制御部によって前もって表示された情報に応じてユーザがさらに実行したアクティビティに基づいて前記タグ情報に関連付けられる情報を決定する、前記（１２）に記載の情報処理装置。
（１４）前記タグ情報表示制御部は、前記タグ情報が関連付けられる前記被写体に関する情報を、前記アクティビティに対応する前記コンテンツ内の１または複数の位置に近接した位置に関連付けられた他のタグ情報に関連付けられた被写体の情報に基づいて決定する、前記（１３）に記載の情報処理装置。
（１５）前記タグ情報表示制御部は、前記タグ情報が関連付けられる前記被写体に関する情報を、前記領域の画像から抽出される情報に基づいて決定する、前記（１３）に記載の情報処理装置。
（１６）前記タグ関連付け部は、前記タグ情報表示制御部によって前もって表示された情報に応じてユーザがさらに実行したアクティビティに基づいて、前記タグ情報が関連付けられる前記被写体に関する情報を修正する、前記（１３）～（１５）のいずれか１項に記載の情報処理装置。
（１７）前記タグ関連付け部は、時間とともに進行する映像コンテンツ内の１または複数の再生位置に前記タグ情報を関連付け、
　前記情報処理装置は、前記１または複数の再生位置での前記映像コンテンツのキャプチャ画像によって、前記タグ情報を前記映像コンテンツの再生画面に表示させるタグ情報表示制御部をさらに備える、前記（１）～（１６）のいずれか１項に記載の情報処理装置。
（１８）前記タグ情報表示制御部は、さらに、前記タグ情報に含まれる情報の種類を示すアイコンによって、前記タグ情報を前記再生画面に表示させる、前記（１７）に記載の情報処理装置。
（１９）前記再生画面に表示されたタグ情報が選択された場合、前記映像コンテンツの再生を前記選択されたタグ情報に対応する再生位置にジャンプさせる再生制御部をさらに備える、前記（１７）または（１８）に記載の情報処理装置。
（２０）コンテンツ再生中のユーザによるアクティビティを検出することと、
　前記アクティビティに関する情報に基づいてタグ情報を生成することと、
　前記タグ情報を前記アクティビティに対応する前記コンテンツ内の１または複数の位置に関連付けることと
　を含む情報処理方法。

　１０，２０　　システム
　１００，５００　　サーバ
　１１０　　通信部
　１２０　　再生制御部
　１３０　　タグＤＢ
　１４０　　タグ情報表示制御部
　１５０　　アクティビティ検出部
　１６０　　生成部
　１７０　　タグ関連付け部
　１８０　　コミュニケーションサービス提供部
　２００，６００　　クライアント
　２１０　　通信部
　２２０　　表示制御部
　２３０　　表示部
　２４０　　音声制御部
　２５０　　音声出力部
　２６０　　操作部

Claims

　コンテンツ再生中のユーザによるアクティビティを検出するアクティビティ検出部と、
　前記アクティビティに関する情報に基づいてタグ情報を生成するタグ生成部と、
　前記タグ情報を前記アクティビティに対応する前記コンテンツ内の１または複数の位置に関連付けるタグ関連付け部と
　を備える情報処理装置。
　前記アクティビティ検出部は、前記ユーザによるコメントの投稿を検出し、
　前記タグ生成部は、前記コメントに含まれるテキストに基づいて前記タグ情報を生成する、請求項１に記載の情報処理装置。
　前記アクティビティ検出部は、前記ユーザによるソーシャルメディアへのコメントの投稿を検出する、請求項２に記載の情報処理装置。
　前記アクティビティ検出部は、前記ユーザによる前記コンテンツ以外の情報へのアクセスを検出し、
　前記タグ生成部は、前記アクセスされた情報に基づいて前記タグ情報を生成する、請求項１に記載の情報処理装置。
　前記タグ生成部は、前記アクセスされた情報へのリンクを含む前記タグ情報を生成する、請求項４に記載の情報処理装置。
　共通する前記コンテンツ内の位置に関連付けられる複数のタグ情報にそれぞれ対応するアクティビティを実行した複数のユーザにコミュニケーションサービスを提供するコミュニケーションサービス提供部をさらに備える、請求項１に記載の情報処理装置。
　前記タグ関連付け部は、時間とともに進行する前記コンテンツ内の１または複数の再生位置に前記複数のタグ情報を関連付け、
　前記情報処理装置は、前記ユーザが前記コミュニケーションサービスを利用している間は前記コンテンツを前記１または複数の再生位置を含む範囲で繰り返し再生する再生制御部をさらに備える、請求項６に記載の情報処理装置。
　前記アクティビティ検出部は、前記コミュニケーションサービスにおけるユーザの発言を検出し、
　前記タグ生成部は、前記発言に含まれるテキストに基づいてさらに前記タグ情報を生成する、請求項６に記載の情報処理装置。
　前記コンテンツは、映像コンテンツであり、
　前記タグ関連付け部は、前記タグ情報を前記映像コンテンツの画面内位置に関連付ける、請求項１に記載の情報処理装置。
　前記アクティビティ検出部は、前記画面内位置の指定を含む前記アクティビティを検出する、請求項９に記載の情報処理装置。
　前記タグ関連付け部は、前記タグ情報を前記画面内位置に対応する領域に関する情報に関連付ける、請求項９に記載の情報処理装置。
　前記領域は、被写体の表示領域を含み、
　前記タグ関連付け部は、前記タグ情報を前記被写体に関する情報に関連付ける、請求項１１に記載の情報処理装置。
　前記タグ情報が関連付けられる前記被写体に関する情報を前記コンテンツの再生画面に前もって表示させるタグ情報表示制御部をさらに備え、
　前記タグ関連付け部は、前記タグ情報表示制御部によって前もって表示された情報に応じてユーザがさらに実行したアクティビティに基づいて前記タグ情報に関連付けられる情報を決定する、請求項１２に記載の情報処理装置。
　前記タグ情報表示制御部は、前記タグ情報が関連付けられる前記被写体に関する情報を、前記アクティビティに対応する前記コンテンツ内の１または複数の位置に近接した位置に関連付けられた他のタグ情報に関連付けられた被写体の情報に基づいて決定する、請求項１３に記載の情報処理装置。
　前記タグ情報表示制御部は、前記タグ情報が関連付けられる前記被写体に関する情報を、前記領域の画像から抽出される情報に基づいて決定する、請求項１３に記載の情報処理装置。
　前記タグ関連付け部は、前記タグ情報表示制御部によって前もって表示された情報に応じてユーザがさらに実行したアクティビティに基づいて、前記タグ情報が関連付けられる前記被写体に関する情報を修正する、請求項１３に記載の情報処理装置。
　前記タグ関連付け部は、時間とともに進行する映像コンテンツ内の１または複数の再生位置に前記タグ情報を関連付け、
　前記情報処理装置は、前記１または複数の再生位置での前記映像コンテンツのキャプチャ画像によって、前記タグ情報を前記映像コンテンツの再生画面に表示させるタグ情報表示制御部をさらに備える、請求項１に記載の情報処理装置。
　前記タグ情報表示制御部は、さらに、前記タグ情報に含まれる情報の種類を示すアイコンによって、前記タグ情報を前記再生画面に表示させる、請求項１７に記載の情報処理装置。
　前記再生画面に表示されたタグ情報が選択された場合、前記映像コンテンツの再生を前記選択されたタグ情報に対応する再生位置にジャンプさせる再生制御部をさらに備える、請求項１７に記載の情報処理装置。
　コンテンツ再生中のユーザによるアクティビティを検出することと、
　前記アクティビティに関する情報に基づいてタグ情報を生成することと、
　前記タグ情報を前記アクティビティに対応する前記コンテンツ内の１または複数の位置に関連付けることと
　を含む情報処理方法。