JP2011175362A - Information processing apparatus, importance level calculation method, and program - Google Patents
Information processing apparatus, importance level calculation method, and program Download PDFInfo
- Publication number
- JP2011175362A JP2011175362A JP2010037469A JP2010037469A JP2011175362A JP 2011175362 A JP2011175362 A JP 2011175362A JP 2010037469 A JP2010037469 A JP 2010037469A JP 2010037469 A JP2010037469 A JP 2010037469A JP 2011175362 A JP2011175362 A JP 2011175362A
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- content
- attributes
- importance
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000004364 calculation method Methods 0.000 title claims abstract description 81
- 230000010365 information processing Effects 0.000 title claims abstract description 66
- 238000000605 extraction Methods 0.000 claims description 78
- 238000000034 method Methods 0.000 claims description 45
- 239000000284 extract Substances 0.000 claims description 22
- 238000004458 analytical method Methods 0.000 claims description 21
- 230000009471 action Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000011156 evaluation Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 12
- 238000012552 review Methods 0.000 description 12
- 230000036651 mood Effects 0.000 description 11
- 238000001914 filtration Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 7
- 239000011435 rock Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 2
- WZFUQSJFWNHZHM-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical class C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 WZFUQSJFWNHZHM-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、情報処理装置、重要度算出方法及びプログラムに関する。 The present invention relates to an information processing apparatus, an importance calculation method, and a program.
近年、情報通信技術の発展に伴い、音楽、映像、電子書籍、ニュース記事、商品情報又はイベント情報などの様々なコンテンツがネットワークを介してユーザに提供されている。このような膨大なコンテンツから個々のユーザが自己に見合った情報を探し出すことは容易でない。そのため、ユーザがコンテンツを探し出すことを支援するキーワード検索又はジャンル検索などの検索サービス、及びシステムがユーザにふさわしいコンテンツを推薦する推薦サービスなどが提供されている。例えば、下記特許文献1は、多くのコンテンツ推薦サービスに取り入れられている協調フィルタリングと呼ばれる手法について記述している。また、下記特許文献2は、ベクトル空間法によるマッチングを利用して推薦すべきTV番組を決定する手法について記述している。
In recent years, with the development of information communication technology, various contents such as music, video, electronic books, news articles, product information or event information are provided to users via a network. It is not easy for individual users to search for information suitable for themselves from such a vast amount of content. Therefore, there are provided search services such as keyword search or genre search that assist the user in finding content, and recommendation services in which the system recommends content suitable for the user. For example,
上述したようなコンテンツ検索サービス、コンテンツ推薦サービス及びその他のコンテンツ関連サービスにおいてサービスの有効性を左右する鍵となるのが、コンテンツの属性の取り扱いである。一般的に、コンテンツの属性には、コンテンツに人為的に付与される属性、コンテンツデータを解析することにより生成される属性、コンテンツに対するユーザアクションに基づいて算出される属性など、様々な種類のものがある。今日では、ユーザに提供されるコンテンツが増加しただけではなく、サービスが取り扱うべきコンテンツの属性の種類も多くなっている。そこで、コンテンツの属性の中から、コンテンツの分類、検索又は推薦等のために重要な属性を効率的に抽出することのできる技術が注目されている。例えば、下記特許文献3は、カテゴリ分類されるデータについての複数の属性の中から重要な属性を抽出するための技術の一例を記述している。
In the content search service, content recommendation service, and other content-related services as described above, the key to the effectiveness of the service is the handling of content attributes. In general, there are various types of content attributes, such as attributes that are artificially given to content, attributes that are generated by analyzing content data, and attributes that are calculated based on user actions on content. There is. Today, not only the content provided to users has increased, but the types of content attributes that the service should handle are also increasing. Therefore, a technique that can efficiently extract important attributes for content classification, search, recommendation, and the like from content attributes has attracted attention. For example,
しかしながら、上記特許文献3に記載された技術では、個々の属性ごとに重要性が判定されるため、相互に関連する属性の組合せについての重要性を認識することができない。例えば、音楽コンテンツの属性の例として「ジャンル」及び「年代」が挙げられる。「ジャンル」についての属性値は、「ロック」、「ポップ」又は「クラシック」などである。また、「年代」についての属性値は、「1970年代」、「1980年代」又は「1990年代」などである。このような場合に、同じ「ジャンル」(=例えば「ロック」)であっても、どの「年代」の「ロック」であるかがユーザにとって異なる意味を持つケースは少なくない。即ち、一般的に、多数のコンテンツの属性の中から属性の様々な組合せについての重要度を柔軟に評価することができれば、コンテンツ推薦の際の推薦理由の呈示、コンテンツ検索のためのジャンルの付与など、その重要度を様々な用途に活用できるものと期待される。
However, in the technique described in
そこで、本発明は、コンテンツの属性の中から属性の様々な組合せについての重要度を柔軟に評価することのできる、新規かつ改良された情報処理装置、重要度算出方法及びプログラムを提供しようとするものである。 Therefore, the present invention aims to provide a new and improved information processing apparatus, importance calculation method, and program capable of flexibly evaluating the importance of various combinations of attributes among the attributes of content. Is.
本発明のある実施形態によれば、複数のコンテンツについて、各コンテンツに付与される属性値を記憶する属性テーブルを保持する記憶部と、上記属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する他の1つ以上の属性の重要度を算出する重要度算出部と、を備え、上記重要度算出部は、上記重要度を、上記所定の属性を決定属性とし、上記1つ以上の属性を条件属性とする決定表を用いて算出する、情報処理装置が提供される。 According to an embodiment of the present invention, for a plurality of contents, a content is stored using a storage unit that stores an attribute table that stores attribute values assigned to each content, and attribute values stored in the attribute table. An importance calculating unit that calculates the importance of one or more other attributes with respect to the predetermined attribute, wherein the importance calculating unit uses the predetermined attribute as the determination attribute, There is provided an information processing apparatus that calculates using a decision table having two or more attributes as condition attributes.
かかる構成によれば、上記1つ以上の属性を条件属性のセットとして、様々な組合せについて、決定表を用いて上記所定の属性に対する重要度が算出され得る。 According to such a configuration, the importance for the predetermined attribute can be calculated for various combinations using the one or more attributes as a set of condition attributes using the determination table.
また、上記重要度算出部は、上記重要度を、上記決定表について上記決定属性の正領域を形成するコンテンツの数に基づいて算出してもよい。 In addition, the importance calculation unit may calculate the importance based on the number of contents forming a positive region of the determination attribute for the determination table.
また、上記情報処理装置は、上記重要度算出部により算出される上記重要度に応じて、コンテンツに関するユーザに呈示すべき情報を生成するために使用される1つ以上の重要属性を抽出する抽出部、をさらに備えてもよい。 In addition, the information processing apparatus extracts one or more important attributes used to generate information about the content to be presented to the user according to the importance calculated by the importance calculation unit. May be further provided.
また、上記情報処理装置は、上記属性テーブルに記憶されている属性値を用いてユーザに推薦すべきコンテンツを選択する推薦部であって、上記抽出部により抽出される上記1つ以上の重要属性に基づいて推薦の理由を生成する推薦部、をさらに備えてもよい。 The information processing apparatus is a recommendation unit that selects content to be recommended to a user using an attribute value stored in the attribute table, and the one or more important attributes extracted by the extraction unit A recommendation unit that generates a reason for recommendation based on the information may be further provided.
また、上記推薦部は、コンテンツの選択のために算出したコンテンツごとのスコアを上記属性テーブルにさらに記憶させ、上記抽出部は、上記スコアを決定属性として上記重要度算出部により算出される上記重要度に応じて、上記1つ以上の重要属性を抽出してもよい。 Further, the recommendation unit further stores a score for each content calculated for content selection in the attribute table, and the extraction unit calculates the importance calculated by the importance calculation unit using the score as a determination attribute. Depending on the degree, the one or more important attributes may be extracted.
また、上記属性テーブルは、各コンテンツに対するユーザのフィードバックに基づいて付与されるフィードバック属性の属性値をさらに記憶し、上記推薦部は、上記フィードバック属性の属性値を用いて、ユーザに推薦すべきコンテンツを選択し、上記抽出部は、上記フィードバック属性を決定属性として上記重要度算出部により算出される上記重要度に応じて、上記1つ以上の重要属性を抽出してもよい。 Further, the attribute table further stores attribute values of feedback attributes given based on user feedback for each content, and the recommendation unit uses the attribute values of the feedback attributes to recommend content to the user The extraction unit may extract the one or more important attributes according to the importance calculated by the importance calculation unit using the feedback attribute as a determination attribute.
また、上記属性テーブルは、各コンテンツに対するユーザアクションの状況に基づいて付与されるコンテキスト属性の属性値をさらに記憶し、上記推薦部は、上記コンテキスト属性の属性値を用いて、ユーザに推薦すべきコンテンツを選択し、上記抽出部は、上記コンテキスト属性を決定属性として上記重要度算出部により算出される上記重要度に応じて、上記1つ以上の重要属性を抽出してもよい。 The attribute table further stores an attribute value of a context attribute given based on a user action status for each content, and the recommendation unit should recommend to the user using the attribute value of the context attribute The content may be selected, and the extraction unit may extract the one or more important attributes according to the importance calculated by the importance calculation unit using the context attribute as a determination attribute.
また、上記属性テーブルは、各コンテンツに付与される基本属性の属性値に加えて、当該基本属性の属性値を解析することにより得られる拡張属性の属性値を記憶してもよい。 The attribute table may store an attribute value of an extended attribute obtained by analyzing the attribute value of the basic attribute in addition to the attribute value of the basic attribute given to each content.
また、上記抽出部は、上記所定の属性を決定属性とし、上記拡張属性に含まれる1つ以上の属性を条件属性として上記重要度算出部により算出される第1の重要度と、上記拡張属性に含まれる属性を決定属性とし、上記基本属性に含まれる1つ以上の属性を条件属性として上記重要度算出部により算出される第2の重要度とに応じて、上記1つ以上の重要属性を抽出してもよい。 In addition, the extraction unit includes the first importance calculated by the importance calculation unit using the predetermined attribute as a determination attribute and one or more attributes included in the extended attribute as a condition attribute, and the extended attribute. The one or more important attributes according to the second importance calculated by the importance calculating unit using the attribute included in the basic attribute as a decision attribute and one or more attributes included in the basic attribute as a condition attribute May be extracted.
また、上記情報処理装置は、PLSA(Probabilistic Latent Semantic Analysis)又はLDA(Latent Dirichlet Allocation)による確率的分類法に従って、上記基本属性の属性値に基づいて上記拡張属性の属性値を算出する解析部、をさらに備えてもよい。 Further, the information processing apparatus includes an analysis unit that calculates an attribute value of the extended attribute based on an attribute value of the basic attribute according to a probabilistic classification method based on PLSA (Probabilistic Latent Semantic Analysis) or LDA (Latent Dirichlet Allocation), May be further provided.
また、上記情報処理装置は、上記属性テーブルに記憶されている属性値を用いて再生すべきコンテンツのリストを生成するコンテンツリスト生成部であって、上記抽出部により抽出される上記1つ以上の重要属性に基づいてコンテンツリストのタイトルを生成するコンテンツリスト生成部、をさらに備え、上記抽出部は、上記コンテンツリスト生成部による上記コンテンツリストの生成のために使用された属性を決定属性として上記重要度算出部により算出される上記重要度に応じて、上記1つ以上の重要属性を抽出してもよい。 The information processing apparatus may be a content list generation unit that generates a list of contents to be played back using the attribute values stored in the attribute table, and the one or more extracted by the extraction unit A content list generation unit that generates a title of the content list based on the important attribute, and the extraction unit uses the attribute used for generation of the content list by the content list generation unit as the determination attribute. The one or more important attributes may be extracted according to the importance calculated by the degree calculation unit.
また、上記情報処理装置は、ユーザの指定に応じて再生すべきコンテンツのリストを生成するコンテンツリスト生成部であって、上記抽出部により抽出される上記1つ以上の重要属性に基づいてコンテンツリストのタイトルを生成するコンテンツリスト生成部、をさらに備え、上記抽出部は、ユーザによる指定の有無に応じて属性値が決定される属性を決定属性として上記重要度算出部により算出される上記重要度に応じて、上記1つ以上の重要属性を抽出してもよい。 The information processing apparatus may be a content list generation unit that generates a list of contents to be played according to a user's specification, and the content list is based on the one or more important attributes extracted by the extraction unit A content list generation unit that generates a title of the image, and the extraction unit calculates the importance calculated by the importance calculation unit using an attribute whose attribute value is determined according to whether or not specified by the user as a determination attribute Depending on, the one or more important attributes may be extracted.
また、上記記憶部は、各コンテンツに対するユーザアクションの履歴を表す履歴データ、をさらに保持し、上記重要度算出部は、上記履歴データに含まれるコンテンツについての属性値を用いて、ユーザごとに上記1つ以上の属性についての上記重要度を算出してもよい。 Further, the storage unit further holds history data representing a history of user actions for each content, and the importance calculation unit uses the attribute value for the content included in the history data, for each user. The importance degree for one or more attributes may be calculated.
また、上記重要度算出部は、Rough集合理論に従って上記決定表における決定属性の正領域を導出してもよい。 In addition, the importance calculation unit may derive a positive region of the decision attribute in the decision table according to a Rough set theory.
また、本発明の別の実施形態によれば、複数のコンテンツについて、各コンテンツに付与される属性値を記憶する属性テーブルを記憶媒体を用いて保持している情報処理装置において、上記属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する他の1つ以上の属性の重要度を算出するステップ、を含む重要度算出方法であって、上記重要度は、上記所定の属性を決定属性とし、上記1つ以上の属性を条件属性とする決定表を用いて算出される、重要度算出方法が提供される。 According to another embodiment of the present invention, in an information processing apparatus that uses a storage medium to store an attribute table that stores an attribute value assigned to each content for a plurality of contents, Calculating an importance level of one or more other attributes with respect to a predetermined attribute of the content using a stored attribute value, wherein the importance level is calculated based on the predetermined attribute value. Is a decision attribute, and an importance calculation method is provided that is calculated using a decision table having the one or more attributes as condition attributes.
また、本発明の別の実施形態によれば、複数のコンテンツについて、各コンテンツに付与される属性値を記憶する属性テーブルを記憶媒体を用いて保持している情報処理装置を制御するコンピュータを、上記属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する他の1つ以上の属性の重要度を算出する重要度算出部、として機能させるためのプログラムであって、上記重要度算出部は、上記重要度を、上記所定の属性を決定属性とし、上記1つ以上の属性を条件属性とする決定表を用いて算出する、プログラムが提供される。 According to another embodiment of the present invention, for a plurality of contents, a computer that controls an information processing apparatus that holds an attribute table that stores attribute values assigned to each content using a storage medium, A program for functioning as an importance calculation unit that calculates importance of one or more other attributes with respect to a predetermined attribute of content using attribute values stored in the attribute table, The degree calculation unit is provided with a program for calculating the importance using a determination table in which the predetermined attribute is the determination attribute and the one or more attributes are condition attributes.
以上説明したように、本発明に係る情報処理装置、重要度算出方法及びプログラムによれば、コンテンツの属性の中から属性の様々な組合せについての重要度を柔軟に評価することができる。 As described above, according to the information processing apparatus, the importance calculation method, and the program according to the present invention, the importance of various combinations of attributes can be flexibly evaluated from the attributes of the content.
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付すことにより重複説明を省略する。 Exemplary embodiments of the present invention will be described below in detail with reference to the accompanying drawings. In addition, in this specification and drawing, about the component which has the substantially same function structure, duplication description is abbreviate | omitted by attaching | subjecting the same code | symbol.
また、以下の順序にしたがって当該「発明を実施するための形態」を説明する。
1.用語の説明
2.一実施形態に係る情報処理装置の構成例
2−1.属性テーブル
2−2.記憶部
2−3.解析部
2−4.ユーザインタフェース制御部
2−5.推薦部
2−6.重要度算出部
2−7.抽出部
2−8.画面例
3.一実施形態に係る処理の流れ
3−1.事前処理
3−2.推薦処理
4.変形例
4−1.プレイリストの提供
4−2.個人化
5.ハードウェア構成例
6.まとめ
Further, the “DETAILED DESCRIPTION OF THE INVENTION” will be described in the following order.
1. Explanation of
<1.用語の説明>
まず、本明細書において使用する主な用語の説明を以下に記述する。
・確率的分類法:コンテンツ又はテキスト等の集合の要素を部分集合に分類するための手法の1つ。確率的分類法においては、1つのコンテンツ又はテキスト等が、複数の部分集合に確率を伴って帰属し得る。
・潜在トピック:確率的分類法における個々の部分集合に対応し、各コンテンツ又はテキストの生起に対して潜在的に寄与する概念。個々の部分集合の分野又は話題等を表現するものと考えることができる。
・PLSA(Probabilistic Latent Semantic Analysis):確率的分類法の1つ。潜在トピックによる確率的生成モデルを提供し、テキスト分類の分野において広く使用されている。
・LDA(Latent Dirichlet Allocation):PLSAを発展させた確率的分類法の1つ。潜在トピックによる確率的生成モデルを提供し、テキスト分類の分野において広く使用されている。
・トピック集合:ある潜在トピックに帰属確率を伴って分類されているコンテンツ又はテキスト等の集合
・Rough集合理論:識別不能性(indiscernibility)による不確実性を伴う決定表(decision table)を解析するための基礎となる理論。
・Crisp−Rough集合理論:Rough集合理論の一種。対象の集合をあるレベルで特定できる範囲で、属性を選択することによって対象の程よい近似を求める手法。
・Fuzzy−Rough集合理論:Crisp−Rough集合理論を発展させたRough集合理論の一種。対象属性を名義属性から数値属性に拡張することにより、連続値による属性の取り扱いと対象の記述とを可能とした手法。
・推薦エンジン:ユーザの嗜好(Preference)又はユーザのコンテンツに対するアクション等に基づいてコンテンツを推薦するシステムモジュール。CF又はCBFなどの様々な推薦アルゴリズムに基づく推薦エンジンが既に実用化されている。
・CF(Collaborative Filtering):協調フィルタリング。推薦アルゴリズムの一種。複数のユーザの嗜好データを蓄積しておき、あるユーザと嗜好の類似する他のユーザに関するデータに基づいて推薦等を行う手法。
・CBF(Content Based Filtering):コンテンツベースフィルタリング。推薦アルゴリズムの一種。コンテンツの属性データの類似度に基づいてコンテンツの推薦等を行う手法。
・推薦理由:推薦エンジンがコンテンツを推薦する際にユーザに呈示する推薦の根拠に関する説明。
<1. Explanation of terms>
First, explanations of main terms used in this specification will be described below.
Probabilistic classification: A method for classifying elements of a set such as content or text into subsets. In the probabilistic classification method, one content or text can belong to a plurality of subsets with probability.
Latent topic: a concept that corresponds to an individual subset in a probabilistic taxonomy and potentially contributes to the occurrence of each content or text. It can be thought of as representing the field or topic of an individual subset.
PLSA (Probabilistic Latent Semantic Analysis): A probabilistic classification method. Provides a probabilistic generation model with latent topics and is widely used in the field of text classification.
LDA (Latent Dirichlet Allocation): One of the probabilistic classification methods developed from PLSA. Provides a probabilistic generation model with latent topics and is widely used in the field of text classification.
-Topic set: A set of content or text classified as belonging to a potential topic with attribution probability-Rough set theory: To analyze a decision table with uncertainty due to indiscernibility The theory underlying
Crisp-Rough set theory: A kind of Rough set theory. A technique for finding a reasonable approximation of an object by selecting attributes within a range that can identify the set of objects at a certain level.
Fuzzy-Rough set theory: A type of Rough set theory developed from Crisp-Rough set theory. A technique that enables the handling of attributes by continuous values and the description of the target by extending the target attribute from the nominal attribute to the numeric attribute.
Recommendation engine: A system module that recommends content based on the user's preferences or actions on the user's content. Recommendation engines based on various recommendation algorithms such as CF or CBF have already been put into practical use.
CF (Collaborative Filtering): collaborative filtering. A kind of recommendation algorithm. A method of accumulating preference data of a plurality of users and making recommendations based on data relating to other users who have similar preferences to a certain user.
CBF (Content Based Filtering): Content-based filtering. A kind of recommendation algorithm. A method for recommending content based on the similarity of content attribute data.
・ Reason for recommendation: Explanation regarding the basis of recommendation presented to the user when the recommendation engine recommends content.
<2.一実施形態に係る情報処理装置の構成例>
本発明の一実施形態に係る情報処理装置100は、典型的には、複数のコンテンツについての属性値を記憶する属性テーブルを保持し、コンテンツの所定の属性への寄与の程度を表す重要度を、他の1つ以上の属性について算出する装置である。本実施形態では、情報処理装置100は、さらに推薦機能を有する。そして、情報処理装置100は、ユーザに推薦すべきコンテンツを選択すると共に、算出した上記重要度に応じて推薦理由を生成して、推薦すべきコンテンツに関する情報と推薦理由とをユーザに呈示する。
<2. Configuration Example of Information Processing Device According to One Embodiment>
The
図1は、本発明の一実施形態に係る情報処理装置100の構成を示すブロック図である。図1を参照すると、情報処理装置100は、記憶部110、解析部120、ユーザインタフェース(UI)制御部130、推薦部140、重要度算出部150及び抽出部160を備える。情報処理装置100は、例えば、記憶部110に記憶されるコンテンツをUI制御部130を介して再生可能なコンテンツプレーヤであってもよい。その代わりに、情報処理装置100は、例えば、UI制御部130を介して端末装置にネットワーク経由でコンテンツデータを提供するコンテンツサーバであってもよい。より一般的には、情報処理装置100は、例えば、高性能コンピュータ、PC(Personal Computer)、デジタル家電機器、ゲーム機器、AVプレーヤ又はスマートフォンなどの任意の種類の装置であってよい。
FIG. 1 is a block diagram showing a configuration of an
[2−1.属性テーブル]
まず、本実施形態に係る情報処理装置100の記憶部110により保持される属性テーブルについて説明する。属性テーブルは、複数のコンテンツについて、各コンテンツに付与される1つ以上の属性値を記憶するテーブルである。
[2-1. Attribute table]
First, an attribute table held by the
図2は、本実施形態に係る属性テーブルの概要を説明するための説明図である。図2を参照すると、属性テーブルは、大きく分けて基本属性、拡張属性及び評価属性の3種類の属性のカテゴリを有する。基本属性は、さらにメタデータ及びコンテキストデータの2種類のカテゴリに分類される。これら基本属性(メタデータ)、基本属性(コンテキストデータ)、拡張属性及び評価属性は、それぞれ1つ以上の属性項目(個々の属性)を含む。そして、これら属性項目ごとに、各コンテンツについて属性値が付与される。以下、図2に示した属性のカテゴリごとに、より具体的な属性の例を説明する。 FIG. 2 is an explanatory diagram for explaining an overview of the attribute table according to the present embodiment. Referring to FIG. 2, the attribute table is roughly divided into three types of attribute categories: basic attributes, extended attributes, and evaluation attributes. Basic attributes are further classified into two categories, metadata and context data. Each of these basic attributes (metadata), basic attributes (context data), extended attributes, and evaluation attributes includes one or more attribute items (individual attributes). An attribute value is assigned to each content item for each content item. Hereinafter, more specific examples of attributes will be described for each attribute category shown in FIG.
(1)基本属性:メタデータ
図3は、属性テーブルにより記憶される基本属性のうちのメタデータの一例を説明するための説明図である。図3を参照すると、メタデータは、「ジャンル」、「年代」、「ムード」、「キーワード」及び「アーティスト」の5種類の属性を含む。これら属性は、図3の例では、数値属性として表現されている。例えば、「ジャンル」については、「G1:Rock」、「G2:Pop」及びその他のジャンルに各コンテンツが属するか否かを表す数値が属性値として与えられている。例えば、コンテンツC1の「ジャンル」についての属性値は、(G1,G2,…)=(1.0,0.0,…)である。また、コンテンツC2の「ジャンル」についての属性値は、(G1,G2,…)=(0.0,1.0,…)である。同様に、「年代」については、「E1:’70s(1970年代)」、「E2:’80s(1980年代)」及びその他の年代に各コンテンツが属するか否かを表す数値が属性値として与えられている。コンテンツC1の「年代」についての属性値は、(E1,E2,…)=(1.0,0.0,…)である。また、コンテンツC2の「年代」についての属性値は、(E1,E2,…)=(0.0,1.0,…)である。なお、1つのコンテンツが重みを伴って複数の「ジャンル」又は「年代」等に属してもよい。
(1) Basic Attributes: Metadata FIG. 3 is an explanatory diagram for explaining an example of metadata among basic attributes stored by the attribute table. Referring to FIG. 3, the metadata includes five types of attributes of “genre”, “age”, “mood”, “keyword”, and “artist”. These attributes are expressed as numerical attributes in the example of FIG. For example, for “genre”, a numerical value indicating whether each content belongs to “G1: Rock”, “G2: Pop”, and other genres is given as an attribute value. For example, the attribute value for “genre” of the content C1 is (G1, G2,...) = (1.0, 0.0,...). Further, the attribute value for the “genre” of the content C2 is (G1, G2,...) = (0.0, 1.0,...). Similarly, for “age”, “E1: '70s (1970s)”, “E2:' 80s (1980s)”, and other numerical values indicating whether each content belongs to the other age are given as attribute values. It has been. The attribute value for the “age” of the content C1 is (E1, E2,...) = (1.0, 0.0,...). Further, the attribute value for the “age” of the content C2 is (E1, E2,...) = (0.0, 1.0,...). One content may belong to a plurality of “genres” or “age” with weights.
「ムード」は、例えば、特開2007−207218号公報に記載された技術を用いて音楽コンテンツの音声信号の特徴量を解析することにより付与される属性である。例えば、各コンテンツが「M1:明るさ」又は「M2:楽しさ」などの印象を有するか否かを表す数値が、「ムード」についての属性値として各コンテンツに与えられる。「キーワード」は、例えば、各コンテンツと関連付けてサービス提供者又はユーザから供給されるレビュー文をテキスト解析することにより付与される属性である。例えば、レビュー文に含まれる名詞や形容詞などの単語ごとの出現頻度が、「キーワード」についての属性値として各コンテンツに与えられる。「アーティスト」は、例えば、音楽コンテンツと関連する人物名ごとに付与される属性である。例えば、作曲者、作詞者、歌手又は共演者などの人物と関連を有するか否かを表す数値が、「アーティスト」についての属性値として各コンテンツに与えられる。 The “mood” is an attribute given by analyzing the feature amount of the audio signal of the music content using, for example, the technique described in Japanese Patent Application Laid-Open No. 2007-207218. For example, a numerical value indicating whether or not each content has an impression such as “M1: brightness” or “M2: fun” is given to each content as an attribute value for “mood”. The “keyword” is an attribute given by, for example, text analysis of a review sentence supplied from a service provider or a user in association with each content. For example, the appearance frequency for each word such as a noun or adjective included in the review sentence is given to each content as an attribute value for “keyword”. “Artist” is an attribute assigned to each person name associated with the music content, for example. For example, a numerical value indicating whether or not there is a relationship with a person such as a composer, a lyricist, a singer or a co-star is given to each content as an attribute value for “artist”.
なお、図3に示した属性は、数値属性の形式ではなく名義属性の形式によっても表現され得る。例えば、名義属性の形式によれば、コンテンツC1について「ジャンル」=「G1:Rock」、「年代」=「E1:’70s」、コンテンツC2について「ジャンル」=「G2:Pop」、「年代」=「E2:’80s」と表現することもできる(「属性」=「属性値」)。 Note that the attributes shown in FIG. 3 can be expressed not in the form of numerical attributes but also in the form of nominal attributes. For example, according to the format of the nominal attribute, “genre” = “G1: Rock”, “age” = “E1: '70s” for the content C1, and “genre” = “G2: Pop”, “age” for the content C2. = “E2: '80s” (“attribute” = “attribute value”).
これらメタデータは、典型的には、ユーザによる閲覧、視聴若しくは購買等(以下、閲覧等という)のアクション、又は後に説明する推薦処理等とは独立して、各コンテンツに予め付与することのできるデータである。 Typically, these metadata can be given in advance to each content independently of actions such as browsing, viewing, purchasing, etc. (hereinafter referred to as browsing) by the user, or recommendation processing described later. It is data.
(2)基本属性:コンテキスト
図4は、属性テーブルにより記憶される基本属性のうちのコンテキストデータの一例を説明するための説明図である。コンテキストデータは、典型的には、各コンテンツに対するユーザアクションの状況に基づいて付与されるデータである。図4を参照すると、コンテキストデータは、「時間帯」及び「場所」の2種類の属性を含む。例えば、「時間帯」は、「T1:10〜12(時)」、「T2:12〜14(時)」及びその他の時間帯において、各コンテンツが閲覧等された回数を表す。例えば、コンテンツC1の「時間帯」についての属性値は、(T1,T2,…)=(2,10,…)である。また、コンテンツC2の「時間帯」についての属性値は、(T1,T2,…)=(3,1,…)である。同様に、「場所」は、「P1:Tokyo」、「P2:Osaka」及びその他の場所において、各コンテンツが閲覧等された回数を表す。コンテンツC1の「場所」についての属性値は、(P1,P2,…)=(8,4,…)である。また、コンテンツC2の「場所」についての属性値は、(P1,P2,…)=(0,4,…)である。なお、コンテキストデータは、図4に例示した属性以外に、例えば、曜日、日付、国(場所)、ユーザの性別又は年齢層など、ユーザアクションと関連付けて取得可能な任意の属性を含んでもよい。また、図4に例示した「Tokyo」又は「Osaka」などの地理的位置の代わりに、「家庭」、「オフィス」又は「車の中」などの「場所」についての属性値がコンテキストデータに含まれてもよい。
(2) Basic Attributes: Context FIG. 4 is an explanatory diagram for explaining an example of context data among basic attributes stored by the attribute table. The context data is typically data that is given based on the state of user action for each content. Referring to FIG. 4, the context data includes two types of attributes “time zone” and “location”. For example, “time zone” represents the number of times each content is browsed in “T1: 10-12 (hours)”, “T2: 12-14 (hours)”, and other time zones. For example, the attribute value for the “time zone” of the content C1 is (T1, T2,...) = (2, 10,...). Also, the attribute value for the “time zone” of the content C2 is (T1, T2,...) = (3, 1,...). Similarly, “location” represents the number of times each content is browsed in “P1: Tokyo”, “P2: Osaka” and other locations. The attribute value for the “location” of the content C1 is (P1, P2,...) = (8, 4,...). Further, the attribute value for “location” of the content C2 is (P1, P2,...) = (0, 4,...). In addition to the attributes illustrated in FIG. 4, the context data may include any attribute that can be acquired in association with the user action, such as a day of the week, a date, a country (location), a user gender, or an age group. Further, instead of the geographical location such as “Tokyo” or “Osaka” illustrated in FIG. 4, attribute values for “location” such as “home”, “office”, or “in the car” are included in the context data. May be.
(3)拡張属性
図5は、属性テーブルにより記憶される拡張属性の概要を説明するための説明図である。拡張属性は、各コンテンツに付与される基本属性の属性値を解析することにより得られる属性である。本実施形態において、属性テーブルは、レビュー文層及び人物層という2つの層に分けられる拡張属性を有する。このうち、レビュー文層は、基本属性のうち「キーワード」の属性値を確率的分類法に従って解析することにより得られる、潜在トピックX1、…、Xmごとの各コンテンツの帰属確率を表す。一方、人物層は、基本属性のうち「アーティスト」の属性値を確率的分類法に従って解析することにより得られる、潜在トピックY1、…、Ymごとの各コンテンツの帰属確率を表す。
(3) Extended Attributes FIG. 5 is an explanatory diagram for explaining an outline of extended attributes stored by the attribute table. The extended attribute is an attribute obtained by analyzing the attribute value of the basic attribute given to each content. In the present embodiment, the attribute table has extended attributes that are divided into two layers, a review sentence layer and a person layer. Among these, the review sentence layer represents the attribution probability of each content for each of the latent topics X1,..., Xm obtained by analyzing the attribute value of “keyword” among the basic attributes according to the probabilistic classification method. On the other hand, the person layer represents the attribution probability of each content for each of the latent topics Y1,..., Ym, obtained by analyzing the attribute value of “artist” among the basic attributes according to the probabilistic classification method.
図6は、図5に示した拡張属性の具体的な例をさらに説明するための説明図である。図6の上部には、コンテンツC1、C2及びC3のそれぞれについて、キーワード(K1,K2,K3,K4,K5,…)の属性値(各キーワードのレビュー文における頻度)が示されている。キーワードK1、K2、K3、K4、K5は、それぞれ、「scandal」、「album」、「popularity」、「record」、「ability」である。そして、コンテンツC1について、キーワード(K1,K2,K3,K4,K5,…)=(1,0,2,0,1,…)である。また、コンテンツC2について、キーワード(K1,K2,K3,K4,K5,…)=(0,1,0,2,1,…)である。コンテンツC3について、キーワード(K1,K2,K3,K4,K5,…)=(3,0,1,1,0,…)である。PLSA又はLDAによりモデル化される確率的分類法によれば、これらキーワードは、各コンテンツが潜在的に帰属する潜在トピックの寄与によって、各コンテンツのレビュー文に現れる。逆に、キーワード(K1,K2,K3,K4,K5,…)の属性値をPLSA又はLDAによる確率的分類法に従って解析すれば、各コンテンツの潜在トピックごとの帰属確率を算出することができる。 FIG. 6 is an explanatory diagram for further explaining a specific example of the extended attribute shown in FIG. The upper part of FIG. 6 shows the attribute values (frequency of each keyword in the review sentence) of the keywords (K1, K2, K3, K4, K5,...) For each of the contents C1, C2, and C3. The keywords K1, K2, K3, K4, and K5 are “scandal”, “album”, “popularity”, “record”, and “ability”, respectively. For the content C1, the keywords (K1, K2, K3, K4, K5,...) = (1, 0, 2, 0, 1,...). For the content C2, the keywords (K1, K2, K3, K4, K5,...) = (0, 1, 0, 2, 1,...). For the content C3, the keyword (K1, K2, K3, K4, K5,...) = (3, 0, 1, 1, 0,...). According to the probabilistic taxonomy modeled by PLSA or LDA, these keywords appear in the review text of each content due to the contribution of potential topics to which each content potentially belongs. Conversely, if the attribute values of the keywords (K1, K2, K3, K4, K5,...) Are analyzed according to the probabilistic classification method by PLSA or LDA, the attribution probability for each potential topic of each content can be calculated.
より具体的には、各コンテンツのレビュー文dにおけるキーワードwの生起確率をp(w|d)とすると、生起確率p(w|d)は式(1)により表される。 More specifically, when the occurrence probability of the keyword w in the review sentence d of each content is p (w | d), the occurrence probability p (w | d) is expressed by Expression (1).
式(1)において、xiは潜在トピック、p(w|xi)は潜在トピックxiについての単語wの生起確率、p(xi|d)は各コンテンツの(レビュー文dの)トピック分布である。なお、潜在トピックxiの数は、解析の対象とするデータ空間の次元等に応じて予め適切な値(例えば16など)に設定される。 In Expression (1), x i is a latent topic, p (w | x i ) is the probability of occurrence of the word w for the latent topic x i , and p (x i | d) is the topic (of the review sentence d) of each content Distribution. Note that the number of latent topics x i is set to an appropriate value (for example, 16) in advance according to the dimension of the data space to be analyzed.
図6の下部には、キーワード(K1,K2,K3,K4,K5,…)の属性値をPLSA又はLDAによる確率的分類法に従って解析することにより得られる潜在トピック(X1,X2,…,Xn)ごとの帰属確率の一例が示されている。例えば、コンテンツC1について、帰属確率(X1,X2,…,Xn)=(0.4,0.1,…,0.3)である。コンテンツC2について、帰属確率(X1,X2,…,Xn)=(0.1,0.2,…,0.1)である。コンテンツC3について、帰属確率(X1,X2,…,Xn)=(0.6,0.1,…,0.1)である。本実施形態では、これら各コンテンツの潜在トピックごとの帰属確率が、拡張属性の1つの層の属性値として、属性テーブルにより記憶される。なお、確率的分類法に従って拡張属性を算出する際には、基本属性の属性値を1つの属性項目(例えば個々のキーワード)の範囲内で正規化した上で(最大値を1とした上で)確率的分類法を適用するのが好適である。 In the lower part of FIG. 6, latent topics (X1, X2,..., Xn) obtained by analyzing attribute values of keywords (K1, K2, K3, K4, K5,...) According to a probabilistic classification method by PLSA or LDA. An example of the probability of belonging to each) is shown. For example, for the content C1, the attribution probability (X1, X2,..., Xn) = (0.4, 0.1,..., 0.3). For the content C2, the attribution probability (X1, X2,..., Xn) = (0.1, 0.2,..., 0.1). For the content C3, the attribution probability (X1, X2,..., Xn) = (0.6, 0.1,..., 0.1). In this embodiment, the attribution probability for each potential topic of each content is stored in the attribute table as an attribute value of one layer of extended attributes. When calculating the extended attribute according to the probabilistic classification method, the attribute value of the basic attribute is normalized within the range of one attribute item (for example, an individual keyword) (with the maximum value set to 1). It is preferred to apply a probabilistic classification method.
(4)評価属性
図7は、属性テーブルにより記憶される評価属性の一例を説明するための説明図である。評価属性は、典型的には、各コンテンツについての推薦エンジン又はユーザによる評価を表す属性である。図7を参照すると、評価属性は、アルゴリズムスコア及びユーザフィードバック(FB)の2種類のカテゴリに分類される。
(4) Evaluation Attributes FIG. 7 is an explanatory diagram for explaining an example of evaluation attributes stored by the attribute table. The evaluation attribute is typically an attribute representing evaluation by a recommendation engine or a user for each content. Referring to FIG. 7, evaluation attributes are classified into two categories: algorithm score and user feedback (FB).
このうち、アルゴリズムスコアは、1つ以上の推薦アルゴリズムにより算出されるコンテンツごとのスコアS1、S2、…を含む。例えば、スコアS1はCF(協調フィルタリング)により算出されるスコア、スコアS2はCBF(コンテンツベースフィルタリング)により算出されるスコアであってよい。この場合、例えば、コンテンツC1についてのスコアS1は、推薦の対象とするユーザのユーザ嗜好と、コンテンツC1を閲覧等した他のユーザのユーザ嗜好との間の類似度などに相当する。また、コンテンツC1についてのスコアS2は、推薦の対象とするユーザが閲覧等したコンテンツのメタデータと、コンテンツC1のメタデータとの間の類似度などに相当する。 Among these, the algorithm score includes scores S1, S2,... For each content calculated by one or more recommendation algorithms. For example, the score S1 may be a score calculated by CF (collaborative filtering), and the score S2 may be a score calculated by CBF (content-based filtering). In this case, for example, the score S1 for the content C1 corresponds to the degree of similarity between the user preference of the user to be recommended and the user preference of another user who has browsed the content C1. The score S2 for the content C1 corresponds to the degree of similarity between the metadata of the content browsed by the user to be recommended and the metadata of the content C1.
一方、ユーザFBは、各コンテンツに対するユーザからのフィードバックに基づいて付与される属性値を含む。ユーザFBの属性値は、例えば、「Y:好き」又は「N:嫌い」の二値データ、又は多段階(例えば5段階)評価における点数などを表す。その代わりに、ユーザフィードバックは、例えば、ユーザによる閲覧等のアクションの回数を表してもよい。 On the other hand, the user FB includes attribute values given based on feedback from the user with respect to each content. The attribute value of the user FB represents, for example, binary data of “Y: likes” or “N: dislikes” or a score in multi-level (for example, 5-level) evaluation. Instead, the user feedback may represent the number of actions such as browsing by the user, for example.
次に、図1に示した情報処理装置100の各部の動作について、順に説明する。
Next, the operation of each unit of the
[2−2.記憶部]
記憶部110は、ハードディスク又は半導体メモリなどの記憶媒体を用いて構成され、図2〜図8を用いて説明した属性テーブルを保持する。属性テーブルには、上述した基本属性、拡張属性及び評価属性の各々の属性項目の属性値が格納される。そして、記憶部110は、情報処理装置100の各部との間で、これら属性値を入出力する。さらに、記憶部110は、コンテンツデータそのものを記憶してもよい。例えば、情報処理装置100が音楽プレーヤである場合には、音楽コンテンツのオーディオデータが記憶部110により記憶されてもよい。
[2-2. Storage unit]
The
[2−3.解析部]
解析部120は、PLSA又はLDAによる確率的分類法に従って、属性テーブルの基本属性の属性値に基づいて、拡張属性の属性値を算出する。例えば、解析部120は、基本属性の属性値のうち、キーワードに関する属性値を確率的分類法に従って解析することにより、拡張属性のレビュー文層の属性値を算出する。より具体的には、拡張属性のレビュー文層の属性値は、例えば、潜在トピックごとのキーワードの生起確率との積和によりキーワードに関する属性値(出現頻度)を導く、各コンテンツのトピック分布であってよい(式(1)参照)。また、例えば、解析部120は、基本属性の属性値のうち、アーティストに関する属性値を確率的分類法に従って解析することにより、拡張属性の人物層の属性値を算出する。そして、解析部120は、算出した拡張属性の属性値を属性テーブルに格納する。解析部120による確率的分類法に従った解析は、例えば、コンテンツのデータベース(例えば記憶部110)に一定の数のコンテンツが蓄積された時、又は1ヶ月ごと若しくは1年ごとなどのように定期的に実行され得る。
[2-3. Analysis Department]
The
なお、PLSAについては、Thomas Hofmannによる“Probabilistic latent semantic indexing”(1999, Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval)において詳しく説明されている。また、LDAについては、David M. Blei, Andrew Y. Ng, Michael I. Jordanによる“Latent Dirichlet Allocation”(2003, Journal of Machine Learning Research, Volume 3)において詳しく説明されている。 The PLSA is described in detail in “Probabilistic latent semantic indexing” by Thomas Hofmann (1999, Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval). LDA is described in detail in “Latent Dirichlet Allocation” (2003, Journal of Machine Learning Research, Volume 3) by David M. Blei, Andrew Y. Ng, Michael I. Jordan.
[2−4.ユーザインタフェース制御部]
UI制御部130は、情報処理装置100とユーザとの間のユーザインタフェースを制御する。かかるユーザインタフェースは、典型的には、表示装置により表示される画面インタフェースと、マウス、キーボード、タッチパネル又はキーパッドなどの入力インタフェースとを含む。さらに、音声出力回路又は映像出力回路などのコンテンツ再生用のインタフェースが、ユーザインタフェースに含まれてもよい。これらユーザインタフェースは、例えば、情報処理装置100上に実装されてもよく、その代わりに情報処理装置100とネットワークを介して接続される端末装置上に実装されてもよい。
[2-4. User interface control unit]
The
より具体的には、UI制御部130は、例えば、あるコンテンツについてのユーザによるアクションに応じて、当該コンテンツについてのコンテキストデータを更新する。即ち、例えば、ユーザが午前11時に東京においてコンテンツC1を閲覧したとする。その場合、UI制御部130は、コンテンツC1についての時間帯「T1:10〜12(時)」及び場所「P1:Tokyo」の属性値を更新する。UI制御部130は、例えば、端末装置のIPアドレスに基づいて、又はGPS(Global Positioning System)を用いて、ユーザによるコンテンツの閲覧場所を認識することができる。
More specifically, the
また、UI制御部130は、例えば、あるコンテンツについての図7に例示したユーザフィードバックの値を入力インタフェースを介して取得し、取得した値を属性テーブルに格納する。また、UI制御部130は、例えば、後に説明する推薦部140により生成される推薦画面を表示装置に表示させる。
For example, the
さらに、UI制御部130は、例えば、情報処理装置100又は端末装置がユーザの状態を検知することのできるセンサを備える場合には、当該センサにより取得されるユーザの状態をコンテキストデータの属性値として属性テーブルに格納してもよい。例えば、スマイルセンサ機能を有する撮像モジュールによりユーザの笑顔の状態を取得すること、又は生体センサによりユーザの脈拍又は呼吸数等の状態を取得することなどが考えられる。
Furthermore, for example, when the
[2−5.推薦部]
推薦部140は、記憶部110が保持している属性テーブルに記憶されている属性値を用いて、ユーザに推薦すべきコンテンツを選択する推薦エンジンとして動作する。また、推薦部140は、後に説明する抽出部160により抽出される1つ以上の重要属性に基づいて、推薦の理由を生成する。そして、推薦部140は、推薦すべきコンテンツに関する情報と推薦理由とをユーザに呈示する推薦画面を生成し、生成した推薦画面をUI制御部130を介して表示装置に表示させる。
[2-5. Recommendation section]
The
推薦部140によるコンテンツの選択は、例えば、上述したCF又はCBFなど、任意の公知の推薦アルゴリズムに従って行われてよい。例えば、推薦部140が推薦アルゴリズムとしてCFを用いる場合には、推薦部140は、ユーザの嗜好と類似する嗜好を有する他のユーザを特定する。次に、推薦部140は、当該他のユーザにより閲覧等された一群のコンテンツを抽出する。このとき、推薦部140は、例えば、嗜好の類似度又は当該他のユーザによる各コンテンツの評価などに応じて、抽出した一群のコンテンツの各々についてのスコア(各コンテンツのユーザへの適合度、又は推薦についての確信度など)を算出する。ここで算出されるコンテンツごとのスコアは、属性テーブルに格納される。そして、推薦部140は、例えば、スコアの相対的に高いコンテンツを、ユーザに推薦すべきコンテンツとして選択する。
The selection of content by the
また、例えば、推薦部140が推薦アルゴリズムとしてCBFを用いる場合には、推薦部140は、ユーザが閲覧等したコンテンツとの間でメタデータが類似する一群のコンテンツを抽出する。このとき、推薦部140は、例えば、メタデータの類似度に応じて、抽出した一群のコンテンツの各々についてのスコアを算出する。ここで算出されるコンテンツごとのスコアは、属性テーブルに格納される。そして、推薦部140は、例えば、スコアの相対的に高いコンテンツを、ユーザに推薦すべきコンテンツとして選択する。
Further, for example, when the
また、例えば、推薦部140は、属性テーブルに記憶されているユーザFBについての属性値を用いて、ユーザに推薦すべきコンテンツを選択してもよい。例えば、複数のコンテンツのうち、ユーザFBについての属性値が良好な値を示すコンテンツが、推薦すべきコンテンツとして優先的に選択され得る。また、例えば、推薦部140は、属性テーブルに記憶されているコンテキストデータについての属性値を用いて、ユーザに推薦すべきコンテンツを選択してもよい。例えば、複数のコンテンツのうち、推薦処理を実行している時間帯及び推薦の対象とするユーザが位置する場所においてより多く閲覧等された実績のあるコンテンツが、推薦すべきコンテンツとして優先的に選択され得る。
For example, the
推薦部140は、推薦すべきコンテンツを選択すると、コンテンツの選択に使用した所定の属性に対する重要度を、当該所定の属性以外の1つ以上の属性について、重要度算出部150に算出させる。また、推薦部140は、ユーザに呈示すべき推薦理由を生成するために使用される1つ以上の重要属性を、抽出部160に抽出させる。そして、推薦部140は、抽出部160により抽出された1つ以上の重要属性を用いて推薦理由を生成し、推薦すべきコンテンツに関する情報と推薦理由とを表示する推薦画面を、UI制御部130へ出力する。
When selecting the content to be recommended, the
[2−6.重要度算出部]
重要度算出部150は、属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する重要度を、コンテンツの当該所定の属性以外の1つ以上の属性について算出する。特に、本実施形態において、重要度算出部150は、上記1つ以上の属性についての重要度を、上記所定の属性を決定属性とし、上記1つ以上の属性を条件属性とする決定表を用いて算出する。例えば、以下に説明するように、重要度算出部150は、上述した決定表について決定属性の正領域を形成するコンテンツの数に基づいて、重要度を算出することができる。決定表における決定属性の正領域は、Rough集合理論に従って導出され得る。
[2-6. Importance calculator]
The importance
(1)決定表に関連する諸概念
図8は、Rough集合理論が適用される決定表に関連する諸概念について説明するための説明図である。図8の上部には、決定表の基本的な構成が示されている。図8に例示される決定表は、二次元の表であって、縦軸に対象全体集合U、横軸に属性全体集合Aをとる。対象全体集合Uは、コンテンツの集合である。一方、属性全体集合Aは、属性項目の集合である。属性全体集合Aは、条件属性C及び決定属性Dの和集合である。条件属性C及び決定属性Dは、共に、1つ以上の属性を含む。属性値集合Vは、属性全体集合Aに含まれる各属性が取り得る名義属性の属性値の集合である。例えば、図3に例示した属性「ジャンル」及び「年代」が属性全体集合Aの元(member)である場合には、V={{Rock,Jazz,…},{‘70s,’80s,…}}などとなる。属性値関数ρは、対象全体集合Uの1つの元(コンテンツ)と属性全体集合Aの1つ元(属性)とが与えられた場合に、それに応じて属性値を特定する関数である(ρ:U×A→V)。
(1) Various Concepts Related to Decision Table FIG. 8 is an explanatory diagram for explaining various concepts related to the decision table to which the Rough set theory is applied. The basic configuration of the decision table is shown in the upper part of FIG. The decision table illustrated in FIG. 8 is a two-dimensional table, in which the vertical axis represents the target total set U and the horizontal axis represents the attribute total set A. The entire target set U is a set of contents. On the other hand, the entire attribute set A is a set of attribute items. The entire attribute set A is a union of the condition attribute C and the decision attribute D. Both the condition attribute C and the decision attribute D include one or more attributes. The attribute value set V is a set of attribute values of nominal attributes that each attribute included in the attribute total set A can take. For example, when the attributes “genre” and “age” illustrated in FIG. 3 are members of the entire attribute set A, V = {{Rock, Jazz,...}, {'70s,' 80s,. }} Etc. The attribute value function ρ is a function that specifies an attribute value in response to one element (content) of the entire object set U and one element (attribute) of the entire attribute set A (ρ). : U × A → V).
図8の左下には、概念集合Xが示されている。概念集合Xは、特定の属性の属性値を1つの概念とみなした場合の、当該概念に属するコンテンツの集合である。例えば、属性Aが“Y”又は“N”の二値の属性値をとり得る場合に、属性A=“Y”という概念についての概念集合Xは、属性A=“Y”であるコンテンツを要素として含む。 A concept set X is shown in the lower left of FIG. The concept set X is a set of contents belonging to the concept when the attribute value of a specific attribute is regarded as one concept. For example, when the attribute A can take a binary attribute value “Y” or “N”, the concept set X for the concept of the attribute A = “Y” Include as.
図8の右下には、属性部分集合P(P⊆C)及びQ(Q⊆D)が示されている。属性部分集合Pは、条件属性Cのうち、重要度の算出に用いる条件属性の集合である。一方、属性部分集合Qは、決定属性Cのうち、重要度の算出に用いる決定属性の集合である。 In the lower right of FIG. 8, attribute subsets P (P⊆C) and Q (Q⊆D) are shown. The attribute subset P is a set of condition attributes used for calculating the importance of the condition attributes C. On the other hand, the attribute subset Q is a set of decision attributes used for calculation of importance among the decision attributes C.
(2)Crisp Rough集合に関する定義式
表1は、上述した決定表に関連する諸概念を用いて記述される、Crisp Rough集合に関する定義式を表す。
(2) Definition Formula for Crisp Rough Set Table 1 shows a definition formula for the Crisp Rough set described using various concepts related to the decision table described above.
図9を参照しながら、表1の各項目について説明する。図9の上部には、コンテンツC1〜C6を対象全体集合Uに含む決定表の一例が示されている。図9の決定表の条件属性の属性部分集合Pは、基本属性のうちのメタデータ「ジャンル」、「年代」、「キーワード(“世界”)」及び「ムード(“明るさ”)」を含む。ここでは、説明の簡明さの観点から、「ジャンル」、「年代」及び「ムード(“明るさ”)」は名義属性の形式で表現されるものとする。「決定属性の属性部分集合Qは、評価属性のうちのユーザFB「好み」を含む。 Each item in Table 1 will be described with reference to FIG. In the upper part of FIG. 9, an example of a decision table including the contents C1 to C6 in the target entire set U is shown. The attribute subset P of the condition attributes in the decision table of FIG. 9 includes metadata “genre”, “age”, “keyword (“ world ”)”, and “mood (“ brightness ”)” among the basic attributes. . Here, from the viewpoint of simplicity of explanation, it is assumed that “genre”, “age”, and “mood (“ brightness ”)” are expressed in the form of nominal attributes. “The attribute subset Q of the decision attributes includes the user FB“ preference ”among the evaluation attributes.
表1において、P−同値関係の式は、条件属性の属性部分集合Pにおいて、対象全体集合Uに属するコンテンツxとコンテンツyとが同値関係であるための条件を表す。例えば、図9の決定表において、コンテンツC2の条件属性の属性値とコンテンツC6の条件属性の属性値とは等しく、コンテンツC2とコンテンツC6とは同値関係にある。 In Table 1, the expression of P-equivalence relationship represents a condition for content x and content y belonging to the target entire set U to have an equivalence relationship in the attribute subset P of the condition attributes. For example, in the determination table of FIG. 9, the attribute value of the condition attribute of the content C2 is equal to the attribute value of the condition attribute of the content C6, and the content C2 and the content C6 are in the same value relationship.
P−同値類は、条件属性の属性部分集合Pにおいて、あるコンテンツxと同値関係にあるコンテンツの集合を表す。図9の決定表において、コンテンツC2及びコンテンツC6は、1つのP−同値類を形成する。 The P-equivalence class represents a set of contents having an equivalence relation with a certain content x in the attribute subset P of the condition attributes. In the decision table of FIG. 9, the content C2 and the content C6 form one P-equivalence class.
P−同値類によるU分割は、各々のP−同値類を部分集合として対象全体集合Uが分割され得ることを表す。図9の決定表において、5つの部分集合{C1}、{C2,C6}、{C3}、{C4}及び{C5}により、対象全体集合Uが分割され得る。 The U division by P-equivalence classes indicates that the target entire set U can be divided with each P-equivalence class as a subset. In the decision table of FIG. 9, the target entire set U can be divided by five subsets {C1}, {C2, C6}, {C3}, {C4}, and {C5}.
概念XのP−上近似は、条件属性の属性部分集合Pについての属性値に基づいて、概念集合Xに含まれる可能性があると判断されるコンテンツの集合を表す。図9の決定表において、決定属性Qの「好み」=“Y”の概念集合Xに含まれる可能性があるコンテンツは、コンテンツC1、C2,C4及びC6である。よって、「好み」=“Y”という概念の上近似は、集合{C1,C2,C4,C6}である。なお、コンテンツC2が当該上近似に含まれるのは、コンテンツC2と同値関係にあるコンテンツC6の「好み」が“Y”であるためである。 The P-top approximation of the concept X represents a set of contents that are determined to be included in the concept set X based on the attribute values for the attribute subset P of the condition attribute. In the decision table of FIG. 9, contents C1, C2, C4, and C6 are contents that may be included in the concept set X of “preference” = “Y” of the decision attribute Q. Therefore, the upper approximation of the concept of “preference” = “Y” is the set {C1, C2, C4, C6}. The reason why the content C2 is included in the upper approximation is that the “favorite” of the content C6 that is equivalent to the content C2 is “Y”.
概念XのP−下近似は、条件属性の属性部分集合Pについての属性値に基づいて、概念集合Xに必然的に含まれると判断されるコンテンツの集合を表す。図9の決定表において、決定属性Qの「好み」=“Y”の概念集合Xに必然的に含まれると判断されるコンテンツは、コンテンツC1及びC4である。よって、「好み」=“Y”という概念の下近似は、集合{C1,C4}である。なお、コンテンツC6が当該下近似に含まれないのは、コンテンツC6と同値関係にあるコンテンツC2の「好み」が“N”であるためである。 The P-lower approximation of the concept X represents a set of contents that are determined to be necessarily included in the concept set X based on the attribute values for the attribute subset P of the condition attribute. In the decision table of FIG. 9, the contents that are inevitably determined to be included in the concept set X of “preference” = “Y” of the decision attribute Q are the contents C1 and C4. Therefore, the lower approximation of the concept of “preference” = “Y” is the set {C1, C4}. The reason why the content C6 is not included in the lower approximation is that the “favorite” of the content C2 having the same relationship with the content C6 is “N”.
Q−同値類によるU分割は、各々のQ−同値類を部分集合として対象全体集合Uが分割され得ることを表す。図9の決定表において、それぞれ決定属性Qの同値類である2つの部分集合{C1,C4,C6}及び{C2,C3,C5}により、対象全体集合Uが分割され得る。 The U division by the Q-equivalence class indicates that the target entire set U can be divided by using each Q-equivalence class as a subset. In the decision table of FIG. 9, the target entire set U can be divided by two subsets {C1, C4, C6} and {C2, C3, C5} that are equivalence classes of the decision attribute Q.
P,Qにおける正領域は、決定属性Qの同値類についてのP−下近似の、全ての同値類にわたっての和集合を表す。図9の決定表において、「好み」=“Y”という概念の下近似は、集合{C1,C4}である。「好み」=“N”という概念の下近似は、集合{C3,C5}である。従って、図9の決定表における条件属性P,決定属性Qにおける正領域は、集合{C1,C4},{C3,C5}}である。 The positive region in P and Q represents the union over all equivalence classes of the P-lower approximation for the equivalence class of the decision attribute Q. In the decision table of FIG. 9, the lower approximation of the concept of “preference” = “Y” is the set {C1, C4}. The lower approximation of the concept of “preference” = “N” is the set {C3, C5}. Accordingly, the primary regions in the condition attribute P and the decision attribute Q in the decision table of FIG. 9 are the set {C1, C4}, {C3, C5}}.
(3)Fuzzy Rough集合に関する定義式
表2は、上述した決定表に関連する諸概念についての、Fuzzy Rough集合に関する定義式を表す。Crisp Rough集合の代わりにFuzzy Rough集合を用いることにより、名義属性に関する近似集合だけでなく、数値属性に関する近似集合をも扱うことが可能となる。例えば、表2において、ファジィ同値類μFi(x)(対象xにおける属性Fiのメンバシップ値)は、0.0〜1.0の連続値で表現される。
(3) Definition Formula for Fuzzy Rough Set Table 2 shows a definition formula for the Fuzzy Rough set for the concepts related to the decision table described above. By using the Fuzzy Rough set instead of the Crisp Rough set, it is possible to handle not only the approximate set related to the nominal attribute but also the approximate set related to the numerical attribute. For example, in Table 2, (membership value of the attribute F i in the subject x) fuzzy equivalence classes mu Fi (x) is represented by consecutive values of 0.0 to 1.0.
なお、Fuzzy Rough集合理論については、Richard Jensen and Qiang Shenによる“Fuzzy-Rough Data Reduction with Ant Colony Optimization”(Fuzzy Sets and Systems, vol. 149, no. 1, pp. 5-20, 2005)において詳しく説明されているため、ここではその説明を省略する。 The Fuzzy Rough set theory is detailed in “Fuzzy-Rough Data Reduction with Ant Colony Optimization” by Richard Jensen and Qiang Shen (Fuzzy Sets and Systems, vol. 149, no. 1, pp. 5-20, 2005). Since it is described, its description is omitted here.
(4)重要度算出式
重要度算出部150による、Crisp Rough集合についての重要度算出式を式(2)に示す。γP(Q)は、決定属性(集合)Qに対する条件属性(集合)Pの重要度である。
(4) Importance Calculation Formula The importance calculation formula for the Crisp Rough set by the
式(2)において、card(K)は、集合Kの濃度(cardinality)、即ち集合Kに含まれる元の数を表す。即ち、右辺の分母は、対象全体集合Uの濃度を表す。右辺の分子は、条件属性(集合)P、決定属性(集合)Qについての正領域の濃度を表す。 In Equation (2), card (K) represents the cardinality of the set K, that is, the original number included in the set K. That is, the denominator on the right side represents the density of the entire target set U. The numerator on the right side represents the density of the positive region for the condition attribute (set) P and the decision attribute (set) Q.
図9の例では、対象全体集合Uの濃度は、コンテンツC1〜C6の数、即ち6である。条件属性(集合)P、決定属性(集合)Qについての正領域の濃度は、「好み」=“Y”の下近似の濃度(=2)及び「好み」=“N”の下近似の濃度(=2)の和に相当し、2+2=4である。従って、式(2)によれば、決定属性(「好み」)に対する条件属性の組合せ「ジャンル」、「年代」、「キーワード(“世界”)」及び「ムード(“明るさ”)」の重要度は、4/6=0.67と算出される。 In the example of FIG. 9, the density of the entire target set U is the number of contents C1 to C6, that is, six. The density of the positive region for the condition attribute (set) P and the decision attribute (set) Q is the density of the lower approximation (= 2) of “Preference” = “Y” and the density of the lower approximation of “Preference” = “N”. It corresponds to the sum of (= 2), and 2 + 2 = 4. Therefore, according to the formula (2), the combination of the condition attribute “genre”, “age”, “keyword (“ world ”)” and “mood (“ brightness ”)” with respect to the decision attribute (“preference”) is important. The degree is calculated as 4/6 = 0.67.
一般的に、正領域の濃度は、選択された条件属性の属性値が決定属性の属性値の決定により大きく寄与する場合、即ち、条件属性の属性値が与えられることで決定属性の属性値をより高い確度で予測できる場合に、高い値となる。逆に、条件属性の属性値が与えられても、決定属性の属性値がある程度の確度(あるいは必然性)をもって定まらない場合には、正領域の濃度は低くなる。これが意味するところは、対象全体集合Uの濃度を用いて式(2)のように正規化された正領域の濃度が、任意に選択される条件属性の組合せ(条件属性の属性部分集合P)の、決定属性(決定属性の属性部分集合Q)の属性値に対する情報伝達性(informativity)の指標(あるいは近似の質の指標)として扱い得るということである。従って、例えば、属性テーブルに含まれる評価属性を決定属性とし、その他の任意の属性の組合せを条件属性として各組合せについて重要度を算出することにより、コンテンツの推薦の基礎となるスコア又はユーザFBがどのような属性の組合せによって有意に決定され又は予測され得るかを、数値的に評価することが可能となる。 Generally, the density of the positive region is determined when the attribute value of the selected condition attribute greatly contributes to the determination of the attribute value of the determination attribute, that is, the attribute value of the determination attribute is given by the attribute value of the condition attribute. A high value is obtained when prediction can be made with higher accuracy. On the other hand, if the attribute value of the decision attribute is not determined with a certain degree of accuracy (or necessity) even if the attribute value of the condition attribute is given, the density of the normal region is low. This means that a combination of condition attributes (condition attribute attribute subset P) in which the density of the normal region normalized by using the density of the entire object set U is arbitrarily selected as shown in Equation (2). It can be treated as an index (or an approximate quality index) of informativity for the attribute value of the determination attribute (attribute subset Q of the determination attribute). Therefore, for example, by calculating the importance for each combination using the evaluation attribute included in the attribute table as the determination attribute and the combination of any other attribute as the condition attribute, the score or the user FB as the basis for recommending the content can be obtained. It is possible to numerically evaluate what combination of attributes can be determined or predicted significantly.
重要度算出部150による、Fuzzy Rough集合についての重要度算出式は、式(3)の通りである。式(3)に従って算出される重要度もまた、任意に選択される条件属性の組合せ(条件属性の属性部分集合P)の、決定属性(決定属性の属性部分集合Q)の属性値に対する情報伝達性の指標として扱い得る。
The importance calculation formula for the Fuzzy Rough set by the
重要度算出部150は、様々な条件属性の組合せ(以下、条件属性セットという)について、式(2)又は式(3)に従って、決定属性Qに対する重要度を計算する。
The
図10は、図9の上部に例示した決定表に基づいて算出される、様々な条件属性セットについての重要度の一例について説明するための説明図である。図10を参照すると、「ジャンル」、「年代」、「キーワード(“世界”)」及び「ムード(“明るさ”)」という4つの元を含む条件属性Cから選択され得る15通りの条件属性セットAS1〜AS15が示されている(そのうち一部は省略されている)。例えば、条件属性セットAS1は、「ジャンル」のみを含む。条件属性セットAS2は、「年代」のみを含む。また、条件属性セットAS5は、「ジャンル」と「年代」とを含む。条件属性セットAS15は、「ジャンル」、「年代」、「キーワード(“世界”)」及び「ムード(“明るさ”)」の全てを含む。 FIG. 10 is an explanatory diagram for explaining an example of importance levels for various condition attribute sets calculated based on the determination table illustrated in the upper part of FIG. 9. Referring to FIG. 10, 15 condition attributes that can be selected from condition attributes C including four elements of “genre”, “age”, “keyword (“ world ”)”, and “mood (“ brightness ”)”. Sets AS1 to AS15 are shown (some of which are omitted). For example, the condition attribute set AS1 includes only “genre”. The condition attribute set AS2 includes only “age”. The condition attribute set AS5 includes “genre” and “age”. The condition attribute set AS15 includes all of “genre”, “age”, “keyword (“ world ”)”, and “mood (“ brightness ”)”.
重要度算出部150は、例えば、1つの属性(図10の例では「好み」)を決定属性とし、各条件属性セットAS1〜AS15を条件属性の属性部分集合として、各条件属性セットについての重要度を式(2)又は式(3)に従って算出する。その結果、例えば、条件属性セットAS7の重要度が最も高い値を示したものとする。図10の例では、条件属性セットAS7の重要度は0.55である。この場合、条件属性セットAS7に含まれる「ジャンル」及び「ムード(“明るさ”)」の組合せが、決定属性「好み」の属性値を決定し又は予測するために最も有意な属性であるということができる。
The
重要度算出部150は、このような条件属性セットごとの重要度の算出結果を、抽出部160へ出力する。
The
[2−7.抽出部]
抽出部160は、重要度算出部150により算出される上述した重要度に応じて、コンテンツに関するユーザに呈示すべき情報を生成するために使用される1つ以上の重要属性を抽出する。コンテンツに関するユーザに呈示すべき情報とは、例えば、推薦すべきコンテンツに関する情報と共に呈示される推薦理由などであってよい。その代わりに、コンテンツに関するユーザに呈示すべき情報とは、例えば、コンテンツリスト(例えば音楽コンテンツを一覧化したプレイリストなど)のタイトルであってもよい。抽出部160による重要属性の抽出処理には、主に(1)直接抽出と(2)段階的抽出の2通りのパターンが存在する。
[2-7. Extraction unit]
The
(1)直接抽出
直接抽出の場合には、抽出部160は、例えば、コンテンツの推薦の基礎とされる属性を決定属性とし、推薦理由の生成のために用い得る1つ以上の属性を条件属性として重要度算出部150により算出される重要度を、重要属性の抽出のために使用する。
(1) Direct extraction In the case of direct extraction, the
例えば、推薦部140がユーザFBについての属性値を用いて推薦すべきコンテンツを選択する場合に、その推薦理由をコンテンツのメタデータを用いて生成することを想定する。その場合、例えば、図10に例示したように、重要度算出部150は、コンテンツのメタデータ(「ジャンル」、「年代」等)の属性の様々な組合せ(条件属性セット)について、ユーザFB(「好み」)を決定属性とした場合の重要度を算出する。そして、抽出部160は、例えば、算出された重要度が最も高い条件属性セットに含まれる1つ以上の属性を、重要属性として抽出する。即ち、図10の例では、「ジャンル」及び「ムード(“明るさ”)」が重要属性として抽出され得る。
For example, it is assumed that when the
図11は、決定表に基づいて算出される重要度の他の例について説明するための説明図である。図11の例に関連し、例えば、推薦処理を実行している時間帯(例えばT1)においてより多く閲覧等された実績のあるコンテンツが、推薦すべきコンテンツとして選択され得る状況を想定する。その場合、例えば、重要度算出部150は、コンテンツのメタデータ(「ジャンル」、「年代」等)の属性の様々な組合せ(条件属性セット)について、コンテキストデータ(例えば「時間帯:T1」)を決定属性とした場合の重要度を算出する。そして、抽出部160は、例えば、算出された重要度が最も高い条件属性セットに含まれる1つ以上の属性を、重要属性として抽出する。図11の例では、「ジャンル」及び「年代」を含む条件属性セットAS5の重要度が最も高いため(0.65)、「ジャンル」及び「年代」が重要属性として抽出され得る。
FIG. 11 is an explanatory diagram for describing another example of the importance calculated based on the determination table. In relation to the example of FIG. 11, for example, a situation is assumed in which content with a history of browsing or the like in a time zone (for example, T1) in which recommendation processing is executed can be selected as content to be recommended. In this case, for example, the
なお、抽出部160は、算出された重要度が最も高い条件属性セットに含まれる属性を重要属性として抽出する代わりに、予め設定される閾値を超える重要度を示す1つ以上の条件属性セットに含まれる属性を重要属性として抽出してもよい。また、抽出部160は、算出された重要度が高い順にN個(Nは予め設定される)の属性を重要属性として抽出してもよい。
Note that the
(2)段階的抽出
段階的抽出の場合には、抽出部160は、例えば、コンテンツの推薦の基礎とされる属性を決定属性とし、拡張属性に含まれる1つ以上の属性を条件属性として重要度算出部150により算出される第1の重要度と、拡張属性に含まれる属性を決定属性、推薦理由の生成のために用い得る1つ以上の属性を条件属性として重要度算出部150により算出される第2の重要度とを、重要属性の抽出のために使用する。
(2) Stepwise extraction In the case of stepwise extraction, the
図12は、抽出部160による重要属性の段階的抽出について説明するための説明図である。図12の上部では、コンテンツの推薦の基礎とされる推薦アルゴリズムのスコアを決定属性Q1とし、拡張属性のレビュー文層に含まれる潜在トピックX1〜Xnの任意の組合せP1を条件属性として、重要度算出部150により第1の重要度γP1(Q1)(P1⊆C1)が算出されている。ここで、例えば、P1={X1,X2}のとき第1の重要度γP1(Q1)が最大であったものとする。
FIG. 12 is an explanatory diagram for explaining the stepwise extraction of important attributes by the
図12の下部では、P1={X1,X2}を決定属性Q2とし、推薦理由の生成のために用い得るキーワードK1、K2、K3、…の任意の組合せP2を条件属性として、重要度算出部150により第2の重要度γP2(Q2)が算出されている。これら、第1の重要度及び第2の重要度の算出結果から、抽出部160は、例えば、第2の重要度γP2(Q2)が最も高い条件属性セットP2(Q2=P1={X1,X2})に含まれるキーワードを、重要属性として抽出する。
In the lower part of FIG. 12, P1 = {X1, X2} is a decision attribute Q2, and an arbitrary combination P2 of keywords K1, K2, K3,. 150, the second importance γ P2 (Q2) is calculated. From the calculation results of the first importance level and the second importance level, the
なお、段階的抽出の手法は、かかる例に限定されない。図12を用いて説明した手法は、第1の重要度を用いて推薦アルゴリズムのスコアに最も寄与する拡張属性(レビュー文層の潜在トピック)のセットを特定した後、特定した拡張属性のセットに寄与する基本属性(キーワード)のセットを第2の重要度を用いて抽出する手法であった。その代わりに、抽出部160は、例えば、第1の重要度と第2の重要度とを共通する拡張属性のセットについて乗算し、その乗算結果がより大きくなる基本属性のセットに含まれる属性を重要属性として抽出してもよい。
Note that the stepwise extraction method is not limited to such an example. The method described with reference to FIG. 12 uses the first importance to identify a set of extended attributes (latent topics in the review sentence layer) that most contributes to the score of the recommendation algorithm, and then to the specified set of extended attributes. This is a method of extracting a set of contributing basic attributes (keywords) using the second importance. Instead, for example, the
なお、直接抽出か段階的抽出かによらず、条件属性と決定属性との組は、上述した例に限定されない。抽出部160は、このように抽出した重要属性を、推薦部140へ出力する。
Regardless of direct extraction or stepwise extraction, the combination of the condition attribute and the determination attribute is not limited to the above-described example. The
[2−8.画面例]
図13及び図14は、推薦理由が呈示される画面の例をそれぞれ示している。図13を参照すると、推薦部140により生成され、UI制御部130を介して表示装置により表示される一例としての推薦画面132aが示されている。推薦画面132aには、ユーザに推薦される音楽コンテンツのジャケット画像134a、当該コンテンツの説明文136a及び推薦理由138aが含まれる。推薦理由138aには、抽出部160により抽出された重要属性を表す文字列が列挙されている。このような推薦理由138aを表示することにより、推薦されたコンテンツについての推薦の理由をユーザに納得させることができる。また、ユーザは、推薦されたコンテンツについてのアクション(視聴、購買、又は無視等)をより容易に決定することができる。
[2-8. Screen example]
13 and 14 show examples of screens on which the reasons for recommendation are presented. Referring to FIG. 13, an
図14を参照すると、推薦部140により生成され、UI制御部130を介して表示装置により表示される他の例としての推薦画面132bが示されている。推薦画面132bには、ユーザに推薦される音楽コンテンツのジャケット画像134b、当該コンテンツの説明文136b及び推薦理由138bが含まれる。推薦理由138bには、抽出部160により抽出された重要属性を用いて生成された推薦理由の文章が示されている。このような推薦理由138bによっても、推薦されたコンテンツについての推薦の理由をユーザに納得させ、かつ、推薦されたコンテンツについてのユーザのアクションの決定をより容易にすることができる。
Referring to FIG. 14, a
<3.一実施形態に係る処理の流れ>
次に、図15及び図16を用いて、本実施形態に係る情報処理装置100による処理の流れを説明する。
<3. Flow of processing according to one embodiment>
Next, the flow of processing by the
[3−1.事前処理]
図15は、本実施形態に係る情報処理装置100による事前処理の流れの一例を示すフローチャートである。事前処理は、コンテンツの推薦処理よりも以前に行われ得る処理である。事前処理は、例えば、一定の数のコンテンツが蓄積された時、又は所定の期間ごとに定期的に実行され得る。
[3-1. Pre-processing]
FIG. 15 is a flowchart illustrating an example of the flow of pre-processing by the
図15を参照すると、まず、解析部120により、記憶部110の属性テーブルに記憶されているコンテンツの基本属性が取得される(ステップS102)。次に、解析部120は、PLSA又はLDAによる確率的分類法に従って、基本属性の属性値に基づいて、拡張属性の属性値を算出する(ステップS104)。解析部120は、ここで算出した拡張属性の属性値を属性テーブルに格納する。
Referring to FIG. 15, first, the basic attribute of content stored in the attribute table of the
次に、重要度算出部150により、推薦部140による推薦処理の中で重要属性の段階的抽出が行われるか否かが判定される(ステップS106)。ここで、重要属性の段階的抽出が行われない場合には、ステップS108はスキップされる。重要属性の段階的抽出が行われる場合には、重要度算出部150は、解析部120により算出された拡張属性を決定属性とし、基本属性を条件属性とした場合の重要度(段階的抽出における第2の重要度)を算出する(ステップS108)。重要度算出部150は、例えば、ここで算出した重要度を、後の推薦処理のために記憶部110に記憶させる。
Next, the importance
このような事前処理のほかに、例えば、ユーザによるコンテンツの閲覧等のアクションが行われた場合には、UI制御部130によるコンテキストデータの更新、ユーザFBの登録などの処理が行われ得る。また、それに応じて、拡張属性の再計算などが行われてもよい。
In addition to such pre-processing, for example, when an action such as browsing of content is performed by the user, processing such as updating of context data and registration of the user FB by the
[3−2.推薦処理]
図16は、本実施形態に係る情報処理装置100による推薦処理の流れの一例を示すフローチャートである。推薦処理は、例えば、ユーザ又は端末装置からの要求に応じて行われ得る処理である。
[3-2. Recommendation process]
FIG. 16 is a flowchart illustrating an example of a flow of recommendation processing by the
図16を参照すると、まず、推薦部140により、記憶部110が保持している属性テーブルに記憶されている属性値を用いて、ユーザに推薦すべきコンテンツが選択される(ステップS202)。次に、推薦部140は、推薦アルゴリズムにより出力されるスコアを、評価属性の属性値として属性テーブルに格納する(ステップS204)。次に、重要度算出部150により、重要属性の段階的抽出が行われるか否かが判定される(ステップS206)。ここで、重要属性の段階的抽出が行われる場合には、処理はステップS208へ進む。一方、重要属性の段階的抽出が行われない場合には、処理はステップS212へ進む。
Referring to FIG. 16, first, the
ステップS208では、重要度算出部150は、例えば、推薦部140により出力されたスコア(又はユーザFBなどの他の属性)を決定属性、拡張属性を条件属性とした場合の重要度(段階的抽出における第1の重要度)を算出する(ステップS208)。次に、抽出部160は、第1の重要度及び第2の重要度に応じて、重要属性を抽出する(ステップS210)。
In step S208, the
一方、ステップS212では、重要度算出部150は、例えば、推薦部140により出力されたスコア(又はユーザFBなどの他の属性)を決定属性、基本属性を条件属性とした場合の重要度(直接抽出における重要度)を算出する(ステップS212)。次に、抽出部160は、重要度算出部150により算出された重要度に応じて、重要属性を抽出する(ステップS214)。
On the other hand, in step S212, the
次に、推薦部140は、抽出部160により抽出された重要属性に基づいて、ユーザに呈示すべき推薦理由を含む推薦画面を生成する(ステップS216)。次に、UI制御部130は、推薦部140により生成された推薦画面を表示装置に表示させる(ステップS218)。その後、推薦すべきコンテンツを変更する場合には、処理はステップS202へ戻り、上述した処理が繰り返される。一方、推薦すべき新たなコンテンツが存在しない場合には、推薦処理は終了する。
Next, the
なお、図16に示したフローチャートでは、1つのコンテンツについて重要属性の直接抽出と段階的抽出のいずれか一方が行われる例を示したが、1つのコンテンツについて重要属性の直接抽出と段階的抽出の双方が行われてもよい。例えば、情報処理装置100は、属性値集合の元の少ない基本属性(「ジャンル」、「年代」、「ムード」など)については直接抽出を行い、属性値集合の元の多い基本属性(「キーワード」、「アーティスト」など)については拡張属性を利用した段階的抽出を行ってもよい。拡張属性の属性空間の次元は基本属性の属性空間の次元に比べて一般的に低い(典型的には、潜在トピックの数に相当する)ため、拡張属性を条件属性として中間的に利用することで、推薦処理の最中の重要度算出処理の計算コストを抑えることができる。また、確率的分類法の利点として、潜在的なキーワード間又はアーティスト間の関連性(例えば同義関係など)を重要度の算出結果に反映させることができる。
Note that the flowchart shown in FIG. 16 shows an example in which either one of the important attribute direct extraction or stepwise extraction is performed for one content. However, the important attribute direct extraction or stepwise extraction is performed for one content. Both may be performed. For example, the
<4.変形例>
[4−1.プレイリストの提供]
図17は、本実施形態の一変形例に係る情報処理装置200の構成を示すブロック図である。図17を参照すると、情報処理装置200は、記憶部110、解析部120、ユーザインタフェース(UI)制御部130、コンテンツリスト生成部240、重要度算出部250及び抽出部260を備える。情報処理装置200においては、図1に示した推薦部140の代わりに、コンテンツリスト生成部240が設けられている。
<4. Modification>
[4-1. Provision of playlist]
FIG. 17 is a block diagram illustrating a configuration of an
コンテンツリスト生成部240は、ユーザの指定に応じて、又は属性テーブルに記憶されている属性値を用いて、UI制御部130が再生すべきコンテンツのリストを生成する。また、コンテンツリスト生成部240は、抽出部260により抽出される1つ以上の重要属性に基づいて、コンテンツリストのタイトルを生成する。そして、コンテンツリスト生成部240は、タイトルを付したコンテンツリストをUI制御部130を介してユーザに呈示する。コンテンツリスト生成部240により生成されるコンテンツリストは、例えば、再生すべき音楽コンテンツ又は映像コンテンツなどを一覧化したプレイリストであってよい。
The content
コンテンツリスト生成部240により生成されるコンテンツリストには、例えば、ユーザにより指定される一群のコンテンツが含まれる。コンテンツリストに含めるべきコンテンツをユーザが指定した場合には、コンテンツリスト生成部240は、例えば、属性テーブルの評価属性として、ユーザによる指定の有無に応じた属性値(例えば、指定ありなら“1”、指定なしなら“0”)を有するスコアを格納する。一方、コンテンツリスト生成部240は、上述したいずれかの推薦アルゴリズムを用いてコンテンツリストに含めるべきコンテンツを自ら選択した場合には、推薦アルゴリズムが出力するスコアを属性テーブルに格納する。
The content list generated by the content
さらに、例えば、コンテンツリスト生成部240は、属性テーブルに記憶されているユーザFBについての属性値を用いて、コンテンツリストに含めるべきコンテンツを選択してもよい。また、例えば、コンテンツリスト生成部240は、属性テーブルに記憶されているコンテキストデータについての属性値を用いて、コンテンツリストに含めるべきコンテンツを選択してもよい。例えば、特定の時間帯においてより多く再生された実績のあるコンテンツが、コンテンツリストに含めるべきコンテンツとして優先的に選択され得る。
Further, for example, the content
コンテンツリスト生成部240は、コンテンツリストを生成すると、コンテンツリストの生成のために使用した所定の属性に対する重要度を、当該所定の属性以外の1つ以上の属性について、重要度算出部250に算出させる。また、コンテンツリスト生成部240は、コンテンツリストのタイトルを生成するために使用される1つ以上の重要属性を、抽出部260に抽出させる。そして、コンテンツリスト生成部240は、抽出部260により抽出された1つ以上の重要属性を用いてコンテンツリストのタイトルを生成し、当該タイトルを付したコンテンツリストをUI制御部130を介してユーザに呈示する。
When the content list is generated, the content
重要度算出部250は、属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する重要度を、コンテンツの当該所定の属性以外の1つ以上の属性について算出する。例えば、重要度算出部250は、ユーザによる指定の有無に応じて属性値が決定された評価属性を決定属性とする決定表を用いて重要度を算出してもよい。また、例えば、重要度算出部250は、コンテンツリスト生成部240によるコンテンツリストの生成のために使用された属性(例えば、推薦アルゴリズムのスコアなど)を決定属性とする決定表を用いて重要度を算出してもよい。重要度算出部250は、上述した重要度算出部150と同様に複数の条件属性セットごとに算出した重要度を、抽出部260へ出力する。
The importance
抽出部260は、重要度算出部250により算出される上述した重要度に応じて、コンテンツリストのタイトルを生成するために使用される1つ以上の重要属性を抽出する。上述した抽出部160と同様、抽出部260による重要属性の抽出処理もまた、直接抽出と段階的抽出の2通りのパターンによって行われ得る。
The
このような変形例によれば、例えば、ユーザの指定に応じてコンテンツリストが生成される場合にも、直接的にはシステムが知り得ないユーザの意図又は感情などに関連する重要属性の組合せが抽出され、その重要属性を用いてコンテンツリストのタイトルを動的に生成することができる。また、例えば、推薦アルゴリズムを用いてシステムがコンテンツリストを生成する場合にも、その推薦の結果にふさわしいタイトルを動的に生成することができる。なお、コンテンツリストのタイトルは、例えば、「Rock,Scandal」のような属性文字列の単純な結合であってもよく、その代わりに、よりタイトルらしく加工されたものであってもよい。 According to such a modification, for example, even when a content list is generated in accordance with a user's specification, there are combinations of important attributes related to the user's intention or emotion that the system cannot directly know. The title of the content list can be dynamically generated using the extracted important attributes. Further, for example, when the system generates a content list using a recommendation algorithm, a title suitable for the result of the recommendation can be dynamically generated. The title of the content list may be, for example, a simple combination of attribute character strings such as “Rock, Scandal”, or may be processed more like a title instead.
[4−2.個人化]
図18は、本実施形態の他の変形例について説明するための説明図である。図18の上部には、図1に示した記憶部110により保持される属性テーブルが示されている。また、属性テーブルの下に、ユーザU1の各コンテンツに対するユーザアクションの履歴を表す履歴データが示されている。かかる履歴データは、例えば、記憶部110によりユーザごとに(又は装置ごとに)保持される。そして、例えば、重要度算出部150又は250は、履歴データに含まれるコンテンツについての属性テーブルのサブセットを取得し、取得したサブセットに含まれる属性値のみに基づいて、重要度を算出する。図18の例では、ユーザU1の履歴データにはコンテンツC1、C4及びC2に対するユーザアクションが記述されており、コンテンツC1、C2及びC4についての属性テーブルのサブセットが取得されている。このような場合には、抽出部160又は260から出力される重要属性は、全てのユーザではなく、特定のユーザ(図18の例ではユーザU1)にとって重要な属性となる。このような履歴データに基づく属性テーブルのフィルタリングにより、ユーザ個人の特性に応じた重要度を算出することが可能となる。その結果、情報処理装置100又は200により呈示される推薦理由又はプレイリストのタイトル等の個人化(Personalization)を図ることが可能となり、ユーザの満足度を向上させることができる。
[4-2. Personalization]
FIG. 18 is an explanatory diagram for explaining another modified example of the present embodiment. In the upper part of FIG. 18, an attribute table held by the
<5.ハードウェア構成例>
上述した情報処理装置100又は200による一連の処理は、典型的には、ソフトウェアを用いて実現される。ソフトウェアを構成するプログラムは、例えば図19に示した構成を有する汎用コンピュータを用いて実行される。
<5. Hardware configuration example>
A series of processing by the
図19において、CPU(Central Processing Unit)902は、汎用コンピュータの動作全般を制御する。ROM(Read Only Memory)904には、一連の処理の一部又は全部を記述したプログラム又はデータが格納される。RAM(Random Access Memory)906には、処理の実行時にCPU902により用いられるプログラムやデータなどが一時的に記憶される。
In FIG. 19, a CPU (Central Processing Unit) 902 controls the overall operation of the general-purpose computer. A ROM (Read Only Memory) 904 stores a program or data describing a part or all of a series of processes. A RAM (Random Access Memory) 906 temporarily stores programs and data used by the
CPU902、ROM904、及びRAM906は、バス910を介して相互に接続される。バス910にはさらに、入出力インタフェース912が接続される。
The
入出力インタフェース912は、CPU902、ROM904、及びRAM906と、入力装置920、出力装置922、記憶装置924、通信装置926、及びドライブ930とを接続するためのインタフェースである。
The input /
入力装置920は、例えばマウス、キーボード又はタッチパネルなどの入力手段を介して、ユーザからの指示や情報入力を受け付ける。出力装置922は、例えばCRT(Cathode Ray Tube)、液晶ディスプレイ、OLED(Organic Light Emitting Diode)などの表示装置、又はスピーカなどの音声出力装置を介してユーザに情報を出力する。
The
記憶装置924は、例えばハードディスク又はフラッシュメモリなどにより構成され、プログラムやプログラムデータなどを記憶する。通信装置926は、LAN又はインターネットなどのネットワークを介する通信処理を行う。ドライブ930は、必要に応じて汎用コンピュータに設けられ、例えばドライブ930にはリムーバブルメディア932が装着される。
The
<6.まとめ>
ここまで、図1〜図19を用いて、本発明の一実施形態及びその変形例について説明した。本実施形態によれば、複数のコンテンツについて各コンテンツに付与される属性値を用いて、コンテンツの所定の属性への寄与の程度を表す重要度が、コンテンツの上記所定の属性以外の1つ以上の属性について算出される。その際、重要度は、上記所定の属性を決定属性とし、上記1つ以上の属性を条件属性とする決定表を用いて算出される。それにより、条件属性の様々な組合せについて重要度を柔軟に評価することが可能となる。
<6. Summary>
Up to this point, an embodiment of the present invention and its modifications have been described with reference to FIGS. According to the present embodiment, one or more importance levels other than the predetermined attribute of the content are represented by using the attribute value given to each content with respect to a plurality of contents, and representing the degree of contribution to the predetermined attribute of the content. Are calculated for the attributes. At this time, the importance is calculated using a decision table in which the predetermined attribute is a decision attribute and the one or more attributes are condition attributes. As a result, the importance can be flexibly evaluated for various combinations of condition attributes.
また、本実施形態によれば、重要度は、Rough集合理論に従い、上記決定表について決定属性の正領域を形成するコンテンツの数に基づいて算出される。一般的に、決定表の正領域の濃度は、条件属性の組合せの、決定属性の属性値に対する情報伝達性の指標として扱い得る。従って、本実施形態に係る手法により算出される重要度は、条件属性の組合せごとの情報伝達性に応じた有意な指標である。 Further, according to the present embodiment, the importance is calculated based on the number of contents forming the positive region of the decision attribute for the decision table according to the Rough set theory. In general, the density of the positive region of the decision table can be treated as an index of information transferability with respect to the attribute value of the decision attribute of the combination of condition attributes. Therefore, the importance calculated by the method according to the present embodiment is a significant index corresponding to information transmissibility for each combination of condition attributes.
また、本実施形態によれば、算出された重要度に応じて抽出される重要属性を用いて、コンテンツに関するユーザに呈示すべき情報、例えば推薦理由又はコンテンツリストのタイトルなどが生成される。それにより、相互に関連する属性の組合せが意味を持つ場合にも、その属性の組合せを的確に推薦理由又はコンテンツリストのタイトルなどに反映することができる。また、ユーザによるフィードバック又はユーザアクションの際の状況(即ち、コンテキスト)に応じて、適応的に推薦理由又はコンテンツリストのタイトルなどを変化させることができる。 Further, according to the present embodiment, information to be presented to the user regarding the content, for example, the reason for recommendation or the title of the content list, is generated using the important attribute extracted according to the calculated importance. Thereby, even when a combination of mutually related attributes is meaningful, the combination of the attributes can be accurately reflected in a recommendation reason or a title of a content list. In addition, the reason for recommendation or the title of the content list can be adaptively changed in accordance with the situation (that is, context) at the time of user feedback or user action.
また、本実施形態によれば、PLSA又はLDAによる確率的分類法に従って、基本属性の属性値に基づいて拡張属性の属性値が算出される。そして、拡張属性の属性値を中間的に利用することにより、重要属性を段階的に抽出することができる。その結果、重要度の算出結果の精度が基本属性(例えばキーワードや人物名など)の表記揺れを原因として低下するリスクが排除され得る。また、基本属性間の同義語関係などの潜在的な関連性を適切に踏まえた上で、推薦理由等を生成することができる。 Further, according to the present embodiment, the attribute value of the extended attribute is calculated based on the attribute value of the basic attribute according to the probabilistic classification method by PLSA or LDA. And an important attribute can be extracted in steps by using the attribute value of an extended attribute in the middle. As a result, it is possible to eliminate the risk that the accuracy of the calculation result of the degree of importance is reduced due to the shake of the notation of the basic attribute (for example, keyword or person name). In addition, it is possible to generate a recommendation reason or the like after properly considering a potential relationship such as a synonym relationship between basic attributes.
なお、本明細書において説明した決定表を用いた重要度算出方法によれば、条件属性及び決定属性の設定に応じて、様々な種類の重要度を算出することができる。例えば、上述したスマイルセンサ又は生体センサにより取得されるユーザの状態を表すコンテキストデータを決定属性とすることで、ユーザの心理状態又は体調に応じて異なる重要度を算出することも可能である。 Note that according to the importance calculation method using the determination table described in this specification, various types of importance can be calculated according to the setting of the condition attribute and the determination attribute. For example, by using the context data representing the user's state acquired by the above-described smile sensor or biometric sensor as a determination attribute, it is possible to calculate a different degree of importance depending on the user's psychological state or physical condition.
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。 The preferred embodiments of the present invention have been described in detail above with reference to the accompanying drawings, but the present invention is not limited to such examples. It is obvious that a person having ordinary knowledge in the technical field to which the present invention pertains can come up with various changes or modifications within the scope of the technical idea described in the claims. Of course, it is understood that these also belong to the technical scope of the present invention.
100,200 情報処理装置
110 記憶部
120 解析部
130 ユーザインタフェース制御部
140 推薦部
150,250 重要度算出部
160,260 抽出部
240 コンテンツリスト生成部
100, 200
Claims (16)
前記属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する他の1つ以上の属性の重要度を算出する重要度算出部と;
を備え、
前記重要度算出部は、前記重要度を、前記所定の属性を決定属性とし、前記1つ以上の属性を条件属性とする決定表を用いて算出する、
情報処理装置。 A storage unit that holds an attribute table that stores attribute values assigned to each content for a plurality of contents;
An importance calculation unit that calculates the importance of one or more other attributes with respect to a predetermined attribute of the content using the attribute value stored in the attribute table;
With
The importance calculating unit calculates the importance using a determination table in which the predetermined attribute is a determination attribute and the one or more attributes are condition attributes;
Information processing device.
前記重要度算出部により算出される前記重要度に応じて、コンテンツに関するユーザに呈示すべき情報を生成するために使用される1つ以上の重要属性を抽出する抽出部、
をさらに備える、請求項2に記載の情報処理装置。 The information processing apparatus includes:
An extraction unit that extracts one or more important attributes used to generate information about the content to be presented to the user according to the importance calculated by the importance calculation unit;
The information processing apparatus according to claim 2, further comprising:
前記属性テーブルに記憶されている属性値を用いてユーザに推薦すべきコンテンツを選択する推薦部であって、前記抽出部により抽出される前記1つ以上の重要属性に基づいて推薦の理由を生成する推薦部、
をさらに備える、請求項3に記載の情報処理装置。 The information processing apparatus includes:
A recommendation unit that selects content to be recommended to a user using an attribute value stored in the attribute table, and generates a reason for recommendation based on the one or more important attributes extracted by the extraction unit Recommendation section,
The information processing apparatus according to claim 3, further comprising:
前記抽出部は、前記スコアを決定属性として前記重要度算出部により算出される前記重要度に応じて、前記1つ以上の重要属性を抽出する、
請求項4に記載の情報処理装置。 The recommendation unit further stores a score for each content calculated for content selection in the attribute table,
The extraction unit extracts the one or more important attributes according to the importance calculated by the importance calculation unit using the score as a determination attribute.
The information processing apparatus according to claim 4.
前記推薦部は、前記フィードバック属性の属性値を用いて、ユーザに推薦すべきコンテンツを選択し、
前記抽出部は、前記フィードバック属性を決定属性として前記重要度算出部により算出される前記重要度に応じて、前記1つ以上の重要属性を抽出する、
請求項4に記載の情報処理装置。 The attribute table further stores attribute values of feedback attributes given based on user feedback for each content,
The recommendation unit selects content to be recommended to the user using the attribute value of the feedback attribute,
The extraction unit extracts the one or more important attributes according to the importance calculated by the importance calculation unit using the feedback attribute as a determination attribute;
The information processing apparatus according to claim 4.
前記推薦部は、前記コンテキスト属性の属性値を用いて、ユーザに推薦すべきコンテンツを選択し、
前記抽出部は、前記コンテキスト属性を決定属性として前記重要度算出部により算出される前記重要度に応じて、前記1つ以上の重要属性を抽出する、
請求項4に記載の情報処理装置。 The attribute table further stores an attribute value of a context attribute that is given based on a user action status for each content,
The recommendation unit selects content to be recommended to the user using the attribute value of the context attribute,
The extraction unit extracts the one or more important attributes according to the importance calculated by the importance calculation unit using the context attribute as a determination attribute;
The information processing apparatus according to claim 4.
PLSA(Probabilistic Latent Semantic Analysis)又はLDA(Latent Dirichlet Allocation)による確率的分類法に従って、前記基本属性の属性値に基づいて前記拡張属性の属性値を算出する解析部、
をさらに備える、請求項9に記載の情報処理装置。 The information processing apparatus includes:
In accordance with a probabilistic classification method based on PLSA (Probabilistic Latent Semantic Analysis) or LDA (Latent Dirichlet Allocation), an analysis unit that calculates the attribute value of the extended attribute based on the attribute value of the basic attribute;
The information processing apparatus according to claim 9, further comprising:
前記属性テーブルに記憶されている属性値を用いて再生すべきコンテンツのリストを生成するコンテンツリスト生成部であって、前記抽出部により抽出される前記1つ以上の重要属性に基づいてコンテンツリストのタイトルを生成するコンテンツリスト生成部、
をさらに備え、
前記抽出部は、前記コンテンツリスト生成部による前記コンテンツリストの生成のために使用された属性を決定属性として前記重要度算出部により算出される前記重要度に応じて、前記1つ以上の重要属性を抽出する、
請求項3に記載の情報処理装置。 The information processing apparatus includes:
A content list generation unit that generates a list of contents to be played back using attribute values stored in the attribute table, wherein the content list is generated based on the one or more important attributes extracted by the extraction unit. A content list generator for generating titles;
Further comprising
The extraction unit includes the one or more important attributes according to the importance calculated by the importance calculation unit using the attribute used for generating the content list by the content list generation unit as a determination attribute. Extract,
The information processing apparatus according to claim 3.
ユーザの指定に応じて再生すべきコンテンツのリストを生成するコンテンツリスト生成部であって、前記抽出部により抽出される前記1つ以上の重要属性に基づいてコンテンツリストのタイトルを生成するコンテンツリスト生成部、
をさらに備え、
前記抽出部は、ユーザによる指定の有無に応じて属性値が決定される属性を決定属性として前記重要度算出部により算出される前記重要度に応じて、前記1つ以上の重要属性を抽出する、
請求項3に記載の情報処理装置。 The information processing apparatus includes:
A content list generation unit that generates a list of contents to be played according to a user's specification, wherein the content list generation unit generates a title of the content list based on the one or more important attributes extracted by the extraction unit Part,
Further comprising
The extraction unit extracts the one or more important attributes according to the importance calculated by the importance calculation unit using an attribute whose attribute value is determined according to whether or not specified by the user as a determination attribute. ,
The information processing apparatus according to claim 3.
前記重要度算出部は、前記履歴データに含まれるコンテンツについての属性値を用いて、ユーザごとに前記1つ以上の属性についての前記重要度を算出する、
請求項1に記載の情報処理装置。 The storage unit further holds history data representing a history of user actions for each content,
The importance level calculation unit calculates the importance level for the one or more attributes for each user using an attribute value for content included in the history data.
The information processing apparatus according to claim 1.
前記属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する他の1つ以上の属性の重要度を算出するステップ、
を含む重要度算出方法であって、
前記重要度は、前記所定の属性を決定属性とし、前記1つ以上の属性を条件属性とする決定表を用いて算出される、
重要度算出方法。 In an information processing apparatus that uses a storage medium to store an attribute table that stores attribute values assigned to each content for a plurality of contents,
Calculating the importance of one or more other attributes with respect to a predetermined attribute of the content using the attribute values stored in the attribute table;
An importance calculation method including
The importance is calculated using a determination table in which the predetermined attribute is a determination attribute and the one or more attributes are condition attributes.
Importance calculation method.
前記属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する他の1つ以上の属性の重要度を算出する重要度算出部、
として機能させるためのプログラムであって、
前記重要度算出部は、前記重要度を、前記所定の属性を決定属性とし、前記1つ以上の属性を条件属性とする決定表を用いて算出する、
プログラム。
For a plurality of contents, a computer that controls an information processing apparatus that holds an attribute table that stores attribute values assigned to each content using a storage medium,
An importance calculation unit that calculates the importance of one or more other attributes with respect to a predetermined attribute of the content using the attribute value stored in the attribute table;
Is a program for functioning as
The importance calculating unit calculates the importance using a determination table in which the predetermined attribute is a determination attribute and the one or more attributes are condition attributes;
program.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010037469A JP2011175362A (en) | 2010-02-23 | 2010-02-23 | Information processing apparatus, importance level calculation method, and program |
CN2011100403831A CN102163211A (en) | 2010-02-23 | 2011-02-16 | Information processing device, importance calculation method, and program |
US13/029,775 US8234311B2 (en) | 2010-02-23 | 2011-02-17 | Information processing device, importance calculation method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010037469A JP2011175362A (en) | 2010-02-23 | 2010-02-23 | Information processing apparatus, importance level calculation method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011175362A true JP2011175362A (en) | 2011-09-08 |
Family
ID=44464439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010037469A Withdrawn JP2011175362A (en) | 2010-02-23 | 2010-02-23 | Information processing apparatus, importance level calculation method, and program |
Country Status (3)
Country | Link |
---|---|
US (1) | US8234311B2 (en) |
JP (1) | JP2011175362A (en) |
CN (1) | CN102163211A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013080599A1 (en) * | 2011-11-30 | 2013-06-06 | 楽天株式会社 | Information processing device, information processing method, information processing program, and recording medium |
JP2013120473A (en) * | 2011-12-07 | 2013-06-17 | Nikon Corp | Electronic device, information processing method, and program |
JP2013196505A (en) * | 2012-03-21 | 2013-09-30 | Fuji Xerox Co Ltd | Information processing apparatus, information processing system and program |
JP2014510972A (en) * | 2011-03-10 | 2014-05-01 | アリババ・グループ・ホールディング・リミテッド | Determining preference categories based on user access attribute values |
JP2015509626A (en) * | 2012-02-22 | 2015-03-30 | ノキア コーポレイション | Access to predictive services |
JP2015513736A (en) * | 2012-02-21 | 2015-05-14 | ウーヤラ インコーポレイテッド | Automatic content recommendation |
US10552434B2 (en) | 2014-06-30 | 2020-02-04 | Sony Corporation | Information processing device, control method, and program |
WO2020208894A1 (en) * | 2019-04-12 | 2020-10-15 | ソニー株式会社 | Information processing device and information processing method |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9218177B2 (en) * | 2011-03-25 | 2015-12-22 | Microsoft Technology Licensing, Llc | Techniques to optimize upgrade tasks |
KR101851241B1 (en) * | 2011-12-06 | 2018-04-24 | 삼성전자 주식회사 | Method and apparatus for contents management-integrated in portable terminal |
KR20140038577A (en) * | 2012-09-11 | 2014-03-31 | 한국과학기술연구원 | Recommendation for multimedia contents by using metadata |
CN108415984B (en) | 2013-02-25 | 2021-10-29 | P·孙雄 | Link association analysis system and method |
CN104216885B (en) * | 2013-05-29 | 2022-07-26 | 上海连尚网络科技有限公司 | Recommendation system and method for automatically combining static and dynamic recommendation reasons |
CN104252660B (en) * | 2013-12-04 | 2018-03-20 | 深圳市华傲数据技术有限公司 | A kind of property set recommends method and apparatus |
CN105279204B (en) * | 2014-07-25 | 2019-04-09 | 阿里巴巴集团控股有限公司 | Information-pushing method and device |
US20160179803A1 (en) * | 2014-12-22 | 2016-06-23 | Rovi Guides, Inc. | Augmenting metadata using commonly available visual elements associated with media content |
CN105677817B (en) * | 2015-12-31 | 2019-07-19 | 华南师范大学 | Personalized recommendation method and system based on positive and negative attribute knowledge base |
CN107797982B (en) * | 2016-08-31 | 2021-05-07 | 百度在线网络技术(北京)有限公司 | Method, device and equipment for recognizing text type |
US11086936B2 (en) * | 2016-12-30 | 2021-08-10 | Spotify Ab | Media content item recommendation system |
US10789302B2 (en) * | 2017-01-14 | 2020-09-29 | Innoplexus Ag | Method and system for extracting user-specific content |
CN107220865A (en) * | 2017-04-11 | 2017-09-29 | 北京小度信息科技有限公司 | Object recommendation method and device |
US10838950B2 (en) * | 2017-04-29 | 2020-11-17 | Cisco Technology, Inc. | Dynamic review cadence for intellectual capital |
CN107463707A (en) * | 2017-08-18 | 2017-12-12 | 北京语言大学 | A kind of constant local attribute's yojan definition of decision table lower aprons and method |
CN107623863B (en) * | 2017-09-21 | 2020-11-06 | 广州华多网络科技有限公司 | Algorithm testing method and device and server |
CN111937000B (en) * | 2018-07-23 | 2024-07-02 | 谷歌有限责任公司 | Intelligent document notification based on user comments |
WO2022060930A1 (en) * | 2020-09-16 | 2022-03-24 | Google Llc | Digital video analysis |
CN113457152B (en) * | 2021-07-22 | 2023-11-03 | 腾讯科技(深圳)有限公司 | Game array generating method, device, equipment and storage medium |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5734890A (en) * | 1994-09-12 | 1998-03-31 | Gartner Group | System and method for analyzing procurement decisions and customer satisfaction |
JP3884520B2 (en) | 1996-04-01 | 2007-02-21 | 富士通株式会社 | Non-related attribute removing apparatus and storage medium storing program associated with removing unrelated attribute |
US7698161B2 (en) * | 2001-01-04 | 2010-04-13 | True Choice Solutions, Inc. | System to quantify consumer preferences |
US7412202B2 (en) * | 2001-04-03 | 2008-08-12 | Koninklijke Philips Electronics N.V. | Method and apparatus for generating recommendations based on user preferences and environmental characteristics |
US20030106058A1 (en) * | 2001-11-30 | 2003-06-05 | Koninklijke Philips Electronics N.V. | Media recommender which presents the user with rationale for the recommendation |
JP2007323315A (en) | 2006-05-31 | 2007-12-13 | Nippon Telegr & Teleph Corp <Ntt> | Cooperative filtering method, cooperative filtering device, cooperative filtering program and recording medium with the same program recorded thereon |
JP4501948B2 (en) | 2007-03-05 | 2010-07-14 | ソニー株式会社 | Information processing apparatus, information processing method, recording medium, and program |
US20090163183A1 (en) * | 2007-10-04 | 2009-06-25 | O'donoghue Hugh | Recommendation generation systems, apparatus and methods |
CN101551825A (en) * | 2009-05-15 | 2009-10-07 | 中国科学技术大学 | Personalized film recommendation system and method based on attribute description |
US20110252031A1 (en) * | 2009-12-31 | 2011-10-13 | Michael Blumenthal | Method, Device, and System for Analyzing and Ranking Products |
-
2010
- 2010-02-23 JP JP2010037469A patent/JP2011175362A/en not_active Withdrawn
-
2011
- 2011-02-16 CN CN2011100403831A patent/CN102163211A/en active Pending
- 2011-02-17 US US13/029,775 patent/US8234311B2/en not_active Expired - Fee Related
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014510972A (en) * | 2011-03-10 | 2014-05-01 | アリババ・グループ・ホールディング・リミテッド | Determining preference categories based on user access attribute values |
WO2013080599A1 (en) * | 2011-11-30 | 2013-06-06 | 楽天株式会社 | Information processing device, information processing method, information processing program, and recording medium |
JP2013114568A (en) * | 2011-11-30 | 2013-06-10 | Rakuten Inc | Information processing device, information processing method, information processing program, and recording medium |
TWI407379B (en) * | 2011-11-30 | 2013-09-01 | Rakuten Inc | Information processing apparatus, information processing method, information processing program product and recording medium |
JP2013120473A (en) * | 2011-12-07 | 2013-06-17 | Nikon Corp | Electronic device, information processing method, and program |
JP2015513736A (en) * | 2012-02-21 | 2015-05-14 | ウーヤラ インコーポレイテッド | Automatic content recommendation |
JP2015509626A (en) * | 2012-02-22 | 2015-03-30 | ノキア コーポレイション | Access to predictive services |
US10324916B2 (en) | 2012-02-22 | 2019-06-18 | Nokia Technologies Oy | Predictive service access |
JP2013196505A (en) * | 2012-03-21 | 2013-09-30 | Fuji Xerox Co Ltd | Information processing apparatus, information processing system and program |
US8989714B2 (en) | 2012-03-21 | 2015-03-24 | Fuji Xerox Co., Ltd. | Information processing apparatus, information processing system, non-transitory computer readable medium that stores a program, and information processing method |
US10552434B2 (en) | 2014-06-30 | 2020-02-04 | Sony Corporation | Information processing device, control method, and program |
WO2020208894A1 (en) * | 2019-04-12 | 2020-10-15 | ソニー株式会社 | Information processing device and information processing method |
Also Published As
Publication number | Publication date |
---|---|
US8234311B2 (en) | 2012-07-31 |
CN102163211A (en) | 2011-08-24 |
US20110208750A1 (en) | 2011-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011175362A (en) | Information processing apparatus, importance level calculation method, and program | |
US20220035827A1 (en) | Tag selection and recommendation to a user of a content hosting service | |
US8200667B2 (en) | Method and apparatus for constructing user profile using content tag, and method for content recommendation using the constructed user profile | |
US20090006368A1 (en) | Automatic Video Recommendation | |
JP5224868B2 (en) | Information recommendation device and information recommendation method | |
US20090177651A1 (en) | Information processing device and method, program, and recording medium | |
De Pessemier et al. | Context aware recommendations for user-generated content on a social network site | |
Qumsiyeh et al. | Predicting the ratings of multimedia items for making personalized recommendations | |
JP2006251866A (en) | Information processor and information processing method, program, and recording medium | |
JP2007058842A (en) | Information processor, feature extraction method, recording medium, and program | |
JP5318034B2 (en) | Information providing apparatus, information providing method, and information providing program | |
Kang et al. | Learning to rank related entities in web search | |
Hopfgartner et al. | Semantic user profiling techniques for personalised multimedia recommendation | |
JPH11282875A (en) | Information filtering device | |
JP4879775B2 (en) | Dictionary creation method | |
US20160188595A1 (en) | Semantic Network Establishing System and Establishing Method Thereof | |
Xu et al. | Do adjective features from user reviews address sparsity and transparency in recommender systems? | |
Bogers | Recommender systems for social bookmarking | |
Garg et al. | Implementing and Analyzing Behaviour of ML based Tamil Songs Recommendation System | |
US20140095465A1 (en) | Method and apparatus for determining rank of web pages based upon past content portion selections | |
US20140149378A1 (en) | Method and apparatus for determining rank of web pages based upon past content portion selections | |
KR101563625B1 (en) | Ontology based image contents recommendation system using relations of metadata and method for the same | |
Vrochidis et al. | Utilizing implicit user feedback to improve interactive video retrieval | |
Hölbling et al. | Content-based tag generation to enable a tag-based collaborative tv-recommendation system. | |
JP5131565B2 (en) | Information processing apparatus and method, program, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20130507 |