[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2011175362A - Information processing apparatus, importance level calculation method, and program - Google Patents

Information processing apparatus, importance level calculation method, and program Download PDF

Info

Publication number
JP2011175362A
JP2011175362A JP2010037469A JP2010037469A JP2011175362A JP 2011175362 A JP2011175362 A JP 2011175362A JP 2010037469 A JP2010037469 A JP 2010037469A JP 2010037469 A JP2010037469 A JP 2010037469A JP 2011175362 A JP2011175362 A JP 2011175362A
Authority
JP
Japan
Prior art keywords
attribute
content
attributes
importance
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010037469A
Other languages
Japanese (ja)
Inventor
Mitsuhiro Miyazaki
充弘 宮嵜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010037469A priority Critical patent/JP2011175362A/en
Priority to CN2011100403831A priority patent/CN102163211A/en
Priority to US13/029,775 priority patent/US8234311B2/en
Publication of JP2011175362A publication Critical patent/JP2011175362A/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To flexibly evaluate importance levels about various combinations between attributes from attributes of contents. <P>SOLUTION: The information processing apparatus includes: a memory holding an attribute table storing an attribute value imparted to each content about the plurality of contents; and an importance level calculation unit calculating the importance levels of other one or more attributes to a prescribed attribute of the content by use of the attribute values stored in the attribute table. The importance level calculation unit calculates the importance level by use of a determination table wherein the prescribed attribute is set as a determination attribute and wherein the one or more attributes are set as condition attributes. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、情報処理装置、重要度算出方法及びプログラムに関する。   The present invention relates to an information processing apparatus, an importance calculation method, and a program.

近年、情報通信技術の発展に伴い、音楽、映像、電子書籍、ニュース記事、商品情報又はイベント情報などの様々なコンテンツがネットワークを介してユーザに提供されている。このような膨大なコンテンツから個々のユーザが自己に見合った情報を探し出すことは容易でない。そのため、ユーザがコンテンツを探し出すことを支援するキーワード検索又はジャンル検索などの検索サービス、及びシステムがユーザにふさわしいコンテンツを推薦する推薦サービスなどが提供されている。例えば、下記特許文献1は、多くのコンテンツ推薦サービスに取り入れられている協調フィルタリングと呼ばれる手法について記述している。また、下記特許文献2は、ベクトル空間法によるマッチングを利用して推薦すべきTV番組を決定する手法について記述している。   In recent years, with the development of information communication technology, various contents such as music, video, electronic books, news articles, product information or event information are provided to users via a network. It is not easy for individual users to search for information suitable for themselves from such a vast amount of content. Therefore, there are provided search services such as keyword search or genre search that assist the user in finding content, and recommendation services in which the system recommends content suitable for the user. For example, Patent Document 1 below describes a technique called collaborative filtering that is incorporated in many content recommendation services. Patent Document 2 below describes a method for determining a TV program to be recommended using matching based on a vector space method.

上述したようなコンテンツ検索サービス、コンテンツ推薦サービス及びその他のコンテンツ関連サービスにおいてサービスの有効性を左右する鍵となるのが、コンテンツの属性の取り扱いである。一般的に、コンテンツの属性には、コンテンツに人為的に付与される属性、コンテンツデータを解析することにより生成される属性、コンテンツに対するユーザアクションに基づいて算出される属性など、様々な種類のものがある。今日では、ユーザに提供されるコンテンツが増加しただけではなく、サービスが取り扱うべきコンテンツの属性の種類も多くなっている。そこで、コンテンツの属性の中から、コンテンツの分類、検索又は推薦等のために重要な属性を効率的に抽出することのできる技術が注目されている。例えば、下記特許文献3は、カテゴリ分類されるデータについての複数の属性の中から重要な属性を抽出するための技術の一例を記述している。   In the content search service, content recommendation service, and other content-related services as described above, the key to the effectiveness of the service is the handling of content attributes. In general, there are various types of content attributes, such as attributes that are artificially given to content, attributes that are generated by analyzing content data, and attributes that are calculated based on user actions on content. There is. Today, not only the content provided to users has increased, but the types of content attributes that the service should handle are also increasing. Therefore, a technique that can efficiently extract important attributes for content classification, search, recommendation, and the like from content attributes has attracted attention. For example, Patent Document 3 below describes an example of a technique for extracting an important attribute from a plurality of attributes for data classified into categories.

特開2007−323315号公報JP 2007-323315 A 特開2007−200339号公報Japanese Patent Laid-Open No. 2007-200339 特開平9−325969号公報JP 9-325969 A

しかしながら、上記特許文献3に記載された技術では、個々の属性ごとに重要性が判定されるため、相互に関連する属性の組合せについての重要性を認識することができない。例えば、音楽コンテンツの属性の例として「ジャンル」及び「年代」が挙げられる。「ジャンル」についての属性値は、「ロック」、「ポップ」又は「クラシック」などである。また、「年代」についての属性値は、「1970年代」、「1980年代」又は「1990年代」などである。このような場合に、同じ「ジャンル」(=例えば「ロック」)であっても、どの「年代」の「ロック」であるかがユーザにとって異なる意味を持つケースは少なくない。即ち、一般的に、多数のコンテンツの属性の中から属性の様々な組合せについての重要度を柔軟に評価することができれば、コンテンツ推薦の際の推薦理由の呈示、コンテンツ検索のためのジャンルの付与など、その重要度を様々な用途に活用できるものと期待される。   However, in the technique described in Patent Document 3, since importance is determined for each attribute, it is not possible to recognize the importance of a combination of attributes that are related to each other. For example, “genre” and “age” are examples of attributes of music content. The attribute value for “genre” is “rock”, “pop”, “classic”, or the like. The attribute value for “age” is “1970s”, “1980s”, “1990s”, or the like. In such a case, even if the “genre” (= “rock”, for example) is the same, the “rock” of which “age” has a different meaning for the user. That is, in general, if the importance of various combinations of attributes among a large number of content attributes can be flexibly evaluated, the reason for recommendation at the time of content recommendation and the addition of a genre for content search are provided. It is expected that the importance can be used for various purposes.

そこで、本発明は、コンテンツの属性の中から属性の様々な組合せについての重要度を柔軟に評価することのできる、新規かつ改良された情報処理装置、重要度算出方法及びプログラムを提供しようとするものである。   Therefore, the present invention aims to provide a new and improved information processing apparatus, importance calculation method, and program capable of flexibly evaluating the importance of various combinations of attributes among the attributes of content. Is.

本発明のある実施形態によれば、複数のコンテンツについて、各コンテンツに付与される属性値を記憶する属性テーブルを保持する記憶部と、上記属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する他の1つ以上の属性の重要度を算出する重要度算出部と、を備え、上記重要度算出部は、上記重要度を、上記所定の属性を決定属性とし、上記1つ以上の属性を条件属性とする決定表を用いて算出する、情報処理装置が提供される。   According to an embodiment of the present invention, for a plurality of contents, a content is stored using a storage unit that stores an attribute table that stores attribute values assigned to each content, and attribute values stored in the attribute table. An importance calculating unit that calculates the importance of one or more other attributes with respect to the predetermined attribute, wherein the importance calculating unit uses the predetermined attribute as the determination attribute, There is provided an information processing apparatus that calculates using a decision table having two or more attributes as condition attributes.

かかる構成によれば、上記1つ以上の属性を条件属性のセットとして、様々な組合せについて、決定表を用いて上記所定の属性に対する重要度が算出され得る。   According to such a configuration, the importance for the predetermined attribute can be calculated for various combinations using the one or more attributes as a set of condition attributes using the determination table.

また、上記重要度算出部は、上記重要度を、上記決定表について上記決定属性の正領域を形成するコンテンツの数に基づいて算出してもよい。   In addition, the importance calculation unit may calculate the importance based on the number of contents forming a positive region of the determination attribute for the determination table.

また、上記情報処理装置は、上記重要度算出部により算出される上記重要度に応じて、コンテンツに関するユーザに呈示すべき情報を生成するために使用される1つ以上の重要属性を抽出する抽出部、をさらに備えてもよい。   In addition, the information processing apparatus extracts one or more important attributes used to generate information about the content to be presented to the user according to the importance calculated by the importance calculation unit. May be further provided.

また、上記情報処理装置は、上記属性テーブルに記憶されている属性値を用いてユーザに推薦すべきコンテンツを選択する推薦部であって、上記抽出部により抽出される上記1つ以上の重要属性に基づいて推薦の理由を生成する推薦部、をさらに備えてもよい。   The information processing apparatus is a recommendation unit that selects content to be recommended to a user using an attribute value stored in the attribute table, and the one or more important attributes extracted by the extraction unit A recommendation unit that generates a reason for recommendation based on the information may be further provided.

また、上記推薦部は、コンテンツの選択のために算出したコンテンツごとのスコアを上記属性テーブルにさらに記憶させ、上記抽出部は、上記スコアを決定属性として上記重要度算出部により算出される上記重要度に応じて、上記1つ以上の重要属性を抽出してもよい。   Further, the recommendation unit further stores a score for each content calculated for content selection in the attribute table, and the extraction unit calculates the importance calculated by the importance calculation unit using the score as a determination attribute. Depending on the degree, the one or more important attributes may be extracted.

また、上記属性テーブルは、各コンテンツに対するユーザのフィードバックに基づいて付与されるフィードバック属性の属性値をさらに記憶し、上記推薦部は、上記フィードバック属性の属性値を用いて、ユーザに推薦すべきコンテンツを選択し、上記抽出部は、上記フィードバック属性を決定属性として上記重要度算出部により算出される上記重要度に応じて、上記1つ以上の重要属性を抽出してもよい。   Further, the attribute table further stores attribute values of feedback attributes given based on user feedback for each content, and the recommendation unit uses the attribute values of the feedback attributes to recommend content to the user The extraction unit may extract the one or more important attributes according to the importance calculated by the importance calculation unit using the feedback attribute as a determination attribute.

また、上記属性テーブルは、各コンテンツに対するユーザアクションの状況に基づいて付与されるコンテキスト属性の属性値をさらに記憶し、上記推薦部は、上記コンテキスト属性の属性値を用いて、ユーザに推薦すべきコンテンツを選択し、上記抽出部は、上記コンテキスト属性を決定属性として上記重要度算出部により算出される上記重要度に応じて、上記1つ以上の重要属性を抽出してもよい。   The attribute table further stores an attribute value of a context attribute given based on a user action status for each content, and the recommendation unit should recommend to the user using the attribute value of the context attribute The content may be selected, and the extraction unit may extract the one or more important attributes according to the importance calculated by the importance calculation unit using the context attribute as a determination attribute.

また、上記属性テーブルは、各コンテンツに付与される基本属性の属性値に加えて、当該基本属性の属性値を解析することにより得られる拡張属性の属性値を記憶してもよい。   The attribute table may store an attribute value of an extended attribute obtained by analyzing the attribute value of the basic attribute in addition to the attribute value of the basic attribute given to each content.

また、上記抽出部は、上記所定の属性を決定属性とし、上記拡張属性に含まれる1つ以上の属性を条件属性として上記重要度算出部により算出される第1の重要度と、上記拡張属性に含まれる属性を決定属性とし、上記基本属性に含まれる1つ以上の属性を条件属性として上記重要度算出部により算出される第2の重要度とに応じて、上記1つ以上の重要属性を抽出してもよい。   In addition, the extraction unit includes the first importance calculated by the importance calculation unit using the predetermined attribute as a determination attribute and one or more attributes included in the extended attribute as a condition attribute, and the extended attribute. The one or more important attributes according to the second importance calculated by the importance calculating unit using the attribute included in the basic attribute as a decision attribute and one or more attributes included in the basic attribute as a condition attribute May be extracted.

また、上記情報処理装置は、PLSA(Probabilistic Latent Semantic Analysis)又はLDA(Latent Dirichlet Allocation)による確率的分類法に従って、上記基本属性の属性値に基づいて上記拡張属性の属性値を算出する解析部、をさらに備えてもよい。   Further, the information processing apparatus includes an analysis unit that calculates an attribute value of the extended attribute based on an attribute value of the basic attribute according to a probabilistic classification method based on PLSA (Probabilistic Latent Semantic Analysis) or LDA (Latent Dirichlet Allocation), May be further provided.

また、上記情報処理装置は、上記属性テーブルに記憶されている属性値を用いて再生すべきコンテンツのリストを生成するコンテンツリスト生成部であって、上記抽出部により抽出される上記1つ以上の重要属性に基づいてコンテンツリストのタイトルを生成するコンテンツリスト生成部、をさらに備え、上記抽出部は、上記コンテンツリスト生成部による上記コンテンツリストの生成のために使用された属性を決定属性として上記重要度算出部により算出される上記重要度に応じて、上記1つ以上の重要属性を抽出してもよい。   The information processing apparatus may be a content list generation unit that generates a list of contents to be played back using the attribute values stored in the attribute table, and the one or more extracted by the extraction unit A content list generation unit that generates a title of the content list based on the important attribute, and the extraction unit uses the attribute used for generation of the content list by the content list generation unit as the determination attribute. The one or more important attributes may be extracted according to the importance calculated by the degree calculation unit.

また、上記情報処理装置は、ユーザの指定に応じて再生すべきコンテンツのリストを生成するコンテンツリスト生成部であって、上記抽出部により抽出される上記1つ以上の重要属性に基づいてコンテンツリストのタイトルを生成するコンテンツリスト生成部、をさらに備え、上記抽出部は、ユーザによる指定の有無に応じて属性値が決定される属性を決定属性として上記重要度算出部により算出される上記重要度に応じて、上記1つ以上の重要属性を抽出してもよい。   The information processing apparatus may be a content list generation unit that generates a list of contents to be played according to a user's specification, and the content list is based on the one or more important attributes extracted by the extraction unit A content list generation unit that generates a title of the image, and the extraction unit calculates the importance calculated by the importance calculation unit using an attribute whose attribute value is determined according to whether or not specified by the user as a determination attribute Depending on, the one or more important attributes may be extracted.

また、上記記憶部は、各コンテンツに対するユーザアクションの履歴を表す履歴データ、をさらに保持し、上記重要度算出部は、上記履歴データに含まれるコンテンツについての属性値を用いて、ユーザごとに上記1つ以上の属性についての上記重要度を算出してもよい。   Further, the storage unit further holds history data representing a history of user actions for each content, and the importance calculation unit uses the attribute value for the content included in the history data, for each user. The importance degree for one or more attributes may be calculated.

また、上記重要度算出部は、Rough集合理論に従って上記決定表における決定属性の正領域を導出してもよい。   In addition, the importance calculation unit may derive a positive region of the decision attribute in the decision table according to a Rough set theory.

また、本発明の別の実施形態によれば、複数のコンテンツについて、各コンテンツに付与される属性値を記憶する属性テーブルを記憶媒体を用いて保持している情報処理装置において、上記属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する他の1つ以上の属性の重要度を算出するステップ、を含む重要度算出方法であって、上記重要度は、上記所定の属性を決定属性とし、上記1つ以上の属性を条件属性とする決定表を用いて算出される、重要度算出方法が提供される。   According to another embodiment of the present invention, in an information processing apparatus that uses a storage medium to store an attribute table that stores an attribute value assigned to each content for a plurality of contents, Calculating an importance level of one or more other attributes with respect to a predetermined attribute of the content using a stored attribute value, wherein the importance level is calculated based on the predetermined attribute value. Is a decision attribute, and an importance calculation method is provided that is calculated using a decision table having the one or more attributes as condition attributes.

また、本発明の別の実施形態によれば、複数のコンテンツについて、各コンテンツに付与される属性値を記憶する属性テーブルを記憶媒体を用いて保持している情報処理装置を制御するコンピュータを、上記属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する他の1つ以上の属性の重要度を算出する重要度算出部、として機能させるためのプログラムであって、上記重要度算出部は、上記重要度を、上記所定の属性を決定属性とし、上記1つ以上の属性を条件属性とする決定表を用いて算出する、プログラムが提供される。   According to another embodiment of the present invention, for a plurality of contents, a computer that controls an information processing apparatus that holds an attribute table that stores attribute values assigned to each content using a storage medium, A program for functioning as an importance calculation unit that calculates importance of one or more other attributes with respect to a predetermined attribute of content using attribute values stored in the attribute table, The degree calculation unit is provided with a program for calculating the importance using a determination table in which the predetermined attribute is the determination attribute and the one or more attributes are condition attributes.

以上説明したように、本発明に係る情報処理装置、重要度算出方法及びプログラムによれば、コンテンツの属性の中から属性の様々な組合せについての重要度を柔軟に評価することができる。   As described above, according to the information processing apparatus, the importance calculation method, and the program according to the present invention, the importance of various combinations of attributes can be flexibly evaluated from the attributes of the content.

一実施形態に係る情報処理装置の構成を示すブロック図である。It is a block diagram which shows the structure of the information processing apparatus which concerns on one Embodiment. 一実施形態に係る属性テーブルの概要を説明するための説明図である。It is explanatory drawing for demonstrating the outline | summary of the attribute table which concerns on one Embodiment. 属性テーブルにより記憶される基本属性のうちのメタデータの一例を説明するための説明図である。It is explanatory drawing for demonstrating an example of the metadata of the basic attributes memorize | stored by the attribute table. 属性テーブルにより記憶される基本属性のうちのコンテキストデータの一例を説明するための説明図である。It is explanatory drawing for demonstrating an example of the context data among the basic attributes memorize | stored by the attribute table. 属性テーブルにより記憶される拡張属性の概要を説明するための説明図である。It is explanatory drawing for demonstrating the outline | summary of the extended attribute memorize | stored by an attribute table. 図5に示した拡張属性の具体的な一例を説明するための説明図である。It is explanatory drawing for demonstrating a specific example of the extended attribute shown in FIG. 属性テーブルにより記憶される評価属性の一例を説明するための説明図である。It is explanatory drawing for demonstrating an example of the evaluation attribute memorize | stored by the attribute table. 決定表に関連する諸概念について説明するための説明図である。It is explanatory drawing for demonstrating the various concepts relevant to a decision table. 決定表に基づく重要度の算出について説明するための説明図である。It is explanatory drawing for demonstrating calculation of the importance based on a determination table. 決定表に基づいて算出される重要度の一例について説明するための説明図である。It is explanatory drawing for demonstrating an example of the importance calculated based on a determination table. 決定表に基づいて算出される重要度の他の例について説明するための説明図である。It is explanatory drawing for demonstrating the other example of the importance calculated based on a determination table. 重要属性の段階的抽出について説明するための説明図である。It is explanatory drawing for demonstrating the stepwise extraction of an important attribute. 推薦理由が呈示される画面の一例について説明するための説明図である。It is explanatory drawing for demonstrating an example of the screen as which a reason for recommendation is shown. 推薦理由が呈示される画面の他の例について説明するための説明図である。It is explanatory drawing for demonstrating the other example of the screen as which the reason for recommendation is shown. 一実施形態に係る情報処理装置による事前処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of the pre-processing by the information processing apparatus which concerns on one Embodiment. 一実施形態に係る情報処理装置による推薦処理の流れの一例を示すフローチャートである。It is a flowchart which shows an example of the flow of the recommendation process by the information processing apparatus which concerns on one Embodiment. 一変形例に係る情報処理装置の構成を示すブロック図である。It is a block diagram which shows the structure of the information processing apparatus which concerns on one modification. 他の変形例に係る個人化について説明するための説明図である。It is explanatory drawing for demonstrating the personalization which concerns on another modification. ハードウェア構成の一例を示すブロック図である。It is a block diagram which shows an example of a hardware configuration.

以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付すことにより重複説明を省略する。   Exemplary embodiments of the present invention will be described below in detail with reference to the accompanying drawings. In addition, in this specification and drawing, about the component which has the substantially same function structure, duplication description is abbreviate | omitted by attaching | subjecting the same code | symbol.

また、以下の順序にしたがって当該「発明を実施するための形態」を説明する。
1.用語の説明
2.一実施形態に係る情報処理装置の構成例
2−1.属性テーブル
2−2.記憶部
2−3.解析部
2−4.ユーザインタフェース制御部
2−5.推薦部
2−6.重要度算出部
2−7.抽出部
2−8.画面例
3.一実施形態に係る処理の流れ
3−1.事前処理
3−2.推薦処理
4.変形例
4−1.プレイリストの提供
4−2.個人化
5.ハードウェア構成例
6.まとめ
Further, the “DETAILED DESCRIPTION OF THE INVENTION” will be described in the following order.
1. Explanation of terms 2. Configuration example of information processing apparatus according to one embodiment 2-1. Attribute table 2-2. Storage unit 2-3. Analysis unit 2-4. User interface controller 2-5. Recommendation section 2-6. Importance calculation unit 2-7. Extraction unit 2-8. Screen example 3. Flow of processing according to one embodiment 3-1. Pre-processing 3-2. Recommendation process Modified example 4-1. Provision of playlist 4-2. Personalization 5. 5. Hardware configuration example Summary

<1.用語の説明>
まず、本明細書において使用する主な用語の説明を以下に記述する。
・確率的分類法:コンテンツ又はテキスト等の集合の要素を部分集合に分類するための手法の1つ。確率的分類法においては、1つのコンテンツ又はテキスト等が、複数の部分集合に確率を伴って帰属し得る。
・潜在トピック:確率的分類法における個々の部分集合に対応し、各コンテンツ又はテキストの生起に対して潜在的に寄与する概念。個々の部分集合の分野又は話題等を表現するものと考えることができる。
・PLSA(Probabilistic Latent Semantic Analysis):確率的分類法の1つ。潜在トピックによる確率的生成モデルを提供し、テキスト分類の分野において広く使用されている。
・LDA(Latent Dirichlet Allocation):PLSAを発展させた確率的分類法の1つ。潜在トピックによる確率的生成モデルを提供し、テキスト分類の分野において広く使用されている。
・トピック集合:ある潜在トピックに帰属確率を伴って分類されているコンテンツ又はテキスト等の集合
・Rough集合理論:識別不能性(indiscernibility)による不確実性を伴う決定表(decision table)を解析するための基礎となる理論。
・Crisp−Rough集合理論:Rough集合理論の一種。対象の集合をあるレベルで特定できる範囲で、属性を選択することによって対象の程よい近似を求める手法。
・Fuzzy−Rough集合理論:Crisp−Rough集合理論を発展させたRough集合理論の一種。対象属性を名義属性から数値属性に拡張することにより、連続値による属性の取り扱いと対象の記述とを可能とした手法。
・推薦エンジン:ユーザの嗜好(Preference)又はユーザのコンテンツに対するアクション等に基づいてコンテンツを推薦するシステムモジュール。CF又はCBFなどの様々な推薦アルゴリズムに基づく推薦エンジンが既に実用化されている。
・CF(Collaborative Filtering):協調フィルタリング。推薦アルゴリズムの一種。複数のユーザの嗜好データを蓄積しておき、あるユーザと嗜好の類似する他のユーザに関するデータに基づいて推薦等を行う手法。
・CBF(Content Based Filtering):コンテンツベースフィルタリング。推薦アルゴリズムの一種。コンテンツの属性データの類似度に基づいてコンテンツの推薦等を行う手法。
・推薦理由:推薦エンジンがコンテンツを推薦する際にユーザに呈示する推薦の根拠に関する説明。
<1. Explanation of terms>
First, explanations of main terms used in this specification will be described below.
Probabilistic classification: A method for classifying elements of a set such as content or text into subsets. In the probabilistic classification method, one content or text can belong to a plurality of subsets with probability.
Latent topic: a concept that corresponds to an individual subset in a probabilistic taxonomy and potentially contributes to the occurrence of each content or text. It can be thought of as representing the field or topic of an individual subset.
PLSA (Probabilistic Latent Semantic Analysis): A probabilistic classification method. Provides a probabilistic generation model with latent topics and is widely used in the field of text classification.
LDA (Latent Dirichlet Allocation): One of the probabilistic classification methods developed from PLSA. Provides a probabilistic generation model with latent topics and is widely used in the field of text classification.
-Topic set: A set of content or text classified as belonging to a potential topic with attribution probability-Rough set theory: To analyze a decision table with uncertainty due to indiscernibility The theory underlying
Crisp-Rough set theory: A kind of Rough set theory. A technique for finding a reasonable approximation of an object by selecting attributes within a range that can identify the set of objects at a certain level.
Fuzzy-Rough set theory: A type of Rough set theory developed from Crisp-Rough set theory. A technique that enables the handling of attributes by continuous values and the description of the target by extending the target attribute from the nominal attribute to the numeric attribute.
Recommendation engine: A system module that recommends content based on the user's preferences or actions on the user's content. Recommendation engines based on various recommendation algorithms such as CF or CBF have already been put into practical use.
CF (Collaborative Filtering): collaborative filtering. A kind of recommendation algorithm. A method of accumulating preference data of a plurality of users and making recommendations based on data relating to other users who have similar preferences to a certain user.
CBF (Content Based Filtering): Content-based filtering. A kind of recommendation algorithm. A method for recommending content based on the similarity of content attribute data.
・ Reason for recommendation: Explanation regarding the basis of recommendation presented to the user when the recommendation engine recommends content.

<2.一実施形態に係る情報処理装置の構成例>
本発明の一実施形態に係る情報処理装置100は、典型的には、複数のコンテンツについての属性値を記憶する属性テーブルを保持し、コンテンツの所定の属性への寄与の程度を表す重要度を、他の1つ以上の属性について算出する装置である。本実施形態では、情報処理装置100は、さらに推薦機能を有する。そして、情報処理装置100は、ユーザに推薦すべきコンテンツを選択すると共に、算出した上記重要度に応じて推薦理由を生成して、推薦すべきコンテンツに関する情報と推薦理由とをユーザに呈示する。
<2. Configuration Example of Information Processing Device According to One Embodiment>
The information processing apparatus 100 according to an embodiment of the present invention typically holds an attribute table that stores attribute values for a plurality of contents, and has an importance level indicating the degree of contribution of the contents to a predetermined attribute. A device that calculates one or more other attributes. In the present embodiment, the information processing apparatus 100 further has a recommendation function. Then, the information processing apparatus 100 selects content to be recommended to the user, generates a reason for recommendation according to the calculated importance, and presents the information about the content to be recommended and the reason for recommendation to the user.

図1は、本発明の一実施形態に係る情報処理装置100の構成を示すブロック図である。図1を参照すると、情報処理装置100は、記憶部110、解析部120、ユーザインタフェース(UI)制御部130、推薦部140、重要度算出部150及び抽出部160を備える。情報処理装置100は、例えば、記憶部110に記憶されるコンテンツをUI制御部130を介して再生可能なコンテンツプレーヤであってもよい。その代わりに、情報処理装置100は、例えば、UI制御部130を介して端末装置にネットワーク経由でコンテンツデータを提供するコンテンツサーバであってもよい。より一般的には、情報処理装置100は、例えば、高性能コンピュータ、PC(Personal Computer)、デジタル家電機器、ゲーム機器、AVプレーヤ又はスマートフォンなどの任意の種類の装置であってよい。   FIG. 1 is a block diagram showing a configuration of an information processing apparatus 100 according to an embodiment of the present invention. Referring to FIG. 1, the information processing apparatus 100 includes a storage unit 110, an analysis unit 120, a user interface (UI) control unit 130, a recommendation unit 140, an importance calculation unit 150, and an extraction unit 160. The information processing apparatus 100 may be, for example, a content player that can reproduce content stored in the storage unit 110 via the UI control unit 130. Instead, the information processing apparatus 100 may be, for example, a content server that provides content data to the terminal device via the UI control unit 130 via a network. More generally, the information processing apparatus 100 may be any type of apparatus such as a high-performance computer, a PC (Personal Computer), a digital home appliance, a game machine, an AV player, or a smartphone.

[2−1.属性テーブル]
まず、本実施形態に係る情報処理装置100の記憶部110により保持される属性テーブルについて説明する。属性テーブルは、複数のコンテンツについて、各コンテンツに付与される1つ以上の属性値を記憶するテーブルである。
[2-1. Attribute table]
First, an attribute table held by the storage unit 110 of the information processing apparatus 100 according to the present embodiment will be described. The attribute table is a table that stores one or more attribute values assigned to each content for a plurality of contents.

図2は、本実施形態に係る属性テーブルの概要を説明するための説明図である。図2を参照すると、属性テーブルは、大きく分けて基本属性、拡張属性及び評価属性の3種類の属性のカテゴリを有する。基本属性は、さらにメタデータ及びコンテキストデータの2種類のカテゴリに分類される。これら基本属性(メタデータ)、基本属性(コンテキストデータ)、拡張属性及び評価属性は、それぞれ1つ以上の属性項目(個々の属性)を含む。そして、これら属性項目ごとに、各コンテンツについて属性値が付与される。以下、図2に示した属性のカテゴリごとに、より具体的な属性の例を説明する。   FIG. 2 is an explanatory diagram for explaining an overview of the attribute table according to the present embodiment. Referring to FIG. 2, the attribute table is roughly divided into three types of attribute categories: basic attributes, extended attributes, and evaluation attributes. Basic attributes are further classified into two categories, metadata and context data. Each of these basic attributes (metadata), basic attributes (context data), extended attributes, and evaluation attributes includes one or more attribute items (individual attributes). An attribute value is assigned to each content item for each content item. Hereinafter, more specific examples of attributes will be described for each attribute category shown in FIG.

(1)基本属性:メタデータ
図3は、属性テーブルにより記憶される基本属性のうちのメタデータの一例を説明するための説明図である。図3を参照すると、メタデータは、「ジャンル」、「年代」、「ムード」、「キーワード」及び「アーティスト」の5種類の属性を含む。これら属性は、図3の例では、数値属性として表現されている。例えば、「ジャンル」については、「G1:Rock」、「G2:Pop」及びその他のジャンルに各コンテンツが属するか否かを表す数値が属性値として与えられている。例えば、コンテンツC1の「ジャンル」についての属性値は、(G1,G2,…)=(1.0,0.0,…)である。また、コンテンツC2の「ジャンル」についての属性値は、(G1,G2,…)=(0.0,1.0,…)である。同様に、「年代」については、「E1:’70s(1970年代)」、「E2:’80s(1980年代)」及びその他の年代に各コンテンツが属するか否かを表す数値が属性値として与えられている。コンテンツC1の「年代」についての属性値は、(E1,E2,…)=(1.0,0.0,…)である。また、コンテンツC2の「年代」についての属性値は、(E1,E2,…)=(0.0,1.0,…)である。なお、1つのコンテンツが重みを伴って複数の「ジャンル」又は「年代」等に属してもよい。
(1) Basic Attributes: Metadata FIG. 3 is an explanatory diagram for explaining an example of metadata among basic attributes stored by the attribute table. Referring to FIG. 3, the metadata includes five types of attributes of “genre”, “age”, “mood”, “keyword”, and “artist”. These attributes are expressed as numerical attributes in the example of FIG. For example, for “genre”, a numerical value indicating whether each content belongs to “G1: Rock”, “G2: Pop”, and other genres is given as an attribute value. For example, the attribute value for “genre” of the content C1 is (G1, G2,...) = (1.0, 0.0,...). Further, the attribute value for the “genre” of the content C2 is (G1, G2,...) = (0.0, 1.0,...). Similarly, for “age”, “E1: '70s (1970s)”, “E2:' 80s (1980s)”, and other numerical values indicating whether each content belongs to the other age are given as attribute values. It has been. The attribute value for the “age” of the content C1 is (E1, E2,...) = (1.0, 0.0,...). Further, the attribute value for the “age” of the content C2 is (E1, E2,...) = (0.0, 1.0,...). One content may belong to a plurality of “genres” or “age” with weights.

「ムード」は、例えば、特開2007−207218号公報に記載された技術を用いて音楽コンテンツの音声信号の特徴量を解析することにより付与される属性である。例えば、各コンテンツが「M1:明るさ」又は「M2:楽しさ」などの印象を有するか否かを表す数値が、「ムード」についての属性値として各コンテンツに与えられる。「キーワード」は、例えば、各コンテンツと関連付けてサービス提供者又はユーザから供給されるレビュー文をテキスト解析することにより付与される属性である。例えば、レビュー文に含まれる名詞や形容詞などの単語ごとの出現頻度が、「キーワード」についての属性値として各コンテンツに与えられる。「アーティスト」は、例えば、音楽コンテンツと関連する人物名ごとに付与される属性である。例えば、作曲者、作詞者、歌手又は共演者などの人物と関連を有するか否かを表す数値が、「アーティスト」についての属性値として各コンテンツに与えられる。   The “mood” is an attribute given by analyzing the feature amount of the audio signal of the music content using, for example, the technique described in Japanese Patent Application Laid-Open No. 2007-207218. For example, a numerical value indicating whether or not each content has an impression such as “M1: brightness” or “M2: fun” is given to each content as an attribute value for “mood”. The “keyword” is an attribute given by, for example, text analysis of a review sentence supplied from a service provider or a user in association with each content. For example, the appearance frequency for each word such as a noun or adjective included in the review sentence is given to each content as an attribute value for “keyword”. “Artist” is an attribute assigned to each person name associated with the music content, for example. For example, a numerical value indicating whether or not there is a relationship with a person such as a composer, a lyricist, a singer or a co-star is given to each content as an attribute value for “artist”.

なお、図3に示した属性は、数値属性の形式ではなく名義属性の形式によっても表現され得る。例えば、名義属性の形式によれば、コンテンツC1について「ジャンル」=「G1:Rock」、「年代」=「E1:’70s」、コンテンツC2について「ジャンル」=「G2:Pop」、「年代」=「E2:’80s」と表現することもできる(「属性」=「属性値」)。   Note that the attributes shown in FIG. 3 can be expressed not in the form of numerical attributes but also in the form of nominal attributes. For example, according to the format of the nominal attribute, “genre” = “G1: Rock”, “age” = “E1: '70s” for the content C1, and “genre” = “G2: Pop”, “age” for the content C2. = “E2: '80s” (“attribute” = “attribute value”).

これらメタデータは、典型的には、ユーザによる閲覧、視聴若しくは購買等(以下、閲覧等という)のアクション、又は後に説明する推薦処理等とは独立して、各コンテンツに予め付与することのできるデータである。   Typically, these metadata can be given in advance to each content independently of actions such as browsing, viewing, purchasing, etc. (hereinafter referred to as browsing) by the user, or recommendation processing described later. It is data.

(2)基本属性:コンテキスト
図4は、属性テーブルにより記憶される基本属性のうちのコンテキストデータの一例を説明するための説明図である。コンテキストデータは、典型的には、各コンテンツに対するユーザアクションの状況に基づいて付与されるデータである。図4を参照すると、コンテキストデータは、「時間帯」及び「場所」の2種類の属性を含む。例えば、「時間帯」は、「T1:10〜12(時)」、「T2:12〜14(時)」及びその他の時間帯において、各コンテンツが閲覧等された回数を表す。例えば、コンテンツC1の「時間帯」についての属性値は、(T1,T2,…)=(2,10,…)である。また、コンテンツC2の「時間帯」についての属性値は、(T1,T2,…)=(3,1,…)である。同様に、「場所」は、「P1:Tokyo」、「P2:Osaka」及びその他の場所において、各コンテンツが閲覧等された回数を表す。コンテンツC1の「場所」についての属性値は、(P1,P2,…)=(8,4,…)である。また、コンテンツC2の「場所」についての属性値は、(P1,P2,…)=(0,4,…)である。なお、コンテキストデータは、図4に例示した属性以外に、例えば、曜日、日付、国(場所)、ユーザの性別又は年齢層など、ユーザアクションと関連付けて取得可能な任意の属性を含んでもよい。また、図4に例示した「Tokyo」又は「Osaka」などの地理的位置の代わりに、「家庭」、「オフィス」又は「車の中」などの「場所」についての属性値がコンテキストデータに含まれてもよい。
(2) Basic Attributes: Context FIG. 4 is an explanatory diagram for explaining an example of context data among basic attributes stored by the attribute table. The context data is typically data that is given based on the state of user action for each content. Referring to FIG. 4, the context data includes two types of attributes “time zone” and “location”. For example, “time zone” represents the number of times each content is browsed in “T1: 10-12 (hours)”, “T2: 12-14 (hours)”, and other time zones. For example, the attribute value for the “time zone” of the content C1 is (T1, T2,...) = (2, 10,...). Also, the attribute value for the “time zone” of the content C2 is (T1, T2,...) = (3, 1,...). Similarly, “location” represents the number of times each content is browsed in “P1: Tokyo”, “P2: Osaka” and other locations. The attribute value for the “location” of the content C1 is (P1, P2,...) = (8, 4,...). Further, the attribute value for “location” of the content C2 is (P1, P2,...) = (0, 4,...). In addition to the attributes illustrated in FIG. 4, the context data may include any attribute that can be acquired in association with the user action, such as a day of the week, a date, a country (location), a user gender, or an age group. Further, instead of the geographical location such as “Tokyo” or “Osaka” illustrated in FIG. 4, attribute values for “location” such as “home”, “office”, or “in the car” are included in the context data. May be.

(3)拡張属性
図5は、属性テーブルにより記憶される拡張属性の概要を説明するための説明図である。拡張属性は、各コンテンツに付与される基本属性の属性値を解析することにより得られる属性である。本実施形態において、属性テーブルは、レビュー文層及び人物層という2つの層に分けられる拡張属性を有する。このうち、レビュー文層は、基本属性のうち「キーワード」の属性値を確率的分類法に従って解析することにより得られる、潜在トピックX1、…、Xmごとの各コンテンツの帰属確率を表す。一方、人物層は、基本属性のうち「アーティスト」の属性値を確率的分類法に従って解析することにより得られる、潜在トピックY1、…、Ymごとの各コンテンツの帰属確率を表す。
(3) Extended Attributes FIG. 5 is an explanatory diagram for explaining an outline of extended attributes stored by the attribute table. The extended attribute is an attribute obtained by analyzing the attribute value of the basic attribute given to each content. In the present embodiment, the attribute table has extended attributes that are divided into two layers, a review sentence layer and a person layer. Among these, the review sentence layer represents the attribution probability of each content for each of the latent topics X1,..., Xm obtained by analyzing the attribute value of “keyword” among the basic attributes according to the probabilistic classification method. On the other hand, the person layer represents the attribution probability of each content for each of the latent topics Y1,..., Ym, obtained by analyzing the attribute value of “artist” among the basic attributes according to the probabilistic classification method.

図6は、図5に示した拡張属性の具体的な例をさらに説明するための説明図である。図6の上部には、コンテンツC1、C2及びC3のそれぞれについて、キーワード(K1,K2,K3,K4,K5,…)の属性値(各キーワードのレビュー文における頻度)が示されている。キーワードK1、K2、K3、K4、K5は、それぞれ、「scandal」、「album」、「popularity」、「record」、「ability」である。そして、コンテンツC1について、キーワード(K1,K2,K3,K4,K5,…)=(1,0,2,0,1,…)である。また、コンテンツC2について、キーワード(K1,K2,K3,K4,K5,…)=(0,1,0,2,1,…)である。コンテンツC3について、キーワード(K1,K2,K3,K4,K5,…)=(3,0,1,1,0,…)である。PLSA又はLDAによりモデル化される確率的分類法によれば、これらキーワードは、各コンテンツが潜在的に帰属する潜在トピックの寄与によって、各コンテンツのレビュー文に現れる。逆に、キーワード(K1,K2,K3,K4,K5,…)の属性値をPLSA又はLDAによる確率的分類法に従って解析すれば、各コンテンツの潜在トピックごとの帰属確率を算出することができる。   FIG. 6 is an explanatory diagram for further explaining a specific example of the extended attribute shown in FIG. The upper part of FIG. 6 shows the attribute values (frequency of each keyword in the review sentence) of the keywords (K1, K2, K3, K4, K5,...) For each of the contents C1, C2, and C3. The keywords K1, K2, K3, K4, and K5 are “scandal”, “album”, “popularity”, “record”, and “ability”, respectively. For the content C1, the keywords (K1, K2, K3, K4, K5,...) = (1, 0, 2, 0, 1,...). For the content C2, the keywords (K1, K2, K3, K4, K5,...) = (0, 1, 0, 2, 1,...). For the content C3, the keyword (K1, K2, K3, K4, K5,...) = (3, 0, 1, 1, 0,...). According to the probabilistic taxonomy modeled by PLSA or LDA, these keywords appear in the review text of each content due to the contribution of potential topics to which each content potentially belongs. Conversely, if the attribute values of the keywords (K1, K2, K3, K4, K5,...) Are analyzed according to the probabilistic classification method by PLSA or LDA, the attribution probability for each potential topic of each content can be calculated.

より具体的には、各コンテンツのレビュー文dにおけるキーワードwの生起確率をp(w|d)とすると、生起確率p(w|d)は式(1)により表される。   More specifically, when the occurrence probability of the keyword w in the review sentence d of each content is p (w | d), the occurrence probability p (w | d) is expressed by Expression (1).

Figure 2011175362
Figure 2011175362

式(1)において、xは潜在トピック、p(w|x)は潜在トピックxについての単語wの生起確率、p(x|d)は各コンテンツの(レビュー文dの)トピック分布である。なお、潜在トピックxの数は、解析の対象とするデータ空間の次元等に応じて予め適切な値(例えば16など)に設定される。 In Expression (1), x i is a latent topic, p (w | x i ) is the probability of occurrence of the word w for the latent topic x i , and p (x i | d) is the topic (of the review sentence d) of each content Distribution. Note that the number of latent topics x i is set to an appropriate value (for example, 16) in advance according to the dimension of the data space to be analyzed.

図6の下部には、キーワード(K1,K2,K3,K4,K5,…)の属性値をPLSA又はLDAによる確率的分類法に従って解析することにより得られる潜在トピック(X1,X2,…,Xn)ごとの帰属確率の一例が示されている。例えば、コンテンツC1について、帰属確率(X1,X2,…,Xn)=(0.4,0.1,…,0.3)である。コンテンツC2について、帰属確率(X1,X2,…,Xn)=(0.1,0.2,…,0.1)である。コンテンツC3について、帰属確率(X1,X2,…,Xn)=(0.6,0.1,…,0.1)である。本実施形態では、これら各コンテンツの潜在トピックごとの帰属確率が、拡張属性の1つの層の属性値として、属性テーブルにより記憶される。なお、確率的分類法に従って拡張属性を算出する際には、基本属性の属性値を1つの属性項目(例えば個々のキーワード)の範囲内で正規化した上で(最大値を1とした上で)確率的分類法を適用するのが好適である。   In the lower part of FIG. 6, latent topics (X1, X2,..., Xn) obtained by analyzing attribute values of keywords (K1, K2, K3, K4, K5,...) According to a probabilistic classification method by PLSA or LDA. An example of the probability of belonging to each) is shown. For example, for the content C1, the attribution probability (X1, X2,..., Xn) = (0.4, 0.1,..., 0.3). For the content C2, the attribution probability (X1, X2,..., Xn) = (0.1, 0.2,..., 0.1). For the content C3, the attribution probability (X1, X2,..., Xn) = (0.6, 0.1,..., 0.1). In this embodiment, the attribution probability for each potential topic of each content is stored in the attribute table as an attribute value of one layer of extended attributes. When calculating the extended attribute according to the probabilistic classification method, the attribute value of the basic attribute is normalized within the range of one attribute item (for example, an individual keyword) (with the maximum value set to 1). It is preferred to apply a probabilistic classification method.

(4)評価属性
図7は、属性テーブルにより記憶される評価属性の一例を説明するための説明図である。評価属性は、典型的には、各コンテンツについての推薦エンジン又はユーザによる評価を表す属性である。図7を参照すると、評価属性は、アルゴリズムスコア及びユーザフィードバック(FB)の2種類のカテゴリに分類される。
(4) Evaluation Attributes FIG. 7 is an explanatory diagram for explaining an example of evaluation attributes stored by the attribute table. The evaluation attribute is typically an attribute representing evaluation by a recommendation engine or a user for each content. Referring to FIG. 7, evaluation attributes are classified into two categories: algorithm score and user feedback (FB).

このうち、アルゴリズムスコアは、1つ以上の推薦アルゴリズムにより算出されるコンテンツごとのスコアS1、S2、…を含む。例えば、スコアS1はCF(協調フィルタリング)により算出されるスコア、スコアS2はCBF(コンテンツベースフィルタリング)により算出されるスコアであってよい。この場合、例えば、コンテンツC1についてのスコアS1は、推薦の対象とするユーザのユーザ嗜好と、コンテンツC1を閲覧等した他のユーザのユーザ嗜好との間の類似度などに相当する。また、コンテンツC1についてのスコアS2は、推薦の対象とするユーザが閲覧等したコンテンツのメタデータと、コンテンツC1のメタデータとの間の類似度などに相当する。   Among these, the algorithm score includes scores S1, S2,... For each content calculated by one or more recommendation algorithms. For example, the score S1 may be a score calculated by CF (collaborative filtering), and the score S2 may be a score calculated by CBF (content-based filtering). In this case, for example, the score S1 for the content C1 corresponds to the degree of similarity between the user preference of the user to be recommended and the user preference of another user who has browsed the content C1. The score S2 for the content C1 corresponds to the degree of similarity between the metadata of the content browsed by the user to be recommended and the metadata of the content C1.

一方、ユーザFBは、各コンテンツに対するユーザからのフィードバックに基づいて付与される属性値を含む。ユーザFBの属性値は、例えば、「Y:好き」又は「N:嫌い」の二値データ、又は多段階(例えば5段階)評価における点数などを表す。その代わりに、ユーザフィードバックは、例えば、ユーザによる閲覧等のアクションの回数を表してもよい。   On the other hand, the user FB includes attribute values given based on feedback from the user with respect to each content. The attribute value of the user FB represents, for example, binary data of “Y: likes” or “N: dislikes” or a score in multi-level (for example, 5-level) evaluation. Instead, the user feedback may represent the number of actions such as browsing by the user, for example.

次に、図1に示した情報処理装置100の各部の動作について、順に説明する。   Next, the operation of each unit of the information processing apparatus 100 illustrated in FIG. 1 will be described in order.

[2−2.記憶部]
記憶部110は、ハードディスク又は半導体メモリなどの記憶媒体を用いて構成され、図2〜図8を用いて説明した属性テーブルを保持する。属性テーブルには、上述した基本属性、拡張属性及び評価属性の各々の属性項目の属性値が格納される。そして、記憶部110は、情報処理装置100の各部との間で、これら属性値を入出力する。さらに、記憶部110は、コンテンツデータそのものを記憶してもよい。例えば、情報処理装置100が音楽プレーヤである場合には、音楽コンテンツのオーディオデータが記憶部110により記憶されてもよい。
[2-2. Storage unit]
The storage unit 110 is configured using a storage medium such as a hard disk or a semiconductor memory, and holds the attribute table described with reference to FIGS. The attribute table stores attribute values of the attribute items of the basic attribute, the extended attribute, and the evaluation attribute described above. The storage unit 110 inputs and outputs these attribute values with each unit of the information processing apparatus 100. Furthermore, the storage unit 110 may store the content data itself. For example, when the information processing apparatus 100 is a music player, audio data of music content may be stored in the storage unit 110.

[2−3.解析部]
解析部120は、PLSA又はLDAによる確率的分類法に従って、属性テーブルの基本属性の属性値に基づいて、拡張属性の属性値を算出する。例えば、解析部120は、基本属性の属性値のうち、キーワードに関する属性値を確率的分類法に従って解析することにより、拡張属性のレビュー文層の属性値を算出する。より具体的には、拡張属性のレビュー文層の属性値は、例えば、潜在トピックごとのキーワードの生起確率との積和によりキーワードに関する属性値(出現頻度)を導く、各コンテンツのトピック分布であってよい(式(1)参照)。また、例えば、解析部120は、基本属性の属性値のうち、アーティストに関する属性値を確率的分類法に従って解析することにより、拡張属性の人物層の属性値を算出する。そして、解析部120は、算出した拡張属性の属性値を属性テーブルに格納する。解析部120による確率的分類法に従った解析は、例えば、コンテンツのデータベース(例えば記憶部110)に一定の数のコンテンツが蓄積された時、又は1ヶ月ごと若しくは1年ごとなどのように定期的に実行され得る。
[2-3. Analysis Department]
The analysis unit 120 calculates the attribute value of the extended attribute based on the attribute value of the basic attribute of the attribute table according to the probabilistic classification method by PLSA or LDA. For example, the analysis unit 120 calculates the attribute value of the review sentence layer of the extended attribute by analyzing the attribute value related to the keyword among the attribute values of the basic attribute according to the probabilistic classification method. More specifically, the attribute value of the review sentence layer of the extended attribute is, for example, the topic distribution of each content that derives the attribute value (appearance frequency) related to the keyword by the product sum with the occurrence probability of the keyword for each latent topic. (See equation (1)). For example, the analysis unit 120 calculates the attribute value of the extended attribute person layer by analyzing the attribute value related to the artist among the attribute values of the basic attribute according to the probabilistic classification method. Then, the analysis unit 120 stores the calculated attribute value of the extended attribute in the attribute table. The analysis according to the probabilistic classification method by the analysis unit 120 is performed periodically, for example, when a certain number of contents are accumulated in the content database (for example, the storage unit 110), or every month or every year. Can be implemented automatically.

なお、PLSAについては、Thomas Hofmannによる“Probabilistic latent semantic indexing”(1999, Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval)において詳しく説明されている。また、LDAについては、David M. Blei, Andrew Y. Ng, Michael I. Jordanによる“Latent Dirichlet Allocation”(2003, Journal of Machine Learning Research, Volume 3)において詳しく説明されている。   The PLSA is described in detail in “Probabilistic latent semantic indexing” by Thomas Hofmann (1999, Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval). LDA is described in detail in “Latent Dirichlet Allocation” (2003, Journal of Machine Learning Research, Volume 3) by David M. Blei, Andrew Y. Ng, Michael I. Jordan.

[2−4.ユーザインタフェース制御部]
UI制御部130は、情報処理装置100とユーザとの間のユーザインタフェースを制御する。かかるユーザインタフェースは、典型的には、表示装置により表示される画面インタフェースと、マウス、キーボード、タッチパネル又はキーパッドなどの入力インタフェースとを含む。さらに、音声出力回路又は映像出力回路などのコンテンツ再生用のインタフェースが、ユーザインタフェースに含まれてもよい。これらユーザインタフェースは、例えば、情報処理装置100上に実装されてもよく、その代わりに情報処理装置100とネットワークを介して接続される端末装置上に実装されてもよい。
[2-4. User interface control unit]
The UI control unit 130 controls a user interface between the information processing apparatus 100 and the user. Such a user interface typically includes a screen interface displayed by a display device and an input interface such as a mouse, a keyboard, a touch panel, or a keypad. Further, an interface for content reproduction such as an audio output circuit or a video output circuit may be included in the user interface. For example, these user interfaces may be mounted on the information processing apparatus 100, or instead, may be mounted on a terminal device connected to the information processing apparatus 100 via a network.

より具体的には、UI制御部130は、例えば、あるコンテンツについてのユーザによるアクションに応じて、当該コンテンツについてのコンテキストデータを更新する。即ち、例えば、ユーザが午前11時に東京においてコンテンツC1を閲覧したとする。その場合、UI制御部130は、コンテンツC1についての時間帯「T1:10〜12(時)」及び場所「P1:Tokyo」の属性値を更新する。UI制御部130は、例えば、端末装置のIPアドレスに基づいて、又はGPS(Global Positioning System)を用いて、ユーザによるコンテンツの閲覧場所を認識することができる。   More specifically, the UI control unit 130 updates the context data for the content according to, for example, an action by the user for the certain content. That is, for example, assume that the user browses the content C1 in Tokyo at 11:00 am. In that case, the UI control unit 130 updates the attribute values of the time zone “T1: 10 to 12 (hours)” and the location “P1: Tokyo” for the content C1. For example, the UI control unit 130 can recognize the viewing location of the content by the user based on the IP address of the terminal device or using the GPS (Global Positioning System).

また、UI制御部130は、例えば、あるコンテンツについての図7に例示したユーザフィードバックの値を入力インタフェースを介して取得し、取得した値を属性テーブルに格納する。また、UI制御部130は、例えば、後に説明する推薦部140により生成される推薦画面を表示装置に表示させる。   For example, the UI control unit 130 acquires the user feedback value illustrated in FIG. 7 for a certain content via the input interface, and stores the acquired value in the attribute table. In addition, the UI control unit 130 causes the display device to display a recommendation screen generated by the recommendation unit 140 described later, for example.

さらに、UI制御部130は、例えば、情報処理装置100又は端末装置がユーザの状態を検知することのできるセンサを備える場合には、当該センサにより取得されるユーザの状態をコンテキストデータの属性値として属性テーブルに格納してもよい。例えば、スマイルセンサ機能を有する撮像モジュールによりユーザの笑顔の状態を取得すること、又は生体センサによりユーザの脈拍又は呼吸数等の状態を取得することなどが考えられる。   Furthermore, for example, when the information processing apparatus 100 or the terminal device includes a sensor that can detect the user state, the UI control unit 130 uses the user state acquired by the sensor as an attribute value of the context data. It may be stored in the attribute table. For example, it is conceivable to acquire the state of the user's smile using an imaging module having a smile sensor function, or to acquire the state of the user's pulse or respiration rate using a biological sensor.

[2−5.推薦部]
推薦部140は、記憶部110が保持している属性テーブルに記憶されている属性値を用いて、ユーザに推薦すべきコンテンツを選択する推薦エンジンとして動作する。また、推薦部140は、後に説明する抽出部160により抽出される1つ以上の重要属性に基づいて、推薦の理由を生成する。そして、推薦部140は、推薦すべきコンテンツに関する情報と推薦理由とをユーザに呈示する推薦画面を生成し、生成した推薦画面をUI制御部130を介して表示装置に表示させる。
[2-5. Recommendation section]
The recommendation unit 140 operates as a recommendation engine that selects content to be recommended to the user using the attribute values stored in the attribute table held by the storage unit 110. The recommendation unit 140 generates a reason for recommendation based on one or more important attributes extracted by the extraction unit 160 described later. And the recommendation part 140 produces | generates the recommendation screen which shows the information regarding the content which should be recommended, and a recommendation reason to a user, and displays the produced | generated recommendation screen on a display apparatus via UI control part 130. FIG.

推薦部140によるコンテンツの選択は、例えば、上述したCF又はCBFなど、任意の公知の推薦アルゴリズムに従って行われてよい。例えば、推薦部140が推薦アルゴリズムとしてCFを用いる場合には、推薦部140は、ユーザの嗜好と類似する嗜好を有する他のユーザを特定する。次に、推薦部140は、当該他のユーザにより閲覧等された一群のコンテンツを抽出する。このとき、推薦部140は、例えば、嗜好の類似度又は当該他のユーザによる各コンテンツの評価などに応じて、抽出した一群のコンテンツの各々についてのスコア(各コンテンツのユーザへの適合度、又は推薦についての確信度など)を算出する。ここで算出されるコンテンツごとのスコアは、属性テーブルに格納される。そして、推薦部140は、例えば、スコアの相対的に高いコンテンツを、ユーザに推薦すべきコンテンツとして選択する。   The selection of content by the recommendation unit 140 may be performed according to any known recommendation algorithm such as the above-described CF or CBF. For example, when the recommendation unit 140 uses CF as a recommendation algorithm, the recommendation unit 140 specifies another user having a preference similar to the user's preference. Next, the recommendation unit 140 extracts a group of contents browsed by the other user. At this time, the recommendation unit 140, for example, according to the similarity of the preference or the evaluation of each content by the other user, the score for each of the extracted group of content (the degree of suitability of each content to the user, or Calculate certainty about recommendation). The score for each content calculated here is stored in the attribute table. And the recommendation part 140 selects the content with a relatively high score as content which should be recommended to a user, for example.

また、例えば、推薦部140が推薦アルゴリズムとしてCBFを用いる場合には、推薦部140は、ユーザが閲覧等したコンテンツとの間でメタデータが類似する一群のコンテンツを抽出する。このとき、推薦部140は、例えば、メタデータの類似度に応じて、抽出した一群のコンテンツの各々についてのスコアを算出する。ここで算出されるコンテンツごとのスコアは、属性テーブルに格納される。そして、推薦部140は、例えば、スコアの相対的に高いコンテンツを、ユーザに推薦すべきコンテンツとして選択する。   Further, for example, when the recommendation unit 140 uses CBF as a recommendation algorithm, the recommendation unit 140 extracts a group of contents whose metadata is similar to content viewed by the user. At this time, the recommendation unit 140 calculates a score for each of the extracted group of contents, for example, according to the similarity of the metadata. The score for each content calculated here is stored in the attribute table. And the recommendation part 140 selects the content with a relatively high score as content which should be recommended to a user, for example.

また、例えば、推薦部140は、属性テーブルに記憶されているユーザFBについての属性値を用いて、ユーザに推薦すべきコンテンツを選択してもよい。例えば、複数のコンテンツのうち、ユーザFBについての属性値が良好な値を示すコンテンツが、推薦すべきコンテンツとして優先的に選択され得る。また、例えば、推薦部140は、属性テーブルに記憶されているコンテキストデータについての属性値を用いて、ユーザに推薦すべきコンテンツを選択してもよい。例えば、複数のコンテンツのうち、推薦処理を実行している時間帯及び推薦の対象とするユーザが位置する場所においてより多く閲覧等された実績のあるコンテンツが、推薦すべきコンテンツとして優先的に選択され得る。   For example, the recommendation unit 140 may select content to be recommended to the user using the attribute value for the user FB stored in the attribute table. For example, among the plurality of contents, a content having a good attribute value for the user FB can be preferentially selected as the content to be recommended. Further, for example, the recommendation unit 140 may select content to be recommended to the user by using the attribute value for the context data stored in the attribute table. For example, among a plurality of contents, content that has been browsed more frequently in the time zone where the recommendation process is being executed and the location of the user to be recommended is preferentially selected as the content to be recommended Can be done.

推薦部140は、推薦すべきコンテンツを選択すると、コンテンツの選択に使用した所定の属性に対する重要度を、当該所定の属性以外の1つ以上の属性について、重要度算出部150に算出させる。また、推薦部140は、ユーザに呈示すべき推薦理由を生成するために使用される1つ以上の重要属性を、抽出部160に抽出させる。そして、推薦部140は、抽出部160により抽出された1つ以上の重要属性を用いて推薦理由を生成し、推薦すべきコンテンツに関する情報と推薦理由とを表示する推薦画面を、UI制御部130へ出力する。   When selecting the content to be recommended, the recommendation unit 140 causes the importance level calculation unit 150 to calculate the importance level for the predetermined attribute used for selecting the content for one or more attributes other than the predetermined attribute. In addition, the recommendation unit 140 causes the extraction unit 160 to extract one or more important attributes used to generate a recommendation reason to be presented to the user. Then, the recommendation unit 140 generates a recommendation reason using one or more important attributes extracted by the extraction unit 160, and displays a recommendation screen that displays information about the content to be recommended and the recommendation reason, and the UI control unit 130. Output to.

[2−6.重要度算出部]
重要度算出部150は、属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する重要度を、コンテンツの当該所定の属性以外の1つ以上の属性について算出する。特に、本実施形態において、重要度算出部150は、上記1つ以上の属性についての重要度を、上記所定の属性を決定属性とし、上記1つ以上の属性を条件属性とする決定表を用いて算出する。例えば、以下に説明するように、重要度算出部150は、上述した決定表について決定属性の正領域を形成するコンテンツの数に基づいて、重要度を算出することができる。決定表における決定属性の正領域は、Rough集合理論に従って導出され得る。
[2-6. Importance calculator]
The importance level calculation unit 150 uses the attribute values stored in the attribute table to calculate the importance level for the predetermined attribute of the content for one or more attributes other than the predetermined attribute of the content. In particular, in the present embodiment, the importance level calculation unit 150 uses a determination table in which the importance level for the one or more attributes is set as the determination attribute and the one or more attributes are condition attributes. To calculate. For example, as will be described below, the importance level calculation unit 150 can calculate the importance level based on the number of contents forming the positive region of the determination attribute for the determination table described above. The positive region of the decision attribute in the decision table can be derived according to Rough set theory.

(1)決定表に関連する諸概念
図8は、Rough集合理論が適用される決定表に関連する諸概念について説明するための説明図である。図8の上部には、決定表の基本的な構成が示されている。図8に例示される決定表は、二次元の表であって、縦軸に対象全体集合U、横軸に属性全体集合Aをとる。対象全体集合Uは、コンテンツの集合である。一方、属性全体集合Aは、属性項目の集合である。属性全体集合Aは、条件属性C及び決定属性Dの和集合である。条件属性C及び決定属性Dは、共に、1つ以上の属性を含む。属性値集合Vは、属性全体集合Aに含まれる各属性が取り得る名義属性の属性値の集合である。例えば、図3に例示した属性「ジャンル」及び「年代」が属性全体集合Aの元(member)である場合には、V={{Rock,Jazz,…},{‘70s,’80s,…}}などとなる。属性値関数ρは、対象全体集合Uの1つの元(コンテンツ)と属性全体集合Aの1つ元(属性)とが与えられた場合に、それに応じて属性値を特定する関数である(ρ:U×A→V)。
(1) Various Concepts Related to Decision Table FIG. 8 is an explanatory diagram for explaining various concepts related to the decision table to which the Rough set theory is applied. The basic configuration of the decision table is shown in the upper part of FIG. The decision table illustrated in FIG. 8 is a two-dimensional table, in which the vertical axis represents the target total set U and the horizontal axis represents the attribute total set A. The entire target set U is a set of contents. On the other hand, the entire attribute set A is a set of attribute items. The entire attribute set A is a union of the condition attribute C and the decision attribute D. Both the condition attribute C and the decision attribute D include one or more attributes. The attribute value set V is a set of attribute values of nominal attributes that each attribute included in the attribute total set A can take. For example, when the attributes “genre” and “age” illustrated in FIG. 3 are members of the entire attribute set A, V = {{Rock, Jazz,...}, {'70s,' 80s,. }} Etc. The attribute value function ρ is a function that specifies an attribute value in response to one element (content) of the entire object set U and one element (attribute) of the entire attribute set A (ρ). : U × A → V).

図8の左下には、概念集合Xが示されている。概念集合Xは、特定の属性の属性値を1つの概念とみなした場合の、当該概念に属するコンテンツの集合である。例えば、属性Aが“Y”又は“N”の二値の属性値をとり得る場合に、属性A=“Y”という概念についての概念集合Xは、属性A=“Y”であるコンテンツを要素として含む。   A concept set X is shown in the lower left of FIG. The concept set X is a set of contents belonging to the concept when the attribute value of a specific attribute is regarded as one concept. For example, when the attribute A can take a binary attribute value “Y” or “N”, the concept set X for the concept of the attribute A = “Y” Include as.

図8の右下には、属性部分集合P(P⊆C)及びQ(Q⊆D)が示されている。属性部分集合Pは、条件属性Cのうち、重要度の算出に用いる条件属性の集合である。一方、属性部分集合Qは、決定属性Cのうち、重要度の算出に用いる決定属性の集合である。   In the lower right of FIG. 8, attribute subsets P (P⊆C) and Q (Q⊆D) are shown. The attribute subset P is a set of condition attributes used for calculating the importance of the condition attributes C. On the other hand, the attribute subset Q is a set of decision attributes used for calculation of importance among the decision attributes C.

(2)Crisp Rough集合に関する定義式
表1は、上述した決定表に関連する諸概念を用いて記述される、Crisp Rough集合に関する定義式を表す。
(2) Definition Formula for Crisp Rough Set Table 1 shows a definition formula for the Crisp Rough set described using various concepts related to the decision table described above.

Figure 2011175362
Figure 2011175362

図9を参照しながら、表1の各項目について説明する。図9の上部には、コンテンツC1〜C6を対象全体集合Uに含む決定表の一例が示されている。図9の決定表の条件属性の属性部分集合Pは、基本属性のうちのメタデータ「ジャンル」、「年代」、「キーワード(“世界”)」及び「ムード(“明るさ”)」を含む。ここでは、説明の簡明さの観点から、「ジャンル」、「年代」及び「ムード(“明るさ”)」は名義属性の形式で表現されるものとする。「決定属性の属性部分集合Qは、評価属性のうちのユーザFB「好み」を含む。   Each item in Table 1 will be described with reference to FIG. In the upper part of FIG. 9, an example of a decision table including the contents C1 to C6 in the target entire set U is shown. The attribute subset P of the condition attributes in the decision table of FIG. 9 includes metadata “genre”, “age”, “keyword (“ world ”)”, and “mood (“ brightness ”)” among the basic attributes. . Here, from the viewpoint of simplicity of explanation, it is assumed that “genre”, “age”, and “mood (“ brightness ”)” are expressed in the form of nominal attributes. “The attribute subset Q of the decision attributes includes the user FB“ preference ”among the evaluation attributes.

表1において、P−同値関係の式は、条件属性の属性部分集合Pにおいて、対象全体集合Uに属するコンテンツxとコンテンツyとが同値関係であるための条件を表す。例えば、図9の決定表において、コンテンツC2の条件属性の属性値とコンテンツC6の条件属性の属性値とは等しく、コンテンツC2とコンテンツC6とは同値関係にある。   In Table 1, the expression of P-equivalence relationship represents a condition for content x and content y belonging to the target entire set U to have an equivalence relationship in the attribute subset P of the condition attributes. For example, in the determination table of FIG. 9, the attribute value of the condition attribute of the content C2 is equal to the attribute value of the condition attribute of the content C6, and the content C2 and the content C6 are in the same value relationship.

P−同値類は、条件属性の属性部分集合Pにおいて、あるコンテンツxと同値関係にあるコンテンツの集合を表す。図9の決定表において、コンテンツC2及びコンテンツC6は、1つのP−同値類を形成する。   The P-equivalence class represents a set of contents having an equivalence relation with a certain content x in the attribute subset P of the condition attributes. In the decision table of FIG. 9, the content C2 and the content C6 form one P-equivalence class.

P−同値類によるU分割は、各々のP−同値類を部分集合として対象全体集合Uが分割され得ることを表す。図9の決定表において、5つの部分集合{C1}、{C2,C6}、{C3}、{C4}及び{C5}により、対象全体集合Uが分割され得る。   The U division by P-equivalence classes indicates that the target entire set U can be divided with each P-equivalence class as a subset. In the decision table of FIG. 9, the target entire set U can be divided by five subsets {C1}, {C2, C6}, {C3}, {C4}, and {C5}.

概念XのP−上近似は、条件属性の属性部分集合Pについての属性値に基づいて、概念集合Xに含まれる可能性があると判断されるコンテンツの集合を表す。図9の決定表において、決定属性Qの「好み」=“Y”の概念集合Xに含まれる可能性があるコンテンツは、コンテンツC1、C2,C4及びC6である。よって、「好み」=“Y”という概念の上近似は、集合{C1,C2,C4,C6}である。なお、コンテンツC2が当該上近似に含まれるのは、コンテンツC2と同値関係にあるコンテンツC6の「好み」が“Y”であるためである。   The P-top approximation of the concept X represents a set of contents that are determined to be included in the concept set X based on the attribute values for the attribute subset P of the condition attribute. In the decision table of FIG. 9, contents C1, C2, C4, and C6 are contents that may be included in the concept set X of “preference” = “Y” of the decision attribute Q. Therefore, the upper approximation of the concept of “preference” = “Y” is the set {C1, C2, C4, C6}. The reason why the content C2 is included in the upper approximation is that the “favorite” of the content C6 that is equivalent to the content C2 is “Y”.

概念XのP−下近似は、条件属性の属性部分集合Pについての属性値に基づいて、概念集合Xに必然的に含まれると判断されるコンテンツの集合を表す。図9の決定表において、決定属性Qの「好み」=“Y”の概念集合Xに必然的に含まれると判断されるコンテンツは、コンテンツC1及びC4である。よって、「好み」=“Y”という概念の下近似は、集合{C1,C4}である。なお、コンテンツC6が当該下近似に含まれないのは、コンテンツC6と同値関係にあるコンテンツC2の「好み」が“N”であるためである。   The P-lower approximation of the concept X represents a set of contents that are determined to be necessarily included in the concept set X based on the attribute values for the attribute subset P of the condition attribute. In the decision table of FIG. 9, the contents that are inevitably determined to be included in the concept set X of “preference” = “Y” of the decision attribute Q are the contents C1 and C4. Therefore, the lower approximation of the concept of “preference” = “Y” is the set {C1, C4}. The reason why the content C6 is not included in the lower approximation is that the “favorite” of the content C2 having the same relationship with the content C6 is “N”.

Q−同値類によるU分割は、各々のQ−同値類を部分集合として対象全体集合Uが分割され得ることを表す。図9の決定表において、それぞれ決定属性Qの同値類である2つの部分集合{C1,C4,C6}及び{C2,C3,C5}により、対象全体集合Uが分割され得る。   The U division by the Q-equivalence class indicates that the target entire set U can be divided by using each Q-equivalence class as a subset. In the decision table of FIG. 9, the target entire set U can be divided by two subsets {C1, C4, C6} and {C2, C3, C5} that are equivalence classes of the decision attribute Q.

P,Qにおける正領域は、決定属性Qの同値類についてのP−下近似の、全ての同値類にわたっての和集合を表す。図9の決定表において、「好み」=“Y”という概念の下近似は、集合{C1,C4}である。「好み」=“N”という概念の下近似は、集合{C3,C5}である。従って、図9の決定表における条件属性P,決定属性Qにおける正領域は、集合{C1,C4},{C3,C5}}である。   The positive region in P and Q represents the union over all equivalence classes of the P-lower approximation for the equivalence class of the decision attribute Q. In the decision table of FIG. 9, the lower approximation of the concept of “preference” = “Y” is the set {C1, C4}. The lower approximation of the concept of “preference” = “N” is the set {C3, C5}. Accordingly, the primary regions in the condition attribute P and the decision attribute Q in the decision table of FIG. 9 are the set {C1, C4}, {C3, C5}}.

(3)Fuzzy Rough集合に関する定義式
表2は、上述した決定表に関連する諸概念についての、Fuzzy Rough集合に関する定義式を表す。Crisp Rough集合の代わりにFuzzy Rough集合を用いることにより、名義属性に関する近似集合だけでなく、数値属性に関する近似集合をも扱うことが可能となる。例えば、表2において、ファジィ同値類μFi(x)(対象xにおける属性Fのメンバシップ値)は、0.0〜1.0の連続値で表現される。
(3) Definition Formula for Fuzzy Rough Set Table 2 shows a definition formula for the Fuzzy Rough set for the concepts related to the decision table described above. By using the Fuzzy Rough set instead of the Crisp Rough set, it is possible to handle not only the approximate set related to the nominal attribute but also the approximate set related to the numerical attribute. For example, in Table 2, (membership value of the attribute F i in the subject x) fuzzy equivalence classes mu Fi (x) is represented by consecutive values of 0.0 to 1.0.

Figure 2011175362
Figure 2011175362

なお、Fuzzy Rough集合理論については、Richard Jensen and Qiang Shenによる“Fuzzy-Rough Data Reduction with Ant Colony Optimization”(Fuzzy Sets and Systems, vol. 149, no. 1, pp. 5-20, 2005)において詳しく説明されているため、ここではその説明を省略する。   The Fuzzy Rough set theory is detailed in “Fuzzy-Rough Data Reduction with Ant Colony Optimization” by Richard Jensen and Qiang Shen (Fuzzy Sets and Systems, vol. 149, no. 1, pp. 5-20, 2005). Since it is described, its description is omitted here.

(4)重要度算出式
重要度算出部150による、Crisp Rough集合についての重要度算出式を式(2)に示す。γ(Q)は、決定属性(集合)Qに対する条件属性(集合)Pの重要度である。
(4) Importance Calculation Formula The importance calculation formula for the Crisp Rough set by the importance calculation unit 150 is shown in Formula (2). γ P (Q) is the importance of the condition attribute (set) P with respect to the decision attribute (set) Q.

Figure 2011175362
Figure 2011175362

式(2)において、card(K)は、集合Kの濃度(cardinality)、即ち集合Kに含まれる元の数を表す。即ち、右辺の分母は、対象全体集合Uの濃度を表す。右辺の分子は、条件属性(集合)P、決定属性(集合)Qについての正領域の濃度を表す。   In Equation (2), card (K) represents the cardinality of the set K, that is, the original number included in the set K. That is, the denominator on the right side represents the density of the entire target set U. The numerator on the right side represents the density of the positive region for the condition attribute (set) P and the decision attribute (set) Q.

図9の例では、対象全体集合Uの濃度は、コンテンツC1〜C6の数、即ち6である。条件属性(集合)P、決定属性(集合)Qについての正領域の濃度は、「好み」=“Y”の下近似の濃度(=2)及び「好み」=“N”の下近似の濃度(=2)の和に相当し、2+2=4である。従って、式(2)によれば、決定属性(「好み」)に対する条件属性の組合せ「ジャンル」、「年代」、「キーワード(“世界”)」及び「ムード(“明るさ”)」の重要度は、4/6=0.67と算出される。   In the example of FIG. 9, the density of the entire target set U is the number of contents C1 to C6, that is, six. The density of the positive region for the condition attribute (set) P and the decision attribute (set) Q is the density of the lower approximation (= 2) of “Preference” = “Y” and the density of the lower approximation of “Preference” = “N”. It corresponds to the sum of (= 2), and 2 + 2 = 4. Therefore, according to the formula (2), the combination of the condition attribute “genre”, “age”, “keyword (“ world ”)” and “mood (“ brightness ”)” with respect to the decision attribute (“preference”) is important. The degree is calculated as 4/6 = 0.67.

一般的に、正領域の濃度は、選択された条件属性の属性値が決定属性の属性値の決定により大きく寄与する場合、即ち、条件属性の属性値が与えられることで決定属性の属性値をより高い確度で予測できる場合に、高い値となる。逆に、条件属性の属性値が与えられても、決定属性の属性値がある程度の確度(あるいは必然性)をもって定まらない場合には、正領域の濃度は低くなる。これが意味するところは、対象全体集合Uの濃度を用いて式(2)のように正規化された正領域の濃度が、任意に選択される条件属性の組合せ(条件属性の属性部分集合P)の、決定属性(決定属性の属性部分集合Q)の属性値に対する情報伝達性(informativity)の指標(あるいは近似の質の指標)として扱い得るということである。従って、例えば、属性テーブルに含まれる評価属性を決定属性とし、その他の任意の属性の組合せを条件属性として各組合せについて重要度を算出することにより、コンテンツの推薦の基礎となるスコア又はユーザFBがどのような属性の組合せによって有意に決定され又は予測され得るかを、数値的に評価することが可能となる。   Generally, the density of the positive region is determined when the attribute value of the selected condition attribute greatly contributes to the determination of the attribute value of the determination attribute, that is, the attribute value of the determination attribute is given by the attribute value of the condition attribute. A high value is obtained when prediction can be made with higher accuracy. On the other hand, if the attribute value of the decision attribute is not determined with a certain degree of accuracy (or necessity) even if the attribute value of the condition attribute is given, the density of the normal region is low. This means that a combination of condition attributes (condition attribute attribute subset P) in which the density of the normal region normalized by using the density of the entire object set U is arbitrarily selected as shown in Equation (2). It can be treated as an index (or an approximate quality index) of informativity for the attribute value of the determination attribute (attribute subset Q of the determination attribute). Therefore, for example, by calculating the importance for each combination using the evaluation attribute included in the attribute table as the determination attribute and the combination of any other attribute as the condition attribute, the score or the user FB as the basis for recommending the content can be obtained. It is possible to numerically evaluate what combination of attributes can be determined or predicted significantly.

重要度算出部150による、Fuzzy Rough集合についての重要度算出式は、式(3)の通りである。式(3)に従って算出される重要度もまた、任意に選択される条件属性の組合せ(条件属性の属性部分集合P)の、決定属性(決定属性の属性部分集合Q)の属性値に対する情報伝達性の指標として扱い得る。   The importance calculation formula for the Fuzzy Rough set by the importance calculation unit 150 is as shown in Expression (3). The importance calculated in accordance with the expression (3) is also transmitted to the attribute value of the decision attribute (the attribute subset Q of the decision attribute) of the arbitrarily selected combination of the condition attributes (the attribute subset P of the condition attribute) It can be treated as an index of sex.

Figure 2011175362
Figure 2011175362

重要度算出部150は、様々な条件属性の組合せ(以下、条件属性セットという)について、式(2)又は式(3)に従って、決定属性Qに対する重要度を計算する。   The importance calculation unit 150 calculates the importance for the decision attribute Q according to the formula (2) or the formula (3) for various combinations of condition attributes (hereinafter referred to as condition attribute sets).

図10は、図9の上部に例示した決定表に基づいて算出される、様々な条件属性セットについての重要度の一例について説明するための説明図である。図10を参照すると、「ジャンル」、「年代」、「キーワード(“世界”)」及び「ムード(“明るさ”)」という4つの元を含む条件属性Cから選択され得る15通りの条件属性セットAS1〜AS15が示されている(そのうち一部は省略されている)。例えば、条件属性セットAS1は、「ジャンル」のみを含む。条件属性セットAS2は、「年代」のみを含む。また、条件属性セットAS5は、「ジャンル」と「年代」とを含む。条件属性セットAS15は、「ジャンル」、「年代」、「キーワード(“世界”)」及び「ムード(“明るさ”)」の全てを含む。   FIG. 10 is an explanatory diagram for explaining an example of importance levels for various condition attribute sets calculated based on the determination table illustrated in the upper part of FIG. 9. Referring to FIG. 10, 15 condition attributes that can be selected from condition attributes C including four elements of “genre”, “age”, “keyword (“ world ”)”, and “mood (“ brightness ”)”. Sets AS1 to AS15 are shown (some of which are omitted). For example, the condition attribute set AS1 includes only “genre”. The condition attribute set AS2 includes only “age”. The condition attribute set AS5 includes “genre” and “age”. The condition attribute set AS15 includes all of “genre”, “age”, “keyword (“ world ”)”, and “mood (“ brightness ”)”.

重要度算出部150は、例えば、1つの属性(図10の例では「好み」)を決定属性とし、各条件属性セットAS1〜AS15を条件属性の属性部分集合として、各条件属性セットについての重要度を式(2)又は式(3)に従って算出する。その結果、例えば、条件属性セットAS7の重要度が最も高い値を示したものとする。図10の例では、条件属性セットAS7の重要度は0.55である。この場合、条件属性セットAS7に含まれる「ジャンル」及び「ムード(“明るさ”)」の組合せが、決定属性「好み」の属性値を決定し又は予測するために最も有意な属性であるということができる。   The importance calculation unit 150 uses, for example, one attribute (“preference” in the example of FIG. 10) as a decision attribute, and sets each condition attribute set AS1 to AS15 as an attribute subset of condition attributes. The degree is calculated according to formula (2) or formula (3). As a result, for example, it is assumed that the condition attribute set AS7 shows the highest importance value. In the example of FIG. 10, the importance of the condition attribute set AS7 is 0.55. In this case, the combination of “genre” and “mood (“ brightness ”)” included in the condition attribute set AS7 is the most significant attribute for determining or predicting the attribute value of the determination attribute “preference”. be able to.

重要度算出部150は、このような条件属性セットごとの重要度の算出結果を、抽出部160へ出力する。   The importance calculation unit 150 outputs the calculation result of the importance for each condition attribute set to the extraction unit 160.

[2−7.抽出部]
抽出部160は、重要度算出部150により算出される上述した重要度に応じて、コンテンツに関するユーザに呈示すべき情報を生成するために使用される1つ以上の重要属性を抽出する。コンテンツに関するユーザに呈示すべき情報とは、例えば、推薦すべきコンテンツに関する情報と共に呈示される推薦理由などであってよい。その代わりに、コンテンツに関するユーザに呈示すべき情報とは、例えば、コンテンツリスト(例えば音楽コンテンツを一覧化したプレイリストなど)のタイトルであってもよい。抽出部160による重要属性の抽出処理には、主に(1)直接抽出と(2)段階的抽出の2通りのパターンが存在する。
[2-7. Extraction unit]
The extraction unit 160 extracts one or more important attributes used to generate information about the content to be presented to the user according to the above-described importance calculated by the importance calculation unit 150. The information to be presented to the user regarding the content may be, for example, the reason for recommendation presented together with the information regarding the content to be recommended. Instead, the information about the content to be presented to the user may be, for example, the title of a content list (for example, a playlist that lists music content). The important attribute extraction processing by the extraction unit 160 mainly includes two patterns: (1) direct extraction and (2) stepwise extraction.

(1)直接抽出
直接抽出の場合には、抽出部160は、例えば、コンテンツの推薦の基礎とされる属性を決定属性とし、推薦理由の生成のために用い得る1つ以上の属性を条件属性として重要度算出部150により算出される重要度を、重要属性の抽出のために使用する。
(1) Direct extraction In the case of direct extraction, the extraction unit 160 uses, for example, an attribute that is a basis for content recommendation as a decision attribute, and uses one or more attributes that can be used for generating a recommendation reason as a conditional attribute. The importance calculated by the importance calculation unit 150 is used for extracting important attributes.

例えば、推薦部140がユーザFBについての属性値を用いて推薦すべきコンテンツを選択する場合に、その推薦理由をコンテンツのメタデータを用いて生成することを想定する。その場合、例えば、図10に例示したように、重要度算出部150は、コンテンツのメタデータ(「ジャンル」、「年代」等)の属性の様々な組合せ(条件属性セット)について、ユーザFB(「好み」)を決定属性とした場合の重要度を算出する。そして、抽出部160は、例えば、算出された重要度が最も高い条件属性セットに含まれる1つ以上の属性を、重要属性として抽出する。即ち、図10の例では、「ジャンル」及び「ムード(“明るさ”)」が重要属性として抽出され得る。   For example, it is assumed that when the recommendation unit 140 selects content to be recommended using an attribute value for the user FB, the reason for recommendation is generated using content metadata. In this case, for example, as illustrated in FIG. 10, the importance calculation unit 150 performs user FB (condition attribute set) on various combinations (condition attribute sets) of content metadata (“genre”, “age”, etc.). The degree of importance is calculated when “preference”) is used as a decision attribute. Then, the extraction unit 160 extracts, for example, one or more attributes included in the condition attribute set having the highest calculated importance as the important attributes. That is, in the example of FIG. 10, “genre” and “mood (“ brightness ”)” can be extracted as important attributes.

図11は、決定表に基づいて算出される重要度の他の例について説明するための説明図である。図11の例に関連し、例えば、推薦処理を実行している時間帯(例えばT1)においてより多く閲覧等された実績のあるコンテンツが、推薦すべきコンテンツとして選択され得る状況を想定する。その場合、例えば、重要度算出部150は、コンテンツのメタデータ(「ジャンル」、「年代」等)の属性の様々な組合せ(条件属性セット)について、コンテキストデータ(例えば「時間帯:T1」)を決定属性とした場合の重要度を算出する。そして、抽出部160は、例えば、算出された重要度が最も高い条件属性セットに含まれる1つ以上の属性を、重要属性として抽出する。図11の例では、「ジャンル」及び「年代」を含む条件属性セットAS5の重要度が最も高いため(0.65)、「ジャンル」及び「年代」が重要属性として抽出され得る。   FIG. 11 is an explanatory diagram for describing another example of the importance calculated based on the determination table. In relation to the example of FIG. 11, for example, a situation is assumed in which content with a history of browsing or the like in a time zone (for example, T1) in which recommendation processing is executed can be selected as content to be recommended. In this case, for example, the importance calculation unit 150 uses context data (for example, “time zone: T1”) for various combinations (condition attribute sets) of attributes of content metadata (“genre”, “age”, etc.). The degree of importance is calculated when the is a decision attribute. Then, the extraction unit 160 extracts, for example, one or more attributes included in the condition attribute set having the highest calculated importance as the important attributes. In the example of FIG. 11, since the condition attribute set AS5 including “genre” and “age” has the highest importance (0.65), “genre” and “age” can be extracted as important attributes.

なお、抽出部160は、算出された重要度が最も高い条件属性セットに含まれる属性を重要属性として抽出する代わりに、予め設定される閾値を超える重要度を示す1つ以上の条件属性セットに含まれる属性を重要属性として抽出してもよい。また、抽出部160は、算出された重要度が高い順にN個(Nは予め設定される)の属性を重要属性として抽出してもよい。   Note that the extraction unit 160 does not extract the attribute included in the calculated condition attribute set having the highest importance level as an important attribute, but extracts one or more condition attribute sets that indicate an importance level exceeding a preset threshold. The included attributes may be extracted as important attributes. In addition, the extraction unit 160 may extract N (N is preset) attributes as important attributes in descending order of the calculated importance.

(2)段階的抽出
段階的抽出の場合には、抽出部160は、例えば、コンテンツの推薦の基礎とされる属性を決定属性とし、拡張属性に含まれる1つ以上の属性を条件属性として重要度算出部150により算出される第1の重要度と、拡張属性に含まれる属性を決定属性、推薦理由の生成のために用い得る1つ以上の属性を条件属性として重要度算出部150により算出される第2の重要度とを、重要属性の抽出のために使用する。
(2) Stepwise extraction In the case of stepwise extraction, the extraction unit 160 uses, for example, an attribute that is a basis for content recommendation as a decision attribute, and one or more attributes included in an extended attribute as important as a condition attribute. Calculated by the importance calculation unit 150 using the first importance calculated by the degree calculation unit 150 and the attribute included in the extended attribute as a decision attribute and one or more attributes that can be used for generating a recommendation reason as a condition attribute The second importance degree to be used is used for extraction of important attributes.

図12は、抽出部160による重要属性の段階的抽出について説明するための説明図である。図12の上部では、コンテンツの推薦の基礎とされる推薦アルゴリズムのスコアを決定属性Q1とし、拡張属性のレビュー文層に含まれる潜在トピックX1〜Xnの任意の組合せP1を条件属性として、重要度算出部150により第1の重要度γP1(Q1)(P1⊆C1)が算出されている。ここで、例えば、P1={X1,X2}のとき第1の重要度γP1(Q1)が最大であったものとする。 FIG. 12 is an explanatory diagram for explaining the stepwise extraction of important attributes by the extraction unit 160. In the upper part of FIG. 12, the score of the recommendation algorithm that is the basis of content recommendation is the determination attribute Q1, and any combination P1 of the latent topics X1 to Xn included in the review sentence layer of the extended attribute is the condition attribute. The calculation unit 150 calculates the first importance γ P1 (Q1) ( P1算出 C1). Here, for example, it is assumed that the first importance γ P1 (Q1) is the maximum when P1 = {X1, X2}.

図12の下部では、P1={X1,X2}を決定属性Q2とし、推薦理由の生成のために用い得るキーワードK1、K2、K3、…の任意の組合せP2を条件属性として、重要度算出部150により第2の重要度γP2(Q2)が算出されている。これら、第1の重要度及び第2の重要度の算出結果から、抽出部160は、例えば、第2の重要度γP2(Q2)が最も高い条件属性セットP2(Q2=P1={X1,X2})に含まれるキーワードを、重要属性として抽出する。 In the lower part of FIG. 12, P1 = {X1, X2} is a decision attribute Q2, and an arbitrary combination P2 of keywords K1, K2, K3,. 150, the second importance γ P2 (Q2) is calculated. From the calculation results of the first importance level and the second importance level, the extraction unit 160, for example, sets the condition attribute set P2 (Q2 = P1 = {X1, Q2) having the highest second importance level γ P2 (Q2). X2}) are extracted as important attributes.

なお、段階的抽出の手法は、かかる例に限定されない。図12を用いて説明した手法は、第1の重要度を用いて推薦アルゴリズムのスコアに最も寄与する拡張属性(レビュー文層の潜在トピック)のセットを特定した後、特定した拡張属性のセットに寄与する基本属性(キーワード)のセットを第2の重要度を用いて抽出する手法であった。その代わりに、抽出部160は、例えば、第1の重要度と第2の重要度とを共通する拡張属性のセットについて乗算し、その乗算結果がより大きくなる基本属性のセットに含まれる属性を重要属性として抽出してもよい。   Note that the stepwise extraction method is not limited to such an example. The method described with reference to FIG. 12 uses the first importance to identify a set of extended attributes (latent topics in the review sentence layer) that most contributes to the score of the recommendation algorithm, and then to the specified set of extended attributes. This is a method of extracting a set of contributing basic attributes (keywords) using the second importance. Instead, for example, the extraction unit 160 multiplies the first importance level and the second importance level with respect to the common extended attribute set, and adds the attributes included in the basic attribute set whose multiplication result is larger. It may be extracted as an important attribute.

なお、直接抽出か段階的抽出かによらず、条件属性と決定属性との組は、上述した例に限定されない。抽出部160は、このように抽出した重要属性を、推薦部140へ出力する。   Regardless of direct extraction or stepwise extraction, the combination of the condition attribute and the determination attribute is not limited to the above-described example. The extraction unit 160 outputs the important attributes extracted in this way to the recommendation unit 140.

[2−8.画面例]
図13及び図14は、推薦理由が呈示される画面の例をそれぞれ示している。図13を参照すると、推薦部140により生成され、UI制御部130を介して表示装置により表示される一例としての推薦画面132aが示されている。推薦画面132aには、ユーザに推薦される音楽コンテンツのジャケット画像134a、当該コンテンツの説明文136a及び推薦理由138aが含まれる。推薦理由138aには、抽出部160により抽出された重要属性を表す文字列が列挙されている。このような推薦理由138aを表示することにより、推薦されたコンテンツについての推薦の理由をユーザに納得させることができる。また、ユーザは、推薦されたコンテンツについてのアクション(視聴、購買、又は無視等)をより容易に決定することができる。
[2-8. Screen example]
13 and 14 show examples of screens on which the reasons for recommendation are presented. Referring to FIG. 13, an example recommendation screen 132 a generated by the recommendation unit 140 and displayed on the display device via the UI control unit 130 is shown. The recommendation screen 132a includes a jacket image 134a of music content recommended by the user, a description sentence 136a of the content, and a recommendation reason 138a. In the recommendation reason 138a, character strings representing the important attributes extracted by the extraction unit 160 are listed. By displaying such a recommendation reason 138a, it is possible to convince the user of the reason for recommendation for the recommended content. Also, the user can more easily determine an action (viewing, purchasing, ignoring, etc.) for the recommended content.

図14を参照すると、推薦部140により生成され、UI制御部130を介して表示装置により表示される他の例としての推薦画面132bが示されている。推薦画面132bには、ユーザに推薦される音楽コンテンツのジャケット画像134b、当該コンテンツの説明文136b及び推薦理由138bが含まれる。推薦理由138bには、抽出部160により抽出された重要属性を用いて生成された推薦理由の文章が示されている。このような推薦理由138bによっても、推薦されたコンテンツについての推薦の理由をユーザに納得させ、かつ、推薦されたコンテンツについてのユーザのアクションの決定をより容易にすることができる。   Referring to FIG. 14, a recommendation screen 132 b as another example generated by the recommendation unit 140 and displayed on the display device via the UI control unit 130 is shown. The recommendation screen 132b includes a jacket image 134b of music content recommended by the user, a description 136b of the content, and a reason for recommendation 138b. In the recommendation reason 138b, a sentence of the reason for recommendation generated by using the important attribute extracted by the extraction unit 160 is shown. Such a recommendation reason 138b can also convince the user of the reason for recommendation for the recommended content, and can more easily determine the user's action for the recommended content.

<3.一実施形態に係る処理の流れ>
次に、図15及び図16を用いて、本実施形態に係る情報処理装置100による処理の流れを説明する。
<3. Flow of processing according to one embodiment>
Next, the flow of processing by the information processing apparatus 100 according to the present embodiment will be described with reference to FIGS. 15 and 16.

[3−1.事前処理]
図15は、本実施形態に係る情報処理装置100による事前処理の流れの一例を示すフローチャートである。事前処理は、コンテンツの推薦処理よりも以前に行われ得る処理である。事前処理は、例えば、一定の数のコンテンツが蓄積された時、又は所定の期間ごとに定期的に実行され得る。
[3-1. Pre-processing]
FIG. 15 is a flowchart illustrating an example of the flow of pre-processing by the information processing apparatus 100 according to the present embodiment. The pre-processing is processing that can be performed before the content recommendation processing. The pre-processing can be executed, for example, when a certain number of contents are accumulated or periodically every predetermined period.

図15を参照すると、まず、解析部120により、記憶部110の属性テーブルに記憶されているコンテンツの基本属性が取得される(ステップS102)。次に、解析部120は、PLSA又はLDAによる確率的分類法に従って、基本属性の属性値に基づいて、拡張属性の属性値を算出する(ステップS104)。解析部120は、ここで算出した拡張属性の属性値を属性テーブルに格納する。   Referring to FIG. 15, first, the basic attribute of content stored in the attribute table of the storage unit 110 is acquired by the analysis unit 120 (step S <b> 102). Next, the analysis unit 120 calculates the attribute value of the extended attribute based on the attribute value of the basic attribute according to the probabilistic classification method by PLSA or LDA (step S104). The analysis unit 120 stores the attribute value of the extended attribute calculated here in the attribute table.

次に、重要度算出部150により、推薦部140による推薦処理の中で重要属性の段階的抽出が行われるか否かが判定される(ステップS106)。ここで、重要属性の段階的抽出が行われない場合には、ステップS108はスキップされる。重要属性の段階的抽出が行われる場合には、重要度算出部150は、解析部120により算出された拡張属性を決定属性とし、基本属性を条件属性とした場合の重要度(段階的抽出における第2の重要度)を算出する(ステップS108)。重要度算出部150は、例えば、ここで算出した重要度を、後の推薦処理のために記憶部110に記憶させる。   Next, the importance level calculation unit 150 determines whether or not stepwise extraction of important attributes is performed in the recommendation process by the recommendation unit 140 (step S106). Here, if the important attributes are not extracted stepwise, step S108 is skipped. When the important attributes are stepwise extracted, the importance degree calculation unit 150 uses the extended attribute calculated by the analysis unit 120 as the decision attribute and the basic attribute as the condition attribute (in the stepwise extraction). The second importance) is calculated (step S108). For example, the importance calculation unit 150 stores the importance calculated here in the storage unit 110 for later recommendation processing.

このような事前処理のほかに、例えば、ユーザによるコンテンツの閲覧等のアクションが行われた場合には、UI制御部130によるコンテキストデータの更新、ユーザFBの登録などの処理が行われ得る。また、それに応じて、拡張属性の再計算などが行われてもよい。   In addition to such pre-processing, for example, when an action such as browsing of content is performed by the user, processing such as updating of context data and registration of the user FB by the UI control unit 130 may be performed. Further, recalculation of extended attributes may be performed accordingly.

[3−2.推薦処理]
図16は、本実施形態に係る情報処理装置100による推薦処理の流れの一例を示すフローチャートである。推薦処理は、例えば、ユーザ又は端末装置からの要求に応じて行われ得る処理である。
[3-2. Recommendation process]
FIG. 16 is a flowchart illustrating an example of a flow of recommendation processing by the information processing apparatus 100 according to the present embodiment. The recommendation process is a process that can be performed in response to a request from a user or a terminal device, for example.

図16を参照すると、まず、推薦部140により、記憶部110が保持している属性テーブルに記憶されている属性値を用いて、ユーザに推薦すべきコンテンツが選択される(ステップS202)。次に、推薦部140は、推薦アルゴリズムにより出力されるスコアを、評価属性の属性値として属性テーブルに格納する(ステップS204)。次に、重要度算出部150により、重要属性の段階的抽出が行われるか否かが判定される(ステップS206)。ここで、重要属性の段階的抽出が行われる場合には、処理はステップS208へ進む。一方、重要属性の段階的抽出が行われない場合には、処理はステップS212へ進む。   Referring to FIG. 16, first, the recommendation unit 140 selects content to be recommended to the user using the attribute values stored in the attribute table held by the storage unit 110 (step S202). Next, the recommendation unit 140 stores the score output by the recommendation algorithm in the attribute table as the attribute value of the evaluation attribute (step S204). Next, it is determined by the importance level calculation unit 150 whether or not the stepwise extraction of important attributes is performed (step S206). Here, when the important attribute is extracted stepwise, the process proceeds to step S208. On the other hand, if the important attributes are not extracted stepwise, the process proceeds to step S212.

ステップS208では、重要度算出部150は、例えば、推薦部140により出力されたスコア(又はユーザFBなどの他の属性)を決定属性、拡張属性を条件属性とした場合の重要度(段階的抽出における第1の重要度)を算出する(ステップS208)。次に、抽出部160は、第1の重要度及び第2の重要度に応じて、重要属性を抽出する(ステップS210)。   In step S208, the importance calculation unit 150, for example, the importance (stepwise extraction) when the score (or other attribute such as the user FB) output by the recommendation unit 140 is the determination attribute and the extended attribute is the condition attribute. (First importance level) is calculated (step S208). Next, the extraction unit 160 extracts important attributes according to the first importance level and the second importance level (step S210).

一方、ステップS212では、重要度算出部150は、例えば、推薦部140により出力されたスコア(又はユーザFBなどの他の属性)を決定属性、基本属性を条件属性とした場合の重要度(直接抽出における重要度)を算出する(ステップS212)。次に、抽出部160は、重要度算出部150により算出された重要度に応じて、重要属性を抽出する(ステップS214)。   On the other hand, in step S212, the importance calculation unit 150 uses, for example, the importance (directly) when the score (or another attribute such as the user FB) output by the recommendation unit 140 is the determination attribute and the basic attribute is the condition attribute. The importance in the extraction is calculated (step S212). Next, the extraction unit 160 extracts an important attribute according to the importance calculated by the importance calculation unit 150 (step S214).

次に、推薦部140は、抽出部160により抽出された重要属性に基づいて、ユーザに呈示すべき推薦理由を含む推薦画面を生成する(ステップS216)。次に、UI制御部130は、推薦部140により生成された推薦画面を表示装置に表示させる(ステップS218)。その後、推薦すべきコンテンツを変更する場合には、処理はステップS202へ戻り、上述した処理が繰り返される。一方、推薦すべき新たなコンテンツが存在しない場合には、推薦処理は終了する。   Next, the recommendation unit 140 generates a recommendation screen including a recommendation reason to be presented to the user based on the important attributes extracted by the extraction unit 160 (step S216). Next, the UI control unit 130 causes the display device to display the recommendation screen generated by the recommendation unit 140 (step S218). Thereafter, when the content to be recommended is changed, the processing returns to step S202, and the above-described processing is repeated. On the other hand, when there is no new content to be recommended, the recommendation process ends.

なお、図16に示したフローチャートでは、1つのコンテンツについて重要属性の直接抽出と段階的抽出のいずれか一方が行われる例を示したが、1つのコンテンツについて重要属性の直接抽出と段階的抽出の双方が行われてもよい。例えば、情報処理装置100は、属性値集合の元の少ない基本属性(「ジャンル」、「年代」、「ムード」など)については直接抽出を行い、属性値集合の元の多い基本属性(「キーワード」、「アーティスト」など)については拡張属性を利用した段階的抽出を行ってもよい。拡張属性の属性空間の次元は基本属性の属性空間の次元に比べて一般的に低い(典型的には、潜在トピックの数に相当する)ため、拡張属性を条件属性として中間的に利用することで、推薦処理の最中の重要度算出処理の計算コストを抑えることができる。また、確率的分類法の利点として、潜在的なキーワード間又はアーティスト間の関連性(例えば同義関係など)を重要度の算出結果に反映させることができる。   Note that the flowchart shown in FIG. 16 shows an example in which either one of the important attribute direct extraction or stepwise extraction is performed for one content. However, the important attribute direct extraction or stepwise extraction is performed for one content. Both may be performed. For example, the information processing apparatus 100 directly extracts basic attributes (“genre”, “age”, “mood”, etc.) with a small original attribute value set, and basic attributes (“keyword” with a large attribute value set) ”,“ Artist ”, etc.) may be extracted step by step using extended attributes. The attribute space dimension of the extended attribute is generally lower than the attribute space dimension of the basic attribute (typically equivalent to the number of potential topics), so the extended attribute should be used as a conditional attribute in the middle Thus, the calculation cost of the importance calculation process during the recommendation process can be suppressed. Further, as an advantage of the probabilistic classification method, it is possible to reflect the relationship between potential keywords or artists (for example, synonymous relationships) in the calculation result of the importance.

<4.変形例>
[4−1.プレイリストの提供]
図17は、本実施形態の一変形例に係る情報処理装置200の構成を示すブロック図である。図17を参照すると、情報処理装置200は、記憶部110、解析部120、ユーザインタフェース(UI)制御部130、コンテンツリスト生成部240、重要度算出部250及び抽出部260を備える。情報処理装置200においては、図1に示した推薦部140の代わりに、コンテンツリスト生成部240が設けられている。
<4. Modification>
[4-1. Provision of playlist]
FIG. 17 is a block diagram illustrating a configuration of an information processing apparatus 200 according to a modification of the present embodiment. Referring to FIG. 17, the information processing apparatus 200 includes a storage unit 110, an analysis unit 120, a user interface (UI) control unit 130, a content list generation unit 240, an importance calculation unit 250, and an extraction unit 260. In the information processing apparatus 200, a content list generation unit 240 is provided instead of the recommendation unit 140 illustrated in FIG.

コンテンツリスト生成部240は、ユーザの指定に応じて、又は属性テーブルに記憶されている属性値を用いて、UI制御部130が再生すべきコンテンツのリストを生成する。また、コンテンツリスト生成部240は、抽出部260により抽出される1つ以上の重要属性に基づいて、コンテンツリストのタイトルを生成する。そして、コンテンツリスト生成部240は、タイトルを付したコンテンツリストをUI制御部130を介してユーザに呈示する。コンテンツリスト生成部240により生成されるコンテンツリストは、例えば、再生すべき音楽コンテンツ又は映像コンテンツなどを一覧化したプレイリストであってよい。   The content list generation unit 240 generates a list of contents to be played back by the UI control unit 130 in accordance with a user designation or using attribute values stored in the attribute table. In addition, the content list generation unit 240 generates a title of the content list based on one or more important attributes extracted by the extraction unit 260. Then, the content list generation unit 240 presents the content list with the title to the user via the UI control unit 130. The content list generated by the content list generation unit 240 may be, for example, a playlist that lists music content or video content to be reproduced.

コンテンツリスト生成部240により生成されるコンテンツリストには、例えば、ユーザにより指定される一群のコンテンツが含まれる。コンテンツリストに含めるべきコンテンツをユーザが指定した場合には、コンテンツリスト生成部240は、例えば、属性テーブルの評価属性として、ユーザによる指定の有無に応じた属性値(例えば、指定ありなら“1”、指定なしなら“0”)を有するスコアを格納する。一方、コンテンツリスト生成部240は、上述したいずれかの推薦アルゴリズムを用いてコンテンツリストに含めるべきコンテンツを自ら選択した場合には、推薦アルゴリズムが出力するスコアを属性テーブルに格納する。   The content list generated by the content list generation unit 240 includes, for example, a group of contents specified by the user. When the user specifies content to be included in the content list, the content list generation unit 240, for example, as an evaluation attribute of the attribute table, an attribute value according to the presence / absence of designation by the user (for example, “1” if designated) If there is no designation, a score having “0”) is stored. On the other hand, the content list generation unit 240 stores the score output by the recommendation algorithm in the attribute table when one of the above-described recommendation algorithms is used to select content to be included in the content list.

さらに、例えば、コンテンツリスト生成部240は、属性テーブルに記憶されているユーザFBについての属性値を用いて、コンテンツリストに含めるべきコンテンツを選択してもよい。また、例えば、コンテンツリスト生成部240は、属性テーブルに記憶されているコンテキストデータについての属性値を用いて、コンテンツリストに含めるべきコンテンツを選択してもよい。例えば、特定の時間帯においてより多く再生された実績のあるコンテンツが、コンテンツリストに含めるべきコンテンツとして優先的に選択され得る。   Further, for example, the content list generation unit 240 may select content to be included in the content list using the attribute value for the user FB stored in the attribute table. In addition, for example, the content list generation unit 240 may select content to be included in the content list using the attribute value for the context data stored in the attribute table. For example, content that has been played more frequently in a specific time zone can be preferentially selected as content to be included in the content list.

コンテンツリスト生成部240は、コンテンツリストを生成すると、コンテンツリストの生成のために使用した所定の属性に対する重要度を、当該所定の属性以外の1つ以上の属性について、重要度算出部250に算出させる。また、コンテンツリスト生成部240は、コンテンツリストのタイトルを生成するために使用される1つ以上の重要属性を、抽出部260に抽出させる。そして、コンテンツリスト生成部240は、抽出部260により抽出された1つ以上の重要属性を用いてコンテンツリストのタイトルを生成し、当該タイトルを付したコンテンツリストをUI制御部130を介してユーザに呈示する。   When the content list is generated, the content list generation unit 240 calculates the importance for the predetermined attribute used for generating the content list to the importance calculation unit 250 for one or more attributes other than the predetermined attribute. Let In addition, the content list generation unit 240 causes the extraction unit 260 to extract one or more important attributes used for generating the title of the content list. Then, the content list generation unit 240 generates a title of the content list using one or more important attributes extracted by the extraction unit 260, and sends the content list with the title to the user via the UI control unit 130. Present.

重要度算出部250は、属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する重要度を、コンテンツの当該所定の属性以外の1つ以上の属性について算出する。例えば、重要度算出部250は、ユーザによる指定の有無に応じて属性値が決定された評価属性を決定属性とする決定表を用いて重要度を算出してもよい。また、例えば、重要度算出部250は、コンテンツリスト生成部240によるコンテンツリストの生成のために使用された属性(例えば、推薦アルゴリズムのスコアなど)を決定属性とする決定表を用いて重要度を算出してもよい。重要度算出部250は、上述した重要度算出部150と同様に複数の条件属性セットごとに算出した重要度を、抽出部260へ出力する。   The importance level calculation unit 250 uses the attribute values stored in the attribute table to calculate the importance level for the predetermined attribute of the content for one or more attributes other than the predetermined attribute of the content. For example, the importance level calculation unit 250 may calculate the importance level using a determination table in which an evaluation attribute whose attribute value is determined according to whether or not a user designates is used as a determination attribute. Further, for example, the importance level calculation unit 250 uses the decision table having the attribute (for example, the recommendation algorithm score) used for generating the content list by the content list generation unit 240 as the determination attribute. It may be calculated. Similar to the importance calculation unit 150 described above, the importance calculation unit 250 outputs the importance calculated for each of the plurality of condition attribute sets to the extraction unit 260.

抽出部260は、重要度算出部250により算出される上述した重要度に応じて、コンテンツリストのタイトルを生成するために使用される1つ以上の重要属性を抽出する。上述した抽出部160と同様、抽出部260による重要属性の抽出処理もまた、直接抽出と段階的抽出の2通りのパターンによって行われ得る。   The extraction unit 260 extracts one or more important attributes used to generate the title of the content list according to the above-described importance calculated by the importance calculation unit 250. Similar to the extraction unit 160 described above, the important attribute extraction processing by the extraction unit 260 can also be performed by two patterns of direct extraction and stepwise extraction.

このような変形例によれば、例えば、ユーザの指定に応じてコンテンツリストが生成される場合にも、直接的にはシステムが知り得ないユーザの意図又は感情などに関連する重要属性の組合せが抽出され、その重要属性を用いてコンテンツリストのタイトルを動的に生成することができる。また、例えば、推薦アルゴリズムを用いてシステムがコンテンツリストを生成する場合にも、その推薦の結果にふさわしいタイトルを動的に生成することができる。なお、コンテンツリストのタイトルは、例えば、「Rock,Scandal」のような属性文字列の単純な結合であってもよく、その代わりに、よりタイトルらしく加工されたものであってもよい。   According to such a modification, for example, even when a content list is generated in accordance with a user's specification, there are combinations of important attributes related to the user's intention or emotion that the system cannot directly know. The title of the content list can be dynamically generated using the extracted important attributes. Further, for example, when the system generates a content list using a recommendation algorithm, a title suitable for the result of the recommendation can be dynamically generated. The title of the content list may be, for example, a simple combination of attribute character strings such as “Rock, Scandal”, or may be processed more like a title instead.

[4−2.個人化]
図18は、本実施形態の他の変形例について説明するための説明図である。図18の上部には、図1に示した記憶部110により保持される属性テーブルが示されている。また、属性テーブルの下に、ユーザU1の各コンテンツに対するユーザアクションの履歴を表す履歴データが示されている。かかる履歴データは、例えば、記憶部110によりユーザごとに(又は装置ごとに)保持される。そして、例えば、重要度算出部150又は250は、履歴データに含まれるコンテンツについての属性テーブルのサブセットを取得し、取得したサブセットに含まれる属性値のみに基づいて、重要度を算出する。図18の例では、ユーザU1の履歴データにはコンテンツC1、C4及びC2に対するユーザアクションが記述されており、コンテンツC1、C2及びC4についての属性テーブルのサブセットが取得されている。このような場合には、抽出部160又は260から出力される重要属性は、全てのユーザではなく、特定のユーザ(図18の例ではユーザU1)にとって重要な属性となる。このような履歴データに基づく属性テーブルのフィルタリングにより、ユーザ個人の特性に応じた重要度を算出することが可能となる。その結果、情報処理装置100又は200により呈示される推薦理由又はプレイリストのタイトル等の個人化(Personalization)を図ることが可能となり、ユーザの満足度を向上させることができる。
[4-2. Personalization]
FIG. 18 is an explanatory diagram for explaining another modified example of the present embodiment. In the upper part of FIG. 18, an attribute table held by the storage unit 110 shown in FIG. 1 is shown. Also, below the attribute table, history data representing the history of user actions for each content of the user U1 is shown. Such history data is held by the storage unit 110 for each user (or for each device), for example. For example, the importance level calculation unit 150 or 250 acquires a subset of the attribute table for the content included in the history data, and calculates the importance level based only on the attribute value included in the acquired subset. In the example of FIG. 18, user actions for the contents C1, C4, and C2 are described in the history data of the user U1, and a subset of the attribute table for the contents C1, C2, and C4 is acquired. In such a case, the important attribute output from the extraction unit 160 or 260 is an important attribute for a specific user (user U1 in the example of FIG. 18), not all users. By filtering the attribute table based on such history data, it is possible to calculate the importance according to the characteristics of the individual user. As a result, it is possible to achieve personalization of the reason for recommendation presented by the information processing apparatus 100 or 200 or the title of the playlist, and the user satisfaction can be improved.

<5.ハードウェア構成例>
上述した情報処理装置100又は200による一連の処理は、典型的には、ソフトウェアを用いて実現される。ソフトウェアを構成するプログラムは、例えば図19に示した構成を有する汎用コンピュータを用いて実行される。
<5. Hardware configuration example>
A series of processing by the information processing apparatus 100 or 200 described above is typically realized using software. The program constituting the software is executed using, for example, a general-purpose computer having the configuration shown in FIG.

図19において、CPU(Central Processing Unit)902は、汎用コンピュータの動作全般を制御する。ROM(Read Only Memory)904には、一連の処理の一部又は全部を記述したプログラム又はデータが格納される。RAM(Random Access Memory)906には、処理の実行時にCPU902により用いられるプログラムやデータなどが一時的に記憶される。   In FIG. 19, a CPU (Central Processing Unit) 902 controls the overall operation of the general-purpose computer. A ROM (Read Only Memory) 904 stores a program or data describing a part or all of a series of processes. A RAM (Random Access Memory) 906 temporarily stores programs and data used by the CPU 902 when processing is executed.

CPU902、ROM904、及びRAM906は、バス910を介して相互に接続される。バス910にはさらに、入出力インタフェース912が接続される。   The CPU 902, ROM 904, and RAM 906 are connected to each other via a bus 910. An input / output interface 912 is further connected to the bus 910.

入出力インタフェース912は、CPU902、ROM904、及びRAM906と、入力装置920、出力装置922、記憶装置924、通信装置926、及びドライブ930とを接続するためのインタフェースである。   The input / output interface 912 is an interface for connecting the CPU 902, ROM 904, and RAM 906 to the input device 920, output device 922, storage device 924, communication device 926, and drive 930.

入力装置920は、例えばマウス、キーボード又はタッチパネルなどの入力手段を介して、ユーザからの指示や情報入力を受け付ける。出力装置922は、例えばCRT(Cathode Ray Tube)、液晶ディスプレイ、OLED(Organic Light Emitting Diode)などの表示装置、又はスピーカなどの音声出力装置を介してユーザに情報を出力する。   The input device 920 receives an instruction and information input from the user via an input unit such as a mouse, a keyboard, or a touch panel. The output device 922 outputs information to the user via a display device such as a CRT (Cathode Ray Tube), a liquid crystal display, an OLED (Organic Light Emitting Diode), or an audio output device such as a speaker.

記憶装置924は、例えばハードディスク又はフラッシュメモリなどにより構成され、プログラムやプログラムデータなどを記憶する。通信装置926は、LAN又はインターネットなどのネットワークを介する通信処理を行う。ドライブ930は、必要に応じて汎用コンピュータに設けられ、例えばドライブ930にはリムーバブルメディア932が装着される。   The storage device 924 is configured by, for example, a hard disk or a flash memory, and stores programs, program data, and the like. The communication device 926 performs communication processing via a network such as a LAN or the Internet. The drive 930 is provided in a general-purpose computer as necessary. For example, a removable medium 932 is attached to the drive 930.

<6.まとめ>
ここまで、図1〜図19を用いて、本発明の一実施形態及びその変形例について説明した。本実施形態によれば、複数のコンテンツについて各コンテンツに付与される属性値を用いて、コンテンツの所定の属性への寄与の程度を表す重要度が、コンテンツの上記所定の属性以外の1つ以上の属性について算出される。その際、重要度は、上記所定の属性を決定属性とし、上記1つ以上の属性を条件属性とする決定表を用いて算出される。それにより、条件属性の様々な組合せについて重要度を柔軟に評価することが可能となる。
<6. Summary>
Up to this point, an embodiment of the present invention and its modifications have been described with reference to FIGS. According to the present embodiment, one or more importance levels other than the predetermined attribute of the content are represented by using the attribute value given to each content with respect to a plurality of contents, and representing the degree of contribution to the predetermined attribute of the content. Are calculated for the attributes. At this time, the importance is calculated using a decision table in which the predetermined attribute is a decision attribute and the one or more attributes are condition attributes. As a result, the importance can be flexibly evaluated for various combinations of condition attributes.

また、本実施形態によれば、重要度は、Rough集合理論に従い、上記決定表について決定属性の正領域を形成するコンテンツの数に基づいて算出される。一般的に、決定表の正領域の濃度は、条件属性の組合せの、決定属性の属性値に対する情報伝達性の指標として扱い得る。従って、本実施形態に係る手法により算出される重要度は、条件属性の組合せごとの情報伝達性に応じた有意な指標である。   Further, according to the present embodiment, the importance is calculated based on the number of contents forming the positive region of the decision attribute for the decision table according to the Rough set theory. In general, the density of the positive region of the decision table can be treated as an index of information transferability with respect to the attribute value of the decision attribute of the combination of condition attributes. Therefore, the importance calculated by the method according to the present embodiment is a significant index corresponding to information transmissibility for each combination of condition attributes.

また、本実施形態によれば、算出された重要度に応じて抽出される重要属性を用いて、コンテンツに関するユーザに呈示すべき情報、例えば推薦理由又はコンテンツリストのタイトルなどが生成される。それにより、相互に関連する属性の組合せが意味を持つ場合にも、その属性の組合せを的確に推薦理由又はコンテンツリストのタイトルなどに反映することができる。また、ユーザによるフィードバック又はユーザアクションの際の状況(即ち、コンテキスト)に応じて、適応的に推薦理由又はコンテンツリストのタイトルなどを変化させることができる。   Further, according to the present embodiment, information to be presented to the user regarding the content, for example, the reason for recommendation or the title of the content list, is generated using the important attribute extracted according to the calculated importance. Thereby, even when a combination of mutually related attributes is meaningful, the combination of the attributes can be accurately reflected in a recommendation reason or a title of a content list. In addition, the reason for recommendation or the title of the content list can be adaptively changed in accordance with the situation (that is, context) at the time of user feedback or user action.

また、本実施形態によれば、PLSA又はLDAによる確率的分類法に従って、基本属性の属性値に基づいて拡張属性の属性値が算出される。そして、拡張属性の属性値を中間的に利用することにより、重要属性を段階的に抽出することができる。その結果、重要度の算出結果の精度が基本属性(例えばキーワードや人物名など)の表記揺れを原因として低下するリスクが排除され得る。また、基本属性間の同義語関係などの潜在的な関連性を適切に踏まえた上で、推薦理由等を生成することができる。   Further, according to the present embodiment, the attribute value of the extended attribute is calculated based on the attribute value of the basic attribute according to the probabilistic classification method by PLSA or LDA. And an important attribute can be extracted in steps by using the attribute value of an extended attribute in the middle. As a result, it is possible to eliminate the risk that the accuracy of the calculation result of the degree of importance is reduced due to the shake of the notation of the basic attribute (for example, keyword or person name). In addition, it is possible to generate a recommendation reason or the like after properly considering a potential relationship such as a synonym relationship between basic attributes.

なお、本明細書において説明した決定表を用いた重要度算出方法によれば、条件属性及び決定属性の設定に応じて、様々な種類の重要度を算出することができる。例えば、上述したスマイルセンサ又は生体センサにより取得されるユーザの状態を表すコンテキストデータを決定属性とすることで、ユーザの心理状態又は体調に応じて異なる重要度を算出することも可能である。   Note that according to the importance calculation method using the determination table described in this specification, various types of importance can be calculated according to the setting of the condition attribute and the determination attribute. For example, by using the context data representing the user's state acquired by the above-described smile sensor or biometric sensor as a determination attribute, it is possible to calculate a different degree of importance depending on the user's psychological state or physical condition.

以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。   The preferred embodiments of the present invention have been described in detail above with reference to the accompanying drawings, but the present invention is not limited to such examples. It is obvious that a person having ordinary knowledge in the technical field to which the present invention pertains can come up with various changes or modifications within the scope of the technical idea described in the claims. Of course, it is understood that these also belong to the technical scope of the present invention.

100,200 情報処理装置
110 記憶部
120 解析部
130 ユーザインタフェース制御部
140 推薦部
150,250 重要度算出部
160,260 抽出部
240 コンテンツリスト生成部
100, 200 Information processing device 110 Storage unit 120 Analysis unit 130 User interface control unit 140 Recommendation unit 150, 250 Importance calculation unit 160, 260 Extraction unit 240 Content list generation unit

Claims (16)

複数のコンテンツについて、各コンテンツに付与される属性値を記憶する属性テーブルを保持する記憶部と;
前記属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する他の1つ以上の属性の重要度を算出する重要度算出部と;
を備え、
前記重要度算出部は、前記重要度を、前記所定の属性を決定属性とし、前記1つ以上の属性を条件属性とする決定表を用いて算出する、
情報処理装置。
A storage unit that holds an attribute table that stores attribute values assigned to each content for a plurality of contents;
An importance calculation unit that calculates the importance of one or more other attributes with respect to a predetermined attribute of the content using the attribute value stored in the attribute table;
With
The importance calculating unit calculates the importance using a determination table in which the predetermined attribute is a determination attribute and the one or more attributes are condition attributes;
Information processing device.
前記重要度算出部は、前記重要度を、前記決定表について前記決定属性の正領域を形成するコンテンツの数に基づいて算出する、請求項1に記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the importance calculation unit calculates the importance based on a number of contents forming a positive region of the determination attribute for the determination table. 前記情報処理装置は、
前記重要度算出部により算出される前記重要度に応じて、コンテンツに関するユーザに呈示すべき情報を生成するために使用される1つ以上の重要属性を抽出する抽出部、
をさらに備える、請求項2に記載の情報処理装置。
The information processing apparatus includes:
An extraction unit that extracts one or more important attributes used to generate information about the content to be presented to the user according to the importance calculated by the importance calculation unit;
The information processing apparatus according to claim 2, further comprising:
前記情報処理装置は、
前記属性テーブルに記憶されている属性値を用いてユーザに推薦すべきコンテンツを選択する推薦部であって、前記抽出部により抽出される前記1つ以上の重要属性に基づいて推薦の理由を生成する推薦部、
をさらに備える、請求項3に記載の情報処理装置。
The information processing apparatus includes:
A recommendation unit that selects content to be recommended to a user using an attribute value stored in the attribute table, and generates a reason for recommendation based on the one or more important attributes extracted by the extraction unit Recommendation section,
The information processing apparatus according to claim 3, further comprising:
前記推薦部は、コンテンツの選択のために算出したコンテンツごとのスコアを前記属性テーブルにさらに記憶させ、
前記抽出部は、前記スコアを決定属性として前記重要度算出部により算出される前記重要度に応じて、前記1つ以上の重要属性を抽出する、
請求項4に記載の情報処理装置。
The recommendation unit further stores a score for each content calculated for content selection in the attribute table,
The extraction unit extracts the one or more important attributes according to the importance calculated by the importance calculation unit using the score as a determination attribute.
The information processing apparatus according to claim 4.
前記属性テーブルは、各コンテンツに対するユーザのフィードバックに基づいて付与されるフィードバック属性の属性値をさらに記憶し、
前記推薦部は、前記フィードバック属性の属性値を用いて、ユーザに推薦すべきコンテンツを選択し、
前記抽出部は、前記フィードバック属性を決定属性として前記重要度算出部により算出される前記重要度に応じて、前記1つ以上の重要属性を抽出する、
請求項4に記載の情報処理装置。
The attribute table further stores attribute values of feedback attributes given based on user feedback for each content,
The recommendation unit selects content to be recommended to the user using the attribute value of the feedback attribute,
The extraction unit extracts the one or more important attributes according to the importance calculated by the importance calculation unit using the feedback attribute as a determination attribute;
The information processing apparatus according to claim 4.
前記属性テーブルは、各コンテンツに対するユーザアクションの状況に基づいて付与されるコンテキスト属性の属性値をさらに記憶し、
前記推薦部は、前記コンテキスト属性の属性値を用いて、ユーザに推薦すべきコンテンツを選択し、
前記抽出部は、前記コンテキスト属性を決定属性として前記重要度算出部により算出される前記重要度に応じて、前記1つ以上の重要属性を抽出する、
請求項4に記載の情報処理装置。
The attribute table further stores an attribute value of a context attribute that is given based on a user action status for each content,
The recommendation unit selects content to be recommended to the user using the attribute value of the context attribute,
The extraction unit extracts the one or more important attributes according to the importance calculated by the importance calculation unit using the context attribute as a determination attribute;
The information processing apparatus according to claim 4.
前記属性テーブルは、各コンテンツに付与される基本属性の属性値に加えて、当該基本属性の属性値を解析することにより得られる拡張属性の属性値を記憶する、請求項3に記載の情報処理装置。   The information processing according to claim 3, wherein the attribute table stores attribute values of extended attributes obtained by analyzing attribute values of the basic attributes in addition to attribute values of the basic attributes assigned to each content. apparatus. 前記抽出部は、前記所定の属性を決定属性とし、前記拡張属性に含まれる1つ以上の属性を条件属性として前記重要度算出部により算出される第1の重要度と、前記拡張属性に含まれる属性を決定属性とし、前記基本属性に含まれる1つ以上の属性を条件属性として前記重要度算出部により算出される第2の重要度とに応じて、前記1つ以上の重要属性を抽出する、請求項8に記載の情報処理装置。   The extraction unit includes the first attribute calculated by the importance calculation unit using the predetermined attribute as a determination attribute and one or more attributes included in the extended attribute as a condition attribute, and the extended attribute. The one or more important attributes are extracted according to the second importance calculated by the importance calculation unit using the attribute to be determined as the determination attribute and one or more attributes included in the basic attribute as the condition attributes The information processing apparatus according to claim 8. 前記情報処理装置は、
PLSA(Probabilistic Latent Semantic Analysis)又はLDA(Latent Dirichlet Allocation)による確率的分類法に従って、前記基本属性の属性値に基づいて前記拡張属性の属性値を算出する解析部、
をさらに備える、請求項9に記載の情報処理装置。
The information processing apparatus includes:
In accordance with a probabilistic classification method based on PLSA (Probabilistic Latent Semantic Analysis) or LDA (Latent Dirichlet Allocation), an analysis unit that calculates the attribute value of the extended attribute based on the attribute value of the basic attribute;
The information processing apparatus according to claim 9, further comprising:
前記情報処理装置は、
前記属性テーブルに記憶されている属性値を用いて再生すべきコンテンツのリストを生成するコンテンツリスト生成部であって、前記抽出部により抽出される前記1つ以上の重要属性に基づいてコンテンツリストのタイトルを生成するコンテンツリスト生成部、
をさらに備え、
前記抽出部は、前記コンテンツリスト生成部による前記コンテンツリストの生成のために使用された属性を決定属性として前記重要度算出部により算出される前記重要度に応じて、前記1つ以上の重要属性を抽出する、
請求項3に記載の情報処理装置。
The information processing apparatus includes:
A content list generation unit that generates a list of contents to be played back using attribute values stored in the attribute table, wherein the content list is generated based on the one or more important attributes extracted by the extraction unit. A content list generator for generating titles;
Further comprising
The extraction unit includes the one or more important attributes according to the importance calculated by the importance calculation unit using the attribute used for generating the content list by the content list generation unit as a determination attribute. Extract,
The information processing apparatus according to claim 3.
前記情報処理装置は、
ユーザの指定に応じて再生すべきコンテンツのリストを生成するコンテンツリスト生成部であって、前記抽出部により抽出される前記1つ以上の重要属性に基づいてコンテンツリストのタイトルを生成するコンテンツリスト生成部、
をさらに備え、
前記抽出部は、ユーザによる指定の有無に応じて属性値が決定される属性を決定属性として前記重要度算出部により算出される前記重要度に応じて、前記1つ以上の重要属性を抽出する、
請求項3に記載の情報処理装置。
The information processing apparatus includes:
A content list generation unit that generates a list of contents to be played according to a user's specification, wherein the content list generation unit generates a title of the content list based on the one or more important attributes extracted by the extraction unit Part,
Further comprising
The extraction unit extracts the one or more important attributes according to the importance calculated by the importance calculation unit using an attribute whose attribute value is determined according to whether or not specified by the user as a determination attribute. ,
The information processing apparatus according to claim 3.
前記記憶部は、各コンテンツに対するユーザアクションの履歴を表す履歴データ、をさらに保持し、
前記重要度算出部は、前記履歴データに含まれるコンテンツについての属性値を用いて、ユーザごとに前記1つ以上の属性についての前記重要度を算出する、
請求項1に記載の情報処理装置。
The storage unit further holds history data representing a history of user actions for each content,
The importance level calculation unit calculates the importance level for the one or more attributes for each user using an attribute value for content included in the history data.
The information processing apparatus according to claim 1.
前記重要度算出部は、Rough集合理論に従って前記決定表における決定属性の正領域を導出する、請求項1〜13のいずれか1項に記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the importance calculation unit derives a positive region of a decision attribute in the decision table according to a Rough set theory. 複数のコンテンツについて、各コンテンツに付与される属性値を記憶する属性テーブルを記憶媒体を用いて保持している情報処理装置において、
前記属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する他の1つ以上の属性の重要度を算出するステップ、
を含む重要度算出方法であって、
前記重要度は、前記所定の属性を決定属性とし、前記1つ以上の属性を条件属性とする決定表を用いて算出される、
重要度算出方法。
In an information processing apparatus that uses a storage medium to store an attribute table that stores attribute values assigned to each content for a plurality of contents,
Calculating the importance of one or more other attributes with respect to a predetermined attribute of the content using the attribute values stored in the attribute table;
An importance calculation method including
The importance is calculated using a determination table in which the predetermined attribute is a determination attribute and the one or more attributes are condition attributes.
Importance calculation method.
複数のコンテンツについて、各コンテンツに付与される属性値を記憶する属性テーブルを記憶媒体を用いて保持している情報処理装置を制御するコンピュータを、
前記属性テーブルに記憶されている属性値を用いて、コンテンツの所定の属性に対する他の1つ以上の属性の重要度を算出する重要度算出部、
として機能させるためのプログラムであって、
前記重要度算出部は、前記重要度を、前記所定の属性を決定属性とし、前記1つ以上の属性を条件属性とする決定表を用いて算出する、
プログラム。
For a plurality of contents, a computer that controls an information processing apparatus that holds an attribute table that stores attribute values assigned to each content using a storage medium,
An importance calculation unit that calculates the importance of one or more other attributes with respect to a predetermined attribute of the content using the attribute value stored in the attribute table;
Is a program for functioning as
The importance calculating unit calculates the importance using a determination table in which the predetermined attribute is a determination attribute and the one or more attributes are condition attributes;
program.
JP2010037469A 2010-02-23 2010-02-23 Information processing apparatus, importance level calculation method, and program Withdrawn JP2011175362A (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010037469A JP2011175362A (en) 2010-02-23 2010-02-23 Information processing apparatus, importance level calculation method, and program
CN2011100403831A CN102163211A (en) 2010-02-23 2011-02-16 Information processing device, importance calculation method, and program
US13/029,775 US8234311B2 (en) 2010-02-23 2011-02-17 Information processing device, importance calculation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010037469A JP2011175362A (en) 2010-02-23 2010-02-23 Information processing apparatus, importance level calculation method, and program

Publications (1)

Publication Number Publication Date
JP2011175362A true JP2011175362A (en) 2011-09-08

Family

ID=44464439

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010037469A Withdrawn JP2011175362A (en) 2010-02-23 2010-02-23 Information processing apparatus, importance level calculation method, and program

Country Status (3)

Country Link
US (1) US8234311B2 (en)
JP (1) JP2011175362A (en)
CN (1) CN102163211A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013080599A1 (en) * 2011-11-30 2013-06-06 楽天株式会社 Information processing device, information processing method, information processing program, and recording medium
JP2013120473A (en) * 2011-12-07 2013-06-17 Nikon Corp Electronic device, information processing method, and program
JP2013196505A (en) * 2012-03-21 2013-09-30 Fuji Xerox Co Ltd Information processing apparatus, information processing system and program
JP2014510972A (en) * 2011-03-10 2014-05-01 アリババ・グループ・ホールディング・リミテッド Determining preference categories based on user access attribute values
JP2015509626A (en) * 2012-02-22 2015-03-30 ノキア コーポレイション Access to predictive services
JP2015513736A (en) * 2012-02-21 2015-05-14 ウーヤラ インコーポレイテッド Automatic content recommendation
US10552434B2 (en) 2014-06-30 2020-02-04 Sony Corporation Information processing device, control method, and program
WO2020208894A1 (en) * 2019-04-12 2020-10-15 ソニー株式会社 Information processing device and information processing method

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9218177B2 (en) * 2011-03-25 2015-12-22 Microsoft Technology Licensing, Llc Techniques to optimize upgrade tasks
KR101851241B1 (en) * 2011-12-06 2018-04-24 삼성전자 주식회사 Method and apparatus for contents management-integrated in portable terminal
KR20140038577A (en) * 2012-09-11 2014-03-31 한국과학기술연구원 Recommendation for multimedia contents by using metadata
CN108415984B (en) 2013-02-25 2021-10-29 P·孙雄 Link association analysis system and method
CN104216885B (en) * 2013-05-29 2022-07-26 上海连尚网络科技有限公司 Recommendation system and method for automatically combining static and dynamic recommendation reasons
CN104252660B (en) * 2013-12-04 2018-03-20 深圳市华傲数据技术有限公司 A kind of property set recommends method and apparatus
CN105279204B (en) * 2014-07-25 2019-04-09 阿里巴巴集团控股有限公司 Information-pushing method and device
US20160179803A1 (en) * 2014-12-22 2016-06-23 Rovi Guides, Inc. Augmenting metadata using commonly available visual elements associated with media content
CN105677817B (en) * 2015-12-31 2019-07-19 华南师范大学 Personalized recommendation method and system based on positive and negative attribute knowledge base
CN107797982B (en) * 2016-08-31 2021-05-07 百度在线网络技术(北京)有限公司 Method, device and equipment for recognizing text type
US11086936B2 (en) * 2016-12-30 2021-08-10 Spotify Ab Media content item recommendation system
US10789302B2 (en) * 2017-01-14 2020-09-29 Innoplexus Ag Method and system for extracting user-specific content
CN107220865A (en) * 2017-04-11 2017-09-29 北京小度信息科技有限公司 Object recommendation method and device
US10838950B2 (en) * 2017-04-29 2020-11-17 Cisco Technology, Inc. Dynamic review cadence for intellectual capital
CN107463707A (en) * 2017-08-18 2017-12-12 北京语言大学 A kind of constant local attribute's yojan definition of decision table lower aprons and method
CN107623863B (en) * 2017-09-21 2020-11-06 广州华多网络科技有限公司 Algorithm testing method and device and server
CN111937000B (en) * 2018-07-23 2024-07-02 谷歌有限责任公司 Intelligent document notification based on user comments
WO2022060930A1 (en) * 2020-09-16 2022-03-24 Google Llc Digital video analysis
CN113457152B (en) * 2021-07-22 2023-11-03 腾讯科技(深圳)有限公司 Game array generating method, device, equipment and storage medium

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5734890A (en) * 1994-09-12 1998-03-31 Gartner Group System and method for analyzing procurement decisions and customer satisfaction
JP3884520B2 (en) 1996-04-01 2007-02-21 富士通株式会社 Non-related attribute removing apparatus and storage medium storing program associated with removing unrelated attribute
US7698161B2 (en) * 2001-01-04 2010-04-13 True Choice Solutions, Inc. System to quantify consumer preferences
US7412202B2 (en) * 2001-04-03 2008-08-12 Koninklijke Philips Electronics N.V. Method and apparatus for generating recommendations based on user preferences and environmental characteristics
US20030106058A1 (en) * 2001-11-30 2003-06-05 Koninklijke Philips Electronics N.V. Media recommender which presents the user with rationale for the recommendation
JP2007323315A (en) 2006-05-31 2007-12-13 Nippon Telegr & Teleph Corp <Ntt> Cooperative filtering method, cooperative filtering device, cooperative filtering program and recording medium with the same program recorded thereon
JP4501948B2 (en) 2007-03-05 2010-07-14 ソニー株式会社 Information processing apparatus, information processing method, recording medium, and program
US20090163183A1 (en) * 2007-10-04 2009-06-25 O'donoghue Hugh Recommendation generation systems, apparatus and methods
CN101551825A (en) * 2009-05-15 2009-10-07 中国科学技术大学 Personalized film recommendation system and method based on attribute description
US20110252031A1 (en) * 2009-12-31 2011-10-13 Michael Blumenthal Method, Device, and System for Analyzing and Ranking Products

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014510972A (en) * 2011-03-10 2014-05-01 アリババ・グループ・ホールディング・リミテッド Determining preference categories based on user access attribute values
WO2013080599A1 (en) * 2011-11-30 2013-06-06 楽天株式会社 Information processing device, information processing method, information processing program, and recording medium
JP2013114568A (en) * 2011-11-30 2013-06-10 Rakuten Inc Information processing device, information processing method, information processing program, and recording medium
TWI407379B (en) * 2011-11-30 2013-09-01 Rakuten Inc Information processing apparatus, information processing method, information processing program product and recording medium
JP2013120473A (en) * 2011-12-07 2013-06-17 Nikon Corp Electronic device, information processing method, and program
JP2015513736A (en) * 2012-02-21 2015-05-14 ウーヤラ インコーポレイテッド Automatic content recommendation
JP2015509626A (en) * 2012-02-22 2015-03-30 ノキア コーポレイション Access to predictive services
US10324916B2 (en) 2012-02-22 2019-06-18 Nokia Technologies Oy Predictive service access
JP2013196505A (en) * 2012-03-21 2013-09-30 Fuji Xerox Co Ltd Information processing apparatus, information processing system and program
US8989714B2 (en) 2012-03-21 2015-03-24 Fuji Xerox Co., Ltd. Information processing apparatus, information processing system, non-transitory computer readable medium that stores a program, and information processing method
US10552434B2 (en) 2014-06-30 2020-02-04 Sony Corporation Information processing device, control method, and program
WO2020208894A1 (en) * 2019-04-12 2020-10-15 ソニー株式会社 Information processing device and information processing method

Also Published As

Publication number Publication date
US8234311B2 (en) 2012-07-31
CN102163211A (en) 2011-08-24
US20110208750A1 (en) 2011-08-25

Similar Documents

Publication Publication Date Title
JP2011175362A (en) Information processing apparatus, importance level calculation method, and program
US20220035827A1 (en) Tag selection and recommendation to a user of a content hosting service
US8200667B2 (en) Method and apparatus for constructing user profile using content tag, and method for content recommendation using the constructed user profile
US20090006368A1 (en) Automatic Video Recommendation
JP5224868B2 (en) Information recommendation device and information recommendation method
US20090177651A1 (en) Information processing device and method, program, and recording medium
De Pessemier et al. Context aware recommendations for user-generated content on a social network site
Qumsiyeh et al. Predicting the ratings of multimedia items for making personalized recommendations
JP2006251866A (en) Information processor and information processing method, program, and recording medium
JP2007058842A (en) Information processor, feature extraction method, recording medium, and program
JP5318034B2 (en) Information providing apparatus, information providing method, and information providing program
Kang et al. Learning to rank related entities in web search
Hopfgartner et al. Semantic user profiling techniques for personalised multimedia recommendation
JPH11282875A (en) Information filtering device
JP4879775B2 (en) Dictionary creation method
US20160188595A1 (en) Semantic Network Establishing System and Establishing Method Thereof
Xu et al. Do adjective features from user reviews address sparsity and transparency in recommender systems?
Bogers Recommender systems for social bookmarking
Garg et al. Implementing and Analyzing Behaviour of ML based Tamil Songs Recommendation System
US20140095465A1 (en) Method and apparatus for determining rank of web pages based upon past content portion selections
US20140149378A1 (en) Method and apparatus for determining rank of web pages based upon past content portion selections
KR101563625B1 (en) Ontology based image contents recommendation system using relations of metadata and method for the same
Vrochidis et al. Utilizing implicit user feedback to improve interactive video retrieval
Hölbling et al. Content-based tag generation to enable a tag-based collaborative tv-recommendation system.
JP5131565B2 (en) Information processing apparatus and method, program, and recording medium

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20130507