[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6101477B2 - コンテンツ推薦装置、及びプログラム - Google Patents

コンテンツ推薦装置、及びプログラム Download PDF

Info

Publication number
JP6101477B2
JP6101477B2 JP2012269663A JP2012269663A JP6101477B2 JP 6101477 B2 JP6101477 B2 JP 6101477B2 JP 2012269663 A JP2012269663 A JP 2012269663A JP 2012269663 A JP2012269663 A JP 2012269663A JP 6101477 B2 JP6101477 B2 JP 6101477B2
Authority
JP
Japan
Prior art keywords
content
negative
evaluation value
positive
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012269663A
Other languages
English (en)
Other versions
JP2014115839A (ja
Inventor
松井 淳
淳 松井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2012269663A priority Critical patent/JP6101477B2/ja
Publication of JP2014115839A publication Critical patent/JP2014115839A/ja
Application granted granted Critical
Publication of JP6101477B2 publication Critical patent/JP6101477B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、コンテンツ推薦装置、及びプログラムに関する。
従来より、ある人物の興味に合致するテレビ番組や、ある人物が購入する可能性が高い商品を特定するための情報(目的評価値)を、本人、及び不特定多数の人物から収集した、別のコンテンツ集合に対する評価値のデータセット(参照評価値)を元に算出する技術がある。
不特定多数の人物について収集したコンテンツ集合に対する評価値のデータから、対象とする人物の評価値を予測する技術としては、不特定多数の人物について収集した評価値を参照し、嗜好が類似する人物のデータを参照、及び統合して、目的評価値を予測する手法(協調フィルタリング)が広く知られおり、実用化が進んでいる。しかしながら、与えられる参照評価値のデータに欠損値が多く含まれる場合、すなわち、参照評価値のテーブルが疎である場合には、目的評価値を予測可能なコンテンツが限定されるため、実用上、大きな問題となる。この問題は、一般的には「希薄問題」と呼ばれる。
希薄問題に対処可能な従来技術としては、例えば、グラフマイニングを用いた関連コンテンツの探索法がある(例えば非特許文献1参照)。この手法は、ユーザ参加型の音楽推薦サービスが収集したデータに基づいて、ある特定のユーザの嗜好に合致する楽曲を予測する技術として考案された手法である。この手法では、同サービスが提供する、各々のユーザの楽曲に対する評価値、ならびに、各楽曲についてのタグ情報(ジャンル)などを1つのグラフの形式に記述し、ユーザと楽曲との推移関係を、グラフマイニング法の一手法であるRWR法(Random Walk with Restart)を用いて推定することによって、目的のユーザの嗜好に合致したコンテンツを予測する。
Ioannis Konstasほか,"On Social Networks and Collaborative Recommendation," Proc. 32nd ACM SIGIR 2009, pp. 195 -- 202, 2009年
上述した従来技術によるRWR法は、解析対象のグラフのエッジに評価値を「重み」として記述する方法を採用する。このため、評価値が正の値と負の値の両方の値を取りうる場合には、どちらか一方の値(例えば、負の評価値)を無視して、残りの一方の評価値(例えば、正の評価値)のみしか利用していない。そのため従来技術によるRWR法では、目的評価値を高精度で予測できないので、目的のユーザの嗜好に合致したコンテンツを高精度に推定することができなかった。その結果、ユーザに嗜好に合致したコンテンツの推薦が得られない場合があり、ユーザの利便性が低いという問題があった。
本発明の一態様は、このような事情を考慮してなされたものであり、その目的は、コンテンツ推薦時におけるユーザの利便性を向上させることができるコンテンツ推薦装置、及びプログラムを提供することにある。
上述した課題を解決するために、本発明の一態様は、複数のコンテンツそれぞれに対する各ユーザの正の評価値を用いて、前記複数のコンテンツのうち、目的ユーザが評価していないコンテンツに対する正の評価値の予測確率値であるポジティブスコアを算出するポジティブスコア算出部と、前記複数のコンテンツそれぞれに対する各ユーザの負の評価値を用いて、前記複数のコンテンツのうち、前記目的ユーザが評価していないコンテンツに対する負の評価値の予測確率値であるネガティブスコアを算出するネガティブスコア算出部と、前記ポジティブスコア算出部が算出したポジティブスコアと前記ネガティブスコア算出部が算出したネガティブスコアとに基づいて、前記目的ユーザに推薦するコンテンツを決定する推薦コンテンツ決定部と、を備えることを特徴とするコンテンツ推薦装置である。
本発明の一態様は、上記のコンテンツ推薦装置において、前記推薦コンテンツ決定部は、前記ポジティブスコアと前記ネガティブスコアとに基づいて、前記目的ユーザが評価していない未評価コンテンツの評価値間の大小関係を推定し、該推定した大小関係に基づいて、前記目的ユーザに推薦するコンテンツを決定する。
本発明の一態様は、上記のコンテンツ推薦装置において、前記ポジティブスコア算出部は、前記各ユーザ間の嗜好の類似度と前記各ユーザの各コンテンツに対する正の評価値と前記コンテンツ間の類似度とを参照して、前記ポジティブスコアを算出し、前記ネガティブスコア算出部は、前記各ユーザ間の嗜好の類似度と前記各ユーザの各コンテンツに対する負の評価値と前記コンテンツ間の類似度とを参照して、前記ネガティブスコアを算出することを特徴とする。
本発明の一態様は、上記のコンテンツ推薦装置において、前記複数のコンテンツの各々に対する各ユーザの評価を示す評価値を、前記正の評価値の集合と前記負の評価値の集合に分割する分割部と、各コンテンツ、及び各ユーザをノードとし、前記正の評価値の集合を各ノードを接続するエッジ重みとして記述したポジティブグラフと、各コンテンツ、及び各ユーザをノードとし、前記負の評価値の集合を、各ノードを接続するエッジ重みとして記述したネガティブグラフとを作成する作成部とを更に備え、前記ポジティブスコア算出部は、前記ポジティブグラフに基づいて、前記ポジティブスコアを算出し、前記ネガティブスコア算出部は、前記ネガティブグラフに基づいて、前記ネガティブスコアを算出することを特徴とする。
また、上述した課題を解決するために、本発明の一態様は、コンピュータに、複数のコンテンツそれぞれに対する各ユーザの正の評価値を用いて、前記複数のコンテンツのうち、目的ユーザが評価していないコンテンツに対する正の評価値の予測確率値であるポジティブスコアを算出するポジティブスコア算出ステップと、前記複数のコンテンツそれぞれに対する各ユーザの負の評価値を用いて、前記複数のコンテンツのうち、前記目的ユーザが評価していないコンテンツに対する負の評価値の予測確率値であるネガティブスコアを算出するネガティブスコア算出ステップと、前記ポジティブスコア算出ステップで算出されたポジティブスコアと前記ネガティブスコア算出ステップで算出されたネガティブスコアとに基づいて、前記目的ユーザに推薦するコンテンツを決定する推薦コンテンツ決定ステップと、を実行させるためのプログラムである。
この発明によれば、コンテンツ推薦時におけるユーザの利便性を向上させることができる。
本発明の一実施形態によるコンテンツ推薦装置の構成を示すブロック図である。 本実施形態によるコンテンツ推薦装置の動作を説明するためのフローチャートである。 本実施形態によるコンテンツ推薦装置の動作を説明するためのフローチャートである。 本実施形態による基礎評価値UIbaseの一例を示す概念図である。 本実施形態による目的ユーザ評価値uitargetの一例を示す概念図である。 本実施形態による参照評価値UIrefの一例を示す概念図である。 本実施形態によるポジティブ・グラフGposの一例を示す概念図である。 本実施形態によるネガティブ・グラフGnegの一例を示す概念図である。 本実施形態による隣接行列Aposの一例を示す概念図である。 本実施形態による隣接行列Anegの一例を示す概念図である。 本実施形態による部分行列IIの一例を示す概念図である。 本実施形態による初期ベクトルp(0)の一例を示す概念図である。 本実施形態による最終的に得られた更新結果pposの一例(α=0.7,ε=10−10の場合)を示す概念図である。 本実施形態による最終的に得られた更新結果pnegの一例(α=0.7,ε=10−10の場合)を示す概念図である。 本実施形態によるポジティブ・スコアsposの一例を示す概念図である。 本実施形態によるネガティブ・スコアsnegの一例を示す概念図である。 本実施形態による統合スコアstotal(wpos=wneg=1.0の場合)の一例を示す概念図である。 本実施形態による推薦コンテンツリストの一例(閾値θ=1の場合)を示す概念図である。 推薦番組の上位1番目についての予測精度を、本実施形態による処理結果と従来のRWR法を用いた処理結果とで比較したグラフである。 推薦番組の上位5番目についての予測精度を、本実施形態による処理結果と従来のRWR法を用いた処理結果とで比較したグラフである。 推薦番組の上位10番目についての予測精度を、本実施形態による処理結果と従来のRWR法を用いた処理結果とで比較したグラフである。 推薦番組の上位20番目についての予測精度を、本実施形態による処理結果と従来のRWR法を用いた処理結果とで比較したグラフである。
以下、本発明の一実施形態を、図面を参照して説明する。まず、本実施形態の概要について説明する。本実施形態におけるコンテンツ推薦装置1は、ある同一のコンテンツ集合に対する不特定人物それぞれの評価値のデータ集合、並びに、先のコンテンツ集合に含まれる一部のコンテンツに対する特定の人物の評価値のデータ集合のセット(以後、「参照評価値」と呼ぶ)が与えられた条件の下で、先のコンテンツ集合のうち、特定人物の評価がまだ与えられていないコンテンツに対する評価値(以後、「目的評価値」と呼ぶ)を予測する。
本実施形態におけるコンテンツ推薦装置1は、参照評価値が正の評価(例えば買いたい商品、または、見たい番組である度合い)と負の評価(例えば買いたくない商品、または、見たくない番組)との相反する2つの方向に沿った尺度が得られる場合において、それぞれの方向についての評価を統合的に評価し、解析する。それによって、コンテンツ推薦装置1は、高精度に目的評価値を推定することができる。特に、コンテンツ推薦装置1は、目的評価値の算出根拠である参照評価値に未評価のデータ、すなわち欠損値が多く存在する条件(以後、「疎な条件」と呼ぶ)であっても頑健な予測が可能である。
本実施形態におけるコンテンツ推薦装置1は、同一、かつ大量なコンテンツ集合に対する不特定多数の人物の評価値を網羅的に調査することが難しい状況において、各々のコンテンツに対する評価値を、好意的な反応(以後、「正の評価」と呼ぶ)、並びに反好意的な反応(以後、「負の評価」と呼ぶ)を調査し、解析する。それによって、コンテンツ推薦装置1は、より高い精度で目的評価値を予測することができる。
ここで、例えば、放送番組を解析対象のコンテンツと仮定した場合、ある特定の人物が見たい番組を予測するために、日本国内の地上波で放送している放送番組全てについての全世帯の評価値を網羅的に調査することは現実的ではない。多くの場合、統計的に優位な回答数が得られるだけの数の協力者について調査した一部の放送番組に対する評価値を、基礎データ(すなわち、参照評価値)とする場合がほとんどである。
解析対象のコンテンツの総数、あるいは、調査対象の人物の総数が比較的少数である場合には、用意した全てのコンテンツに対する評価値(参照評価値)を網羅的に調査することは可能である。しかしながら、どちらか一方の数が千以上の大規模な調査となった場合、全ての調査対象のコンテンツに対する評価値を正確に回収することは非常に困難であり、ある確率で未評価のデータ、すなわち、欠損値が含まれることを考慮する必要がある。
従来、与えられる参照評価値に多くの欠損値が含まれる状況であっても高精度に目的評価値を予測可能な手法として、RWR法が知られている。しかしながら、RWR手法は、各コンテンツに対する評価値を、グラフの「重さ」として記述して解析する。このため、各々のコンテンツに対する好意的な評価(正の評価)は記述可能であるが、それと併せて反好意的な評価(負の評価)を同時に記述することが原理的に不可能であり、両者の情報を統合して解析するためには、別途新たな工夫が必要である。
それに対して本実施形態におけるコンテンツ推薦装置1は、参照評価値が正の評価、並びに負の評価の2つの方向が与えられるとき、両者の評価値をそれぞれ別のグラフに記述する。そして、コンテンツ推薦装置1は、各々のグラフを独立に解析した後に、それら2つの解析結果を1つの確率分布に統合する。それによって、コンテンツ推薦装置1は、正負両方の参照評価値に基づいた高精度な目的評価値を予測することができる。
図1は、本発明の一実施形態によるコンテンツ推薦装置1の構成を示すブロック図である。図1において、コンテンツ推薦装置1は、基礎評価値記録部10、グラフ作成部20、目的評価値予測部30、及び推薦コンテンツ決定部40を備える。
基礎評価値記録部10は、基礎コンテンツリストと、参照ユーザIDと、参照ユーザ評価値とを記録する。上記基礎コンテンツリストは、解析対象であるコンテンツ全てを記載したリストである。上記参照ユーザIDは、基礎コンテンツリストに記載された各々のコンテンツに対する評価値を調査する不特定多数のユーザのそれぞれを識別する番号である。上記参照ユーザ評価値は、各々の参照ユーザについて調査した基礎コンテンツリストに記載された、それぞれのコンテンツに対する評価値である。
グラフ作成部20は、参照ユーザID別に記録された参照ユーザ評価値(以下、この参照ユーザ別の評価値のリストを基礎評価値と呼ぶ)を、基礎評価値記録部10から受け取るとともに、目的ユーザIDと目的ユーザ評価値とを入力とし、ポジティブ・グラフとネガティブ・グラフとを作成して出力する。上記目的ユーザIDは、推薦リストを提示する対象のユーザ(以後、目的ユーザと呼ぶ)を識別するための識別情報である。上記目的ユーザ評価値は、目的ユーザが先のコンテンツ集合の部分集合の各コンテンツに対して下した評価値のリストである。
より具体的には、グラフ作成部20は、分割部21と作成部22とを備えている。分割部21は、参照ユーザ評価値を正の評価値(参照評価値の正の成分)と負の評価値(参照評価値の負の成分)とに分離する。作成部22は、各コンテンツ、及び各ユーザをノードとし、各コンテンツに対する各々のユーザ(参照ユーザ、並びに目的ユーザ)の正の評価値(参照評価値の正の成分)を、各ノードを接続するエッジ重みとして記述したポジティブ・グラフと、各コンテンツに対する各々のユーザ(参照ユーザ、並びに目的ユーザ)の負の評価値(参照評価値の負の成分)をエッジ重みとして記述したネガティブ・グラフとを作成して出力する。
目的評価値予測部30は、ポジティブ・スコア算出部31(ポジティブスコア算出部)とネガティブ・スコア算出部(ネガティブスコア算出部)32とを備えている。ポジティブ・スコア算出部31は、グラフ作成部20から受け取ったポジティブ・グラフを、別途、入力として与えられるRWR実行パラメータ(具体的には、リスタート確率α、及び収束判定閾値ε)に記述された各種設定値に従って解析し、解析結果として、ポジティブ・スコアを算出して出力する。また、ネガティブ・スコア算出部32は、グラフ作成部20から受け取ったネガティブ・グラフを、別途、入力として与えられるRWR実行パラメータ(具体的には、リスタート確率α、及び収束判定閾値ε)に記述された各種設定値に従って解析し、解析結果としてネガティブ・スコアを算出して出力する。
ポジティブ・スコアは、目的ユーザの基礎コンテンツリストに記載されたコンテンツのうち、未評価のコンテンツに対する正の評価値の予測確率分布を近似したものである。また、ネガティブ・スコアは、同目的ユーザの未評価コンテンツに対する負の評価値の予測確率分布を近似したものである。
推薦コンテンツ決定部40は、推定部41と決定部42とを備えている。推定部41は、具体的なコンテンツ(番組など)を推薦する際に必要な各種設定値の集合体である推薦コンテンツ決定パラメータと、先に目的評価値予測部30で算出したポジティブ・スコア、並びにネガティブ・スコアとに基づいて、目的ユーザが未評価のコンテンツに対する評価値(すなわち、目的評価値)のコンテンツ毎の予測確率値(大小関係)を算出(推定)する。決定部42は、コンテンツ毎の予測確率値の大小に応じて降順に並べ替え、上位の確率値を与えるコンテンツのリスト、すなわち、推薦コンテンツリストを出力する。
次に、本実施形態の動作について説明する。
図2、及び図3は、本実施形態によるコンテンツ推薦装置1の動作を説明するためのフローチャートである。なお、基礎評価値記録部10は、一例として、内部にメモリを有するものとして説明する。
基礎評価値記録部10は、まず、基礎コンテンツリストを受け取り、内部のメモリに記録する(ステップS100)。次に、基礎評価値記録部10は、参照ユーザIDと、参照ユーザ評価値とを受け取り、内部のメモリに記録する(ステップS101)。そして、基礎評価値記録部10は、基礎コンテンツリストに記載された各コンテンツに対する参照ユーザごとに評価値を記録した基礎評価値(テーブル)UIbaseを、グラフ作成部20に送る(ステップS102)。
図4は、本実施形態による基礎評価値UIbaseの一例を示す概念図である。図4において、基礎評価値UIbaseには、各参照ユーザuser#1、user#2ごとに、基礎コンテンツリストに記載された各コンテンツcontents#1〜#4に対する評価値が記録されている。ここで、contents#1〜#4は、コンテンツを識別する情報であるコンテンツIDである。図示の例では、参照ユーザuser#1には、各コンテンツcontents#1〜#4に対して、評価値「0」、「+2」、「−1」、「0」が記録されている。また、参照ユーザuser#2には、各コンテンツcontents#1〜#4に対して、評価値「+2」、「−1」、「0」、「+1」が記録されている。
図2に戻り、次に、グラフ作成部20は、推薦の対象である目的ユーザを特定するための目的ユーザIDと、目的ユーザが既に評価した基礎コンテンツリスト中の各コンテンツについての評価値(目的ユーザ評価値)のリストuitargetを受け取る(ステップS103)。次に、グラフ作成部20は、基礎評価値記録部10から基礎評価値UIbaseを受け取る(ステップS104)。次に、グラフ作成部20は、基礎評価値(テーブル)UIbaseと目的ユーザ評価値uitargetのリストとを結合して参照評価値(テーブル)UIrefを作成する(ステップS105)。
図5は、本実施形態による目的ユーザ評価値uitargetの一例を示す概念図である。図5において、目的ユーザ評価値uitargetには、目的ユーザの基礎コンテンツリスト中の各コンテンツについて既に評価した評価値が記録されている。図示の例では、目的ユーザ#0について、各コンテンツcontents#1〜#4に対して、評価値「+1」、「NA」、「−2」、「NA」が記録されている。
図6は、本実施形態による参照評価値UIrefの一例を示す概念図である。図6において、参照評価値UIrefには、目的ユーザ#0、参照ユーザuser#1、user#2ごとに、基礎コンテンツリスト中の各コンテンツについての評価値が記録されている。すなわち、図4に示す基礎評価値UIbaseと、図5に示す目的ユーザ評価値uitargetとが結合されている。
次に、グラフ作成部20は、参照評価値UIrefを正の成分と負の成分とに分離し、各々をポジティブ・グラフGposと、ネガティブ・グラフGnegとする(ステップS106)。具体的には、グラフ作成部20は、作成した参照評価値UIrefの各要素を、正の成分(正の評価値)あるいは負の成分(負の評価値)のいずれか一方のみを抽出した2つのテーブルに分離し、各々の欠損値NAを0で埋める。
グラフ作成部20は、得られた2つのテーブルそれぞれについて、各ユーザと各コンテンツをノードとし、各々のユーザのノードと、当該ユーザが評価したコンテンツのノードとをエッジで結び、その評価値を当該エッジに重みとして割り当てる。但し、参照評価値UIrefの負の成分については、その評価値(負の値)の絶対値を当該エッジの重みとして付与するものとする。そして、グラフ作成部20は、参照評価値UIrefの正の成分、並びに負の成分、各々について得られたグラフを、それぞれ、ポジティブ・グラフGposと、ネガティブ・グラフGnegとして出力する。
図7は、本実施形態によるポジティブ・グラフGposの一例を示す概念図である。図7において、丸印が各ユーザと各コンテンツを示すノードであり、ノード間を結ぶエッジ(線分)の太さがその評価値に相当する。各エッジの数字は評価値である。
図8は、本実施形態によるネガティブ・グラフGnegの一例を示す概念図である。図8においても、図7と同様に、丸印が各ユーザと各コンテンツを示すノードであり、ノード間を結ぶエッジ(線分)の太さがその評価値に相当する。各エッジの数字は評価値である。
図2に戻り、次に、グラフ作成部20は、基礎コンテンツリストの中で、目的ユーザの評価が未評価(評価値がNA(欠損値)となっているコンテンツ)を、予測対象の目的コンテンツとして検出し、それらを指し示すコンテンツIDを目的コンテンツIDとして出力する(ステップS107)。
次に、目的評価値予測部30は、まず、グラフ作成部20からポジティブ・グラフGposとネガティブ・グラフGnegとを読み込む(ステップS108)。次に、目的評価値予測部30は、RWR実行パラメータの各要素、すわなち、リスタート確率α、収束判定閾値εを読み込む(ステップS109)。
次に、目的評価値予測部30は、ポジティブ・グラフGposから抽出した隣接行列Aposの各要素aijを、数式(2)の右辺に代入して行列Aを求め、ネガティブ・グラフGnegから抽出した隣接行列Anegの各要素aijを、数式(2)の右辺に代入して行列Aを求める(ステップS110、S111)。
具体的には、目的評価値予測部30は、ポジティブ・グラフGposとネガティブ・グラフGnegとのそれぞれについて、以下で説明する手順に従い、前者のグラフの各ノード間の接続関係から隣接行列Aposを、後者のグラフの接続関係から隣接行列Anegを、各々、抽出する。
図9は、本実施形態による隣接行列Aposの一例を示す概念図である。図9に示すように、隣接行列Aposは、ポジティブ・グラフGposから抽出した、各ユーザuser#0〜#2、各コンテンツcontents#1〜#4のそれぞれの間の評価値を要素とする行列である。
図10は、本実施形態による隣接行列Anegの一例を示す概念図である。図10に示すように、隣接行列Anegは、ネガティブ・グラフGnegから抽出した、各ユーザuser#0〜#2、各コンテンツcontents#1〜#4のそれぞれの間の評価値を要素とする行列である。
そして、それら2つの行列を、それぞれ数式(1)の行列Aの項に代入し、さらに、各々、数式(2)に従って正規化処理を実行して、2通りの正規化隣接行列Aを得る。
Figure 0006101477
Figure 0006101477
行列Aは、与えられたポジティブ・グラフGpos、または、ネガティブ・グラフGnegのノード間の接続関係、及び接続の強さ(すなわちエッジ重み)によって決定される隣接行列を表し、4つの部分行列UU、UI、IU、IIから構成される。
部分行列UUは、各ユーザ間の嗜好の類似関係を記述した行列であり、そのa行b列成分は、a番目のユーザの基礎コンテンツリスト内の各コンテンツに対する評価値を並べたベクトルvと、b番目のユーザの同コンテンツに対する評価値を並べたベクトルvとの間の相関係数である。但し、負の相関係数が得られたユーザの組については、該当する行列UUの値を0で置き換えるものとする。
部分行列UIは、各ユーザの各コンテンツに対する評価値の分布を表す行列であり、そのa行c列成分は、ベクトルvのc番目の要素(すなわち、a番目のユーザのc番目のコンテンツに対する評価値)である。また、部分行列IUは、UIの行と列を入れ替えた転置行列である。
部分行列IIは、コンテンツ間の類似度を記述した行列であり、そのc行d列成分は、c番目のコンテンツとd番目のコンテンツとの類似度である。コンテンツ間の類似度は、コンテンツの内容に基づいた類似の度合の大小関係を表現可能な指標でれば何でもよい。例えば、放送番組コンテンツについては、EPG(Electronic Program Guide)で配信される各々の番組の概要文に出現した名詞の集合の対について、共通して出現した名詞の数の割合を類似度として算出してもよい。
図11は、本実施形態による部分行列IIの一例を示す概念図である。図11において、部分行列IIには、コンテンツcontents#1〜#4ごとに、他のコンテンツとの類似度が記述されている。図示の例では、一致を「1」とし、類似しているほど「1」に近くなり、類似していないほど「1」より小さい値となる指標を用いている。
また、行列Aは、数式(2)に示したように、行列Aの要素を、各々の列についての要素の和が1となるように正規化した行列である。
次に、目的評価値予測部30は、ポジティブ・グラフGposとネガティブ・グラフGnegとのそれぞれについて、目的ユーザIDに対応するノードの値のみを1とし、その他の値を0とした初期ベクトルp(0)を設定し(ステップS111、S115)、隣接行列Apos、Anegを、それぞれ正規化した隣接行列A、及び初期ベクトルp(0)を用いて、数式(3)に従いベクトルp(t)を更新する(ステップS111、S115)。
図12は、本実施形態による初期ベクトルp(0)の一例を示す概念図である。図12に示すように、初期ベクトルp(0)は、上述したように、目的ユーザIDに対応するノードの値のみを1とし、その他の値を0とした行列である。
具体的には、ステップS110、S114で得られた2つの異なる行列Aについて、各々独立に数式(3)で定義される更新処理を各ノードの滞留確率を表すベクトルpに対して実行する。
Figure 0006101477
ここで、ベクトルp(t+1)は、目的ユーザからみた各ユーザへの近接度の期待値を表わす列ベクトルと、目的ユーザから見た各コンテンツへの近接度の期待値を表わす列ベクトルとを、縦に連結したベクトルpの、第t番目の更新ステップにおける値を表わす。その長さは、与えられたポジティブ・グラフGpos、あるいはネガティブ・グラフGnegに記載されたノードの総数(すなわち、本システムが取り扱うユーザの総数とコンテンツの総数との和)に一致する。
また、ベクトルの初期値p(0)は、目的ユーザに対応する要素の値のみを1に、それ以外の要素を全て0に設定したベクトル(共通の固定値)である。
次に、目的評価値予測部30は、更新結果が収束したか否か、すなわち、各ステップ単位でのベクトルp(t)の変化量(具体的には、p(t+1)とベクトルp(t)との差分の絶対値の合計値)が、収束判定閾値εを下回ったか否かを判定する(ステップS113、S117)。そして、更新結果が収束していない場合には(ステップS113のNO、S117のNO)、それぞれステップS112、S116に戻り、更新処理を繰り返し実行する。
一方、p(t)の変化量が収束判定閾値εを下回り、更新が終了した場合には(ステップS113のYES、S117のYES)、目的評価値予測部30は、ポジティブ・グラフGposから抽出した隣接行列Aposについて数式(1)〜数式(3)を実行し、最終的に得られた更新結果ppos、並びに、ネガティブ・グラフGnegから抽出した隣接行列Aposについて同様の処理を実行して最終的に得られた更新結果pnegのそれぞれついて、目的コンテンツIDに対応する成分をベクトル形式で抽出し、それぞれ、ポジティブ・スコアspos、及びネガティブ・スコアsnegとして出力する(ステップS118)。
図13は、本実施形態による最終的に目的評価値予測部30が算出した更新結果pposの一例(α=0.7,ε=10−10の場合)を示す概念図である。図13に示すように、最終的に得られた更新結果pposは、ユーザuser#0〜#2、コンテンツcontents#1〜#4に対応して、「0.772、0.065、0.072、0.072、0.011、0.001、0.008」となる要素を有する。
図14は、本実施形態による最終的に目的評価値予測部30が算出した更新結果pnegの一例(α=0.7,ε=10−10の場合)を示す概念図である。図14に示すように、最終的に得られた更新結果pnegは、ユーザuser#0〜#2、コンテンツcontents#1〜#4に対応して、「0.772、0.060、0.053、0.002、0.007、0.106、0.000」となる要素を有する。
図15は、本実施形態によるポジティブ・スコアsposの一例を示す概念図である。図15には、ポジティブ・スコアsposの一例として、目的コンテンツID(=#2、#4)に対応する成分からなる行列が示されている。ポジティブ・スコア算出部31は、例えば、図15に示されたポジティブ・スコアsposを算出し、算出したポジティブ・スコアsposを保持する。
図16は、本実施形態によるネガティブ・スコアsnegの一例を示す概念図である。図16には、ネガティブ・スコアsnegの一例として、目的コンテンツID(=#2、#4)に対応する成分からなる行列が示されている。ネガティブ・スコア算出部32は、例えば、図16に示されたネガティブ・スコアsnegを算出し、算出したネガティブ・スコアsnegを保持する。
次に、推薦コンテンツ決定部40は、目的評価値予測部30からポジティブ・スコアsposとネガティブ・スコアsnegとを読み込み(ステップS119)、推薦コンテンツ決定パラメータ(wpos,wneg,θ)を読み込む(ステップS120)。次に、推薦コンテンツ決定部40は、予測対象のコンテンツ(目的コンテンツ)に対する目的ユーザの正の評価値を近似したポジティブ・スコアsposと、同目的コンテンツに対する目的ユーザの負の評価値を近似したネガティブ・スコアsnegとの重み付き差分を用いて、次式(4)に従って、統合スコアstotalを算出する(ステップS121)。
Figure 0006101477
図17は、本実施形態による統合スコアstotal(wpos=wneg=1.0の場合)の一例を示す概念図である。図17には、統合スコアstotalの一例として、目的コンテンツID(=#2、#4)に対応する成分「0.004、0.008」からなる行列が示されている。推薦コンテンツ決定部40は、例えば図17に示された統合スコアstotalを算出する。
そして、推薦コンテンツ決定部40は、統合スコアstotalの値を降順に並べ替え、上位θ個に対応するコンテンツのIDとスコアとを、推薦コンテンツリストとして出力する(ステップS122)。
図18は、本実施形態による推薦コンテンツリストの一例(閾値θ=1の場合)を示す概念図である。図18には、推薦コンテンツリストの一例としては、[user#0. contents#4, 0.008]が示されている。これは、図17における統合スコアstotalを表す行列の成分のうち値が最も大きい成分である0.008と、それに対応する目的コンテンツID#4とが推薦コンテンツ決定部40によって推薦コンテンツリストとして抽出されたからである。
次に、上述した実施形態の従来技術に対する有効性について説明する。
図19乃至図22は、本実施形態による処理結果と従来のRWR法を用いた処理結果の比較を示すグラフである。図19は、推薦番組の上位1番目についての予測精度を、本実施形態による処理結果と従来のRWR法を用いた処理結果とで比較したグラフである。図20は、推薦番組の上位5番目についての予測精度を、本実施形態による処理結果と従来のRWR法を用いた処理結果とで比較したグラフである。図21は、推薦番組の上位10番目についての予測精度を、本実施形態による処理結果と従来のRWR法を用いた処理結果とで比較したグラフである。図22は、推薦番組の上位20番目についての予測精度を、本実施形態による処理結果と従来のRWR法を用いた処理結果とで比較したグラフである。
図19乃至図22のグラフを得るために、コンテンツとして用意した300番組に対する、ユーザ1228名の5段階評価(5:見たい、4:まあ見たい、3:どちらともいえない、2:あまり見たくない、1:見たくない)が用いられている。図19乃至図22において、グラフの横軸は、データの間引き率(%Pruning rate)である。ここでデータの間引き率は、システムが参照する番組評価値のうち、欠損値(未評価番組)として隠すデータの割合である。グラフの縦軸は、推薦番組の上位k番目についての予測精度である。ここで推薦番組の上位k番目についての予測精度は、算出したスコアの上位k番組(kは1、5、10、または20)のうち、ユーザ評価が「4:まあ見たい」以上であった割合である。グラフ中では、推薦番組の上位k番目についての予測精度は、%Precision@kと表されている。以後、推薦番組の上位k番目についての予測精度を「P@k」と呼ぶ。
また、図19乃至図22において、黒丸は、従来の標準的なRWR法によるデータである。5段階評価のうち、正の評価値(5&4)のみを隣接行列に用いたRWR法による番組評価値の予測精度(従来の標準的なRWR法を用いた5回の試行の結果の平均値)が黒丸としてプロットされている。また、白丸は、本実施形態のRWR法によるデータである。従来技術と同じく、5段階評価の正の評価値(5&4)と負の評価値(2&1)を、各々、別の隣接行列に反映させ、それぞれの隣接行列が対応するグラフを、独立なRWRアルゴリズムで解析した結果を統合したときの予測精度(各々のユーザの300番組に対する評価値のうち、設定した間引き率に相当する数の番組を無作為に決定し、その評価値を欠損値として隠した条件において、本発明の方法で予測した5回の試行の結果の平均値)が白丸としてプロットされている。
また、図19乃至図22において、白丸及び黒丸の上に伸びる線分に相当する割合または下に伸びる線分の割合は、各々の間引き率の設定において、各々、5回ずつ実施した無作為抽出の結果についての予測精度のバラツキを評価するための標準偏差に相当する割合である。
図19に示すように、推薦番組の上位1番目についての予測精度(P@1)の場合には、両者の間に有為な差は見られない。これに対して、図20、図21、及び図22に示す2番目以降の推薦番組を含めた予測精度(P@5、P@10、P@20)の場合には、どのpruning rateの設定においても、本発明による方法を用いた結果の曲線(白丸)が、従来の標準的なRWR法を用いた結果の曲線(黒丸)よりも、エラーバーの上下幅を考慮した変動分よりも、さらに上の領域を通過していることが分かる。すなわち、本実施形態による方法は、従来法よりも有為に予測精度が高いと結論付けることができる。
以上、本実施形態におけるコンテンツ推薦装置1において、ポジティブ・スコア算出部31は、各ユーザ間の嗜好の類似度と各ユーザの各コンテンツに対する正の評価値とコンテンツ間の類似度とを参照して、目的ユーザから前記各ユーザへの近接度の期待値と前記目的ユーザからみた各コンテンツへの近接度の期待値とを更新することで、ポジティブ・スコアを算出する。また、ネガティブ・スコア算出部32は、各ユーザ間の嗜好の類似度と各ユーザの各コンテンツに対する負の評価値と前記コンテンツ間の類似度とを参照して、目的ユーザから前記各ユーザへの近接度の期待値と目的ユーザからみた各コンテンツへの近接度の期待値とを更新することで、ネガティブ・スコアを算出する。
本実施形態におけるコンテンツ推薦装置1は、基礎コンテンツリストに記載されたコンテンツの一部についてしか評価値が得られない条件でも、希薄問題に対して頑健であるRWR法を、参照評価値の相反する成分、すなわち正の評価値(ポジティブ・グラフ)、並びに負の評価値(ネガティブ・グラフ)の各々について独立に実行する。そして、コンテンツ推薦装置1は、それぞれの解析結果を最終的に1つの確率分布に統合する。このように同一コンテンツに対する相反する評価の成分を統合的に解析することにより、コンテンツ推薦装置1は、希薄問題に対して頑健でありながら、RWR法を正の評価値のみに対して単独で実行した場合よりも、目的評価値をより高精度に予測することができる。その結果、コンテンツ推薦装置1は、目的ユーザの嗜好に合致したコンテンツを高精度に推薦することができるので、目的ユーザの利便性を向上させることができる。
なお、複数の装置を備えるシステムが、本実施形態のコンテンツ推薦装置1の各処理を、それらの複数の装置で分散して処理してもよい。
また、本実施形態のコンテンツ推薦装置1の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、コンテンツ推薦装置1に係る上述した種々の処理を行ってもよい。
なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
以上、本発明の実施形態について図面を参照して詳述したが、具体的な構成はこの実施形態に限られるものではない。各実施形態における各構成及びそれらの組み合わせ等は一例であり、本発明の趣旨から逸脱しない範囲内で、構成の付加、省略、置換、およびその他の変更が可能である。また、本発明は実施形態によって限定されることはなく、特許請求の範囲によってのみ限定される。
1 コンテンツ推薦装置
10 基礎評価値記録部
20 グラフ作成部
21 分割部
22 作成部
30 目的評価値予測部
31 ポジティブ・スコア算出部(ポジティブスコア算出部)
32 ネガティブ・スコア算出部(ネガティブスコア算出部)
40 推薦コンテンツ決定部
41 推定部
42 決定部

Claims (4)

  1. 複数のコンテンツそれぞれに対する各ユーザの正の評価値を用いて、前記複数のコンテンツのうち、目的ユーザが評価していないコンテンツに対する正の評価値の予測確率値であるポジティブスコアを算出するポジティブスコア算出部と、
    前記複数のコンテンツそれぞれに対する各ユーザの負の評価値を用いて、前記複数のコンテンツのうち、前記目的ユーザが評価していないコンテンツに対する負の評価値の予測確率値であるネガティブスコアを算出するネガティブスコア算出部と、
    前記ポジティブスコア算出部が算出したポジティブスコアと前記ネガティブスコア算出部が算出したネガティブスコアとに基づいて、前記目的ユーザに推薦するコンテンツを決定する推薦コンテンツ決定部と、
    を備え
    前記ポジティブスコア算出部は、前記各ユーザ間の嗜好の類似度と前記各ユーザの各コンテンツに対する正の評価値と前記コンテンツ間の類似度とを参照して、前記ポジティブスコアを算出し、
    前記ネガティブスコア算出部は、前記各ユーザ間の嗜好の類似度と前記各ユーザの各コンテンツに対する負の評価値と前記コンテンツ間の類似度とを参照して、前記ネガティブスコアを算出する、
    ことを特徴とするコンテンツ推薦装置。
  2. 前記推薦コンテンツ決定部は、前記ポジティブスコアと前記ネガティブスコアとに基づいて、前記目的ユーザが評価していない未評価コンテンツの評価値間の大小関係を推定し、該推定した大小関係に基づいて、前記目的ユーザに推薦するコンテンツを決定する
    ことを特徴とする請求項1に記載のコンテンツ推薦装置。
  3. 前記複数のコンテンツの各々に対する各ユーザの評価を示す評価値を、前記正の評価値の集合と前記負の評価値の集合に分割する分割部と、
    各コンテンツ、及び各ユーザをノードとし、前記正の評価値の集合を、各ノードを接続するエッジ重みとして記述したポジティブグラフと、各コンテンツ、及び各ユーザをノードとし、前記負の評価値の集合を、各ノードを接続するエッジ重みとして記述したネガティブグラフとを作成する作成部と
    を更に備え、
    前記ポジティブスコア算出部は、前記ポジティブグラフに基づいて、前記ポジティブスコアを算出し、
    前記ネガティブスコア算出部は、前記ネガティブグラフに基づいて、前記ネガティブスコアを算出することを特徴とする請求項1または2記載のコンテンツ推薦装置。
  4. コンピュータを、請求項1から3までのいずれか一項に記載のコンテンツ推薦装置として機能させるためのプログラム。
JP2012269663A 2012-12-10 2012-12-10 コンテンツ推薦装置、及びプログラム Expired - Fee Related JP6101477B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012269663A JP6101477B2 (ja) 2012-12-10 2012-12-10 コンテンツ推薦装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012269663A JP6101477B2 (ja) 2012-12-10 2012-12-10 コンテンツ推薦装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014115839A JP2014115839A (ja) 2014-06-26
JP6101477B2 true JP6101477B2 (ja) 2017-03-22

Family

ID=51171768

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012269663A Expired - Fee Related JP6101477B2 (ja) 2012-12-10 2012-12-10 コンテンツ推薦装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP6101477B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107341679A (zh) * 2016-04-29 2017-11-10 腾讯科技(深圳)有限公司 获取用户画像的方法及装置
CA3053531A1 (en) * 2017-02-17 2018-08-23 Kyndi, Inc. Method and apparatus of machine learning using a network with software agents at the network nodes and then ranking network nodes

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5464412B2 (ja) * 2009-08-12 2014-04-09 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
JP2014115839A (ja) 2014-06-26

Similar Documents

Publication Publication Date Title
US9215252B2 (en) Methods and apparatus to identify privacy relevant correlations between data values
Miller Virtual species distribution models: using simulated data to evaluate aspects of model performance
Bagchi Performance and quality assessment of similarity measures in collaborative filtering using mahout
KR101620748B1 (ko) 아이템 추천 방법 및 아이템 추천 장치
Olivera Changes in inequality and generalized trust in Europe
Bethem et al. Establishing the fitness for purpose of mass spectrometric methods
Sohnesen et al. Is random forest a superior methodology for predicting poverty? An empirical assessment
KR101579376B1 (ko) 주관성 분석을 이용한 사용자 분류와 그에 따른 개인화된 장소 추천 시스템 및 방법
US9558273B2 (en) System and method for generating influencer scores
Sen et al. A total error framework for digital traces of humans
Tonon et al. Pooling-based continuous evaluation of information retrieval systems
WO2012161740A2 (en) System and method for generating recommendations
Bellogín et al. The magic barrier of recommender systems–no magic, just ratings
US20130031093A1 (en) Information processing system, information processing method, program, and non-transitory information storage medium
KR20150113644A (ko) 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법
KR101450453B1 (ko) 컨텐츠 추천 방법 및 장치
Ebbes et al. Using social network activity data to identify and target job seekers
US10296924B2 (en) Document performance indicators based on referral context
Darr et al. Resurgent mass partisanship revisited: The role of media choice in clarifying elite ideology
JP6101477B2 (ja) コンテンツ推薦装置、及びプログラム
US9922315B2 (en) Systems and methods for calculating actual dollar costs for entities
Khoshnevis et al. Prioritizing ground‐motion validation metrics using semisupervised and supervised learning
Thielsch et al. How informative is informative? Benchmarks and optimal cut points for E-Health Websites
Yucel et al. Sequential hierarchical regression imputation
Bartok et al. How to assess rater rankings? A theoretical and a simulation approach using the sum of the Pairwise Absolute Row Differences (PARDs)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151102

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160817

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160906

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170227

R150 Certificate of patent or registration of utility model

Ref document number: 6101477

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees