[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6390239B2 - 情報処理装置、及びプログラム - Google Patents

情報処理装置、及びプログラム Download PDF

Info

Publication number
JP6390239B2
JP6390239B2 JP2014151512A JP2014151512A JP6390239B2 JP 6390239 B2 JP6390239 B2 JP 6390239B2 JP 2014151512 A JP2014151512 A JP 2014151512A JP 2014151512 A JP2014151512 A JP 2014151512A JP 6390239 B2 JP6390239 B2 JP 6390239B2
Authority
JP
Japan
Prior art keywords
component
node
nodes
components
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014151512A
Other languages
English (en)
Other versions
JP2016029526A (ja
Inventor
岡本 洋
洋 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2014151512A priority Critical patent/JP6390239B2/ja
Priority to US14/722,781 priority patent/US9690969B2/en
Priority to AU2015203002A priority patent/AU2015203002B2/en
Publication of JP2016029526A publication Critical patent/JP2016029526A/ja
Application granted granted Critical
Publication of JP6390239B2 publication Critical patent/JP6390239B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/63Routing a service request depending on the request content or context

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は情報処理装置、及びプログラムに関する。
従来、データ点の集合等、ベクトル型データの大域的特徴を捉えるため、いわゆるクラスタリングを行う場合があった。ここで、クラスタリングの種類として、1つのデータ点が1つのクラスタに属するように分類するハードクラスタリングと、1つのデータ点が複数のクラスタに属し得るように分類するソフトクラスタリングとがあった。
下記特許文献1には、複数のストリングエントリのインデクシングを行う方法であって、ユーザのリクエストを渡す前にユーザに関連するロックテーブルへの問い合わせを実行するステップを有する、衝突検出又は衝突マネージメントのための方法が記載されている。
下記特許文献2には、対象点と周囲点とのリンクを除去し、周囲点と周囲点に最も近い点との間に新たにリンクを生成するグラフインデックス再構成装置が記載されている。
下記特許文献3には、Weblogコミュニティにおいて頻出するキーワードによりコ
ミュニティをインデクシングすると共に、コミュニケーション鮮度を算出し、Weblogコミュニティ検索結果をキーワード適合度及びコミュニケーション鮮度に基づきソートして表示可能とするコミュニティ検索支援方法が記載されている。
下記特許文献4には、コミュニティでやり取りされるメッセージから索引を作成し、ユーザがネットワークを介して送信した質問メッセージについて、質問先とするコミュニティを索引に基づいて選択して、質問メッセージを送信する質問先選択サーバが記載されている。
特開2006−004439号公報 特開2012−133522号公報 特開2006−331292号公報 特開2007−287046号公報
近年、情報処理技術の発達により、相互参照を含むHTMLデータ等、ネットワーク型データの重要性が高まっている。ネットワーク型データは、ノードと、ノードを結ぶリンクとを含み、ベクトル型データと同様に複数のクラスタに分類される場合がある。
しかし、ネットワーク型データのノードが複数のクラスタに属し得るようにソフトクラスタリングする方法は必ずしも確立されていない。
そこで、本発明は、ネットワーク型データのソフトクラスタリングを行う情報処理装置、及びプログラムの提供を目的とする。
上記課題を解決するために、請求項1に記載の情報処理装置は、複数のノード及び前記複数のノードを結ぶ複数のリンクを含むネットワークの情報と、前記複数のノードを複数の成分に分類する粒度とを取得する取得手段と、前記複数の成分それぞれについて、前記複数のノードそれぞれが当該成分に分類される分類割合を、当該ノードとの間でリンクを有するノードの当該成分に関する前記分類割合が大きいほど大きな値となる第1の寄与と、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となる第2の寄与と、から構成される値により算出する分類割合算出手段と、前記複数のノードそれぞれについて、前記複数の成分に帰属する帰属度を、当該ノードが当該成分に分類される前記分類割合が大きいほど、大きな値となるように算出する帰属度算出手段と、前記複数の成分それぞれについて、前記複数の成分の重要度を、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となるように算出する重要度算出手段と、を備え、前記分類割合算出手段は、粒度を粗くすることで前記第2の寄与より前記第1の寄与の方が大きくなるように前記分類割合を算出し、前記帰属度算出手段は、前記複数のノードそれぞれについて、前記複数の成分に帰属する帰属度を、当該成分の前記重要度が大きいほど、大きな値となるように算出し、前記取得手段は、前記複数のノードそれぞれについて、ユーザの興味の多寡を表す数値をさらに取得し、前記複数のノードそれぞれについて、前記数値に基づく固有順位を、前記数値が相対的に大きいノードについての前記帰属度が相対的に大きい成分について、当該成分に帰属する前記帰属度が大きいノードほど上位となるように算出する固有順位算出手段をさらに備える、ことを特徴とする。
また、請求項に記載の発明は、前記分類割合算出手段及び前記重要度算出手段は、逐次計算により前記分類割合及び前記重要度をそれぞれ算出し、前記第1の寄与は、前記粒度を粗くすると1に近付く第1の係数と、当該ノードとの間でリンクを有するノードに関して直前に算出された前記分類割合と、から定められ、前記第2の寄与は、前記粒度を粗くすると0に近付く第2の係数と、前記複数のノード間を前記複数のリンクに沿ってランダムに遷移する場合に通過するノードを示す複数の通過情報と、直前に算出された前記分類割合及び前記重要度から算出される前記複数の成分全体に対する当該成分が占める割合と、から定められることを特徴とする請求項1に記載の情報処理装置である。
また、請求項に記載の発明は、前記複数のノードの1つをnと表し、前記複数の成分の1つをkと表し、ノードnが成分kに分類される前記分類割合のうち直前に算出された前記分類割合をpt−1(n|k)と表し、前記粒度をαと表し、ノードnとノードmとを結ぶリンクの情報をTnmと表し、ノードnの通過を示す前記複数の通過情報をτ (d)と表し、成分kの前記重要度のうち直前に算出された前記重要度をπt−1(k)と表し、直前に算出された前記分類割合pt−1(n|k)及び前記重要度πt−1(k)、並びに前記複数の通過情報τ (d)から算出される前記複数の成分全体に対する成分kが占める割合γ (d)(k)をγ (d)(k)=πt−1(k)Π(pt−1(n|k))τn(d)/Σ(πt−1(j)Π(pt−1(m|j))τm(d))と定め、Dt−1(k)=Σγt−1 (d)(k)と定める場合に、前記分類割合算出手段は、p(n|k)=αΣnmt−1(m|k)/(α+2Dt−1(k))+Σγt−1 (d)(k)τ (d)/(α+2Dt−1(k))の関係により前記分類割合を逐次計算し、前記重要度算出手段は、π(k)=Dt−1(k)/Σt−1(j)の関係により前記重要度を逐次計算し、Q=ΣΣγ (d)(k)log(π(k))+ΣΣ(Σγ (d)(k)τ (d)+αΣnm(m|k))log(p(n|k))で定められる判定値Qが、予め定められた数値εとの間で、|Q−Qt−1|<εの関係を満たす場合に、ノードnが成分kに分類される前記分類割合をp(n|k)=p(n|k)、成分kの前記重要度をπ(k)=π(k)、と定めることを特徴とする請求項に記載の情報処理装置である。
また、請求項に記載の発明は、ノードnが成分kに帰属する前記帰属度をq(k|n)と表す場合に、前記帰属度算出手段は、q(k|n)=π(k)p(n|k)/(Σπ(j)p(n|j))の関係により前記帰属度を算出することを特徴とする請求項に記載の情報処理装置である。
また、請求項に記載の発明は、ノードnについての、前記ユーザの興味の多寡を表す数値をIと表し、ノードnについての前記ユーザの前記固有順位をp(n|I)と表す場合に、前記固有順位算出手段は、p(n|I)=Σp(n|k)Π(q(k|m))Im/(ΣΠ(q(j|r))Ir)の関係により前記固有順位を算出することを特徴とする請求項に記載の情報処理装置である。
また、請求項に記載の発明は、情報処理装置に備えられたコンピュータを、複数のノード及び前記複数のノードを結ぶ複数のリンクを含むネットワークの情報と、前記複数のノードを複数の成分に分類する粒度とを取得する取得手段、前記複数の成分それぞれについて、前記複数のノードそれぞれが当該成分に分類される分類割合を、当該ノードとの間でリンクを有するノードの当該成分に関する前記分類割合が大きいほど大きな値となる第1の寄与と、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となる第2の寄与と、から構成される値により算出する分類割合算出手段、前記複数のノードそれぞれについて、前記複数の成分に帰属する帰属度を、当該ノードが当該成分に分類される前記分類割合が大きいほど、大きな値となるように算出する帰属度算出手段、前記複数の成分それぞれについて、前記複数の成分の重要度を、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となるように算出する重要度算出手段、として機能させることを特徴とするプログラムであって、前記分類割合算出手段は、粒度を粗くすることで前記第2の寄与より前記第1の寄与の方が大きくなるように前記分類割合を算出し、前記帰属度算出手段は、前記複数のノードそれぞれについて、前記複数の成分に帰属する帰属度を、当該成分の前記重要度が大きいほど、大きな値となるように算出し、前記取得手段は、前記複数のノードそれぞれについて、ユーザの興味の多寡を表す数値をさらに取得し、前記複数のノードそれぞれについて、前記数値に基づく固有順位を、前記数値が相対的に大きいノードについての前記帰属度が相対的に大きい成分について、当該成分に帰属する前記帰属度が大きいノードほど上位となるように算出する固有順位算出手段として機能させる、プログラムである。
請求項1、及びに記載の発明によれば、ネットワーク型データのソフトクラスタリングを行う情報処理装置、及びプログラムが得られる。
請求項に記載の発明によれば、ネットワーク型データのソフトクラスタリングが漸近的に行われる。
請求項に記載の発明によれば、ネットワーク型データのソフトクラスタリングが任意の精度で行われる。
請求項に記載の発明によれば、ノードのインデクシングが任意の精度で行われる。
請求項に記載の発明によれば、ノードのパーソナライズドランキングがリアルタイムで得られる。
本発明の実施形態に係る情報処理装置の構成図である。 ネットワーク情報を示す図である。 本発明の実施形態に係る情報処理装置において実行される分解工程のフローチャートである。 本発明の実施形態に係る情報処理装置において算出された分類割合及び重要度を示す図である。 本発明の実施形態に係る情報処理装置において算出された帰属度を示す図である。 本発明の実施形態に係る情報処理装置において算出された、各ノードについての帰属度を表すグラフである。 本発明の実施形態に係る情報処理装置において取得される興味ベクトルと、算出された固有順位とを示す図である。 本発明の実施形態に係る情報処理装置において算出された、各ノードについての固有順位を表すグラフである。 本発明の実施形態に係る情報処理装置において取得される粒度と、成分数の関係を示す図である。
以下、本発明の実施の形態について、図面を参照しながら説明する。
図1は、本発明の実施形態に係る情報処理装置1の構成図である。情報処理装置1は、記憶部10、入力部11、制御部12、表示部13を含む。
記憶部10は、例えばRAM(Random Access Memory)やROM(Read Only Memory)を含む。記憶部10は、制御部12が実行するプログラムを格納するとともに、制御部12のワークメモリとしても機能する。なお、記憶部10に格納される制御部12が実行するプログラムは、電気通信回線を介して提供されるものであってもよいし、半導体記憶素子等のコンピュータで読み取り可能な情報記憶媒体に格納されて提供されるものであってもよい。
本実施形態に係る情報処理装置1の記憶部10には、ネットワーク情報100、粒度α101、及び興味ベクトルI102が記憶される。ネットワーク情報100は、複数のノード及び複数のノードを結ぶ複数のリンクを含むネットワークの情報である。ネットワーク情報100は、例えば相互参照を含むHTMLデータ、友人関係のデータ等であってよい。ネットワーク情報100は、少なくともノード間の結び付きの関係(ノードとリンクの関係)を示すものであればよく、ノードが含む具体的な内容(HTMLデータの内容等)を示すものでなくてもよい。
粒度α101は、正の実数であって、情報処理装置1によってネットワーク情報100をソフトクラスタリングする場合に、クラスタの大きさを定めるパラメータである。興味ベクトルI102は、ネットワーク情報100に含まれるノードの数と同じ次元を有するベクトルであり、各要素は正の実数であり、各要素の総和が1となるものである。興味ベクトルI102は、各ノードの固有順位(パーソナライズドランキング)を算出するために用いられる。
入力部11は、例えばキーボードやマウス等であり、ユーザの指示を制御部12に伝達する。本実施形態では、記憶部10に粒度α101及び興味ベクトルI102が記憶されることとしたが、ユーザが入力部11によって、粒度α101及び興味ベクトルI102を入力することとしてもよい。
制御部12は、例えばCPU(Central Processing Unit)を含んでおり、記憶部10に格納されるプログラムを実行することにより、情報処理装置1の全体を制御する。制御部12は、機能的に、取得部120、算出部121、帰属度算出部122、固有順位算出部123を含む。ここで、算出部121は、分類割合算出部1210、及び重要度算出部1211を含む。制御部12の行う制御については、後に詳細に説明する。
表示部13は、制御部12により処理された情報をユーザに表示するものであり、例えば液晶ディスプレイである。
図2は、ネットワーク情報100を示す図である。本実施形態では、ネットワーク情報100は、7つのノードと、9つのリンクの情報を含むものである。各ノードには、1から7までのノード番号が付与されており、例えばノード番号1であるノード(以下、ノード[1]と表す)は、ノード[2]及びノード[4]のノードとリンクを有する。本実施形態では、簡明な説明のため7つのノードを有するネットワークの場合を示すが、ノード数及びリンク数はこれより多くてもよく、例えば10万程度であってもよい。本実施形態では、ノード間を結ぶリンクは方向を持たないこととしているが、リンクは一方通行であってもよい。
行列Tは、ノード間をリンクに沿ってランダムに遷移する場合における遷移確率を表すものである。例えば、ノード[1]を起点としてリンクに沿ってランダムに他のノードに遷移する場合、1/2の確率でノード[2]に遷移し、1/2の確率でノード[4]に遷移する。これらの遷移確率をまとめて表したものが、行列Tの第1列である。他の行列要素についても同様に構成されている。一般に、ノード[n]とノード[m]がリンクで接続されている場合にAnm=1、ノード[n]とノード[m]がリンクで接続されていない場合にAnm=0となる行列Aを用いて、ノードの総数をNとする場合に、行列Tは以下の数式(1)で定義される。遷移確率の総和は1であるから、任意のノード[m]について、Σnm=1が成り立つ。
Figure 0006390239
図3は、本発明の実施形態に係る情報処理装置1において実行される分解工程のフローチャートである。分解工程では、ネットワーク情報100及び粒度α101を入力として、ネットワークに含まれるN個のノードをK個の成分に分類することにより、ネットワークのソフトクラスタリングを行う。ここで、N及びKは正の整数である。なお、成分の総数Kはユーザが仮決めすることのできるパラメータであるが、後述するようにクラスタの総数は分解工程を実行することにより自動的に定まる。分解工程では、複数の成分それぞれについて、複数のノードそれぞれが当該成分に分類される分類割合を求め、複数の成分の重要度を求める。すなわち、成分[k]について、ノード[n]が成分[k]に分類される分類割合p(n|k)を求め、成分[k]の重要度π(k)を求める。分類割合p(n|k)、及び重要度π(k)を求めるにあたって、第d番目の通過情報τ(d)に基づく、複数の成分全体に対する成分[k]が占める割合γ(d)(k)を求めることとなる。ここで、第d番目の通過情報τ(d)はN次元のベクトルであり、τ(1)、τ(2)…τ(D)(Dは正の整数)というD個のデータである。
分解工程では、はじめに、ネットワーク情報100が表すネットワークのノード間をランダムに遷移する場合における定常確率分布pst(n)を算出する(S1)。定常確率分布pst(n)は、以下の数式(2)で定められる連立N次方程式を解くことにより求められる。定常確率分布pst(n)は、行列Tの固有ベクトルであって、固有値が1のものである。
Figure 0006390239
一方通行のリンクを含むネットワークを想定する場合、いわゆるランクシンク等の問題が発生し、定常確率分布が特定のノードにのみ値を有する場合がある。そのような場合、数式(2)を変形し、例えば、pst(n)=(1−r)Σnmst(m)+rという関係によって定常確率分布pst(n)を求めることとしてもよい。ここで、rは0以上1以下の実数である。rは、ノード間をリンクに沿わずにランダムに遷移する確率を表す。
次に、複数のノード間を複数のリンクに沿ってランダムに遷移する場合に通過するノードを示す複数の通過情報τ (d)を生成する(S2)。本実施形態では、通過情報は、定常確率分布pst(n)に従って選出されたノード[n]についてτ (d)=1、かつ、ノード[n]を起点としてノード[m]に遷移する確率を与えるTmnに従って選出されたノード[m]についてτ (d)=1として生成する。このようなN次元ベクトルを、D回生成する。通過情報τ (d)は、Στ (d)=2を満たす量である。通過情報τ (d)は、仮想エージェントがノード間をリンクに沿ってランダムに遷移する場合に、仮想エージェントをノード[n]とノード[m]とを結ぶリンク上に見出す場合を表している。
本実施形態に係る分類割合算出部1210及び重要度算出部1211は、逐次計算により分類割合p(n|k)及び重要度π(k)をそれぞれ算出する。分解工程では、逐次計算を開始するにあたって、p(n|k)、π(k)、γ (d)(k)を仮決めする(S3)。ここで、Σ(n|k)=1、Σπ(k)=1を満たす値を与えるものとする。p(n|k)は、k=1〜Kの成分について、n=1〜Nのノードが分類される割合を示すものであるから、仮決めではK×N−1個の正の実数を与えることになる。なお、−1はΣ(n|k)=1の条件による。また、π(k)は、k=1〜Kに分類されたネットワークの成分について、重要度を示すものであるから、仮決めではK−1個の正の実数を与えることになる。γ (d)(k)は、複数の成分全体に対する成分[k]が占める割合を表す係数であり、d=1〜Dの通過情報τ(d)に対応して定まる係数であるから、仮決めではK×D個の正の実数を与えることになる。
逐次計算の第1ステップでは、第t回目の逐次計算による分類割合p(n|k)を計算する(S4)。ここで、tは正の整数であり、逐次計算の回数を表す。p(n|k)は、1つ前の逐次計算により得られるpt−1(n|k)、πt−1(k)、及びγt−1 (d)(k)より算出される。例えば、仮決め(S3)の後行われる第一回目の逐次計算では、p(n|k)、π(k)、及びγ (d)(k)を用いてp(n|k)を求めることになる。
本実施形態に係る分類割合算出部1210は、以下の数式(3)で定められる関係により第t回目の逐次計算による分類割合p(n|k)を算出する(S4)。
Figure 0006390239
ここで、αは記憶部10に記憶された粒度α101であり、正の実数である。本実施形態では、粒度α101は、αが0に近付くほど分解の粒度が細かくなり、αが無限大に近付くほど分解の粒度が粗くなるパラメータである。また、Dt−1(k)はγt−1 (d)(k)から定まる係数であり、Dt−1(k)=Σγt−1 (d)(k)である。
分類割合p(n|k)は、ノード[n]との間でリンクを有するノード(Tnm≠0であるノード[m])の成分[k]に関する分類割合pt−1(m|k)が大きいほど大きな値となる第1の寄与(右辺第一項)と、複数の成分全体に対する成分[k]が占める割合γt−1 (d)(k)が大きいほど大きな値となる第2の寄与(右辺第二項)とから構成される値により算出される。
また、第1の寄与は、粒度α101を粗くすると(αを無限大に近付けると)1に近付く第1の係数α/(α+2Dt−1(k))と、ノード[n]との間でリンクを有するノード(Tnm≠0であるノード[m])に関して直前に算出された分類割合pt−1(m|k)と、から定められる。また、第2の寄与は、粒度α101を粗くすると(αを無限大に近付けると)0に近付く第2の係数1/(α+2Dt−1(k))と、複数の通過情報τ (d)と、複数の成分全体に対する成分[k]が占める割合γt−1 (d)(k)と、から定められる。なお、以下に示すように、複数の成分全体に対する成分[k]が占める割合γt−1 (d)(k)は、直前に算出された分類割合pt−1(n|k)及び重要度πt−1(k)から算出される。
次に、直前に算出された分類割合pt−1(n|k)及び重要度πt−1(k)、並びに複数の通過情報τ (d)から、複数の成分全体に対する成分[k]が占める割合γ (d)(k)を算出する(S5)。本実施形態では、以下の数式(4)により割合γ (d)(k)を算出する。割合γ (d)(k)は、成分全体の中で重要度が相対的に大きい成分について大きな値をとる。
Figure 0006390239
さらに、ネットワークの成分[k]の重要度π(k)を算出する(S6)。重要度π(k)は、複数の成分全体に対する成分[k]が占める割合γ (d)(k)が大きいほど大きな値となるように算出される。本実施形態では、以下の数式(5)により成分[k]の重要度π(k)を算出する。
Figure 0006390239
以上の数式(3)、(4)、及び(5)により、直前に算出された分類割合pt−1(n|k)、重要度πt−1(k)、及び割合γt−1 (d)(k)、並びに通過情報τ (d)から、分類割合p(n|k)、重要度π(k)、及び割合γ (d)(k)が算出される。
分解工程では、逐次計算の前後における評価値Qの差の絶対値|Q−Qt−1|が予め定められた基準値εより小さいか否かを算出部121により判定し、逐次計算を終了するか否かを決定する(S7)。本実施形態において、評価値Qは以下の数式(6)で定められる量である。
Figure 0006390239
|Q−Qt−1|<εが成立しない場合、最新の分類割合p(n|k)、重要度π(k)、及び割合γ (d)(k)を直前の分類割合、重要度、及び割合であるとして更新する(S8)。その後、分類割合pt+1(n|k)を算出する工程(S4)、割合γt+1 (d)(k)を算出する工程(S5)、重要度πt+1(k)を算出する工程(S6)を行い、|Qt+1−Q|<εが成立するか否かを判定する(S7)、という一連の工程を繰り返す。本実施形態に係る分類割合算出部1210及び重要度算出部1211は、評価値の差の絶対値が予め定められた値より小さくなるまで、以上の工程を繰り返し、逐次計算により分類割合、及び重要度を算出する。これにより、ネットワーク情報100のソフトクラスタリングが漸近的に行われる。
一方、|Q−Qt−1|<εが成立する場合、ノード[n]が成分[k]に分類される分類割合をp(n|k)=p(n|k)により定め、成分[k]の重要度をπ(k)=π(k)により定める(S9)。本実施形態に係る情報処理装置1によれば、予め定められた値εを調整することで、任意の精度で分類割合p(n|k)、及び重要度π(k)を求めることができ、ネットワークのソフトクラスタリングを任意の精度で行うことができる。なお、逐次計算の回数を予め定めておき、定められた回数だけ逐次計算を行った場合におけるp(n|k)及びπ(k)の値を、それぞれ分類割合p(n|k)及び重要度π(k)と決定することとしてもよい。
図4は、本発明の実施形態に係る情報処理装置1において算出された分類割合及び重要度を示す図である。図4では、図2に示したネットワーク情報100、及び粒度α101を入力として、本実施形態に係る分類割合算出部1210及び重要度算出部1211によって算出された分類割合及び重要度を示している。本実施形態に係るネットワーク情報100のノード数はN=7であり、算出された成分数はK=2である。ここで、成分数Kはユーザが予め仮決めすることのできるパラメータであるが、十分に大きな値を設定する場合、π(k)<εとなるkが表れる。そして、π(k)<εとなる成分kは重要度が0である(当該成分は見出されない)とみなして、ネットワーク情報100のソフトクラスタリングを行う。ここで、Kとして十分に大きな値とは、ノード数Nと同程度かそれ以上の値であることを意味する。すなわち、本実施形態の場合、Kを十分に大きな値に設定することは、K≧7に設定することを意味する。本実施形態に係る分類割合算出部1210及び重要度算出部1211は、例えばK=7という条件で逐次計算を行うことで、5つの成分について重要度がπ(k)<εと得られ、2つの成分について重要度がπ(1)=0.6、π(2)=0.4と得られる。よって、本実施形態におけるネットワーク情報100は、2つの成分にソフトクラスタリングされたといえる。後述するように、ネットワーク情報100がいくつの成分に分類されるかは、粒度α101の大きさによって変化する。
分類割合p(n|k)は、数式(3)から読み取れるように、任意のkについてΣp(n|k)=1を満たす量である。例えば第1の成分(k=1)について、複数のノードそれぞれが成分[1]に分類される分類割合を確認すると、p(1|1)=0.25、p(2|1)=0.25、p(3|1)=0.25、p(4|1)=0.15、p(5|1)=0.05、p(6|1)=0.025、p(7|1)=0.025である。このことから、ノード[1]、[2]、[3]が成分[1]に分類される分類割合は等しく1/4であるのに対し、ノード[4]が成分[1]に分類される分類割合は0.15と相対的にやや小さく、ノード[5]が成分[1]に分類される分類割合は0.05、ノード[6]及び[7]が成分[1]に分類される分類割合はどちらも0.025と相対的に非常に小さくなっている。
一方、複数のノードそれぞれが成分[2]に分類される分類割合を確認すると、ノード[1]、[2]、[3]が成分[2]に分類される分類割合は等しく0.03で相対的に非常に小さく、ノード[4]が成分[1]に分類される分類割合は0.11と相対的にやや小さく、ノード[5]が成分[1]に分類される分類割合は0.2、ノード[6]及び[7]が成分[1]に分類される分類割合はどちらも0.3となっている。
図2に表されたネットワーク情報100の構造から予想されるように、本実施形態に係る情報処理装置1によれば、ノード[1]、[2]、[3]と、ノード[5]、[6]、[7]とは異なる成分に分類される。ノード[4]は中間的なノードであり、成分[1]に分類される分類割合と、成分[2]に分類される分類割合とが同程度である。もっとも、ノード[1]、[2]、[3]が成分[2]に分類される分類割合は0ではなく、ノード[5]、[6]、[7]が成分[1]に分類される分類割合も0ではない。このように、分類割合を算出することにより、ネットワークを構成するノードを複数の成分に分類することができ、ネットワークのソフトクラスタリングが行える。
重要度π(k)は、Σπ(k)=1を満たす量である。重要度π(k)は、ネットワーク全体における成分[k]の相対的な重要度を表す。成分[k]の重要度は、成分[k]に分類されるノードの数に応じて定まる。本実施形態において得られた分類割合によれば、成分[1]については特にノード[1]、[2]、[3]の分類割合が大きく、成分[2]については特にノード[5]、[6]、[7]の分類割合が大きく、ノード[4]については成分[1]に分類される分類割合の方が成分[2]に分類される分類割合よりも大きい。そのため、成分[1]に分類されるノードが相対的に多いこととなり、π(1)>π(2)という結果が得られている。
図5は、本発明の実施形態に係る情報処理装置1において算出された帰属度を示す図である。帰属度は、帰属度算出部122により算出される量であって、複数のノードそれぞれについて、ノード[n]が成分[k]に分類される分類割合p(n|k)が大きいほど、大きな値となるように算出される量である。本実施形態では、ノード[n]が成分[k]に帰属する帰属度q(k|n)は、以下の数式(7)によって求められる。
Figure 0006390239
数式(7)から読み取れるように、帰属度q(k|n)は、Σq(k|n)=1を満たす。すなわち、あるノードが各成分に帰属する帰属度の総和は1となる。帰属度q(k|n)は、あるノード[n]が、成分[k]に帰属する度合いを成分全体に関して相対的に測った量である。
図6は、本発明の実施形態に係る情報処理装置1において算出された、各ノードについての帰属度を表すグラフである。グラフは、横軸にノード番号、縦軸に帰属度を表している。例えば、ノード[1]、[2]、[3]について、成分[1]に帰属する帰属度は、q(1|1)=q(1|2)=q(1|3)=0.93であり、成分[2]に帰属する帰属度は、q(2|1)=q(2|2)=q(2|3)=0.07である。よって、ノード[1]、[2]、[3]は成分[1]に帰属する度合いが比較的大きいノードであると考えられる。ノード[4]は、成分[1]への帰属度がq(1|4)=0.67であり、成分[2]への帰属度がq(2|4)=0.33であるので、成分[1]に帰属する度合いが比較的大きいが、成分[2]に帰属する度合いも無視できない大きさで有するので、中間的なノードであるといえる。ノード[5]も中間的なノードであり、成分[1]への帰属度がq(1|5)=0.27であり、成分[2]への帰属度がq(2|5)=0.73である。一方、ノード[6]、[7]は、成分[1]への帰属度がq(1|6)=q(1|7)=0.11であり、成分[2]への帰属度がq(2|6)=q(2|7)=0.89であり、成分[2]に帰属する度合いが比較的大きいノードであると考えられる。
本実施形態に係る情報処理装置1は、算出した帰属度を各ノードに付与し、ノードのインデクシングを行う。ノード[n]にインデックスとして付与される帰属度q(k|n)は、K次元のベクトルであり、ノード[n]の特性をK個の実数値によって表すものである。インデックスは、ノードの内容をK次元のベクトルに圧縮して表したものということができる。インデックスは、以下に説明する各ノードの固有順位を算出する場合に用いられる他、ノードの検索を行う場合に用いることができる。例えば、ある種の特性を有するノードを探し出したいというユーザからの要求を受け付けた場合に、情報処理装置1はユーザの要求に含まれるネットワークの成分を1つ又は複数抽出し、当該抽出された成分に帰属する度合いの大きいノードを選出することで検索結果とすることができる。このような方法を採用することにより、ノードの内容を直接検索する場合に比べて、高速にノードを検索することができる。
図7は、本発明の実施形態に係る情報処理装置1において取得される興味ベクトルI102と、算出された固有順位とを示す図である。興味ベクトル102は、ノードの総数Nと同じ次元をもったベクトルであって、各要素は正の実数であり、Σ=1を満たす規格化されたベクトルである。興味ベクトル102の各要素は、複数のノードそれぞれについて、ユーザの興味の多寡を表す数値である。数値が大きいほどユーザが関心を抱いているノードであることを表し、数値が小さいほどユーザが関心を寄せていないノードであることを意味する。例えば、複数のノードが文書データである場合には、ユーザが入力した単語を受けて、興味ベクトル102の要素を、I=(ノード[n]が含む当該単語の数)/Σ(ノード[m]が含む当該単語の数)として定めることとしてもよい。
図7では、本実施形態に係る情報処理装置1に記憶されている興味ベクトル102の例を示している。興味ベクトル102は、n=0〜5ではI=0であり、I=0.8、I=0.2である。本実施形態における興味ベクトル102の例は、ユーザがノード[6]に特に強い興味を持ち、ノード[7]についても僅かに興味を持っている状態を表している。
固有順位算出部123は、分類割合算出部1210、重要度算出部1211、及び帰属度算出部122でそれぞれ算出された分類割合p(n|k)、重要度π(k)、及び帰属度q(k|n)、並びに興味ベクトルI102を用いて、複数のノードそれぞれについて固有順位を算出する。固有順位算出部123は、興味ベクトル102に基づく固有順位を、興味ベクトル102が相対的に大きいノード[n]についての帰属度q(k|n)が相対的に大きい成分[k]について、当該成分[k]に帰属する帰属度が大きいノードほど上位となるように算出する。本実施形態の場合に当てはめて考えると、興味ベクトル102の要素Iが相対的に大きいノードはノード[6]であり、ノード[6]についての帰属度が相対的に大きい成分は成分[2]である。そして、成分[2]に帰属する度合いが大きいノードは、ノード[6]及び[7]であり、次いでノード[5]である。
本実施形態では、以下の数式(8)によって、興味ベクトルI102に基づいたノード[n]の固有順位p(n|I)を求める。
Figure 0006390239
図8は、本発明の実施形態に係る情報処理装置1において算出された、各ノードについての固有順位を表すグラフである。図8に示すグラフの横軸はノード番号を表し、縦軸は固有順位p(n|I)を表す。固有順位は、ノード[6]及び[7]について0.28であり、全ノード中最も大きな値となっている。ノード[5]の固有順位はp(5|I)=0.18、ノード[4]の固有順位はp(4|I)=0.11であり、中間的な順位となっている。ノード[1]〜[3]の固有順位は低く、各々0.05である。これらの数値は足して1となる(Σp(n|I)=1)ものであり、固有順位は複数のノード間における相対的な順位である。
本実施形態に係る情報処理装置1は、興味ベクトル102が特定されているユーザからの要求に応じて、ノードの固有順位、いわゆるパーソナライズドランキングをリアルタイムで出力することができる。例えば、各ノードが文書データを表す場合に、興味ベクトル102が特定されているユーザによって検索ワードが入力されると、インデックスq(k|n)に基づく検索を行うとともに、固有順位p(n|I)が高いノードを優先的に提示するように処理することで、ユーザの興味を反映したノード検索を行うことができる。本実施形態に係る情報処理装置1によれば、ノードの固有順位を予め算出しておく必要はなく、ユーザからの要求を受け付けた後に算出することができる。そのため、固有順位を予め算出しておく場合に比べて、より状況変化を反映した固有順位を提供することができる。
図9は、本発明の実施形態に係る情報処理装置1において取得される粒度101と、成分数Kの関係を示す図である。本実施形態に係る情報処理装置1では、ネットワークを幾つかの成分に分類する場合における粒度101は、正の実数αでパラメータ付けられる。本実施形態におけるパラメータ付けでは、αが大きいほど分類の粒度は粗く、αが小さいほど分類の粒度は細かい。図9は、ネットワークのソフトクラスタリングの様子を正確に表す図ではなく、もっぱら粒度101と成分数Kとの関係を示すための図である。図9において、楕円形の破線はネットワークの成分を表し、破線が囲むノードは、当該成分に関する帰属度が相対的に大きいノードを表す。
第1の例における成分2は、粒度101が比較的粗い場合の例における成分を示している。第1の例の場合、粒度101が比較的粗いため、ネットワークを構成する全ノードが単一の成分に帰属すると算出される。この場合、重要度が0でない(重要度が予め定められた基準値ε以下でない)成分の数は1であり、成分の総数は1である。
第2の例における成分3a、3bは、粒度101が第1の例よりも細かい第2の例の場合において、算出される成分をそれぞれ破線で表したものである。第2の例における成分3aには4つのノードが帰属し、第2の例における成分3bには3つのノードが帰属している。ノード[1]〜[4]は、第2の例における成分3aに関する帰属度が相対的に大きく、ノード[5]〜[7]は、第2の例における成分3bに関する帰属度が相対的に大きい。もっとも、いずれのノードも複数の成分について0でない帰属度を有する場合がある。特に、ノード[4]及び[5]等は、2つの成分に対して同程度の帰属度を有する場合がある。第2の例の場合、ネットワークの各ノードは2つの成分に帰属すると算出される。この場合、重要度が0でない成分の数は2であり、成分の総数は2である。
第3の例における成分4a、4b、4cは、粒度101が第2の例よりも細かい第3の例の場合において、算出される成分をそれぞれ破線で表したものである。第3の例における成分4a、4bには2つのノードが帰属し、第3の例における成分4cには3つのノードが帰属している。ノード[2]及び[3]は、第3の例における成分4aに関する帰属度が相対的に大きく、ノード[1]及び[4]は、第3の例における成分4bに関する帰属度が相対的に大きく、ノード[5]〜[7]は、第3の例における成分4cに関する帰属度が相対的に大きい。第3の例の場合、1つの成分に含まれるノードの数が少なく、成分間の重なりが生じやすいため、いずれのノードも複数の成分について同程度の帰属度を有する場合がある。第3の例の場合、ネットワークの各ノードは3つの成分に帰属すると算出される。この場合、重要度が0でない成分の数は3であり、成分の総数は3である。
以上のように、本実施形態に係る情報処理装置1では、粒度α101を大きくするに従って、見出される成分の数は少なくなる。情報処理装置1のユーザは、同一のネットワーク情報100について、異なる粒度α101を用いてネットワークのソフトクラスタリングを行うことができ、ネットワークを様々な階層に分解することができる。
以下では、本実施形態における分類割合、重要度、粒度α、帰属度、及び固有順位の意味を理論的背景に基づいて説明する。ネットワーク情報100が表すネットワーク上を仮想エージェントがランダムに遷移する状況を考え、ノード[n]に仮想エージェントが見出される確率をp(n)とするとき、p(n)は、任意の確率p(k)及び条件付き確率p(n|k)を用いて、p(n)=Σp(n|k)p(k)と表すことができる。本実施形態では、条件付き確率p(n|k)を、成分[k]にノード[n]が分類される分類割合p(n|k)と捉え、確率p(k)を、成分[k]の重要度π(k)と捉えて、それぞれを定めるべきパラメータθと捉える。パラメータθは、(N+1)×K−2個の実数値である。分類割合p(n|k)は、仮想エージェントを成分[k]に見出した場合に、仮想エージェントがノード[n]に見出される確率である。また、重要度π(k)は、仮想エージェントを成分[k]に見出す確率である。
パラメータθは、ネットワークを観測することによりデータxが得られたという条件の下で決定される。本実施形態において、データxとは、通過情報τ (d)である。通過情報τ (d)は、d回目の観測において、仮想エージェントがどのリンクを通過しているかを表す情報である。データxは、N×D個の0又は1の値である。
本実施形態では、パラメータθ(分類割合及び重要度)について仮定をした場合において、データx(通過情報)が得られる尤もらしさp(x|θ)を最大化することにより、パラメータθを決定する。すなわち、尤度関数p(x|θ)を最大化することによりパラメータθを推定するという最尤推定法を用いる。
本実施形態では、EMアルゴリズム(Expectation-Maximization algorithm)を用いてパラメータθの最尤推定を行う。そのため、p(x|θ)=Σp(x、z|θ)となる潜在変数z (d)を導入する。本実施形態において、潜在変数z (d)は成分の総数Kと同じ次元を有するベクトルであり、仮想エージェントが滞在する成分が成分[k]である場合にz=1、それ意外の要素は0である単位ベクトルである。潜在変数z (d)は、d回目の試行により得られた潜在変数を表す。潜在変数zは、K×D個の0又は1の値である。
EMアルゴリズムでは、尤度関数p(x|θ)を直接最大化するのではなく、より計算が簡明となる評価値Q=Σp(z|x、θ)log(P(x、z|θ))を最大化することによりパラメータθを決定する。尤度関数p(x|θ)ではなく評価値Qを最大化する場合であっても、尤度関数p(x|θ)を最大化するのと同じ結果が得られる。
本実施形態では、パラメータθ(分類割合及び重要度)についての仮定として、以下の数式(9)を与える。すなわち、パラメータθは数式(9)で表される確率分布に従うことを仮定する。これは、パラメータθの事前確率分布はディリクレ分布であると仮定することを意味する。
Figure 0006390239
ここで、p(n|k)、pt−1(m|k)は分解工程の逐次計算における分類割合であり、αは粒度101であり、Tnmはネットワーク情報100の構造から定まる遷移確率である。
パラメータθの従う確率分布P(θ)は、pt−1(n|k)からp(n|k)に遷移する確率P(p(n|k)|pt−1(n|k))を表すと捉えることもできる。ここで、α→∞の極限で、P(p(n|k)|pt−1(n|k))→δ(p(n|k)−Σnmt−1(m|k))となる。ここで、δは、いわゆるデルタ関数を表す。すなわち、粒度101を粗くするに従って、逐次計算におけるp(n|k)の発展を与える関係式は、ネットワーク上をランダムに遷移する場合に成立するp(n|k)=Σnmt−1(m|k)という関係に漸近していく。本実施形態において、αは、p(n|k)=Σnmt−1(m|k)という関係からのずれを表すパラメータということもできる。αが0に近付くほど、決定論的な関係p(n|k)=Σnmt−1(m|k)からのずれが大きくなる。
EMアルゴリズムでは、数式(6)に表した評価値Qをパラメータθであるp(n|k)及びπ(k)により偏微分し、評価値Qの最大値を与えるパラメータθを決定する。その結果は、分類割合p(n|k)について数式(3)となり、重要度π(k)について数式(5)となる。その後、評価値Qの最大値と、評価値Qt−1の最大値との差の絶対値が予め定められた基準値ε以下となった場合に逐次計算を終了し、p(n|k)及びπ(k)が決定される。
ここで、評価値を最大化する場合に拘束条件Σ(n|k)=1、及びΣπ(k)=1を考慮しなくてはならない。これらの拘束条件を評価値Qの表式中にラグランジュ未定乗数の方法で取り込むこととしてもよいし、拘束条件を解いた状態で計算を行うこととしてもよい。拘束条件を解いた状態とは、例えば、p(n=N|k)=1−p(n=1|k)−p(n=2|k)…−p(n=N−1|k)と定めた状態である。
帰属度q(k|n)は、数式(7)により求められる。数式(7)はベイズの定理として知られる関係式であり、帰属度q(k|n)は条件付き確率p(k|n)に等しい。帰属度q(k|n)は、仮想エージェントをノード[n]に見出した場合に、仮想エージェントが成分[k]に帰属する確率を表すものである。
固有順位p(n|I)は、条件付き確率であって、数式(8)により求められる。固有順位p(n|I)は、ユーザの興味ベクトルIが与えられた条件の下で、仮想エージェントをノード[n]に見出す確率を表す。
1 情報処理装置、2 第1の例における成分、3a,3b 第2の例における成分、4a,4b,4c 第3の例における成分、10 記憶部、11 入力部、12 制御部、13 表示部、100 ネットワーク情報、101 粒度、102 興味ベクトル、120取得部、121 算出部、122 帰属度算出部、123 固有順位算出部、1210 分類割合算出部、1211 重要度算出部。

Claims (6)

  1. 複数のノード及び前記複数のノードを結ぶ複数のリンクを含むネットワークの情報と、前記複数のノードを複数の成分に分類する粒度とを取得する取得手段と、
    前記複数の成分それぞれについて、前記複数のノードそれぞれが当該成分に分類される分類割合を、当該ノードとの間でリンクを有するノードの当該成分に関する前記分類割合が大きいほど大きな値となる第1の寄与と、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となる第2の寄与と、から構成される値により算出する分類割合算出手段と、
    前記複数のノードそれぞれについて、前記複数の成分に帰属する帰属度を、当該ノードが当該成分に分類される前記分類割合が大きいほど、大きな値となるように算出する帰属度算出手段と、
    前記複数の成分それぞれについて、前記複数の成分の重要度を、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となるように算出する重要度算出手段と、を備え、
    前記分類割合算出手段は、粒度を粗くすることで前記第2の寄与より前記第1の寄与の方が大きくなるように前記分類割合を算出し、
    前記帰属度算出手段は、前記複数のノードそれぞれについて、前記複数の成分に帰属する帰属度を、当該成分の前記重要度が大きいほど、大きな値となるように算出し、
    前記取得手段は、
    前記複数のノードそれぞれについて、ユーザの興味の多寡を表す数値をさらに取得し、
    前記複数のノードそれぞれについて、前記数値に基づく固有順位を、前記数値が相対的に大きいノードについての前記帰属度が相対的に大きい成分について、当該成分に帰属する前記帰属度が大きいノードほど上位となるように算出する固有順位算出手段をさらに備える、
    ことを特徴とする情報処理装置。
  2. 前記分類割合算出手段及び前記重要度算出手段は、逐次計算により前記分類割合及び前記重要度をそれぞれ算出し、
    前記第1の寄与は、前記粒度を粗くすると1に近付く第1の係数と、当該ノードとの間でリンクを有するノードに関して直前に算出された前記分類割合と、から定められ、
    前記第2の寄与は、前記粒度を粗くすると0に近付く第2の係数と、前記複数のノード間を前記複数のリンクに沿ってランダムに遷移する場合に通過するノードを示す複数の通過情報と、直前に算出された前記分類割合及び前記重要度から算出される前記複数の成分全体に対する当該成分が占める割合と、から定められる
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記複数のノードの1つをnと表し、前記複数の成分の1つをkと表し、ノードnが成分kに分類される前記分類割合のうち直前に算出された前記分類割合をpt−1(n|k)と表し、前記粒度をαと表し、ノードnとノードmとを結ぶリンクの情報をTnmと表し、ノードnの通過を示す前記複数の通過情報をτn(d)と表し、成分kの前記重要度のうち直前に算出された前記重要度をπt−1(k)と表し、
    直前に算出された前記分類割合pt−1(n|k)及び前記重要度πt−1(k)、並びに前記複数の通過情報τn(d)から算出される前記複数の成分全体に対する成分kが占める割合γt(d)(k)を
    γt(d)(k)=πt−1(k)Πn(pt−1(n|k))τn(d)/Σj(πt−1(j)Πm(pt−1(m|j))τm(d))
    と定め、
    Dt−1(k)=Σdγt−1(d)(k)
    と定める場合に、
    前記分類割合算出手段は、
    pt(n|k)=αΣmTnmpt−1(m|k)/(α+2Dt−1(k))+Σdγt−1(d)(k)τn(d)/(α+2Dt−1(k))
    の関係により前記分類割合を逐次計算し、
    前記重要度算出手段は、
    πt(k)=Dt−1(k)/ΣjDt−1(j)
    の関係により前記重要度を逐次計算し、
    Qt=ΣkΣdγt(d)(k)log(πt(k))+ΣkΣn(Σdγt(d)(k)τn(d)+αΣmTnmpt(m|k))log(pt(n|k))
    で定められる判定値Qtが、予め定められた数値εとの間で、
    |Qt−Qt−1|<ε
    の関係を満たす場合に、ノードnが成分kに分類される前記分類割合をp(n|k)=pt(n|k)、成分kの前記重要度をπ(k)=πt(k)、と定める
    ことを特徴とする請求項に記載の情報処理装置。
  4. ノードnが成分kに帰属する前記帰属度をq(k|n)と表す場合に、
    前記帰属度算出手段は、
    q(k|n)=π(k)p(n|k)/(Σjπ(j)p(n|j))
    の関係により前記帰属度を算出する
    ことを特徴とする請求項に記載の情報処理装置。
  5. ノードnについての、前記ユーザの興味の多寡を表す数値をInと表し、ノードnについての前記ユーザの前記固有順位をp(n|I)と表す場合に、
    前記固有順位算出手段は、
    p(n|I)=Σkp(n|k)Πm(q(k|m))Im/(ΣjΠr(q(j|r))Ir)
    の関係により前記固有順位を算出する
    ことを特徴とする請求項に記載の情報処理装置。
  6. 情報処理装置に備えられたコンピュータを、
    複数のノード及び前記複数のノードを結ぶ複数のリンクを含むネットワークの情報と、前記複数のノードを複数の成分に分類する粒度とを取得する取得手段、
    前記複数の成分それぞれについて、前記複数のノードそれぞれが当該成分に分類される分類割合を、当該ノードとの間でリンクを有するノードの当該成分に関する前記分類割合が大きいほど大きな値となる第1の寄与と、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となる第2の寄与と、から構成される値により算出する分類割合算出手段、
    前記複数のノードそれぞれについて、前記複数の成分に帰属する帰属度を、当該ノードが当該成分に分類される前記分類割合が大きいほど、大きな値となるように算出する帰属度算出手段、
    前記複数の成分それぞれについて、前記複数の成分の重要度を、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となるように算出する重要度算出手段、
    として機能させることを特徴とするプログラムであって、
    前記分類割合算出手段は、粒度を粗くすることで前記第2の寄与より前記第1の寄与の方が大きくなるように前記分類割合を算出し、
    前記帰属度算出手段は、前記複数のノードそれぞれについて、前記複数の成分に帰属する帰属度を、当該成分の前記重要度が大きいほど、大きな値となるように算出し、
    前記取得手段は、
    前記複数のノードそれぞれについて、ユーザの興味の多寡を表す数値をさらに取得し、
    前記複数のノードそれぞれについて、前記数値に基づく固有順位を、前記数値が相対的に大きいノードについての前記帰属度が相対的に大きい成分について、当該成分に帰属する前記帰属度が大きいノードほど上位となるように算出する固有順位算出手段として機能させる、
    プログラム。
JP2014151512A 2014-07-25 2014-07-25 情報処理装置、及びプログラム Expired - Fee Related JP6390239B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014151512A JP6390239B2 (ja) 2014-07-25 2014-07-25 情報処理装置、及びプログラム
US14/722,781 US9690969B2 (en) 2014-07-25 2015-05-27 Information processing apparatus, non-transitory computer readable medium, and information processing method
AU2015203002A AU2015203002B2 (en) 2014-07-25 2015-06-05 Information processing apparatus, program, and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014151512A JP6390239B2 (ja) 2014-07-25 2014-07-25 情報処理装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2016029526A JP2016029526A (ja) 2016-03-03
JP6390239B2 true JP6390239B2 (ja) 2018-09-19

Family

ID=55167674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014151512A Expired - Fee Related JP6390239B2 (ja) 2014-07-25 2014-07-25 情報処理装置、及びプログラム

Country Status (3)

Country Link
US (1) US9690969B2 (ja)
JP (1) JP6390239B2 (ja)
AU (1) AU2015203002B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201718756D0 (en) * 2017-11-13 2017-12-27 Cambridge Bio-Augmentation Systems Ltd Neural interface
JP6822182B2 (ja) 2017-02-03 2021-01-27 富士ゼロックス株式会社 プログラム及び情報処理装置
JP2018142095A (ja) 2017-02-27 2018-09-13 富士ゼロックス株式会社 プログラム及び情報処理装置
JP2019040285A (ja) * 2017-08-23 2019-03-14 富士ゼロックス株式会社 情報処理装置およびプログラム
US11884733B2 (en) 2018-02-08 2024-01-30 Dragonfly Therapeutics, Inc. Antibody variable domains targeting the NKG2D receptor
JP2020042488A (ja) 2018-09-10 2020-03-19 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2021060804A (ja) 2019-10-07 2021-04-15 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6047283A (en) 1998-02-26 2000-04-04 Sap Aktiengesellschaft Fast string searching and indexing using a search tree having a plurality of linked nodes
US20020184172A1 (en) * 2001-04-16 2002-12-05 Vladimir Shlain Object class definition for automatic defect classification
JP2006331292A (ja) 2005-05-30 2006-12-07 Nippon Telegr & Teleph Corp <Ntt> Weblogコミュニティ検索支援方法、検索支援装置および検索支援方法のプログラムを記録した記録媒体
JP2007241459A (ja) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd ドキュメントデータ分析装置
JP2007287046A (ja) 2006-04-19 2007-11-01 Toshiba Tec Corp 質問先選択サーバ及び質問先選択プログラム
US8407164B2 (en) * 2006-10-02 2013-03-26 The Trustees Of Columbia University In The City Of New York Data classification and hierarchical clustering
TW201123064A (en) * 2009-12-30 2011-07-01 Univ Nat Taiwan Science Tech Method for patent valuation and computer-readable storage medium
US8621070B1 (en) * 2010-12-17 2013-12-31 Netapp Inc. Statistical profiling of cluster tasks
JP5292384B2 (ja) 2010-12-21 2013-09-18 ヤフー株式会社 グラフインデックス再構成装置
JP5895813B2 (ja) * 2012-01-18 2016-03-30 富士ゼロックス株式会社 プログラム及び検索装置
CN103916950B (zh) * 2012-12-31 2018-11-23 中兴通讯股份有限公司 时间同步方法及系统

Also Published As

Publication number Publication date
JP2016029526A (ja) 2016-03-03
AU2015203002B2 (en) 2016-12-08
AU2015203002A1 (en) 2016-02-11
US20160028850A1 (en) 2016-01-28
US9690969B2 (en) 2017-06-27

Similar Documents

Publication Publication Date Title
JP6390239B2 (ja) 情報処理装置、及びプログラム
JP7104244B2 (ja) ユーザタグ生成方法並びにその、装置、コンピュータプログラム及びコンピュータ機器
CN110969516B (zh) 一种商品推荐方法及装置
Chormunge et al. Correlation based feature selection with clustering for high dimensional data
Cooper et al. Coalescing random walks and voting on connected graphs
CN107357793B (zh) 信息推荐方法和装置
CN107330115A (zh) 一种信息推荐方法及装置
CN109120462A (zh) 机会网络链路的预测方法、装置及可读存储介质
JP7495777B2 (ja) 物理的システムに影響を与えるイベントの予測
JP2024503774A (ja) 融合パラメータの特定方法及び装置、情報推奨方法及び装置、パラメータ測定モデルのトレーニング方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
JP6511951B2 (ja) 情報処理装置及びプログラム
CN113239266B (zh) 基于局部矩阵分解的个性化推荐方法及系统
CN110245310B (zh) 一种对象的行为分析方法、装置及存储介质
CN109241442B (zh) 基于预测值填充的项目推荐方法、可读存储介质和终端
Pobiedina et al. Predicting citation counts for academic literature using graph pattern mining
JP6927409B2 (ja) 情報処理装置、制御方法、及びプログラム
Fradi et al. A new approach for reusable 3D CAD objects detection, by similarity calculation based on Bayesian network models (BNM)
Ni et al. Models and algorithm for the orienteering problem in a fuzzy environment
CN116383458A (zh) 信息推送的方法及装置
WO2016116958A1 (ja) 系列データ分析装置及プログラム
Cai et al. Heterogeneous context-aware recommendation algorithm with semi-supervised tensor factorization
Cui et al. Probabilistic model for online 3D printing service evaluation
Li et al. Learning management knowledge for manufacturing systems in the early stages using time series data
Hasan et al. A comprehensive collaborating filtering approach using extended matrix factorization and autoencoder in recommender system
WO2020261449A1 (ja) 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180724

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180806

R150 Certificate of patent or registration of utility model

Ref document number: 6390239

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees