[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5147162B2 - オブジェクトの類似性を異種の関係に基づいて判定するための方法およびシステム - Google Patents

オブジェクトの類似性を異種の関係に基づいて判定するための方法およびシステム Download PDF

Info

Publication number
JP5147162B2
JP5147162B2 JP2005142845A JP2005142845A JP5147162B2 JP 5147162 B2 JP5147162 B2 JP 5147162B2 JP 2005142845 A JP2005142845 A JP 2005142845A JP 2005142845 A JP2005142845 A JP 2005142845A JP 5147162 B2 JP5147162 B2 JP 5147162B2
Authority
JP
Japan
Prior art keywords
similarity
type
objects
relationship
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005142845A
Other languages
English (en)
Other versions
JP2005327299A5 (ja
JP2005327299A (ja
Inventor
チャン ベンユー
シェー グイ−ロン
チェン ホア−ジュン
マ ウェイ−イン
チェン ツェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2005327299A publication Critical patent/JP2005327299A/ja
Publication of JP2005327299A5 publication Critical patent/JP2005327299A5/ja
Application granted granted Critical
Publication of JP5147162B2 publication Critical patent/JP5147162B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Complex Calculations (AREA)
  • Stored Programmes (AREA)

Description

記載の技術は一般に、オブジェクトの類似性を判定することに関し、より詳細には、類似性をオブジェクト関係に基づいて判定することに関する。
GoogleやOvertureなど多くの検索エンジンサービスでは、インターネットを介してアクセス可能な情報を検索することができる。これらの検索エンジンサービスにより、ユーザは、ウェブページなど、ユーザに関心のあるかもしれない表示ページを検索することができる。ユーザが検索語を含む検索要求(「クエリ」とも呼ばれる)をサブミットした後、検索エンジンサービスは、これらの検索語に関係する可能性のあるウェブページを識別する。関係するウェブページを素早く識別するために、検索エンジンサービスは、ウェブページに対するキーワードのマッピングを維持管理することがある。検索エンジンサービスは、ウェブ(すなわちワールドワイドウェブ)を「クロール」して各ウェブページのキーワードを抽出することによって、このマッピングを生成することができる。ウェブをクロールするために、検索エンジンサービスは、ルートウェブページのリストを使用することができ、これらのルートウェブページを介してアクセス可能なすべてのウェブページを識別することができる。任意の特定のウェブページのキーワードは、見出しの単語、ウェブページのメタデータ中で供給される単語、強調表示されている単語等を識別するなど、様々な周知の情報検索技法を使用して抽出することができる。検索エンジンサービスは、各ウェブページが検索要求にどのくらい関連するかを示す関連性スコアを、各マッチの近さやウェブページの人気(例えばGoogleのページランク)などに基づいて計算することができる。次いで検索エンジンサービスは、これらのウェブページへのリンクを、その関連性に基づく順序でユーザに対して表示する。検索エンジンは、より一般的に、任意の文書の集まりの中で情報検索を提供することもできる。例えば、文書の集まりには、すべての米国特許、すべての連邦裁判所見解、会社のすべてのアーカイブされた文書などが含まれ得るであろう。
検索エンジンサービスは、ウェブページやクエリなど様々なオブジェクト間の類似性を測定する必要がある場合がある。例えば、検索エンジンサービスは対話式クエリ拡張を可能にする場合があるが、これはクエリ語と他の語との間での類似性計算を必要とする。別の例として、検索エンジンサービスは、ユーザがウェブページをナビゲートするのを補助するために、ウェブページを類似ウェブページのクラスタにグループ化したい場合がある。オブジェクトの類似性を判定するための典型的なアルゴリズムは、一般に、オブジェクトに関係する特徴ベクトルを使用し、次いで特徴ベクトル間の距離を類似性の指示として計算する。例えば、ウェブページは、類似性の計算に使用されるキーワードや内容などを含む特徴を有することがある。ほとんどのアルゴリズムは、類似性を判定するとき、オブジェクトに関連する特徴だけに依拠する。例えば、ウェブページ間の類似性は、ウェブページの内容だけに基づくものとすることができる。しかし、いくつかのアルゴリズムは、異種のオブジェクトに基づく特徴を計算に入れる。例えば、あるアルゴリズムはクリックスルーデータを使用し、クエリが同じ語を含む場合、またはクエリによってユーザが同じウェブページを選択することになる場合、これらのクエリは類似する。したがって、このようなクエリの特徴ベクトルは、ユーザによって選択されたクエリ結果のウェブページに関する情報を含むことになろう。
しかし、これらの技法は、あるタイプのオブジェクト間の類似性を計算するとき、関係する可能性のある別のタイプのオブジェクト間の類似性を考慮に入れることができない。すなわち、あるタイプのオブジェクトの類似性測定値は、別のタイプのオブジェクトの類似性測定値に関係する場合がある。例えば、あるクエリは、ユーザが選択またはクリックスルーする結果のウェブページ間の類似性に部分的に基づいて、別のクエリと類似する場合がある。逆に、ウェブページは、これらのウェブページをクエリの結果中で返すクエリ間の類似性に部分的に基づいて、別のウェブページと類似する場合がある。異種のオブジェクト間の関係を計算に入れた、オブジェクトの類似性を測定する技法を有することが望ましいであろう。
同じタイプおよび異なるタイプのオブジェクトとの関係、ならびにこれらのオブジェクトの別のオブジェクトに対する類似性に基づいて、オブジェクトの類似性を測定するための方法およびシステムが提供される。一実施形態では、類似性システムは、各オブジェクトタイプについて、タイプ内およびタイプ間の類似性関数を定義する。類似性システムは、あるタイプについてのタイプ内およびタイプ間の類似性関数を組み合わせて、そのタイプについての全体的な類似性関数とすることができる。類似性関数を定義した後、類似性システムは、オブジェクトの属性値を収集する。属性値は、同じタイプのオブジェクト間の関係データ(タイプ内関係と呼ばれる)、および異なるタイプのオブジェクト間の関係(タイプ間関係と呼ばれる)を含むことができる。オブジェクトの属性値を収集した後、類似性システムは、類似性が解に収束するまで反復的にオブジェクトの類似性を計算することによって、タイプ内およびタイプ間の類似性関数を解く。
同じタイプおよび異なるタイプのオブジェクトとの関係、ならびにこれらのオブジェクトの別のオブジェクトに対する類似性に基づいて、オブジェクトの類似性を測定するための方法およびシステムが提供される。一実施形態では、類似性システムは、各オブジェクトタイプについて、タイプ内およびタイプ間の類似性関数を定義する。タイプ内類似性関数は、同じタイプのオブジェクト間の類似性を測定する。例えば、クエリ間のタイプ内類似性関数は、クエリをサブミットするユーザの属性に基づいてクエリの検索語がどのくらい近くマッチするかに基づくことができる。オブジェクト間のタイプ内類似性はまた、同じタイプの他のオブジェクトの類似性に依存することもできる。例えば、2つのクエリがそれぞれ第3のクエリに対して高い類似性を有する場合、2つのクエリは、より相互に類似する場合がある。このような、他のオブジェクトとの類似性に基づくオブジェクト間のタイプ内類似性は、再帰関数を定義する。タイプ間類似性関数は、類似性を含む別のタイプのオブジェクトの属性に基づいて、あるタイプの2つのオブジェクト間の類似性を測定する。例えば、ユーザがクリックスルーするあるクエリの結果のウェブページが、ユーザがクリックスルーする別のクエリの結果のウェブページと類似する場合、2つのクエリはより類似する可能性がある。別のタイプのオブジェクトの類似性もまた、あるタイプのオブジェクトとの類似性に依存することがある。さらに、あるタイプのオブジェクトの類似性が別のタイプのオブジェクトの類似性に依存することがあり、またその逆もあるので、タイプ間類似性関数は、様々なタイプ間で再帰的である。
オブジェクトのタイプは、そのタイプのオブジェクトに対し、オブジェクトの種々の属性に基づいて定義された様々な類似性定義を有することができる。例えば、ウェブページは、ウェブページの内容に基づくタイプ内類似性と、ウェブページ間のリンクに基づく別のタイプ内類似性とを有することができる。類似性システムは、あるタイプについてのタイプ内およびタイプ間の類似性関数を組み合わせて、そのタイプについての全体的な類似性関数とすることができる。一実施形態では、類似性システムは、線形式によってタイプ内およびタイプ間の類似性関数を組み合わせ、タイプ内とタイプ間の類似性関数それぞれには、そのタイプのオブジェクト間の全体的な類似性を表す際に、その知覚された精度に基づいて重みが適用される。例えば、高い精度のタイプ内類似性関数には高い重みを与え、低い精度のタイプ内類似性関数には低い重みを与えることができる。
類似性関数を定義した後、類似性システムは、オブジェクトの属性値を収集する。属性値は、同じタイプのオブジェクト間の関係データ(タイプ内関係と呼ばれる)、および異なるタイプのオブジェクト間の関係(タイプ間関係と呼ばれる)を含むことができる。例えば、ウェブページは、ウェブページのキーワードに対応する非関係ベースの属性値を有することができる。ウェブページはまた、ウェブページ間の入リンクおよび出リンクに基づくタイプ内関係を有することもできる。ウェブページは、クエリ結果からウェブページへのクリックスルーに基づく、クエリとのタイプ間関係を有することもできる。
オブジェクトの属性値を収集した後、類似性システムは、類似性が解に収束するまで反復的にオブジェクトの類似性を計算することによって、タイプ内およびタイプ間の類似性関数を解く。類似性関数の再帰的な性質のため、類似性システムは反復的アプローチを用いる。類似性システムは、類似性が初期化された状態で開始し、次いで、初期類似性に基づいて各オブジェクトタイプについて類似性関数を計算して、新しい類似性を出す。類似性システムは、新しい類似性と古い類似性との差を測定して、類似性が解に収束したかどうかを判定する。収束した場合は、この新しい類似性が解を表す。収束していない場合は、新しい類似性は古い類似性になり、類似性システムは処理を繰り返す。このように類似性システムは、あるタイプのオブジェクトの類似性を、別のタイプのオブジェクトの類似性に基づいて、また様々なタイプのオブジェクト間の関係に基づいて計算する。
以下、検索エンジンのコンテキストにおける類似性システムの処理の例を提供する。類似性システムは、検索エンジンによって使用されるオブジェクト(例えばウェブページやクエリ)および関係(例えば入リンクやクリックスルー)を、有向グラフG=(V,E)としてモデル化し、ノードVは検索エンジンのオブジェクトを表し、エッジEはオブジェクト間の関係を表す。ノードVは、2つの部分集合Q={q1,q2,...,qm}とP={p1,p2,...,pn}とに分割することができ、Qはクエリを表し、Pはウェブページを表す。これらのウェブページおよびクエリの間の関係は、入リンク関係(IL)、出リンク関係(OL)、クリックスルー関係(CT)を含むことができる。グラフ中のノードvについて、MR(v)は、ノードvと関係Rを有する隣接ノードの集合を表す。例えば、MIL(v)は、ウェブページvへの入リンクのソースであるウェブページの集合を表す。
Figure 0005147162
は、集合中のi番目のウェブページを示す。類似性システムは、類似性行列Sを使用してオブジェクト間の類似性を表し、S[a,b]は、オブジェクトaとbとの類似性を表す。
類似性システムは、あるタイプのオブジェクト同士が、別のタイプの相互に関連のあるオブジェクトの類似性に部分的に基づいて類似するという原理に基づいている。あるタイプの2つのオブジェクトが別のタイプの同じ1つのオブジェクトとの関係を有する場合、2つのオブジェクトはある程度類似する。また、同じタイプの2つのオブジェクトが、別のタイプの、異なるが類似する2つのオブジェクトとの関係を有する場合も、2つのオブジェクトはある程度類似する。類似性システムは、この原理を以下の式で表す。
Figure 0005147162
上式で、
Figure 0005147162
は、タイプO1のオブジェクトaとbとの類似性を表す。
Figure 0005147162
は、別のタイプのオブジェクトiとjとの間の類似性を表す。Rは、類似性が基づくタイプ間関係を表し、Cは重み係数である。aがbと等しい場合、
Figure 0005147162
は1になるように定義される。すなわち、オブジェクトとそれ自体との類似性は、最大類似性1を定義する。aとbが両方ともO2中の同じオブジェクトAに関係する場合、
Figure 0005147162
は1であり、これは
Figure 0005147162
への最大寄与をもたらす。aとbのどちらかが近隣を有さない場合、すなわちO2中のオブジェクトとの関係を有さない場合は、|MR(a)|または|MR(b)|は0に等しくなるであろう。このような場合、類似性システムは、
Figure 0005147162
を0に設定し、0による除算を防ぐ。例として、O1がオブジェクトaおよびbを含み、O2がオブジェクトA、B、Cを含み、aがAおよびBに関係し、bがBおよびCに関係すると仮定する。
Figure 0005147162
が0.7、
Figure 0005147162
が0.7、
Figure 0005147162
が0.49であり、重み係数が0.7である場合、式1を適用することにより、
Figure 0005147162
は0.5である(例えば0.7/4*(0.7+0.49+1.0+0.7))。
類似性システムは、タイプ内類似性関数とタイプ間類似性関数から得られる類似性の組み合わせに基づいて、あるタイプのオブジェクトの全体的な類似性を定義する。一実施形態では、類似性システムは、以下の式で表されるように、タイプ内類似性関数およびタイプ間類似性関数の類似性の一次結合を使用する。
Figure 0005147162
上式で、SintraおよびSinterは、タイプ内類似性関数およびタイプ間類似性関数から得られる類似性を表し、αおよびβは類似性に対する重みであり、α+β=1である。αおよびβに様々な値を割り当てることにより、類似性システムは、全体的な類似性に対する様々な類似性関数の寄与を調整することができる。前述のように、あるオブジェクトの類似性を別のオブジェクトの類似性に基づいて定義することができ、別のオブジェクトの類似性はあるオブジェクトの類似性に基づいて定義することができるので、式2は再帰的に定義することができる。一実施形態では、類似性システムは、類似性が収束する(すなわち‖Si−Si-1‖<ε(εは差分しきい値))まで類似性を計算することによって、類似性関数を反復的に解く。
検索エンジンのコンテキストでは、類似性システムは、クエリの内容だけを使用してタイプ内類似性関数を定義することができる。内容に基づくタイプ内類似性関数は、以下の式で定義することができる。
Figure 0005147162
上式で、aおよびbはクエリであり、SQCは、内容に基づく、クエリの内容類似性行列である。例として、クエリaおよびbが2つの検索語(またはキーワード)を有し、一方のキーワードが共通であるとき、これらの類似性値は0.33(すなわち1/3)になる。類似性システムは、以下の式により、ウェブページとのクリックスルー関係に基づく、クエリについてのタイプ間類似性関数を定義することができる。
Figure 0005147162
上式で、SQCTは、クリックスルーに基づく、クエリの類似性行列を表す。SPCTは、クリックスルーに基づく、ウェブページの類似性行列を表す。MCT(a)は、クエリログから識別される、クエリaからウェブページへのクリックスルーを表す。CCTは重み係数である。類似性システムは、式(3)と(4)を組み合わせて、クエリについての全体的な類似性関数とする。これは以下の式で表される。
Figure 0005147162
上式で、SQは、クエリの全体的な類似性行列を表す。
類似性システムは、入リンクおよび出リンクのタイプ内関係、ならびにウェブページへのクリックスルーをもたらすクエリとのタイプ間関係に基づいて、ウェブページの類似性を表す。類似性システムは、2つのウェブページが同じウェブページ(または類似するウェブページ)からリンクされているときに2つのウェブページが類似する可能性があることを反映するように、入リンク関係に基づくタイプ内類似性関数を定義する。類似性システムはまた、2つのウェブページが同じウェブページ(または類似するウェブページ)にリンクしているときに2つのウェブページが類似する可能性があることを反映するように、出リンク関係に基づくタイプ間類似性関数を定義する。類似性システムは、以下の式により、出リンクおよび入リンクの関係に基づく、ウェブページについてのタイプ内類似性関数を表す。
Figure 0005147162
Figure 0005147162
上式で、AおよびBはウェブページを表し、COLおよびCILは重み係数を表す。SOLおよびSILは、出リンクおよび入リンクに基づく類似性行列である。MOL(A)は、ウェブページAからの出リンクの宛先ウェブページを表し、MIL(A)は、ウェブページAへの入リンクのウェブページのソースを表す。類似性システムは、以下の式により、クリックスルー関係に基づく、ウェブページについてのタイプ間類似性関数を表す。
Figure 0005147162
上式で、MCT(A)は、ウェブページAにアクセスするためにユーザがクリックスルーするクエリを表す。式8は式4(すなわちSQCT)で定義され、またその逆でもあるので、これらの1対の式は再帰関数を定義する。類似性システムは、ウェブページについての全体的な類似性関数を、タイプ内類似性関数およびタイプ間類似性関数の一次結合として定義し、これは以下の式で表される。
Figure 0005147162
上式で、SPはウェブページについての類似性行列を表し、α’、β’、γ’は重みであって、α’+β’+γ’=1である。
このように類似性システムは、統一されたフレームワークを使用して、異種のオブジェクトとそれらのタイプ間関係を統合する。全体的な類似性関数は再帰的なので、類似性システムは、類似性関数を同時に、そして反復的に解く。類似性関数は、上に定義したように、以下の式で表される。
Figure 0005147162
式10でわかるように、任意の2つのクエリ間におけるタイプ間類似性は、ウェブページ類似性、タイプ内とタイプ間の両方の類似性に影響される。ウェブページ間のタイプ間類似性は、タイプ内とタイプ間の両方のクエリ類似性に影響されるので、式10は再帰的関係を定義する。したがって、ウェブページおよびクエリの類似性は、互いに拡がり、安定状態に収束する。
図1は、一実施形態における類似性システムのコンポーネントを示すブロック図である。ウェブサイト101が、通信リンク102を介して類似性システム110に接続されている。類似性システムは、類似性計算コンポーネント111、類似性関数定義コンポーネント112、関係確立コンポーネント113、類似性関数解決コンポーネント114を備える。類似性計算コンポーネントは、タイプ間関係と他のタイプのオブジェクトの類似性とに基づいて、オブジェクト間の類似性を計算する。類似性計算コンポーネントは、類似性関数定義コンポーネント、関係確立コンポーネント、類似性関数解決コンポーネントを呼び出す。類似性関数定義コンポーネントは、ユーザと対話して、オブジェクトのタイプと、オブジェクト間の関係と、各タイプのオブジェクトについての様々な類似性関数とを定義することができる。関係確立コンポーネントは、収集されたデータに基づいて関係データを生成する。例えば、収集データは、クエリ、クエリ結果のウェブページ、クエリログを含むことができる。類似性関数解決コンポーネントは、定義された類似性関数を反復的に計算して更新された類似性行列を生成し、類似性行列の類似性が解に収束するまで反復する。
類似性システムが実現されるコンピューティングデバイスは、中央処理装置、メモリ、入力デバイス(例えばキーボードやポインティングデバイス)、出力デバイス(例えば表示デバイス)、記憶デバイス(例えばディスクドライブ)を備えることができる。メモリおよび記憶デバイスは、類似性システムを実現する命令を含むことのできるコンピュータ可読媒体である。また、データ構造およびメッセージ構造は、通信リンク上の信号としてデータ伝送媒体を介して記憶または伝送することができる。インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、ポイントツーポイントダイヤルアップ接続など、様々な通信リンクを使用することができる。
類似性システムは、様々な動作環境で実現することができる。使用に適するであろう様々な周知のコンピューティングシステム、環境、構成には、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイスまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、プログラム可能な民生用電子機器、ネットワークPC、ミニコンピュータ、メインフレームコンピュータが含まれ、また、これらのシステムまたはデバイスのいずれかを含む分散コンピューティング環境などが含まれる。
類似性システムは、プログラムモジュールなど、1つまたは複数のコンピュータまたはその他のデバイスによって実行されるコンピュータ実行可能命令の一般的なコンテキストで述べることができる。一般に、プログラムモジュールは、特定のタスクを実行するか特定の抽象データ型を実現するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを含む。通常、プログラムモジュールの機能は、様々な実施形態で望まれるように組み合わせたり、分散させたりすることができる。
図2は、一実施形態における類似性関数定義コンポーネントの処理を示す流れ図である。ブロック201〜209で、コンポーネントは、各オブジェクトタイプを選択し、そのタイプのオブジェクトについてタイプ内およびタイプ間の類似性関数を定義しながらループする。一実施形態では、コンポーネントは、ユーザと対話して、オブジェクト間のタイプ内関係およびタイプ間関係を定義することができる。コンポーネントはまた、クエリの検索語に基づく類似性など、オブジェクト間の類似性に再帰的に基づかない類似性関数を定義することもできる。ブロック201で、コンポーネントは、次のオブジェクトタイプを選択する。判定ブロック202で、すべてのオブジェクトタイプがすでに選択されている場合は、コンポーネントはリターンし、そうでない場合は、コンポーネントはブロック203で継続する。ブロック203で、コンポーネントは、選択されたタイプについて次のタイプ内関係を選択する。判定ブロック204で、すべてのタイプ内関係がすでに選択されている場合は、コンポーネントはブロック206で継続し、そうでない場合は、コンポーネントはブロック205で継続する。ブロック205で、コンポーネントは、選択されたタイプおよび関係についてタイプ内類似性関数を定義する。次いでコンポーネントは、ブロック203にループして次のタイプ内関係を選択する。ブロック206で、コンポーネントは、選択されたタイプについて次のタイプ間関係を選択する。判定ブロック207で、すべてのタイプ間関係がすでに選択されている場合は、コンポーネントはブロック209で継続し、そうでない場合は、コンポーネントはブロック208で継続する。ブロック208で、コンポーネントは、選択されたタイプおよび関係についてタイプ間類似性関数を定義する。次いでコンポーネントは、ブロック206にループして次のタイプ間関係を選択する。ブロック209で、コンポーネントは、選択されたタイプについて定義されたタイプ内類似性関数およびタイプ間類似性関数を組み合わせることによって、全体的な類似性関数を定義する。コンポーネントは、組み合わされた類似性関数のそれぞれに重み係数を適用することができる。コンポーネントは、ブロック201にループして次のオブジェクトタイプを選択する。
図3は、一実施形態における関係確立コンポーネントの処理を示す流れ図である。コンポーネントは、収集されたデータを処理し、関係データを生成する。ブロック301〜308で、コンポーネントは、各オブジェクトタイプを選択し、そのオブジェクトタイプについて関係データを生成しながらループする。ブロック301で、コンポーネントは、次のオブジェクトタイプを選択する。判定ブロック302で、すべてのタイプがすでに選択されている場合は、コンポーネントはリターンし、そうでない場合は、コンポーネントはブロック303で継続する。ブロック303で、コンポーネントは、選択されたタイプについて次のタイプ内関係を選択する。判定ブロック304で、すべてのタイプ内関係がすでに選択されている場合は、コンポーネントはブロック306で継続し、そうでない場合は、コンポーネントはブロック305で継続する。ブロック305で、コンポーネントは、選択されたタイプおよび選択されたタイプ内関係について、関係データの要素を設定する。次いでコンポーネントは、ブロック303にループして次のタイプ内関係を選択する。ブロック306で、コンポーネントは、選択されたタイプについて次のタイプ間関係を選択する。判定ブロック307で、すべてのタイプ間関係がすでに選択されている場合は、コンポーネントはブロック301にループして次のオブジェクトタイプを選択し、そうでない場合は、コンポーネントはブロック308で継続する。ブロック308で、コンポーネントは、選択されたタイプおよび選択されたタイプ間関係について、関係データの要素を設定する。次いでコンポーネントは、ブロック306にループして、選択されたタイプについて次のタイプ間関係を選択する。
図4は、一実施形態における類似性関数解決コンポーネントの処理を示す流れ図である。ブロック401で、コンポーネントは、類似性行列を初期化する。例えば、コンポーネントは、対角線の類似性値を1に設定して最大類似性を示し、他の類似性値を乱数に設定することができる。ブロック402で、コンポーネントは、少なくとも1回の反復が実行されるように、差分値を非常に大きい数に設定する。ブロック403〜408で、コンポーネントは、複数の反復での全体的な類似性関数を計算して、類似性値が解に収束するまで類似性行列を更新しながらループする。ブロック403で、コンポーネントは次の反復を選択する。判定ブロック404で、このタイプの類似性についての差分値の合計がしきい値差分未満である場合は、解は収束しており、コンポーネントはリターンする。そうでない場合は、コンポーネントはブロック405で継続する。ブロック405で、コンポーネントは次のオブジェクトタイプを選択する。判定ブロック406で、すべてのタイプがすでに選択されている場合は、コンポーネントはブロック408で継続し、そうでない場合は、コンポーネントはブロック407で継続する。ブロック407で、コンポーネントは、選択されたタイプについて類似性関数を計算して、選択されたタイプについての類似性行列を更新し、次いでブロック405にループして次のタイプを選択する。ブロック408で、コンポーネントは、選択されたタイプについて、この反復の類似性値と前の反復の類似性値との差を計算する。次いでコンポーネントは、ブロック403にループして次の反復を開始する。
図5は、一実施形態における類似性計算コンポーネントの処理を示す流れ図である。コンポーネントは、オブジェクトのタイプを渡され、そのタイプについての類似性行列を更新する。ブロック501で、コンポーネントは、渡されたタイプについて次のタイプ内類似性関数を選択する。判定ブロック502で、すべてのタイプ内類似性関数がすでに選択されている場合は、コンポーネントはブロック504で継続し、そうでない場合は、コンポーネントはブロック503で継続する。ブロック503で、コンポーネントは、渡されたタイプの各オブジェクトについて、新しい類似性値を計算する。次いでコンポーネントは、ブロック501にループして次のタイプ内類似性関数を選択する。ブロック504で、コンポーネントは、渡されたタイプについて次のタイプ間類似性関数を選択する。判定ブロック505で、すべてのタイプ間類似性関数がすでに選択されている場合は、コンポーネントはブロック507で継続し、そうでない場合は、コンポーネントはブロック506で継続する。ブロック506で、コンポーネントは、選択されたタイプ間類似性関数を使用して、渡されたタイプの各オブジェクトについて新しい類似性値を計算する。次いでコンポーネントは、ブロック504にループして次のタイプ間類似性関数を選択する。ブロック507で、コンポーネントは、重みを使用して行列を組み合わせ、現在の反復で渡されたタイプについての全体的な類似性を生成する。次いでコンポーネントはリターンする。
本明細書では説明のために類似性システムの特定の実施形態について述べたが、本発明の趣旨および範囲を逸脱することなく様々な修正を加えることができることを当業者は理解するであろう。したがって、本発明は、添付の特許請求の範囲による以外には限定されない。
一実施形態における類似性システムのコンポーネントを示すブロック図である。 一実施形態における類似性関数定義コンポーネントの処理を示す流れ図である。 一実施形態における関係確立コンポーネントの処理を示す流れ図である。 一実施形態における類似性関数解決コンポーネントの処理を示す流れ図である。 一実施形態における類似性計算コンポーネントの処理を示す流れ図である。
符号の説明
101 ウェブサイト1
101 ウェブサイトN
102 通信リンク
110 類似性システム
111 類似性計算
112 類似性関数定義
113 関係確立
114 類似性関数解決

Claims (31)

  1. オブジェクト間の類似性の測定値を生成するためのコンピュータシステムによって実行される方法であって、各オブジェクトは複数のタイプのうちの1つを有し、1つのタイプはタイプ内関係を有し、タイプの対はタイプ間関係を有し、前記コンピュータシステムは、
    各タイプにつき、
    そのタイプの類似性がタイプ内関係に基づくとき、そのタイプのオブジェクト間の類似性を測定する当該関係ごとのタイプ内類似性関数と、
    そのタイプの類似性がタイプ間関係に基づくとき、別のタイプのオブジェクトの類似性に基づいてそのタイプのオブジェクト間の類似性を測定する当該関係ごとのタイプ間類似性関数であって、当該タイプ間類似性関数は、そのタイプの第1のオブジェクトと第2のオブジェクトの類似性について生成し、前記第1のオブジェクトと第2のオブジェクトの類似性は、前記第1のオブジェクトと関係を有するオブジェクトと前記第2のオブジェクトと関係を有するオブジェクトから成る前記別のタイプのオブジェクトの対の間の類似性の加重平均であるタイプ間類似性関数と、
    そのタイプについての任意のタイプ内類似性関数および任意のタイプ間類似性関数に基づいてそのタイプのオブジェクト間の類似性を測定する類似性関数と、
    各関係につき、オブジェクト間のその関係を定義するデータと
    格納するメモリ含み、前記方法は、
    前記メモリに含まれるデータによって定義される関係に基づいて、前記コンピュータシステムのプロセッサが、前記オブジェクト間の類似性の測定値が収束するまで、前記類似性関数を反復的に解くことと
    を備えることを特徴とする方法。
  2. あるタイプについてのタイプ内類似性関数は、そのタイプの類似性関数に基づいて再帰的に定義されることを特徴とする請求項1に記載の方法。
  3. あるタイプについてのタイプ間類似性関数は、別のタイプの類似性関数に基づいて再帰的に定義されることを特徴とする請求項1に記載の方法。
  4. あるタイプについての前記類似性関数は、そのタイプについてのタイプ内およびタイプ間の類似性関数の一次結合であることを特徴とする請求項1に記載の方法。
  5. 各タイプ内およびタイプ間の類似性関数に重みが与えられることを特徴とする請求項4に記載の方法。
  6. そのタイプについての前記タイプ内およびタイプ間の類似性関数に対する重みの合計は1であることを特徴とする請求項5に記載の方法。
  7. 前記タイプ間類似性関数は、そのタイプの第1および第2のオブジェクトについての類似性を測定し、該類似性が他のタイプのオブジェクトの対の間の類似性であって、前記第1のオブジェクトと関係を有する前記対の一方のオブジェクトと前記第2のオブジェクトと関係を有する前記対の他方のオブジェクトを有する前記他のタイプのオブジェクトの対の間の類似性に基づくことを特徴とする請求項1に記載の方法。
  8. 前記類似性関数は、ある反復から次の反復への類似性に基づく差分尺度が収束するときに解かれることを特徴とする請求項7に記載の方法。
  9. 前記類似性関数は、ある反復から次の反復への類似性に基づく差分尺度がしきい値差分未満のときに解かれることを特徴とする請求項7に記載の方法。
  10. オブジェクトの前記タイプはウェブページおよびクエリを含み、クエリとウェブページとの間のタイプ間関係はクエリからウェブページへのクリックスルーに基づくことを特徴とする請求項1に記載の方法。
  11. オブジェクトの前記タイプはウェブページおよびクエリを含み、ウェブページについてのタイプ内関係は入リンクおよび出リンクに基づき、ウェブページとクエリとの間のタイプ間関係はクエリからウェブページへのクリックスルーに基づくことを特徴とする請求項1に記載の方法。
  12. オブジェクト間の類似性の測定値を生成するためにコンピュータシステムを制御するための命令を収容したコンピュータ可読媒体であって、各オブジェクトは複数のタイプの1つを有し、前記コンピュータシステムは、
    各タイプにつき、そのタイプについてタイプ内類似性が定義されたときそのタイプのオブジェクト間のタイプ内類似性と、そのタイプについてタイプ間類似性が定義されたとき別のタイプのオブジェクトの類似性に基づくそのタイプのオブジェクト間のタイプ間類似性とに基づいて、そのタイプのオブジェクト間の類似性を測定する類似性関数であって、そのタイプの第1のオブジェクトと第2のオブジェクトのタイプ間類似性は、前記第1のオブジェクトと関係を有するオブジェクトと前記第2のオブジェクトと関係を有するオブジェクトから成る前記別のタイプのオブジェクトの対の間のタイプ内類似性の加重平均である類似性関数と、
    各関係につき、オブジェクト間のその関係を定義するデータと
    格納するメモリ含み、前記命令は、前記コンピュータシステムのプロセッサ
    前記メモリに含まれるデータによって定義される前記関係に基づいて、前記オブジェクト間の類似性の測定値が収束するまで、前記類似性関数を反復的に解かせることを特徴とするコンピュータ可読媒体。
  13. 前記類似性関数は、線形式のセットを定義することを特徴とする請求項12に記載のコンピュータ可読媒体。
  14. 類似性関数は、異なるタイプのオブジェクトの類似性に基づいて再帰的に定義されることを特徴とする請求項12に記載のコンピュータ可読媒体。
  15. 類似性関数は、種々の関係についてのそのタイプのオブジェクトの類似性に基づいて再帰的に定義されることを特徴とする請求項12に記載のコンピュータ可読媒体。
  16. あるタイプについての前記類似性関数は、そのタイプについてのタイプ内およびタイプ間の類似性関数の一次結合であることを特徴とする請求項12に記載のコンピュータ可読媒体。
  17. 各タイプ内およびタイプ間の類似性に重みが与えられることを特徴とする請求項16に記載のコンピュータ可読媒体。
  18. そのタイプについての前記タイプ内およびタイプ間の類似性に対する重みの合計は1であることを特徴とする請求項17に記載のコンピュータ可読媒体。
  19. 前記タイプ間類似性関数は、そのタイプの第1および第2のオブジェクトについての類似性を生成し、該類似性は、他のタイプのオブジェクトの対の間の類似性であって、前記第1のオブジェクトと関係を有する前記対の一方のオブジェクトと前記第2のオブジェクトと関係を有する前記対の他方のオブジェクトを有する前記他のタイプのオブジェクトの対の間の類似性に基づくことを特徴とする請求項12に記載のコンピュータ可読媒体。
  20. 前記類似性関数は、ある反復から次の反復への類似性に基づく差分尺度が収束するときに解かれることを特徴とする請求項19に記載のコンピュータ可読媒体。
  21. 前記類似性関数は、ある反復から次の反復への類似性に基づく差分尺度がしきい値差分未満のときに解かれることを特徴とする請求項19に記載のコンピュータ可読媒体。
  22. オブジェクトの類似性スコアを計算するためのコンピュータシステムであって、各オブジェクトは複数のタイプの1つを有し、各タイプは別のタイプとのタイプ間関係を有し、
    各タイプにつき、そのタイプについてタイプ内類似性が定義されたときそのタイプのオブジェクト間のタイプ内類似性と、そのタイプのオブジェクトと別のタイプのオブジェクトとの間のタイプ間類似性に基づいてそのタイプのオブジェクトの対の類似性スコアを提供する類似性関数であって、前記タイプ間類似性は前記別のタイプのオブジェクトの対の間の類似性スコアと、オブジェクトの対の間のタイプ間関係とに基づいて再帰的に定義され、そのタイプの第1のオブジェクトと第2のオブジェクトのタイプ間類似性は、前記第1のオブジェクトと関係を有するオブジェクトと前記第2のオブジェクトと関係を有するオブジェクトから成る前記別のタイプのオブジェクトの対の間のタイプ内類似性の加重平均である、類似性関数を格納するメモリと、
    前記類似性スコアが収束するまで、前記メモリに含まれる類似性関数を反復的に呼び出すことによって、オブジェクトのセットについて定義されたタイプ間関係に基づいて前記類似性関数を解くプロセッサ
    を備えたことを特徴とするコンピュータシステム。
  23. 前記類似性関数は、線形式のセットを定義することを特徴とする請求項22に記載のコンピュータシステム。
  24. 1つのタイプは、そのタイプのオブジェクト間のタイプ内関係を有し、前記類似性関数はそのタイプのオブジェクト間のタイプ内関係に基づく前記オブジェクト間のタイプ内類似性にさらに基づくことを特徴とする請求項22に記載のコンピュータシステム。
  25. あるタイプについてのタイプ内類似性は、そのタイプのオブジェクトと別のタイプのオブジェクトとの間のタイプ間類似性に基づくことを特徴とする請求項24に記載のコンピュータシステム。
  26. 類似性関数は、種々のタイプ内関係についてのオブジェクトのタイプ内類似性に基づいて再帰的に定義されることを特徴とする請求項24に記載のコンピュータシステム。
  27. あるタイプについての前記類似性関数は、そのタイプについてのタイプ内およびタイプ間の類似性関数の一次結合であることを特徴とする請求項24に記載のコンピュータシステム。
  28. 各タイプ内およびタイプ間の類似性関数に重みが与えられることを特徴とする請求項27に記載のコンピュータシステム。
  29. そのタイプについての前記タイプ内およびタイプ間の類似性関数に対する重みの合計は1であることを特徴とする請求項28に記載のコンピュータシステム。
  30. 前記類似性スコアは、ある反復から次の反復への類似性に基づく差分尺度が差分しきい値未満のときに収束することを特徴とする請求項22に記載のコンピュータシステム。
  31. 前記類似性関数は、ある反復から次の反復への類似性に基づく差分尺度がしきい値差分未満のときに解かれることを特徴とする請求項22に記載のコンピュータシステム。
JP2005142845A 2004-05-14 2005-05-16 オブジェクトの類似性を異種の関係に基づいて判定するための方法およびシステム Expired - Fee Related JP5147162B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/846,949 2004-05-14
US10/846,949 US7376643B2 (en) 2004-05-14 2004-05-14 Method and system for determining similarity of objects based on heterogeneous relationships

Publications (3)

Publication Number Publication Date
JP2005327299A JP2005327299A (ja) 2005-11-24
JP2005327299A5 JP2005327299A5 (ja) 2008-07-03
JP5147162B2 true JP5147162B2 (ja) 2013-02-20

Family

ID=34939829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005142845A Expired - Fee Related JP5147162B2 (ja) 2004-05-14 2005-05-16 オブジェクトの類似性を異種の関係に基づいて判定するための方法およびシステム

Country Status (10)

Country Link
US (1) US7376643B2 (ja)
EP (1) EP1596314B1 (ja)
JP (1) JP5147162B2 (ja)
KR (1) KR101130533B1 (ja)
CN (1) CN1728147B (ja)
AU (1) AU2005202016A1 (ja)
BR (1) BRPI0503220A (ja)
CA (1) CA2507365A1 (ja)
MX (1) MXPA05005219A (ja)
RU (1) RU2419857C2 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8135698B2 (en) * 2004-06-25 2012-03-13 International Business Machines Corporation Techniques for representing relationships between queries
US7779001B2 (en) * 2004-10-29 2010-08-17 Microsoft Corporation Web page ranking with hierarchical considerations
US8762280B1 (en) * 2004-12-02 2014-06-24 Google Inc. Method and system for using a network analysis system to verify content on a website
US7509320B2 (en) * 2005-12-14 2009-03-24 Siemens Aktiengesellschaft Methods and apparatus to determine context relevant information
US8332386B2 (en) * 2006-03-29 2012-12-11 Oracle International Corporation Contextual search of a collaborative environment
US8768932B1 (en) * 2007-05-14 2014-07-01 Google Inc. Method and apparatus for ranking search results
US20090198666A1 (en) * 2008-02-01 2009-08-06 Winston Ronald H Affinity matching system and method
US8321803B2 (en) * 2008-06-19 2012-11-27 International Business Machines Corporation Aggregating service components
CN101615178B (zh) * 2008-06-26 2013-01-09 日电(中国)有限公司 用于建立对象层次结构的方法和系统
US20100211533A1 (en) * 2009-02-18 2010-08-19 Microsoft Corporation Extracting structured data from web forums
US9443209B2 (en) * 2009-04-30 2016-09-13 Paypal, Inc. Recommendations based on branding
US9286411B2 (en) * 2009-06-25 2016-03-15 International Business Machines Corporation Retrieval of relevant objects in a similarity
JP5306461B2 (ja) * 2009-06-30 2013-10-02 インターナショナル・ビジネス・マシーンズ・コーポレーション グラフの類似度計算システム、方法及びプログラム
US8266149B2 (en) * 2010-12-10 2012-09-11 Yahoo! Inc. Clustering with similarity-adjusted entropy
US9460390B1 (en) * 2011-12-21 2016-10-04 Emc Corporation Analyzing device similarity
CN103218358A (zh) * 2012-01-18 2013-07-24 百度在线网络技术(北京)有限公司 一种Diff打分方法以及系统
US9292793B1 (en) * 2012-03-31 2016-03-22 Emc Corporation Analyzing device similarity
US20140067443A1 (en) * 2012-08-28 2014-03-06 International Business Machines Corporation Business process transformation recommendation generation
CN108738036B (zh) * 2017-04-14 2021-06-18 广州杰赛科技股份有限公司 移动通信的关键用户提取方法和系统
CN107766498B (zh) * 2017-10-19 2022-01-07 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN108256070B (zh) * 2018-01-17 2022-07-15 北京百度网讯科技有限公司 用于生成信息的方法和装置
US11586824B2 (en) * 2019-10-07 2023-02-21 Royal Bank Of Canada System and method for link prediction with semantic analysis
TWI742446B (zh) * 2019-10-08 2021-10-11 東方線上股份有限公司 詞句庫擴展系統及其方法
CN118018269B (zh) * 2024-01-31 2024-12-24 北京亚鸿世纪科技发展有限公司 一种数据安全分析方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6421675B1 (en) 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
JP2001160067A (ja) * 1999-09-22 2001-06-12 Ddi Corp 類似文書検索方法および該類似文書検索方法を利用した推薦記事通知サービスシステム
JP3678985B2 (ja) * 2000-08-25 2005-08-03 日本電信電話株式会社 ウェブページ間の類似度自動判定方法、装置及びそのプログラムを記録した媒体
US7440943B2 (en) 2000-12-22 2008-10-21 Xerox Corporation Recommender system and method
US7251648B2 (en) 2002-06-28 2007-07-31 Microsoft Corporation Automatically ranking answers to database queries
WO2005008526A1 (en) * 2003-07-23 2005-01-27 University College Dublin, National University Of Ireland, Dublin Information retrieval

Also Published As

Publication number Publication date
MXPA05005219A (es) 2005-12-06
KR20060047858A (ko) 2006-05-18
AU2005202016A8 (en) 2005-12-22
CA2507365A1 (en) 2005-11-14
EP1596314B1 (en) 2013-07-17
RU2419857C2 (ru) 2011-05-27
RU2005114666A (ru) 2006-11-20
AU2005202016A1 (en) 2005-12-22
US20050256833A1 (en) 2005-11-17
KR101130533B1 (ko) 2012-04-12
US7376643B2 (en) 2008-05-20
BRPI0503220A (pt) 2006-01-10
CN1728147B (zh) 2010-09-08
JP2005327299A (ja) 2005-11-24
EP1596314A1 (en) 2005-11-16
CN1728147A (zh) 2006-02-01

Similar Documents

Publication Publication Date Title
JP5147162B2 (ja) オブジェクトの類似性を異種の関係に基づいて判定するための方法およびシステム
RU2387005C2 (ru) Способ и система ранжирования объектов на основе отношений внутри типа и между типами
US7849089B2 (en) Method and system for adapting search results to personal information needs
JP4845420B2 (ja) 情報の多様性および豊富さを向上させるよう検索結果のドキュメントを順位付ける方法およびシステム
KR100963623B1 (ko) 시맨틱 웹 자원의 랭킹처리방법
JP2005327293A5 (ja)
US20080313168A1 (en) Ranking documents based on a series of document graphs
JP4634214B2 (ja) リンクおよびページレイアウトの分析を利用することによりイメージ関連性を識別する方法およびシステム
US8290986B2 (en) Determining quality measures for web objects based on searcher behavior
US20070005588A1 (en) Determining relevance using queries as surrogate content
JP2006107432A (ja) クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法
US8484193B2 (en) Look-ahead document ranking system
US20110161330A1 (en) Calculating global importance of documents based on global hitting times
US7774340B2 (en) Method and system for calculating document importance using document classifications
Alghamdi et al. Extended user preference based weighted page ranking algorithm
JP2011028509A (ja) 関連性判定装置、関連性判定方法およびプログラム
Nakanishi et al. Dynamic cross-domain link creation for interconnection of heterogeneous knowledge bases
Jayanthi et al. Segregating unique service object from multi-web sources for effective visualization
Zhang et al. On web communities mining and analysis
Srinivasanacd et al. Web Crawling Agents for Retrieving Biomedical Information

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080515

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110225

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110524

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120829

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121127

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151207

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees