[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4322887B2 - スレッド順位付け装置及び方法 - Google Patents

スレッド順位付け装置及び方法 Download PDF

Info

Publication number
JP4322887B2
JP4322887B2 JP2006153568A JP2006153568A JP4322887B2 JP 4322887 B2 JP4322887 B2 JP 4322887B2 JP 2006153568 A JP2006153568 A JP 2006153568A JP 2006153568 A JP2006153568 A JP 2006153568A JP 4322887 B2 JP4322887 B2 JP 4322887B2
Authority
JP
Japan
Prior art keywords
article
thread
importance
articles
bibliographic information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006153568A
Other languages
English (en)
Other versions
JP2007323412A (ja
Inventor
茂明 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006153568A priority Critical patent/JP4322887B2/ja
Priority to US11/654,561 priority patent/US20070282940A1/en
Publication of JP2007323412A publication Critical patent/JP2007323412A/ja
Application granted granted Critical
Publication of JP4322887B2 publication Critical patent/JP4322887B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Computer Hardware Design (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、掲示板サイト上における特定のテーマに沿って記述された記事の集合(スレッド)を対象として、利用者の意思決定を支援するスレッド順位付け装置及び方法に関するものである。
Web上には多数の掲示板サイトが存在しており、各サイトでは多数の議論がスレッドという形で展開されている。これらスレッドの中には、例えば、企業活動にすら影響を与える大規模な議論へと発展する注目すべきスレッドが存在していることもある。しかし、これら注目すべきスレッドは、大多数の注目に値しないスレッドの中に埋もれてしまっている。このため、注目すべきスレッドを抽出することが望まれている。
そのひとつの方法として、自身の興味を表現したイベントによって各スレッドに含まれる記事の特徴付けを行い、特定のイベントを含む記事の件数に基づいてスレッドの順位付けを行って、スレッドを提示する手法がある(例えば、非特許文献1)。本手法の場合、スレッドを構成する記事の件数が多いスレッドに高い順位を与える傾向にあるため、スレッドを構成する記事が少ないものの、注目すべきであるスレッドを見逃す危険性がある。
櫻井茂明、折原良平:「掲示板サイトからの注意スレッドの発見法」、第10回 曖昧な気持ちに挑むワークショップ、39−44、(2005)
従来の技術では、多数あるスレッド間の順序関係を評価して、注目すべきスレッドを抽出することができない可能性が高い。また、従来の技術を用いて、注目すべきスレッドの抽出を試みたとしても、スレッドに含まれる記事数が多かったり、記事が長かったりするスレッドに高い順位を与える傾向にあるため、記事数が少ない注目すべきスレッドを見逃す危険性がある。
この発明は、上述した事情を考慮してなされたものであり、注目すべきスレッドを重要度が高いスレッドとして順位付けするスレッド順位付け装置及び方法を提供することを目的とする。
上述の課題を解決するため、本発明のスレッド順位付け装置は、複数の投稿者の識別子と、各投稿者が1以上の書誌情報に関して記述した記事と、書誌情報との集合であるスレッドを掲示板サイトから複数収集する収集手段と、各前記スレッドに含まれている各記事から、該記事以前の記事に含まれる内容である参照部分を抽出する抽出手段と、前記スレッドに含まれている記事ごとに、該記事が他の記事に参照部分として含まれている個数に基づいて、該記事の記事重要度を算出する算出手段と、前記スレッドに含まれている記事ごとに記事重要度を格納する第1の格納手段と、書誌情報および投稿者の識別子の両方が同一である記事がない場合に、ある書誌情報とある投稿者の識別子とに対応する書誌情報重要度として、該書誌情報と該投稿者の識別子とに対応する記事の0でない記事重要度がある場合には該記事重要度と初期値との和を設定し該記事の記事重要度が0である場合には初期値を設定し書誌情報および投稿者の識別子の両方が同一である記事がある場合に、ある書誌情報とある投稿者の識別子とに対応する書誌情報重要度として、該書誌情報と該投稿者の識別子とに対応する記事の0でない記事重要度が複数ある場合には該複数の記事重要度の和と初期値との和を設定し、記事の0でない記事重要度が単数である場合には該単数の記事重要度と初期値との和を設定し、該記事重要度が0である場合には初期値を設定する第1の設定手段と、前記掲示板サイトから、前記収集手段が収集した記事に追加された追加記事を含んだ追加スレッドを取得する取得手段と、前記追加記事の書誌情報と該追加記事の投稿者の識別子とに対応する書誌情報重要度を該追加記事の記事重要度として設定する第2の設定手段と、前記追加スレッドに含まれる複数の記事に対応する複数の記事重要度の和を該追加スレッドのスレッド重要度として設定する第3の設定手段と、複数の追加スレッドのそれぞれにスレッド重要度が設定されている場合に、スレッド重要度を重要度順に並び替える並び替え手段と、前記並び替えられたスレッド重要度と、スレッドとを対応付けて格納する第2の格納手段と、を具備することを特徴とする。
本発明のスレッド順位付け方法は、収集手段が、複数の投稿者の識別子と、各投稿者が1以上の書誌情報に関して記述した記事と、書誌情報との集合であるスレッドを掲示板サイトから複数収集し、抽出手段が、各前記スレッドに含まれている各記事から、該記事以前の記事に含まれる内容である参照部分を抽出し、算出手段が、前記スレッドに含まれている記事ごとに、該記事が他の記事に参照部分として含まれている個数に基づいて、該記事の記事重要度を算出し、前記スレッドに含まれている記事ごとに記事重要度を格納する第1の格納手段を用意し、第1の設定手段が、書誌情報および投稿者の識別子の両方が同一である記事がない場合に、ある書誌情報とある投稿者の識別子とに対応する書誌情報重要度として、該書誌情報と該投稿者の識別子とに対応する記事の0でない記事重要度がある場合には該記事重要度と初期値との和を設定し該記事の記事重要度が0である場合には初期値を設定し書誌情報および投稿者の識別子の両方が同一である記事がある場合に、ある書誌情報とある投稿者の識別子とに対応する書誌情報重要度として、該書誌情報と該投稿者の識別子とに対応する記事の0でない記事重要度が複数ある場合には該複数の記事重要度の和と初期値との和を設定し、記事の0でない記事重要度が単数である場合には該単数の記事重要度と初期値との和を設定し、該記事重要度が0である場合には初期値を設定し、取得手段が、前記掲示板サイトから、前記収集手段が収集した記事に追加された追加記事を含んだ追加スレッドを取得し、第2の設定手段が、前記追加記事の書誌情報と該追加記事の投稿者の識別子とに対応する書誌情報重要度を該追加記事の記事重要度として設定し、第3の設定手段が、前記追加スレッドに含まれる複数の記事に対応する複数の記事重要度の和を該追加スレッドのスレッド重要度として設定し、並び替え手段が、複数の追加スレッドのそれぞれに複数のスレッド重要度が設定されている場合に、スレッド重要度を重要度順に並び替え、前記並び替えられたスレッド重要度と、スレッドとを対応付けて格納する第2の格納手段を用意することを特徴とする。
本発明のスレッド順位付け装置及び方法によれば、注目すべきスレッドを重要度が高いスレッドとして順位付けすることができる。
以下、図面を参照しながら本発明の実施形態に係るスレッド順位付け装置及び方法について詳細に説明する。本実施形態では、スレッドとは、例えば、複数の投稿者の識別子と、各投稿者が1以上の書誌情報に関して記述した記事と、書誌情報との集合であるとする。書誌情報とは、例えば、ジャンル、タイトルである。ジャンルは、例えば、「パソコン/ハードディスク」、「パソコン/ソフトウェア」である。タイトルは、ジャンルの詳細な項目であり、例えば、「ハードディスクの相性」、「S1ソフト」である。
まず、本実施形態のスレッド順位付け装置及び方法について概要を説明する。
本発明の実施形態のスレッド順位付け装置及び方法は、スレッドが多数ある場合に、スレッドを重要度にしたがって順位付けし、利用者に順位の高い順にスレッドを提示することにより、利用者の意思決定を支援する。
より詳細には、本実施形態のスレッド順位付け装置及び方法は、掲示板サイト上に蓄積されているスレッド(掲示板サイト上における特定のテーマに沿って記述された記事の集合)を学習データ(学習スレッドと呼ぶ)として収集する。本実施形態のスレッド順位付け装置及び方法は、スレッドを構成する各記事の参照関係を解析することにより、参照される頻度が高い記事の重要度が高くなるように、記事の重要度を算出する。
また、本実施形態のスレッド順位付け装置及び方法は、算出された各記事の重要度を書誌情報(スレッドのジャンルや記事の投稿者など)の組ごとにまとめることにより、各書誌情報の組の重要度を算出する。掲示板サイトにおいて、新たなスレッドが立ち上がって記事が投稿されたり、現存のスレッドに記事が追加されたりした場合に、スレッド順位付け装置及び方法は付随する書誌情報の組の重要度及び参照する記事の重要度に基づいて記事の重要度を算出する。スレッド順位付け装置及び方法は、スレッドが格納する各記事の重要度に基づいてスレッドの重要度を算出することにより、スレッドの重要度に基づいてスレッドを順位付けして利用者に提示する。
次に、本実施形態のスレッド順位付け装置について図1を参照して説明する。図1は、掲示板サイトに内在するスレッドの順位付け装置の構成の一例を示す図である。
本実施形態のスレッド順位付け装置は、図1に示すように、学習スレッド収集部101、学習記事参照関係解析部102、学習記事重要度算出部103、書誌情報重要度算出部104、評価スレッド監視部105、評価スレッド解析部106、評価記事重要度算出部107、評価スレッド重要度算出部108、評価スレッド順位付け部109、データベース110を備えている。
学習スレッド収集部101は、掲示板サイトからスレッドごとに複数の記事を収集する。学習スレッド収集部101は、掲示板サイトに現在までに保存されている各スレッドを学習スレッドとして収集する。
学習記事参照関係解析部102は、スレッドごとに複数の記事の参照関係を解析する。学習記事参照関係解析部102は、例えば、学習記事の内容に記載されている文章を利用することにより、学習記事間の参照関係を規定する。
学習記事重要度算出部103は、学習記事参照関係解析部102の解析結果に基づいて収集された各記事の学習記事重要度を算出する。学習記事重要度算出部103は、例えば、文章が疑問表現であるかどうかや記事を参照しているかどうかの情報だけを利用することにより、学習記事重要度の算出を行う。
書誌情報重要度算出部104は、スレッドに付随する書誌情報の組ごとに学習記事重要度算出部103によって算出された学習記事重要度をまとめて書誌情報の組ごとの重要度(書誌情報重要度)を算出する。書誌情報重要度算出部104は、学習記事重要度を、学習記事に付随する投稿者及びスレッドに付随するジャンル別に、それまでに算出された重要度の値に加算することにより、投稿者別、ジャンル別の重要度を算出する。
評価スレッド監視部105は、掲示板サイトに接続していて、掲示板サイトへの記事の投稿及びスレッドの新設を監視する。評価スレッド監視部105は、掲示板サイトに定期的にアクセスして、記事が追加されたスレッドや新たに立ち上がったスレッドを評価スレッドとして、その評価スレッドに含まれる記事を評価記事として取得する。
評価スレッド解析部106は、評価スレッド監視部105からの通知を基に更新されたスレッドの重要度の算出を開始するかどうかを判定してスレッドに付随する書誌情報を解析する。評価スレッド解析部106は、例えば、評価記事として図12、図13に示す、スレッドの解析結果を得る。
評価記事重要度算出部107は、評価スレッド解析部106の解析結果及び書誌情報重要度算出部104から得られる重要度に基づいて評価スレッドに含まれる評価記事の重要度を算出する。
評価スレッド重要度算出部108は、スレッドに内在する記事の重要度に基づいて評価スレッドの重要度を算出する。
評価スレッド順位付け部109は、評価スレッド重要度算出部108によって算出されたスレッド重要度に基づいてスレッドを順位付けして、順位付けたスレッドをデータベース110に渡す。
データベース110は、評価スレッド順位付け部109で順位付けされたスレッドを格納する。ユーザは、データベース110にアクセスすることによって、順位付けされたスレッドを閲覧することができる。
次に、本実施形態のスレッド順位付け装置の動作の一例について図2及び図3を参照して説明する。図2は、本実施形態のスレッド順位付け装置の処理の流れの前半に対応する重要度の学習部分の処理の流れの一例を示す図である。図3は、本実施形態のスレッド順位付け装置の処理の流れの後半に対応する評価スレッドの順位付け部分の処理の流れの一例を示す図である。なお、本装置が対象とする掲示板サイトに内在するスレッドは、スレッドの書誌情報であるジャンル及びタイトルと複数の記事から構成されているとし、各記事は記事を投稿した日時、記事の投稿者といった書誌情報に加えて、記事に記述される内容から構成されているとする。
ステップS201では学習スレッド収集部101が、掲示板サイトに現在までに保存されているすべてのスレッドをダウンロードし、各スレッドを学習スレッドとして収集する。
ステップS202では学習記事参照関係解析部102が、ステップS201で収集された学習スレッドの集合の中からひとつの学習スレッドを取り出す。このとき、取り出す学習スレッドが存在しない場合には、ステップS301へと処理を進める。一方、取り出す学習スレッドが存在する場合には、ステップS203へと処理を進める。
ステップS203では、学習記事参照関係解析部102が、学習スレッドを構成する記事の中からひとつの記事を学習記事として取り出す。このとき、取り出す学習記事が存在しない場合には、ステップS202へと処理を戻す。一方、取り出す学習記事が存在する場合には、ステップS204へと処理を進める。
ステップS204では、学習記事参照関係解析部102が、学習記事を構成する内容を解析することにより、当該の学習スレッドの前の学習記事の内容を含んでいる参照部分を抽出する。また、学習記事参照関係解析部102は、この参照部分が存在する場合には、対応する学習記事を抽出する。このステップの具体例は後に図4、図5、図6を参照して説明する。
ステップS205では、学習記事参照関係解析部102が、ステップS204で抽出された参照部分をひとつ取り出す。このとき、取り出す参照関係が存在しなければ、ステップS207へと進む。一方、取り出す参照関係が存在する場合にはステップS206へと進む。
ステップS206では、学習記事参照関係解析部102が、参照部分が疑問表現を含むかどうかを判定する。このとき、疑問表現を含むとすれば、この参照部分に対応する学習記事の抽出を行わずにステップS205へと戻る。例えば、文章の最後に「?」が記述されているか「・・・しょうか。」といった表現が参照部分に含まれている場合に、疑問表現が含まれていると判定することにする。一方、疑問表現を含んでいないとすれば、対象としているスレッドの最初の学習記事から開始して、取り出された参照部分を最初に含む学習記事を抽出する。この抽出された学習記事のIDを学習記事参照関係解析部102の内部のメモリ(図示せず)に格納してある参照部分に対応させて格納する。他の具体例については後に図4を参照して説明する。
ステップS207では、学習記事重要度算出部103が、学習スレッドを構成する学習記事に対して、参照部分に対応する学習記事のIDの個数を計算する。また、この個数に基づいて下記の式(1)の値を計算することにより、学習記事の重要度を算出し、学習記事重要度算出部103の内部のメモリ(図示せず)に格納する。ただし、ipを重要度パラメータとし、参照部分に対応する学習記事aのIDの個数が0になる場合は除いて積算することにする。importance(a)は学習記事aの学習記事重要度を示す。
importance(a)
= Σ(学習記事bにおける学習記事aに含まれる参照部分の個数/学習記事bの参照部分の個数)×ip …(1)
具体例については後に図4、図7、図8、図9、図10を参照して説明する。
ステップS208では、書誌情報重要度算出部104が、学習記事重要度算出部103が算出した学習記事ごとの重要度を、学習記事に付随する投稿者及びスレッドに付随するジャンル別に、それまでに算出された重要度の値に加算することにより、投稿者別、ジャンル別の重要度を算出し、書誌情報重要度算出部104の内部のメモリ(図示せず)に格納する。具体例については後に図4、図8、図9、図10、図11を参照して説明する。
ステップS301では、評価スレッド監視部105が、掲示板サイトに定期的にアクセスすることにより、記事が追加されたスレッドや新たに立ち上がったスレッドを評価スレッドとして収集する。また、評価スレッド監視部105は、評価スレッドから記事を評価記事として収集する。さらに、評価スレッド監視部105は、収集した評価記事の総数、学習記事の収集から一定期間の経過等を条件として、評価スレッド解析部106に評価スレッドの解析開始を指示して、ステップS302へ進む。
ステップS302では、評価スレッド解析部106が、評価スレッド監視部105が収集した評価スレッドの集合から評価スレッドをひとつ取り出す。また、取り出された評価スレッドに対応する書誌情報であるジャンル情報を抽出する。このとき、取り出す評価スレッドがない場合には、ステップS306へと処理を進める一方、取り出す評価スレッドがある場合には処理をステップS303へと進める。
ステップS303では、評価スレッド解析部106が評価スレッドを構成する評価記事をひとつ取り出す。このとき、取り出す評価記事がない場合には、ステップS305へと処理を進める。一方、取り出す評価記事がある場合には、ステップS304へと処理を進める。
ステップS304では、評価記事重要度算出部107が、評価スレッド解析部106によって取り出された評価記事に対応する投稿者情報を抽出する。また、抽出された投稿者情報及び先に取り出されているジャンル情報に基づいて、投稿者別、ジャンル別の重要度を参照することにより、当該評価記事の重要度を算出する。具体例については後に図11、図12、図13を参照して説明する。
ステップS305では、評価スレッド重要度算出部108が、評価スレッドを構成する記事に対して、評価記事重要度算出部107が付与した重要度を積算することにより、評価スレッドの重要度を算出する。具体例については後に図11、図12、図13を参照して説明する。
ステップS306では、評価スレッド順位付け部109が、評価スレッドに付与されている重要度に基づいて、重要度の高い評価スレッドの順位が高くなるように、評価スレッドの順位付けを行う。また、順位付けされた評価スレッドをその順位の順にデータベース110に格納する。利用者は、データベース110にアクセスして、評価スレッドをその順位の順に整理された状態を閲覧することができる。具体例については後に図12、図13、図14を参照して説明する。
次に、ステップS204について具体的な一例を挙げて図4、図5、図6を参照して説明する。図4は学習スレッドを示し、ジャンルとタイトルは図4の学習スレッドに対応している。図4は、疑問表現を含む学習スレッドの一例を示す図である。記事は、ID=1,2,3のそれぞれの内容が対応する。図4の例では、学習スレッドはID=1,2,3に対応する3つの記事の集合である。図5は、図4の第2の学習記事から抽出される参照部分を示す図である。図6は、図4の第3の学習記事から抽出される参照部分を示す図である。
学習スレッド収集部101が収集した学習記事として図4の学習スレッドに含まれる記事を学習記事として考えることにする。学習記事参照関係解析部102は、学習記事に参照部分が含まれているかどうかについて、内容を構成する文章の先頭が「>」で始まるかどうかによって判定することにする。このため、図4の学習記事からなる学習スレッドに含まれる第1の学習記事(ID=1)の場合には、その内容の中には「>」で始まる文章が存在しないので、学習記事参照関係解析部102は参照部分が存在しないと判定する。一方、図4の第2の学習記事(ID=2)の場合には、その内容の中に「>」で始まる文章が存在するので、学習記事参照関係解析部102は参照部分を取り出して、その内部のメモリ(図示せず)に格納する。図5は学習記事参照関係解析部102の内部のメモリに格納される参照部分の例を示している。図5は、図4の第2の学習記事の中の「>」で始まる文章が参照部分として格納されている内容を示している。
また、第3の学習記事の場合には、その内容の中に「>」で始まる文章が複数存在するので、学習記事参照関係解析部102は、参照部分を個々に取り出して、その内部のメモリに格納する。図6は学習記事参照関係解析部102の内部に格納される参照部分の例を示している。図6には、図4の第2の学習記事の中の「>」で始まる文章が参照部分として格納されている。
次に、ステップS206の動作について具体的な一例を挙げて図4、図7を参照して説明する。図7は、図4の第3の学習記事から抽出される参照部分を示す図において、参照元の学習記事のIDが抽出された後の状態を示す図である。
図4の第2の学習記事の第1の参照部分(「>P1パソコンと…どうですか?」の部分)の場合には、疑問表現を含んでいるので、対応する学習記事を抽出することなしにステップS205へと戻る。一方、図4の第3の学習記事の第3の参照部分(「>大丈夫です。」の部分と「>この他、…OKです。」の部分)の場合には、疑問表現を含んでいないので、対応する学習記事を図4の第1の学習記事から調査し、第2の学習記事で第3の参照部分に対応する部分を発見する。したがって、学習記事参照関係解析部102は、図7に示すように、第2の学習記事のIDを参照元IDとして学習記事参照関係解析部102の内部に、対応する参照部分とともに格納する。
次に、ステップS207の動作の具体的な一例について図4、図7、図8、図9、図10を参照して説明する。図8は、図4の学習記事に対して算出される重要度を示す図である。図9は、疑問表現を含まない学習スレッドの一例を示す図である。図10は、図9の学習記事に対して算出される重要度を示す図である。
図4の学習スレッドの場合について説明する。例えば、上記式(1)に含まれるipを0.5とする。図4の第1の学習記事には記号「>」が含まれていないので参照部分はない。図4の第2の学習記事には記号「>」が含まれているが、この「>」に続く文は疑問文であるのでステップS206で参照部分としては抽出されない。図4の第3の学習記事には、図7に示すように、疑問文でない文が2箇所含まれる。したがって、第1の学習記事と第2の学習記事の参照部分に対応するIDの個数は0であり、第3の学習記事の参照部分に対応する参照元ID(ID=2)が図7のように与えられているので、学習記事3(=第3の学習記事)における学習記事2(=第2の学習記事)に含まれる参照部分の個数は2であり、学習記事3の参照部分の個数も疑問文を除くので2になる。したがって、学習記事重要度算出部103は、上記の式(1)を適用して、第2の学習記事の重要度として、0.5(=(2/2)×0.5)を算出する。また、第1の学習記事と第3の学習記事は、他の学習記事に参照部分として抽出されていないので、これらの学習記事の重要度はそれぞれ0となる。この結果、図4に含まれる学習記事に対して、図8の学習記事重要度が与えられる。
別の例として図9の学習スレッドについて説明する。この例でも上記式(1)に含まれるipを0.5とする。図9の第1の学習記事には記号「>」が含まれていないので参照部分はない。図9の第2の学習記事と第3の学習記事にはそれぞれ記号「>」を含み、疑問文でない文をそれぞれ1箇所含むので、それぞれの記事は参照部分を1つずつ含む。したがって、第1の学習記事の参照部分に対応するIDの個数は0であり、第2の学習記事と第3の学習記事のそれぞれの参照部分に対応する参照元ID(ID=1)により、学習記事2(=第2の学習記事)における学習記事1(=第1の学習記事)に含まれる参照部分の個数は1であり、学習記事3(=第3の学習記事)における学習記事1に含まれる参照部分の個数も1であり、学習記事2の参照部分の個数と学習記事3の参照部分の個数はそれぞれ1になる。したがって、学習記事重要度算出部103は、上記の式(1)を適用して、第1の学習記事の重要度として、1.0(=(1/1)×0.5+(1/1)×0.5)を算出する。また、第2の学習記事と第3の学習記事は、他の学習記事に参照部分として抽出されていないので、これらの学習記事の重要度はそれぞれ0となる。この結果、図9に含まれる学習記事に対して、図10の学習記事重要度が与えられる。
また、この計算とともに、記事重要度が0のものは不要であるとして、例えば、記事重要度を−1.0としてもよい。すなわち、不要な記事の記事重要度を下げてもよい。
次に、ステップS208の動作の具体的な一例について図4、図8、図9、図10、図11を参照して説明する。図11は、図4の学習記事及び図9の学習記事を適用することにより算出される投稿者別、ジャンル別の重要度を示す図である。
例えば、投稿者別、ジャンル別の重要度の初期値を1.0とする。このとき、図4の学習スレッドからは、学習記事重要度算出部103により図の学習記事重要度が計算される。この場合、書誌情報重要度算出部104は、ID=2の記事に、初期値1.0に重要度0.5を加算した1.5を投稿者別、ジャンル別の重要度として算出する。換言すれば、投稿者別、ジャンル別の重要度(書誌情報重要度)は、第2番目の学習記事の投稿者である「Author2」及びこの学習スレッドのジャンルである「パソコン/ハードディスク」を組み合わせた重要度に0.5が加算され、1.5となる。
別の例として図9について説明する。図9の学習スレッドからは、学習記事重要度算出部103により図10の学習記事重要度が計算される。この場合、書誌情報重要度算出部104は、ID=1の記事に、初期値1.0に重要度1.0を加算した2.0を投稿者別、ジャンル別の重要度として算出する。換言すれば、投稿者別、ジャンル別の重要度は、第1番目の学習記事の投稿者である「Author2」及びこの学習スレッドのジャンルである「パソコン/ソフトウェア」を組み合わせた重要度に1.0が加算され、2.0となる。
したがって、図4と図9の例によれば、図11に示す投稿者別、ジャンル別の重要度(書誌情報重要度)が書誌情報重要度算出部104の内部メモリに格納される。
次に、ステップS304の動作の具体的な一例について図4、図8、図9、図10、図11、図12、図13を参照して説明する。図12は、ジャンルがパソコン/ソフトウェアとなる評価スレッドの一例を示す図である。図13は、ジャンルがパソコン/ハードディスクとなる評価スレッドの一例を示す図である。
書誌情報重要度算出部104が、例えば、図11に示すように投稿者別、ジャンル別の重要度(書誌情報重要度)を算出したとする。また、評価スレッド解析部106が、評価記事として図12、図13に示すスレッドの解析結果を得ているとする。
図12の第1の評価記事に対して、評価記事重要度算出部107は、投稿者が「Author2」であり、ジャンルが「パソコン/ソフトウェア」であるため、書誌情報重要度算出部104の内部メモリに格納されている図11の書誌情報重要度を参照して、図12の第1の評価記事の評価記事重要度は2.0であると算出する。同様に、図12の第2、第3の評価記事に対して、評価記事重要度算出部107は、それぞれ評価記事重要度として、1.0、2.0を算出する。
また、図13の第1の評価記事に対して、評価記事重要度算出部107は、投稿者が「Author1」であり、ジャンルが「パソコン/ハードディスク」であるため、書誌情報重要度算出部104の内部メモリに格納されている図11の書誌情報重要度を参照して、図13の第1の評価記事の評価記事重要度は1.0であると算出する。同様に、図13の第2、第3、第4の評価記事に対して、評価記事重要度算出部107は、それぞれ評価記事重要度として、1.0、1.0、1.0を算出する。
次に、ステップS305の動作の具体的な一例について図11、図12、図13を参照して説明する。
書誌情報重要度算出部104が、例えば、図11に示すように投稿者別、ジャンル別の重要度(書誌情報重要度)を算出したとする。また、評価スレッド解析部106が、評価記事として図12、図13に示す、スレッドの解析結果を得ているとする。ステップS305では、評価スレッド重要度算出部108は、各記事の評価記事重要度の和を評価スレッド重要度として算出する。
図12に示したスレッド解析結果の場合には、評価スレッド重要度算出部108は、ステップS304で計算した各評価記事重要度の和、2.0+1.0+2.0=5.0を評価スレッド重要度とする。
図13に示したスレッド解析結果の場合には、評価スレッド重要度算出部108は、ステップS304で計算した各評価記事重要度の和、1.0+1.0+1.0+1.0=4.0を評価スレッド重要度とする。
次に、ステップS306の動作の具体的な一例について図12、図13、図14を参照して説明する。図12、図13の評価スレッド以外の評価スレッドの評価スレッド重要度が2.0以下であるとする。図14は、順位付けされた評価スレッドの出力結果の一例を示す図である。
評価スレッド順位付け部109は、評価スレッド重要度算出部108が算出した全ての評価スレッド重要度を重要度の大きい順番に並び替えて、データベース110に渡す。例えば、評価スレッド順位付け部109は、複数の評価スレッドに対して、評価スレッド重要度を重要度の大きい順で付けた順位と、タイトルと、重要度とをデータベース110に渡す。データベース110は、これらの情報を格納し、例えば、ユーザ端末からアクセスがあり要求がある場合には、これらの情報をユーザに提供する。
図12、図13に示した具体例の場合には、評価スレッド順位付け部109は、図14に示したような情報をデータベース110に渡す。
以上のようにして、各ステップを実施することにより、各評価スレッドを構成する評価記事の評価記事重要度に基づいて、複数の評価スレッドに順位付けを行うことができる。評価記事重要度に基づいて順位付けしているため、評価スレッドに含まれる評価記事の数が少ないとしても評価スレッドの順位を高くすることができる。また、多数の学習スレッドに基づいて評価スレッド重要度を算出しているため、精度の高い重要度を算出でき、適切な評価スレッドの順位付けを行うことができる。
ただし、掲示板サイトに内在するスレッドの順位付け装置は上記実施形態に限定するものではない。例えば、学習記事参照関係解析部102、学習記事重要度算出部103、書誌情報重要度算出部104、評価記事重要度算出部107の変形例を以下に示す。
学習記事参照関係解析部102では、学習記事の内容に記載されている文章を利用することにより、学習記事間の参照関係を規定しているが、スレッドへの記事の投稿に際に関連する記事を投稿者がリンクによって結んでおくことにより、リンクを利用して参照関係を規定することもできる。
より詳細には、ステップS204における学習記事の参照関係の解析をリンクに基づいて実施する。ここで、図15に示す学習記事が与えられているとする。図15は、図4とは異なった記法で参照関係が記載されている学習スレッドの一例である。図15の「ID=1」及び図15の「ID=2」は、IDが1及びIDが2となる記事をそれぞれ参照するリンクを表しているとする。この場合、学習記事参照関係解析部102は、各記事におけるリンクの有無を確認することにより、各記事の参照関係を規定することができる。すなわち、ID=2の記事は、IDが1の記事を参照していて、ID=3の記事は、IDが1の記事とIDが2の記事とを参照している。このように図15は、図4と同一の内容であり、参照を示す記法が異なるだけである。
学習記事重要度算出部103では、文章が疑問表現であるかどうかや記事を参照しているかどうかの情報だけを利用することにより、重要度の算出を行っている。しかしながら、同じように参照を行っているとしても、時間の経過にしたがって、参照の重要度が異なることもあるので、学習記事重要度算出部103は、記事の時間の経過を加味して重要度を算出してもよい。
より詳細には、ステップS207における学習記事重要度の算出を参照記事までの日数を考慮した下に記載の式(2)を用いて計算する。
importance(a)
= Σ(学習記事bにおける学習記事aに含まれる参照部分の個数/学習記事bの参照部分の個数)×(1/学習記事a,b間の日数)×ip …(2)
例えば、図9の学習記事における第1の学習記事の学習記事重要度を計算してみる。図9の第1の学習記事は、第2の学習記事と第3の学習記事から参照されており、第1の学習記事と第2の学習記事の間の日数が1日、第1の学習記事と第3の学習記事の間の日数が2日であるので、第1の学習記事の重要度は、ip=0.5として、((1/1)×(1/1)+(1/1)×(1/2))×0.5=0.75と計算される。なお、同日の場合には、例えば、0.5日として式(2)に代入する。
書誌情報重要度算出部104では、同種の書誌情報がひとつ付与された学習スレッドを扱っているが、複数のジャンルがひとつの学習スレッドに割り当てられたような同種の書誌情報が複数の学習スレッドに付与された学習スレッドを組み合わせて、重要度の算出を行うこともできる。
より詳細には、書誌情報重要度算出部104は複数のジャンルを組み合わせた学習スレッドから学習する。例えば、図4の例において、「パソコン/ハードディスク」に加えて、「パソコン/OS」といったジャンルが割り当てられているとして、図9の例において、「パソコン/ソフトウェア」に加えて、「パソコン/OS」といったジャンルが割り当てられているとする。この場合、学習スレッドに含まれる各記事に対して、図8、図10の学習記事重要度が与えられているので、投稿者別、ジャンル別の書誌情報重要度は図16のように与えられる。図16は、複数のジャンルが1つのスレッドに与えられている場合に計算された書誌情報重要度の一例を示す図である。「Author2」の場合の「パソコン/OS」のジャンルの書誌情報重要度を算出する具体例を挙げる。図4に示す第2番目の学習記事の投稿者である「Author2」の学習記事重要度0.5と、図9に示す「Author2」の学習記事重要度1.0との和1.5に、初期値1.0が加算されて2.5となる。他の「Author」は学習記事重要度が0であるので初期値1.0のままである。
評価記事重要度算出部107では、評価記事の投稿者と評価スレッドのジャンルに基づいて評価記事重要度を算出しているが、評価記事間に関して参照関係を解析し、参照関係を加味して重要度を付与することもできる。
より詳細には、評価記事重要度算出部107では、評価スレッドに含まれる記事の重要度に加えて、その参照関係を加味した式(3)を利用して評価スレッドの重要度を算出する。
eval(α) = Σimp×ref …(3)
ここで、eval(α)はある評価スレッドαの評価スレッド重要度、impは記事bの記事重要度を表し、refは記事bへの参照数を表すとする。ただし、最後の記事における参照数は1とする。このとき、図12の評価スレッドにおいて、第1の記事が第2及び第3番目の記事によって参照され、第2の記事が第3の記事によって参照されているとすれば、各記事に対する参照数は、2、1、1と与えられる。また、上述したように、図12の第1、第2、第3の評価記事重要度は、2.0、1.0、2.0である。したがって、この評価スレッドの重要度は2.0×2+1.0×1+2.0×1=7.0と計算される。
さらには、上記実施形態においては、重要度の学習と評価スレッドの順位付けを一度しか実施していないが、重要度の学習及び評価スレッドの順位付けを適宜繰り返すようにしてもよい。例えば、一定時間間隔で重要度の学習及び評価スレッドの順位付けを実行する。この他、本発明の趣旨を逸脱しない範囲において、種々変形して掲示板サイトに内在するスレッドの順位付け装置を構成することができる。
以上に示した実施形態によれば、掲示板サイト上に蓄積されている多数のスレッドに対して、スレッドを構成する記事の重要度を考慮してスレッドを順位付けすることにより、注目すべきスレッドを高い順位を持つスレッドとして抽出できるようにすることができる。
スレッドを構成する各記事の重要度に基づいてスレッドを順位付けする指標を算出しているため、記事数の少なさによる注目すべきスレッドの順位の低下の影響を軽減することができる。また、大量の記事によってモデル化された書誌情報の組み合わせ別の重要度に基づいて、新たな記事及びスレッドの重要度を算出しているため、新たな記事及びスレッドの重要度を精度よく算出することができ、注目すべきスレッドを高い精度で抽出することができる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の実施形態に係るスレッド順位付け装置のブロック図。 図1のスレッド順位付け装置の動作の一例を示すフローチャート。 図2の続きを示すフローチャート。 学習スレッドの一例を示す図。 図1の学習記事参照関係解析部が図4から取り出した参照部分の一例を示す図。 図1の学習記事参照関係解析部が図4から取り出した参照部分の一例を示す図。 図1の学習記事参照関係解析部が図4から取り出した参照部分と参照元IDの一例を示す図。 図1の学習記事重要度算出部が図4に対して計算した学習記事重要度を示す図。 学習スレッドの一例を示す図。 図1の学習記事重要度算出部が図9に対して計算した学習記事重要度を示す図。 図1の書誌情報重要度算出部が図4、図9に対して計算した書誌情報重要度を示す図。 評価スレッドの一例を示す図。 評価スレッドの一例を示す図。 図1の評価スレッド順位付け部が図12、図13に対して計算した順位情報を示す図。 学習スレッドの一例を示す図。 図1の書誌情報重要度算出部が計算した書誌情報重要度の一例を示す図。
符号の説明
101…学習スレッド収集部、102…学習記事参照関係解析部、103…学習記事重要度算出部、104…書誌情報重要度算出部、105…評価スレッド監視部、106…評価スレッド解析部、107…評価記事重要度算出部、108…評価スレッド重要度算出部、109…評価スレッド順位付け部、110…データベース。

Claims (15)

  1. 複数の投稿者の識別子と、各投稿者が1以上の書誌情報に関して記述した記事と、書誌情報との集合であるスレッドを掲示板サイトから複数収集する収集手段と、
    各前記スレッドに含まれている各記事から、該記事以前の記事に含まれる内容である参照部分を抽出する抽出手段と、
    前記スレッドに含まれている記事ごとに、該記事が他の記事に参照部分として含まれている個数に基づいて、該記事の記事重要度を算出する算出手段と、
    前記スレッドに含まれている記事ごとに記事重要度を格納する第1の格納手段と、
    書誌情報および投稿者の識別子の両方が同一である記事がない場合に、ある書誌情報とある投稿者の識別子とに対応する書誌情報重要度として、該書誌情報と該投稿者の識別子とに対応する記事の0でない記事重要度がある場合には該記事重要度と初期値との和を設定し該記事の記事重要度が0である場合には初期値を設定し書誌情報および投稿者の識別子の両方が同一である記事がある場合に、ある書誌情報とある投稿者の識別子とに対応する書誌情報重要度として、該書誌情報と該投稿者の識別子とに対応する記事の0でない記事重要度が複数ある場合には該複数の記事重要度の和と初期値との和を設定し、記事の0でない記事重要度が単数である場合には該単数の記事重要度と初期値との和を設定し、該記事重要度が0である場合には初期値を設定する第1の設定手段と、
    前記掲示板サイトから、前記収集手段が収集した記事に追加された追加記事を含んだ追加スレッドを取得する取得手段と、
    前記追加記事の書誌情報と該追加記事の投稿者の識別子とに対応する書誌情報重要度を該追加記事の記事重要度として設定する第2の設定手段と、
    前記追加スレッドに含まれる複数の記事に対応する複数の記事重要度の和を該追加スレッドのスレッド重要度として設定する第3の設定手段と、
    複数の追加スレッドのそれぞれにスレッド重要度が設定されている場合に、スレッド重要度を重要度順に並び替える並び替え手段と、
    前記並び替えられたスレッド重要度と、スレッドとを対応付けて格納する第2の格納手段と、を具備することを特徴とするスレッド順位付け装置。
  2. 前記抽出手段は、各前記スレッドに含まれている各記事が含んでいる引用記号が付与されている部分を参照部分として抽出することを特徴とする請求項1に記載のスレッド順位付け装置。
  3. 前記抽出手段は、各前記スレッドに含まれている各記事が含んでいるリンクが付与されている部分を参照部分として抽出することを特徴とする請求項1に記載のスレッド順位付け装置。
  4. 前記算出手段は、前記スレッドに含まれている記事が他の記事に、前記参照部分のうち疑問表現が含まれていない参照部分として含まれている個数に基づいて、該記事の記事重要度を算出することを特徴とする請求項1に記載のスレッド順位付け装置。
  5. 前記算出手段は、前記スレッドに含まれている記事がある他の記事に前記参照部分のうち疑問表現が含まれていない参照部分として含まれている個数と、該他の記事に含まれている疑問表現が含まれていない参照部分の個数と、を全ての他の記事について計算した値に基づいて、該記事の記事重要度を算出することを特徴とする請求項1に記載のスレッド順位付け装置。
  6. 前記算出手段は、前記スレッドに含まれている記事が投稿された日時と前記他の記事が投稿された日時とに基づいて、該記事の記事重要度を算出することを特徴とする請求項1に記載のスレッド順位付け装置。
  7. 前記第3の設定手段は、前記追加スレッドに含まれる複数の記事に対応する複数の記事重要度の各記事への参照数を重みとした重み付け和を、前記スレッド重要度として設定することを特徴とする請求項1に記載のスレッド順位付け装置。
  8. 前記収集手段、前記抽出手段、前記算出手段、前記第1の格納手段、前記第1の設定手段、前記取得手段、前記第2の設定手段、前記第3の設定手段、前記並び替え手段、前記第2の格納手段は、一定の時間間隔で処理を繰り返し実行することを特徴とする請求項1に記載のスレッド順位付け装置。
  9. 収集手段が、複数の投稿者の識別子と、各投稿者が1以上の書誌情報に関して記述した記事と、書誌情報との集合であるスレッドを掲示板サイトから複数収集し、
    抽出手段が、各前記スレッドに含まれている各記事から、該記事以前の記事に含まれる内容である参照部分を抽出し、
    算出手段が、前記スレッドに含まれている記事ごとに、該記事が他の記事に参照部分として含まれている個数に基づいて、該記事の記事重要度を算出し、
    前記スレッドに含まれている記事ごとに記事重要度を格納する第1の格納手段を用意し、
    第1の設定手段が、書誌情報および投稿者の識別子の両方が同一である記事がない場合に、ある書誌情報とある投稿者の識別子とに対応する書誌情報重要度として、該書誌情報と該投稿者の識別子とに対応する記事の0でない記事重要度がある場合には該記事重要度と初期値との和を設定し該記事の記事重要度が0である場合には初期値を設定し書誌情報および投稿者の識別子の両方が同一である記事がある場合に、ある書誌情報とある投稿者の識別子とに対応する書誌情報重要度として、該書誌情報と該投稿者の識別子とに対応する記事の0でない記事重要度が複数ある場合には該複数の記事重要度の和と初期値との和を設定し、記事の0でない記事重要度が単数である場合には該単数の記事重要度と初期値との和を設定し、該記事重要度が0である場合には初期値を設定し、
    取得手段が、前記掲示板サイトから、前記収集手段が収集した記事に追加された追加記事を含んだ追加スレッドを取得し、
    第2の設定手段が、前記追加記事の書誌情報と該追加記事の投稿者の識別子とに対応する書誌情報重要度を該追加記事の記事重要度として設定し、
    第3の設定手段が、前記追加スレッドに含まれる複数の記事に対応する複数の記事重要度の和を該追加スレッドのスレッド重要度として設定し、
    並び替え手段が、複数の追加スレッドのそれぞれにスレッド重要度が設定されている場合に、スレッド重要度を重要度順に並び替え、
    前記並び替えられたスレッド重要度と、スレッドとを対応付けて格納する第2の格納手段を用意することを特徴とするスレッド順位付け方法。
  10. 前記参照部分を抽出することは、各前記スレッドに含まれている各記事が含んでいる引用記号が付与されている部分を参照部分として抽出することであることを特徴とする請求項9に記載のスレッド順位付け方法。
  11. 前記参照部分を抽出することは、各前記スレッドに含まれている各記事が含んでいるリンクが付与されている部分を参照部分として抽出することであることを特徴とする請求項9に記載のスレッド順位付け方法。
  12. 前記記事重要度を算出することは、前記スレッドに含まれている記事が他の記事に、前記参照部分のうち疑問表現が含まれていない参照部分として含まれている個数に基づいて、該記事の記事重要度を算出することであることを特徴とする請求項9に記載のスレッド順位付け方法。
  13. 前記記事重要度を算出することは、前記スレッドに含まれている記事がある他の記事に前記参照部分のうち疑問表現が含まれていない参照部分として含まれている個数と、該他の記事に含まれている疑問表現が含まれていない参照部分の個数と、を全ての他の記事について計算した値に基づいて、該記事の記事重要度を算出することであることを特徴とする請求項9に記載のスレッド順位付け方法。
  14. 前記記事重要度を算出することは、前記スレッドに含まれている記事が投稿された日時と前記他の記事が投稿された日時とに基づいて、該記事の記事重要度を算出することであることを特徴とする請求項9に記載のスレッド順位付け方法。
  15. 前記複数の記事重要度の和を前記追加スレッドのスレッド重要度として設定することは、前記追加スレッドに含まれる複数の記事に対応する複数の記事重要度の各記事への参照数を重みとした重み付け和を、前記スレッド重要度として設定することであることを特徴とする請求項9に記載のスレッド順位付け方法。
JP2006153568A 2006-06-01 2006-06-01 スレッド順位付け装置及び方法 Expired - Fee Related JP4322887B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006153568A JP4322887B2 (ja) 2006-06-01 2006-06-01 スレッド順位付け装置及び方法
US11/654,561 US20070282940A1 (en) 2006-06-01 2007-01-18 Thread-ranking apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006153568A JP4322887B2 (ja) 2006-06-01 2006-06-01 スレッド順位付け装置及び方法

Publications (2)

Publication Number Publication Date
JP2007323412A JP2007323412A (ja) 2007-12-13
JP4322887B2 true JP4322887B2 (ja) 2009-09-02

Family

ID=38791649

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006153568A Expired - Fee Related JP4322887B2 (ja) 2006-06-01 2006-06-01 スレッド順位付け装置及び方法

Country Status (2)

Country Link
US (1) US20070282940A1 (ja)
JP (1) JP4322887B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4247266B2 (ja) * 2006-10-18 2009-04-02 株式会社東芝 スレッド順位付け装置及びスレッド順位付け方法
US8015246B1 (en) 2007-03-21 2011-09-06 Google Inc. Graphical user interface for chat room with thin walls
US8006191B1 (en) 2007-03-21 2011-08-23 Google Inc. Chat room with thin walls
US7899869B1 (en) 2007-03-22 2011-03-01 Google Inc. Broadcasting in chat system without topic-specific rooms
US7860928B1 (en) * 2007-03-22 2010-12-28 Google Inc. Voting in chat system without topic-specific rooms
US7865553B1 (en) 2007-03-22 2011-01-04 Google Inc. Chat system without topic-specific rooms
US7904500B1 (en) 2007-03-22 2011-03-08 Google Inc. Advertising in chat system without topic-specific rooms
JP5084665B2 (ja) * 2008-08-20 2012-11-28 日本電信電話株式会社 コンポーネント連携シナリオ統合開発環境提供システム、シナリオ作成支援方法、及び、プログラム
JP5658939B2 (ja) * 2010-07-30 2015-01-28 楽天株式会社 階層構造を持つ書込み記事の評価システム
US8762875B2 (en) 2011-12-23 2014-06-24 Blackberry Limited Posting activity visualization
US9305085B2 (en) 2013-11-26 2016-04-05 International Business Machines Corporation Online thread retrieval using thread structure and query subjectivity
US9940319B2 (en) 2014-05-29 2018-04-10 Nippon Telegraph And Telephone Corporation Information analysis system, information analysis method, and information analysis program
WO2017003340A1 (en) * 2015-07-02 2017-01-05 Telefonaktiebolaget Lm Ericsson (Publ) Managing and indexing communication data, and recommending communication type
US20170345090A1 (en) * 2016-05-24 2017-11-30 Acquisition Simplicity, LLC Processing for requirement requests
JP7310171B2 (ja) * 2019-02-28 2023-07-19 富士通株式会社 配分方法、抽出方法、配分プログラム、抽出プログラム、配分装置及び抽出装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000090020A (ja) * 1998-09-14 2000-03-31 Sharp Corp 情報処理装置及び返信メール作成プログラムを記録したコンピュータ読み取り可能な記録媒体
US6772160B2 (en) * 2000-06-08 2004-08-03 Ingenuity Systems, Inc. Techniques for facilitating information acquisition and storage
US7814043B2 (en) * 2001-11-26 2010-10-12 Fujitsu Limited Content information analyzing method and apparatus
JP3962382B2 (ja) * 2004-02-20 2007-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 表現抽出装置、表現抽出方法、プログラム及び記録媒体
US7567959B2 (en) * 2004-07-26 2009-07-28 Google Inc. Multiple index based information retrieval system
JP4772378B2 (ja) * 2005-05-26 2011-09-14 株式会社東芝 Webページから時系列データを生成する方法及び装置

Also Published As

Publication number Publication date
JP2007323412A (ja) 2007-12-13
US20070282940A1 (en) 2007-12-06

Similar Documents

Publication Publication Date Title
JP4322887B2 (ja) スレッド順位付け装置及び方法
JP5492187B2 (ja) 編集距離および文書情報を使用する検索結果順位付け
KR101527259B1 (ko) 검색 질의에 응답하여 디스커션 스레드에 대한 포스트를 제공하는 방법 및 시스템
JP5092252B2 (ja) トレンド解析サーバおよびトレンド解析方法
KR20150031234A (ko) 어플리케이션 검색들을 가능하게 하기 위해 사용되는 검색 인덱스의 업데이트
JP4962980B2 (ja) クリックログを用いた検索結果分類装置及び方法
JP2021192237A (ja) 関連スコア算出システム、方法およびプログラム
Roy et al. Survey on pre-processing web log files in web usage mining
CN103514289A (zh) 一种兴趣本体库构建方法及装置
JP4542993B2 (ja) 構造化文書抽出装置、構造化文書抽出方法および構造化文書抽出プログラム
JP5048852B2 (ja) 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
JP2009251957A (ja) 興味情報特定システム、興味情報特定方法、および興味情報特定用プログラム
KR101556714B1 (ko) 검색결과 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
JP4759600B2 (ja) 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体
JP2007334590A (ja) 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2006079412A (ja) イベント情報抽出方法及び装置及びプログラム
KR101105798B1 (ko) 키워드 정련 장치 및 방법과 그를 위한 컨텐츠 검색 시스템 및 그 방법
JP5135174B2 (ja) 大規模webサイトの評価装置、大規模webサイトの評価方法および大規模webサイトの評価プログラム
JP4853915B2 (ja) 検索システム
JP5462713B2 (ja) Webページ収集装置、方法及びプログラム
JP2011175486A (ja) 名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法
JP2009187395A (ja) トピック分析装置、方法及びプログラム
JP2010244341A (ja) 属性表現獲得方法及び装置及びプログラム
JP2011100302A (ja) ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム
JP5411802B2 (ja) 代表語抽出装置、代表語抽出方法および代表語抽出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081007

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090512

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090603

R151 Written notification of patent or utility model registration

Ref document number: 4322887

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130612

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees