[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP3791908B2 - 検索システム、システム、検索方法およびプログラム - Google Patents

検索システム、システム、検索方法およびプログラム Download PDF

Info

Publication number
JP3791908B2
JP3791908B2 JP2002046934A JP2002046934A JP3791908B2 JP 3791908 B2 JP3791908 B2 JP 3791908B2 JP 2002046934 A JP2002046934 A JP 2002046934A JP 2002046934 A JP2002046934 A JP 2002046934A JP 3791908 B2 JP3791908 B2 JP 3791908B2
Authority
JP
Japan
Prior art keywords
search
document
user
selection
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002046934A
Other languages
English (en)
Other versions
JP2003256471A (ja
Inventor
建夫 川村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2002046934A priority Critical patent/JP3791908B2/ja
Priority to US10/366,833 priority patent/US7110996B2/en
Publication of JP2003256471A publication Critical patent/JP2003256471A/ja
Application granted granted Critical
Publication of JP3791908B2 publication Critical patent/JP3791908B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、データベースにおける検索において、効率的に目的とするものを抽出することができる検索システム等に関する。
【0002】
【従来の技術】
近年、多くのコンピュータ装置が、インターネット、社内ネットワーク、LAN(Local Area Network)等のネットワークに接続されて使用されている。これらネットワークには、サービスを提供するコンピュータ装置としてサーバが接続されており、様々な情報がこのサーバに蓄積されている。ユーザは、自分が使用する端末であるコンピュータ装置を、ネットワークを介してサーバに接続させ、様々な情報を入手することができる。
【0003】
ところで、ユーザが情報を取得するには、多量に蓄積された情報から、目的とする情報を抽出する処理を行う必要がある。その方法としては、例えば、ユーザが目的とする情報に含まれるであろうキーワードを想定し、多量に蓄積された情報からそのキーワードを含んだデータを抽出する。このような抽出処理では、検索エンジンと呼ばれるプログラムが広く使用されている。この検索エンジンは、サーバに蓄積された情報を広くサーチし、ユーザが指定したキーワードを含むデータを自動的に抽出する。その結果、ユーザはそのキーワードを含んでいるデータを入手することができる。
【0004】
【発明が解決しようとする課題】
しかしながら、このような検索エンジンを用いて得られるデータの全てが、ユーザの目的とする情報であるとは限られない。例えば、「OLE for Process Control」(プロセス制御のためのOLE)についての情報を入手したい場合を例に挙げて説明すると、「OLE for Process Control 」はしばしば「OPC」という省略語で表現されているので、正式な名称「OLE for Process Control 」をキーワードとして検索しても、「OPC」として表記されている情報は取得することができない。そこで、キーワードとしてこの「OPC」を含めて検索を行うと、「OPC」を含むデータを全て抽出することが可能となる。
【0005】
ところが、「OPC」は「Organic Photo Conductor」(有機光半導体)の省略語でもあるため、ユーザが目的とする「OLE for Process Control」のデータと共に、全く関係のない「Organic Photo Conductor」のデータも抽出されてしまう。したがって、ユーザは抽出されたデータの中から、個別に必要なデータをピックアップしなければならない。この場合、抽出されたデータが多ければ多いほど、目的とするデータを探し出す作業に時間を要し、また大変な手間がかかる。
【0006】
一方、「OLE for Process Control」に関連する新たなキーワード、例えば「制御」をさらに掛け合わせることにより、全く関係のない「Organic Photo Conductor」のデータを排除し、抽出されたデータを絞り込むことも可能である。しかしこの処理を行うと、「OLE for Process Control」のデータであっても、新たなキーワード「制御」を含んでいないものは抽出されない。したがって、本来であれば抽出されるべき「OLE for Process Control」のデータまで排除される可能性が生じてしまう。このように絞り込み検索を行って不必要なデータを排除しようとすると、必要なデータまで排除されてしまい、目的とするデータが得られないといった問題が生じる。
【0007】
本発明は、上記のような技術的課題に基づいてなされたもので、ユーザが必要な情報をより的確に抽出することができる検索システム等を提供することを主たる目的とする。
【0008】
【課題を解決するための手段】
かかる目的のもと、本発明の検索システムは、あらかじめ記憶された文書に対する検索処理を実行するサーバと、サーバに対して検索処理を要求する少なくとも1つの端末を備えた検索システムであって、端末は、検索結果に示される所定の文書に対するユーザの指定を受け付け、指定された文書(指定文書)に基づく拡張検索をサーバに対して要求し、サーバは、拡張検索の要求を受け付け、ユーザもしくはその他のユーザまたは両方が過去に行った検索処理において同時に選択した少なくとも1つの文書からなる1または複数のグループにおいて、指定文書が属するグループを抽出し、抽出されたグループに属する文書を拡張検索結果として出力することを特徴とするものである。この検索システムでは、過去において行われた検索処理を利用して検索を行うことで、目的とする文書を抽出することができる。
【0009】
この検索システムにおいては、端末は、検索結果および拡張検索結果に含まれる文書に対してユーザが行った選択をサーバへ送出し、サーバは、選択から新たなグループを作成し、新たなグループを選択履歴として記憶することができる。また、端末は、拡張検索の要求の前において検索用タームに基づく準備用検索をサーバに対して要求し、指定文書は、準備用検索の結果から選択された文書とすることができる。この場合、サーバは、準備用検索に用いた検索用タームを検索結果と共に選択履歴として記憶することが好ましい。
【0010】
また、本発明はサーバ等のシステムとして捉えることもできる。本発明のシステムは、ユーザからの要求に応じてオブジェクトの検索処理を行うシステムであって、過去の検索処理において、ユーザもしくはその他のユーザまたはその両方が、過去において行った検索処理において同時に選択したオブジェクトを選択履歴データとして記憶する選択履歴記憶部と、拡張検索用にユーザが指定したオブジェクト(指定オブジェクト)に基づく拡張検索要求を受け付ける受付部と、指定オブジェクトの履歴データが、選択履歴記憶部に記憶されているか否かを判断する判断部と、指定オブジェクトの履歴データが選択履歴記憶部に記憶されていると判断部により判断されると、選択履歴記憶部に記憶された検索結果から指定オブジェクトと同時に選択された1または複数のオブジェクトを特定するオブジェクト特定部と、を備えたことを特徴とするものである。
【0011】
このシステムは、オブジェクトを蓄積したオブジェクト・データベースと、オブジェクト特定部により特定されたオブジェクトを、オブジェクト・データベースから抽出するオブジェクト抽出部と、をさらに備えることができる。
また、システムは、過去に選択された回数に関するデータをオブジェクト毎に記憶する選択回数記憶部をさらに備えていてもよい。
【0012】
さらに、本発明は端末として捉えることもできる。本発明の端末は、ネットワークを介してサーバに接続し、目的とするオブジェクトをサーバから抽出可能な端末であって、ユーザからの検索指示を受け付ける入力部と、検索指示に基づいてサーバに対して検索の要求を送出し、検索の結果を受信する送受信部と、ユーザからの入力およびサーバから送出されたデータを表示する表示部とを備え、表示部は、サーバから受信した検索の結果に示されたオブジェクトのうち、任意のオブジェクトの選択を可能とする選択部と、選択されたオブジェクトについての類似検索指示の受け付けを可能とする受け付け部と、を表示することを特徴とするものである。
【0013】
端末の表示部は、類似検索の結果とともに、結果に含まれる類似オブジェクトの選択を可能とする類似オブジェクト選択部を表示することもできる。
また表示部は、類似検索の結果として、選択されたオブジェクトに類似する類似オブジェクトと共に、類似オブジェクトが過去に選択された回数を表示するものであってもよい。
【0014】
その他、本発明は検索方法として捉えることもできる。この検索方法は、データベースから目的とする文書の検索を行う検索方法であって、ユーザの要求に応じて所定のタームを基に1次検索を行うステップと、1次検索の結果に対して所定の文書の選択を受け付けるステップと、選択された所定の文書に基づいて2次検索を行うステップとを有し、2次検索では、ユーザもしくはその他のユーザまたはその両方を含むユーザによる過去の検索処理において所定の文書が抽出されたことがある場合に、所定の文書と同時に選択された履歴を有する文書を抽出することを特徴とする方法である。
【0015】
この検索方法は、2次検索において抽出された文書に対し、ユーザより同時に選択された文書を新たな検索結果として記憶するステップをさらに有することが好ましい。
【0016】
さらに、本発明はプログラムとして捉えることもできる。このプログラムは、類似検索処理をコンピュータ装置に実行させるためのプログラムであって、複数のユーザによって行われた検索における検索結果に対し、ユーザによって選択されたオブジェクトの選択履歴を記憶する手順と、検索用オブジェクトを指定した類似検索要求を受け付ける手順と、指定された検索用オブジェクトについての選択履歴が既に記憶されている場合、選択履歴を抽出する手順と、選択履歴から、検索用オブジェクトと共通点を有する類似オブジェクトを抽出する手順とをコンピュータ装置に実行させることを特徴とするプログラムである。
【0017】
このプログラムにおいて、共通点は、例えば類似オブジェクトが、検索用オブジェクトと同時に抽出されたことである。また、共通点は、類似オブジェクトが、検索用オブジェクトと同じキーワードで抽出されたことである。
【0018】
また本発明のプログラムは、コンピュータ装置において検索要求を処理させるためのプログラムであって、ユーザからの検索指示を受け付ける手順と、検索指示に基づいて検索の要求を行う手順と、検索の結果とともに、所定のオブジェクトを選択する選択手段をユーザに対して表示する手順と、選択された所定のオブジェクトについて他人の検索結果を得るための類似検索指示を受け付ける受付手段をユーザに対して表示する手順と、類似検索指示に基づいて検索指示を行い、他人の検索結果を入手する手順と、をコンピュータ装置に実行させることを特徴とするプログラムである。
【0019】
このプログラムは、類似検索の結果とともに、結果に含まれる類似オブジェクトを選択する選択手段をユーザに対して表示する手順をさらにコンピュータ装置に実行させることができる。
また、類似検索の結果として、所定のオブジェクトに類似するオブジェクトと共に、類似オブジェクトが過去に選択された回数を表示する手順をさらにコンピュータ装置に実行させることもできる。
【0020】
【発明の実施の形態】
以下、添付図面に示す実施の形態に基づいて本発明を詳細に説明する。
図1は、実施の形態における検索サービス提供システムを説明する図である。この検索サービス提供システム(検索システム)では、ユーザが検索を行って目的とする文書(オブジェクト)を探し出す処理に使用するユーザ端末10と、文書データを蓄積して検索を実行するサーバ20と、を備えており、それぞれインターネット等のネットワークを介して接続されている。
【0021】
ユーザ端末10は、ネットワークを介してデータの送受信を行う送受信部11と、ユーザからの入力を受け付けるキーボードやマウス等の入力部12と、出力されるデータを表示するディスプレイ等の表示部13と、CPU等で構成される演算処理部14と、を備えている。
【0022】
サーバ20は、ネットワークを介してデータの送受信を行う送受信部21と、全文検索を実行する全文検索実行部22と、類似文書の検索を実行する類似文書検索実行部23と、選択履歴蓄積処理部24と、データの一時保存を行うメモリ等で構成された記憶部25と、文書のデータを蓄積した文書データベース(以下、データベースをDBと称す)30と、検索履歴のデータを蓄積した履歴DB33(と、を備えている。ここで、あるユーザAが選択した文書Xがあるとした場合、文書Xの「類似文書」とは、過去の検索処理(ユーザA以外のユーザによる検索を含む。)において、文書Xとともに選択されたことがある文書のことをいう。1回の検索処理で同時に選ばれる文書は、関連性が強いと考えられることから、このように称する。
【0023】
サーバ20において、記憶部25は、全文検索結果を一時的に保存する全文検索結果記憶部26と、類似文書の検索結果を一時的に保存する類似文書検索結果記憶部27と、ユーザが選択した文書を一時的に保存する選択結果記憶部28と、を備えている。文書DB30は、文書データを検索しやすくするために作成された索引データを蓄積する索引データ蓄積部31と、文書データそのものを蓄積する本文データ蓄積部32と、を備えている。履歴DB33は、ユーザが選択した文書データの履歴データを蓄積する選択履歴データ蓄積部34を備えている。また、必要な場合には、文書データごとに選択された回数のデータを蓄積する選択回数データ蓄積部35も備えている。
【0024】
図1に示す検索サービス提供システムでは、全文検索(1次検索、準備用検索)を行った後、続けて類似文書検索(2次検索、拡張検索)を行うことで、検索を行うユーザが目的とする文書を簡単に且つ高精度で抽出することができる。以下、検索サービス提供システムにおける検索処理について具体的に説明する。
【0025】
図2は、ユーザ端末10における処理の流れを示す図である。図3は、ユーザ端末10の表示部13に表示されるメイン画面を示す図である。
まず、ユーザ端末10は、ユーザによる入力部12を介した全文検索の要求があるか否かを判断する(ステップS101)。具体的には、図3に示す全文検索ボタン50がユーザによって押されると、ユーザ端末10は全文検索の要求があったと判断し、図4に示すようなキーワードを入力するウィンドウを表示部13に表示する。ユーザはこのキーワードを入力する枠内に、ユーザが取得したい情報に含まれるであろうキーワードを入力する。なお、図4に示す枠内には、「検索」と「履歴」が「AND」で繋がれているので、この場合「検索」と「履歴」の双方のキーワードが含まれる文書データが抽出されることとなる。
【0026】
ステップS101において、ユーザ端末10が全文検索の要求はないと判断した場合、後述のステップS113の処理が行われる。一方、全文検索の要求があると判断した場合、サーバ20に対して全文検索を実行するように、ユーザ端末10は送受信部11を介して全文検索実行要求を送出する(ステップS103)。このとき、ユーザが図4に示す枠内に入力したキーワードも一緒に送出する。そして、この全文検索実行要求に対してサーバ20からネットワークを介して送信された全文検索結果を、ユーザ端末10は送受信部11において受信する(ステップS105)。
【0027】
続いて、ユーザ端末10は、受信した全文検索結果を表示部13に表示する(ステップS107)。図5は、表示部13に表示される全文検索結果の画面を示す図である。図5に示すように、全文検索結果の画面には、抽出された文書データごとに選択ボタン(選択部)51が表示されており、ユーザが所定の文書データを選択できるようになっている。なお、この選択に際し、ユーザは画面に表示されたタイトルを元に所定の文書データを選択することができるが、その文書データの本文を参照することで選択することも可能である。具体的には、タイトルを選択指示する(例えば入力部12に接続されたマウスで下線が引かれているタイトルをクリックする)ことで、図6に示すような文書データの本文52を表示させることができる。なお、図6に示すように、本文52を表示させているウィンドウ内にも、その文書データを選択するための選択ボタン53を表示させることもできる。なお、以下に述べる画面においてタイトルの下に下線が引かれているものについては、同様に選択指示することで本文52を表示することが可能である。
【0028】
このようにして選択ボタン53がチェックされた文書データに対して、ユーザ端末10は選択文書リストへの追加要求があるか否かを判断する(ステップS109)。具体的には図5に示す全文検索結果の画面において、選択文書リストに追加ボタン54がユーザによって押されたか否かによって判断する。ステップS109において、ユーザ端末10は、選択文書リストに追加要求がないと判断した場合、後述のステップS113の処理が行われる。追加要求があると判断した場合、選択文書リストにおいて選択された文書を選択文書リストに追加し、さらに選択文書リストのデータをサーバ20に対して送出する(ステップS111)。このとき、図5に示す全文検索結果の選択ボタン51において選択された文書のリストが、図7に示すように、メイン画面に表示される。
【0029】
続けて、ユーザ端末10は、類似文書検索要求があるか否かを判断する(ステップS113)。まず、ユーザは図7に示すメイン画面において表示された文書のリストにおいて、選択ボタン51をチェックすることにより類似文書検索時の基本となる文書を選択する。このようにメイン画面において所定の文書が選択された状態で図7に示すメイン画面の類似文書検索ボタン(受け付け部)55が押されると、ユーザ端末10は類似文書検索の要求がなされたと判断する。
【0030】
ステップS113において、ユーザ端末10が類似文書検索の要求はないと判断した場合、後述のステップS125の処理が行われる。一方、類似文書検索の要求があると判断した場合、ユーザ端末10は送受信部11を介してサーバ20へ類似文書検索実行要求を送出する(ステップS115)。このとき、類似文書検索時の基本となる選択された文書を指定するデータも一緒に送出する。そして、この類似文書検索実行要求に対してサーバ20からネットワークを介して送信された類似文書検索結果を、ユーザ端末10は送受信部11において受信する(ステップS117)。
【0031】
ここで、類似文書検索結果とは、全文検索の結果に対して選択された文書が、過去の他の検索において選択されたことがある場合に抽出される文書グループである。具体的には、他の検索時において今回選択された文書と、その文書と同時に選択された文書とを含む文書グループである。更なる詳細は、後述のサーバ20における処理において説明する。
なお、類似文書検索において、図7のリスト中の文書を複数選択してもよい。この場合、選択された全ての文書が含まれる文書グループを抽出するものであってもよいし(AND抽出)、選択された文書のいずれかが含まれる文書グループを抽出するものであってもよい(OR抽出)。また抽出の方法は、類似文書検索の要求をする際にどちらの方法を希望するかユーザが選択することもできる。
【0032】
続いて、ユーザ端末10は、受信した類似検索結果を表示部13に表示する(ステップS119)。図8は、表示部13に表示される類似文書検索結果の画面を示す図である。図8に示すように類似検索結果の画面には、図5に示す全文検索結果の画面と同様に、文書毎に選択ボタン56が表示されている。ここで既に選択済みの文書は、着色したり、チェック不能な入力属性を持たせることにより、識別可能とすることができる。さらに、選択ボタン56の隣には符号57に示すようにその文書が過去に何回選択されたかの回数が文書毎に表示されている。過去に選択された回数が多いほど、重要性が高い文書であることが多い。したがって、ユーザは、文書のタイトル、本文だけでなく、その文書が過去に選択された回数を参考にして、類似文書検索結果の中から適当であると思う文書を選択することができる。
【0033】
このようにして選択ボタン56がチェックされたリストに対して、ユーザ端末10は選択文書リストへの追加要求があるか否かを判断する(ステップS121)。ユーザ端末10が、選択文書リストに追加要求がないと判断した場合、後述のステップS125の処理が行われる。追加要求があると判断した場合、選択文書リストに選択された文書を追加し、さらに選択文書リストのデータをサーバ20に対して送出する(ステップS123)。このとき、図8に示す類似文書検索結果の選択ボタン56において選択された文書のリストが、図9に示すように、メイン画面に表示される。
【0034】
続けて、ユーザ端末10は、終了要求があるか否かを判断する(ステップS125)。これは、図9に示すメイン画面において表示されている終了ボタン58がユーザによって押されたかどうかに基づいて判断する。終了要求はないと判断した場合、ステップS101に戻って上記の処理を再度行う。終了要求があると判断した場合、図9に示す文書のリストにおいて選択されている文書を指定する選択文書リストをサーバ20に送出し(ステップS127)、本処理を終了する。なお、このように終了要求があった場合、最終的にユーザが選択したリストをユーザが後に使用することができる。具体的には、最終的に選択されたリストを、ユーザ端末10に保存し、ユーザが希望するときに最終的な選択要求されたリストに追加したときの文書が閲覧できるようにすることが可能である。また、ユーザは他のアプリケーション、例えば電子メール等において使用することができる。なお、ここでは、選択マークがついている文書のみを選択文書リストに含めるように構成してもよい。
【0035】
次に、サーバ20における処理の流れを説明する。図10は、サーバ20における処理の流れを示す図である。
まず、サーバ20は、送受信部21を介してユーザ端末10が送出した全文検索実行要求を受信したか否かを判断する(ステップS201)。全文検索実行要求を受信していないと判断した場合、後述のステップS213の処理が行われる。一方、全文検索実行要求を受信したと判断した場合、サーバ20は、全文検索実行要求と共に送られてきたキーワードを基に全文検索実行部22において全文検索を実行する(ステップS203)。
【0036】
図11は、文書DB30の索引データ蓄積部31に蓄積されたデータの一例を示す図である。ステップS203における全文検索は、全文検索実行部22が索引データ蓄積部31において検索に際し指定されたキーワードが図11に示す索引情報に含まれている文書を抽出する。そして、抽出した全文検索結果は記憶部25の全文検索結果記憶部26に一時的に保存される(ステップS205)。ここで、図13に全文検索結果記憶部26に保存されるデータの一例を示す。続けて、サーバ20は送受信部21を介して全文検索結果をユーザ端末10へ送出する(ステップS207)。
【0037】
なお、送出した全文検索結果に関連して、ユーザ端末10から所定の文書の本文の閲覧要求が送出される場合がある。この場合、指定された文書に対応する本文のデータを文書DB30の本文データ蓄積部32から抽出してユーザ端末10へ対して送出する。具体的には、本文データ蓄積部32に蓄積された図12に示すようなデータにおいて、該当するファイル名の本文データを抽出する。尚、本文の閲覧要求は、以下の処理においても、要求がある度に随時行われる。
【0038】
続けて、サーバ20は、ユーザ端末10が送出した選択文書リストのデータを受信したか否かを判断する(ステップS209)。選択文書リストのデータを受信していないと判断した場合には、後述のステップS213の処理が行われる。選択文書リストのデータを受信したと判断した場合、記憶部25の選択結果記憶部28に選択結果として選択文書リストのデータを一時保存する(ステップS211)。
【0039】
次に、サーバ20は、ユーザ端末10が送出した類似文書検索実行要求を受信したか否かを判断する(ステップS213)。類似文書検索実行要求を受け付けていないと判断した場合、後述のステップS225の処理が行われる。一方、類似文書検索実行要求を受信したと判断した場合、サーバ20は、類似文書検索実行要求と共に送られてきた選択文書リスト中の文書の識別番号(以下、文書IDという)を基に類似文書検索実行部23において類似文書検索を実行する(ステップS215)。ここで、類似文書検索について詳細を説明する。
【0040】
図14は、類似文書検索における具体的な処理の流れを示す図である。
まず、サーバ20の類似文書検索実行部23は、選択文書リストから類似文書検索のために選択された文書(以下、指定文書)についての選択履歴データが、履歴DB33の選択履歴データ蓄積部34に蓄積されているか否かを判断する(ステップS301)。具体的には、類似文書検索の際に図7に示すメイン画面においてユーザによって選択された文書の文書IDと同じ文書IDを有する選択履歴データが、履歴DB33の選択履歴データ蓄積部34にあるか否かを調査し、その同じ文書IDのデータを抽出する。図15は、履歴DB33の選択履歴データ蓄積部34に蓄積された選択履歴データの一例を示す図である。例えば図7に示すような選択がされていた場合、まず選択ボタン51がチェックされている文書ID=821について、図15に示す選択履歴データ蓄積部34に蓄積された選択履歴データから文書ID=821の選択履歴データを探し出す。
【0041】
ここで選択履歴データとは、過去の検索処理において、ユーザ(同じユーザに限られない)が検索した結果、得られた複数の文書の集合体の中から、最終的にユーザが閲覧を希望するのに選択された文書からなるグループである。例えば図15では、選択IDがXXの文書が複数個存在するが、これらの文書はXX番目の検索時においてユーザによって最終的に閲覧を希望するために同時に選択された文書である。なお、最終的に閲覧を希望する際に選択される文書とは、後述する図10におけるステップS227で受信する選択文書リストの文書である。
【0042】
ステップS301において類似文書検索実行部23が指定文書についての選択履歴データはないと判断した場合、図14に示す類似文書検索の処理は終了する。一方、指定文書についての選択履歴データはあると判断した場合、その指定文書の選択履歴データが属する文書グループ(同じ選択IDを有する文書のグループ)を1つ抽出する(ステップS303)。例えば図15において指定文書が文書ID=821の場合、選択IDがXXの文書グループを抽出する。続けて、文書グループ内の1つの文書について選択履歴データを抽出する(ステップS305)。例えば図15において文書グループとして選択IDがXXの選択履歴データを抽出した場合、文書ID=321、821、1094のうちの1つ、例えば文書ID=321の選択履歴データを抽出する。
【0043】
続けて、類似文書検索実行部23は、ステップS305において抽出した選択履歴データの文書が、類似文書検索結果にリストアップ済みか否か(類似文書検索結果記憶部27に記憶された文書であるか否か)を判断する(ステップS307)。リストアップされていないと判断した場合、その文書に関するデータを類似文書検索結果記憶部27に記憶し、リストアップする(ステップS308)。ステップS308でリストアップ後およびステップS307でリストアップ済みと判断された場合、この抽出された文書の選択回数データ(図16参照)に1を加える(ステップS309)。このような計数処理を行うことで、過去に選択された回数を単純に合計する場合と比べて、指定文書との関係でより選択頻度の高い文書を示すことが可能となる。次に、ステップS303において抽出された文書グループ内の文書は全てリストアップ済みか否かを判断する(ステップS310)。抽出された文書グループ内の文書においてリストアップ済みでないものが未だあると判断した場合、ステップS305へ戻り、文書グループ内の文書が全てリストアップされるまで処理が繰り返される。
【0044】
ステップS310において抽出された文書グループ内の文書が全てリストアップされたと判断した場合、選択履歴データ蓄積部34において、選択された文書と同じ選択IDを有する文書グループは全て抽出されたか否かを判断する(ステップS311)。例えば指定文書が文書ID=821の場合、図15に示す選択履歴データでは、選択IDがXXの他に、選択IDがYYのデータが存在する。このように1つの選択された文書に対して複数の選択履歴データが存在することがある場合には、その選択履歴データを含む文書グループの全てを抽出するようにする。
【0045】
ステップS311において、未だ全ての文書グループが抽出されていないと判断した場合、ステップS303へ戻って次の文書グループを抽出し、選択履歴データ蓄積部34において指定文書と同じ選択IDを有する文書グループが全て抽出されるまで処理が繰り返される。そして、ステップS311において全ての文書グループが抽出されたと判断した場合、類似文書検索の処理を終了する。
【0046】
以上のようにして、図10のステップS215における類似文書検索が実行された後、得られた類似文書検索結果を、サーバ20は記憶部25の類似文書検索結果記憶部27に一時的に保存する(ステップS217)。図16に類似文書検索結果記憶部27に保存するデータの一例を示す。続けて、サーバ20は類似文書検索結果を、送受信部21を介してユーザ端末10へと送出する(ステップS219)。このとき、類似文書検索結果として、選択履歴データと共にその文書についての選択回数のデータを一緒に送出する。なお、本発明では前述のとおり類似文書の検索処理の過程で選択回数データを蓄積するが、過去の選択回数を履歴DB33の蓄積データからまとめて個別に計算しておき、その合計数を選択回数データとして送出するように構成してもよい。
【0047】
続けて、サーバ20は、類似文書検索結果に対する選択文書リストのデータをユーザ端末10から受信したか否かを判断する(ステップS221)。選択文書リストのデータを受信していないと判断した場合には、後述のステップS225の処理が行われる。選択文書リストのデータを受信したと判断した場合、記憶部25の選択結果記憶部28に選択結果を更新して、一時保存する(ステップS223)。ここで、図17に選択結果記憶部28に保存されたデータの一例を示す。
【0048】
そして、サーバ20は検索処理の終了要求をユーザ端末10から受信したか否かを判断する(ステップS225)。終了要求を受け付けていないと判断した場合、ステップS201へ戻って、上記の検索処理を引き続き行う。例えば、ステップS215において類似文書検索実行を行った結果得られた類似文書検索結果のリストの中から、さらに文書を選択して、その文書についての類似文書検索の要求が行われる可能性がある。一方、サーバ20が終了要求を受信したと判断した場合、続けてユーザ端末10から選択文書リストを受信する(ステップS227)。選択文書リストは、類似文書検索(類似文書検索が行われなかった場合には全文検索)の結果に対してユーザが最終的に閲覧を希望するために選択した文書のリストであり、例えば図9において選択ボックスがチェックされている文書である。
【0049】
サーバ20は、ステップS227において受信した選択文書リストを履歴DB33の選択履歴データ蓄積部34に保存する(ステップS229)。ここで、保存するときの処理について具体的に説明する。図18は、選択文書リストの保存処理の流れを説明する図である。まず、サーバ20の選択履歴蓄積処理部24が、履歴DB33の選択履歴データ蓄積部34に蓄積されている選択履歴データが最大保存数に達しているか否かを判断する(ステップS401)。
【0050】
ステップS401において最大保存数に達していると選択履歴蓄積処理部24が判断した場合、選択履歴データ蓄積部34に蓄積されている選択履歴データのうち、最も古い選択履歴データが属する文書グループのデータを削除する(ステップS403)。そして、データを削除した後、またはステップS401において最大保存数に達していないと判断した場合、選択文書リストのデータ、すなわち文書IDと選択IDのデータを選択履歴データ蓄積部34に蓄積し(ステップS405)、保存処理を終了する。なお、選択履歴データ蓄積部34に蓄積できるデータ量に制限がない場合には、このような保存処理を行わずに、全ての選択履歴データを保存するものであってもよい。
【0051】
このようにして、図10のステップS229における選択文書リストの保存が実行された後、本処理を終了する。なお、選択回数のデータを一括して蓄積しておく場合には、データの更新処理をステップS229の後に実行する(ステップS231)。この場合、データの更新は、選択履歴リストにおいて選択された文書に対し、選択回数データ蓄積部35の選択回数のデータを1つ増分する等の処理である。後述する集約処理を事前に行う場合には、ステップS231が必要となる。
【0052】
以上のように本実施の形態では、一度全文検索を実行した後に得られる全文検索結果において、ユーザが目的とする文書、または目的とする文書に近い文書を選択し、その文書に対する類似文書検索を行う。類似文書検索では、過去に他のユーザが行った検索において最終的に選択された文書グループを抽出することができる。文書グループは、過去の検索において他のユーザが検索結果の中から目的とする文書を抽出した文書の集合体である。したがって、ユーザが選択した目的とする文書を含む文書グループは、今回のユーザの検索において目的とする文書の集合体である可能性が高く、ユーザは目的とする文書を効率良く入手できる。
【0053】
また、通常の検索では所定のキーワードを元に検索を行うので、検索結果にはユーザが目的とする文書とともに不必要な文書も含まれる。しかし、本実施の形態では、類似検索の際に選択した文書とともに過去に選択されたことがある他の文書をユーザに提示することができる。したがって、不必要な文書を高い割合で排除することができるので、全文検索の結果において多量の文書が抽出されても、簡単な処理によりユーザが目的とする文書を高い割合で提示することができる。更には通常の検索では抽出することが難しい文書や、参照頻度が低い文書や、ユーザの全文検索において抽出できなかった文書等も提示することができる。
【0054】
なお、上記実施の形態において、図10に示すステップS229の選択文書リストを文書グループとして保存する処理や文書グループの作成方法は、図18に示す方法に限定されない。例えば、検索に使用する複数のキーワードの組み合わせ(以下、キーワード・セット)を元に目的とする文書グループを形成する方法もある。以下に、他の文書グループの作成方法について具体例(キーワード・セット間の距離を利用する方法、集約処理を事前に行う方法)を挙げて説明する。
【0055】
○キーワード・セット間の距離を利用する方法
まず、キーワード・セット間の距離を求める方法を説明する。例えばキーワード・セットとして、2つのキーワード・セットKS1、KS2があり、それぞれのキーワード・セットが有するキーワード(以下、KWD)を以下に示すものと仮定する。
KS1={KWDa、KWDb、KWDc}
KS2={KWDb、KWDc、KWDd、KWDe、KWDf}
ここで、キーワードはKWDa〜fと6つあるので、6次元の空間にそれぞれKS-1、KS-2の座標上の点KP1、KP2が存在すると考えることができる。
【0056】
そこで、KP1、KP2の2点間の距離Dを計算する。KWDの順にKWDa〜fの順で、そのキーワードがある場合を"1"、ない場合を"0"と仮定して座標値に変換すると以下のようになる。
KP1=(1,1,1,0,0,0)
KP2=(0,1,1,1,1,1)
これを用いて距離Dを計算する。
2 =(KP1−KP2)2
2 =12+ 02 + 02+ 12 + 12 + 12
2 =4=22
【0057】
距離Dは、値が大きいほどKP1、KP2の2点間の距離が大きいと言える(なお、ここでは異なるキーワードは異なる空間軸に有るものとしている)。この距離から、キーワード・セットとしてKS1を用いた検索と、KS2を用いた検索の類似度がわかる。類似度の判断において距離Dの値を比較するときには、単純な値の比較ではなく、次元数に対する割合を考慮する。例えば、距離Dの値が2の場合、4次元しかない空間では共通点はゼロとなるが、10次元の空間であれば共通点は8割と考えられる。
【0058】
なお、検索においてより精度を上げるならば、類義語を考慮に入れることが好ましい。この場合、キーワードの座標値も"0 or 1"ではなく、類義語間の意味の強弱に応じてより広い値をとる等の処置を行う。またキーワードの中には、"システム"などのように頻繁に用いられるがあまり検索対象との結びつきが強くないものも有り得る。こうしたキーワードには座標値として低い値をつけるといった処理を行うこともできる。
【0059】
○集約処理を事前に行う方法
次に、集約処理を事前に行う方法について説明する。例えば、過去の選択結果として下記のデータが存在するものとする。
選択結果1 {DOC1, DOC2, DOC3, DOC4}
選択結果2 {DOC2, DOC4, DOC5}
選択結果3 {DOC5, DOC6, DOC7, DOC8, DOC9}
選択結果4 {DOC6, DOC8, DOC9}
選択結果5 {DOC9, DOC10, DOC11}
【0060】
まず、これらのデータを、選択されている文書の類似性で分類する。ここでは、文書の内容ではなく、選択結果のパターンから分類する。具体的な分類方法は、データの分布などから適切な分類を行う統計的な手法として各種知られている手法を採用できる。例えば、選択結果間の類似性は、上記のキーワード・セット間の距離の計算と同じものでも計算可能である。ただし、適切なグループ数の決め方や、距離を計算するための基準となる座標の決め方、大量データの処理方法等を考慮することが好ましい。
【0061】
例えば、次に示す例ではセット間の距離Dが3以下であるものは同じグループに属すると見なして、得られる選択文書セット1,2,3である。
選択文書セット1:
(選択結果1+2)={DOC1(1), DOC2(2), DOC3(1), DOC4(2), DOC5(1)}
選択文書セット2:
(選択結果3+4)={DOC5(1), DOC6(2), DOC7(1), DOC8(2), DOC9(2)}
選択文書セット3:
(選択結果5)={DOC9(1), DOC10(1), DOC11(1)}
ここで、DOCjのjは、選択されたj番目の文書を表し、DOCj(n)のnは、文書DOCjがn回選択されたことを表す。なお、このようなデータの集約処理は、実際に選択結果が保存される度に行なう方法や、例えば1日分の選択結果をまとめて、夜間などにバッチ処理するといった方法が採用できる。
【0062】
このように集約された集約データが蓄積された状態において、下記のような選択された文書に基づく類似文書検索が行なわれたとする。
指定文書:{DOC1, DOC5}
このとき、{DOC1, DOC5}を含む選択文書セットを蓄積された集約データから検索する。この例では、上記した選択文書セット1が選択され、その結果は以下のようになる。
検索結果:{DOC1(1), DOC2(2), DOC3(1), DOC4(2), DOC5(1) }
【0063】
なお、検索される選択文書セットは複数あっても良い。例えば、下記のような指定文書(選択された文書)に基づく類似文書検索が行なわれたとする。
指定文書:{DOC5}
この場合は、選択文書セット1,2が検索対象となり、その結果は以下のようになる。
検索結果:{DOC1(1), DOC2(2), DOC3(1), DOC4(2), DOC5(2), DOC6(2), DOC7(1), DOC8(2), DOC9(2)}
また、この状態において更に指定文書としてDOC1を追加で選択すると、その結果は以下のようになり、検索においてより正確な絞り込みを行うことができる。
検索結果:{DOC1(1), DOC2(2), DOC3(1), DOC4(2), DOC5(1)}
すなわち、上記のDOC1とDOC5を始めから指定した場合と同じ検索結果が得られる。
【0064】
図19に、以上説明したキーワード・セットと集約処理を用いた選択文書リストの保存処理の流れを示す。
まず、サーバ20は、新たな検索の結果生じた新規キーワード・セットと、選択履歴データ蓄積部34に記憶されているキーワード・セットとの距離Dを計算する(ステップS501)。そしてサーバ20は、距離Dが指定値以下か否かを判断する(ステップS503)。この指定値は、キーワードの数、すなわち次元に応じて適宜設定することができる。
【0065】
ステップS503において距離Dが指定値以下ではないと判断した場合、新規キーワード・セットと、ステップS227で受信した選択文書リストを選択履歴データ蓄積部34に記憶する(ステップS504)。ステップS503において距離Dが指定値以下であると判断した場合、既に選択履歴データ蓄積部34に記憶されているキーワード・セットについてキーワード毎の選択回数を更新させ、すなわち1増加させ、新規キーワードについては選択回数を“1”にセットして記憶する(ステップS505)。
【0066】
続けて、抽出されたキーワード・セットと新規キーワード・セット内の選択文書のグループとの距離D’を計算する(ステップS507)。距離D’が所定の指定値以下であるか否かを判断する(ステップS509)。距離D’が指定値以下ではないと判断した場合、新しい選択文書リストを選択履歴データ蓄積部34に記憶し(ステップS510)、本処理を終了する。距離D’が指定値以下であると判断した場合、選択履歴データ蓄積部34に既に記憶されている選択文書リスト毎の選択回数を更新させ、すなわち1増加させ、新規文書について選択回数を“1”にセットして記憶し(ステップS511)、本処理を終了する。
【0067】
先の例において図19の処理を行った場合の選択回数データの蓄積例を図20に示す。
なお、図20では、キーワード・セットの集約の後、そのキーワード・セット内での選択文書セットによる集約が実行されている。しかしながら、キーワード・セットの集約を省略し、選択文書セットによる集約のみとしてもよいことに注意されたい。
【0068】
このように検索に用いたキーワード・セットに対して距離Dの近い過去のキーワード・セットを抽出し、その過去のキーワード・セットにおいて選択されていた文書を抽出することで、類似文書検索を行うことができる。以上のように、本実施の形態では、類似文書検索として様々な方法を採用することができ、目的とする文書を高い精度で抽出することができる。
【0069】
その他、本実施の形態の検索処理は、上記述べた方法に限定されない。例えば、本実施の形態の検索処理では、類似文書検索の前に全文検索が行われているが、検索方法はこれに限定されず、例えば、タイトルや要約、または番号による検索であってもよい。また、所定の文書を最初に指定することで、全文検索等の前処理を行うことなく初めから類似文書検索を行うことも可能である。
また、本実施の形態においてユーザ端末10における検索は、ユーザ端末10に導入した所定のプログラムで処理されるものであってもよく、またインターネット等のネットワークからのデータを表示するブラウザ上で処理されるものであってもよい。
【0070】
なお、本実施の形態で示したような処理を行うためのプログラムは、以下のような記憶媒体、プログラム伝送装置の形態とすることもできる。すなわち、記憶媒体としては、コンピュータ装置に実行させるプログラムを、CD−ROM、DVD、メモリ、ハードディスク等の記憶媒体に、コンピュータ装置が読み取り可能に記憶させれば良い。また、プログラム伝送装置としては、上記したようなプログラムを記憶させたCD−ROM、DVD、メモリ、ハードディスク等の記憶手段と、この記憶手段から当該プログラムを読み出し、当該プログラムを実行する装置側に、コネクタ、あるいはインターネットやLAN等のネットワークを介して当該プログラムを伝送する伝送手段とを備える構成とすれば良い。
【0071】
その他、検索を行うユーザに対して表示する画面は、本実施の形態で示す検索ごとにウィンドウが切り替わるものに限られない。例えば、全文検索の結果に対して行った類似文書検索の結果を、全文検索の結果においてハイライトをつけたり、並び替えすることで表示させたりすることもできる。
また、本実施の形態では、選択文書リストを作成するための文書の選択は、ユーザによって選択ボタンをチェックすることで行われるが、選択の指定方法はこれに限定されない。例えば、カートのようなものにユーザが選択したい文書を入れる方法であってもよい。また、ユーザが文書の本文や要約を閲覧するためにクリックしたものを自動的に選択されるように処理することもできる。
【0072】
なお、本実施の形態では、検索対象を文書等の文字データとしているが、検索対象はこれに限定されない。例えば、検索対象は画像等の視覚で認識するものや音楽等の音で認識するものに対しても応用することが可能である。
これ以外にも、本発明の主旨を逸脱しない限り、上記実施の形態で挙げた構成を取捨選択したり、他の構成に適宜変更することが可能である。
【0073】
【発明の効果】
このように本発明によれば、検索システムにおいてユーザが必要な情報をより的確に抽出することができる。
【図面の簡単な説明】
【図1】 実施の形態における検索サービス提供システムを説明する図である。
【図2】 ユーザ端末における処理の流れを示す図である。
【図3】 ユーザ端末の表示部に表示されるメイン画面を示す図である。
【図4】 キーワードを入力する画面を示す図である。
【図5】 表示部に表示される全文検索結果の画面を示す図である。
【図6】 文書データの本文を表示させた画面を示す図である。
【図7】 ユーザ端末の表示部に表示されるメイン画面を示す図である。
【図8】 表示部に表示される類似文書検索結果の画面を示す図である。
【図9】 類似検索結果の画面を示す図である。
【図10】 サーバにおける処理の流れを示す図である。
【図11】 文書DBの索引データ蓄積部に蓄積されたデータの一例を示す図である。
【図12】 文書DBの本文データ蓄積部に蓄積されたデータの一例を示す図である。
【図13】 全文検索結果記憶部に保存されるデータの一例を示す図である。
【図14】 類似文書検索における具体的な処理の流れを示す図である。
【図15】 履歴DBの選択履歴データ蓄積部に蓄積された選択履歴データの一例を示す図である。
【図16】 類似文書検索結果記憶部に保存するデータの一例を示す図である。
【図17】 選択結果記憶部に記憶されるデータの一例を示す図である。
【図18】 選択文書リストの保存処理の流れを説明する図である。
【図19】 選択文書リストの保存処理の流れの他の例を説明する図である。
【図20】 図19の集約結果のデータの蓄積例を示す図である。
【符号の説明】
10…ユーザ端末、20…サーバ、22…全文検索実行部、23…類似文書検索実行部(判断部、オブジェクト特定部、オブジェクト抽出部)、24…選択履歴蓄積処理部(選択履歴記憶部)、25…記憶部、26…全文検索結果記憶部、27…類似文書検索結果記憶部、28…選択結果記憶部、30…文書DB(オブジェクト・データベース)、31…索引データ蓄積部、32…本文データ蓄積部、33…履歴DB(選択履歴記憶部)、34…選択履歴データ蓄積部、35…選択回数データ蓄積部

Claims (10)

  1. あらかじめ記憶された文書に対する検索処理を実行するサーバと、前記サーバに対して検索処理を要求する少なくとも1つの端末を備えた検索システムであって、
    前記端末は、
    検索結果に示される所定の文書に対するユーザの指定を受け付け、
    指定された前記文書(指定文書)に基づく拡張検索を前記サーバに対して要求し、
    前記サーバは、
    前記ユーザもしくはその他のユーザまたはその両方が、過去の検索結果から最終的な閲覧対象として同時に選択した少なくとも1つの文書からなる1または複数のグループを選択履歴として記憶しており、
    前記拡張検索の要求を受け付け、
    前記選択履歴から、前記指定文書が属するグループを抽出し、
    抽出された前記グループに属する文書を拡張検索結果として出力することを特徴とする検索システム。
  2. 前記端末は、前記拡張検索結果に含まれる文書に対してユーザが行った最終的な閲覧対象の選択を前記サーバへ送出し、
    前記サーバは、前記選択から新たなグループを作成し、当該新たなグループを前記選択履歴として記憶することを特徴とする請求項1記載の検索システム。
  3. 前記端末は、前記拡張検索の要求の前において検索用タームに基づく準備用検索を前記サーバに対して要求し、
    前記指定文書は、前記準備用検索の結果から選択された文書であることを特徴とする請求項1記載の検索システム。
  4. 前記サーバは、前記準備用検索に用いた前記検索用タームを、前記拡張検索結果から最終的な閲覧対象として同時に選択された少なくとも1つの文書からなるグループ(文書グループ)と共に前記選択履歴として記憶し、互いに類似する複数の前記検索用タームと共に記憶された複数の前記文書グループをまとめて1つのグループとすることを特徴とする請求項3記載の検索システム。
  5. ユーザからの要求に応じてオブジェクトの検索処理を行うシステムであって、
    前記ユーザもしくはその他のユーザまたはその両方が、過去の検索結果から最終的な閲覧対象として同時に選択したオブジェクトを選択履歴データとして記憶する選択履歴記憶部と、
    拡張検索用に前記ユーザが指定したオブジェクト(指定オブジェクト)に基づく拡張検索要求を受け付ける受付部と、
    前記指定オブジェクトの履歴データが、前記選択履歴記憶部に記憶されているか否かを判断する判断部と、
    前記指定オブジェクトの履歴データが前記選択履歴記憶部に記憶されていると前記判断部により判断されると、当該選択履歴記憶部に記憶された前記検索結果から前記指定オブジェクトと同時に選択された1または複数のオブジェクトを特定するオブジェクト特定部と、
    を備えたことを特徴とするシステム。
  6. オブジェクトを蓄積したオブジェクト・データベースと、
    前記オブジェクト特定部により特定された前記オブジェクトを、前記オブジェクト・データベースから抽出するオブジェクト抽出部と、
    をさらに備えたことを特徴とする請求項5記載のシステム。
  7. データベースから目的とする文書の検索をコンピュータにより行う検索方法であって、
    前記コンピュータが備える1次検索手段が、ユーザの要求に応じて所定のタームを基に1次検索を行うステップと、
    前記コンピュータが備える選択受付手段が、前記1次検索の結果に対して所定の文書の選択を受け付けるステップと、
    前記コンピュータが備える2次検索手段が、選択された前記所定の文書に基づいて2次検索を行うステップと、を有し、
    前記コンピュータは、前記ユーザもしくはその他のユーザまたはその両方を含むユーザが、過去の検索結果から最終的な閲覧対象として同時に選択した文書の履歴(選択文書履歴)を記憶する記憶手段を有しており、前記2次検索では、前記記憶手段に前記所定の文書の履歴がある場合に、当該所定の文書と同時に選択された履歴を有する文書を抽出することを特徴とする検索方法。
  8. 前記2次検索において抽出された前記文書の中から最終的な閲覧対象として同時に選択された文書の履歴を、前記選択文書履歴に追加して記憶するステップをさらに有することを特徴とする請求項7記載の検索方法。
  9. 類似検索処理をコンピュータ装置に実行させるためのプログラムであって、
    前記コンピュータ装置は、過去の検索結果から最終的な閲覧対象として選択されたオブジェクトの選択履歴を、当該オブジェクトのグループとして記憶した記憶手段を備えており、
    類似検索用にユーザが指定したオブジェクト(指定オブジェクト)に基づく類似検索要求を受け付ける手順と、
    前記記憶手段に前記指定オブジェクトについての選択履歴が既に記憶されている場合、当該選択履歴を抽出する手順と、
    前記選択履歴から、前記指定オブジェクトと同じグループに属するオブジェクトを抽出する手順と
    を前記コンピュータ装置に実行させることを特徴とするプログラム。
  10. 前記指定オブジェクトと同じグループに属するオブジェクトは、前記ユーザによって当該指定オブジェクトと同時に最終的な閲覧対象として選択されたオブジェクトであることを特徴とする請求項9記載のプログラム。
JP2002046934A 2002-02-22 2002-02-22 検索システム、システム、検索方法およびプログラム Expired - Fee Related JP3791908B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002046934A JP3791908B2 (ja) 2002-02-22 2002-02-22 検索システム、システム、検索方法およびプログラム
US10/366,833 US7110996B2 (en) 2002-02-22 2003-02-14 System and method for determining numerical representations for categorical data fields and data processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002046934A JP3791908B2 (ja) 2002-02-22 2002-02-22 検索システム、システム、検索方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2003256471A JP2003256471A (ja) 2003-09-12
JP3791908B2 true JP3791908B2 (ja) 2006-06-28

Family

ID=27750669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002046934A Expired - Fee Related JP3791908B2 (ja) 2002-02-22 2002-02-22 検索システム、システム、検索方法およびプログラム

Country Status (2)

Country Link
US (1) US7110996B2 (ja)
JP (1) JP3791908B2 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8275661B1 (en) 1999-03-31 2012-09-25 Verizon Corporate Services Group Inc. Targeted banner advertisements
WO2000058863A1 (en) 1999-03-31 2000-10-05 Verizon Laboratories Inc. Techniques for performing a data query in a computer system
US8572069B2 (en) * 1999-03-31 2013-10-29 Apple Inc. Semi-automatic index term augmentation in document retrieval
US6718363B1 (en) 1999-07-30 2004-04-06 Verizon Laboratories, Inc. Page aggregation for web sites
US6912525B1 (en) 2000-05-08 2005-06-28 Verizon Laboratories, Inc. Techniques for web site integration
US7460737B2 (en) * 2004-02-12 2008-12-02 Hoshiko Llc Method and apparatus for photograph finding
JP2005267607A (ja) * 2004-02-20 2005-09-29 Fuji Photo Film Co Ltd デジタル図鑑システム、図鑑検索方法、及び図鑑検索プログラム
JP2006031391A (ja) * 2004-07-15 2006-02-02 Nippon Telegr & Teleph Corp <Ntt> 情報検索システム
US8386453B2 (en) 2004-09-30 2013-02-26 Google Inc. Providing search information relating to a document
US7765208B2 (en) * 2005-06-06 2010-07-27 Microsoft Corporation Keyword analysis and arrangement
JP4281719B2 (ja) * 2005-08-10 2009-06-17 コニカミノルタビジネステクノロジーズ株式会社 ファイル処理装置、ファイル処理方法、およびファイル処理プログラム
JP2007133809A (ja) * 2005-11-14 2007-05-31 Canon Inc 情報処理装置、コンテンツ処理方法、記憶媒体およびプログラム
US7747600B2 (en) * 2007-06-13 2010-06-29 Microsoft Corporation Multi-level search
US8195687B2 (en) 2007-08-08 2012-06-05 Panasonic Corporation Program retrieval support device for accumulating and searching pieces of program information and corresponding programs and a method for performing the same
US7792813B2 (en) * 2007-08-31 2010-09-07 Microsoft Corporation Presenting result items based upon user behavior
JP5246932B2 (ja) * 2008-08-29 2013-07-24 西日本電信電話株式会社 検索装置及び方法、ならびに、コンピュータプログラム
JP2012058941A (ja) * 2010-09-08 2012-03-22 Seiko Epson Corp 情報検索装置、情報検索方法およびコンピュータープログラム
CN102737038B (zh) * 2011-04-07 2015-09-23 阿里巴巴集团控股有限公司 关联度确定方法及装置、信息提供方法及装置
CN103678358A (zh) * 2012-09-13 2014-03-26 腾讯科技(深圳)有限公司 一种信息搜索方法及系统
JP5701846B2 (ja) * 2012-11-28 2015-04-15 京セラドキュメントソリューションズ株式会社 画像形成装置
US9858291B1 (en) * 2013-10-30 2018-01-02 Google Inc. Detection of related local entities
CN104391958B (zh) * 2014-11-28 2018-06-26 北京国双科技有限公司 网页搜索关键词的相关性检测方法及装置
RU2632133C2 (ru) 2015-09-29 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и система (варианты) создания модели прогнозирования и определения точности модели прогнозирования
RU2692048C2 (ru) 2017-11-24 2019-06-19 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для преобразования значения категориального фактора в его числовое представление и для создания разделяющего значения категориального фактора
RU2693324C2 (ru) * 2017-11-24 2019-07-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер преобразования значения категориального фактора в его числовое представление
CN108227954A (zh) * 2017-12-29 2018-06-29 北京奇虎科技有限公司 一种提供搜索输入联想词的方法、装置及电子设备
CN110427487B (zh) * 2019-07-30 2022-05-17 中国工商银行股份有限公司 一种数据标注方法、装置及存储介质
EP4006743A4 (en) * 2019-10-01 2022-10-05 JFE Steel Corporation INFORMATION SEARCH SYSTEM

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096794A (ja) 1995-06-14 1997-01-10 Fuji Xerox Co Ltd データ検索指示装置
JPH0962658A (ja) 1995-08-21 1997-03-07 Hitachi Inf Syst Ltd 文書間リンク処理システム
US5826261A (en) * 1996-05-10 1998-10-20 Spencer; Graham System and method for querying multiple, distributed databases by selective sharing of local relative significance information for terms related to the query
US5974412A (en) * 1997-09-24 1999-10-26 Sapient Health Network Intelligent query system for automatically indexing information in a database and automatically categorizing users
US6772150B1 (en) * 1999-12-10 2004-08-03 Amazon.Com, Inc. Search query refinement using related search phrases
JP2002046934A (ja) 2000-08-03 2002-02-12 Ricoh Co Ltd 粘着部品の剥離装置及び供給装置
CN1535433A (zh) * 2001-07-04 2004-10-06 库吉萨姆媒介公司 基于分类的可扩展交互式文档检索系统

Also Published As

Publication number Publication date
US20030163462A1 (en) 2003-08-28
US7110996B2 (en) 2006-09-19
JP2003256471A (ja) 2003-09-12

Similar Documents

Publication Publication Date Title
JP3791908B2 (ja) 検索システム、システム、検索方法およびプログラム
JP5638031B2 (ja) 格付け方法、検索結果分類方法、格付けシステム及び検索結果分類システム
US7769771B2 (en) Searching a document using relevance feedback
US6564210B1 (en) System and method for searching databases employing user profiles
US7809717B1 (en) Method and apparatus for concept-based visual presentation of search results
US7752243B2 (en) Method and apparatus for construction and use of concept knowledge base
US10891700B2 (en) Methods and computer-program products for searching patent-related documents using search term variants
US7475074B2 (en) Web search system and method thereof
US20040133557A1 (en) Retrieval of structured documents
JP2007004807A (ja) 領域に固有のメタサーチを実行し、そのサーチ結果を視覚化するシステム、方法、及びコンピュータ可読媒体
JP4746439B2 (ja) 文書検索サーバおよび文書検索方法
CN112100396B (zh) 一种数据处理方法和装置
JP2004341753A (ja) 検索支援装置、検索支援方法、およびプログラム
JP4973503B2 (ja) ファイル検索プログラム、方法及び装置
TW201211805A (en) Information provision device, information provision method, programme, and information recording medium
US20110119250A1 (en) Forward Progress Search Platform
JPWO2012023541A1 (ja) 情報提供装置、情報提供方法、プログラム、ならびに、情報記録媒体
JP3730878B2 (ja) 情報検索配信システム、情報検索方法、および、プログラム
Gretzel et al. Intelligent search support: Building search term associations for tourism-specific search engines
JPH09114847A (ja) 情報処理装置
JPWO2017134760A1 (ja) 情報検索方法及び情報検索装置並びに情報検索システム
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP2009003731A (ja) 特許検索システム
JPH11126204A (ja) 速読支援方法、文書検索方法およびその装置
JPH11212987A (ja) 情報検索装置および情報検索プログラムを記録した記憶媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050516

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060314

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20060316

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060403

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090414

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100414

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110414

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110414

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees