JP3711710B2 - 情報検索収集システムおよび情報検索収集プログラムを記憶した記憶媒体 - Google Patents
情報検索収集システムおよび情報検索収集プログラムを記憶した記憶媒体 Download PDFInfo
- Publication number
- JP3711710B2 JP3711710B2 JP27131497A JP27131497A JP3711710B2 JP 3711710 B2 JP3711710 B2 JP 3711710B2 JP 27131497 A JP27131497 A JP 27131497A JP 27131497 A JP27131497 A JP 27131497A JP 3711710 B2 JP3711710 B2 JP 3711710B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- class
- content
- collection
- collected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、ある特定の情報をインターネット上から収集する際、ユーザの入力するキーワードに関連する多数の情報の中からユーザの要求に見合った情報を収集してその収集した情報を1つの包括的な情報として出力する情報検索収集方法およびそのシステムに関する。
【0002】
【従来の技術】
最近、インターネットを利用して各種情報の検索したり収集することが可能になってきた。インターネット上から情報の検索・収集を行うには、たとえば、ユーザの入力したキーワードをサーチエンジンにかけて、そのキーワードに対してヒットしたすべてのページのアドレスを出力するというような検索方法がある。たとえば、或る有名な人物についての情報を収集しようとして、その人物の氏名をキーワードとして入力すると、そのキーワードに対してヒットするページのアドレスがすべて出力される。これによって、ユーザは、その人物に関する様々な情報の中で、ユーザの必要とする情報を得るために、その情報が有りそうなページをアクセスして、必要な情報のみを取り出すというような作業を行うことで、所望とする情報を得るようにしている。
【0003】
【発明が解決しようとする課題】
しかしながら、上述したような検索・収集方法では、情報収集しようとする人物が多方面に活躍しているような人物である場合には、氏名だけのキーワードで検索すると、検索されるページ数は、ときには数百ページにもなることがある。これは、人物だけではなく、たとえば、ある施設などについての情報を得ようとする場合も、有名な施設の場合には、色々な分野にその施設の情報が存在している可能性が高く、施設名をキーワードとして検索・収集しようとすると、膨大なページ数が検索されることになる。
【0004】
このような検索・収集の手間を少しでも改善する方法として、たとえば、収集しようとする情報についてその情報を表す複数のキーワードを入力可能として、すべてのキーワードに対してヒットするページのアドレスを出力したり、キーワードが一定の数以上出てくるページのみのアドレスを出力するというように、ある程度の情報絞り込みを行うようにすることもなされている。
【0005】
具体例としては、広い分野で活躍する或る有名な人物の情報として、その人物の主な職業とそれに関連する様々な情報を収集しようとする場合、その人物の氏名と主な職業をキーワードとして入力することにより、両方のキーワードに対してヒットするページのみのアドレスを出力することにより、取り出されるページ数は大幅に絞り込まれることになる。
【0006】
しかしながら、このようにして或る程度の絞り込みがなされて取り出された場合でも、ユーザが本当に必要とする情報は取り出されたページすべてではなく、その中の一部であることが多く、結局は、取り出されたページの中から、ユーザが必要な情報を取捨選択するというような作業を行う必要がある。
【0007】
このように、現段階の検索サービスでは、ある程度の情報の絞り込みはなされた場合でも、結局は、検索された大量の情報の中からユーザが自ら必要な情報を探して1つの情報ページとして編集する必要があり、使い勝手の面でさらに改善の余地がある。
【0008】
そこで本発明は、ユーザからのキーワードをもとに、ユーザの入力要求解析を行い、ユーザの要求をシステムが理解できるような形式に変換して、予め設定したアルゴリズムに基づいて情報の検索・収集を行い、ユーザの要求入力に応じた包括的な情報として提供できるようにすることを目的としている。
【0009】
【課題を解決するための手段】
本発明の情報検索収集方法は、要求入力に基づいて情報を検索して収集する情報検索収集方法において、要求入力をシステムが理解できる要求入力形式とし、その要求入力形式に基づき、当該要求入力に関連した情報を収集し、その収集した結果を解析して、必要なコンテンツを取り出し、取り出したコンテンツを要求入力に応じた包括的な情報として出力することを特徴としている。
【0010】
さらに、具体的には、要求入力に基づいて情報を検索して収集する情報検索収集方法において、オブジェクト指向プログラミングに基づいてそれぞれのコンテンツのカテゴリを表現するカテゴリクラスを定義し、各カテゴリクラスは各カテゴリごとに収集すべき情報項目がプロパティとして設定されるとともに、それぞれのプロパティごとに情報取得方法や情報の加工処理方法などを記述したメソッドを有し、要求入力をシステムが理解できる要求入力形式としたのち、その要求入力を前記カテゴリクラスに分類し、その要求入力に対し、その要求入力が属するクラスのプロパティに基づき、かつ、前記メソッドに記述された内容に基づいて、前記収集すべき情報項目に関する情報を検索して収集するとともに、その収集結果を要求入力に応じた包括的な情報として出力することを特徴としている。
【0011】
そして、前記収集すべき情報項目を表現するタイトルクラスを定義し、それぞれのタイトルクラスは、それぞれの情報項目ごとにそれぞれの情報項目に対する情報の内容がプロパティとして設定されるとともに、それぞれの情報の内容ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有するようなクラス構造を持つようにしてもよい。
【0012】
さらに、前記情報の内容を表現する情報形式クラスを定義し、それぞれの情報形式クラスは、それぞれの情報の内容ごとにそれぞれの情報内容に対する情報の表し方がプロパティとして設定されるとともに、それぞれの情報の表し方ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有するようなクラス構造を持つようにしてもよい。
【0013】
さらにまた、このような情報検索収集方法において、前記各カテゴリごとのプロパティを表示し、その表示されたプロパティの中から任意のプロパティを選択可能とするようにしてもよい。
【0014】
また、本発明の情報検索収集システムは、要求入力に基づいて情報を検索して収集する情報検索収集システムにおいて、要求入力をシステムが理解できる要求入力形式とする要求解析手段と、この要求解析手段により得られた要求入力形式に基づき、当該要求入力に関連した情報を収集する情報収集手段と、その収集した結果を解析して、必要なコンテンツを取り出すコンテンツ解析・収集手段と、このコンテンツ解析・収集手段により取り出されたコンテンツを要求入力に応じた包括的な情報として編集して出力する情報編集・出力手段とを有することを特徴としている。
【0015】
さらに具体的には、要求入力に基づいて情報を検索して収集する情報検索収集システムにおいて、要求入力をシステムが理解できる要求入力形式とする要求解析手段と、この要求解析手段により得られた要求入力形式に基づき、当該要求入力に関連した情報を収集する情報収集手段と、その収集した結果を解析して、必要なコンテンツを取り出すコンテンツ解析・収集手段と、このコンテンツ解析・収集手段により取り出されたコンテンツを要求入力に応じた包括的な情報として編集して出力する情報編集・出力手段とを有し、オブジェクト指向プログラミングに基づいてそれぞれのコンテンツのカテゴリを表現するカテゴリクラスを定義し、各カテゴリクラスは各カテゴリごとに収集すべき情報項目がプロパティとして設定されるとともに、それぞれのプロパティごとに情報取得方法や情報の加工処理方法などを記述したメソッドを有し、要求入力をシステムが理解できる要求入力形式としたのち、その要求入力を前記カテゴリクラスに分類し、その要求入力に対し、その要求入力が属するクラスのプロパティに基づき、かつ、前記メソッドに記述された内容に基づいて、前記収集すべき情報項目に関する情報を検索して収集するとともに、その収集した結果を要求入力に応じた包括的な情報として出力することを特徴としている。
【0016】
そして、このような情報検索収集システムにおいて、前記収集すべき情報項目をタイトルクラスとして定義し、それぞれのタイトルクラスは、それぞれの情報項目ごとにそれぞれの情報項目に対する情報の内容がプロパティとして設定されるとともに、それぞれの情報の内容ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有するようなクラス構造を持つようにしてもよい。さらに、前記情報の内容を情報形式クラスとして定義し、それぞれの情報形式クラスは、それぞれの情報の内容ごとにそれぞれの情報内容に対する情報の表し方がプロパティとして設定されるとともに、それぞれの情報の表し方ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有するようなクラス構造を持つようにしてもよい。
【0017】
さらにまた、このような情報検索収集システムにおいて、前記各カテゴリごとのプロパティを表示し、その表示されたプロパティの中から任意のプロパティを選択可能としてもよい。
また、本発明の情報検索収集プログラムを記憶した記憶媒体は、要求入力に基づいて情報を検索して収集する処理を実行する情報検索収集プログラムを記憶した記憶媒体において、前記情報検索収集プログラムが、
要求入力をシステムが理解できる要求入力形式とする要求解析ステップと、
この要求解析ステップにより得られた要求入力形式に基づき、当該要求入力に関連した情報を収集する情報収集ステップと、
その収集した結果を解析して、必要なコンテンツを取り出すコンテンツ解析・収集ステップと、
このコンテンツ解析・収集ステップにより取り出されたコンテンツを要求入力に応じた包括的な情報として編集して出力する情報編集・出力ステップと、
を実行することを特徴としている。
さらに具体的には、要求入力に基づいて情報を検索して収集する処理を実行する情報検索収集プログラムを記憶した記憶媒体において、前記情報検索収集プログラムが、
要求入力をシステムが理解できる要求入力形式とする要求解析ステップと、
この要求解析ステップにより得られた要求入力形式に基づき、当該要求入力に関連した情報を収集する情報収集ステップと、
その収集した結果を解析して、必要なコンテンツを取り出すコンテンツ解析・収集ステップと、
このコンテンツ解析・収集ステップにより取り出されたコンテンツをユーザからの要求入力に応じた包括的な情報として編集して出力する情報編集・出力ステップと、を有し、
オブジェクト指向プログラミングに基づいてそれぞれのコンテンツのカテゴリを表現するカテゴリクラスを定義し、各カテゴリクラスは各カテゴリごとに収集すべき情報項目がプロパティとして設定されるとともに、それぞれのプロパティごとに情報取得方法や情報の加工処理方法などを記述したメソッドを有し、ユーザからの要求入力をシステムが理解できる要求入力形式としたのち、その要求入力を前記カテゴリクラスに分類し、その要求入力に対し、その要求入力が属するクラスのプロパティに基づき、かつ、前記メソッドに記述された内容に基づいて、前記収集すべき情報項目に関する情報を検索して収集するとともに、その収集した結果をユーザの要求入力に応じた包括的な情報として出力する処理を実行することを特徴としている。
【0018】
上述したように、本発明は、ユーザからの要求入力をシステムが理解できる要求入力形式としたのち、その要求入力をカテゴリクラスに分類し、その要求入力に対し、その要求入力が属するクラスのプロパティに基づき、かつ、各プロパティごとのメソッドに記述された内容に基づいて情報を検索して収集するとともに、収集結果をユーザの要求入力に応じた包括的な情報として出力するようにしている。これにより、システム側では、ユーザの入力するキーワードに基づいて、予め定められたアルゴリズムにしたがって処理するだけでユーザの所望とする情報の検索収集を行うことができ、効率の良い情報検索・収集が可能となる。また、収集された情報は、ユーザの要求入力に応じた1つのまとまった情報として取り出すことができる。
【0019】
また、情報項目をタイトルクラスとして定義し、それぞれのタイトルクラスごとに、情報内容をプロパティとして設定し、そのメソッドを決めていることにより、前記情報項目ごとの情報内容の情報収集の仕方や情報の加工の仕方などを示すメソッドを、ユーザからのキーワードで分類されるカテゴリクラスごとに設定する必要が無くなり、アルゴリズムを簡素化することができ、処理の効率化が図れる。
【0020】
さらに、それぞれの情報の内容ごとに、情報の表し方をプロパティとして設定するとともに、それぞれの情報の表し方ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有するようにしているので、異なったクラスにおいて同じ形式の情報である場合などに、共通のアルゴリズムで処理を行うことができ、処理の効率化が図れる。
【0021】
また、各カテゴリごとのプロパティをユーザに対して表示し、その表示されたプロパティの中から任意のプロパティをユーザが選択可能としているので、ユーザカスタマイズが実現でき、ユーザの好みに応じた情報のみに対して検索収集するということも可能となり処理の効率化が図れる。
【0022】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照して説明する。
【0023】
本発明の概略的な処理としては、図1に示すように、ユーザからの検索要求を受け付けると、その検索要求の解析を行い(ステップs1)、システムが理解できる形式にする。そして、ユーザからの要求入力に基づいて、たとえばサーチエンジンにかけてその検索要求に関連した情報報収集を行い(ステップs2)、コンテンツ解析を行って、必要な情報の収集を行う(ステップs3)。そして、収集した情報の編集を行いユーザに対してその情報を表示する(ステップs4)。以上の処理の流れは本発明が行おうとする概略的な処理であり、個々の処理について具体的に説明する。
【0024】
たとえば、ユーザが世界的に有名な人物(この人物を「A」と呼ぶ)について、その人物の情報を収集しようとする場合について説明する。この人物Aは、技術者としても経営者としても、また、他の分野においても世界的に有名な人物であるとし、ここでは、ユーザは、予め定義されたカテゴリクラス構造に基づいて、人物Aの技術者ならびに経営者としての情報を収集しようとするものとする。ユーザが必要とする人物Aの技術者および経営者としての情報としては、たとえば、人物Aの顔写真、経歴、技術者としての技術論文、経営者としての資産などであるとする。
【0025】
今、ユーザが人物Aの技術者および経営者としての情報を得ようとした場合、その情報要求入力方法は種々の方法が考えられるが、その1つの方法として、たとえば、キーボードから人物Aの氏名「A」を入力する。この段階では、システム側は、その入力を解析すると、ユーザの要求は「Aという名前の人物」について何らかの情報検索要求であることを理解する。次に、ユーザがこの人物Aについて収集しようとする情報を入力する。ここでは、ユーザは「A」という人物の技術者および経営者としての情報を収集しようとしているので、技術者および経営者というような内容を入力する。
【0026】
これにより、システム側では、ユーザからの要求は、「人物、技術者であり経営者、氏名はA」であるというように、予め定義されたカテゴリクラス構造に基づいた入力形式とする。
【0027】
すなわち、本発明は、図2に示すようなオブジェクト指向プログラミングによるクラス構造(これをクラス構造1という)を有する。図2からもわかるように、コンテンツとしてカテゴリがあって、そのカテゴリとしては、たとえば、施設、人物、製品などのカテゴリクラスがあって、そのカテゴリクラスのサブクラスとして、人物の場合は、技術者、経営者、さらには、図示されていないが、スポーツ選手、政治家などというようなクラスを持っている。
【0028】
このようなクラス構造において、たとえば、「A」は、人物クラスのサブクラスである経営者クラスと技術者クラスを継承した技術者/経営者のインスタンスということになる。
【0029】
ユーザの要求入力は、カテゴリクラスの1つのクラスのインスタンスの場合もあるが、上述の例のように、複数のカテゴリクラスを継承したインスタンスとなる場合もある。
【0030】
そして、カテゴリの中のどのクラスかが決まれば、それぞれのクラスごとに、収集すべき情報の項目が決まるようになっている。たとえば、図3に示すように、クラスが人物クラスであれば、たとえば、顔、経歴、職業などがプロパティとして設定され、経営者クラスであれば、たとえば、資産がそのプロパティとして設定され、技術者クラスであれば、たとえば、論文がそのプロパティとして設定されるというように、それぞれのクラスごとに収集すべき情報の項目をプロパティとして予め設定しておく。
【0031】
さらに、それぞれのプロパティに対して、その情報収集の仕方(constructor)とユーザに対する情報表示の仕方(show)をメソッドとして予め記述しておく。
【0032】
たとえば、人物クラスのプロパティである「顔」に対しては、「A」という氏名をキーワードとしてサーチエンジンにかけられて収集された情報の中で、顔画像ファイルで、かつ、タイトルがその人物の名前である画像を取り出すというように、それぞれの項目ごとに情報収集の仕方を記述しておく。
【0033】
このように、この実施の形態では、たとえば、人物名、経営者/技術者というようなユーザの入力したキーワードを、システムが予め持っているカテゴリクラス構造に基づいた入力形式としたのち、それぞれのカテゴリクラスに対して、予め設定されたプロパティ(人物クラスに対しては、顔、経歴など、経営者クラスに対しては資産など、技術者クラスに対しては論文など)ごとに予め定められた情報収集の仕方に基づいて情報収集をして、収集された情報を包括的な情報としてユーザに出力するようにしている。
【0034】
つまり、この場合、ユーザがカテゴリを特定するだけで、たとえば、「A」という人物に対して、その顔写真、経歴、論文、資産など、人物Aの経営者/技術者としての情報が1つのページにまとめられた形でユーザに対して表示される。ところで、図2に示したクラス構造1は、コンテンツの中身としてカテゴリのそれぞれのクラスあるいはそのサブクラスを設定するクラス構造の一例であり、それぞれのカテゴリクラスおよびそのサブクラスについての情報収集項目をプロパティとして設定し、それぞれのプロパティごとに情報の収集方法や情報の加工処理などについてをメソッドとして記述した例について示したが、コンテンツの中身として、タイトルクラスに対する収集項目をプロパティとして設定し、そのプロパティごとに、メソッドを定めるということもできる。
【0035】
つまり、クラス構造1におけるプロパティ(たとえば、顔、経歴、資産、論文など)は、ユーザに対して表示すべきページを作成するときに、それぞれの項目のタイトルとなるもので、これをタイトルクラスとして、このタイトルクラスについてのプロパティを予め定め、それぞれのプロパティごとに、情報の収集の仕方(constructor)とユーザに対する情報表示の仕方(show)をメソッドとして予め記述しておく。
【0036】
図4に示すクラス構造(クラス構造2という)の例では、タイトルクラスとして、顔クラス、経歴クラス、論文クラス、資産クラスなどを定めた例を示し、それぞれのタイトルクラスについて、図5に示すように、たとえば、顔クラスに対しては、その顔クラスの情報の内容として、たとえば、写真とその写真をインターネット上のどこから取り出したかを示す情報ソースURLをプロパティとして設定し、また、経歴クラスに対しては、その情報の内容として、テキスト、リストなどをプロパティとして設定し、論文クラスに対しては、その情報の内容として、たとえば、リストをプロパティとして設定し、それぞれのプロパティごとに、その情報の収集の仕方(constructor)とユーザに対する情報表示の仕方(show)をメソッドとして予め記述しておく。
【0037】
このように、それぞれのタイトルクラスごとに、各タイトルクラスに対する情報の内容などを表すプロパティを定め、それぞれのプロパティについて、1つ1つの情報内容ごとに予め定められた情報の収集の仕方(constructor)と、予め定められた情報表示の仕方(show)を定めておく。
【0038】
このような方法を採用することによって、異なったカテゴリクラスで共通するプロパティが存在するような場合、それぞれのカテゴリクラスごとに、それぞれのタイトルについての情報の収集の仕方などのメソッドを記述する必要がなくなる。
【0039】
さらに、前記クラス構造2で示した写真、テキスト、リストなど情報の内容ごとに情報の表し方を示すプロパティについて情報形式クラスを定義することもできる。
【0040】
たとえば、タイトルを表すそれぞれの項目の情報の内容について、図6に示すように、テキスト、グラフィック、表、リスト、動画、音などというようにそれぞれの情報形式を表すクラス構造(クラス構造3という)を設定する。そして、図7に示すように、たとえば、テキストクラスであれば、フォーマット、サイズなどをプロパティとして設定し、情報取得方法や情報の加工処理方法などをメソッドに記述しておく。このメソッドには、テキストであれば、テキストをどのように収集して、フォーマットやサイズをどのようにするか、あるいは内容を要約するかなどに関しての記述がなされている。
【0041】
このように、タイトルを表す項目の情報内容を情報形式クラスとしてクラス構造で表すことにより、異なったカテゴリクラスで、同じ形式の情報を取り出すような場合、情報収集処理を共通化することも可能である。
【0042】
たとえば、カテゴリクラスが人物クラスであった場合、その人物クラスにおいて収集すべき情報にはその人物に関するテキスト情報も存在し、また、カテゴリクラスが施設クラスの場合もその施設の概要を表すテキスト情報もある。このように、異なったカテゴリクラスであっても、それぞれのカテゴリクラスに対応する情報項目の中身を表す情報形式(情報内容)が共通する場合も多い。したがって、情報項目の中身を表す形式に対する情報収集処理の仕方を共通化することにより、より一層、情報収集の効率化が図れる。
【0043】
以上説明した実施の形態は、ユーザが人物「A」について、経営者/技術者としての情報を収集しようとして、システム側にキーワードとして、人物「A」の氏名として「A」と「経営者/技術者」というようなキーワードを入力した場合における情報検索・収集処理である。
【0044】
このように、ユーザが所定のキーワードを入力すると、まず、そのキーワードに基づいてシステム側が理解できるような要求入力形式にするが、この場合は、ユーザの入力した「A」と「経営者/技術者」を解析して、ユーザの検索要求は「或る人物であり、その人物は経営者であり技術者であって、その名前はAである」というような形式、つまり、「人物・経営者/技術者・A」というようなシステムが理解できるような形に変換する。
【0045】
そして、それぞれのカテゴリクラス(人物クラス、経営者クラス、技術者クラス)について予め設定されたプロパティ(人物クラス:顔、経歴、職業など、経営者クラス:資産など、技術者クラス:論文など)について予め定められたメソッドにより情報収集を行ったのち、収集した情報をユーザの要求に応じて所定の形式として表示する。図8はこのようにして収集された情報の表示例を示すものである。この場合、その表示ページにおける各項目ごとのタイトルともなるカテゴリクラスのプロパティ(この場合、顔、経歴、論文、資産)は、図4に示すようなクラス構造2にもとづいて図5の例のようにして情報収集することができる。さらに、それぞれのタイトルクラスのそれぞれの形式(テキストクラス、グラフィッククラス、写真クラスなど)ごとに図6のようなクラス構造3にもとづいて図7の例のようにして情報収集することもできる。
【0046】
この図8の例では、人物「A」の顔写真とその情報ソースURLが表示され、経歴として経歴の要約、経歴リストが表示され、論文としては論文リスト、資産としてはその概要が表示される。このように、ユーザの入力したキーワードに基づいて検索された数多くの情報の中からユーザの要求に応じた情報のみが取り出され、それらが1つのまとまった情報として出力される。
【0047】
なお、ユーザからの要求の受け付けの仕方としては、前記実施の形態では、キーボードからユーザが一方的に入力する例について説明したが、これに限られるものではなく、たとえば、対話方式としてもよい。以下、この対話方式について概略的に説明する。
【0048】
まず、ユーザが「Aという人物について知りたい」というような入力を行う。これにより、システム側ではユーザからの入力に基づいて、入力解析を行い、この段階では、「人物、−?−、A」というような解析結果であり、システム側から、「Aについて知っていることは有りますか」または「どのようなことについて知りたいですか」というような表示を行う。
【0049】
これにより、ユーザは「Aは情報産業では、ビジョナリーといわれています」というような応答を行うと、そこで、システムはユーザの要求を「人物・経営者/技術者、A」という形式に変換して、これに基づいて検索処理を行う。また、この対話方式は、キーボードと画面表示による対話方式ではなく、自然言語による対話方式でも可能である。
【0050】
また、入力されたキーワードがインスタンスとなるようなカテゴリクラスのプロパティをユーザに表示して、その表示されたプロパティのうちユーザがプロパティを選択するようにしてもよい。さらに、システムの画面上に図2で示したようなクラス構造を表示し、ユーザがそのカテゴリクラスの中から必要なカテゴリクラスをクリックして選択するようにし、さらに、そのカテゴリクラスのプロパティを表示して、その表示されたプロパティからユーザが選択するというように、表示された内容からユーザが選択するようにしてもよい。
【0051】
このように、ユーザが必要なプロパティを選択したり、クラスを選択するようにして、それに基づいた処理を行わせるようにすることにより、必要な検索項目だけについて処理を行えばよいため、処理の効率化が図れ、高速なデータ検索収集処理が可能となる。
【0052】
図9は本発明のシステムの概略構成を示すもので、要求解析手段11、情報収集手段12、コンテンツ解析・収集手段13、情報編集手段14、情報表示手段15などを主な構成要素としている。
【0053】
要求解析手段11はユーザが入力したキーワードをシステムが理解できる形式にするものである。つまり、前記したように、ユーザの入力した内容に基づいて、たとえば、「人物・経営者/技術者・A」というような形式にする。
【0054】
このような要求形式に基づいて、情報収集手段12により、インターネット上において、関連する情報を収集し、その収集した情報の中からコンテンツ解析・収集手段13により、必要な情報を収集する。この情報の収集の仕方は、前記したように、たとえば、人物クラスであれば、そのプロパティとしての顔、経歴、職業などを、それぞれのプロパティごとに定められたメソッドにもとづいて収集する。
【0055】
そして、収集されたそれぞれの情報を情報編集手段14により所定のフォーマットに編集して情報表示手段15により情報表示を行う。この編集作業は、単に決められたフォーマットにするというだけではなく、たとば、テキストデータであれば、場合によっては内容を要約したり、グラフィックデータであれば、データ圧縮したり縮小したりというような処理も含むものであり、このような編集作業ののち、図8に示すようなフォーマットのページの情報として出力される。
【0056】
ところで、本発明は、サーバだけではなく、クライアントソフトでも実現できる。この場合、たとえば、これまで説明したカテゴリクラスのようなものをクライアントソフトとして持っていて、ユーザがそのカテゴリクラスのクラス構造に基づいてキーワード入力して、最終的な結果をサーバから取り出すというように、一部の処理をクライアントソフトで行い、処理の多い部分をサーバで行うというようなクライアントソフトとサーバとで処理を分散して行うことも可能であるし、また、すべての処理をクライアントソフトで行わせることも可能である。
【0057】
なお、本発明の処理を行う処理プログラムは、フロッピィディスク、光ディスク、ハードディスクなどの記憶媒体に記憶させておくことができ、本発明は、それらの記憶媒体をも含むものであり、また、ネットワークからデータを得る形式でもよい。
【0058】
【発明の効果】
本発明によれば、ユーザからの要求入力をシステムが理解できる要求入力形式としたのち、その要求入力をカテゴリクラスに分類し、その要求入力に対し、その要求入力が属するクラスのプロパティに基づき、かつ、各プロパティごとのメソッドに記述された内容に基づいて情報を検索して収集するとともに、収集結果をユーザの要求入力に応じた包括的な情報として出力するようにしている。これにより、システム側では、ユーザの入力するキーワードに対して、予め定められたアルゴリズムにしたがって処理するだけでユーザの所望とする情報の検索収集が行え、効率の良い情報検索・収集が可能となる。そして、収集された情報は、ユーザの要求入力に応じた1つのまとまった情報として取り出すことができる。たとえば、人物に対する情報収集であれば、その人物の経歴や仕事の内容などの項目をタイトルとし、タイトル別にそれぞれの情報が編集された状態で情報提供することができる。
【0059】
また、ユーザからの要求入力に対してシステムが出力する情報の項目ごとにタイトルクラスを定義し、それぞれのタイトルクラスは、それぞれの項目ごとにそれぞれの項目に対する情報の内容がプロパティとして設定されるとともに、それぞれの情報内容ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有するようにしている。このように、タイトルクラスごとに、情報内容をプロパティとして設定し、そのメソッドを決めていることにより、前記項目(タイトル)に対する情報内容の情報収集の仕方や情報の加工の仕方などを示すメソッドを、ユーザからのキーワードで分類されるカテゴリごとに設定する必要が無くなり、アルゴリズムを簡素化することができ、処理の効率化が図れる。
【0060】
さらに、前記情報の内容ごとに情報の表し方を示す情報形式クラスを定義し、それぞれの情報形式クラスは、それぞれの情報の内容ごとにそれぞれの内容に対する情報の表し方がプロパティとして設定されるとともに、それぞれの情報の表し方ごとにデータ取得方法やデータの加工処理方法などを記述したメソッドを有すりようにしている。これにより、異なったクラスにおいて同じ形式の情報である場合などに、共通のアルゴリズムで処理を行うことができ、処理の効率化が図れる。
【0061】
また、各カテゴリごとのプロパティをユーザに対して表示し、その表示されたプロパティの中から任意のプロパティをユーザが選択可能とすることにより、ユーザカスタマイズが実現でき、ユーザの好みに応じた情報のみに対して検索収集するということも可能となり、処理の効率化が図れ、有料の検索サービスである場合には、安価な料金でサービスを受けることができる。
【0062】
以上のように本発明によれば、ユーザからの要求入力に基づいてインターネット上の情報を検索・収集する際、従来のように、膨大な検索結果からユーザ自身が情報の絞り込みを行う必要が無くなり、所定のアルゴリズムに従ってユーザの必要とする情報が項目ごとに1つのまとまった情報として効率よく取り出すことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態における情報検索収集処理手順を概略的に説明するフローチャート。
【図2】本発明の実施の形態における情報検索収集処理においてユーザの要求入力に対応するカテゴリクラスのクラス構造を示す図。
【図3】図2で示したカテゴリクラス構造におけるプロパティとメソッドの一例を説明する図。
【図4】図3で示したカテゴリクラスにおけるプロパティをタイトルクラスとしたクラス構造を示す図。
【図5】図4で示したタイトルクラス構造におけるプロパティとメソッドの一例を説明する図。
【図6】図4で示したタイトルクラスにおけるプロパティを情報形式クラスとしたクラス構造を示す図。
【図7】図6で示した情報形式クラス構造におけるプロパティとメソッドの一例を説明する図。
【図8】本発明の実施の形態における情報検索収集処理によって出力される情報のフォーマットの一例を説明する図。
【図9】本発明の実施の形態における概略的なシステム構成図。
【符号の説明】
11 要求解析手段
12 情報収集手段
13 コンテンツ解析・収集手段
14 情報編集手段
15 情報表示手段
Claims (5)
- 予め定義されたクラス構造を備え、インスタンスとクラスに関する要求を含むユーザの要求入力に基づいて情報を検索する情報検索収集システムであって、
前記クラス構造は、複数の異なるクラスが一層または多層の階層構造で関連付けられて定義され、前記各クラス毎に収集すべきコンテンツの項目がプロパティとして設定され、前記各プロパティ毎に前記収集すべきコンテンツの収集方法、加工方法及び表示方法が設定されていて、
前記要求入力を前記クラス構造に基づいた形式の要求に変換する要求解析手段と、
前記要求に基づいて、前記収集方法に従って外部の関連する情報を収集する情報収集手段と、
収集された情報に含まれるコンテンツを前記クラス構造に基づいて解析・収集するコンテンツ解析・収集手段と、
解析・収集されたコンテンツを、前記加工方法及び表示方法に従って、予め定義されたフォーマットに包括的な情報として編集する情報編集手段と、
前記編集されたコンテンツを表示する情報表示手段と、
を備えていることを特徴とする情報検索収集システム。 - 請求項1において、
前記クラス構造は、コンテンツのカテゴリを表現するカテゴリクラス構造であることを特徴とする情報検索収集システム。 - 請求項1において、
前記クラス構造は、コンテンツのタイトルを表現するタイトルクラス構造であることを特徴とする情報検索収集システム。 - 請求項1において、
前記クラス構造は、コンテンツの情報形式を表現する情報形式クラス構造であることを特徴とする情報検索収集システム。 - 予め定義されたクラス構造を備え、インスタンスとクラスに関する要求を含むユーザの要求入力に基づいてコンピュータに情報を検索させる情報検索収集プログラムを記憶した記憶媒体であって、前記情報検索収集プログラムは、コンピュータに、
前記クラス構造は、複数の異なるクラスが一層または多層の階層構造で関連付けられて定義され、前記各クラス毎に収集すべきコンテンツの項目がプロパティとして設定され、前記各プロパティ毎に前記収集すべきコンテンツの収集方法、加工方法及び表示方法が設定されていて、
前記要求入力を前記クラス構造に基づいた形式の要求に変換する要求解析ステップと、
前記要求に基づいて、前記収集方法に従って外部の関連する情報を収集する情報収集ステップと、
収集された情報に含まれるコンテンツを前記クラス構造に基づいて解析・収集するコンテンツ解析・収集ステップと、
解析・収集されたコンテンツを、前記加工方法及び表示方法に従って、予め定義されたフォーマットに包括的な情報として編集する情報編集ステップと、
前記編集されたコンテンツを表示する情報表示ステップと、
を実行させることを特徴とする、コンピュータに情報を検索させる情報検索収集プログラムを記憶した記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP27131497A JP3711710B2 (ja) | 1996-12-10 | 1997-10-03 | 情報検索収集システムおよび情報検索収集プログラムを記憶した記憶媒体 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33007796 | 1996-12-10 | ||
JP8-330077 | 1996-12-10 | ||
JP27131497A JP3711710B2 (ja) | 1996-12-10 | 1997-10-03 | 情報検索収集システムおよび情報検索収集プログラムを記憶した記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10228488A JPH10228488A (ja) | 1998-08-25 |
JP3711710B2 true JP3711710B2 (ja) | 2005-11-02 |
Family
ID=26549645
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27131497A Expired - Fee Related JP3711710B2 (ja) | 1996-12-10 | 1997-10-03 | 情報検索収集システムおよび情報検索収集プログラムを記憶した記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3711710B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107256260A (zh) * | 2017-06-13 | 2017-10-17 | 浪潮软件股份有限公司 | 一种智能语义识别方法、搜索方法、装置及系统 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100343854B1 (ko) * | 1999-08-10 | 2002-07-20 | 주승철 | 분류도표형 정보 검색 시스템 |
KR20010069137A (ko) * | 2000-01-12 | 2001-07-23 | 이만성 | 정보 분석 시스템 |
KR20010076048A (ko) * | 2000-01-24 | 2001-08-11 | 강희종 | 인터넷 전자비서 시스템 |
KR100754157B1 (ko) * | 2000-05-31 | 2007-09-03 | 삼성전자주식회사 | 멀티미디어 콘텐츠를 위한 데이터베이스 구축 방법 |
JP6157244B2 (ja) * | 2013-06-28 | 2017-07-05 | 株式会社日立システムズ | コンテンツ管理システム、コンテンツ管理方法およびプログラム |
-
1997
- 1997-10-03 JP JP27131497A patent/JP3711710B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107256260A (zh) * | 2017-06-13 | 2017-10-17 | 浪潮软件股份有限公司 | 一种智能语义识别方法、搜索方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
JPH10228488A (ja) | 1998-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5907838A (en) | Information search and collection method and system | |
US6073170A (en) | Information filtering device and information filtering method | |
JP4893243B2 (ja) | 画像要約方法、画像表示装置、kツリー表示システム、kツリー表示プログラム、および、kツリー表示方法 | |
US10373079B2 (en) | Method and apparatus for generating recommendations from descriptive information | |
US20030038836A1 (en) | Web map tool | |
US20040125143A1 (en) | Display system and method for displaying a multi-dimensional file visualizer and chooser | |
US20080215515A1 (en) | System, apparatus and method for using and managing digital information | |
JP2005122689A (ja) | 情報検索方法 | |
JP2003044491A (ja) | 知識分析システムならびに同システムにおける分析条件設定方法、分析条件保存方法および再分析処理方法 | |
US20070094245A1 (en) | Computer-implemented system and method for obtaining customized information related to media content | |
MXPA04006410A (es) | Interprete de sistema de archivo. | |
US20190286669A1 (en) | Search system, apparatuse, and method | |
US7921127B2 (en) | File management apparatus, control method therefor, computer program, and computer-readable storage medium | |
US20120046937A1 (en) | Semantic classification of variable data campaign information | |
JP2005107688A (ja) | 情報表示方法及びシステム及び情報表示プログラム | |
JP3601675B2 (ja) | 情報検索装置、情報検索方法、及び記録媒体 | |
JP2004362451A (ja) | 検索キーワード情報表示方法及びシステム及び検索キーワード情報表示プログラム | |
JPH11282875A (ja) | 情報フィルタリング装置 | |
JP3711710B2 (ja) | 情報検索収集システムおよび情報検索収集プログラムを記憶した記憶媒体 | |
US8904272B2 (en) | Method of multi-document aggregation and presentation | |
JP5271920B2 (ja) | オンライン検索のために構造化データを用いる方法 | |
JP2000231569A (ja) | インターネット情報検索装置、インターネット情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US20140059051A1 (en) | Apparatus and system for an integrated research library | |
JP2007280238A (ja) | データ表示定義情報作成装置、データ表示装置、データ表示定義情報作成方法、データ表示方法およびそれらの装置の実現に用いられるプログラム | |
MXPA01012418A (es) | Metabuscador personalizado. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20041026 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050419 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050726 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050808 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080826 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090826 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090826 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100826 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110826 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120826 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130826 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |