JPH08153108A - Method and device for retrieving information - Google Patents
Method and device for retrieving informationInfo
- Publication number
- JPH08153108A JPH08153108A JP6293149A JP29314994A JPH08153108A JP H08153108 A JPH08153108 A JP H08153108A JP 6293149 A JP6293149 A JP 6293149A JP 29314994 A JP29314994 A JP 29314994A JP H08153108 A JPH08153108 A JP H08153108A
- Authority
- JP
- Japan
- Prior art keywords
- department
- database
- search keyword
- search
- name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は入力された検索キーワー
ドに基づいて情報検索を行う情報検索方法及びその装置
に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information search method and apparatus for searching information based on an input search keyword.
【0002】[0002]
【従来の技術】従来の情報検索装置では、入力された検
索キーワードに一致する文字列に基づき情報検索を行っ
ている。2. Description of the Related Art In a conventional information search apparatus, information search is performed based on a character string that matches an input search keyword.
【0003】[0003]
【発明が解決しようとする課題】しかしながら、検索キ
ーワードの入力ミスがあったり、検索キーワードが変更
されて入力された検索キーワードがない場合には、所望
の検索結果が得られず検索を遣り直す必要があった。こ
のような例は検索キーワードに限らず、例えば、会社等
で組織変更により部署名が代わった後に、組織変更前の
部署名で送られてきたメール等に対して、対応する組織
変更後の部署名を見付けてメールを送ること、あるいは
組織変更前の部署名によるデータベースの検索はできな
かった。However, if there is no input of the search keyword or there is no search keyword input due to the change of the search keyword, the desired search result cannot be obtained and the search needs to be retried. was there. Such an example is not limited to the search keyword. For example, after the department name is changed by a company or the like due to the organization change, the department after the organization change corresponding to the mail etc. sent with the department name before the organization change It was not possible to find a name and send an email, or to search the database by the department name before the organizational change.
【0004】本発明は、前記従来の欠点を除去し、入力
された検索キーワードが存在しない場合、特に検索キー
ワードの変更によらず正しい検索キーワードによる検索
を可能とする情報検索方法及びその装置を提供する。ま
た、具体的には、部署名の変更等により検索対象の部署
名が部署データベースに存在しない場合にも、組織変更
前の部署名に対して組織変更後の部署名を検索すること
ができる情報検索方法及びその装置を提供する。The present invention eliminates the above-mentioned drawbacks of the prior art, and provides an information retrieval method and an apparatus therefor, which makes it possible to perform retrieval by a correct retrieval keyword without changing the retrieval keyword when an inputted retrieval keyword does not exist. To do. In addition, specifically, even if the department name to be searched does not exist in the department database due to a change in the department name, the department name after the organization change can be searched for the department name before the organization change. A search method and a device therefor are provided.
【0005】[0005]
【課題を解決するための手段】上述の課題を解決するた
めに、本発明の情報検索方法は、検索キーワードに基づ
いてデータベースの検索を行う情報検索方法において、
入力された検索キーワードが前記データベースの検索キ
ーワードでない場合に、入力された前記検索キーワード
に最も近い前記データベースの検索キーワードを、正し
い検索キーワードとして推定することを特徴とする。こ
こで、前記データベースは、前記検索キーワードが変更
された場合に、少なくとも部分的に変更前の検索キーワ
ードに関連付けられた検索キーワードに変更されるデー
タベースであり、かつ旧い検索キーワードを記憶してお
かないデータベースである。In order to solve the above-mentioned problems, the information search method of the present invention is an information search method for searching a database based on a search keyword.
When the input search keyword is not a search keyword of the database, the search keyword of the database closest to the input search keyword is estimated as a correct search keyword. Here, the database is a database which is at least partially changed to a search keyword associated with the search keyword before the change when the search keyword is changed, and does not store the old search keyword. It is a database.
【0006】又、本発明の情報検索装置は、検索キーワ
ードが変更された場合に、新しい検索キーワードが少な
くとも部分的に変更前の検索キーワードに関連付けられ
るデータベースであって、かつ旧い検索キーワードを記
憶しておかないデータベースと、入力された検索キーワ
ードでデータベースを検索する検索手段と、前記入力さ
れた検索キーワードがデータベースに存在しない場合
に、前記入力された検索キーワードに対して最も近い検
索キーワードを正しい検索キーワードとして推定するキ
ーワード推定手段とを備える。ここで、前記キーワード
推定手段は、前記入力された検索キーワードを構成する
文字に対して変更後の検索キーワードと一致する文字数
を計算し、一致する文字数が最も多い検索キーワードを
前記正しい検索キーワードとして推定する手段と、前記
入力された検索キーワードに対して形態素解析を行なっ
て単語に分解し、変更後の検索キーワードと一致する単
語数を計算して、その値が最大のものを前記正しい検索
キーワードとして推定する手段と、前記入力された検索
キーワードの2文字以上の連続文字に対して変更後の検
索キーワードと一致した連続数対応のポイントを与え、
ポイント数が最大となるデータベース内の検索キーワー
ドを前記正しい検索キーワードとして推定する手段と、
シソーラスなどの類義語の辞書を備え、前記入力された
キーワードに対する類義語に対して、データベースの検
索キーワードと一致する単語数を計算し、一致する単語
数が最も多いものを前記正しい検索キーワードとして推
定する手段との少なくとも1つの推定手段を備える。ま
た、前記各推定手段において、前記入力されたキーワー
ドから一般的共通な文字を比較対象より除外する除外手
段を含む。Further, the information search apparatus of the present invention is a database in which when a search keyword is changed, the new search keyword is at least partially associated with the search keyword before the change, and the old search keyword is stored. A database that does not exist, a search means that searches the database with the input search keyword, and a correct search for the closest search keyword to the input search keyword when the input search keyword does not exist in the database And a keyword estimating means for estimating as a keyword. Here, the keyword estimation unit calculates the number of characters that match the changed search keyword with respect to the characters that form the input search keyword, and estimates the search keyword with the largest number of matching characters as the correct search keyword. And a means for performing morphological analysis on the input search keyword to decompose it into words, calculate the number of words that match the changed search keyword, and set the maximum value as the correct search keyword. Estimating means, and giving points corresponding to the number of consecutive matches with the changed search keyword for two or more consecutive characters of the input search keyword,
Means for estimating the search keyword in the database with the maximum number of points as the correct search keyword;
Means for providing a synonym dictionary such as a thesaurus, calculating the number of words matching the search keyword of the database with respect to the synonyms for the input keyword, and estimating the word having the largest number of matching words as the correct search keyword And at least one estimation means of Further, each of the estimating means includes an excluding means for excluding a generally common character from the input keyword from a comparison target.
【0007】又、本発明の情報検索装置は、組織の部署
名の一覧を蓄えている部署データベースと、検索対象の
部署名が部署データベースに存在するか否かを検索する
部署検索手段と、前記検索対象の部署名が部署データベ
ースに存在しない場合に、前記検索対象の部署名から正
しい部署名を推定する部署推定手段とを有することを特
徴とする。ここで、前記部署推定手段は、前記検索対象
の部署名を構成する文字に対して前記部署データベース
の各部署名と一致する文字数を計算し、一致する文字数
が最大となる部署データベースの中の部署名を正しい部
署名として推定する。また、前記部署推定手段は、前記
検索対象の部署名に対して形態素解析を行なって単語に
分割し、分割された各単語に対して前記部署データベー
スの各部署名と一致する単語数を計算し、一致する単語
数が最大となる部署名データベースの中の部署名を正し
い部署名として推定する。また、前記部署推定手段は、
前記検索対象の部署名を構成する文字の2文字以の連続
文字に対して、部署データベースの各部署名と一致する
連続文字を得て、連続文字数に対して与えられた単語に
相応するポイント数を計算し、ポイント数が最大となる
部署データベースの中の部署名を正しい部署名として推
定する。また、前記部署推定手段は、シソーラスなどの
類義語の辞書を備え、前記検索対象の部署名に対する類
義語に対して部署データベースの各部署名と一致する単
語数を計算し、一致する単語数が最大となる部署データ
ベースの中の部署名を正しい部署名として推定する。ま
た、前記部署推定手段は、前記検索対象の部署名の中か
ら各部署名間でほぼ共通の文字を比較対象の部署名より
除外する。また、電子メイルの配信に際して、前記推定
した部署へ配信する配信手段を更に備える。Further, the information retrieval apparatus of the present invention comprises a department database storing a list of department names of an organization, department searching means for searching whether or not a department signature to be searched exists in the department database, When the department name to be searched does not exist in the department database, the department estimating unit estimates the correct department name from the department name to be searched. Here, the department estimation unit calculates the number of characters that match each department name of the department database with respect to the characters that form the department name of the search target, and the department signature in the department database that maximizes the number of matching characters. Is estimated as the correct department name. Further, the department estimation means performs morphological analysis on the department name of the search target to divide into words, and for each divided word, calculates the number of words that match each department signature of the department database, The department name in the department name database with the maximum number of matching words is estimated as the correct department name. In addition, the department estimation means,
For two or more consecutive characters that form the department name to be searched, consecutive characters that match each department name in the department database are obtained, and the number of points corresponding to the given word is set for the number of consecutive characters. It is calculated and the department name in the department database with the maximum number of points is estimated as the correct department name. Further, the department estimation means includes a synonym dictionary such as a thesaurus, calculates the number of words that match each department name of the department database with respect to the synonyms for the department name to be searched, and the number of matching words becomes maximum. The department name in the department database is estimated as the correct department name. Further, the department estimation unit excludes, from among the department names to be searched, characters that are almost common between the department names from the department names to be compared. In addition, when the electronic mail is delivered, a delivery means for delivering to the estimated department is further provided.
【0008】[0008]
【作用】以上の構成により、データベースに存在しない
入力された検索キーワードに対して、近い検索キーワー
ドを推定して検索することができる。With the above configuration, it is possible to perform a search by estimating a close search keyword with respect to the input search keyword that does not exist in the database.
【0009】[0009]
【実施例】以下、本発明の実施例を添付図面を用いて詳
細に説明する。 <実施例1>図1は、本実施例の情報検索装置の一構成
例の図である。図中、1は装置の処理を行う中央処理装
置(CPU)、2は操作入力の為のキーボード、21は
マウス等の画面をポイントするためのポインティングバ
イス、3は操作者への表示出力を行う為のディスプレ
イ、4はCPU1と他の構成要素を接続する為のバス、
5はRAMやROMのメモリで、システムの処理を行う
為のシステムプログラム104や、本実施例の構成要素
である部署検索プログラムを含む部署検索部102と部
署推定プログラムを含む部署推定部103とを含む。
尚、これらのプログラムは、他の記憶部にあって処理の
実行前にメモリ5へロードされてもよい。6はフロッピ
ーディスクであり、必要なデータやプログラムの入力や
出力のメディアとして用いる。7は大容量ディスクであ
り、ハードディスクや光磁気ディスク等の大容量記憶部
であり、本実施例の構成要素である部署データベース1
01を含む。なお、部署データベース101は、フロッ
ピーディスク6やメモリ5にあってもよい。8は通信制
御装置であり、通信回線を介して本情報検索装置をアク
セスする為のものである。Embodiments of the present invention will be described below in detail with reference to the accompanying drawings. <Embodiment 1> FIG. 1 is a diagram showing a configuration example of an information search apparatus according to the present embodiment. In the figure, 1 is a central processing unit (CPU) for processing the device, 2 is a keyboard for operation input, 21 is a pointing vice for pointing a screen such as a mouse, and 3 is a display output to an operator. For display, 4 is a bus for connecting the CPU 1 and other components,
Reference numeral 5 denotes a RAM or ROM memory, which includes a system program 104 for performing system processing, a department search unit 102 including a department search program and a department estimation unit 103 including a department estimation program, which are components of this embodiment. Including.
Note that these programs may be loaded in the memory 5 in another storage unit before execution of processing. A floppy disk 6 is used as a medium for inputting and outputting necessary data and programs. Reference numeral 7 denotes a large-capacity disk, which is a large-capacity storage unit such as a hard disk or a magneto-optical disk, and a department database 1 which is a constituent element of this embodiment.
Including 01. The department database 101 may be in the floppy disk 6 or the memory 5. Reference numeral 8 is a communication control device for accessing the information retrieval device via a communication line.
【0010】図2は、本実施例の情報検索装置の主要構
成要素を示したものである。図2において、101は部
署名の一覧を蓄えている上記部署データベースであり、
102は検索対象の部署名がデータベースに存在するか
どうか検索する上記部署検索部であり、103は部署デ
ータベースに存在しない誤った部署名に対し正しい部署
名を推定する上記部署推定部である。FIG. 2 shows the main components of the information retrieval apparatus of this embodiment. In FIG. 2, 101 is the department database that stores a list of department names,
Reference numeral 102 is the department search unit that searches whether or not the department name to be searched exists in the database, and 103 is the department estimation unit that estimates a correct department name for an incorrect department name that does not exist in the department database.
【0011】図3は、本実施例の情報検索装置の動作過
程を示すフローチャートである。ステップS101で、
操作者が検索したい部署名を入力する。ステップS10
2では、ステップS101で入力した部署名が部署デー
タベース101に存在するかどうかが部署検索部102
で検索される。部署名がデータベース101に存在する
場合はステップS103の処理へ進む。存在しない場合
はステップS104の処理へ進む。ステップS103で
は、入力された部署名をこれから出力される部署名と定
める。FIG. 3 is a flow chart showing the operation process of the information retrieval apparatus of this embodiment. In step S101,
The operator inputs the department name to be searched. Step S10
In 2, the department search unit 102 determines whether the department name input in step S101 exists in the department database 101.
It is searched by. If the department name exists in the database 101, the process proceeds to step S103. If it does not exist, the process proceeds to step S104. In step S103, the input department name is determined as the department name to be output.
【0012】ステップS102で部署名がデータベース
101に存在しない場合は、ステップS104で、入力
されたが部署データベース101に存在しない誤った部
署名に対し、部署推定部103が近い部署名を推定す
る。ステップS105では、ステップS104で推定し
た部署名をこれから出力する部署名と定める。ステップ
S106では、ステップS103またはステップS10
5により得た部署名を出力する。If the department name does not exist in the database 101 in step S102, the department estimating unit 103 estimates a department name close to the incorrect department signature that is input but does not exist in the department database 101 in step S104. In step S105, the department name estimated in step S104 is set as the department name to be output. In step S106, step S103 or step S10.
The department name obtained in step 5 is output.
【0013】図4は、図3のステップS104に示す部
署推定の処理をより詳しく説明するフローチャートであ
る。ステップS201では、部署データベース101の
各部署名について、入力された部署名と一致する文字数
を計算し、ステップS202では、ステップS201で
計算した文字数が最も多い部署名を、正しい部署名と推
定する。FIG. 4 is a flowchart for explaining in more detail the process of department estimation shown in step S104 of FIG. In step S201, for each department name in the department database 101, the number of characters that matches the input department name is calculated, and in step S202, the department name with the largest number of characters calculated in step S201 is estimated to be the correct department name.
【0014】以下、実際の例について更に詳しく説明す
る。図5に部署データベース101の組織変更前後の例
を示す。この例では、部署データベース101で、組織
変更により元の人工知能研究部、コンピュータ研究部、
計算機画像研究部、特許部が、それぞれ新しく知能シス
テム研究部、並列コンピュータ研究部、画像情報研究
部、知的所有権保護部と改名されたことを表わしてい
る。そこへ、組織変更後に「人工知能研究部」宛のメー
ルが届いたとする。An actual example will be described in more detail below. FIG. 5 shows an example of the department database 101 before and after the organization change. In this example, in the department database 101, the original artificial intelligence research department, computer research department,
The Computer Image Research Department and the Patent Department have been renamed as Intelligent Systems Research Department, Parallel Computer Research Department, Image Information Research Department, and Intellectual Property Protection Department, respectively. Suppose there is an email addressed to the "Artificial Intelligence Research Department" after the organization change.
【0015】この場合の処理の流れは以下のようにな
る。すなわち、図3のステップS101で、部署名が
「人工知能研究部」と入力され設定される。次のステッ
プS102で「人工知能研究部」が部署データベース1
01に存在しない誤った部署名であることが分かるの
で、ステップS104の処理へ進む。ステップS104
では、まず図4に示すステップS201の一致文字数の
計算を行う。計算した結果を図6に示す。ステップS2
02では、図6において一致する文字数が最も多い「知
能システム研究部」を正しい部署名と推定する。このよ
うにして、図3のステップS104の処理が終わる。The flow of processing in this case is as follows. That is, in step S101 of FIG. 3, the department name is input and set as “artificial intelligence research department”. In the next step S102, the "Artificial Intelligence Research Department" has a department database 1
Since it is found that the wrong department name does not exist in 01, the process proceeds to step S104. Step S104
First, the number of matching characters in step S201 shown in FIG. 4 is calculated. The calculated result is shown in FIG. Step S2
In 02, the "Intelligent Systems Research Department" having the largest number of matching characters in FIG. 6 is estimated to be the correct department name. In this way, the process of step S104 in FIG. 3 ends.
【0016】次のステップS105では、出力する部署
名を「知能システム研究部」と定め、ステップ106
で、「知能システム研究部」を部署名として出力する。
従って、「人工知能研究部」宛のメールを「知能システ
ム研究部」に送ることができる。なお、図3のステップ
S101は操作者でなく、通信回線からの入力を行うこ
とができ、部署名の出力に代わって電子メールを自動送
信することもできる。In the next step S105, the department name to be output is defined as "Intelligent Systems Research Department", and step 106
Then, "Intelligent Systems Research Department" is output as the department name.
Therefore, a mail addressed to the "artificial intelligence research department" can be sent to the "intelligent system research department". It should be noted that in step S101 of FIG. 3, an operator can make an input from a communication line, and an electronic mail can be automatically transmitted instead of outputting the department name.
【0017】尚、上記実施例では、部署名を構成する全
ての文字に対して一致する文字数を計算していた。これ
に限らず、「部」とか「課」等の一般的な共通文字に対
しては一致する文字数を計算しないようにしてもよい。
又、上記実施例では、一致する文字数を計算しその値を
用いて正しい部署名を推定していた。それに限らず、形
態素解析を行ない単語に分割し、一致する単語数を計算
しその値が最大のものを正しい部署名と推定してもよ
い。In the above embodiment, the number of matching characters is calculated for all the characters forming the department name. Not limited to this, the number of matching characters may not be calculated for general common characters such as “copy” and “section”.
Further, in the above-described embodiment, the number of matching characters is calculated and the value is used to estimate the correct department name. Not limited to this, morphological analysis may be performed to divide into words, the number of matching words may be calculated, and the one with the maximum value may be estimated as the correct department name.
【0018】又、2文字以上連続して一致する文字列の
連続数に対して単語に相応するポイントを与えてこのポ
イントが最も大きいものを正しい部署名と推定しても良
い。又、一致する単語だけでなく、シソーラスなどの情
報から類義とわかる単語数も加える。例えば、「特許」
に対し、類義である「知的所有権」も数に加えてもよ
い。It is also possible to give a point corresponding to a word to the number of consecutive character strings that consecutively match two or more characters, and assume that the point with the largest point is the correct department name. In addition to the matching words, the number of words that are synonymous with information such as thesaurus is also added. For example, "patent"
On the other hand, a synonym “intellectual property right” may be added to the number.
【0019】更に、上述した方法を適当に組み合わせて
も良い。 <実施例2>以上の実施例では、会社組織等の部署名に
対しての変更があった場合、メール等が変更前の部署名
で送られてきた場合の情報検索装置の処理について説明
し、送られてきたメールに対して新しい部署名を検索す
ることが可能となった。Further, the above methods may be combined appropriately. <Embodiment 2> In the above embodiment, the processing of the information retrieval apparatus when the department name of the company organization or the like is changed, or the mail or the like is sent with the department name before the change is described. , It became possible to search for new department name in the sent mail.
【0020】従って、データベースを検索する情報検索
装置では、本実施例の部署データベースのように部分的
に名称の変更が起こる可能性があり、部署名に限らず旧
名称を残さないデータベースに対して、本実施例で説明
した情報検索装置がそのまま使用できることは言うまで
もない。すなわち、検索のキーワードとなる部分が、部
分的にまたはすべて前のキーワードに関連付けられたキ
ーワードに変更が起こる可能性があるデータベースがあ
り、かつ旧キーワードとなる部分を記憶しておかない情
報検索装置においては、前記データベースと、キーワー
ドでデータベースを検束するキーワード検索部と、検索
対象のキーワードがデータベースに存在しない場合、検
索対象のキーワードに対して最も近いキーワードを推定
するキーワード推定部を備えることで、検索が可能とな
る。Therefore, in the information retrieval apparatus for retrieving the database, there is a possibility that the name may be partially changed like the department database of the present embodiment, and not only the department name but also the database in which the old name is not left. It goes without saying that the information retrieval device described in this embodiment can be used as it is. That is, there is a database in which the keyword part of the search may be partially or entirely changed to the keyword associated with the previous keyword, and the information search device does not store the old keyword part. In the above, the database, a keyword search unit for bundling the database with keywords, and if the search target keyword does not exist in the database, by providing a keyword estimation unit that estimates the closest keyword to the search target keyword, Search is possible.
【0021】キーワードの推定部としては、上記実施例
と同様に、キーワードを構成する全ての文字に対して一
致する文字数を計算し、一致する文字数が最も多いキー
ワードを一致したキーワードを推定するか、キーワード
に対して形態素解析を行ない単語に分解して一致する単
語数を計算し、その値が最大のものをキーワードと推定
するか、キーワードの2文字以上の連続文字に対して、
キーワードと一致した連続数対応のポイントを予め与
え、ポイント数が最大となるデータベース内のキーワー
ドを一致したキーワードと推定するか、キーワード推定
部にシソーラスなどの類義語の辞書を備え、検索するキ
ーワードに対する類義語に対して、データベースの各キ
ーワードの一致する単語数を計算し、一致する単語数が
最も多いものをキーワードとして推定する。また、各キ
ーワード間で一般的共通な文字をキーワードの比較対象
より除外する。The keyword estimation unit calculates the number of matching characters for all the characters forming the keyword and estimates the keyword having the largest number of matching characters, as in the above embodiment. Morphological analysis is performed on the keywords, and the number of matching words is calculated by dividing them into words and the one with the largest value is estimated as the keyword, or for consecutive characters of two or more characters of the keyword,
A point corresponding to the number of consecutive matches with the keyword is given in advance, and the keyword in the database with the maximum number of points is estimated as the matched keyword. On the other hand, the number of matching words of each keyword in the database is calculated, and the word having the largest number of matching words is estimated as the keyword. In addition, characters that are generally common between the keywords are excluded from the keywords to be compared.
【0022】以上のようにして、部分的にまたはすべて
前のキーワードに関連付けられたキーワードに変更が起
こる可能性があるデータベースであり、旧キーワードが
残さないデータベースに対して、本発明の情報検索方法
が普遍的に使用できる。尚、本発明は、複数の機器から
構成されるシステムに適用しても、1つの機器から成る
装置に適用しても良い。また、本発明はシステム或は装
置にプログラムを供給することによって達成される場合
にも適用できることはいうまでもない。As described above, the information retrieval method of the present invention is applied to a database in which there is a possibility that some or all of the keywords associated with the previous keyword may be changed and the old keyword does not remain. Can be universally used. The present invention may be applied to a system including a plurality of devices or an apparatus including a single device. Further, it goes without saying that the present invention can be applied to the case where it is achieved by supplying a program to a system or an apparatus.
【0023】[0023]
【発明の効果】以上説明したように、本発明は、入力さ
れた検索キーワードが存在しない場合、前記入力された
検索キーワードから正しい検索キーワードを推定するこ
とにより、特に検索キーワードの変更によらず正しい検
索キーワードによる検索を可能とした。As described above, according to the present invention, when the input search keyword does not exist, the correct search keyword is estimated from the input search keyword, so that it is correct regardless of the change of the search keyword. The search by the search keyword was enabled.
【0024】また、本発明は、検索対象の部署名が部署
データベースに存在しない場合、誤った部署名に対し正
しい部署名を推定する部署推定部を設けたことにより、
組織変更前の部署名に対して組織変更後の部署名を検索
することができるという効果がある。Further, according to the present invention, when the department name to be searched does not exist in the department database, the department estimating unit for estimating a correct department name for an incorrect department name is provided.
There is an effect that the department name after the organization change can be searched for the department name before the organization change.
【図1】実施例1を説明する為の情報検索装置の一構成
例である。FIG. 1 is a configuration example of an information search device for explaining a first embodiment.
【図2】本発明の論理付構成を示す図である。FIG. 2 is a diagram showing a logical structure of the present invention.
【図3】実施例の動作過程を示すフローチャートであ
る。FIG. 3 is a flowchart showing an operation process of the embodiment.
【図4】実施例1の部署推定のステップ104をより詳
しく説明する為のフローチャートである。FIG. 4 is a flowchart for explaining in more detail the step 104 of department estimation in the first embodiment.
【図5】実施例1の部署データベース101の例を示す
図である。FIG. 5 is a diagram illustrating an example of a department database 101 according to the first embodiment.
【図6】実施例1の部署推定ステップ104における、
一致文字数の計算例を示す図である。FIG. 6 is a diagram illustrating a department estimation step 104 according to the first embodiment.
It is a figure which shows the example of calculation of the number of matching characters.
1 CPU 2 キーボード 3 ディスプレイ 4 バス 5 メモリ 6 フロッピーディスク 7 大容量ディスク 8 通信制御装置 21 ポインティングデバイス 101 部署データベース 102 部署検索部 103 部署推定部 104 システムプログラム 1 CPU 2 keyboard 3 display 4 bus 5 memory 6 floppy disk 7 large capacity disk 8 communication control device 21 pointing device 101 department database 102 department search unit 103 department estimation unit 104 system program
───────────────────────────────────────────────────── フロントページの続き (72)発明者 柴田 昇吾 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 上田 隆也 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 池田 裕治 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 藤田 稔 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 ─────────────────────────────────────────────────── ─── Continuation of front page (72) Inventor Shogo Shibata 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Takaya Ueda 3-30-2 Shimomaruko, Ota-ku, Tokyo Kya Non-Incorporated (72) Inventor Yuji Ikeda 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Minoru Fujita 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc.
Claims (12)
の検索を行う情報検索方法において、 入力された検索キーワードが前記データベースの検索キ
ーワードでない場合に、入力された前記検索キーワード
に最も近い前記データベースの検索キーワードを、正し
い検索キーワードとして推定することを特徴とする情報
検索方法。1. An information search method for searching a database based on a search keyword, wherein when the input search keyword is not the search keyword of the database, the search keyword of the database closest to the input search keyword is selected. , An information search method characterized by estimating as a correct search keyword.
ドが変更された場合に、少なくとも部分的に変更前の検
索キーワードに関連付けられた検索キーワードに変更さ
れるデータベースであり、かつ旧い検索キーワードを記
憶しておかないデータベースであることを特徴とする請
求項1記載の情報検索方法。2. The database is a database that is changed to a search keyword associated with the search keyword before the change when the search keyword is changed, and stores the old search keyword. The information retrieval method according to claim 1, wherein the information retrieval method is a non-existent database.
しい検索キーワードが少なくとも部分的に変更前の検索
キーワードに関連付けられるデータベースであって、か
つ旧い検索キーワードを記憶しておかないデータベース
と、 入力された検索キーワードでデータベースを検索する検
索手段と、 前記入力された検索キーワードがデータベースに存在し
ない場合に、前記入力された検索キーワードに対して最
も近い検索キーワードを正しい検索キーワードとして推
定するキーワード推定手段とを備えることを特徴とする
情報検索装置。3. A database in which when a search keyword is changed, a new search keyword is at least partially associated with the search keyword before the change, and a database in which an old search keyword is not stored is input. Search means for searching the database with the search keyword, and keyword estimating means for estimating a search keyword closest to the input search keyword as a correct search keyword when the input search keyword does not exist in the database An information search device comprising:
変更後の検索キーワードと一致する文字数を計算し、一
致する文字数が最も多い検索キーワードを前記正しい検
索キーワードとして推定する手段と、 前記入力された検索キーワードに対して形態素解析を行
なって単語に分解し、変更後の検索キーワードと一致す
る単語数を計算して、その値が最大のものを前記正しい
検索キーワードとして推定する手段と、 前記入力された検索キーワードの2文字以上の連続文字
に対して変更後の検索キーワードと一致した連続数対応
のポイントを与え、ポイント数が最大となるデータベー
ス内の検索キーワードを前記正しい検索キーワードとし
て推定する手段と、 シソーラスなどの類義語の辞書を備え、前記入力された
キーワードに対する類義語に対して、データベースの検
索キーワードと一致する単語数を計算し、一致する単語
数が最も多いものを前記正しい検索キーワードとして推
定する手段との少なくとも1つの推定手段を備えること
を特徴とする請求項3記載の情報検索装置。4. The keyword estimating means calculates the number of characters matching the changed search keyword with respect to the characters forming the input search keyword, and the search keyword having the largest number of matching characters is the correct search keyword. And a means for estimating the input search keyword, performing morphological analysis on the input search keyword to decompose it into words, calculating the number of words that match the changed search keyword, and finding the one with the maximum value as the correct search. Means for estimating as a keyword, and a search keyword in a database in which the number of consecutive points corresponding to the changed search keyword is given to two or more consecutive characters of the input search keyword, and the number of points is maximum And a dictionary of synonyms such as a thesaurus, At least one estimating means for calculating the number of words that match the search keyword in the database with respect to the synonyms for the entered keywords and estimating the word having the largest number of matching words as the correct search keyword The information search device according to claim 3, wherein
たキーワードから一般的共通な文字を比較対象より除外
する除外手段を含むことを特徴とする請求項4記載の情
報検索装置。5. The information retrieving apparatus according to claim 4, wherein each of the estimating means includes an excluding means for excluding a generally common character from the input keyword from a comparison target.
ータベースと、 検索対象の部署名が部署データベースに存在するか否か
を検索する部署検索手段と、 前記検索対象の部署名が部署データベースに存在しない
場合に、前記検索対象の部署名から正しい部署名を推定
する部署推定手段とを有することを特徴とする情報検索
装置。6. A department database storing a list of department names of an organization, department search means for searching whether or not a department signature to be searched exists in the department database, and the department signature to be searched is a department database. And a department estimation unit that estimates a correct department name from the department name to be searched when the information retrieval device does not exist.
署名を構成する文字に対して前記部署データベースの各
部署名と一致する文字数を計算し、一致する文字数が最
大となる部署データベースの中の部署名を正しい部署名
として推定することを特徴とする請求項6記載の情報検
索装置。7. The department estimation unit calculates the number of characters that match each department name of the department database with respect to the characters that form the department name of the search target, and selects the number of characters in the department database in which the number of matching characters is the maximum. The information retrieval apparatus according to claim 6, wherein the department name is estimated as a correct department name.
署名に対して形態素解析を行なって単語に分割し、分割
された各単語に対して前記部署データベースの各部署名
と一致する単語数を計算し、一致する単語数が最大とな
る部署名データベースの中の部署名を正しい部署名とし
て推定することを特徴とする請求項6記載の情報検索装
置。8. The department estimation unit performs morphological analysis on the department name to be searched and divides it into words, and for each divided word, determines the number of words that match each department signature of the department database. 7. The information retrieval apparatus according to claim 6, wherein the calculated section name in the section name database having the maximum number of matching words is estimated as a correct section name.
署名を構成する文字の2文字以の連続文字に対して、部
署データベースの各部署名と一致する連続文字を得て、
連続文字数に対して与えられた単語に相応するポイント
数を計算し、ポイント数が最大となる部署データベース
の中の部署名を正しい部署名として推定することを特徴
とする請求項6記載の情報検索装置。9. The department estimation unit obtains a continuous character that matches each department signature of a department database for two or more consecutive characters that form the department signature to be searched,
7. The information retrieval according to claim 6, wherein the number of points corresponding to a given word is calculated with respect to the number of consecutive characters, and the department name in the department database having the maximum number of points is estimated as a correct department name. apparatus.
の類義語の辞書を備え、前記検索対象の部署名に対する
類義語に対して部署データベースの各部署名と一致する
単語数を計算し、一致する単語数が最大となる部署デー
タベースの中の部署名を正しい部署名として推定するこ
とを特徴とする請求項6記載の情報検索装置。10. The department estimation unit includes a dictionary of synonyms such as a thesaurus, calculates the number of words that match each synonym of the department name of the search target with each department name of the department database, and determines the number of matching words. 7. The information retrieval device according to claim 6, wherein the department name in the largest department database is estimated as a correct department name.
部署名の中から各部署名間でほぼ共通の文字を比較対象
の部署名より除外することを特徴とする請求項7乃至1
0のいずれか1つに記載の情報検索装置。11. The department estimation unit excludes characters that are substantially common to each department signature from the department signatures to be searched, from the department signatures to be compared.
The information search device described in any one of 0.
した部署へ配信する配信手段を更に備えることを特徴と
する請求項6記載の情報検索装置。12. The information retrieving apparatus according to claim 6, further comprising a distribution unit that distributes to the estimated department when distributing the electronic mail.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6293149A JPH08153108A (en) | 1994-11-28 | 1994-11-28 | Method and device for retrieving information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6293149A JPH08153108A (en) | 1994-11-28 | 1994-11-28 | Method and device for retrieving information |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08153108A true JPH08153108A (en) | 1996-06-11 |
Family
ID=17791059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6293149A Withdrawn JPH08153108A (en) | 1994-11-28 | 1994-11-28 | Method and device for retrieving information |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08153108A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007535741A (en) * | 2004-04-21 | 2007-12-06 | テルコーディア テクノロジーズ インコーポレイテッド | Two-step data validation and mapping for database access |
JP2017182279A (en) * | 2016-03-29 | 2017-10-05 | 株式会社トヨタマップマスター | Search system, search method, search program, and storage medium |
-
1994
- 1994-11-28 JP JP6293149A patent/JPH08153108A/en not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007535741A (en) * | 2004-04-21 | 2007-12-06 | テルコーディア テクノロジーズ インコーポレイテッド | Two-step data validation and mapping for database access |
US7788278B2 (en) | 2004-04-21 | 2010-08-31 | Kong Eng Cheng | Querying target databases using reference database records |
US8346794B2 (en) | 2004-04-21 | 2013-01-01 | Tti Inventions C Llc | Method and apparatus for querying target databases using reference database records by applying a set of reference-based mapping rules for matching input data queries from one of the plurality of sources |
JP2017182279A (en) * | 2016-03-29 | 2017-10-05 | 株式会社トヨタマップマスター | Search system, search method, search program, and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5848409A (en) | System, method and computer program product for maintaining group hits tables and document index tables for the purpose of searching through individual documents and groups of documents | |
US6356899B1 (en) | Method for interactively creating an information database including preferred information elements, such as preferred-authority, world wide web pages | |
US6959303B2 (en) | Efficient searching techniques | |
US7096218B2 (en) | Search refinement graphical user interface | |
US20080222138A1 (en) | Method and Apparatus for Constructing a Link Structure Between Documents | |
JPH07104870B2 (en) | Data processing method | |
CN109299219A (en) | Data query method, apparatus, electronic equipment and computer readable storage medium | |
JPH10171819A (en) | Information retrieving device | |
JP2002288214A (en) | Search system and search service | |
JPH08255163A (en) | Document retrieval device | |
EP0457705A2 (en) | Method for contextual search of copied data objects | |
JPH08153108A (en) | Method and device for retrieving information | |
US6963865B2 (en) | Method system and program product for data searching | |
JPH1115841A (en) | Information retrieving device and medium recording information retrieving program | |
JP3418876B2 (en) | Data base search apparatus and method | |
JP3007375B2 (en) | Document information retrieval device | |
JP2925042B2 (en) | Information link generation method | |
JPH05266085A (en) | Method and device for similar retrieval using dynamic concept dictionary | |
JP3526198B2 (en) | Database similarity search method and apparatus, and storage medium storing similarity search program | |
JPH1145238A (en) | Document management system and computer readable recording medium for recording program for having computer function as the same system | |
JPH07210565A (en) | Method and device for retrieving information | |
JPH09212523A (en) | Entire sentence retrieval method | |
JPH0765013A (en) | Document retrieving device | |
JPH05313971A (en) | Key word managing system in relational data base | |
JP3040114B2 (en) | Record search device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20020205 |