JP3181548B2 - 情報検索装置及び情報検索方法 - Google Patents
情報検索装置及び情報検索方法Info
- Publication number
- JP3181548B2 JP3181548B2 JP02163198A JP2163198A JP3181548B2 JP 3181548 B2 JP3181548 B2 JP 3181548B2 JP 02163198 A JP02163198 A JP 02163198A JP 2163198 A JP2163198 A JP 2163198A JP 3181548 B2 JP3181548 B2 JP 3181548B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- format
- result
- unit
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3337—Translation of the query language, e.g. Chinese to English
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
報検索方法に関し、特に、入力されたキーワードの言語
と、検索対象データベースの記述言語が異なる場合に適
用して好適なものである。
するキーワードの言語(以下、「入力側言語」と呼ぶ)
と、検索対象データベースの記述言語(以下、「データ
側言語」と呼ぶ)が異なる場合、機械翻訳を介して検索
を行うものがあった。
ベースの言語に変換し、変換された言語のキーワードで
データベースを検索する。そして、データ側言語の検索
結果を入力側言語に変換して表示する。
置では、入力されたキーワードに対して同義語や類義語
による展開を行うことによって、検索の再現率を上げる
ような仕組みが用意されていた。また、これら展開され
たキーワードに対して論理演算などを用いた検索を行う
装置も多く開発されている。
検索キーワードと検索されたデータの一致度を基にラン
キングするランキング検索も用いられてきた。このラン
キング検索では、データ側言語に変換されたキーワード
により検索結果をランキングし、ランキングされた検索
結果を入力側言語に変換して検索者に提示する。
とにより、英語で記述されたデータベースを検索するも
のとする。この場合、入力された日本語のキーワードを
英語に変換し、変換された英語のキーワードにより、英
語で記述されたデータベースを検索する。そして、英語
で記述された検索結果を日本語に翻訳してから、検索者
に提示する。また、ランキング検索では、英語で記述さ
れた検索結果が、英語に変換されたキーワードを用いて
ランキングされ、そのランキングされた検索結果が日本
語に翻訳されて、検索者に提示される。
機械翻訳を介した情報検索装置では、入力されたキーワ
ードを同義語展開したり、入力側言語で記述されたキー
ワードをデータ側言語に変換したりする間に揺れが生じ
る。このため、入力側言語で記述されたキーワードとデ
ータ側言語で記述されたキーワードとの間にニュアンス
が異なる場合が発生し、入力側言語で記述されたキーワ
ードと関連性の低いデータが検索される場合が発生す
る。このような状況において、データ側言語に翻訳され
たキーワードを用いることにより、データ側言語で記述
された検索結果をランキングすると、入力側言語で記述
されたキーワードのニュアンスが反映されないため、ラ
ンキング結果が検索者の意図に反する場合が生じる。
基づいて、英語で記述されたデータベースを検索した場
合、検索結果のランキングは、英語に変換されたキーワ
ードと英語で記述された検索結果とを比較することによ
り行われる。このため、英語に変換されたキーワードを
含む文書が上位にランキングされ、キーワードの日英変
換が適正に行われないと、日本語のキーワードの意義が
反映されてない文書が上位にランキングされることにな
る。
ベースの記述言語と入力キーワードの記述言語とが異な
る場合においても、入力キーワードに忠実な検索結果を
出力させることが可能な情報検索装置を提供することで
ある。
ために、本発明によれば、第1のデータ形式の検索要求
に基づいて、第2のデータ形式の検索情報を生成する生
成手段と、前記検索情報に基づいて、第2のデータ形式
のデータを検索する検索手段と、前記第2のデータ形式
の検索結果を前記第1のデータ形式に変換する変換手段
と、前記第1のデータ形式の検索要求に基づいて、前記
第1のデータ形式に変換された検索結果を評価する評価
手段とを備えている。
検索要求のデータ形式とが異なる場合においても、検索
結果のデータ形式を検索要求のデータ形式に一致させる
ことが可能となり、検索要求のデータ形式を変換するこ
となしに、検索結果を評価することが可能となることか
ら、検索要求のデータ形式の変換に伴う揺れを排除し
て、検索要求に忠実な検索結果を得ることが可能とな
る。
から第1のデータ形式で抽出されたキー情報に基づい
て、第2のデータ形式の検索情報を生成する。このこと
により、第2のデータ形式に変換してからキー情報の抽
出を行う場合と比べて、データ変換に伴うデータの揺れ
の影響のない状態で、キー情報の抽出を行うことが可能
となり、検索要求に忠実にキー情報を抽出することが可
能となる。
ータ形式で展開された展開結果に基づいて、第2のデー
タ形式の検索情報を生成する。このことにより、第2の
データ形式に変換してから展開を行う場合と比べて、デ
ータ変換に伴うデータの揺れの影響のない状態で、展開
を行うことが可能となり、検索要求に忠実に展開するこ
とが可能となる。
ータ形式で行われた論理演算結果に基づいて、第2のデ
ータ形式の検索情報を生成する。このことにより、第2
のデータ形式に変換してから論理演算を行う場合と比べ
て、データ変換に伴うデータの揺れの影響のない状態
で、論理演算を行うことが可能となり、検索要求に忠実
に論理演算することが可能となる。
ータ形式の検索結果を第1のデータ形式に変換し、第1
のデータ形式に変換された変換結果を第1のデータ形式
のキー情報、展開結果、または演算結果に基づいて評価
する。
形式のデータの検索を行う場合においても、幅広い範囲
から検索したデータについて、検索要求のデータ変換を
行うことなしに、検索結果を評価することが可能となる
ことから、データ変換に伴う検索要求のニュアンスの揺
れを排除して、検索要求に忠実に検索結果を評価するこ
とが可能となる。
の評価結果に基づいて、検索結果をランキングする。こ
のことにより、検索結果を容易に選別することが可能と
なる。
式で記述された検索要求を入力する検索要求入力部と、
前記検索要求を入力側形式からデータ側形式へ変換する
第1の形式変換部と、前記第1の形式変換部による変換
結果に基づいて、データベースの検索処理を行う検索処
理部と、前記データベースからの検索結果をデータ側形
式から入力側形式へ変換する第2の形式変換部と、前記
入力側形式で記述された検索要求に基づいて、前記入力
側形式に変換された検索結果を整理する検索結果整理部
と、前記検索結果整理部により整理されたデータを表示
する検索結果表示部とを備えている。
ているデータのデータ形式と異なる形式で、検索要求が
入力された場合においても、データベースからの検索結
果のデータ形式を検索要求のデータ形式に一致させるこ
とが可能となり、検索要求のデータ形式を変換すること
なしに、検索要求と検索結果の変換結果とを直接比較す
ることが可能となることから、検索要求を忠実に反映し
た検索結果を抽出することが可能となる。
式とデータ側形式との間の変換は、言語翻訳または辞書
検索である。このことにより、入力されたキーワードの
言語と、検索対象データベースの記述言語とが異なる場
合においても、検索対象データベースから検索された内
容を、入力されたキーワードの言語で判別することが可
能となり、機械翻訳を介したデータの検索の正確性を向
上させることが可能となる。
言語を自動的に判別してから、言語翻訳または辞書検索
を行う。このことにより、検索要求側が検索対象データ
ベースの記述言語を認識していない場合においても、検
索対象データベースからの検索結果を検索要求側の言語
に変換することが可能となり、検索対象データベースか
らの検索結果を検索要求側の言語に基づいて判別するこ
とが可能となる。
ースの検索結果のうち、検索キーワードを含む文につい
てのみ、変換処理を行う。このことにより、データベー
スの検索結果から検索要求に関係ない情報を除去したも
のを、変換処理に渡すことが可能となり、機械翻訳を介
したデータの検索の処理時間を短縮することが可能とな
る。
ースの検索結果のうち、検索キーワードを含む段落につ
いてのみ、変換処理を行う。このことにより、検索の信
頼度を維持したまま検索要求に関係ない情報を除去する
ことが可能となり、機械翻訳を介したデータの検索の処
理時間を短縮することが可能となる。
の展開を入力側形式で行い、この展開結果をデータ側形
式へ変換してから、検索処理を行う。このことにより、
データ変換に伴うデータの揺れの影響のない状態で、検
索要求の展開を行うことが可能となり、検索要求の内容
を展開結果に忠実に反映させることが可能となることか
ら、データ変換を介したデータベースの検索の正確性を
向上させることが可能となる。
に付与された重みに基づいて、入力側形式に変換された
検索結果を整理する。このことにより、展開結果に対応
して複数の検索結果が得られた場合、展開結果の内容に
応じて検索結果を容易に整理することが可能となる。
の変換結果に付与された重みに基づいて、入力側形式に
変換された検索結果を整理する。このことにより、検索
要求の変換結果に対応して複数の検索結果が得られた場
合、検索要求の変換結果の内容に応じて検索結果を容易
に整理することが可能となる。
に対応して複数の検索情報が生成された場合、検索情報
のそれぞれに基づいて検索を行う。このことにより、検
索要求に関連する全ての情報を検索することが可能とな
り、検索要求に対応した情報を幅広い範囲から検索する
ことが可能となる。
形式から入力側形式への変換結果の要素について、複数
の候補が生成される場合、データベースからの検索結果
を、前記候補のそれぞれに対応させて変換する。 この
ことにより、データ形式の変換の際に揺れが生じた場合
においても、その揺れにより生成される全ての候補を提
示することが可能となり、データ形式の変換の際の揺れ
による所望のデータの欠落を防止して、検索精度を向上
させることが可能となる。
形式から入力側形式への変換により複数の候補が生成さ
れた場合、同一の検索結果に対して変換結果を最大1つ
だけ選択する。
から、検索結果を提示することが可能となり、検索を効
率的に行うことが可能となる。また、本発明の一態様に
よれば、データ側形式から入力側形式への変換結果の要
素について、複数の候補が生成された場合、データベー
スからの検索結果の中に、前記複数の候補を展開する。
揺れが生じた場合においても、その揺れにより生成され
る全ての候補を、同一の検索結果の中で提示することが
可能となり、検索精度を向上させることが可能となる。
式で記述された検索要求の論理演算結果に基づいて、入
力側形式に変換された検索結果を整理する。このことに
より、データ変換に伴うデータの揺れの影響のない状態
で、検索要求の論理演算を行うことが可能となり、検索
要求の内容を演算結果に忠実に反映させることが可能と
なることから、データ変換を介したデータベースの検索
の正確性を向上させることが可能となる。
式で記述された検索要求と、入力側形式に変換された検
索結果との関連度に基づいて、入力側形式に変換された
検索結果をランキングする。
た検索結果を入力側形式で比較することが可能となり、
検索要求を忠実に反映した検索結果を容易に選別するこ
とが可能となる。
式に変換された検索結果のうち、検索要求と一致した部
分を強調表示する。このことにより、検索結果と検索要
求との関連性を直接認識することが可能となり、検索要
求と合致する検索結果を容易に見つけることが可能とな
る。
式に変換された検索結果のうち、検索要求と一致した部
分及び検索要求の展開結果に一致した部分を各々区別し
て強調表示する。
関連性を幅広い範囲に渡って表示することができ、検索
要求と合致する検索結果及び検索要求と関連する検索結
果を容易に見つけることが可能となる。
ースの検索と、検索結果のデータ側形式から入力側形式
への変換とを並列に処理する。このことにより、データ
側形式から入力側形式への変換を、1回の検索が終了す
るごとに行うことが可能となり、全ての検索結果が蓄積
されるのを待つ必要がなくなることから、処理を高速に
行うことが可能となる。
の整理は入力側形式で行い、検索結果の表示はデータ側
形式で行う。このことにより、データ側形式から入力側
形式への変換が正常に行われないために、検索結果をデ
ータ側形式のまま検索者に提示する場合においても、入
力側形式で行ったランキング結果を、検索者への提示結
果に反映させることが可能となる。
ースからの検索結果をデータ側形式のままランキングを
行い、データ側形式でのランキング結果から上位の検索
結果を取り出す。そして、上位の検索結果についてのみ
データ側形式から入力側形式へ変換し、入力側形式で記
述された検索要求と入力側形式に変換された上位の検索
結果とを比較することにより検索結果を整理する。
ングの際に抽出された下位の検索結果については、デー
タ形式の変換を省略することが可能となり、データ変換
を介した検索処理に必要な全体の処理時間を短縮するこ
とが可能となる。
式で記述された検索要求に基づいて、データ側形式が異
なる複数のデータベースを検索し、これらのデータベー
スから検索された検索結果のデータ形式を入力側形式に
変換してから、これらの検索結果を整理する。
ータ形式で記述されている場合においても、1つの検索
要求に基づいて、これらのデータベースを一度に検索す
ることが可能となるとともに、様々なデータ形式で記述
された検索結果を、入力側形式で評価することが可能と
なり、幅広い範囲からのデータの検索を正確に行うこと
が可能となる。
ースから検索された検索結果に対応させて、データ形式
の種別を表示する。このことにより、検索結果が入力側
形式で表示されている場合においても、検索元のデータ
形式を認識することが可能となる。
式で記述された検索要求をそのまま使って検索した結果
を表示するとともに、入力側形式で記述された検索要求
をデータ側形式に変換して検索した結果を一緒に表示す
るようにしている。
タを幅広い範囲から検索して表示することが可能とな
る。また、本発明の一態様によれば、入力側形式で記述
された検索要求をそのまま使って検索した結果と、入力
側形式で記述された検索要求をデータ側形式に変換して
検索した結果とを同一画面に分けて表示する。
たデータの検索元を容易に区別することが可能となる。
情報検索装置について図面を参照しながら説明する。
索装置の構成を示すブロック図である。図1において、
入力手段1は、第1のデータ形式の検索要求を入力す
る。生成手段2は、第1のデータ形式の検索要求に基づ
いて、第2のデータ形式の検索情報を生成する。検索手
段3は、第2のデータ形式の検索情報に基づいて、第2
のデータ形式のデータを検索する。変換手段4は、第2
のデータ形式で記述されている検索結果を第1のデータ
形式に変換する。評価手段5は、第1のデータ形式の検
索要求に基づいて、第1のデータ形式に変換された検索
結果を評価する。
検索要求のデータ形式とが異なる場合においても、検索
結果のデータ形式を検索要求のデータ形式に一致させる
ことが可能となる。この結果、評価手段5は、検索要求
のデータ形式を変換することなしに、検索要求のデータ
形式で検索結果を評価することが可能となり、検索要求
のデータ形式の変換に伴う揺れを排除して、検索要求に
忠実な検索を行うことが可能となる。
索方法を説明する図である。図2において、データベー
ス13には英文書が格納されているものとし、この英語
のデータベース13から日本語の入力キーワード11に
対応する文書を取得するものとする。
と、入力キーワード11に対して日英変換を行うことに
より、日本語の入力キーワード11に対応する英語の検
索キーワード12を生成する。そして、英語の検索キー
ワード12を含む英文書をデータベース13から検索
し、この検索された英文書を検索結果14として出力す
る。英語の検索結果14が出力されると、検索結果14
に対して英日翻訳を行うことにより、データベース13
から検索された英文書を日本語文書に変換する。検索結
果14の日本語への変換が行われると、日本語の変換結
果15を日本語の入力キーワード11と比較することに
より、データベース13から検索された検索結果14の
妥当性を評価する。例えば、日本語の変換結果15の中
に日本語の入力キーワード11が含まれる場合、データ
ベース13から検索された英語の検索結果14を、日本
語の入力キーワード11に対応するものとして上位にラ
ンキングして、その検索結果14に対応する変換結果1
5を検索者に提示することができる。
れた英文書を日本語に翻訳してからランキングを行うこ
とにより、変換結果15を日本語の入力キーワード11
と直接比較して、検索結果14を評価することが可能と
なる。この結果、日本語の入力キーワード11を英語の
検索キーワード12に変換する際に揺れが発生する場合
においても、日本語の入力キーワード11を変換する前
の状態で、変換結果15を評価することが可能となり、
入力キーワード11の意義を忠実に反映した評価結果1
6を得ることが可能となる。
検索装置の構成を示すブロック図である。この第2実施
例は、情報形式変換部を介して検索を行う情報検索装置
において、入力側の形式で検索結果を整理することによ
り、検索者の検索要求により近い検索結果の表示を実現
可能とするものである。
部24、展開部25、展開辞書26、検索結果整理部2
7、及び結果表示部28は、入力側形式21で情報を処
理する。検索処理部31、データベース32及び検索結
果蓄積部33は、データ側形式22で情報を処理する。
要求を受け付け、受け付けた検索要求を展開部25に出
力する。なお、検索者24の検索要求は、検索結果整理
部27にも送られる。展開部25は、展開辞書26に格
納されている展開規則などを参照することにより、検索
要求入力部24から出力された検索要求を展開し、形式
変換部29に出力する。なお、展開部25による展開結
果は、検索結果整理部27にも送られる。展開辞書26
は、検索要求を展開する展開規則などを格納する。形式
変換部29は、変換辞書30に格納されている変換規則
を参照することにより、展開部25から出力された展開
結果を、入力側形式21からデータ側形式22に変換す
る。変換辞書30は、入力側形式21のデータをデータ
側形式22のデータに変換する変換規則を格納する。
換された検索要求に基づいて、データベース32からデ
ータ側形式22のデータを検索する。データベース32
は、データ側形式22のデータを格納する。検索結果蓄
積部33は、データベース32から検索されたデータを
蓄積する。検索結果蓄積部33に蓄積されたデータ側形
式のデータは、形式変換部29に送られる。形式変換部
29は、検索結果蓄積部33から送られたデータを、デ
ータ側形式22から入力側形式21に変換し、検索結果
整理部27に送る。検索結果整理部27は、検索要求入
力部24から出力された検索要求や展開部25から出力
された展開結果などの情報を基に、入力側形式21に変
換された検索結果を整理する。結果表示部28は、検索
結果整理部27によって整理されたデータを検索者23
に提示する。
索処理を示すフローチャートである。図4において、ま
ず、入力側形式21で表現されている検索要求を検索要
求入力部24により受け付ける(ステップS1)。
検索要求に対し、入力側形式21で展開を行う(ステッ
プS2)。次に、入力側形式21で展開された検索入力
に対し、データ側形式22への変換を行う(ステップS
3)。
要求を用いて、データベース32の検索を行う(ステッ
プS4)。次に、データベース32から検索された検索
結果を、検索結果蓄積部33に蓄積する(ステップS
5)。
9に送り、データ側形式22で表現されている検索結果
を、入力側形式21に変換する(ステップS6)。次
に、検索者23の入力した検索要求や検索要求の展開結
果などを用いることにより、入力側形式21に変換され
た検索結果を整理する(ステップS7)。
1で表示し、検索者23に提示する(ステップS8)。
このように、変換処理を介して得た検索結果について、
元の検索要求入力と照合できるようにするにより、検索
者23の元の検索要求と関連の大きい検索結果を表示す
ることができる。このため、検索者23にとって満足度
の高いランキング結果を得ることができる。
て、機械翻訳を介した情報検索を例にとって説明する。
機械翻訳を介してデータベース32の検索を行う場合、
検索者23は、データベース32を検索する際の手がか
りとなるキーワードを、検索要求入力部24に入力す
る。ここで、検索要求入力部24に入力されるキーワー
ドは、入力側言語で記述されている。一方、データベー
ス32に格納されているデータはデータ側言語で記述さ
れ、検索要求入力部24に入力されたキーワードの記述
言語とデータベース32に格納されているデータの記述
言語とが異なっている。このため、入力側言語で記述さ
れたキーワードの言語変換を行い、検索者23が入力し
たキーワードをデータ側言語で表現する。
キーワードの意味内容に揺れが発生する場合がある。こ
のため、データベース32から検索された検索結果を、
データ側言語に変換されたキーワードを用いてランキン
グすると、キーワードを変換した際の意味内容の揺れ
が、ランキング結果にそのまま反映され、検索者23の
意図がランキング結果に反映されない場合が発生する。
に、データベース32から検索された検索結果を入力側
言語に変換する。そして、入力側言語に変換された検索
結果を、入力側言語で入力されたキーワードと比較する
ことにより、検索結果をランキングする。この場合、言
語変換される前のキーワードを用いてランキングが行わ
れるので、言語変換に伴うキーワードの揺れがない状態
で検索結果を整理することが可能となり、検索者23の
意図をランキング結果に反映せることができる。
訳を介した情報検索処理を示すフローチャートである。
この実施例では、言語判定処理により、データ側言語を
判定してから、翻訳を行うようにしている。
から、日本語のキーワードを抽出する(ステップS1
1)。次に、日本語のキーワードをアルファベットのキ
ーワードに変換する(ステップS12)。
て、データベースを検索する(ステップS13)。次
に、データベースから検索された文書の一次情報を1つ
受け取る(ステップS14)。
定を行う(ステップS15)。次に、検索された文書の
記述言語を日本語に変換する(ステップS16)。次
に、データベースから検索された全ての検索結果につい
て、日本語への変換が終了すると(ステップS17)、
日本語の入力文字列や日本語のキーワードを用いること
により、日本語に変換された文書を整理する(ステップ
S18)。
定処理を示すフローチャートである。図6において、ま
ず、データ側形式で記述されている文書を1つ取り出す
(ステップS21)。
(ステップS22)、文書のコード系が2バイト系コー
ドの場合(ステップS23)、取り出した文書を単語に
分割し(ステップS24)、文書のコード系が1バイト
系コードの場合(ステップS23)、取り出した文書を
形態素に分割する(ステップS25)。
素について、各種言語で辞書検索を行い(ステップS2
6)、ヒット率の高い辞書の言語を出力する(ステップ
S27)。
展開を用いた情報検索処理を示すフローチャートであ
る。図7において、まず、日本語の入力文字列から、日
本語のキーワードを抽出する(ステップS31)。
行う(ステップS32)。次に、日本語のキーワードを
英語のキーワードに変換する(ステップS33)。
記述されているデータベースから英語文書を検索する
(ステップS34)。次に、検索された英語文書の英日
翻訳を行う(ステップS35)。
いることにより、英日翻訳された文書を整理する(ステ
ップS36)。図8は、本発明の一実施例に係わるキー
ワードと文書との関連度の算出方法を説明する図であ
る。キーワードと文書の関連度を調べる場合、キーワー
ドの出現位置や出現頻度を算出する。そして、文単位ま
たはバイト単位で数えて、文書の先頭により近い位置で
出現したキーワードの関連度を高く設定する。あるい
は、検索された文書での出現頻度の大きいキーワードの
関連度を高く設定する。
「床」というキーワードに対し、「テーブルの上にはペ
ンがある。そして、床の上には本がある。また、ソファ
の上にはクッションが見える。」と書かれた文書が得ら
れたものとする。
というキーワードの出現位置は、1文目で、文書の最初
から数えて9バイト目、出現頻度は1回である。また、
「床」というキーワードの出現位置は、2文目で、文書
の最初から数えて19バイト目、出現頻度は1回であ
る。
る。そして、床の上には本がある。また、ソファの上に
はクッションが見える。」と書かれた文書に対し、「ペ
ン」及び「床」の出現頻度は同じであるが、「ペン」の
出現位置の方が「床」の出現位置よりも前にあるので、
「床」というキーワードよりも、「ペン」というキーワ
ードの方が関連度が高いと判断される。
ングを入力キーワードとの関連度を基に行うことによ
り、検索者の意図に合ったランキング結果を得ることが
可能となる。
索装置のシステム構成を示すブロック図である。図9に
おいて、41は全体的な処理を行う中央演算処理ユニッ
ト(CPU)、42はリードオンリメモリ(ROM)、
43はランダムアクセスメモリ(RAM)、44は通信
インターフェイス、45は通信ネットワーク、46は入
出力インターフェイス、47はディスプレイ、48はテ
キストやイメージなどを印刷するプリンタ、49はスキ
ャナ50により読み取られたデータを一時的に格納する
メモリ、50はテキストやイメージなどを読み取るスキ
ャナ、51はキーボード、52は記憶媒体を駆動するド
ライバ、53はハードディスク、54はICメモリカー
ド、55は磁気テープ、56はフロッピーディスク、5
7はCD−ROMやDVD−ROMなどの光ディスク、
58はバスである。
ラム、あるいは検索対象となるデータを、ハードディス
ク53、ICメモリカード54、磁気テープ55、フロ
ッピーディスク56、光ディスク57などの記憶媒体に
格納する。そして、情報検索処理や形式変換処理を行う
プログラムを、これらの記憶媒体からRAM43に読み
出すことにより、形式変換を介した情報検索処理を行う
ことができる。また、情報検索処理や形式変換処理を行
うプログラム、あるいは検索対象となるデータなどを、
ROM42に格納しておくこともできる。
うプログラム、あるいは検索対象となるデータなどを、
通信インターフェイス54を介して通信ネットワーク4
5から取り出すことをできる。通信インターフェイス4
4に接続される通信ネットワーク45として、例えば、
LAN(Local Area Network)、W
AN(Wide Area Network)、インタ
ーネット、アナログ電話網、デジタル電話網(ISD
N:Integral Service Digita
l Network)、PHS(パーソナルハンディシ
ステム)や衛星通信などの無線通信網を用いることがで
きる。
ラムが起動されると、キーボード51から入力されたキ
ー情報やスキャナ50から読み取られたキー情報などに
基づいて、検索対象となるデータの検索を行う。ここ
で、入力されたキー情報と検索対象となるデータとのデ
ータ形式が異なる場合、形式変換処理を行うプログラム
を起動し、入力されたキー情報のデータ形式を検索対象
となるデータのデータ形式に一致させる。データの検索
が終了すると、検索したデータのデータ形式を、入力さ
れたキー情報のデータ形式に一致させて、検索したデー
タの整理を行う。検索したデータの整理結果は、ディス
プレイ47またはプリンタ48に出力される。
処理について、検索要求が日本語で入力され、データベ
ースには英語文書が格納されている場合を例にとって、
より具体的に説明する。
に係わる情報検索処理の具体例を示す。この第1実施例
では、日本語の入力キーワードを同義語展開し、この展
開結果に基づいて、検索結果をランキングする。
わる同義語展開結果を示す図である。図10(a)にお
いて、「橋本総理」というキーワードが、検索要求とし
て入力されたものとする。この入力キーワードについ
て、同義語辞書を用いて展開を行うことにより、「橋本
総理大臣」と「橋本首相」とが得られる。なお、この展
開結果は、日本語での展開結果となっている。この展開
結果について、日英辞書検索を行うことにより、入力キ
ーワードの展開結果を英語のキーワードに変換する。
わる日英辞書検索結果を示す図である。図10(b)に
おいて、日英辞書検索を行うことにより、「橋本総理大
臣」に対し、“Prime Minister Ryu
taro Hashimoto”、“Prime Mi
nister R.Hashimoto”及び“P.
M.Hashimoto”という英語のキーワードが得
られる。また、「橋本首相」に対し、“Prime M
inister Ryutaro Hashimot
o”、“Prime Minister R.Hash
imoto”及び“Prime Minister H
ashimoto”という英語のキーワードが得られ
る。これらの英語のキーワードを用いることにより、英
語のデータベースを検索する。
わる英文書検索結果を示す図である。図10(c)にお
いて、日英辞書検索により得られた英語のキーワードを
用いることにより、英語のデータベースから文書A〜文
書Dが検索される。文書Aは、“Prime Mini
ster Ryutaro Hashimoto”とい
う文字列を含み、文書Bは、“Mr.Hashimot
o”という文字列を含み、文書Cは、“Seiko H
ashimoto”という文字列を含み、文書Dは、
“Prime Minister Hashimot
o”という文字列を含んでいる。文書A〜文書Dが検索
されると、文書A〜文書Dを日本語に変換する。
わる英日翻訳結果を示す図である。図11(a)におい
て、文書Aを英日翻訳することにより、「橋本首相」と
いう文字列を含む文書A’が得られる。文書Bを英日翻
訳することにより、「橋本氏」という文字列を含む文書
B’が得られる。文書Cを英日翻訳することにより、
「橋本聖子」という文字列を含む文書C’が得られる。
文書Dを英日翻訳することにより、「橋本首相」という
文字列を含む文書D’が得られる。日本語の文書A’〜
文書D’が得られると、同義語展開により得られた「橋
本総理大臣」及び「橋本首相」という文字列を、文書
A’〜文書D’と比較する。そして、「橋本総理大臣」
または「橋本首相」という文字列と、文書A’〜文書
D’との関連度を調べることにより、文書A’〜文書
D’をランキングする。
わるランキング結果を示す図である。図11(b)にお
いて、文書A’及び文書D’には「橋本首相」という文
字列が含まれ、この「橋本首相」という文字列は、同義
語展開により得られた「橋本首相」という文字列と一致
するので、高いランキング点数が与えられる。ここで、
文書A’に含まれる「橋本首相」という文字列は、文書
A’の先頭の方にあるので、文書A’は文書D’よりも
高いランキング点数が与えられる。文書B’には「橋本
氏」という文字列が含まれ、この「橋本氏」という文字
列は、同義語展開により得られた「橋本首相」という文
字列と類似するので、比較的高いランキング点数が与え
られる。文書C’には「橋本聖子」という文字列が含ま
れ、この「橋本聖子」という文字列には、「聖子」とい
う余分な文字列が含まれているので、低いランキング点
数が与えられる。
A’、文書D’、文書B’、文書C’の順でランキング
され、検索者の意図に近いランキング結果を得ることが
できる。
に係わる情報検索処理の具体例を示す。この第2実施例
では、入力された日本語の文字列からキーワードを抽出
し、抽出されたキーワードの論理演算結果に基づいて、
検索結果をランキングする。
わるキーワード抽出結果を示す図である。図12(a)
において、「ソフトの開発」という文字列が、検索要求
として入力されたものとする。この「ソフトの開発」と
いう文字列に対して、形態素解析を行うことにより、
「ソフト」というキーワードと「開発」というキーワー
ドを抽出する。この抽出結果について、日英辞書検索を
行うことにより、日本語のキーワードを英語のキーワー
ドに変換する。
わる日英辞書検索結果を示す図である。図12(b)に
おいて、日本語の「ソフト」というキーワードに対して
日英変換を行うことにより、英語の「soft」という
キーワードと英語の「software」というキーワ
ードが得られる。また、日本語の「開発」というキーワ
ードに対して日英変換を行うことにより、英語の「de
velop」というキーワードと英語の「develo
pment」というキーワードが得られる。これらの英
語のキーワードを用いて検索式を生成し、この検索式に
基づいてデータベースを検索する。
わる英文書検索結果を示す図である。図12(c)にお
いて、「soft」というキーワードと「develo
p」というキーワードとを組み合わせることにより、
「soft」「develop」という検索式1が生成
される。「software」というキーワードと「d
evelop」というキーワードとを組み合わせること
により、「software」「develop」とい
う検索式2が生成される。「soft」というキーワー
ドと「development」というキーワードとを
組み合わせることにより、「soft」「develo
pment」という検索式3が生成される。「soft
ware」というキーワードと「developmen
t」というキーワードとを組み合わせることにより、
「software」「development」とい
う検索式4が生成される。
り、英語のデータベースから文書1〜文書4が検索され
る。文書1は、“soft loans to dev
elop”という文字列を含み、文書2は、“soft
ware for processing the g
iven data is developed”とい
う文字列を含み、文書3は、“soft lading
economic development”という
文字列を含み、文書4は、“the developm
ent method for the softwa
re is”という文字列を含んでいる。文書1〜文書
4が検索されたら、文書1〜文書4を日本語に変換す
る。
文書が検索されてくるが、これら検索結果文書の中で検
索式1に最も近い文字列を含む文書が文書1である。同
様に、検索式2により検索された複数の文書のうち、検
索式2に最も近い文字列を含む文書が文書2であり、検
索式3により検索された複数の文書のうち、検索式3に
最も近い文字列を含む文書が文書3であり、検索式4に
より検索された複数の文書のうち、検索式4に最も近い
文字列を含む文書が文書4である。
して複数の文書が検索されてきた場合、英語の文書の状
態でランキングを行い、日本語に変換する文書を絞り込
むことにより、変換処理の負担を軽減することが可能と
なる。
して検索結果がどのくらい近いかの判定はランキング検
索を用いれば行うことができるが、文書1〜文書4を順
位づける決め手はない。
わる英日翻訳結果を示す図である。図13(a)におい
て、文書1を英日翻訳することにより、「開発のために
低金利の融資を」という文字列を含む文書1’が得られ
る。文書2を英日翻訳することにより、「与えられたデ
ータを処理するためのソフトを開発する」という文字列
を含む文書2’が得られる。文書3を英日翻訳すること
により、「経済開発は軟着陸に」という文字列を含む文
書3’が得られる。文書4を英日翻訳することにより、
「ソフトの開発方法は」という文字列を含む文書4’が
得られる。日本語の文書1’〜文書4’が得られると、
検索要求として入力された「ソフトの開発」という文字
列を、文書1’〜文書4’と比較する。そして、「ソフ
トの開発」という文字列と、文書1’〜文書4’との関
連度を調べることにより、文書1’〜文書4’をランキ
ングする。
わるランキング結果を示す図である。図13(b)にお
いて、文書4’には「ソフトの開発」という文字列が含
まれ、この「ソフトの開発」という文字列は、検索要求
として入力された「ソフトの開発」という文字列と一致
するので、高いランキング点数が与えられる。文書2’
には「ソフトを開発」という文字列が含まれ、この「ソ
フトを開発」という文字列は、検索要求として入力され
た「ソフトの開発」という文字列と類似するので、比較
的高いランキング点数が与えられる。文書3’及び文書
1’には「開発」という文字列が含まれているけれど
も、「ソフト」という文字列が含まれていないので、低
いランキング点数が与えられる。
4’、文書2’、文書3’、文書1’の順でランキング
され、検索者の意図に近いランキング結果を得ることが
できる。
係わる情報検索処理の具体例を示す。この第3実施例で
は、入力された日本語の文字列からキーワードを抽出
し、抽出されたキーワードの同義語展開結果に基づい
て、検索結果をランキングする。
わるキーワード抽出結果を示す図である。図14(a)
において、「ソフトの開発」という文字列が、検索要求
として入力されたものとする。この「ソフトの開発」と
いう文字列に対して、形態素解析を行うことにより、
「ソフト」というキーワードと「開発」というキーワー
ドを抽出する。この抽出結果について、同義語展開及び
日英辞書検索を行うことにより、日本語のキーワードを
英語のキーワードに変換する。
わる同義語展開結果及び日英辞書検索結果を示す図であ
る。図14(b)において、日本語の「ソフト」という
キーワードに対して同義語展開を行ったが、「ソフト」
の同義語は見つからなかったものとする。このため、日
本語の「ソフト」というキーワードに対して日英変換を
行うことにより、英語の「soft」というキーワード
と英語の「software」というキーワードが得ら
れる。
に対して日本語で同義語展開を行うことにより、「開
発」というキーワードと「構築」というキーワードとが
得られる。そして、「開発」というキーワードに対して
日英変換を行うことにより、英語の「develop」
というキーワードと英語の「development」
というキーワードが得られる。さらに、「構築」という
キーワードに対して日英変換を行うことにより、英語の
「construct」というキーワードと英語の「c
onstruction」というキーワードが得られ
る。これらの英語のキーワードを用いて検索式を生成
し、この検索式に基づいてデータベースを検索する。
索対象から検索を行うことができ、幅広い検索結果に対
して整理を行うことができるので、総合的な検索の精度
を向上させることができる。
文書検索結果を示す図である。図15において、「so
ft」というキーワードと「develop」というキ
ーワードとを組み合わせることにより、「soft」
「develop」という検索式1が生成される。「s
oftware」というキーワードと「develo
p」というキーワードとを組み合わせることにより、
「software」「develop」という検索式
2が生成される。「soft」というキーワードと「d
evelopment」というキーワードとを組み合わ
せることにより、「soft」「developmen
t」という検索式3が生成される。「softwar
e」というキーワードと「development」と
いうキーワードとを組み合わせることにより、「sof
tware」「development」という検索式
4が生成される。
struct」というキーワードとを組み合わせること
により、「soft」「construct」という検
索式5が生成される。「software」というキー
ワードと「construct」というキーワードとを
組み合わせることにより、「software」「co
nstruct」という検索式6が生成される。「so
ft」というキーワードと「constructio
n」というキーワードとを組み合わせることにより、
「soft」「construction」という検索
式7が生成される。「software」というキーワ
ードと「construction」というキーワード
とを組み合わせることにより、「software」
「construction」という検索式8が生成さ
れる。
り、英語の文書1〜文書8が検索される。文書1は、
“soft loans to develop”とい
う文字列を含み、文書2は、“software fo
r processing the given da
ta is developed”という文字列を含
み、文書3は、“soft lading econo
mic development”という文字列を含
み、文書4は、“the development m
ethod for the software i
s”という文字列を含み、文書5は、“to cons
truct economic policy”という
文字列を含み、文書6は、“to construct
a methodfor the softwar
e”という文字列を含み、文書7は、“soft la
nding for economic actio
n.The construction of”という
文字列を含み、文書8は、“the construc
tion method for the softw
areis”という文字列を含んでいる。英語の文書1
〜文書8が検索されたら、文書1〜文書8を日本語に変
換する。
日翻訳結果を示す図である。図16において、文書1を
英日翻訳することにより、「開発のために低金利の融資
を」という文字列を含む文書1’が得られる。文書2を
英日翻訳することにより、「与えられたデータを処理す
るためのソフトを開発する」という文字列を含む文書
2’が得られる。文書3を英日翻訳することにより、
「経済開発は軟着陸に」という文字列を含む文書3’が
得られる。文書4を英日翻訳することにより、「ソフト
の開発方法は」という文字列を含む文書4’が得られ
る。文書5を英日翻訳することにより、「経済政策を構
築する」という文字列を含む文書5’が得られる。文書
6を英日翻訳することにより、「ソフトの...方法を
構築する」という文字列を含む文書6’が得られる。文
書7を英日翻訳することにより、「経済活動の軟着
陸...の構築は」という文字列を含む文書7’が得ら
れる。文書8を英日翻訳することにより、「ソフトウェ
アの構築方法は」という文字列を含む文書8’が得られ
る。日本語の文書1’〜文書8’が得られると、検索要
求として入力された「ソフトの開発」という文字列及び
同義語展開により得られた「ソフトの構築」という文字
列を、文書1’〜文書8’と比較する。そして、「ソフ
トの開発」という文字列または「ソフトの構築」という
文字列と、文書1’〜文書8’との関連度を調べること
により、文書1’〜文書8’をランキングする。
ンキング結果を示す図である。図17において、文書
4’には「ソフトの開発」という文字列が含まれ、この
「ソフトの開発」という文字列は、検索要求として入力
された「ソフトの開発」という文字列と一致するので、
高いランキング点数が与えられる。文書8’には「ソフ
トウェアの構築」という文字列が含まれ、この「ソフト
ウェアの構築」という文字列は、同義語展開により得ら
れた「ソフトの構築」という文字列とほぼ一致するの
で、高いランキング点数が与えられる。
列が含まれ、この「ソフトを開発」という文字列は、検
索要求として入力された「ソフトの開発」という文字列
と類似するので、比較的高いランキング点数が与えられ
る。文書6’には「ソフト」及び「構築」という文字列
が含まれ、この「ソフト」という文字列及び「構築」」
という文字列は、同義語展開により得られた「ソフトの
構築」という文字列に含まれるキーワードに一致するの
で、比較的高いランキング点数が与えられる。
文字列が含まれているけれども、「ソフト」という文字
列が含まれていないので、低いランキング点数が与えら
れる。文書5’及び文書7’には「構築」という文字列
が含まれているけれども、「ソフト」という文字列が含
まれていないので、低いランキング点数が与えられる。
4’、文書8’、文書2’、文書6’、文書3’、文書
1’、文書5’、文書7’の順でランキングされ、検索
者の意図に近いランキング結果を、幅広い検索対象から
得ることができる。
翻訳結果の整理方法について、より具体的に説明する。
図18は、本発明の第1実施例に係わる検索結果の翻訳
結果の整理方法を説明する図である。
キーワードと「開発」というキーワードに対し、検索結
果の翻訳結果として、文書1’〜文書4’が得られたも
のとする。文書1’には、「開発のために低金利の融資
を」という文字列が含まれ、文書2’には、「与えられ
たデータを処理するためのソフトを開発する」という文
字列が含まれ、文書3’には、「経済開発は軟着陸に」
という文字列が含まれ、文書4’には、「ソフトの開発
方法は」という文字列が含まれている。
「ソフト」と「開発」という2つのキーワードを用い
て、4つの文書1’〜文書4’に対して論理積演算を行
う。すなわち、「ソフト」と「開発」の両方のキーワー
ドを含んだ文書のみ抽出し、抽出された文書を整理結果
として出力する。
「ソフト」と「開発」の両方のキーワードを含む文書
2′及び文書4′が整理結果として出力される。なお、
この実施例では、ランキングは行っていないので、出力
文書はいずれも関連性があるが、関連度による順位づけ
は行われてない。
索結果の翻訳結果の整理方法を説明する図である。図1
9において、「ソフトの開発」という文字列が、検索要
求として入力されたものとする。この「ソフトの開発」
という文字列に対して、形態素解析を行うことにより、
「ソフト」というキーワードと「開発」というキーワー
ドが抽出される。ここで、入力文字列が「ソフトの開
発」であることから、キーワードである「ソフト」も
「開発」も名詞であることがわかる。
られた“soft”及び“software”のうち、
“soft”は形容詞、“software”は名詞で
ある。従って、変換前の単語と品詞が一致する“sof
tware”には高い重みを付け、変換前の単語と品詞
が異なる“soft”には低い重みを付ける。例えば、
“soft”という単語には、0.2の重みが付与さ
れ、“software”という単語には、1.0の重
みが付与される。
れた“develop”及び“developmen
t”のうち、“develop”は動詞、“devel
opment”は名詞である。従って、変換前の単語と
品詞が一致する“development”には高い重
みを付け、変換前の単語と品詞が異なる“develo
p”には低い重みを付ける。例えば、“develo
p”という単語には、0.7の重みが付与され、“de
velopment”という単語には、1.0の重みが
付与される。
を利用することにより、信頼度の高い整理結果を得るこ
とができる。図20は、本発明の第3実施例に係わる検
索結果の翻訳結果の整理方法を説明する図である。
文字列が、検索要求として入力されたものとする。この
「ソフトの開発」という文字列に対して、形態素解析を
行うことにより、「ソフト」というキーワードと「開
発」というキーワードが抽出されたものとする。そし
て、「ソフト」というキーワードに対して同義語展開を
行ったが、「ソフト」の同義語は見つからなかったもの
とする。このため、日本語の「ソフト」というキーワー
ドに対して日英変換を行うことにより、英語の“sof
t”というキーワードと英語の“software”と
いうキーワードが得られたものとする。
日本語で同義語展開を行うことにより、「開発」という
キーワードと「構築」というキーワードとが得られたも
のとする。そして、「開発」というキーワードに対して
日英変換を行うことにより、英語の“develop”
というキーワードと英語の“development”
というキーワードが得られ、「構築」というキーワード
に対して日英変換を行うことにより、英語の“cons
truct”というキーワードと英語の“constr
uction”というキーワードが得られたものとす
る。
行うことにより、「ソフト」と「開発」を含む文書が、
検索結果の翻訳結果として得られる。また、同義語展開
を用いた検索も行われるので、「ソフト」と「構築」を
含む文書も、検索結果の翻訳結果として得られる。これ
らの文書のランキングを行う際は、元のキーワードによ
って得られた文書群と、同義語展開によって得られた文
書群の両方に対してランキングが行われるが、同義語展
開によって得られた文書群には低い点数を与えてランキ
ングを行う。
た“soft”、“software”、“devel
op”及び“development”の単語には、
1.0の重みが付与され、同義語展開により得られた
“construct”、“constructio
n”の単語には、0.7の重みが付与される。
索結果の翻訳結果の整理方法を説明する図である。図2
1において、「ソフトの開発」という文字列が、検索要
求として入力されたものとする。この「ソフトの開発」
という文字列に対して、形態素解析を行うことにより、
「ソフト」というキーワードと「開発」というキーワー
ドが抽出されたものとする。そして、「ソフト」という
キーワードに対して日英変換を行うことにより、英語の
“soft”というキーワードと英語の“softwa
re”というキーワードが得られ、「開発」というキー
ワードに対して日英変換を行うことにより、英語の“d
evelop”というキーワードが得られたものとす
る。日英変換により得られた“soft”というキーワ
ードと“develop”というキーワードとを組み合
わせることにより、“soft”“develop”と
いう検索式1が生成されている。また、日英変換により
得られた“software”というキーワードと“d
evelop”というキーワードとを組み合わせること
により、“software”“develop”とい
う検索式2が生成されている。検索式1を用いることに
より、“soft”及び“develop”の単語を含
む3つの文書1a〜1cが検索されたものとする。ま
た、検索式2を用いることにより、“softwar
e”及び“develop”の単語を含む3つの文書2
a〜2cが検索されたものとする。
と、これらの文書1a〜1cについて、“soft”と
“develop”という英語のキーワードを用いてラ
ンキングを行う。この結果、文書1aがランキングの1
位となったものとすると、ランキングが1位の文書1a
だけを翻訳処理に送る。
て、“software”と“develop”という
英語のキーワードを用いてランキングを行う。この結
果、文書2aがランキングの1位となったものとする
と、ランキングが1位の文書2aだけを翻訳処理に送
る。
ると、文書1a及び文書2aの翻訳結果について、「ソ
フト」と「開発」という日本語のキーワードを用いてラ
ンキングを行い、このランキング結果を検索者に提示す
る。
行い、変換対象となる文書を絞り込んで翻訳処理に送る
ことにより、処理時間を短縮することができる。以下、
本発明の実施例に係わる検索結果の翻訳方法について、
より具体的に説明する。
索結果の翻訳方法を説明する図である。図22におい
て、「床」という日本語の文字列が入力されたとする。
この日本語の文字列に対する日英変換によって、英語の
“floor”というキーワードが得られる。この“f
loor”というキーワードを用いた英語文書の検索に
より、“There is a pen on the
table.And there are book
s on the floor.I also see
cushions on the sofa.”とい
う英語文書が検索されたとする。ここで、“floo
r”というキーワードの出現位置を記憶しておき、文区
切り処理によって、“floor”というキーワードを
含む“Andthere are books on
the floor”という文だけを、検索された英語
文書から切り出す。この切り出された文に対して英日翻
訳を行うことにより、「そして、床の上には本があ
る。」という日本語の文を得ることができる。
て行い、日本語訳文を1文だけ含む日本語文書群を作成
する。そして、元の入力文字列である「床」とこれらの
日本語文書群との比較を行うことにより、ランキングを
行う。
抑えることが可能となり、処理時間を削減することがで
きる。図23は、本発明の第1実施例に係わる検索結果
の翻訳方法を示すフローチャートである。
列から、日本語のキーワードを抽出する(ステップS4
1)。次に、日本語のキーワードの同義語展開を行う
(ステップS42)。
ードに変換する(ステップS43)。次に、英語のキー
ワードを用いて、英語で記述されているデータベースか
ら英語文書を検索する(ステップS44)。
のキーワードを含む文だけを切り出す(ステップS4
5)。次に、切り出された英文の英日翻訳を行う(ステ
ップS46)。
果を用いることにより、英日翻訳された日本文を整理す
る(ステップS47)。図24は、本発明の第2実施例
に係わる検索結果の翻訳方法を説明する図である。
字列が入力されたとする。この日本語の文字列に対する
日英変換によって、英語の“floor”というキーワ
ードが得られる。この“floor”というキーワード
を用いた英語文書の検索により、“xxxxx xxx
xxxxxxx xx x xxxxx,xxxxxx
xxx xx xxxxx.yyyy yy yyy
yyyyy.There is a pen on t
he table.And there are bo
oks on the floor.I also s
ee cushions on the sofa.a
aa aaaaa aa a aaaa,aaaa a
aa aaa aaaa a aaa.bb bbb
bbbb.”という英語文書が検索されたとする。ここ
で、“floor”というキーワードの出現位置を記憶
しておき、文区切り処理によって、“floor”とい
うキーワードを含む“There is a pen
on the table.And there ar
e books on the floor.Ials
o see cushions on the sof
a.”という段落だけを、検索された英語文書から切り
出す。この切り出された段落に対して英日翻訳を行うこ
とにより、「テーブルの上にはペンがある。そして、床
の上には本がある。また、ソファの上にはクッションが
見える。」という日本語の文章を得ることができる。
て行い、日本語訳文を1段落だけ含む日本語文書群を作
成する。そして、元の入力文字列である「床」とこれら
日本語文書群との比較を行うことにより、ランキングを
行う。
含む段落だけを切り出すことにより、1文のみを翻訳対
象とする場合に比べて、元のキーワードとの比較の際に
得られる情報の精度を損なうことなく、処理速度を高速
化することができ、信頼度の高いランキングを高速に行
うことが可能となる。
索結果の翻訳方法を示すフローチャートである。図25
において、まず、日本語の入力文字列から、日本語のキ
ーワードを抽出する(ステップS51)。
行う(ステップS52)。次に、日本語のキーワードを
英語のキーワードに変換する(ステップS53)。
記述されているデータベースから英語文書を検索する
(ステップS54)。次に、検索された英語文書の中か
ら、英語のキーワードを含む段落だけを切り出す(ステ
ップS55)。
英日翻訳を行う(ステップS56)。次に、日本語の入
力文字列や同義語展開結果を用いることにより、英日翻
訳された日本語の段落を整理する(ステップS57)。
索結果の翻訳方法を示すフローチャートである。図26
において、まず、日本語の入力文字列から、日本語のキ
ーワードを抽出する(ステップS61)。
ードに変換する(ステップS62)。次に、英語のキー
ワードを用いて、英語で記述されているデータベースか
ら英語文書を検索する(ステップS63)。この検索に
より、英語のキーワードを含む英語文書名の一覧を取得
することができる。
次情報を1つずつ取り寄せる(ステップS64)。次
に、一次情報を1つ受け取るごとに、受け取った一次情
報の英日翻訳を開始するとともに(ステップS65〜S
67)、受け取った一次情報が最後の検索結果であるか
どうかを判断する(ステップS68)。そして、英日翻
訳を開始した一次情報が最後の検索結果になった場合、
受け取った全ての一次情報についての翻訳が終了するの
を待つ(ステップS69)、次に、英日翻訳が終了する
と(ステップS70)、日本語の入力文字列や日本語の
キーワードを用いることにより、英日翻訳された文書を
整理する(ステップS70)。
せ処理を別プロセスとして動作させ、文書情報の取り寄
せと翻訳とを並列に処理することにより、ネットワーク
などを介した場合に一次情報の取り寄せに時間がかかる
時でも、処理時間を短縮することができる。
出力方法について、より具体的に説明する。図27
(a)は、本発明の第1実施例に係わる検索結果の出力
方法を説明する図である。
という日本語の文字列から、“soft”、“soft
ware”、“develop”、“developm
ent”という英語のキーワードが生成され、これらの
英語のキーワードを用いることにより、英語の文書1〜
文書4が検索されたものとする。文書1には、“sof
t loans to develop”という文字列
が含まれ、文書2には、“software for
processing the givendata
is developed”という文字列が含まれ、文
書3には、“soft lading economi
c development”という文字列が含まれ、
文書4には、“the development me
thod for the software is”
という文字列が含まれている。
のために低金利の融資を」という文字列を含む文書1’
を得る。文書2を英日翻訳する場合、“softwar
e”の訳語として「ソフト」と「ソフトウェア」の両方
があるので、これら両方の訳語に対応した訳文を生成す
る。すなわち、「与えられたデータを処理するためのソ
フトを開発する」という文字列を含む文書2’、及び
「与えられたデータを処理するためのソフトウェアを開
発する」という文字列を含む文書2’’を生成する。文
書3を英日翻訳することにより、「経済開発は軟着陸
に」という文字列を含む文書3’を得る。文書4を英日
翻訳する場合、“software”の訳語として「ソ
フト」と「ソフトウェア」の両方があるので、これら両
方の訳語に対応した訳文を生成する。すなわち、「ソフ
トの開発方法は」という文字列を含む文書4’、及び
「ソフトウェアの開発方法は」という文字列を含む文書
4’’を生成する。
語が得られる場合、こられの訳語を展開した訳文を生成
することにより、入力キーワードが「ソフトの開発」で
あった場合でも「ソフトウェアの開発」であった場合で
も、適合度の高い文書を上位にランキングすることがで
きる。
わる検索結果の出力方法を説明する図である。図27
(b)において、「ソフトの開発」という日本語の文字
列から、“soft”、“software”、“de
velop”、“development”という英語
のキーワードが生成され、これらの英語のキーワードを
用いることにより、文書1〜文書4が検索されたものと
する。文書1には、“softloans to de
velop”という文字列が含まれ、文書2には、“s
oftware for processing th
e given data is develope
d”という文字列が含まれ、文書3には、“soft
lading economic developme
nt”という文字列が含まれ、文書4には、“the
development method for th
e software is”という文字列が含まれて
いる。
のために低金利の融資を」という文字列を含む文書1’
を得る。文書2を英日翻訳する場合、“softwar
e”の訳語として「ソフト」と「ソフトウェア」の両方
があるので、これら両方の訳語を埋め込んだ訳文を生成
する。すなわち、「ソフト」と「ソフトウェア」の両方
の訳語を文書2’に埋め込むことにより、「与えられた
データを処理するためのソフト/ソフトウェアを開発す
る」という文字列を含む文書2’を生成する。文書3を
英日翻訳することにより、「経済開発は軟着陸に」とい
う文字列を含む文書3’を得る。文書4を英日翻訳する
場合、“software”の訳語として「ソフト」と
「ソフトウェア」の両方があるので、これら両方の訳語
を埋め込んだ訳文を生成する。すなわち、「ソフト」と
「ソフトウェア」の両方の訳語を文書4’に埋め込むこ
とにより、「ソフト/ソフトウェアの開発方法は」とい
う文字列を含む文書4’を生成する。
が得られる場合、これらの複数の訳語を1つの訳文の中
に埋め込むことにより、同じ英語から派生した複数の日
本語訳語が同時に選ばれることを防止し、精度の高い検
索を行うことができる。
わる検索結果の出力方法を説明する図である。図28
(a)において、「ソフトの開発」という文字列が、検
索要求として入力されたものとする。この「ソフトの開
発」という文字列に対して、形態素解析を行うことによ
り、「ソフト」というキーワードと「開発」というキー
ワードが抽出される。そして、「ソフト」というキーワ
ードに対して日英変換を行うことにより、英語の“so
ft”というキーワードと英語の“software”
というキーワードが得られ、「開発」というキーワード
に対して日英変換を行うことにより、英語の“deve
lop”というキーワードと英語の“developm
ent”というキーワードが得られる。
より、英語の文書1〜4が検索され、検索された英語の
文書1〜4を英日変換することにより、文書1’〜4’
が得られる。英日変換された文書1’〜4’を、「ソフ
ト」または「開発」という日本語のキーワードと比較す
ることにより、文書1’〜4’が文書4’、文書2’、
文書3’、文書1’の順でランキングされている。
文字列を含んでいる。ここで、文書4’に含まれる文字
列のうち、日本語のキーワードと一致している「ソフ
ト」及び「開発」という文字列が強調表示されている。
ためのソフトを開発する」という文字列を含んでいる。
ここで、文書2’に含まれる文字列のうち、日本語のキ
ーワードと一致している「ソフト」及び「開発」という
文字列が強調表示されている。、文書3’は「経済開発
は軟着陸に」という文字列を含んでいる。ここで、文書
3’に含まれる文字列のうち、日本語のキーワードと一
致している「開発」という文字列が強調表示されてい
る。
を」という文字列を含んでいる。ここで、文書1’に含
まれる文字列のうち、日本語のキーワードと一致してい
る「開発」という文字列が強調表示されている。
は、強調表示する文字列を枠で囲む方法の他、強調表示
する文字列に下線を引く方法、強調表示する文字列のサ
イズや線の太さを他の文字列と比較して大きくする方
法、強調表示する文字列の色を他の文字列の色と相違さ
せる方法などを用いてもよい。
字列を強調表示することにより、検索者は、自分の意図
した文書が検索されてきたかどうかを容易に把握するこ
とが可能となり、キーワード検索を行う際の利便性を向
上させることが可能となる。
わる検索結果の出力方法を説明する図である。図28
(b)において、「ソフトの開発」という文字列が、検
索要求として入力されたものとする。この「ソフトの開
発」という文字列に対して、形態素解析を行うことによ
り、「ソフト」というキーワードと「開発」というキー
ワードが抽出される。さらに、「開発」というキーワー
ドについて同義語展開を行うことにより、「開発」とい
うキーワードの加えて、「構築」というキーワードも得
られる。そして、「ソフト」というキーワードに対して
日英変換を行うことにより、英語の“soft”という
キーワードと英語の“software”というキーワ
ードが得られ、「開発」というキーワードに対して日英
変換を行うことにより、英語の“develop”とい
うキーワードと英語の“development”とい
うキーワードが得られ、「構築」というキーワードに対
して日英変換を行うことにより、英語の“constr
uct”というキーワードと英語の“construc
tion”というキーワードが得られる。
より、英語の文書が検索され、検索された英語の文書を
英日変換することにより、日本語の文書が得られる。英
日変換された日本語の文書を、「ソフト」、「開発」及
び「構築」という日本語のキーワードと比較することに
より、日本語の文書1’、3’、4’、9’が文書
4’、文書9’、文書3’、文書1’の順でランキング
されている。
う文字列を含んでいる。ここで、文書4’に含まれる文
字列のうち、日本語のキーワードと一致している「ソフ
ト」及び「開発」という文字列が強調表示されている。
るためのソフトを構築する」という文字列を含んでい
る。ここで、文書9’に含まれる文字列のうち、日本語
のキーワードと一致している「ソフト」、及び「同義語
展開により生成されたキーワードと一致している「構
築」という文字列が強調表示されている。この際、「構
築」という文字列は、同義語展開により生成されたキー
ワードであることを明確にするため、「構築」という文
字列は「ソフト」という文字列と異なる態様で強調表示
されている。例えば、「開発」という文字列は枠で囲
み、「構築」という文字列は網掛けを行うことにより、
強調表示することができる。また、「開発」という文字
列と「構築」という文字列とを異なる色で表示させるよ
うにしてもよい。
う文字列を含んでいる。ここで、文書3’に含まれる文
字列のうち、日本語のキーワードと一致している「開
発」という文字列が強調表示されている。
を」という文字列を含んでいる。ここで、文書1’に含
まれる文字列のうち、日本語のキーワードと一致してい
る「開発」という文字列が強調表示されている。
ーワードを入力されたキーワードと区別して強調表示す
ることにより、幅広い範囲から検索されてきた文書が自
分の意図した文書に一致しているかを容易に把握するこ
とが可能となり、キーワード検索を行う際の利便性を向
上させることが可能となる。
索結果の出力方法を説明する図である。図29(a)に
おいて、「ソフトの開発」という文字列が、検索要求と
して入力されたものとする。この「ソフトの開発」とい
う文字列に対して、形態素解析を行うことにより、「ソ
フト」というキーワードと「開発」というキーワードが
抽出される。この抽出結果について、日英辞書検索を行
うことにより、英語のキーワードが生成され、この英語
のキーワードを用いることにより、図29(b)の英語
の文書1〜4が検索されたものとする。
develop”という文字列を含み、文書2は、
“software for processing
thegiven data is develope
d”という文字列を含み、文書3は、“soft la
ding economic developmen
t”という文字列を含み、文書4は、“the dev
elopment method for the s
oftware is”という文字列を含んでいる。
換により日本語の文書1’〜文書4’に変換される。文
書1’は、「開発のために低金利の融資を」という文字
列を含み、文書2’は、「与えられたデータを処理する
ためのソフトを開発する」という文字列を含み、文書
3’は、「経済開発は軟着陸に」という文字列を含み、
文書4’は、「ソフトの開発方法は」という文字列を含
んでいる。
という日本語の文字列と比較され、文書4’、文書
2’、文書3’、文書1’の順でランキングされる。こ
のランキング結果を検索者に提示する際、日本語の文書
1’〜文書4’を提示する代わりに、日本語の文書1’
〜文書4’を用いてランク付けした順序で、翻訳前の英
語の文書1〜文書4を提示する。
果を示す。図29(b)において、文書1〜文書4が、
文書4、文書2、文書3、文書1の順に並べて表示され
ている。この表示順序は、図29(a)の日本語の文書
1’〜文書4’を用いてランク付けした順序に一致して
いる。なお、この提示方法は、データ側形式から入力側
形式への変換の精度に問題があり、変換された日本語の
文書1’〜文書4’をそのまま提示することに支障があ
る場合に有効である。
書の検索方法について説明する。図30(a)は、本発
明の第1実施例に係わる多言語文書の検索方法を説明す
る図である。
いうキーワードが日本語で入力されたものとする。この
日本語のキーワードに基づいて、記述言語が英語のデー
タベースと、記述言語がフランス語のデータベースとを
検索するものとする。この場合、「ミッテラン」という
日本語のキーワードは、“Mitterand”という
アルファベットのキーワードに変換される。そして、こ
のアルファベットのキーワードを用いて英語で記述され
ているデータベースと、フランス語で記述されているデ
ータベースとを検索することにより、“Mittera
nd”という文字列を含む英語文書60a、60bと、
“Mitterand”という文字列を含むフランス語
文書61a、61bとが検索される。英語文書60a、
60b及びフランス語文書61a、61bが検索される
と、これらの文書の日本語への変換を行う。
わる多言語文書の変換方法を説明する図である。図30
(b)において、検索された英語文書60a、60b及
びフランス語文書61a、61bについての言語判定を
行う。この言語判定結果に基づいて、言語変換を行う変
換辞書や変換規則を選択し、英日変換及び仏日変換を行
う。この結果、英語文書60a、60b及びフランス語
文書61a、61bが、日本語文書62a〜62dに変
換される。日本語文書62a〜62dが得られると、日
本語文書62a〜62dの内容を「ミッテラン」という
日本語のキーワードと比較することにより、日本語文書
62a〜62dをランク付けする。
言語文書の表示結果を示す図である。図31において、
「ソフトの開発」という文字列が、検索要求として入力
されたものとする。この「ソフトの開発」という文字列
に対して、形態素解析を行うことにより、「ソフト」と
いうキーワードと「開発」というキーワードが抽出され
る。「ソフト」というキーワード及び「開発」というキ
ーワードは、英語及びフランス語に変換される。
ータベースを検索することにより、英文書が得られる。
変換で得られたフランス語のキーワードでフランス語デ
ータベースを検索することにより、フランス語文書が得
られる。この検索で得られた英文書及びフランス語文書
は日本語に翻訳され、翻訳結果が表示される。ここで、
英語データベースから検索された情報と、フランス語デ
ータベースから検索された情報とを分けて表示する。ま
た、どの言語のデータベースから検索されてきたかを示
す情報も表示する。
文字列を含む文書及び「ソフトの開発方法は」という文
字列を含む文書が、「英語データベースからの検索結果
の翻訳結果」と表示された欄の下に表示される。また、
「データを処理用のソフトを開発する」という文字列を
含む文書及び「開発用の低金利融資を」という文字列を
含む文書が、「フランス語データベースからの検索結果
の翻訳結果」と表示された欄の下に表示される。
分けて表示するとともに、データ側形式の情報に対応さ
せてデータ側形式の種別を表示することにより、検索者
は、表示されている情報の情報源を容易に把握すること
が可能となる。
言語文書の検索方法を説明する図である。図32におい
て、「ソフトの開発」という文字列が、検索要求として
入力されたものとする。この「ソフトの開発」という文
字列に対して、形態素解析を行うことにより、「ソフ
ト」というキーワードと「開発」というキーワードが抽
出される。
発」というキーワードとをそのまま用いて日本語のデー
タベースを検索することにより、日本語文書71g〜7
1jを得る。
て日英変換を行うことにより、英語の“soft”とい
うキーワードと英語の“software”というキー
ワードを生成する。「開発」というキーワードに対して
日英変換を行うことにより、英語の“develop”
というキーワードと英語の“development”
というキーワードを生成する。そして、これらの英語の
キーワードを用いることにより、英文書を検索し、検索
された英文書を英日変換することにより、日本語文書7
1a〜71fを得る。
「ソフト」及び「開発」という日本語のキーワードと、
これらの日本語文書71a〜71jとを比較することに
より、日本語文書71a〜71f及び日本語文書71g
〜71jを一緒にしてランキングする。
検索された多言語文書の検索結果を混ぜてランキングす
ることにより、より幅広い文書から情報収集を行うこと
ができる。
言語文書の検索方法を示すフローチャートである。図3
3において、まず、日本語で入力された文字列を受け付
ける(ステップS81)。
キーワードを抽出する(ステップS82)。次に、日本
語のキーワードを用いて、日本語で記述されているデー
タベースから日本語文書を検索する(ステップS8
3)。
ードに変換する(ステップS84)。次に、変換された
英語のキーワードを用いて、英語で記述されているデー
タベースから英語文書を検索する(ステップS85)。
う(ステップS86)。次に、検索された日本語文書及
び英日翻訳された日本語文書を統合する(ステップS8
7)。
ードを用いることにより、検索された日本語文書及び英
日翻訳された日本語文書を一緒に整理する(ステップS
88)。
言語文書の表示結果を示す図である。図34において、
「ソフトの開発」という文字列が、検索要求として入力
されたものとする。この「ソフトの開発」という文字列
に対して、形態素解析を行うことにより、「ソフト」と
いうキーワードと「開発」というキーワードが抽出され
る。
発」というキーワードをそのまま用いて日本語のデータ
ベースを検索することにより、「開発のために低金利の
融資を」という文字列を含む文書及び「与えられたデー
タを処理するためのソフトを開発する」という文字列を
含む文書が得られる。
て日英変換を行うことにより、英語の“soft”とい
うキーワードと英語の“software”というキー
ワードが生成される。「開発」というキーワードに対し
て日英変換を行うことにより、英語の“develo
p”というキーワードと英語の“developmen
t”というキーワードが生成される。これらの英語のキ
ーワードを用いることにより、英文書が検索される。そ
して、検索された英文書を英日変換することにより、
「経済開発は軟着陸に」という文字列を含む文書及び
「ソフトの開発方法は」という文字列を含む文書が得ら
れる。
字列を含む文書及び「与えられたデータを処理するため
のソフトを開発する」という文字列を含む文書は、「日
本語データベースからの検索結果」と表示された欄の下
に表示される。また、「経済開発は軟着陸に」という文
字列を含む文書及び「ソフトの開発方法は」という文字
列を含む文書は、「英語データベースからの検索結果の
翻訳結果」と表示された欄の下に表示される。
検索結果のデータ形式と検索要求のデータ形式とが異な
る場合においても、検索要求のデータ形式により検索結
果を評価することにより、検索要求のデータ形式を変換
することなしに、検索結果を整理することが可能となる
ことから、検索要求のデータ形式の変換に伴う揺れを排
除して、検索要求に忠実な検索を行うことが可能とな
る。
ータ形式でキー情報を抽出することにより、第2のデー
タ形式に変換してからキー情報の抽出を行う場合と比べ
て、データ変換に伴うデータの揺れの影響のない状態
で、キー情報の抽出を行うことが可能となり、検索要求
に忠実にキー情報を抽出することが可能となる。
ータ形式で検索要求を展開することにより、第2のデー
タ形式に変換してから展開を行う場合と比べて、データ
変換に伴うデータの揺れの影響のない状態で、展開を行
うことが可能となり、検索要求に忠実に展開することが
可能となる。
ータ形式で検索要求の論理演算を行うことにより、第2
のデータ形式に変換してから論理演算を行う場合と比べ
て、データ変換に伴うデータの揺れの影響のない状態
で、論理演算を行うことが可能となり、検索要求に忠実
に論理演算することが可能となる。
ータ形式に変換された変換結果を第1のデータ形式のキ
ー情報、展開結果、または演算結果と比較することによ
り、キー情報、展開結果、または演算結果のデータ形式
の変換を行うことなしに、検索結果を判別することが可
能となることから、データ変換に伴う検索要求のニュア
ンスの揺れを排除して、検索要求に忠実に検索結果を判
別することが可能となる。
の判別結果に基づいて、検索結果をランキングすること
により、検索結果を容易に選別することが可能となる。
また、本発明の一態様によれば、データベースからの検
索結果のデータ形式を検索要求のデータ形式に一致させ
ることにより、データベースに格納されているデータの
データ形式と異なる形式で、検索要求が入力された場合
においても、検索要求のデータ形式を変換することなし
に、検索要求と検索結果の変換結果とを直接比較するこ
とが可能となることから、検索要求を忠実に反映した検
索結果を抽出することが可能となる。
の記述言語を検索要求の記述言語に一致させることによ
り、入力されたキーワードの言語と、検索対象データベ
ースの記述言語とが異なる場合においても、検索対象デ
ータベースから検索された内容を、入力されたキーワー
ドの言語で判別することが可能となり、機械翻訳を介し
たデータの検索の正確性を向上させることが可能とな
る。
言語を自動的に判別することにより、検索対象データベ
ースの記述言語を検索要求側で認識することなしに、検
索対象データベースからの検索結果を検索要求側の言語
に変換することが可能となり、検索対象データベースか
らの検索結果を検索要求側の言語に基づいて判別するこ
とが可能となる。
ワードを含む文についてのみ、変換処理を行うことによ
り、検索要求に関係ない情報を除去してから変換処理を
行うことが可能となり、機械翻訳を介したデータの検索
の処理時間を短縮することが可能となる。
ワードを含む段落についてのみ、変換処理を行うことに
より、検索要求に関係ない情報を除去してから変換処理
を行うことが可能となり、機械翻訳を介したデータの検
索の処理時間を短縮することが可能となる。
に重みを付与することにより、展開結果に対応して複数
の検索結果が得られた場合、展開結果の内容に応じて検
索結果を容易に整理することが可能となる。
の変換結果に重みを付与することにより、検索要求の変
換結果に対応して複数の検索結果が得られた場合、検索
要求の変換結果の内容に応じて検索結果を容易に整理す
ることが可能となる。
から生成された複数の検索情報のそれぞれに基づいて検
索することにより、検索要求に関連する全ての情報を検
索することが可能となり、検索要求に対して漏れなく情
報を提示することが可能となる。
に得られる複数の候補のそれぞれに対応させて、データ
ベースの検索結果を変換することにより、データ形式の
変換の際に揺れが生じた場合においても、その揺れによ
り生成される全ての候補を提示することが可能となり、
データ形式の変換の際の揺れによる所望のデータの欠落
を防止して、検索精度を向上させることが可能となる。
索結果に対して変換結果を最大1つだけ選択することに
より、不要な検索結果を除いてから、検索結果を提示す
ることが可能となり、検索を効率的に行うことが可能と
なる。
に得られる複数の候補を、検索結果の中に択一的に埋め
込むことにより、データ形式の変換の際に揺れが生じた
場合においても、その揺れにより生成される全ての候補
を、同一の検索結果の中で提示することが可能となり、
検索精度を向上させることが可能となる。
と検索結果との関連度を入力側形式で算出することによ
り、検索要求を忠実に反映した検索結果を容易に選別す
ることが可能となる。
を表示する際に、入力キーワードと一致する部分を強調
表示することにより、検索結果と入力キーワードとの関
連性を直接認識することが可能となり、入力キーワード
と合致する検索結果を容易に見つけることが可能とな
る。
を表示する際に、入力キーワードに一致する部分と、入
力キーワードの展開結果に一致する部分とを各々区別し
て強調表示することにより、検索結果と入力キーワード
との関連性を幅広い範囲に渡って表示することができ、
入力キーワードと関連する検索結果を容易に見つけるこ
とが可能となる。
ースの検索と変換とを並列に処理することにより、デー
タ側形式から入力側形式への変換を文単位で行うことが
可能となり、全ての文が検索されるまで変換の開始を待
つ必要がなくなることから、処理を高速に行うことが可
能となる。
の整理は入力側形式で行い、検索結果の表示はデータ側
形式で行うことにより、データ形式の変換が正常に行わ
れないために、変換結果をそのまま提示することに支障
がある場合においても、ランキング処理は入力側形式で
行うことが可能となる。
形式でのランキング結果に基づいて、入力側形式でのラ
ンキングを行うことにより、データ側形式でのランキン
グにより得られた下位の検索結果については、データ形
式の変換を省略することが可能となり、データ変換を介
した検索処理に必要な全体の処理時間を短縮することが
可能となる。
式で記述された検索要求に基づいて、データ側形式の異
なる複数のデータベースを検索することにより、データ
ベースが様々なデータ形式で記述されている場合におい
ても、1つの検索要求に基づいて、これらのデータベー
スを一度に検索することが可能となるとともに、様々な
データ形式で記述された検索結果を、入力側形式で評価
することが可能となる。
ースから検索された検索結果に対応させて、データ形式
の種別を表示することにより、検索結果が入力側形式で
表示されている場合においても、検索元のデータ形式を
認識することが可能となる。
式で記述された検索要求に基づいて、入力側形式で記述
されたデータベース及びデータ側形式で記述されたデー
タベースの両方を検索することにより、検索要求に関連
するデータを幅広い範囲から検索して表示することが可
能となる。
式で記述された検索要求に基づいて、入力側形式で記述
されたデータベース及びデータ側形式で記述されたデー
タベースの両方を検索し、それらの検索結果を同一画面
に分けて表示することにより、幅広い範囲から検索され
たデータの検索元を容易に区別することが可能となる。
成を示すブロック図である。
する図である。
成を示すブロック図である。
フローチャートである。
報検索処理を示すフローチャートである。
フローチャートである。
情報検索処理を示すフローチャートである。
の関連度の算出方法を説明する図である。
テム構成を示すブロック図である。
語展開結果を示す図、(b)は、本発明の第1実施例に
係わる日英辞書検索結果を示す図、(c)は、本発明の
第1実施例に係わる英文書検索結果を示す図である。
翻訳結果を示す図、(b)は、本発明の第1実施例に係
わるランキング結果を示す図である。
ワード抽出結果を示す図、(b)は、本発明の第2実施
例に係わる日英辞書検索結果を示す図、(c)は、本発
明の第2実施例に係わる英文書検索結果を示す図であ
る。
翻訳結果を示す図、(b)は、本発明の第2実施例に係
わるランキング結果を示す図である。
ワード抽出結果を示す図、(b)は、本発明の第3実施
例に係わる同義語展開結果及び日英辞書検索結果を示す
図である。
を示す図である。
示す図である。
を示す図である。
結果の整理方法を説明する図である。
結果の整理方法を説明する図である。
結果の整理方法を説明する図である。
結果の整理方法を説明する図である。
方法を説明する図である。
方法を示すフローチャートである。
方法を説明する図である。
方法を示すフローチャートである。
方法を示すフローチャートである。
結果の出力方法を説明する図、(b)は、本発明の第2
実施例に係わる検索結果の出力方法を説明する図であ
る。
結果の出力方法を説明する図、(b)は、本発明の第4
実施例に係わる検索結果の出力方法を説明する図であ
る。
果のランキング方法を説明する図、(b)は、本発明の
第5実施例に係わる検索結果の出力方法を説明する図で
ある。
語文書の検索方法を説明する図、(b)は、本発明の第
1実施例に係わる多言語文書の変換方法を説明する図で
ある。
示結果を示す図である。
索方法を説明する図である。
索方法を示すフローチャートである。
示結果を示す図である。
Claims (35)
- 【請求項1】 第1のデータ形式の検索要求を入力する
入力手段と、 前記第1のデータ形式の検索要求に基づいて、第2のデ
ータ形式の検索情報を生成する生成手段と、 前記第2のデータ形式の検索情報に基づいて、第2のデ
ータ形式のデータを検索する検索手段と、 前記第2のデータ形式の検索結果を前記第1のデータ形
式に変換する変換手段と、 前記第1のデータ形式の検索要求に基づいて、前記第1
のデータ形式に変換された検索結果を評価する評価手段
とを備えることを特徴とする情報検索装置。 - 【請求項2】 前記生成手段は、前記検索要求から前記
第1のデータ形式のキー情報を抽出する抽出手段を備
え、前記キー情報に基づいて、前記第2のデータ形式の
検索情報を生成することを特徴とする請求項1に記載の
情報検索装置。 - 【請求項3】 前記生成手段は、前記検索要求を前記第
1のデータ形式で展開する展開手段を備え、前記展開結
果に基づいて、前記第2のデータ形式の検索情報を生成
することを特徴とする請求項1または2に記載の情報検
索装置。 - 【請求項4】 前記生成手段は、前記キー情報または前
記展開結果の論理演算を前記第1のデータ形式で行う演
算手段を備え、前記演算結果に基づいて、前記第2のデ
ータ形式の検索情報を生成することを特徴とする請求項
2または3に記載の情報検索装置。 - 【請求項5】 前記評価手段は、前記キー情報、前記展
開結果、または前記演算結果に基づいて、前記第1のデ
ータ形式に変換された検索結果を評価することを特徴と
する請求項2〜4のいずれか1項に記載の情報検索装
置。 - 【請求項6】 前記評価手段は、前記検索結果の評価結
果に基づいて、前記検索結果をランキングするランキン
グ手段を備えることを特徴とする請求項1〜5のいずれ
か1項に記載の情報検索装置。 - 【請求項7】 入力側形式で記述された検索要求を入力
する検索要求入力部と、 前記検索要求を入力側形式からデータ側形式へ変換する
第1の形式変換部と、 前記第1の形式変換部による変換結果に基づいて、デー
タベースの検索処理を行う検索処理部と、 前記データベースからの検索結果をデータ側形式から入
力側形式へ変換する第2の形式変換部と、 前記入力側形式で記述された検索要求に基づいて、前記
入力側形式に変換された検索結果を整理する検索結果整
理部と、 前記検索結果整理部により整理されたデータを表示する
検索結果表示部とを備えることを特徴とする情報検索装
置。 - 【請求項8】 前記入力側形式と前記データ側形式との
間の変換は、言語翻訳または辞書検索であることを特徴
とする請求項7に記載の情報検索装置。 - 【請求項9】 データ側言語を自動的に判別する言語判
別手段をさらに備え、 前記第2の形式変換部は、前記言語判別手段による判別
結果に基づいて、言語翻訳または辞書検索を行うことを
特徴とする請求項8に記載の情報検索装置。 - 【請求項10】 前記データベースの検索結果から、検
索キーワードを含む文を抽出する第1の抽出手段をさら
に備え、 前記第2の形式変換部は、前記第1の抽出手段により抽
出された文についてのみ処理を行うことを特徴とする請
求項8または9に記載の情報検索装置。 - 【請求項11】 前記データベースの検索結果から、検
索キーワードを含む段落を抽出する第2の抽出手段をさ
らに備え、 前記第2の形式変換部は、前記第2の抽出手段により抽
出された段落についてのみ処理を行うことを特徴とする
請求項8または9に記載の情報検索装置。 - 【請求項12】 前記検索要求を展開する展開部をさら
に備え、 前記第1の形式変換部は、前記展開部による展開結果を
入力側形式からデータ側形式へ変換することを特徴とす
る請求項7〜11のいずれか1項に記載の情報検索装
置。 - 【請求項13】 前記展開結果に重み付けを行う第1の
重み生成部をさらに備え、 前記検索結果整理部は、前記第1の重み生成部により生
成された重みに基づいて、前記入力側形式に変換された
検索結果を整理することを特徴とする請求項12に記載
の情報検索装置。 - 【請求項14】 前記第1の形式変換部の変換結果に重
み付けを行う第2の重み生成部をさらに備え、 前記検索結果整理部は、前記第2の重み生成部により生
成された重みに基づいて、前記入力側形式に変換された
検索結果を整理することを特徴とする請求項12に記載
の情報検索装置。 - 【請求項15】 前記第1の形式変換部の変換結果とし
て、複数の検索情報が生成された場合、前記検索処理部
は、前記検索情報のそれぞれに基づいて検索を行うこと
を特徴とする請求項7〜14のいずれか1項に記載の情
報検索装置。 - 【請求項16】 前記第2の形式変換部による変換結果
の要素について、複数の候補が生成される場合、前記第
2の形式変換部は、前記データベースからの検索結果
を、前記候補のそれぞれに対応させて変換することを特
徴とする請求項7〜15のいずれか1項に記載の情報検
索装置。 - 【請求項17】 前記検索結果整理部は、前記検索処理
部により検索された同一の検索結果に対し、前記第2の
形式変換部により複数の変換結果が生成された場合、前
記同一の検索結果に対して最大1つの変換結果を選択す
る選択部を備えることを特徴とする請求項7〜16のい
ずれか1項に記載の情報検索装置。 - 【請求項18】 前記第2の形式変換部による変換結果
の要素について、複数の候補が生成された場合、前記第
2の形式変換部は、前記データベースからの検索結果の
中に、前記複数の候補を展開することを特徴とする請求
項7〜17のいずれか1項に記載の情報検索装置。 - 【請求項19】 前記検索結果整理部は、前記入力側形
式で記述された検索要求の論理演算結果に基づいて、前
記入力側形式に変換された検索結果を整理することを特
徴とする請求項7〜18のいずれか1項に記載の情報検
索装置。 - 【請求項20】 前記検索結果整理部は、前記検索要求
と前記入力側形式に変換された検索結果との関連度を算
出する関連度算出手段を備え、前記関連度に基づいて、
前記入力側形式に変換された検索結果をランキングする
ことを特徴とする請求項7〜19のいずれか1項に記載
の情報検索装置。 - 【請求項21】 前記検索結果表示部は、前記入力側形
式に変換された検索結果のうち、前記検索要求と一致し
た部分を強調表示する第1の強調表示部を備えることを
特徴とする請求項4〜20のいずれか1項に記載の情報
検索装置。 - 【請求項22】 前記検索結果表示部は、前記入力側形
式に変換された検索結果のうち、前記検索要求と一致し
た部分及び前記検索要求の展開結果に一致した部分を各
々区別して強調表示する第2の強調表示部を備えること
を特徴とする請求項4〜21のいずれか1項に記載の情
報検索装置。 - 【請求項23】 前記検索処理部によるデータベースの
検索と、前記検索結果のデータ側形式から入力側形式へ
の変換とを並列に処理する並列処理部をさらに備えるこ
とを特徴とする請求項4〜22のいずれか1項に記載の
情報検索装置。 - 【請求項24】 前記検索結果表示部は、前記検索結果
整理部による整理結果に基づいて、データ側形式で表現
された検索結果を表示することを特徴とする請求項7〜
23のいずれか1項に記載の情報検索装置。 - 【請求項25】 入力側形式で記述された検索要求を入
力する検索要求入力部と、 前記検索要求を入力側形式からデータ側形式へ変換する
第1の形式変換部と、 前記第1の形式変換部による変換結果に基づいて、デー
タベースの検索処理を行う検索処理部と、 前記データベースからの検索結果を前記データ側形式で
ランキングする第1のランキング部と、 前記第1のランキング部によるランキング結果に基づい
て、上位の検索結果を抽出する抽出部と、 前記抽出部により抽出された検索結果をデータ側形式か
ら入力側形式へ変換する第2の形式変換部と、 前記入力側形式で記述された検索要求に基づいて、前記
入力側形式に変換された検索結果を整理する検索結果整
理部と、 前記検索結果整理部により整理されたデータを表示する
検索結果表示部とを備えることを特徴とする情報検索装
置。 - 【請求項26】 入力側形式で記述された検索要求を入
力する検索要求入力部と、 前記検索要求を入力側形式から第1のデータ側形式へ変
換する第1の形式変換部と、 前記検索要求を入力側形式から第2のデータ側形式へ変
換する第2の形式変換部と、 前記第1の形式変換部による変換結果に基づいて、第1
のデータベースの検索処理を行う第1の検索処理部と、 前記第2の形式変換部による変換結果に基づいて、第2
のデータベースの検索処理を行う第1の検索処理部と、 前記第1のデータベースからの検索結果を前記第1のデ
ータ側形式から入力側形式へ変換する第3の形式変換部
と、 前記第2のデータベースからの検索結果を前記第2のデ
ータ側形式から入力側形式へ変換する第4の形式変換部
と、 前記入力側形式で記述された検索要求に基づいて、前記
入力側形式に変換された前記第1のデータベースからの
検索結果を整理する第1の検索結果整理部と、 前記入力側形式で記述された検索要求に基づいて、前記
入力側形式に変換された前記第2のデータベースからの
検索結果を整理する第2の検索結果整理部と、 前記第1の検索結果整理部により整理されたデータ及び
前記第2の検索結果整理部により整理されたデータを表
示する検索結果表示部とを備えることを特徴とする情報
検索装置。 - 【請求項27】 前記検索結果表示部は、前記第1の検
索結果整理部により整理されたデータ及び前記第2の検
索結果整理部により整理されたデータのそれぞれに対応
させて、データ形式の種別を表示することを特徴とする
請求項26に記載の情報検索装置。 - 【請求項28】 入力側形式で記述された検索要求を入
力する検索要求入力部と、 前記検索要求を入力側形式からデータ側形式へ変換する
第1の形式変換部と、 前記入力側形式で記述された検索要求に基づいて、第1
のデータベースの検索処理を行う第1の検索処理部と、 前記第1の形式変換部による変換結果に基づいて、第2
のデータベースの検索処理を行う第2の検索処理部と、 前記第2のデータベースからの検索結果をデータ側形式
から入力側形式へ変換する第2の形式変換部と、 前記入力側形式で記述された検索要求に基づいて、前記
第1のデータベースからの検索結果と、前記入力側形式
に変換された前記第2のデータベースからの検索結果と
を整理する検索結果整理部と、 前記検索結果整理部により整理されたデータを表示する
検索結果表示部とを備えることを特徴とする情報検索装
置。 - 【請求項29】 前記検索結果表示部は、前記第1のデ
ータベースからの検索結果と、前記入力側形式に変換さ
れた前記第2のデータベースからの検索結果とを同一画
面に分けて表示することを特徴とする請求項28に記載
の情報検索装置。 - 【請求項30】 第1の言語で記述されたキーワードを
入力する入力部と、 前記第1の言語で記述されたキーワードを第2の言語に
変換する第1の変換部と、 前記第2の言語に変換されたキーワードに基づいて、第
2の言語で記述されたデータベースを検索する検索部
と、 前記データベースからの検索結果を前記第1の言語に変
換する第2の変換部と、 前記第1の言語で記述されたキーワードに基づいて、前
記第1の言語に変換された検索結果を評価する評価部と
を備えることを特徴とする情報検索装置。 - 【請求項31】 検索要求と異なるデータ形式のデータ
を検索する情報検索装置であって、 検索結果のデータ形式を検索要求のデータ形式に一致さ
せてから、前記検索結果を評価することを特徴とする情
報検索装置。 - 【請求項32】 第1のデータ形式のキー情報を入力す
るステップと、 前記キー情報を第2のデータ形式に変換するステップ
と、 前記キー情報の変換結果に基づいて、第2のデータ形式
のデータを検索するステップと、 前記検索結果を前記第1のデータ形式に変換するステッ
プと、 前記第1のデータ形式のキー情報に基づいて、前記第1
のデータ形式に変換された検索結果を評価するステップ
とを備えることを特徴とする情報検索方法。 - 【請求項33】 第1のデータ形式の入力キーワードに
基づいて、第2のデータ形式のデータベースを検索する
ステップと、 前記データベースから検索された検索結果を前記第1の
データ形式に変換するステップと、 前記第1のデータ形式に変換された検索結果を前記第1
のデータ形式の入力キーワードと比較するステップと、 前記比較結果に基づいて、前記検索結果の良否を判定す
るステップとを備えることを特徴とする情報検索方法。 - 【請求項34】 第1の言語で記述された入力キーワー
ドに基づいて、第2の言語で記述されたデータベースを
検索する情報検索方法であって、 前記データベースから検索された検索結果を前記第1の
言語に変換し、変換された検索結果を前記入力キーワー
ドと比較することにより、前記検索結果を評価すること
を特徴とする情報検索方法。 - 【請求項35】 第1のデータ形式の入力キーワードに
基づいて、第2のデータ形式のデータベースを検索する
機能と、 前記データベースから検索された検索結果を前記第1の
データ形式に変換する機能と、 前記第1のデータ形式に変換された検索結果を前記入力
キーワードと比較する機能と、 前記比較結果に基づいて、前記検索結果を評価する機能
とをコンピュータに実行させるプログラムを格納したコ
ンピュータ読み取り可能な記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02163198A JP3181548B2 (ja) | 1998-02-03 | 1998-02-03 | 情報検索装置及び情報検索方法 |
US09/145,969 US6602300B2 (en) | 1998-02-03 | 1998-09-03 | Apparatus and method for retrieving data from a document database |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02163198A JP3181548B2 (ja) | 1998-02-03 | 1998-02-03 | 情報検索装置及び情報検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11219368A JPH11219368A (ja) | 1999-08-10 |
JP3181548B2 true JP3181548B2 (ja) | 2001-07-03 |
Family
ID=12060426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP02163198A Expired - Fee Related JP3181548B2 (ja) | 1998-02-03 | 1998-02-03 | 情報検索装置及び情報検索方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6602300B2 (ja) |
JP (1) | JP3181548B2 (ja) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10541974B2 (en) | 1998-02-23 | 2020-01-21 | Transperfect Global, Inc. | Intercepting web server requests and localizing content |
US8489980B2 (en) * | 1998-02-23 | 2013-07-16 | Transperfect Global, Inc. | Translation management system |
JP2000298677A (ja) * | 1999-04-14 | 2000-10-24 | Canon Inc | 情報検索方法、情報検索装置および記憶媒体 |
JP3368237B2 (ja) * | 1999-04-14 | 2003-01-20 | キヤノン株式会社 | コード処理方法、端末装置及び記憶媒体 |
JP3376311B2 (ja) | 1999-04-14 | 2003-02-10 | キヤノン株式会社 | 情報提供方法および情報提供システム |
JP3327877B2 (ja) | 1999-04-14 | 2002-09-24 | キヤノン株式会社 | 情報提供方法、情報提供システム、端末装置および情報提供プログラムを格納した記憶媒体 |
JP3747133B2 (ja) | 1999-04-14 | 2006-02-22 | キヤノン株式会社 | 携帯端末及びその制御方法及びその記憶媒体 |
US6704727B1 (en) * | 2000-01-31 | 2004-03-09 | Overture Services, Inc. | Method and system for generating a set of search terms |
US7437669B1 (en) * | 2000-05-23 | 2008-10-14 | International Business Machines Corporation | Method and system for dynamic creation of mixed language hypertext markup language content through machine translation |
JP2001337980A (ja) * | 2000-05-29 | 2001-12-07 | Sony Corp | 電子番組ガイド検索方法及び電子番組ガイド検索装置 |
JP4025517B2 (ja) * | 2001-05-31 | 2007-12-19 | 株式会社日立製作所 | 文書検索システムおよびサーバ |
US7260570B2 (en) * | 2002-02-01 | 2007-08-21 | International Business Machines Corporation | Retrieving matching documents by queries in any national language |
US6952691B2 (en) | 2002-02-01 | 2005-10-04 | International Business Machines Corporation | Method and system for searching a multi-lingual database |
DE10213348A1 (de) * | 2002-03-26 | 2003-10-09 | Abb Research Ltd | System und Verfahren zur Informationssuche in multilingualen Wissensdatenbanken unter Verwendung eines multilingualen Fachvokabulars |
DE10213468A1 (de) * | 2002-03-26 | 2003-10-09 | Abb Research Ltd | Verfahren und System zur Informationssuche in multilingualen Wissensdatenbanken mit automatischer Übersetzung der Suchergebnisse |
JP2004005439A (ja) | 2002-03-28 | 2004-01-08 | Matsushita Electric Ind Co Ltd | コンテンツ検索装置およびコンテンツ検索方法 |
ATE330287T1 (de) * | 2002-04-12 | 2006-07-15 | Targit As | Verfahren zur verarbeitung von mehrsprachigen abfragen |
US7127463B2 (en) * | 2002-04-18 | 2006-10-24 | International Business Machines Corporation | Optimization of database network traffic based upon data-use analysis |
US7356523B2 (en) * | 2002-05-23 | 2008-04-08 | International Business Machines Corporation | Dynamic optimization of prepared statements in a statement pool |
US20050165642A1 (en) * | 2002-05-07 | 2005-07-28 | Gabriel-Antoine Brouze | Method and system for processing classified advertisements |
US20040006628A1 (en) * | 2002-07-03 | 2004-01-08 | Scott Shepard | Systems and methods for providing real-time alerting |
US20040024598A1 (en) | 2002-07-03 | 2004-02-05 | Amit Srivastava | Thematic segmentation of speech |
US8856093B2 (en) * | 2002-09-03 | 2014-10-07 | William Gross | Methods and systems for search indexing |
JP2004118740A (ja) * | 2002-09-27 | 2004-04-15 | Toshiba Corp | 質問応答システム、質問応答方法、質問応答プログラム |
US20040083104A1 (en) * | 2002-10-17 | 2004-04-29 | Daben Liu | Systems and methods for providing interactive speaker identification training |
JP2004178490A (ja) * | 2002-11-29 | 2004-06-24 | Oki Electric Ind Co Ltd | 数値情報検索装置 |
JP3920812B2 (ja) * | 2003-05-27 | 2007-05-30 | 株式会社東芝 | コミュニケーション支援装置、支援方法、及び支援プログラム |
US7854009B2 (en) | 2003-06-12 | 2010-12-14 | International Business Machines Corporation | Method of securing access to IP LANs |
US20050065774A1 (en) * | 2003-09-20 | 2005-03-24 | International Business Machines Corporation | Method of self enhancement of search results through analysis of system logs |
US8014997B2 (en) * | 2003-09-20 | 2011-09-06 | International Business Machines Corporation | Method of search content enhancement |
GB2407657B (en) * | 2003-10-30 | 2006-08-23 | Vox Generation Ltd | Automated grammar generator (AGG) |
US20050210042A1 (en) * | 2004-03-22 | 2005-09-22 | Goedken James F | Methods and apparatus to search and analyze prior art |
US7707142B1 (en) | 2004-03-31 | 2010-04-27 | Google Inc. | Methods and systems for performing an offline search |
US7664734B2 (en) | 2004-03-31 | 2010-02-16 | Google Inc. | Systems and methods for generating multiple implicit search queries |
US8631001B2 (en) * | 2004-03-31 | 2014-01-14 | Google Inc. | Systems and methods for weighting a search query result |
US9009153B2 (en) | 2004-03-31 | 2015-04-14 | Google Inc. | Systems and methods for identifying a named entity |
US7272601B1 (en) * | 2004-03-31 | 2007-09-18 | Google Inc. | Systems and methods for associating a keyword with a user interface area |
US20080040315A1 (en) * | 2004-03-31 | 2008-02-14 | Auerbach David B | Systems and methods for generating a user interface |
US7693825B2 (en) * | 2004-03-31 | 2010-04-06 | Google Inc. | Systems and methods for ranking implicit search results |
US8041713B2 (en) * | 2004-03-31 | 2011-10-18 | Google Inc. | Systems and methods for analyzing boilerplate |
JP3962763B2 (ja) * | 2004-04-12 | 2007-08-22 | 松下電器産業株式会社 | 対話支援装置 |
WO2005124599A2 (en) * | 2004-06-12 | 2005-12-29 | Getty Images, Inc. | Content search in complex language, such as japanese |
US7788274B1 (en) | 2004-06-30 | 2010-08-31 | Google Inc. | Systems and methods for category-based search |
US8131754B1 (en) | 2004-06-30 | 2012-03-06 | Google Inc. | Systems and methods for determining an article association measure |
US7711542B2 (en) * | 2004-08-31 | 2010-05-04 | Research In Motion Limited | System and method for multilanguage text input in a handheld electronic device |
JP4325577B2 (ja) * | 2005-03-25 | 2009-09-02 | 富士ゼロックス株式会社 | 翻訳装置およびプログラム |
JP4839813B2 (ja) * | 2005-12-09 | 2011-12-21 | 富士ゼロックス株式会社 | 情報処理システム及びプログラム |
JP4923604B2 (ja) * | 2006-02-13 | 2012-04-25 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP2008084070A (ja) * | 2006-09-28 | 2008-04-10 | Toshiba Corp | 構造化文書検索装置およびプログラム |
JP4930153B2 (ja) * | 2007-03-30 | 2012-05-16 | 富士通株式会社 | 文書検索システム、文書番号部分列取得装置、および文書検索方法 |
US8799307B2 (en) | 2007-05-16 | 2014-08-05 | Google Inc. | Cross-language information retrieval |
US7890493B2 (en) | 2007-07-20 | 2011-02-15 | Google Inc. | Translating a search query into multiple languages |
US8185377B2 (en) * | 2007-08-11 | 2012-05-22 | Microsoft Corporation | Diagnostic evaluation of machine translators |
JP5156456B2 (ja) * | 2008-03-31 | 2013-03-06 | 株式会社日立製作所 | 文書評価支援方法及びシステム |
JP2010055235A (ja) * | 2008-08-27 | 2010-03-11 | Fujitsu Ltd | 翻訳支援プログラム、及び該システム |
KR20120113654A (ko) * | 2009-06-01 | 2012-10-15 | 알까뗄 루슨트 | 텍스트/멀티미디어 메시지에 삽입된 광고의 관리 |
EP2341450A1 (en) * | 2009-08-21 | 2011-07-06 | Mikko Kalervo Väänänen | Method and means for data searching and language translation |
US8862595B1 (en) | 2010-11-23 | 2014-10-14 | Google Inc. | Language selection for information retrieval |
JP5910867B2 (ja) * | 2012-03-13 | 2016-04-27 | 日本電気株式会社 | 文書内の図情報を利用した類似文書の検索システム及び方法 |
US11087098B2 (en) * | 2018-09-18 | 2021-08-10 | Sap Se | Computer systems for classifying multilingual text |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5301109A (en) * | 1990-06-11 | 1994-04-05 | Bell Communications Research, Inc. | Computerized cross-language document retrieval using latent semantic indexing |
US5278980A (en) * | 1991-08-16 | 1994-01-11 | Xerox Corporation | Iterative technique for phrase query formation and an information retrieval system employing same |
US5675815A (en) * | 1992-11-09 | 1997-10-07 | Ricoh Company, Ltd. | Language conversion system and text creating system using such |
EP0672989A3 (en) * | 1994-03-15 | 1998-10-28 | Toppan Printing Co., Ltd. | Machine translation system |
US5987402A (en) * | 1995-01-31 | 1999-11-16 | Oki Electric Industry Co., Ltd. | System and method for efficiently retrieving and translating source documents in different languages, and other displaying the translated documents at a client device |
EP0856175A4 (en) * | 1995-08-16 | 2000-05-24 | Univ Syracuse | SYSTEM AND METHOD FOR RETURNING MULTI-LANGUAGE DOCUMENTS USING A SEMANTIC VECTOR COMPARISON |
JP2987099B2 (ja) * | 1996-03-27 | 1999-12-06 | 株式会社日立国際ビジネス | 文書作成支援システム及び用語辞書 |
US6055528A (en) * | 1997-07-25 | 2000-04-25 | Claritech Corporation | Method for cross-linguistic document retrieval |
AU9513198A (en) * | 1997-09-30 | 1999-04-23 | Ihc Health Services, Inc. | Aprobabilistic system for natural language processing |
US5966719A (en) * | 1997-11-20 | 1999-10-12 | Microsoft Corporation | Method for inserting capitalized Latin characters in a non-Latin document |
-
1998
- 1998-02-03 JP JP02163198A patent/JP3181548B2/ja not_active Expired - Fee Related
- 1998-09-03 US US09/145,969 patent/US6602300B2/en not_active Expired - Lifetime
Non-Patent Citations (4)
Title |
---|
平川秀樹、住田一男、竹田公人、「WWWブラウジングのための言語処理とヒューマンインタフェース」,東芝レビュー Vol.52,No.9(平成9年9月1日),pp.15−18 |
福島俊一、木村一至、「インターネットドキュメント検索」,NEC技報(平成8年7月30日),pp.40−44 |
菊井玄一郎、「インターネットと多言語情報処理」,情報処理Vol.38,No.1(平成9年1月15日),pp.1−8 |
菊井玄一郎、鷲崎誠司、林良彦、砂場倫太郎、「インターネット情報ナビゲーションにおける多言語機能」,情処シンポジウム論文集Vol.95,No.6(自然言語処理の応用に関するシンポジウム)(平成7年10月19日),pp.97−105 |
Also Published As
Publication number | Publication date |
---|---|
US20020007384A1 (en) | 2002-01-17 |
US6602300B2 (en) | 2003-08-05 |
JPH11219368A (ja) | 1999-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3181548B2 (ja) | 情報検索装置及び情報検索方法 | |
JP2742115B2 (ja) | 類似文書検索装置 | |
US6662152B2 (en) | Information retrieval apparatus and information retrieval method | |
JP3695191B2 (ja) | 翻訳支援装置及びその方法並びにコンピュータ可読記録媒体 | |
JP5011751B2 (ja) | 訳語情報出力処理プログラム,処理方法および処理装置 | |
US20060206481A1 (en) | Question answering system, data search method, and computer program | |
JPH1145241A (ja) | かな漢字変換システムおよびそのシステムの各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US20050203900A1 (en) | Associative retrieval system and associative retrieval method | |
JP3231004B2 (ja) | データベースアクセス装置およびその方法 | |
JP3372532B2 (ja) | 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体 | |
JP3198932B2 (ja) | 文書検索装置 | |
JP2004029906A (ja) | 文書検索装置および方法 | |
JPH1145261A (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH1145268A (ja) | 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2000163441A (ja) | 辞書作成方法及び装置及び辞書作成プログラムを格納した記憶媒体及び検索要求作成方法及び装置及び検索要求作成プログラムを格納した記憶媒体及び多言語対応情報検索システム | |
US20030009490A1 (en) | Information processing apparatus, information processing method, recording medium, program, and electronic-publishing-data providing system | |
JP2005158044A (ja) | 情報検索プログラム、当該プログラムを格納するコンピュータ読み取り可能な記録媒体、情報検索方法、および情報検索装置 | |
JPH10207896A (ja) | 検索用語拡張方法及び装置及び情報検索方法及び装置 | |
JP2009059290A (ja) | 外国語文書作成支援装置、外国語文書作成支援方法および外国語文書作成支援プログラム | |
JPH1145249A (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3210842B2 (ja) | 情報処理装置 | |
JP2000339342A (ja) | 文書検索方法および文書検索装置 | |
JPH08249346A (ja) | 文書検索装置及び文書生成方法 | |
JP4390039B2 (ja) | 検索システムおよびその方法 | |
JPH10149364A (ja) | 訳語選択装置と記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010410 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080420 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090420 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090420 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100420 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110420 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110420 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120420 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130420 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140420 Year of fee payment: 13 |
|
LAPS | Cancellation because of no payment of annual fees |