[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP3625054B2 - Technical document retrieval device - Google Patents

Technical document retrieval device Download PDF

Info

Publication number
JP3625054B2
JP3625054B2 JP2000363384A JP2000363384A JP3625054B2 JP 3625054 B2 JP3625054 B2 JP 3625054B2 JP 2000363384 A JP2000363384 A JP 2000363384A JP 2000363384 A JP2000363384 A JP 2000363384A JP 3625054 B2 JP3625054 B2 JP 3625054B2
Authority
JP
Japan
Prior art keywords
document
search
technical
similarity
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000363384A
Other languages
Japanese (ja)
Other versions
JP2002163275A (en
Inventor
泰樹 飯塚
光昭 稲葉
祐司 菅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2000363384A priority Critical patent/JP3625054B2/en
Publication of JP2002163275A publication Critical patent/JP2002163275A/en
Application granted granted Critical
Publication of JP3625054B2 publication Critical patent/JP3625054B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、特許文献や技術論文などの技術文書を検索する技術文書検索装置に関し、特に、的確な検索が可能であり、また、検索結果を分かり易く表示することができる装置を実現するものである。
【0002】
【従来の技術】
特許文献や技術論文の数は、既存の発行分だけでも膨大な量に達しており、今後も増え続けることが確実である。これらの技術文献を有効に利用するためには、目的の分野の文書を的確に選択することができる検索手段を持つことが不可欠である。
【0003】
文書の検索には、従来から、キーワード検索や、ベクトル空間法を用いて検索質問に類似する文書を検索する方法などが知られている。
【0004】
図20は、従来の文書検索装置の構成を示している。この装置は、検索条件を入力し、検索結果を出力する入出力手段11と、技術文書が格納された文書実体格納手段14と、技術文書の検索用インデックスが格納されたインデックス格納手段13と、検索用インデックスを用いて技術文書を検索する検索手段12とを備えている。
【0005】
このインデックス格納手段13には、文書実体格納手段14に格納された各技術文書のインデックスとして、各技術文書から抽出されたキーワードやベクトルデータ、辞書などが格納されている。
【0006】
入出力手段11から検索条件式や検索質問が入力されると、検索手段12は、インデックス格納手段13に格納されたインデックスを用いて、検索条件式に合致する文書や、検索質問に類似する文書を検索し、検索結果が入出力手段11を通じて表示される。検索結果の文書実体は、入出力手段11からの選択操作に応じて文書実体格納手段14から読み出されて表示される。
【0007】
また、検索した特許文献を分かり易く示すため、従来から、特許マップによる表示が行われている。
【0008】
図19は、特許マップの一例を示している。この例は、パソコン用インクジェットプリンタに関する特許マップであり、このプリンタの構成要素の関係、各構成要素ごとの関連する特許文献の番号及びキーワード、特許文献の抽出年代、特許分類などが記述され、また、特許文献については、出願人と技術評価を示す記号とが表示されている。
【0009】
こうした特許マップの作成を支援する装置が特開平7−182356号に記載されている。この装置では、あらかじめ決めておいたキーワード、特許分類、年代などに従って特許文献が自動的に分類される。
【0010】
また、特開平8−221435号には、特許マップで表示する特許文献を自動更新するシステムが記載されている。このシステムでは、クライアント端末から特許データベースサーバに予め検索キーを送ることにより、特許データベースが更新された時、更新範囲の特許データが検索キーで検索され、検索結果がクライアント端末に送られて、クライアント端末の特許マップ用データベースに追加される。
【0011】
このように、検索された特許文献が表示された特許マップは、技術動向や権利関係を把握するための資料として広く利用されている。
【0012】
また、検索した特許文献の文書集合を出願年代別の件数でグラフ表示して、該当する技術分野の出願動向を表すことも広く行われている。また、特開平7−182356号には、特許文献や技術情報を、利用分野、要素技術、発行時期などのデータと合わせてデータベースに蓄積し、このデータベースの検索結果を、利用分野軸、要素技術軸、時間軸を座標軸とした技術情報空間に表示する方法が開示されている。
【0013】
【発明が解決しようとする課題】
しかし、キーワードによる技術文書の検索では、関連する文書であっても、全く新しい概念の技術文書や、キーワードに指定した単語以外の単語を使って記述されている技術文書については、検索から漏れたり、正しく分類できない可能性がある。
【0014】
また、技術用語には、例えば「フィルター」が、電気分野では、信号の周波数範囲を制限する回路部品の意味を持ち、機械分野では、液体から懸濁粒状物を分離する多孔性物質の意味を持ち、また、光学分野では、光量を制限する光学部品を表すように、同じ用語であっても、技術分野で異なる意味に使用されるものが少なくない。そのため、技術文書のキーワード検索では、キーワードを適切に選定しないと、検索結果に大量のノイズが含まれる場合がある。
【0015】
また、検索された技術文献を各種の視点から整理して表示する装置は、前述した特開平7−182356号などに記載されているが、検索された技術文献の相互間の関連性に着目し、技術文献同士の関係を表示する装置は、これまで作られていない。
【0016】
本発明は、こうした従来の問題点を解決するものであり、技術文書の検索や分類を効率的、且つ、的確に行うことができ、また、検索した技術文書同士の相互間の関係を明示することができる技術文書検索装置を提供することを目的としている。
【0017】
【課題を解決するための手段】
そこで、本発明では、書誌事項を含む特許文献や技術論文などの技術文書を検索する技術文書検索装置において、検索手段と、技術文書の書誌事項から検索式を生成する検索式合成手段と、技術文書間の類似度を判定する文書類似度判定手段とを設け、前記検索式合成手段が、元になる技術文書の書誌事項から検索式を生成し、前記検索手段が、前記検索式合成手段によって生成された検索式を用いて検索を実行し、前記文書類似度判定手段が、前記検索手段によって検索された技術文書と元の技術文書との書誌事項を除く部分の類似度を判定し、前記検索された技術文書と元の技術文書との関係を、前記類似度が視覚的に分かるように表示するようにしている。
【0021】
そのため、この装置では、技術マップの情報を用いて、検索結果を適切に分類することができる。
【0022】
また、技術マップに記載されている技術文書との類似度に基づいて、検索結果を絞り込むことができる。
【0023】
また、書誌事項に含まれる発明者や出願人を共通にする技術文書の関係を表示したり、参照関係にある技術文書の関係を表示したりすることができる。
【0024】
【発明の実施の形態】
(第1の実施形態)
第1の実施形態では、従来、技術文献の検索結果を表示するために用いられていた特許マップの情報を、検索した特許文献を分類するために使用する技術文書検索装置について説明する。
【0025】
この装置は、図1に示すように、検索条件を入力し、検索結果を出力する入出力手段11と、特許文献が格納された文書実体格納手段14と、特許文献の検索用インデックスが格納されたインデックス格納手段13と、検索用インデックスを用いて特許文献を検索する検索手段12と、特許文献の文書ベクトルを分析する分析手段15と、これまでに作成された複数の特許マップが蓄積されている技術マップ群蓄積手段17と、技術マップ群蓄積手段17からた読み出され特許マップを記憶する技術マップ格納手段18と、文書ベクトルを用いて特許文献相互間の類似度を判定する文書類似度判定手段16とを備えている。
【0026】
技術マップ群蓄積手段17に格納された各特許マップは、図2に示すように、ツリー状のデータ構造を備えており、この例では、パソコン用インクジェットプリンタの制御部、計算機インタフェース、プリント部などの各構成要素ごとに、検索キーワードや重要特許一覧のデータが記述されている。この特許マップを画面表示した場合には、例えば図19のように表示される。
【0027】
利用者は、この技術文献検索装置を使うに当たり、自分がこれから使う特許マップを入出力手段11で指定する。指定された特許マップは、技術マップ群蓄積手段17から読み出されてマップ格納手段18に格納される。
【0028】
次に、利用者は、好きなキーワードを入力して特許文献を検索する。検索手段12は、インデックス格納手段13に格納されたインデックスを用いて、キーワードに合致する文書を検索し、検索結果が入出力手段11を通じて表示される。図3は、「カラー*高速」をキーワードに用いて特許文献を検索したときの検索結果の表示画面を示している。ここでは2000件の検索結果が得られている。
【0029】
このように検索結果が多数得られたとしても、表示画面の「分類表示」ボタンを押すことによって、図4に示すように、その検索結果が特許マップの構成図ごとに分類されて表示される。
【0030】
入出力手段11から「分類表示」が入力されたとき、装置内部では、検索結果の特許文献の各々と、特許マップの構成要素ごとに記載されている特許文献との類似度が計算され、検索結果の特許文献が、最も類似する構成要素の部分に分類される。この類似度の判定は、ベクトル空間法などの公知の技術を用いて行う。
【0031】
この処理は、次のような手順で行われる。
▲1▼分析手段15は、特許マップの構成要素ごとに記載されている各特許文書の文書ベクトルを計算する(これは、あらかじめ計算しておいてもよい)。
▲2▼分析手段15は、検索結果の特許文献一つを取り出し、この特許文献の文書ベクトルを計算する。
▲3▼文書類似度判定手段16は、特許マップ中の各構成要素の特許文献の文書ベクトルと、検索結果の特許文献の文書ベクトルとを比較し、類似度が最も大きい、一番近いところに分類する。(どこにも似ていなかったら「その他」に分類する。また、文書空間全体からみて、あまりにも違っている場合は、「関連しない」という所に分類することで、その検索結果を捨てる)
▲4▼次の検索結果の特許文献を取り出し、▲2▼からの処理を繰り返す。次の検索結果の特許文献がなければ終了する。
このように、この技術文書検索装置では、特許マップの情報を利用して、検索した特許文献を分類して表示することができる。
【0032】
なお、この装置では、検索結果の特許文献と、特許マップに記載されている特許文献との類似度を比較する場合、文書全体についての文書ベクトルを計算して比較したが、文書の一部を取り出して比較するように構成することもできる。
【0033】
この場合の装置は、図5に示すように、特許文献の記載箇所の一部を抽出する部分文書抽出手段19を設ける。その他の構成は図1の装置と変わりがない。
【0034】
部分文書抽出手段19は、類似度を計算する際に、検索結果の特許文献、及び、特許マップの特許文献の各々から「従来の技術」の記載箇所を取り出す。分析手段15は、この「従来の技術」の文書ベクトルを計算し、文書類似度判定手段16は、検索結果の特許文献における「従来の技術」の文書ベクトルを、特許マップ中の特許文献における「従来の技術」の文書ベクトルと比較し、一番近いところに分類する。
【0035】
特許文献は非常に長く、最大のデータ量を占める「実施の形態」には、各種の実施例や比較例など、多様な内容が含まれる場合がある。そのため、特許文献全体を対象として類似度を比較すると、処理負担が大きいだけで無く、分類の精度が低下する場合もあり得る。
【0036】
その点、「従来の技術」には、これまで何が問題で何を改善したかが強調して記述されるため、この「従来の技術」だけの文書ベクトルを作成し、相互に比較することにより分類が可能になる。
【0037】
また、同様に、部分文書抽出手段19により特許文献の「発明が解決しようとする課題」を抽出し、この部分の文書ベクトルを比較して分類するようにしてもよい。
【0038】
また、技術論文の場合は、過去の文献を参照している部分を中心に抜き出し、ここの部分だけから文書ベクトルを作成し、比較分類する。技術論文の場合は、特許文献と異なり、形式が自由であるため、特定の部分を抽出することは難しいが、過去の文献を参照している部分の周辺は、従来の技術についての記述部分と考えられるため、過去の文献の記述箇所を目安に、従来技術の記述部分を抜き出して分類することができる。
【0039】
このように、この技術文献検索装置では、少ない処理負担で、分類の精度を高めることが可能である。
【0040】
また、この技術文献検索装置に、図6に示すように、類似度を絡めた表示データを合成する表示合成手段20を設けることにより、検索結果の特許文献を、技術空間に類似度を表す大きさの点で表示することができる。
【0041】
この装置は、検索結果を示す図3の表示画面の「多次元分類」ボタンを押すと、図7に示すように、書誌事項(出願人など)、時間(出願日など)、及び構成要素を軸とする多次元空間に、検索結果の特許文献の位置を表す点を表示する。このとき、表示合成手段20は、検索結果の特許文献を表す点の大きさを、文書類似度判定手段16が計算した類似度の大きさに対応させて表示する。
【0042】
利用者が、この分類表示された点をマウスでクリックすると、該当する特許文献が文書実体格納手段14から読み出されて、その内容が表示される。また、内容を表示しているときに、「特許マップに追加」ボタンをクリックすると、その特許文献が特許マップに追加される。従って、利用者は、多次元空間の点の大きさを目安に特許マップに追加する特許文献を選択することができる。
【0043】
このように、この技術検索装置では、特許マップ作成支援の機能を有しており、特許マップに登録する特許文献の更新を容易に実施することができる。
【0044】
なお、ここでは、特許文献の表示点の大きさを類似度によって差別化する場合について説明したが、類似度に応じて点の色や形状を差別化するようにしても良い。
【0045】
(第2の実施形態)
第2の実施形態では、従来、技術文献の検索結果を表示するために用いられていた特許マップの情報を、特許文献の検索数を絞り込むために使用する技術文書検索装置について説明する。
【0046】
この装置は、図8に示すように、利用者が設定した検索式に特許マップのキーワードを加えた検索式を合成する検索式合成手段21を備えている。その他の構成は第1の実施形態の図6と変わりがない。
【0047】
この装置の技術マップ群蓄積手段17には、あらかじめ作成された特許マップが蓄積されている。利用者は、この技術文書検索装置を使うに当たり、自分がこれから使う特許マップを指定する。指定された特許マップは、技術マップ群蓄積手段17から読み出され、技術マップ格納手段18に格納される。
【0048】
次に、利用者は、入出力手段11から好きなキーワードを入力して特許文献を検索する。入出力手段11からキーワードが入力されると、検索式合成手段21は、利用者から指定されたキーワード以外に、特許マップで指定された基本キーワードや書誌事項(IPC分類など)を加えて検索式を自動的に組み立て、検索手段12は、この検索式を用いて検索を実施する。文書類似度判定手段16は、検索結果の特許文献と特許マップに記載されている特許文献との類似度を判定し、類似度が極めて低いものを除いて(この判定はあまり狭めない、類似度をある程度広くとる)検索結果を表示する。
【0049】
例えば、利用者が「FAXサーバ装置」に関する特許を検索したいとする。いままでの検索装置で
「(FAX+ファクシミリ+ファックス)*制御*画像*通信*圧縮」
などと検索すると、目的とするFAXサーバ関連特許以外にNC制御装置(工作機械数値制御装置)の特許が膨大に検索されてしまう。利用者はIPC分類で絞り込むほか、NCなどの単語をNOT演算子で指定して少しずつ絞り込まなければならず、これは特許分野ごとにノウハウが必要であった。
【0050】
この技術文書検索装置では、利用者があらかじめFAXサーバ装置に関する特許マップを持っていれば、その特許マップを指定しただけでFAXサーバ装置の特許が検索できる。
【0051】
また、「カラー」とだけキーワードを指定した場合、通常の検索装置では、カラーテレビからカラーフィルムから、あらゆるものが検索され、その数は膨大な量に達するが、この技術文書検索装置の場合には、カラーFAXに関係したFAXサーバ装置の特許文献だけを検索することができる。
【0052】
このように、この技術文書検索装置は、特許マップを用いて検索条件を合成することにより、効率的、且つ、正確な技術文書の検索が可能になる。
【0053】
(第3の実施形態)
第3の実施形態では、書誌事項に共通性を持つ特許文献を検索し、相互間の関係を表示する技術文書検索装置について説明する。
【0054】
この装置は、図9に示すように、特許文献の書誌事項を抽出する書誌事項抽出手段22と、書誌事項から検索式を合成する検索式合成手段21と、検索された特許文献の間の関係を記憶する文書関係記憶手段23とを備えている。その他の構成は第1の実施形態の図1と変わりがない。
【0055】
利用者は、何らかのキーワードを入出力手段11から入力して特許文献を検索する。その結果、図11の画面例に示すように、ある程度の数の特許文書が検索されたとする。そのうちの1件が、探していた特許文書に相当するものであったとする。そこで、利用者は、この特許文献(元特許文献と云う)に類似する特許文書を見ようとする。以降の手順を図10のフロー図に示している。
【0056】
ステップ1:利用者は、図12に示すように、画面上で文書を選択し、「類似書誌検索」ボタンを押す。すると、この技術文書検索装置の書誌事項抽出手段22は、選択された元特許文献から発明者と出願人とを抽出する。出願人として「出願人A」の名前が、発明者として「発明者1」「発明者2」「発明者3」の3人の名前が抽出されたとする。
【0057】
ステップ2:検索式合成手段21は、
出願人A*発明者1+出願人A*発明者2+出願人A*発明者3
という検索式を組み立てる。
ステップ3:検索手段12は、この検索式で検索を行う。その結果、50件の検索結果が得られたとする。
ステップ4:文書類似度判定手段16は、この得られた50件全てに対して、元特許文献との類似度を計算する。類似度が、あらかじめ決めておいた閾値以上の場合、すなわち、ある程度似ていたら、結果として残すが、それ以外の(似ていない)検索結果は捨てる。
ステップ5:残った検索結果を文書関係記憶手段23に格納し、これを、時間順(出願順)、または類似度順、あるいは時間順で類似度順にソートして出力表示する。
【0058】
こうして、図13に示すように、出願人及び発明者が共通する特許文献の相互間の類似度を時間軸上に表示することができる。
【0059】
このように、この装置では、元文書から、一部の書誌事項だけ抜き出し、その抽出した書誌事項から検索式を合成し、この検索式で検索を実施し、得られた検索結果から類似のものを探し、類似のものだけを整列して表示することにより、書誌事項が共通する特許文献の相互間の関係を表示することができる。
【0060】
(第4の実施形態)
第4の実施形態では、参照関係にある特許文献を検索し、相互間の関係を表示する技術文書検索装置について説明する。
【0061】
この装置は、図14に示すように、特許文献中で参照している文献を抽出する関連文書抽出手段24と、検索された特許文献の間の関係を記憶する文書関係記憶手段23と、参照関係にある特許文献を関連付けて表示する表示合成手段20とを備えている。その他の構成は第1の実施形態の図1と変わりがない。
【0062】
利用者は、何らかのキーワードを入出力手段11から入力して特許文献を検索する。その結果、図11の画面例に示すように、ある程度の数の特許文書が検索され、そのうちの1件が、探していた特許文書に相当するものであったとする。そこで、利用者は、この特許文献(種特許文献と云う)に類似する特許文献を見ようとする。以降の手順を図15のフロー図に示している。
【0063】
ステップ11:利用者は、画面上で種特許文献を選択し、「参照文献検索」ボタンを押す。
ステップ13:技術文書検索装置の関連文書抽出手段24は、種特許文献から、種特許文献で引用されている参照文書名を(複数)抽出する。これを親特許文献と呼ぶ。
ステップ14:文書関係記憶手段23は、種特許文書と親特許文献との関係を記憶する。
ステップ15:親特許文献を文書実体格納手段14から取得し、
ステップ16:その親特許文献を種とし、ステップ13〜ステップ16を繰り返し、最初の種特許文献からN世代(Nは指定できる)遡るまで繰り返す。
【0064】
ステップ17:最初の種特許文献を再び種特許文献に設定し、
ステップ19:この種特許文献を参照している特許文献を、文書実体格納手段14に格納された特許文献を全文検索して検索する。
ステップ20:文書関係記憶手段23は、検索された結果(子特許文献)と種特許文献との関係を記憶する。
ステップ21:全ての子特許文献について、これを種とし、ステップ19〜ステップ21をM世代(Mは指定可能)後まで繰り返す。
ステップ22:表示合成手段20は、ステップ14及びステップ20で文書関係記憶手段23に記憶された文書間の関係を表示する。
図16、図17は、こうして表示された画面の一例を示している。
【0065】
なお、文献中で参照している文書名の抽出は、特許文献ならば「特公平11−12345」などのように形式的に記述されているので、計算機が容易に認識可能である。また、論文の場合は、参照文献が文末に、
[8]飯塚泰樹, 接続確立最小法による単語分割, 200−NL−139,pp11,2000
などのように形式的に記述されているため、この記述部分から計算機が容易に認識できる。
【0066】
また、子特許文献(子供)を探す時は、種特許文献(自分)の特許公開番号をもとにデータベースを全文検索すれば、種特許文献(自分)を参照している子特許文献(子供)を検索することは可能である。
【0067】
また、兄妹の子供(甥)に当たる文献を検索するかどうか、親をどこまで遡るか(N世代、あるいはX年前)、子供をどこまで辿るか(M世代、あるいは現在までの全て)、などについては、選択できるようにする。
【0068】
また、より多くの文書から参照されている文書(子供が多い文書)は、表示する時に特に色をつけるなどして強調表示するようにしても良い。これは、子供が多いということは、より重要であるということを示しており、それを明示するためである。
【0069】
また、図16、図17では、説明のために特許公開番号しか表示していないが、公開番号以外に、名称、出願人などの表示を選択できるようにしたり、あるいは、図18に示すように、図中の公開番号の位置にマウスポインタを置いたときだけ、その書誌事項や要約内容がポップアップ表示されるように構成しても良い。
【0070】
また、図16、図17の特許公開番号のボックスをダブルクリックすると、すぐにその特許文献を閲覧できるようにすることも可能である。また、閲覧している特許文献に参照特許(親特許)番号が記されている部分があると、そこだけ反転表示(あるいは色付き表示)し、そこをクリックすると参照特許(親特許)を表示するように構成しても良い。
関係する特許文献の間の類似度を文書類似度判定手段で判定し、この類似度が視覚的に分かるように表示するようにしても良い。
【0071】
このように、この技術文書検索装置では、文書間の参照関係を検索し、その文書間の関係を画面上に表示することができる。この画面を閲覧することにより、技術体系や技術動向などを簡単に把握することができる。
【0072】
なお、実施形態では、特許文献の検索を中心に説明したが、本発明の技術文書検索装置は、技術論文などを対象とすることもできる。
【0073】
【発明の効果】
以上の説明から明らかなように、本発明の技術文書検索装置は、特許マップなどの技術マップを検索に使うことにより、利用者が難しい指定をしなくても簡単に自分の欲する検索結果を得ることができる。
【0074】
また、この検索結果を基に、技術マップに登録すべき技術文書を的確、且つ、簡便に識別することができ、技術マップのデータを正確に更新することが可能になる。その結果、技術動向をより簡単、且つ、的確に把握できるようになる。
【0075】
また、本発明の技術文書検索装置では、文書間の繋がりを検索して表示できるため、利用者は技術体系や技術動向を容易に把握することができ、また、この繋がりから関連文書を探すことにより、検索漏れを減らし、より簡単、且つ、正確に文書検索を行うことが可能になる。
【図面の簡単な説明】
【図1】第1の実施形態の技術文書検索装置の構成を示すブロック図、
【図2】特許マップのデータ構成を示す図、
【図3】第1の実施形態の技術文書検索装置の検索結果画面を示す図、
【図4】第1の実施形態の技術文書検索装置の特許マップ分類表示画面を示す図、
【図5】第1の実施形態の技術文書検索装置の他の構成を示すブロック図、
【図6】第1の実施形態の技術文書検索装置のその他の構成を示すブロック図、
【図7】第1の実施形態の技術文書検索装置の三次元分類表示画面を示す図、
【図8】第2の実施形態の技術文書検索装置の構成を示すブロック図、
【図9】第3の実施形態の技術文書検索装置の構成を示すブロック図、
【図10】第3の実施形態の技術文書検索装置の動作手順を示すフロー図、
【図11】第3の実施形態の技術文書検索装置の検索結果画面を示す図、
【図12】第3の実施形態の技術文書検索装置の類似書誌検索選択画面を示す図、
【図13】第3の実施形態の技術文書検索装置の表示画面を示す図、
【図14】第4の実施形態の技術文書検索装置の構成を示すブロック図、
【図15】第4の実施形態の技術文書検索装置の動作手順を示すフロー図、
【図16】第4の実施形態の技術文書検索装置で表示される文書間の繋がりを示す図、
【図17】第4の実施形態の技術文書検索装置での三次元分類表示画面を示す図、
【図18】第4の実施形態の技術文書検索装置でのポップアップ表示を示す図、
【図19】特許マップを示す図、
【図20】従来の技術文書検索装置の構成を示すブロック図である。
【符号の説明】
11 入出力手段
12 検索手段
13 インデックス格納手段
14 文書実体格納手段
15 分析手段
16 文書類似度判定手段
17 技術マップ群蓄積手段
18 技術マップ格納手段
19 部分文書抽出手段
20 表示合成手段
21 検索式合成手段
22 書誌事項抽出手段
23 文書関係記憶手段
24 関連文書抽出手段
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a technical document search apparatus that searches technical documents such as patent documents and technical papers, and in particular, implements an apparatus that can perform an accurate search and display search results in an easy-to-understand manner. is there.
[0002]
[Prior art]
The number of patent documents and technical papers has reached an enormous amount even with existing publications alone, and it is certain that it will continue to increase in the future. In order to use these technical documents effectively, it is indispensable to have a search means that can accurately select a document in a target field.
[0003]
Conventionally known methods for searching for documents include keyword search and a method for searching for a document similar to a search query using a vector space method.
[0004]
FIG. 20 shows the configuration of a conventional document search apparatus. The apparatus includes an input / output unit 11 that inputs search conditions and outputs a search result, a document entity storage unit 14 that stores technical documents, an index storage unit 13 that stores technical document search indexes, Search means 12 for searching for technical documents using the search index is provided.
[0005]
The index storage unit 13 stores keywords, vector data, dictionaries, and the like extracted from each technical document as an index of each technical document stored in the document entity storage unit 14.
[0006]
When a search condition expression or a search question is input from the input / output means 11, the search means 12 uses the index stored in the index storage means 13, a document that matches the search condition expression, or a document similar to the search question. The search result is displayed through the input / output means 11. The document entity of the search result is read from the document entity storage unit 14 and displayed according to the selection operation from the input / output unit 11.
[0007]
Moreover, in order to show the searched patent document in an easy-to-understand manner, display using a patent map has been conventionally performed.
[0008]
FIG. 19 shows an example of a patent map. This example is a patent map for an inkjet printer for a personal computer, and describes the relationship of the components of this printer, the number and keyword of the related patent document for each component, the age of extraction of the patent document, the patent classification, etc. For patent documents, the applicant and a symbol indicating technical evaluation are displayed.
[0009]
An apparatus for supporting the creation of such a patent map is described in Japanese Patent Laid-Open No. 7-182356. In this apparatus, patent documents are automatically classified according to a predetermined keyword, patent classification, age, and the like.
[0010]
Japanese Patent Application Laid-Open No. 8-221435 describes a system for automatically updating patent documents displayed on a patent map. In this system, when the patent database is updated by sending a search key from the client terminal to the patent database server in advance, the patent data in the update range is searched with the search key, and the search result is sent to the client terminal. It is added to the patent map database of the terminal.
[0011]
Thus, the patent map on which the searched patent documents are displayed is widely used as a material for grasping technical trends and rights.
[0012]
In addition, it is also widely performed to display the document collection of searched patent documents in a graph by the number of cases by filing age and to show the application trends in the corresponding technical field. Japanese Patent Application Laid-Open No. Hei 7-182356 stores patent documents and technical information in a database together with data such as fields of use, elemental technologies, and issuance dates. A method of displaying in a technical information space with an axis and a time axis as coordinate axes is disclosed.
[0013]
[Problems to be solved by the invention]
However, when searching for technical documents using keywords, even if the documents are related, technical documents with completely new concepts or technical documents written using words other than those specified as keywords may be omitted from the search. May not be classified correctly.
[0014]
In addition, in technical terms, for example, “filter” has the meaning of a circuit component that limits the frequency range of a signal in the electrical field, and the meaning of a porous material that separates suspended particulate matter from a liquid in the mechanical field. In the optical field, the same term is often used in different meanings in the technical field to represent an optical component that limits the amount of light. Therefore, in the keyword search of technical documents, a search result may include a large amount of noise unless keywords are selected appropriately.
[0015]
An apparatus for organizing and displaying searched technical documents from various viewpoints is described in the above-mentioned Japanese Patent Application Laid-Open No. 7-182356, etc., but paying attention to the relationship between searched technical documents. No device for displaying the relationship between technical documents has been made so far.
[0016]
The present invention solves these conventional problems, and can search and classify technical documents efficiently and accurately, and clearly shows the relationship between retrieved technical documents. It is an object of the present invention to provide a technical document search apparatus capable of performing the above.
[0017]
[Means for Solving the Problems]
Therefore, in the present invention,Includes bibliographic itemsIn a technical document search device for searching for technical documents such as patent documents and technical papers,A search expression synthesis means for generating a search expression from bibliographic items of technical documents;Document similarity determination means for determining the similarity between technical documents is provided,The search formula synthesis means generates a search formula from bibliographic items of the original technical document, the search means executes a search using the search formula generated by the search formula synthesis means, and the document similarity The determining means determines the similarity of a part excluding bibliographic items between the technical document searched by the searching means and the original technical document, and the relationship between the searched technical document and the original technical document is determined by the similarity. It is displayed so that the degree can be visually recognized.
[0021]
Therefore, in this apparatus, it is possible to appropriately classify search results using the information of the technical map.
[0022]
Also listed on the technology mapTechniqueSearch results can be narrowed down based on the similarity to the technical document.
[0023]
It is also possible to display the relationship of technical documents that share the inventor and applicant included in the bibliographic items, or display the relationship of technical documents that are in a reference relationship.
[0024]
DETAILED DESCRIPTION OF THE INVENTION
(First embodiment)
In the first embodiment, a technical document search apparatus that uses information of a patent map, which has been conventionally used to display a search result of technical documents, to classify searched patent documents will be described.
[0025]
As shown in FIG. 1, this apparatus stores input / output means 11 for inputting search conditions and outputting search results, document entity storage means 14 for storing patent documents, and a search index for patent documents. The index storage means 13, the search means 12 for searching for patent documents using the search index, the analysis means 15 for analyzing the document vector of the patent documents, and a plurality of patent maps created so far are accumulated. A technical map group accumulating unit 17, a technical map storing unit 18 for storing a patent map read out from the technical map group accumulating unit 17, and a document similarity for determining a similarity between patent documents using a document vector Determination means 16.
[0026]
As shown in FIG. 2, each patent map stored in the technical map group accumulating means 17 has a tree-like data structure. In this example, a control unit, a computer interface, a printing unit, etc. of a personal computer inkjet printer. The search keyword and important patent list data are described for each of the components. When this patent map is displayed on the screen, it is displayed as shown in FIG. 19, for example.
[0027]
The user designates a patent map to be used by the input / output unit 11 when using the technical document retrieval apparatus. The designated patent map is read from the technical map group storage means 17 and stored in the map storage means 18.
[0028]
Next, a user inputs a favorite keyword and searches patent documents. The search means 12 searches for a document that matches the keyword using the index stored in the index storage means 13, and the search result is displayed through the input / output means 11. FIG. 3 shows a search result display screen when a patent document is searched using “color * high speed” as a keyword. Here, 2000 search results are obtained.
[0029]
Even if a large number of search results are obtained in this way, the search results are classified and displayed for each configuration diagram of the patent map as shown in FIG. 4 by pressing the “category display” button on the display screen. .
[0030]
When "classification display" is input from the input / output means 11, the degree of similarity between each patent document as a search result and the patent document described for each component of the patent map is calculated and searched. The resulting patent document is classified into the most similar component parts. The similarity is determined using a known technique such as a vector space method.
[0031]
This process is performed in the following procedure.
(1) The analysis means 15 calculates the document vector of each patent document described for each component of the patent map (this may be calculated in advance).
(2) The analyzing means 15 takes out one patent document as a search result and calculates a document vector of this patent document.
(3) The document similarity determination means 16 compares the document vector of the patent document of each component in the patent map with the document vector of the patent document of the search result, and finds the closest similarity at the closest place. Classify. (If it doesn't look like anything else, classify it as "Other". If it's too different from the whole document space, classify it as "Not relevant" and discard the search results.)
(4) The patent document of the next search result is taken out and the processing from (2) is repeated. If there is no patent document of the next search result, the process ends.
As described above, in this technical document search apparatus, searched patent documents can be classified and displayed using the information of the patent map.
[0032]
In this apparatus, when comparing the similarity between the patent document of the search result and the patent document described in the patent map, the document vector for the entire document is calculated and compared. It can also be configured to take out and compare.
[0033]
As shown in FIG. 5, the apparatus in this case is provided with a partial document extracting means 19 for extracting a part of the description part of the patent document. Other configurations are the same as the apparatus of FIG.
[0034]
When calculating the similarity, the partial document extracting unit 19 extracts a description portion of “conventional technology” from each of the patent documents of the search result and the patent documents of the patent map. The analysis unit 15 calculates the document vector of the “conventional technology”, and the document similarity determination unit 16 converts the document vector of the “conventional technology” in the patent document as the search result into the “patent document” in the patent map. Compared with the document vector of “Prior art”, classify it to the closest place.
[0035]
The patent document is very long, and the “embodiment” occupying the maximum amount of data may include various contents such as various examples and comparative examples. For this reason, when comparing the degree of similarity for the entire patent document, not only the processing load is large, but also the classification accuracy may decrease.
[0036]
In that regard, since the "conventional technology" emphasizes what has been the problem and what has been improved, it is necessary to create a document vector for this "conventional technology" and compare it with each other. Classification becomes possible.
[0037]
Similarly, the “document to be solved by the invention” of the patent document may be extracted by the partial document extracting means 19 and the document vectors of this portion may be compared and classified.
[0038]
In the case of a technical paper, a part referring to a past document is extracted as a center, a document vector is created only from this part, and comparison classification is performed. In the case of technical papers, unlike patent literature, it is difficult to extract a specific part because the format is free, but the area around the part that refers to past literature is the description part of the conventional technology. Therefore, it is possible to extract and classify the description part of the prior art by using the description part of the past document as a guide.
[0039]
As described above, in this technical document retrieval apparatus, it is possible to improve the classification accuracy with a small processing load.
[0040]
Further, as shown in FIG. 6, this technical document search apparatus is provided with display composition means 20 for synthesizing display data entangled with similarities, so that the patent documents of the search results can be displayed in a large size representing the similarity in the technical space. It can be displayed in terms of size.
[0041]
When the “multi-dimensional classification” button on the display screen shown in FIG. 3 showing the search result is pressed, this apparatus displays bibliographic items (such as applicants), time (such as the application date), and components as shown in FIG. A point representing the position of the patent document as a search result is displayed in a multidimensional space as an axis. At this time, the display synthesizing unit 20 displays the size of the point representing the patent document as the search result in correspondence with the size of the similarity calculated by the document similarity determining unit 16.
[0042]
When the user clicks the classified and displayed point with the mouse, the corresponding patent document is read from the document entity storage means 14 and the contents thereof are displayed. Further, when the “Add to patent map” button is clicked while the contents are displayed, the patent document is added to the patent map. Therefore, the user can select a patent document to be added to the patent map using the size of a point in the multidimensional space as a guide.
[0043]
As described above, this technology search apparatus has a function of supporting the creation of a patent map, and can easily update patent documents registered in the patent map.
[0044]
Here, although the case where the size of the display point of the patent document is differentiated according to the similarity is described, the color or shape of the point may be differentiated according to the similarity.
[0045]
(Second Embodiment)
In the second embodiment, a technical document search apparatus that uses information on a patent map, which has been conventionally used to display search results of technical documents, to narrow down the number of searches for patent documents will be described.
[0046]
As shown in FIG. 8, this apparatus includes search formula combining means 21 that combines a search formula obtained by adding a keyword of a patent map to a search formula set by a user. Other configurations are the same as those in FIG. 6 of the first embodiment.
[0047]
The technology map group storage means 17 of this apparatus stores a patent map created in advance. The user designates a patent map to be used from now on when using this technical document retrieval apparatus. The designated patent map is read from the technical map group storage unit 17 and stored in the technical map storage unit 18.
[0048]
Next, the user inputs a favorite keyword from the input / output means 11 and searches for patent documents. When a keyword is input from the input / output unit 11, the search formula combining unit 21 adds a basic keyword or bibliographic item (IPC classification or the like) specified in the patent map to the search formula in addition to the keyword specified by the user. Are automatically assembled, and the search means 12 performs a search using this search formula. The document similarity determination means 16 determines the similarity between the patent document of the search result and the patent document described in the patent map, except for those having very low similarity (this determination does not narrow the similarity so much) Display search results).
[0049]
For example, it is assumed that a user wants to search for a patent related to “FAX server device”. With conventional search devices
"(FAX + facsimile + fax) * control * image * communication * compression"
And so on, patents for NC control devices (machine tool numerical control devices) will be searched in addition to the target FAX server related patents. In addition to narrowing down by IPC classification, the user has to specify words such as NC with the NOT operator and narrow down little by little, which requires know-how for each patent field.
[0050]
In this technical document search apparatus, if a user has a patent map related to the FAX server apparatus in advance, the patent of the FAX server apparatus can be searched simply by specifying the patent map.
[0051]
In addition, when only the keyword “color” is specified, a normal search device searches for everything from color television to color film, and the number reaches a huge amount. In the case of this technical document search device, Can search only patent documents of FAX server devices related to color FAX.
[0052]
As described above, this technical document search apparatus can efficiently and accurately search technical documents by synthesizing search conditions using a patent map.
[0053]
(Third embodiment)
In the third embodiment, a technical document search apparatus that searches patent documents having commonality in bibliographic items and displays the relationship between them will be described.
[0054]
As shown in FIG. 9, this apparatus includes a bibliographic item extracting unit 22 for extracting bibliographic items of patent documents, a search formula synthesizing unit 21 for synthesizing a search formula from bibliographic items, and a relationship between searched patent documents. And a document relation storage means 23 for storing. Other configurations are the same as those in FIG. 1 of the first embodiment.
[0055]
The user inputs some keyword from the input / output means 11 and searches for patent documents. As a result, it is assumed that a certain number of patent documents are retrieved as shown in the screen example of FIG. Assume that one of them corresponds to the patent document you were looking for. Therefore, the user tries to see a patent document similar to this patent document (referred to as the original patent document). The subsequent procedure is shown in the flowchart of FIG.
[0056]
Step 1: As shown in FIG. 12, the user selects a document on the screen and presses a “similar bibliography search” button. Then, the bibliographic item extraction means 22 of this technical document search apparatus extracts the inventor and the applicant from the selected original patent document. It is assumed that the name of “applicant A” is extracted as the applicant, and three names of “inventor 1”, “inventor 2”, and “inventor 3” are extracted as inventors.
[0057]
Step 2: The retrieval formula combining means 21
Applicant A * Inventor 1 + Applicant A * Inventor 2 + Applicant A * Inventor 3
Assemble the search expression.
Step 3: The search means 12 performs a search using this search formula. As a result, 50 search results are obtained.
Step 4: The document similarity determination means 16 calculates the similarity with the original patent document for all 50 obtained cases. If the degree of similarity is greater than or equal to a predetermined threshold value, that is, if it is similar to a certain extent, it is left as a result, but other (not similar) search results are discarded.
Step 5: The remaining search results are stored in the document relation storage unit 23, and output and displayed by sorting in time order (application order), similarity order, or time order.
[0058]
In this way, as shown in FIG. 13, the similarity between the patent documents shared by the applicant and the inventor can be displayed on the time axis.
[0059]
In this way, this device extracts only a part of bibliographic items from the original document, synthesizes a search formula from the extracted bibliographic items, performs a search using this search formula, and obtains similar results from the obtained search results. By searching for and displaying only similar items in alignment, it is possible to display the relationship between patent documents having common bibliographic items.
[0060]
(Fourth embodiment)
In the fourth embodiment, a technical document search device that searches patent documents in a reference relationship and displays the relationship between them will be described.
[0061]
As shown in FIG. 14, this apparatus includes a related document extracting unit 24 that extracts a document referred to in a patent document, a document relationship storage unit 23 that stores a relationship between searched patent documents, and a reference. Display synthesizing means 20 for displaying related patent documents in association with each other. Other configurations are the same as those in FIG. 1 of the first embodiment.
[0062]
The user inputs some keyword from the input / output means 11 and searches for patent documents. As a result, as shown in the screen example of FIG. 11, it is assumed that a certain number of patent documents are searched, and one of them corresponds to the searched patent document. Therefore, the user tries to see a patent document similar to this patent document (referred to as a seed patent document). The subsequent procedure is shown in the flowchart of FIG.
[0063]
Step 11: The user selects a seed patent document on the screen and presses a “reference document search” button.
Step 13: The related document extraction unit 24 of the technical document search apparatus extracts (a plurality of) reference document names cited in the seed patent document from the seed patent document. This is called a parent patent document.
Step 14: The document relationship storage means 23 stores the relationship between the seed patent document and the parent patent document.
Step 15: The parent patent document is acquired from the document entity storage means 14,
Step 16: The parent patent document is used as a seed, and Steps 13 to 16 are repeated until N generations (N can be specified) are traced back from the first seed patent document.
[0064]
Step 17: Set the first seed patent document as the seed patent document again,
Step 19: Search for a patent document referring to this kind of patent document by searching the full text of the patent document stored in the document entity storage unit 14.
Step 20: The document relationship storage means 23 stores the relationship between the retrieved result (child patent document) and the seed patent document.
Step 21: Use this as a seed for all the child patent documents, and repeat Steps 19 to 21 until after M generations (M can be specified).
Step 22: The display composition unit 20 displays the relationship between the documents stored in the document relationship storage unit 23 in Step 14 and Step 20.
16 and 17 show an example of the screen displayed in this way.
[0065]
Note that the extraction of the document name referred to in the literature is formally described as “Japanese Patent Publication No. 11-12345” in the case of patent literature, so that the computer can easily recognize it. Also, in the case of papers, references are at the end of the sentence,
[8] Yaizuki Iizuka, Word segmentation by connection establishment minimum method, 200-NL-139, pp11, 2000
For example, the computer can be easily recognized from this description part.
[0066]
In addition, when searching for a child patent document (child), if a full-text search is performed on the database based on the patent publication number of the seed patent document (own), the child patent document (child) that refers to the seed patent document (self) ) Is possible.
[0067]
Also, if you want to search for documents that correspond to the sibling's child (甥), how far to go back to the parent (N generation or X years ago), how far to go to the child (M generation or all up to now), etc. To be able to choose.
[0068]
In addition, a document referred to by more documents (a document with many children) may be highlighted with a particular color when displayed. This shows that the fact that there are many children is more important, so that it can be clearly shown.
[0069]
In FIG. 16 and FIG. 17, only the patent publication number is displayed for the sake of explanation. However, in addition to the publication number, the display of the name, the applicant, etc. can be selected, or as shown in FIG. The bibliographic items and summary contents may be displayed in a pop-up only when the mouse pointer is placed at the position of the public number in the figure.
[0070]
It is also possible to browse the patent document immediately by double-clicking the patent publication number box in FIGS. Also, if there is a part in which the reference patent (parent patent) number is written in the patent document being browsed, only that part is highlighted (or colored), and when it is clicked, the reference patent (parent patent) is displayed. You may comprise as follows.
The similarity between related patent documents may be determined by the document similarity determination means, and the similarity may be displayed so as to be visually understood.
[0071]
As described above, this technical document retrieval apparatus can retrieve a reference relationship between documents and display the relationship between the documents on the screen. By browsing this screen, it is possible to easily grasp the technical system and the technical trend.
[0072]
In the embodiment, the description has been made centering on the search of patent documents, but the technical document search apparatus of the present invention can also target a technical paper or the like.
[0073]
【The invention's effect】
As is clear from the above description, the technical document search apparatus of the present invention uses the technical map such as a patent map for the search, so that the user can easily obtain the desired search result without making a difficult specification. be able to.
[0074]
Further, based on the search result, the technical document to be registered in the technical map can be accurately and easily identified, and the technical map data can be accurately updated. As a result, the technical trend can be grasped more easily and accurately.
[0075]
In addition, since the technical document search apparatus of the present invention can search and display the connection between documents, the user can easily grasp the technical system and the technical trend, and can also search the related document from this connection. Therefore, it is possible to reduce retrieval omissions and perform document retrieval more easily and accurately.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a technical document search apparatus according to a first embodiment;
FIG. 2 is a diagram showing a data structure of a patent map;
FIG. 3 is a diagram showing a search result screen of the technical document search device according to the first embodiment;
FIG. 4 is a view showing a patent map classification display screen of the technical document search apparatus according to the first embodiment;
FIG. 5 is a block diagram showing another configuration of the technical document search apparatus according to the first embodiment;
FIG. 6 is a block diagram showing another configuration of the technical document search apparatus according to the first embodiment;
FIG. 7 is a diagram showing a three-dimensional classification display screen of the technical document search device according to the first embodiment;
FIG. 8 is a block diagram showing a configuration of a technical document search apparatus according to the second embodiment;
FIG. 9 is a block diagram showing a configuration of a technical document search apparatus according to a third embodiment;
FIG. 10 is a flowchart showing an operation procedure of the technical document search apparatus according to the third embodiment;
FIG. 11 is a view showing a search result screen of the technical document search apparatus according to the third embodiment;
FIG. 12 is a view showing a similar bibliographic search selection screen of the technical document search apparatus according to the third embodiment;
FIG. 13 is a diagram showing a display screen of the technical document search device according to the third embodiment;
FIG. 14 is a block diagram showing a configuration of a technical document search apparatus according to the fourth embodiment;
FIG. 15 is a flowchart showing an operation procedure of the technical document search apparatus according to the fourth embodiment;
FIG. 16 is a diagram showing a connection between documents displayed by the technical document search apparatus according to the fourth embodiment;
FIG. 17 is a diagram showing a three-dimensional classification display screen in the technical document search device of the fourth embodiment;
FIG. 18 is a diagram showing a pop-up display in the technical document search device according to the fourth embodiment;
FIG. 19 is a diagram showing a patent map;
FIG. 20 is a block diagram showing a configuration of a conventional technical document search apparatus.
[Explanation of symbols]
11 Input / output means
12 Search means
13 Index storage means
14 Document entity storage means
15 Analytical means
16 Document similarity determination means
17 Technical map group storage means
18 Technical map storage means
19 Partial document extraction means
20 Display composition means
21 Search formula synthesis means
22 Bibliographic item extraction means
23 Document relation storage means
24 Related Document Extraction Means

Claims (5)

書誌事項を含む特許文献や技術論文などの技術文書を検索する技術文書検索装置において、
検索手段と、
技術文書の書誌事項から検索式を生成する検索式合成手段と、
技術文書間の類似度を判定する文書類似度判定手段と
を備え、前記検索式合成手段は、元になる技術文書の書誌事項から検索式を生成し、前記検索手段は、前記検索式合成手段によって生成された検索式を用いて検索を実行し、前記文書類似度判定手段は、前記検索手段によって検索された技術文書と元の技術文書との書誌事項を除く部分の類似度を判定し、前記検索された技術文書と元の技術文書との関係を、前記類似度が視覚的に分かるように表示することを特徴とする技術文書検索装置。
In a technical document search device for searching technical documents such as patent documents and technical papers including bibliographic items
Search means;
A search expression synthesis means for generating a search expression from bibliographic items of technical documents;
Document similarity determination means for determining similarity between technical documents, wherein the search expression synthesis means generates a search expression from bibliographic items of the original technical document, and the search means includes the search expression synthesis means The document similarity determination unit determines a similarity of a part excluding bibliographic items between the technical document searched by the search unit and the original technical document, A technical document search apparatus for displaying a relationship between the searched technical document and the original technical document so that the similarity is visually understood.
前記文書類似度判定手段が判定した類似度が所定値以下である技術文書を検索結果から除くことを特徴とする請求項1に記載の技術文書検索装置。2. The technical document search apparatus according to claim 1, wherein a technical document whose similarity determined by the document similarity determination unit is equal to or less than a predetermined value is excluded from a search result. 技術文書の一部分を抽出する部分文書抽出手段を具備し、前記文書類似度判定手段は、前記検索された技術文書及び前記元の技術文書の中で、前記部分文書抽出手段が抽出した一部分を用いて前記類似度を判定することを特徴とする請求項1に記載の技術文書検索装置。A partial document extracting unit for extracting a part of the technical document, wherein the document similarity determination unit uses a part extracted from the searched technical document and the original technical document by the partial document extracting unit; The technical document search device according to claim 1, wherein the similarity is determined. 前記部分文書抽出手段は、特許文献の中から「従来の技術」または「発明が解決しようとする課題」の部分を抽出することを特徴とする請求項3に記載の技術文書検索装置。4. The technical document search apparatus according to claim 3, wherein the partial document extracting unit extracts a part of “conventional technology” or “problem to be solved by the invention” from patent documents. 前記検索式合成手段は、元になる技術文書の書誌事項に含まれる出願人及び発明者の情報を用いて前記検索式を生成することを特徴とする請求項1に記載の技術文書検索装置。2. The technical document search apparatus according to claim 1, wherein the search formula synthesizing unit generates the search formula using information of an applicant and an inventor included in a bibliographic item of the original technical document.
JP2000363384A 2000-11-29 2000-11-29 Technical document retrieval device Expired - Fee Related JP3625054B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000363384A JP3625054B2 (en) 2000-11-29 2000-11-29 Technical document retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000363384A JP3625054B2 (en) 2000-11-29 2000-11-29 Technical document retrieval device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004265227A Division JP2004348771A (en) 2004-09-13 2004-09-13 Technical document retrieval device

Publications (2)

Publication Number Publication Date
JP2002163275A JP2002163275A (en) 2002-06-07
JP3625054B2 true JP3625054B2 (en) 2005-03-02

Family

ID=18834502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000363384A Expired - Fee Related JP3625054B2 (en) 2000-11-29 2000-11-29 Technical document retrieval device

Country Status (1)

Country Link
JP (1) JP3625054B2 (en)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4817585B2 (en) * 2002-06-21 2011-11-16 株式会社日本総合研究所 Attribute information search apparatus, attribute information search method, and program causing computer to execute the method
KR100502174B1 (en) * 2002-09-11 2005-07-20 한국과학기술정보연구원 Method of patent search using icon and method and media that can record computer program sources thereof
JP2004133684A (en) * 2002-10-10 2004-04-30 Ntt Data Corp Information retrieval system and information retrieval program
EP1582999A4 (en) * 2002-12-27 2008-05-28 Intellectual Property Bank Technique evaluating device, technique evaluating program, and technique evaluating method
WO2004104859A1 (en) * 2003-05-22 2004-12-02 Fujitsu Limited Theme analyzer
JP2005038199A (en) * 2003-07-15 2005-02-10 Nissan Motor Co Ltd Patent map creating system, and patent map creating program
JP2005339412A (en) * 2004-05-31 2005-12-08 Bearnet Inc Patent map generation method and program
BRPI0515687A (en) * 2004-09-14 2008-07-29 Intellectual Property Bank device, program, and drawing method for the diagrammatic relationship of documents in chronological order
CN100462966C (en) * 2004-09-14 2009-02-18 株式会社Ipb Device for drawing document correlation diagram where documents are arranged in time series
JP4661159B2 (en) * 2004-10-18 2011-03-30 ソニー株式会社 Information providing system, metadata collection and analysis server, and computer program
JP5273840B2 (en) * 2007-06-22 2013-08-28 一郎 工藤 Patent power calculation device and operation method of patent power calculation device
JP5007625B2 (en) * 2007-08-15 2012-08-22 ソニー株式会社 Display interface, display control apparatus, display method, and program
JP2009116536A (en) * 2007-11-05 2009-05-28 Hatsumei-Tsushin Co Ltd Literature information display device and literature information display method
JP5106155B2 (en) * 2008-01-29 2012-12-26 株式会社東芝 Document processing apparatus, method and program
WO2009096190A1 (en) * 2008-02-01 2009-08-06 Kanazawa Institute Of Technology Quotation judgment supporting device
CN104142947A (en) * 2013-05-09 2014-11-12 鸿富锦精密工业(深圳)有限公司 File classifying system and file classifying method
JP6064855B2 (en) * 2013-06-17 2017-01-25 富士ゼロックス株式会社 Information processing program and information processing apparatus
JP6019303B1 (en) * 2015-12-21 2016-11-02 ジャパンモード株式会社 Problem solving support system
JP6777445B2 (en) * 2016-07-07 2020-10-28 株式会社野村総合研究所 Citation map generator, citation map generation method and computer program
JP7041530B2 (en) * 2018-01-24 2022-03-24 ヤフー株式会社 Display program, display method, and display device
JP2019211974A (en) * 2018-06-04 2019-12-12 株式会社野村総合研究所 Company analysis device

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06251064A (en) * 1993-02-26 1994-09-09 Sony Corp Information retriever
JPH07319905A (en) * 1994-05-25 1995-12-08 Fujitsu Ltd Information retrieving device
JPH08272818A (en) * 1995-04-03 1996-10-18 Nippon Steel Corp Information retrieval system
JPH0962690A (en) * 1995-08-22 1997-03-07 Fujitsu Ltd Document managing device
JPH09259138A (en) * 1996-03-21 1997-10-03 N T T Data Tsushin Kk Sort information display method and information retrieval device
JPH1173422A (en) * 1997-08-28 1999-03-16 Hitachi Inf Syst Ltd Similar document retrieval system and storage medium used for same
JP3571231B2 (en) * 1998-10-02 2004-09-29 日本電信電話株式会社 Automatic information classification method and apparatus, and recording medium recording automatic information classification program

Also Published As

Publication number Publication date
JP2002163275A (en) 2002-06-07

Similar Documents

Publication Publication Date Title
JP3625054B2 (en) Technical document retrieval device
US20210382927A1 (en) System and method for hierarchically organizing documents based on document portions
JP6190887B2 (en) Image search system and information recording medium
JP4101239B2 (en) Automatic query clustering
JP4335335B2 (en) How to sort document images
JP3577819B2 (en) Information search apparatus and information search method
EP1424640A2 (en) Information storage and retrieval apparatus and method
US20050021545A1 (en) Very-large-scale automatic categorizer for Web content
EP1426882A2 (en) Information storage and retrieval
CN100410928C (en) Drawing search support apparatus and drawing search method
JPH11224345A (en) Identification method for part of document image
JPH11242654A (en) Method for transmitting document image to client work station
GB2403558A (en) Document searching and method for presenting the results
JPH1074210A (en) Method and device for supporting document retrieval and document retrieving service using the method and device
JPWO2005038672A1 (en) Index word extraction device, character expression diagram, and document feature analysis device for survey target document
JP2004348771A (en) Technical document retrieval device
US20060112142A1 (en) Document retrieval method and apparatus using image contents
CN104317867B (en) The system that entity cluster is carried out to the Web page picture that search engine returns
JP5010624B2 (en) Search device
Song Bibliomapper: A cluster-based information visualization technique
Henry et al. Multifacet: A faceted interface for browsing large multimedia collections
Eler et al. Coordinated and multiple views for visualizing text collections
Wirth et al. SPORENLP: A Spatial Recommender System for Scientific Literature.
JP2005258910A (en) Hierarchical keyword extraction device, method and program
Seki et al. Information management system using structure analysis of paper/electronic documents and its applications

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040713

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041124

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071210

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091210

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees