JP4479745B2 - 文書の類似度補正方法、プログラムおよびコンピュータ - Google Patents
文書の類似度補正方法、プログラムおよびコンピュータ Download PDFInfo
- Publication number
- JP4479745B2 JP4479745B2 JP2007124084A JP2007124084A JP4479745B2 JP 4479745 B2 JP4479745 B2 JP 4479745B2 JP 2007124084 A JP2007124084 A JP 2007124084A JP 2007124084 A JP2007124084 A JP 2007124084A JP 4479745 B2 JP4479745 B2 JP 4479745B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- classification
- similarity
- search
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
の内容に応じて適切な分類が人手でまたは機械的に付与されている。類似文書検索におい
て、この分類を加味した検索を実現しているシステムは多いが、その処理方式は、類似文
書として検索された文書群の中で、特定の分類を持つ文書のみを検索結果として出力する
検索結果フィルタリングであるものがほとんどである。
Claims (6)
- 入力部と複数の検索文書の情報を記憶する記憶部と出力部を有するコンピュータにより、前記入力部を介して入力された第1の文書に基づき前記記憶部を検索し、前記第1の文書と前記複数の検索文書の各々との類似度を算出し、該算出結果を前記記憶部に格納し、該記憶部における前記第1の文書に類似する第2の文書の類似度を補正する文書の類似度補正方法であって、
前記第1の文書に付与されている第1の分類に基づき、前記第2の文書を識別する情報、該第2の文書に付与されている第2の分類および前記第1の文書に対する類似度を関連付けたレコードを複数有する前記記憶部を検索して、前記第1の分類に共通する前記第2の分類の有無を判定し、
該判定により前記第1の分類に共通する前記第2の分類がある場合に、前記記憶部に記憶されている前記類似度のうち一番高い類似度に、予め決められた割合を乗じ、その演算結果を、前記第1の分類に共通する前記第2の分類に関連付いた前記第1の文書に対する前記類似度に加算する
ことを特徴とする文書の類似度補正方法。 - 前記コンピュータにより、
前記各レコードの情報を、前記加算された類似度の高い順に前記出力部に出力する、
ことを特徴とする請求項1に記載の文書の類似度補正方法。 - 入力部と複数の検索文書の情報を記憶する記憶部と出力部を有し、前記入力部を介して入力された第1の文書に基づき前記記憶部を検索し、前記第1の文書と前記複数の検索文書の各々との類似度を算出し、該算出結果を前記記憶部に格納し、該記憶部における前記第1の文書に類似する第2の文書の類似度を補正するコンピュータであって、
前記第1の文書に付与されている第1の分類に基づき、前記第2の文書を識別する情報、該第2の文書に付与されている第2の分類および前記第1の文書に対する類似度を関連付けたレコードを複数有する前記記憶部を検索して、前記第1の分類に共通する前記第2の分類の有無を判定し、該判定により前記第1の分類に共通する前記第2の分類がある場合に、前記記憶部に記憶されている前記類似度のうち一番高い類似度に、予め決められた割合を乗じ、その演算結果を、前記第1の分類の共通する前記第2の分類に関連付いた前記第1の文書に対する前記類似度に加算する計算処理部を有する、
ことを特徴とするコンピュータ。 - 前記計算処理部は、
前記各レコードの情報を、前記加算された類似度の高い順に前記出力部に出力する、
ことを特徴とする請求項3に記載のコンピュータ。 - 入力部と複数の検索文書の情報を記憶する記憶部と出力部を有するコンピュータに、前記入力部を介して入力された第1の文書に基づき前記記憶部を検索し、前記第1の文書と前記複数の検索文書の各々との類似度を算出し、該算出結果を前記記憶部に格納し、該記憶部における前記第1の文書に類似する第2の文書の類似度を補正する処
理を実行させるプログラムであって、
前記第1の文書に付与されている第1の分類に基づき、前記第2の文書を識別する情報、該第2の文書に付与されている第2の分類および前記第1の文書に対する類似度を関連付けたレコードを複数有する前記記憶部を検索して、前記第1の分類に共通する前記第2の分類の有無を判定する処理と、
該判定により前記第1の分類に共通する前記第2の分類がある場合に、前記記憶部に記憶されている前記類似度のうち一番高い類似度に、予め決められた割合を乗じ、その演算結果を、前記第1の分類に共通する前記第2の分類に関連付いた前記第1の文書に対する前記類似度に加算する処理とを前記コンピュータに実行させる、
ことを特徴とする特徴とするプログラム。 - 前記各レコードの情報を、前記加算された類似度の高い順に前記出力部に出力する処理を前記コンピュータに実行させる、
ことを特徴とする請求項5に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007124084A JP4479745B2 (ja) | 2007-05-09 | 2007-05-09 | 文書の類似度補正方法、プログラムおよびコンピュータ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007124084A JP4479745B2 (ja) | 2007-05-09 | 2007-05-09 | 文書の類似度補正方法、プログラムおよびコンピュータ |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008282111A JP2008282111A (ja) | 2008-11-20 |
JP2008282111A5 JP2008282111A5 (ja) | 2009-05-07 |
JP4479745B2 true JP4479745B2 (ja) | 2010-06-09 |
Family
ID=40142894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007124084A Active JP4479745B2 (ja) | 2007-05-09 | 2007-05-09 | 文書の類似度補正方法、プログラムおよびコンピュータ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4479745B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4521459B2 (ja) * | 2008-12-18 | 2010-08-11 | 株式会社日立製作所 | 文書分類装置、文書分類方法およびプログラム |
JP5324677B2 (ja) * | 2012-02-24 | 2013-10-23 | 株式会社日立製作所 | 類似文書検索支援装置及び類似文書検索支援プログラム |
WO2016103409A1 (ja) * | 2014-12-25 | 2016-06-30 | 株式会社日立製作所 | 検索システム |
JP6623547B2 (ja) | 2015-05-12 | 2019-12-25 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
-
2007
- 2007-05-09 JP JP2007124084A patent/JP4479745B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008282111A (ja) | 2008-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102431549B1 (ko) | 인과 관계 인식 장치 및 그것을 위한 컴퓨터 프로그램 | |
JP3726263B2 (ja) | 文書分類方法及び装置 | |
US7480667B2 (en) | System and method for using anchor text as training data for classifier-based search systems | |
US20050086045A1 (en) | Question answering system and question answering processing method | |
US20020156793A1 (en) | Categorization based on record linkage theory | |
US20100205198A1 (en) | Search query disambiguation | |
US20040083224A1 (en) | Document automatic classification system, unnecessary word determination method and document automatic classification method | |
JP4904496B2 (ja) | 文書類似性導出装置及びそれを用いた回答支援システム | |
JP2005158010A (ja) | 分類評価装置・方法及びプログラム | |
WO2010035455A1 (ja) | 情報分析装置、情報分析方法、及びプログラム | |
CN110134777B (zh) | 问题去重方法、装置、电子设备和计算机可读存储介质 | |
KR102244938B1 (ko) | 인공지능 채용 시스템 및 상기 시스템의 채용 방법 | |
JP4426894B2 (ja) | 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置 | |
CN106844482B (zh) | 一种基于搜索引擎的检索信息匹配方法及装置 | |
JP4479745B2 (ja) | 文書の類似度補正方法、プログラムおよびコンピュータ | |
US11520994B2 (en) | Summary evaluation device, method, program, and storage medium | |
WO2008062822A1 (fr) | Dispositif d'exploration de texte, procédé d'exploration de texte et programme d'exploration de texte | |
CN108536671B (zh) | 文本数据的情感指数识别方法和系统 | |
CN114139537A (zh) | 词向量的生成方法及装置 | |
JP5439235B2 (ja) | 文書分類方法、文書分類装置、およびプログラム | |
JP2020071678A (ja) | 情報処理装置、制御方法、プログラム | |
US20180011919A1 (en) | Systems and method for clustering electronic documents | |
JP6509391B1 (ja) | 計算機システム | |
KR20220041336A (ko) | 중요 키워드 추천 및 핵심 문서를 추출하기 위한 그래프 생성 시스템 및 이를 이용한 그래프 생성 방법 | |
JP4592556B2 (ja) | 文書検索装置、文書検索方法および文書検索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090318 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090318 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20090318 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20090414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090609 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091027 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091221 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100223 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100308 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130326 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4479745 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130326 Year of fee payment: 3 |