JP2020123318A - テキスト相関度を確定するための方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム - Google Patents
テキスト相関度を確定するための方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2020123318A JP2020123318A JP2019210903A JP2019210903A JP2020123318A JP 2020123318 A JP2020123318 A JP 2020123318A JP 2019210903 A JP2019210903 A JP 2019210903A JP 2019210903 A JP2019210903 A JP 2019210903A JP 2020123318 A JP2020123318 A JP 2020123318A
- Authority
- JP
- Japan
- Prior art keywords
- text
- knowledge
- correlation
- knowledge elements
- elements
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000004590 computer program Methods 0.000 title claims description 7
- 230000014509 gene expression Effects 0.000 claims description 42
- 238000000605 extraction Methods 0.000 claims description 33
- 238000013507 mapping Methods 0.000 claims description 32
- 239000002585 base Substances 0.000 description 65
- 230000000875 corresponding effect Effects 0.000 description 45
- 238000010586 diagram Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 12
- 230000011218 segmentation Effects 0.000 description 11
- 238000012549 training Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 238000013135 deep learning Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
- G06F16/3326—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/046—Forward inferencing; Production systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
式(1)は、第1組の知識要素のいずれか1つに対して、同じ識別子を有する知識要素が第2組の知識要素内に存在するかどうかを判定することを示す。そして、知識要素相関度を確定するために、第1組の知識要素のうち、同じ識別子を有する要素の数と第1組の総要素数nとの比率が知識要素の類似度を示すために用いられる。2組の知識要素の間の識別子レベルでの類似度は他の方法で確定されてもよいことを理解されたい。
Claims (21)
- 知識要素からなる知識表現を含む予め定義された知識ベースから、第1テキストに関連付けられる第1組の知識要素と、第2テキストに関連付けられる第2組の知識要素とを識別するステップと、
前記第1組の知識要素と前記第2組の知識要素との間の知識要素相関度を確定するステップと、
少なくとも前記知識要素相関度に基づいて、前記第1テキストに対する前記第2テキストのテキスト相関度を確定するステップとを含む、
テキスト相関度を確定するための方法。 - 前記第1テキストは検索クエリを含み、前記第2テキストは候補文書の少なくとも一部を含み、前記相関度は、前記検索クエリに対するクエリ結果における前記候補文書の順位の決定に用いられる、請求項1に記載の方法。
- 前記第1組の知識要素又は前記第2組の知識要素は、前記知識ベースにおけるエンティティ、前記エンティティ間の関係、及び前記エンティティの属性のうちの少なくとも1つを含む、
請求項1に記載の方法。 - 前記知識要素相関度を確定するステップは、
前記第1組の知識要素及び第2組の知識要素のうち、前記知識ベースにおいて同じ識別子を有する知識要素の数を決定するステップであって、知識要素の識別子は前記知識ベースにおいて前記知識要素を一意に識別するステップと、
同じ識別子を有する前記知識要素の数に基づいて、前記知識要素相関度を確定するステップとを含む、請求項1に記載の方法。 - 前記知識要素相関度を確定するステップは、
前記第1テキストにおいて前記第1組の知識要素に関連付けるための第1組のテキストアイテムと、前記第2テキストにおいて前記第2組の知識要素に関連付けるための第2組のテキストアイテムとのテキスト類似度を確定するステップと、
前記テキスト類似度に基づいて前記知識要素相関度を確定するステップとを含む、請求項1に記載の方法。 - 前記知識要素相関度を確定するステップはさらに、
前記第1組の知識要素に対応する第1結合ベクトル表現及び前記第2組の知識要素に対応する第2結合ベクトル表現を決定するステップと、
前記第1結合ベクトル表現の第1特徴及び前記第2結合ベクトル表現の第2特徴を抽出するステップと、
さらに前記第1特徴及び前記第2特徴に基づいて前記知識要素相関度を確定するステップとを含む、請求項1に記載の方法。 - 前記第1結合ベクトル表現及び前記第2結合ベクトル表現を決定するステップは、
知識要素とベクトル表現との間の第1所定マッピング関係に基づいて、前記第1組の知識要素の第1組のベクトル表現、及び前記第2組の知識要素の第2組のベクトル表現を決定するステップであって、前記第1組の知識要素及び前記第2組の知識要素のうち、前記知識ベースにおける同じ識別子を有する知識要素が同じベクトル表現にマッピングされるステップと、
前記第1テキストで現れる前記第1組の知識要素の順位によって前記第1組のベクトル表現を組み合わせることにより、前記第1結合ベクトル表現を決定するステップと、
前記第2テキストで現れる前記第2組の知識要素の順位によって前記第2組のベクトル表現を組み合わせることにより、前記第2結合ベクトル表現を決定するステップとを含む、請求項1に記載の方法。 - 前記第1所定マッピング関係が前記知識ベースにおける知識要素の主語、述語、目的語(SPO)情報に基づいて決定される、請求項7に記載の方法。
- 前記テキスト相関度を確定するステップはさらに、
テキストアイテムとベクトル表現との間の第2所定マッピング関係に基づいて、前記第1テキストに対応する第1テキストベクトル表現と、前記第2テキストに対応する第2テキストベクトル表現とを決定するステップと、
前記第1テキストベクトル表現の第3特徴及び前記第2テキストベクトル表現の第4特徴を抽出するステップと、
さらに前記第3特徴及び前記第4特徴に基づいて前記テキスト相関度を確定するステップとを含む、請求項1に記載の方法。 - 前記第2所定マッピング関係は、テキストアイテムが前記知識ベースにおいて関連付けられる知識要素の主語、述語、目的語(SPO)情報に基づいて決定される、請求項9に記載の方法。
- 知識要素からなる知識表現を含む予め定義された知識ベースから、第1テキストに関連付けられる第1組の知識要素と、第2テキストに関連付けられる第2組の知識要素とを識別するように構成された知識要素関連付けモジュールと、
前記第1組の知識要素と前記第2組の知識要素との間の知識要素相関度を確定するように構成された要素相関度確定モジュールと、
少なくとも前記知識要素相関度に基づいて、前記第1テキストに対する前記第2テキストのテキスト相関度を確定するように構成されたテキスト相関度確定モジュールとを含む、テキスト相関度を確定するための装置。 - 前記第1テキストは検索クエリを含み、前記第2テキストは候補文書の少なくとも一部を含み、前記相関度は、前記検索クエリに対するクエリ結果における前記候補文書の順位の決定に用いられる、請求項11に記載の装置。
- 前記第1組の知識要素又は前記第2組の知識要素は、前記知識ベースにおけるエンティティ、前記エンティティ間の関係、及び前記エンティティの属性のうちの少なくとも1つを含む、請求項11に記載の装置。
- 前記要素相関度確定モジュールは、
前記第1組の知識要素及び第2組の知識要素のうち、前記知識ベースにおいて同じ識別子を有する知識要素の数を決定するように構成された同識別子モジュールであって、知識要素の識別子は前記知識ベースにおいて前記知識要素を一意に識別する同識別子モジュールと、
同じ識別子を有する前記知識要素の数に基づいて、前記知識要素相関度を確定するように構成された識別子に基づく相関度確定モジュールとを含む、請求項11に記載の装置。 - 前記要素相関度確定モジュールは、
前記第1テキストにおいて前記第1組の知識要素に関連付けるための第1組のテキストアイテムと、前記第2テキストにおいて前記第2組の知識要素に関連付けるための第2組のテキストアイテムとのテキスト類似度を確定するように構成されたテキスト類似度確定モジュールと、
前記テキスト類似度に基づいて前記知識要素相関度を確定するように構成された類似度に基づく相関度確定モジュールとを含む、請求項11に記載の装置。 - 前記要素相関度確定モジュールはさらに、
前記第1組の知識要素に対応する第1結合ベクトル表現及び前記第2組の知識要素に対応する第2結合ベクトル表現を決定するように構成された第1表現決定モジュールと、
前記第1結合ベクトル表現の第1特徴及び前記第2結合ベクトル表現の第2特徴を抽出するように構成された第1特徴抽出モジュールと、
さらに前記第1特徴及び前記第2特徴に基づいて前記知識要素相関度を確定するように構成された特徴に基づく相関度確定モジュールとを含む、請求項11に記載の装置。 - 前記表現決定モジュールは、
知識要素とベクトル表現との間の第1所定マッピング関係に基づいて、前記第1組の知識要素の第1組のベクトル表現、及び前記第2組の知識要素の第2組のベクトル表現を決定するように構成された個別表現決定モジュールであって、前記第1組の知識要素及び前記第2組の知識要素のうち、前記知識ベースにおける同じ識別子を有する知識要素が同じベクトル表現にマッピングされている個別表現決定モジュールと、
前記第1テキストで現れる前記第1組の知識要素の順位によって前記第1組のベクトル表現を組み合わせることにより、前記第1結合ベクトル表現を決定するように構成される第1組み合わせモジュールと、
前記第2テキストで現れる前記第2組の知識要素の順位によって前記第2組のベクトル表現を組み合わせることにより、前記第2結合ベクトル表現を決定するように構成される第2組み合わせモジュールとを含む、請求項6に記載の装置。 - 前記第1所定マッピング関係が、前記知識ベースにおける知識要素の主語、述語、目的語(SPO)情報に基づいて決定される、請求項17に記載の装置。
- 前記テキスト相関度確定モジュールは、
テキストアイテムとベクトル表現との間の第2所定マッピング関係に基づいて、前記第1テキストに対応する第1テキストベクトル表現と、前記第2テキストに対応する第2テキストベクトル表現とを決定するように構成される第2表現決定モジュールと、
前記第1テキストベクトル表現の第3特徴及び前記第2テキストベクトル表現の第4特徴を抽出するように構成された第2特徴抽出モジュールと、
さらに前記第3特徴及び前記第4特徴に基づいて前記テキスト相関度を確定するように構成される特徴に基づく相関度確定モジュールとをさらに含む、請求項11に記載の装置。 - 1つ又は複数のプロセッサと、
1つ又は複数のプログラムを格納するための記憶装置であって、前記1つ又は複数のプログラムが前記1つ又は複数のプロセッサによって実行されるとき、前記1つ又は複数のプロセッサに請求項1〜10のいずれか1項に記載の方法を実現させる記憶装置とを含む、電子機器。 - コンピュータプログラムが格納されているコンピュータ可読記憶媒体であって、
前記プログラムがプロセッサにより実行されるとき、請求項1〜10のいずれか1項に記載の方法を実現するコンピュータ可読記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910093336.X | 2019-01-30 | ||
CN201910093336.XA CN109871428B (zh) | 2019-01-30 | 2019-01-30 | 用于确定文本相关度的方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020123318A true JP2020123318A (ja) | 2020-08-13 |
JP6975377B2 JP6975377B2 (ja) | 2021-12-01 |
Family
ID=66918312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019210903A Active JP6975377B2 (ja) | 2019-01-30 | 2019-11-21 | テキスト相関度を確定するためのコンピュータ実施方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11520812B2 (ja) |
EP (1) | EP3690672A1 (ja) |
JP (1) | JP6975377B2 (ja) |
KR (1) | KR102564144B1 (ja) |
CN (1) | CN109871428B (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022050379A (ja) * | 2021-02-09 | 2022-03-30 | ペキン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
WO2022149400A1 (ja) * | 2021-01-08 | 2022-07-14 | ソニーグループ株式会社 | 情報処理装置および情報処理方法 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11580127B1 (en) | 2018-12-21 | 2023-02-14 | Wells Fargo Bank, N.A. | User interfaces for database visualizations |
CN110738059B (zh) * | 2019-10-21 | 2023-07-14 | 支付宝(杭州)信息技术有限公司 | 一种文本相似度计算方法及系统 |
CN111159485B (zh) * | 2019-12-30 | 2020-11-13 | 科大讯飞(苏州)科技有限公司 | 尾实体链接方法、装置、服务器及存储介质 |
US11687570B2 (en) * | 2020-02-03 | 2023-06-27 | Samsung Electronics Co., Ltd. | System and method for efficient multi-relational entity understanding and retrieval |
DE102020109953A1 (de) * | 2020-04-09 | 2021-10-14 | Contexon GmbH | Verfahren und Computersystem zur Bestimmung der Relevanz eines Textes |
CN111428514A (zh) * | 2020-06-12 | 2020-07-17 | 北京百度网讯科技有限公司 | 语义匹配方法、装置、设备以及存储介质 |
CN111753055B (zh) * | 2020-06-28 | 2024-01-26 | 中国银行股份有限公司 | 一种客户问答自动提示方法及装置 |
CN112216359B (zh) * | 2020-09-29 | 2024-03-26 | 百度国际科技(深圳)有限公司 | 医疗数据校验方法、装置及电子设备 |
CN112507684B (zh) * | 2020-11-30 | 2023-09-22 | 北京百度网讯科技有限公司 | 用于检测原创文本的方法、装置、电子设备及存储介质 |
CN112613315B (zh) * | 2020-12-29 | 2024-06-07 | 重庆农村商业银行股份有限公司 | 一种文本知识自动抽取方法、装置、设备及存储介质 |
CN112769625B (zh) * | 2021-01-29 | 2021-11-30 | 广州技象科技有限公司 | 一种配置数据的分组配置方法及装置 |
CN112906368B (zh) * | 2021-02-19 | 2022-09-02 | 北京百度网讯科技有限公司 | 行业文本增量方法、相关装置及计算机程序产品 |
CN113554053B (zh) * | 2021-05-20 | 2023-06-20 | 重庆康洲大数据有限公司 | 一种比较中药处方相似性的方法 |
US20230140791A1 (en) * | 2021-10-29 | 2023-05-04 | International Business Machines Corporation | Programming task supporting material generation |
US11768837B1 (en) | 2021-12-28 | 2023-09-26 | Wells Fargo Bank, N.A. | Semantic entity search using vector space |
US12072918B1 (en) | 2021-12-28 | 2024-08-27 | Wells Fargo Bank, N.A. | Machine learning using knowledge graphs |
US11880379B1 (en) | 2022-04-28 | 2024-01-23 | Wells Fargo Bank, N.A. | Identity resolution in knowledge graph databases |
CN115861715B (zh) * | 2023-02-15 | 2023-05-09 | 创意信息技术股份有限公司 | 基于知识表示增强的图像目标关系识别算法 |
CN116028597B (zh) * | 2023-03-27 | 2023-07-21 | 南京燧坤智能科技有限公司 | 对象检索方法、装置、非易失性存储介质及计算机设备 |
CN116721730B (zh) * | 2023-06-15 | 2024-03-08 | 医途(杭州)科技有限公司 | 一种基于数字疗法的患者全程管理系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006065387A (ja) * | 2004-08-24 | 2006-03-09 | Fuji Xerox Co Ltd | テキスト文検索装置、テキスト文検索方法、及びテキスト文検索プログラム |
WO2011078186A1 (ja) * | 2009-12-22 | 2011-06-30 | 日本電気株式会社 | 文書クラスタリングシステム、文書クラスタリング方法および記録媒体 |
JP2018181259A (ja) * | 2017-04-21 | 2018-11-15 | 日本電信電話株式会社 | 対話ルール照合装置、対話装置、対話ルール照合方法、対話方法、対話ルール照合プログラム、及び対話プログラム |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6766316B2 (en) | 2001-01-18 | 2004-07-20 | Science Applications International Corporation | Method and system of ranking and clustering for document indexing and retrieval |
RU2488877C2 (ru) * | 2007-08-31 | 2013-07-27 | Майкрософт Корпорейшн | Идентификация семантических взаимоотношений в косвенной речи |
US9201927B1 (en) * | 2009-01-07 | 2015-12-01 | Guangsheng Zhang | System and methods for quantitative assessment of information in natural language contents and for determining relevance using association data |
US8458171B2 (en) * | 2009-01-30 | 2013-06-04 | Google Inc. | Identifying query aspects |
WO2010105216A2 (en) * | 2009-03-13 | 2010-09-16 | Invention Machine Corporation | System and method for automatic semantic labeling of natural language texts |
IN2013CH04333A (ja) * | 2013-09-25 | 2015-08-28 | Accenture Global Services Ltd | |
CN103678281B (zh) * | 2013-12-31 | 2016-10-19 | 北京百度网讯科技有限公司 | 对文本进行自动标注的方法和装置 |
CN105701083A (zh) * | 2014-11-28 | 2016-06-22 | 国际商业机器公司 | 文本表示方法和装置 |
KR20160120583A (ko) * | 2015-04-08 | 2016-10-18 | 주식회사 노스트 | 지식 관리 시스템 및 이의 지식 구조 기반의 자료 관리 방법 |
KR101662450B1 (ko) * | 2015-05-29 | 2016-10-05 | 포항공과대학교 산학협력단 | 다중 소스 하이브리드 질의응답 방법 및 시스템 |
CN105279264B (zh) * | 2015-10-26 | 2018-07-03 | 深圳市智搜信息技术有限公司 | 一种文档的语义相关度计算方法 |
CN106844368B (zh) | 2015-12-03 | 2020-06-16 | 华为技术有限公司 | 用于人机对话的方法、神经网络系统和用户设备 |
KR101768852B1 (ko) * | 2016-01-26 | 2017-08-17 | 경북대학교 산학협력단 | 트리플 데이터의 생성 방법 및 시스템 |
US10127274B2 (en) | 2016-02-08 | 2018-11-13 | Taiger Spain Sl | System and method for querying questions and answers |
KR102457821B1 (ko) | 2016-03-15 | 2022-10-24 | 한국전자통신연구원 | 자연어 이해 및 질의응답 기반의 의사결정 지원 장치 및 방법 |
KR101992399B1 (ko) | 2016-07-05 | 2019-06-24 | 한국전자통신연구원 | 하이브리드 추론 기반의 자연어 질의응답 시스템 및 그 방법 |
KR101914853B1 (ko) * | 2017-02-08 | 2018-11-02 | 경북대학교 산학협력단 | 논리적 속성이 반영된 지식 그래프 임베딩 방법 및 시스템, 이를 수행하기 위한 기록매체 |
US10798027B2 (en) * | 2017-03-05 | 2020-10-06 | Microsoft Technology Licensing, Llc | Personalized communications using semantic memory |
CN108304381B (zh) * | 2018-01-25 | 2021-09-21 | 北京百度网讯科技有限公司 | 基于人工智能的实体建边方法、装置、设备及存储介质 |
-
2019
- 2019-01-30 CN CN201910093336.XA patent/CN109871428B/zh active Active
- 2019-11-20 US US16/689,862 patent/US11520812B2/en active Active
- 2019-11-21 EP EP19210678.9A patent/EP3690672A1/en not_active Ceased
- 2019-11-21 JP JP2019210903A patent/JP6975377B2/ja active Active
- 2019-12-10 KR KR1020190163710A patent/KR102564144B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006065387A (ja) * | 2004-08-24 | 2006-03-09 | Fuji Xerox Co Ltd | テキスト文検索装置、テキスト文検索方法、及びテキスト文検索プログラム |
WO2011078186A1 (ja) * | 2009-12-22 | 2011-06-30 | 日本電気株式会社 | 文書クラスタリングシステム、文書クラスタリング方法および記録媒体 |
JP2018181259A (ja) * | 2017-04-21 | 2018-11-15 | 日本電信電話株式会社 | 対話ルール照合装置、対話装置、対話ルール照合方法、対話方法、対話ルール照合プログラム、及び対話プログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022149400A1 (ja) * | 2021-01-08 | 2022-07-14 | ソニーグループ株式会社 | 情報処理装置および情報処理方法 |
JP2022050379A (ja) * | 2021-02-09 | 2022-03-30 | ペキン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
JP7301922B2 (ja) | 2021-02-09 | 2023-07-03 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN109871428A (zh) | 2019-06-11 |
KR20200094627A (ko) | 2020-08-07 |
KR102564144B1 (ko) | 2023-08-08 |
JP6975377B2 (ja) | 2021-12-01 |
US20200242140A1 (en) | 2020-07-30 |
US11520812B2 (en) | 2022-12-06 |
EP3690672A1 (en) | 2020-08-05 |
CN109871428B (zh) | 2022-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6975377B2 (ja) | テキスト相関度を確定するためのコンピュータ実施方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム | |
Lin et al. | A structured self-attentive sentence embedding | |
US11227118B2 (en) | Methods, devices, and systems for constructing intelligent knowledge base | |
US9898773B2 (en) | Multilingual content based recommendation system | |
CN108681557B (zh) | 基于自扩充表示和相似双向约束的短文本主题发现方法及系统 | |
US10755179B2 (en) | Methods and apparatus for identifying concepts corresponding to input information | |
US9514098B1 (en) | Iteratively learning coreference embeddings of noun phrases using feature representations that include distributed word representations of the noun phrases | |
CN110162771B (zh) | 事件触发词的识别方法、装置、电子设备 | |
CN112966091B (zh) | 一种融合实体信息与热度的知识图谱推荐系统 | |
KR102695381B1 (ko) | 엔티티-속성 관계 식별 | |
JP2015518210A (ja) | 製品に関連するデータを体系化する方法、装置及びコンピュータ読み取り可能な媒体 | |
Sarkhel et al. | Visual segmentation for information extraction from heterogeneous visually rich documents | |
Maurya et al. | Deceptive opinion spam detection approaches: a literature survey | |
Qian et al. | Detecting new Chinese words from massive domain texts with word embedding | |
KR20180129001A (ko) | 다언어 특질 투영된 개체 공간 기반 개체 요약본 생성 방법 및 시스템 | |
Çoban et al. | Facebook tells me your gender: an exploratory study of gender prediction for Turkish Facebook users | |
Dadure et al. | Embedding and generalization of formula with context in the retrieval of mathematical information | |
Mohammadi et al. | Context-specific recommendation system for predicting similar pubmed articles | |
Kayed et al. | Postal address extraction from the web: a comprehensive survey | |
Xu et al. | Measuring semantic relatedness between flickr images: from a social tag based view | |
Zhang et al. | A tag recommendation system for folksonomy | |
CN115878761A (zh) | 事件脉络生成方法、设备及介质 | |
CN115129871A (zh) | 文本类别确定方法、装置、计算机设备和存储介质 | |
Rao et al. | Automatic identification of conceptual structures using deep Boltzmann machines | |
Sheng et al. | A Markov network based passage retrieval method for multimodal question answering in the cultural heritage domain |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191129 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210928 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211019 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6975377 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |