JP5825676B2 - ノン・ファクトイド型質問応答システム及びコンピュータプログラム - Google Patents
ノン・ファクトイド型質問応答システム及びコンピュータプログラム Download PDFInfo
- Publication number
- JP5825676B2 JP5825676B2 JP2012036972A JP2012036972A JP5825676B2 JP 5825676 B2 JP5825676 B2 JP 5825676B2 JP 2012036972 A JP2012036972 A JP 2012036972A JP 2012036972 A JP2012036972 A JP 2012036972A JP 5825676 B2 JP5825676 B2 JP 5825676B2
- Authority
- JP
- Japan
- Prior art keywords
- question
- answer
- evaluation
- candidate
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004590 computer program Methods 0.000 title claims description 10
- 238000011156 evaluation Methods 0.000 claims description 109
- 238000004458 analytical method Methods 0.000 claims description 71
- 238000006243 chemical reaction Methods 0.000 claims description 25
- 230000004044 response Effects 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 16
- 230000000877 morphologic effect Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 description 54
- 238000012706 support-vector machine Methods 0.000 description 33
- 238000002474 experimental method Methods 0.000 description 15
- 238000000034 method Methods 0.000 description 15
- 238000013500 data storage Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 108010057081 Merozoite Surface Protein 1 Proteins 0.000 description 3
- 101100478997 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SWC3 gene Proteins 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013179 statistical model Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 208000020997 susceptibility to multiple system atrophy 1 Diseases 0.000 description 3
- 101000667209 Homo sapiens Vacuolar protein sorting-associated protein 72 homolog Proteins 0.000 description 2
- 102100039098 Vacuolar protein sorting-associated protein 72 homolog Human genes 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012854 evaluation process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- APCLRHPWFCQIMG-UHFFFAOYSA-N 4-(5,6-dimethoxy-1-benzothiophen-2-yl)-4-oxobutanoic acid Chemical compound C1=C(OC)C(OC)=CC2=C1SC(C(=O)CCC(O)=O)=C2 APCLRHPWFCQIMG-UHFFFAOYSA-N 0.000 description 1
- 241001655798 Taku Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Algebra (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本願発明では、ノン・ファクトイド型の質問とその回答との間には、以下のような関係があることに着目し、これを第1の仮定とした。すなわち、
・好ましくないことが起きると、その理由も何か好ましくないものであることが多く、
・好ましいことが起きると、その理由もまた好ましいものであることが多い、
という点に着目したものである。
Recognition by Large-scale Clustering of Dependency Relations」(http://http://www.aclweb.org/anthology-new/P/P08/P08-1047.pdf)に詳細が記載されている。
図4を参照して、本実施の形態に係るノン・ファクトイド型質問応答システム160は、予めインターネット上の大量の文書からなる文書集合164を獲得しておき、インターネット162を介してサービス利用端末166からノン・ファクトイド型の質問を受けたことに応答して、蓄積しておいた文書集合164からその質問に対する回答としてふさわしいもののリストを生成し、サービス利用端末166に返信するものである。本実施の形態では、サービス利用端末166からの質問はウェブのフォームへの入力データとしてノン・ファクトイド型質問応答システム160に送信されるものとする。
候補文検索部222としては、本実施の形態では、http://lucene.apache.org/solrで配布されているSolrを用いる。本実施の形態では、候補文検索部222は、質問文1つに対し、コーパス記憶部178に格納されている6億個の文書のうちから例えば回答を含む可能性の高い順に、トップの所定個数(例えば300個)の文書を抽出するように調整する。各候補はさらに、5つの連続する文からなる回答候補の集合に分割される。文書の分割方法の誤りにより正しい回答が得られない可能性を小さくするために、分割される文書については、互いに2つの文までは共有できるようにしている。
前記したとおり、ランキングには3種類の素性集合を用いる教師付分類器(SVM)を使用する。素性集合は、(1)質問と回答候補との形態素分析及び統語分析の結果を表す素性(「MSA」で示す。)、(2)質問と回答候補とに現れる意味的単語クラスを表す素性(「SWC」で示す。)、及び(3)評価分析の結果を表す素性(「SA」で示す。)、を含む。
MSAは、回答候補の再ランキングのために従来から広く用いられている素性である。この素性は、質問と回答候補との間の、形態素、文節、及び統語構造レベルでの結び付きを明らかにするためのものである。
phrases)、統語構造チェーンの集まりである。これらはそれぞれ、形態素分析プログラム(例えばhttp://nlp.ist.i.kyoto-u.ac.jp/index.php?JUMAN)及び構文解析プログラム(例えばhttp://nlp.ist.i.kyoto-u.ac.jp/index.php?KNP)を用いて得ることができる。
単語意味クラスとは、意味的に類似した単語の集合のことをいう。本実施の形態では、前記したKazama及びTorisawaの文献に記載された名詞のクラスタリング技術を用い、このような単語意味クラスを構築した。この文献に記載されたアルゴリズムは、意味的に類似した単語は類似した文脈に現れる傾向がある、という仮定に基づくものである。この方法は、単語間の統語的係り受け関係を文脈として扱うことにより、非動詞の係り受け関係に関する、隠れクラスについての確率モデルを以下の式(2)により定義する。
SAという素性はさらに2種類に分類される。第1は単語レベルでの評価分析である(単語の極性)。これを図8ではSA@W1〜SA@W4で表す。第2は、フレーズレベルでの評価分析である(フレーズ極性)。これらは図8ではSA@P1〜SA@P10で表す。
単語の極性は、予め準備された、単語の極性傾向のための辞書の参照により行なう。辞書としては、本実施の形態では、非特許文献3により紹介されたツールプログラムにより提供されるものを用いる。この素性は、質問中の単語の極性と、正しい回答中の単語の極性との関連を明らかにするためのものである。ここでは、前提にしたがい、学習の結果、質問中の単語の極性と、選択される回答中の単語の極性とは互いに等しいことが多くなる筈である。
本実施の形態では、評価フレーズの抽出及びその極性の判定は、既存のツールプログラム(前述の非特許文献3による。)を用いる。実験の結果、質問内の語を含まないような評価フレーズについては、正しい回答を定めるために有用ではないことがわかった。したがって、本実施の形態では、質問内の語を少なくとも1つ含むような文から抽出された評価フレーズのみを、フレーズ極性の素性生成のために用いることとした。
以上に説明した本実施の形態に係るノン・ファクトイド型の質問応答システム160の動作は、基本的に図1に示す従来のものと同様の手順を踏む。すなわち、SVM176の学習と、回答処理部170による質問の処理とである。これらに先立ち、評価処理部194で使用する評価ツール及び辞書、並びに、意味クラス変換部196で使用する統計的確率モデルを作成しておく必要がある。この確率モデルは、式(2)によるものである。さらに、多数の文を収集し、コーパス記憶部178に格納する。これらについては、既に述べたように、素性ベクトル生成部232が素性を生成するために必要な情報を作成しておき、各文に付しておく。一方、人手により作成した、質問とその回答とからなる複数の組合せ(QA文)を準備し、QA文記憶部190に格納する。これら質問と回答との組合せとしては、ある質問とその質問に対する正しい回答とからなる組とを準備する。これら質問と回答との組合せとしては、できるだけ多くの種類の質問を用いることが望ましい。そのためには、できるだけ多くの人にこのQA文の作成に参加してもらうことが理想的である。もっとも、現実的にはこの準備に参加する人の数は限定されることが多く、その点でシステムにある制約が生じ得ることはやむを得ない。
回答文ランキング部234にSVM176が組込まれることにより、回答処理部170による回答処理が可能になる。サービス利用端末166が質問を回答処理部170に送信すると、質問文解析部226及び候補文検索部222がこの質問を受ける。
上記した実施の形態により、ノン・ファクトイド型の質問に対する回答の精度としてどの向上が得られるかについて、実験により調べた。
上記実施の形態を評価するため、手作業によりテストセットを構築した。テストセットの構築は、質問の生成と、それに対する回答の検証とである。なるべく多くの人によりこのテストセットを構築することが望ましいが、実際には様々な制約から、限られた人数(4人)による作業となった。実際には質問の範囲はより広くなるであろうから、以下の実験の結果は、実際の応用に上記実施の形態を用いたときの性能の上限を示すものとなると思われる。
実験では、上記したテストセットを用い、10分割交差検定を行なうことでシステムの評価を行なった。学習には、線形カーネルを持つTinySVM(http://chasen.org/~taku/software/TinySVM/)を用いた。評価は、P@1(上位1個の精度)と、MAP(Mean Average Precision:平均適合率(AP)の平均)とにより行なった。
5つの異なるシステムについて、上記設定の実験により得られた結果を図10に示す。図10において、B−QAは、非特許文献1に記載されたシステムを発明者が実装したものであり、これが基本システムとなる。B−RankerはB−QAの回答検索システムに、形態素情報及び統語情報から得た素性(MSA)を用いた再ランキングを付加したものである。本実施の形態に係るシステムの、本実施の形態に用いたものは、「本発明」として示してあり、図8に挙げた全ての素性を利用したものである。「上限」と記載したものは、トップ20の回答候補中に正しい回答が存在するときには必ずその上位n個の回答候補の中にn個の正しい回答を全て挙げるようなシステムのことを指す。これは、本実験で期待できる最上の結果(上限)を示す。各システムによる結果を上限システムと比較したものをカッコ内に示す。
以上のようにこの実施の形態によれば、上記した仮定に基づき、質問中の評価フレーズと、回答候補中の評価フレーズとを特定し、それらの極性が同じである場合に回答候補が正しいものである、とする考えに基づいて素性を選択することにより、回答検索の精度の向上を得ることができた。さらに、そのような評価に関する統計的モデルを学習する際に、質問が広い範囲にわたる可能性があること、それに対して学習のためのデータの範囲及び数には限りがあることに鑑み、質問及び回答候補中の名詞について、意味クラスを導入し、それら名詞を意味クラスに置換えたものを素性として導入した。これら素性の導入により、回答を検索する対象となるコーパスが非常に多くの文を含み、かつ学習データに限りがある場合であっても、従来のノン・ファクトイド型の質問応答システムと比較して大きく精度が向上したノン・ファクトイド型の質問応答システムを得ることができた。
この実施の形態のシステムのうち、回答処理部170及び学習処理部172はそれぞれ、コンピュータハードウェアと、そのコンピュータハードウェアにより実行されるプログラムと、コンピュータハードウェアに格納されるデータとにより実現される。両者が同一のコンピュータハードウェア内に実装されてもよい。図12はこのコンピュータシステム330の外観を示し、図13はコンピュータシステム330の内部構成を示す。
40、170 回答処理部
42、172 学習処理部
44、166 サービス利用端末
46、176 SVM
48、178 コーパス記憶部
50、174 回答文リスト
60、190 QA文記憶部
62、198 学習データ生成部
64、200 学習データ記憶部
66 学習処理部
82、222 候補文検索部
84、224 回答候補文記憶部
86、226 質問文解析部
88、232 素性ベクトル生成部
90、234 回答文ランキング部
160 ノン・ファクトイド型の質問応答システム
192 QA文解析部
194、228 評価処理部
196、230 意味クラス変換部
Claims (6)
- ノン・ファクトイド型の質問の入力を受け、当該質問に対する回答を生成するノン・ファクトイド型の質問応答システムであって、
処理対象の言語の文書であって、コンピュータ読取可能な文書からなるコーパスを記憶するためのコーパス記憶手段に接続されて用いられ、
質問の入力を受けたことに応答して、前記コーパス記憶手段から、当該質問に対する複数個の回答候補を検索し取り出すための候補検索手段と、
質問の入力を受けたことに応答して、当該質問と、前記候補検索手段に記憶された回答候補の各々との組合せについて、所定の素性の集合を生成するための素性生成手段と、
前記素性生成手段により生成される前記素性の集合が与えられると、当該素性の集合を生成する元となった質問及び回答候補の組合せについて、当該回答候補が当該質問に対する正しい回答である度合いを示すスコアを算出するように予め学習されたスコア算出手段と、
前記質問と、前記回答候補に記憶された回答候補の各々との組合せについて、前記スコア算出手段により算出されたスコアに基づき、前記質問に対する正しい回答である可能性が最も高い回答候補を前記質問に対する回答として出力する回答選択手段とを含み、
前記候補検索手段により検索された回答候補の各々には、前記素性生成手段による素性の生成に必要な情報が付されており、
前記素性生成手段は、
前記質問について、形態素解析及び構文解析を行ない、形態素情報及び統語情報を出力するための構文解析手段と、
前記質問のうち、ある評価基準にしたがって第1の評価クラスに分類されるフレーズと第2の評価クラスに分類されるフレーズとを特定するための評価手段とを含み、前記第1の評価クラス及び第2の評価クラスには、それぞれ互いに相反する評価の極性が割当てられており、
前記質問応答システムはさらに、前記質問と、前記回答候補の各々との組合せについて、前記構文解析手段による解析結果と、前記評価手段により特定されたフレーズの箇所及びその評価クラスの極性と、前記回答候補に付されている素性生成用の情報とに基づいて、前記素性の集合を生成するための素性集合生成手段を含む、ノン・ファクトイド型の質問応答システム。 - 請求項1に記載のノン・ファクトイド型の質問応答システムであって、
前記素性生成手段はさらに、前記構文解析手段の出力に含まれる各名詞を、予め準備された、複数個の、単語の意味クラスのいずれかに分類し、当該名詞を対応する意味クラスに変換するための意味クラス変換手段を含み、
前記素性集合生成手段は、前記質問と、前記回答候補の各々との組合せについて、前記構文解析手段による解析結果と、前記評価手段により特定されたフレーズの箇所及びその評価クラスの極性と、前記意味クラス変換手段による変換がされた後の前記構文解析手段の出力と、前記回答候補に付されている素性生成用の情報とに基づいて、前記素性の集合を生成するための第1の手段を含む、請求項1に記載のノン・ファクトイド型の質問応答システム。 - 前記第1の手段が、前記評価手段により特定されたフレーズの箇所及び評価クラスの極性に基づいて生成する素性は、質問中のフレーズの評価クラスの極性と、回答候補中のフレーズの評価クラスの極性とが一致するか否かを示す情報を含む、請求項2に記載のノン・ファクトイド型の質問応答システム。
- 前記第1の手段が生成する素性は、前記構文解析手段の出力から得られ、前記評価手段の出力又は前記意味クラス変換手段の出力を用いずに得られる素性と、前記構文解析手段の出力に、前記評価手段の出力を組合せて得られる素性と、前記構文解析手段の出力に、前記意味クラス変換手段の出力を組合せて得られる素性とを含む、請求項2に記載のノン・ファクトイド型の質問応答システム。
- 前記第1の手段が生成する素性は、前記構文解析手段の出力に、前記評価手段の出力を組合せ、さらに前記意味クラス変換手段の出力を組合せて得られる素性を含む、請求項2に記載のノン・ファクトイド型の質問応答システム。
- ノン・ファクトイド型の質問の入力を受け、当該質問に対する回答を生成するノン・ファクトイド型の質問応答システムをコンピュータにより実現させるコンピュータプログラムであって、
前記コンピュータは、処理対象の言語の文書であって、コンピュータ読取可能な文書からなるコーパスを記憶するためのコーパス記憶手段に接続され、
前記コンピュータプログラムは、前記コンピュータを、
質問の入力を受けたことに応答して、前記コーパス記憶手段から、当該質問に対する複数個の回答候補を検索し取り出すための候補検索手段と、
質問の入力を受けたことに応答して、当該質問と、前記候補検索手段に記憶された回答候補の各々との組合せについて、所定の素性の集合を生成するための素性生成手段と、
前記素性生成手段により生成される前記素性の集合が与えられると、当該素性の集合を生成する元となった質問及び回答候補の組合せについて、当該回答候補が当該質問に対する正しい回答である度合いを示すスコアを算出するように予め学習されたスコア算出手段と、
前記質問と、前記回答候補に記憶された回答候補の各々との組合せについて、前記スコア算出手段により算出されたスコアに基づき、前記質問に対する正しい回答である可能性が最も高い回答候補を前記質問に対する回答として出力する回答選択手段として機能させ、
前記候補検索手段により検索された回答候補の各々には、前記素性生成手段による素性の生成に必要な情報が付されており、
前記コンピュータを前記素性生成手段として機能させるプログラム部分は、前記コンピュータを、
前記質問について、形態素解析及び構文解析を行ない、形態素情報及び統語情報を出力するための構文解析手段と、
前記質問のうち、ある評価基準にしたがって第1の評価クラスに分類されるフレーズと、第2の評価クラスに分類されるフレーズとを特定するための評価手段として機能させ、前記第1の評価クラス及び第2の評価クラスには、それぞれ互いに相反する評価の極性が割当てられており、
前記コンピュータプログラムはさらに、前記コンピュータを、前記質問と、前記回答候補の各々との組合せについて、前記構文解析手段による解析結果と、前記評価手段により特定されたフレーズの箇所及びその評価クラスの極性と、前記回答候補に付されている素性生成用の情報とに基づいて、前記素性の集合を生成するための素性集合生成手段として機能させる、コンピュータプログラム。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012036972A JP5825676B2 (ja) | 2012-02-23 | 2012-02-23 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
EP13751215.8A EP2819031A4 (en) | 2012-02-23 | 2013-01-23 | SYSTEM FOR ANSWERING QUESTIONS WITHOUT FACTORY AND COMPUTER PROGRAM THEREFOR |
US14/377,999 US9697477B2 (en) | 2012-02-23 | 2013-01-23 | Non-factoid question-answering system and computer program |
PCT/JP2013/051327 WO2013125286A1 (ja) | 2012-02-23 | 2013-01-23 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
CN201380010249.4A CN104137102B (zh) | 2012-02-23 | 2013-01-23 | 非事实型询问应答系统以及方法 |
KR1020147023478A KR101968102B1 (ko) | 2012-02-23 | 2013-01-23 | 논팩토이드형 질의 응답 시스템 및 컴퓨터 프로그램 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012036972A JP5825676B2 (ja) | 2012-02-23 | 2012-02-23 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013171550A JP2013171550A (ja) | 2013-09-02 |
JP5825676B2 true JP5825676B2 (ja) | 2015-12-02 |
Family
ID=49005480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012036972A Active JP5825676B2 (ja) | 2012-02-23 | 2012-02-23 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US9697477B2 (ja) |
EP (1) | EP2819031A4 (ja) |
JP (1) | JP5825676B2 (ja) |
KR (1) | KR101968102B1 (ja) |
CN (1) | CN104137102B (ja) |
WO (1) | WO2013125286A1 (ja) |
Families Citing this family (76)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9634855B2 (en) | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
JP5825676B2 (ja) * | 2012-02-23 | 2015-12-02 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
JP6150282B2 (ja) * | 2013-06-27 | 2017-06-21 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
US9471874B2 (en) * | 2013-12-07 | 2016-10-18 | International Business Machines Corporation | Mining forums for solutions to questions and scoring candidate answers |
US9276939B2 (en) * | 2013-12-17 | 2016-03-01 | International Business Machines Corporation | Managing user access to query results |
KR101559376B1 (ko) | 2014-02-24 | 2015-10-12 | 서울대학교산학협력단 | 엔트로피를 최대화하는 실시간 조합 자질 구축 방법 및 이를 수행하는 조합 자질 구축 장치 |
US9471601B2 (en) | 2014-03-25 | 2016-10-18 | International Business Machines Corporation | Images for a question answering system |
US9754207B2 (en) | 2014-07-28 | 2017-09-05 | International Business Machines Corporation | Corpus quality analysis |
US9886479B2 (en) | 2014-07-29 | 2018-02-06 | International Business Machines Corporation | Managing credibility for a question answering system |
JP6414956B2 (ja) | 2014-08-21 | 2018-10-31 | 国立研究開発法人情報通信研究機構 | 質問文生成装置及びコンピュータプログラム |
KR101581816B1 (ko) * | 2014-10-14 | 2016-01-05 | 서강대학교산학협력단 | 기계학습을 이용한 음성인식방법 |
US9946763B2 (en) * | 2014-11-05 | 2018-04-17 | International Business Machines Corporation | Evaluating passages in a question answering computer system |
US20160125437A1 (en) * | 2014-11-05 | 2016-05-05 | International Business Machines Corporation | Answer sequence discovery and generation |
KR102094934B1 (ko) * | 2014-11-19 | 2020-03-31 | 한국전자통신연구원 | 자연어 질의 응답 시스템 및 방법 |
JP6087333B2 (ja) | 2014-11-26 | 2017-03-01 | 株式会社ユニバーサルエンターテインメント | 情報提供システム、情報提供方法、及びプログラム |
JP6345577B2 (ja) | 2014-11-26 | 2018-06-20 | 株式会社ユニバーサルエンターテインメント | 情報提供システム、情報提供方法、プログラム、及びデータ構造 |
US10061842B2 (en) | 2014-12-09 | 2018-08-28 | International Business Machines Corporation | Displaying answers in accordance with answer classifications |
US10127284B2 (en) * | 2014-12-18 | 2018-11-13 | International Business Machines Corporation | Scoring attributes in deep question answering systems based on algorithmic source code influences |
US9928269B2 (en) * | 2015-01-03 | 2018-03-27 | International Business Machines Corporation | Apply corrections to an ingested corpus |
JP6551968B2 (ja) * | 2015-03-06 | 2019-07-31 | 国立研究開発法人情報通信研究機構 | 含意ペア拡張装置、そのためのコンピュータプログラム、及び質問応答システム |
CN104794109B (zh) * | 2015-04-09 | 2017-06-23 | 山西大学 | 一种应用于学习机的智能解答系统 |
US10102275B2 (en) | 2015-05-27 | 2018-10-16 | International Business Machines Corporation | User interface for a query answering system |
US9727552B2 (en) | 2015-05-27 | 2017-08-08 | International Business Machines Corporation | Utilizing a dialectical model in a question answering system |
FR3037843B1 (fr) * | 2015-06-24 | 2018-01-05 | Gaztransport Et Technigaz | Procede et dispositif de decoupe de matiere isolante fibreuse ou alveolaire |
US10223440B2 (en) * | 2015-06-29 | 2019-03-05 | International Business Machines Corporation | Question and answer system emulating people and clusters of blended people |
JP6544131B2 (ja) * | 2015-08-14 | 2019-07-17 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
JP6618735B2 (ja) * | 2015-08-31 | 2019-12-11 | 国立研究開発法人情報通信研究機構 | 質問応答システムの訓練装置及びそのためのコンピュータプログラム |
US10146858B2 (en) | 2015-12-11 | 2018-12-04 | International Business Machines Corporation | Discrepancy handler for document ingestion into a corpus for a cognitive computing system |
CN105630917A (zh) * | 2015-12-22 | 2016-06-01 | 成都小多科技有限公司 | 智能应答方法及装置 |
US10176250B2 (en) | 2016-01-12 | 2019-01-08 | International Business Machines Corporation | Automated curation of documents in a corpus for a cognitive computing system |
US9842161B2 (en) | 2016-01-12 | 2017-12-12 | International Business Machines Corporation | Discrepancy curator for documents in a corpus of a cognitive computing system |
US9720981B1 (en) | 2016-02-25 | 2017-08-01 | International Business Machines Corporation | Multiple instance machine learning for question answering systems |
JP6623852B2 (ja) * | 2016-03-09 | 2019-12-25 | 富士通株式会社 | 検索制御プログラム、検索制御装置及び検索制御方法 |
US10592519B2 (en) | 2016-03-29 | 2020-03-17 | Microsoft Technology Licensing, Llc | Computational-model operation using multiple subject representations |
US20170293621A1 (en) * | 2016-04-06 | 2017-10-12 | International Business Machines Corporation | Natural language processing based on textual polarity |
US10706044B2 (en) | 2016-04-06 | 2020-07-07 | International Business Machines Corporation | Natural language processing based on textual polarity |
US20170293620A1 (en) * | 2016-04-06 | 2017-10-12 | International Business Machines Corporation | Natural language processing based on textual polarity |
CN107402912B (zh) * | 2016-05-19 | 2019-12-31 | 北京京东尚科信息技术有限公司 | 解析语义的方法和装置 |
JP6767042B2 (ja) * | 2016-09-26 | 2020-10-14 | 国立研究開発法人情報通信研究機構 | シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム |
JP6721179B2 (ja) * | 2016-10-05 | 2020-07-08 | 国立研究開発法人情報通信研究機構 | 因果関係認識装置及びそのためのコンピュータプログラム |
WO2018066489A1 (ja) * | 2016-10-07 | 2018-04-12 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム |
JP6929539B2 (ja) * | 2016-10-07 | 2021-09-01 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及び方法並びにそのためのコンピュータプログラム |
US10699215B2 (en) * | 2016-11-16 | 2020-06-30 | International Business Machines Corporation | Self-training of question answering system using question profiles |
US10303763B2 (en) * | 2017-01-06 | 2019-05-28 | International Business Machines Corporation | Process for identifying completion of domain adaptation dictionary activities |
JP2019020893A (ja) | 2017-07-13 | 2019-02-07 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答装置 |
JP6218057B1 (ja) * | 2017-07-14 | 2017-10-25 | Jeインターナショナル株式会社 | 自動応答サーバー装置、端末装置、応答システム、応答方法、およびプログラム |
US10902738B2 (en) * | 2017-08-03 | 2021-01-26 | Microsoft Technology Licensing, Llc | Neural models for key phrase detection and question generation |
JP6972788B2 (ja) | 2017-08-31 | 2021-11-24 | 富士通株式会社 | 特定プログラム、特定方法および情報処理装置 |
US10387572B2 (en) * | 2017-09-15 | 2019-08-20 | International Business Machines Corporation | Training data update |
US11409749B2 (en) * | 2017-11-09 | 2022-08-09 | Microsoft Technology Licensing, Llc | Machine reading comprehension system for answering queries related to a document |
KR102005525B1 (ko) * | 2017-12-29 | 2019-07-30 | (주)헤르스 | 딥러닝 기술을 활용한 화학물질 안전관리의 질의응답 관리시스템 |
US11449762B2 (en) | 2018-02-20 | 2022-09-20 | Pearson Education, Inc. | Real time development of auto scoring essay models for custom created prompts |
US11475245B2 (en) | 2018-02-20 | 2022-10-18 | Pearson Education, Inc. | Systems and methods for automated evaluation model customization |
JP6691340B2 (ja) | 2018-03-07 | 2020-04-28 | 株式会社哲英 | 質問応答システム、質問受付回答システム、第1次回答システム、及びそれらを用いた質問応答方法 |
JP6772213B2 (ja) * | 2018-04-23 | 2020-10-21 | 日本電信電話株式会社 | 質問応答装置、質問応答方法及びプログラム |
US11106664B2 (en) * | 2018-05-03 | 2021-08-31 | Thomson Reuters Enterprise Centre Gmbh | Systems and methods for generating a contextually and conversationally correct response to a query |
JP7126682B2 (ja) * | 2018-05-11 | 2022-08-29 | 国立研究開発法人情報通信研究機構 | 対話システム及びそのコンピュータプログラム |
CN110489531B (zh) * | 2018-05-11 | 2023-05-30 | 阿里巴巴集团控股有限公司 | 高频问题的确定方法和装置 |
WO2020031242A1 (ja) | 2018-08-06 | 2020-02-13 | 富士通株式会社 | 評価プログラム、評価方法および情報処理装置 |
RU2704738C1 (ru) * | 2018-10-15 | 2019-10-30 | Общество с ограниченной ответственностью "Уралинновация" | Автоматизированная информационно-голосовая вопросно-ответная система |
US11822588B2 (en) * | 2018-10-24 | 2023-11-21 | International Business Machines Corporation | Supporting passage ranking in question answering (QA) system |
CN109739956B (zh) * | 2018-11-08 | 2020-04-10 | 第四范式(北京)技术有限公司 | 语料清洗方法、装置、设备及介质 |
CN111309875B (zh) * | 2018-12-10 | 2023-08-04 | 百度在线网络技术(北京)有限公司 | 问题应答的方法、装置、设备和存储介质 |
CN111382573A (zh) * | 2018-12-12 | 2020-07-07 | 百度在线网络技术(北京)有限公司 | 用于答案质量评估的方法、装置、设备和存储介质 |
JP6899973B2 (ja) * | 2019-01-08 | 2021-07-07 | 三菱電機株式会社 | 意味関係学習装置、意味関係学習方法、及び意味関係学習プログラム |
US11093491B2 (en) | 2019-01-16 | 2021-08-17 | International Business Machines Corporation | Question answering system using topic-sensitive source reliability scoring |
US11262978B1 (en) * | 2019-06-19 | 2022-03-01 | Amazon Technologies, Inc. | Voice-adapted reformulation of web-based answers |
CN110837738B (zh) * | 2019-09-24 | 2023-06-30 | 平安科技(深圳)有限公司 | 相似问识别方法、装置、计算机设备及存储介质 |
RU2722461C1 (ru) * | 2019-11-19 | 2020-06-01 | Общество с ограниченной ответственностью "Уралинновация" | Голосовая роботизированная вопросно-ответная система и способ ее автоматического взаимодействия с электронным устройством пользователя |
RU2724600C1 (ru) * | 2019-11-19 | 2020-06-25 | Общество с ограниченной ответственностью "Уралинновация" | Голосовая роботизированная вопросно-ответная система и способ ее автоматического взаимодействия с электронным устройством пользователя |
CN111339268B (zh) * | 2020-02-19 | 2023-08-15 | 北京百度网讯科技有限公司 | 实体词识别方法和装置 |
US20210279605A1 (en) * | 2020-03-06 | 2021-09-09 | International Business Machines Corporation | Efficiently generating accurate responses to a multi-facet question by a question answering system |
JP7568359B2 (ja) | 2020-06-04 | 2024-10-16 | 東京エレクトロン株式会社 | サーバ装置、顧客サポートサービス提供方法及び顧客サポートサービス提供プログラム |
US20220318230A1 (en) * | 2021-04-05 | 2022-10-06 | Vianai Systems, Inc. | Text to question-answer model system |
CN114462422A (zh) * | 2022-02-10 | 2022-05-10 | 北京融汇金信信息技术有限公司 | 反事实数据生成方法及装置 |
CN115455160B (zh) * | 2022-09-02 | 2024-08-06 | 腾讯科技(深圳)有限公司 | 一种多文档阅读理解方法、装置、设备及存储介质 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002247029A (ja) * | 2000-02-02 | 2002-08-30 | Sony Corp | 認証装置、認証システムおよびその方法、処理装置、通信装置、通信制御装置、通信システムおよびその方法、情報記録方法およびその装置、情報復元方法およびその装置、その記録媒体 |
JP2004139553A (ja) * | 2002-08-19 | 2004-05-13 | Matsushita Electric Ind Co Ltd | 文書検索システムおよび質問応答システム |
CN101377777A (zh) * | 2007-09-03 | 2009-03-04 | 北京百问百答网络技术有限公司 | 一种自动问答方法和系统 |
US8543565B2 (en) * | 2007-09-07 | 2013-09-24 | At&T Intellectual Property Ii, L.P. | System and method using a discriminative learning approach for question answering |
JP5229782B2 (ja) * | 2007-11-07 | 2013-07-03 | 独立行政法人情報通信研究機構 | 質問応答装置、質問応答方法、及びプログラム |
JP5086799B2 (ja) | 2007-12-27 | 2012-11-28 | 日本電信電話株式会社 | 質問応答方法、装置、プログラム並びにそのプログラムを記録した記録媒体 |
CN101872349B (zh) | 2009-04-23 | 2013-06-19 | 国际商业机器公司 | 处理自然语言问题的方法和装置 |
KR20130021944A (ko) * | 2011-08-24 | 2013-03-06 | 한국전자통신연구원 | 서술형 질의 응답 방법 및 장치 |
JP5825676B2 (ja) * | 2012-02-23 | 2015-12-02 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
JP5924666B2 (ja) * | 2012-02-27 | 2016-05-25 | 国立研究開発法人情報通信研究機構 | 述語テンプレート収集装置、特定フレーズペア収集装置、及びそれらのためのコンピュータプログラム |
JP6206840B2 (ja) * | 2013-06-19 | 2017-10-04 | 国立研究開発法人情報通信研究機構 | テキストマッチング装置、テキスト分類装置及びそれらのためのコンピュータプログラム |
JP6150282B2 (ja) * | 2013-06-27 | 2017-06-21 | 国立研究開発法人情報通信研究機構 | ノン・ファクトイド型質問応答システム及びコンピュータプログラム |
JP6150291B2 (ja) * | 2013-10-08 | 2017-06-21 | 国立研究開発法人情報通信研究機構 | 矛盾表現収集装置及びそのためのコンピュータプログラム |
JP5904559B2 (ja) * | 2013-12-20 | 2016-04-13 | 国立研究開発法人情報通信研究機構 | シナリオ生成装置、及びそのためのコンピュータプログラム |
JP6403382B2 (ja) * | 2013-12-20 | 2018-10-10 | 国立研究開発法人情報通信研究機構 | フレーズペア収集装置、及びそのためのコンピュータプログラム |
JP5907393B2 (ja) * | 2013-12-20 | 2016-04-26 | 国立研究開発法人情報通信研究機構 | 複雑述語テンプレート収集装置、及びそのためのコンピュータプログラム |
-
2012
- 2012-02-23 JP JP2012036972A patent/JP5825676B2/ja active Active
-
2013
- 2013-01-23 KR KR1020147023478A patent/KR101968102B1/ko active IP Right Grant
- 2013-01-23 EP EP13751215.8A patent/EP2819031A4/en not_active Withdrawn
- 2013-01-23 CN CN201380010249.4A patent/CN104137102B/zh not_active Expired - Fee Related
- 2013-01-23 US US14/377,999 patent/US9697477B2/en active Active
- 2013-01-23 WO PCT/JP2013/051327 patent/WO2013125286A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US9697477B2 (en) | 2017-07-04 |
CN104137102B (zh) | 2017-06-13 |
CN104137102A (zh) | 2014-11-05 |
KR20140128346A (ko) | 2014-11-05 |
EP2819031A4 (en) | 2016-05-18 |
EP2819031A1 (en) | 2014-12-31 |
US20150026106A1 (en) | 2015-01-22 |
KR101968102B1 (ko) | 2019-04-11 |
JP2013171550A (ja) | 2013-09-02 |
WO2013125286A1 (ja) | 2013-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5825676B2 (ja) | ノン・ファクトイド型質問応答システム及びコンピュータプログラム | |
KR102256240B1 (ko) | 논팩토이드형 질의 응답 시스템 및 방법 | |
Zhou et al. | Predicting discourse connectives for implicit discourse relation recognition | |
KR102640564B1 (ko) | 질의 응답 시스템의 훈련 장치 및 그것을 위한 컴퓨터 프로그램 | |
Zhu et al. | Aspect-based opinion polling from customer reviews | |
Azmi et al. | An abstractive Arabic text summarizer with user controlled granularity | |
US8832064B2 (en) | Answer determination for natural language questioning | |
Ng | Semantic class induction and coreference resolution | |
Berber Sardinha | Chapter 1. An assessment of metaphor retrieval methods | |
Alsallal et al. | Intrinsic plagiarism detection using latent semantic indexing and stylometry | |
Alami et al. | Automatic texts summarization: Current state of the art | |
WO2015004006A1 (en) | Method and computer server system for receiving and presenting information to a user in a computer network | |
Liebeskind et al. | Semiautomatic construction of cross-period thesaurus | |
Chifu et al. | Word sense disambiguation to improve precision for ambiguous queries | |
CN109992651A (zh) | 一种问题目标特征自动识别和抽取方法 | |
Dunn et al. | Language-independent ensemble approaches to metaphor identification | |
Ben-Sghaier et al. | Ar-SLoTE: a recognizing textual entailment tool for arabic question/answering systems | |
Hong et al. | Ontology-based event relation prediction: A SUMO based study of Mandarin VV compounds | |
Tanaka et al. | Acquiring and generalizing causal inference rules from deverbal noun constructions | |
Zouaoui et al. | Ontological Approach Based on Multi-Agent System for Indexing and Filtering Arabic Docu-ments | |
Chitra et al. | Genetic algorithm based feature selection for paraphrase recognition | |
Israel et al. | Semantic analysis for focused multi-document summarization (fMDS) of text | |
Zhang et al. | An ATE system based on probabilistic relations between terms and syntactic functions | |
Rajpal et al. | A Novel Techinque For Ranking of Documents Using Semantic Similarity | |
CN119092126A (zh) | 基于时序的病情预测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150929 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151008 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5825676 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |