JP7028746B2 - Question generator and question generation method - Google Patents
Question generator and question generation method Download PDFInfo
- Publication number
- JP7028746B2 JP7028746B2 JP2018189979A JP2018189979A JP7028746B2 JP 7028746 B2 JP7028746 B2 JP 7028746B2 JP 2018189979 A JP2018189979 A JP 2018189979A JP 2018189979 A JP2018189979 A JP 2018189979A JP 7028746 B2 JP7028746 B2 JP 7028746B2
- Authority
- JP
- Japan
- Prior art keywords
- question
- tree
- candidate
- answers
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、質問生成装置および質問生成方法に関するものである。 The present invention relates to a question generator and a question generation method.
商品、サービスに関して不具合等が生じた場合、そのユーザがベンダーに問い合わせを行うことは一般的である。そのためベンダー側ではお客様対応窓口やコールセンターを運用し、そうした問い合わせに対応している。 When a problem occurs with a product or service, it is common for the user to make an inquiry to the vendor. Therefore, the vendor operates a customer service center and call center to respond to such inquiries.
しかしながら、そうした顧客対応に要するコストは小さくないため、近年ではチャットボットやIVR(Interactive Voice Response)等の自動応答システムを適宜採用し、該当業務の効率化が図られつつある。 However, since the cost required for dealing with such customers is not small, in recent years, automatic response systems such as chatbots and IVR (Interactive Voice Response) have been appropriately adopted to improve the efficiency of the relevant business.
このような自動応答システムでは、問い合わせの内容を認識し、その内容に応じた応答をコンピュータが自動実行する。この自動応答の仕組みには、いわゆるシナリオ型や一問一答型など種々のタイプが存在する。 In such an automatic response system, the computer recognizes the content of the inquiry and automatically executes a response according to the content. There are various types of this automatic response mechanism, such as a so-called scenario type and a question-and-answer type.
このうちシナリオ型の自動応答システムは、ユーザからの問い合わせを契機に、最終的な回答に至るまで、複数回のやり取りをユーザと行って回答を絞り込む。いわゆるFAQの内容を単純にシステム化した一問一答型とは異なり、多少の手間と引き換えに、ユーザの望む回答を導き出せる確率が高くなりやすい特徴がある。 Of these, the scenario-type automatic response system narrows down the answers by exchanging multiple times with the user until the final answer is reached, triggered by an inquiry from the user. Unlike the one-question-one-answer type, in which the contents of the so-called FAQ are simply systematized, there is a characteristic that the probability of being able to derive the answer desired by the user is likely to increase in exchange for some effort.
こうした自動応答技術に関連する従来技術としては、例えば、予め登録されている検索条件と、検索対象である検索データからなるデータベースとによって構成され、上記検索条件についてYes/Noで答えることによって上記検索データを絞り込むYes/No型質問木を作成するYes/No型質問木作成装置において、所定の検索条件によって検索データ群を抽出し、上記抽出された検索データ群を、任意の検索条件で検索できる検索データ群と、上記任意の検索条件では検索できない検索データ群とに分割するデータ分割手段と;上記登録されている検索条件のうちで、上記検索データ群について検索結果が在在する検索条件だけを、上記質問木を構成する検索条件として作成し、上記検索データ群を再帰的に分割する再帰的分割手段と;上記再帰的に検索データ群を分割する場合における当該検索データ群の評価値を、当該検索データ群における最大評価値という関数に代入する関数代入手段と;所定の検索条件で検索できる検索データ群の最大評価値と、上記所定の検索条件で検索できない検索データ群の最大評価値とを足し合わせた値を、当該検索条件における分割の最大評価値として決定する最大評価値決定手段と;上記最大評価値が最も大きくなるように、検索条件で検索データを分割する質問木、または、分割の対象となる検索データ群を質問木として設定する質問木設定手段と;を有することを特徴とするYes/No型質問木作成装置(特許文献1参照)などが提案されている。 As a conventional technique related to such an automatic response technique, for example, it is composed of a search condition registered in advance and a database consisting of search data to be searched, and the search is performed by answering Yes / No about the search condition. In the Yes / No type question tree creating device that narrows down the data, the search data group can be extracted according to a predetermined search condition, and the extracted search data group can be searched by any search condition. A data dividing means for dividing into a search data group and a search data group that cannot be searched by any of the above search conditions; among the above registered search conditions, only the search conditions in which the search results exist for the above search data group. Is created as a search condition constituting the question tree, and a recursive division means for recursively dividing the search data group; and an evaluation value of the search data group in the case of recursively dividing the search data group. , A function assignment means to be assigned to a function called the maximum evaluation value in the search data group; With a maximum evaluation value determining means that determines the sum of the above values as the maximum evaluation value for division in the search condition; a question tree that divides the search data according to the search condition so that the above maximum evaluation value is the largest, or , A Yes / No type question tree creating device (see Patent Document 1) characterized by having a question tree setting means for setting a search data group to be divided as a question tree; and the like have been proposed.
また、対話型検索システム及びプログラム、並びに対話シナリオ生成システム及びプログラム(特許文献2参照)や、対話シナリオに対する動的対話ノードの挿入行動を制御する対話プログラム、サーバ及び方法(特許文献3参照)なども提案されている。 Further, an interactive search system and a program, a dialogue scenario generation system and a program (see Patent Document 2), a dialogue program, a server and a method for controlling the insertion behavior of a dynamic dialogue node for a dialogue scenario (see Patent Document 3), and the like. Has also been proposed.
上述のシナリオ型の自動応答システムは、顧客対応の品質面では確かに相応の利点を有する。しかし一方で、その運用コストが大きいという課題がある。 The scenario-based automated response system described above certainly has considerable advantages in terms of customer service quality. However, on the other hand, there is a problem that the operating cost is high.
すなわち、ユーザからの問い合わせに対する回答ないし追加の問いかけを順次行うためには、そうした問いかけ等を場合分けした質問木すなわちシナリオを作成し、必要に応じてメンテナンスするが必要あり、大きなコストが継続的に発生しうる。
そこで本発明の目的は、質問木を効率的に自動生成する技術を提供することにある。
In other words, in order to answer inquiries from users or to make additional inquiries in sequence, it is necessary to create a question tree, that is, a scenario, in which such inquiries are divided into cases, and maintain them as necessary, resulting in continuous high costs. It can occur.
Therefore, an object of the present invention is to provide a technique for efficiently and automatically generating a question tree.
上記課題を解決する本発明の質問生成装置は、所定事項各々に関する各説明文を保持する記憶部と、前記各説明文の形態素解析結果に基づき、前記各説明文における各単語の有無を記述したマトリクスの生成を行う処理と、所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記各説明文のうち前記キーワードを含むものを候補説明文として特定する処理と、前記マトリクスにおける前記候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした質問木を生成する処理と、を実行する演算部とを備えることを特徴とする。 The question generator of the present invention that solves the above problems describes the presence or absence of each word in each of the explanations based on the storage unit that holds each explanation for each predetermined item and the morphological analysis result of each of the explanations. A process of generating a matrix, a process of receiving an inquiry from a predetermined terminal, and a process of specifying a candidate explanatory text among the explanatory texts including the keyword based on the keyword included in the query, and the candidate in the matrix. It is characterized by having a process of executing a decision tree analysis based on a description of an explanatory text and generating a question tree using a branch determination item as a question sentence, and a calculation unit for executing the process.
また、本発明の質問生成方法は、所定事項各々に関する各説明文を保持する記憶部を備えた情報処理装置が、前記各説明文の形態素解析結果に基づき、前記各説明文における各単語の有無を記述したマトリクスの生成を行う処理と、所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記各説明文のうち前記キーワードを含むものを候補説明文として特定する処理と、前記マトリクスにおける前記候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした質問木を生成する処理と、を実行することを特徴とする。 Further, in the question generation method of the present invention, an information processing apparatus provided with a storage unit that holds each explanatory statement for each predetermined item has a presence or absence of each word in each explanatory statement based on the morphological analysis result of each explanatory statement. A process of generating a matrix in which the above is described, a process of receiving an inquiry from a predetermined terminal, and a process of specifying one of the above explanatory texts including the keyword as a candidate explanatory text based on the keywords included in the inquiry, and the said matrix. It is characterized in that the decision tree analysis is executed based on the description regarding the candidate explanatory text in the above, and the process of generating the question tree with the branch determination item as the question text is executed.
本発明によれば、質問木を効率的に自動生成可能となる。 According to the present invention, a question tree can be efficiently and automatically generated.
---ネットワーク構成---
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態の質問生成装置100を含むネットワーク構成図である。
--- Network configuration ---
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a network configuration diagram including the
図1に示す質問生成装置100は、質問木を効率的に自動生成するコンピュータ装置である。質問生成装置100は、一例として、各種の金融サービスを顧客に提供する金融機関が運用するサーバ装置を想定できる。この質問生成装置100は、チャットボット機能を有し、或いは既存のチャットボットシステムと連動し、顧客からの問い合わせに対して、適宜な応答を自動的に行う顧客対応業務用のシステムとも言える。
The
従って本実施形態の質問生成装置100は、こうしたチャットボット機能における自動応答処理に適用する質問木を、顧客からの問い合わせ機会ごとに生成し、当該チャットボット機能に提供するものとなる。
Therefore, the
なお、図1で例示するように、質問生成装置100は、インターネットなどの適宜なネットワーク10を介して、ユーザ端末200と通信可能に接続されている。
As illustrated in FIG. 1, the
ユーザ端末200は、上述の顧客が操作する端末である。当該ユーザ端末200を操作する顧客は、所定のWEBサイトを閲覧しつつ、自身が行う問い合わせの内容を入力する。
The
上述のWEBサイトは、例えば、金融機関が運用する顧客対応業務用のサーバ(質問生成装置100も含みうる)がインターネット上で公開するWEBサイトである。
一方、ユーザ端末200は、顧客が入力した問い合わせの情報を、ネットワーク10を介して質問生成装置100に送信することとなる。
---ハードウェア構成---
The above-mentioned WEB site is, for example, a WEB site that is open to the public on the Internet by a server for customer service business operated by a financial institution (which may also include a question generation device 100).
On the other hand, the
--- Hardware configuration ---
また、本実施形態の質問生成装置100のハードウェア構成は図2に示すものとなる。すなわち本実施形態の質問生成装置100は、記憶部101、メモリ103、演算部104、入力部105、出力部106、および、通信部107、を備える。
このうち、記憶部101は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
また、メモリ103は、RAMなど揮発性記憶素子で構成される。
Further, the hardware configuration of the
Of these, the
Further, the
また、演算部104は、記憶部101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUで構成される。
また、入力部105は、ユーザからのキー入力や音声入力を受け付けるキーボード、マウス等で構成される。
また、出力部106は、処理データの表示を行うディスプレイ、スピーカー等で構成される。
Further, the
Further, the
Further, the output unit 106 is composed of a display, a speaker, and the like that display processing data.
また、通信部107は、ネットワーク10と接続して、ユーザ端末200等の他装置との通信処理を担うNFC(Network Interface Card)で構成される。
Further, the communication unit 107 is composed of an NFC (Network Interface Card) that is connected to the
なお、記憶部101内には、本実施形態の質問生成装置として必要な機能を実装する為のプログラム102に加えて、QA情報125およびマトリクス126が少なくとも記憶されている。このQA情報125およびマトリクス126の詳細については後述する。
---データ構造例---
続いて、本実施形態の質問生成装置100が用いるテーブル類について説明する。図3に、本実施形態におけるQA情報125の一例を示す。
In addition to the
--- Data structure example ---
Subsequently, the tables used by the
本実施形態のQA情報125は、上述の金融機関において生成した、いわゆるFAQなどの想定問答集である。金融機関において、顧客から問い合わせを受ける対象は、金融サービス(金融商品の概念含む)の不明点や不具合といった事項である。
The
よって、このQA情報125においては、こうした事項に関する問い合わせに対して想定される1または複数の説明分を格納している。なお、以降は「問い合わせ」を「質問」、「説明文」を「回答」と称している。
Therefore, in this
そのデータ構造は、質問と回答の組合せを一意に特定するIDをキーとして、当該組合せにおける質問、当該質問に対する回答、当該回答に関する形態素解析結果、および、回答実績、といったデータから成るレコードの集合体である。 The data structure is a collection of records consisting of data such as a question in the combination, an answer to the question, a morphological analysis result related to the answer, and an answer record, using an ID that uniquely identifies the combination of the question and the answer as a key. Is.
このうち形態素解析結果は、一般的な形態素解析プログラムにより得られるもので、上述の回答(の文章)において意味を有する最小単位に該当する。こうした形態素解析結果は、質問生成装置100が所定の形態素解析プログラムを実行した結果であってもよいし、或いは、金融機関における他の所定装置による結果であってもよい。
Of these, the morphological analysis result is obtained by a general morphological analysis program, and corresponds to the smallest unit that has meaning in the above answer (sentence). Such a morphological analysis result may be the result of the
また、回答実績は、当該組合せにおける質問に対して当該回答を顧客に返した回数や頻度を示す値である。図3で示すQA情報125の例では、一例として累積回数の値を回答実績としている。
In addition, the answer record is a value indicating the number and frequency of returning the answer to the customer for the question in the combination. In the example of
したがって、この回答実績の値が所定の基準より大きい場合、或いは、相対的に他の組合せより大きい場合、当該組合せにおける質問に対して、当該回答が用いられやすい、ことを示している。換言すれば、顧客らが不明点等を感じる機会が多い事項(の質問)に関して、そうした顧客らの条件に合致しやすい回答、であるとも言える。 Therefore, when the value of this answer record is larger than a predetermined standard, or when it is relatively larger than another combination, it indicates that the answer is likely to be used for the question in the combination. In other words, it can be said that it is an answer that easily meets the conditions of such customers regarding matters (questions) that customers often feel unclear points.
続いて図4に、本実施形態のマトリクス126の一例を示す。本実施形態のマトリクス126は、上述のQA情報125における各回答の形態素解析結果に基づき、当該各回答における各単語の有無を記述したテーブルである。
Subsequently, FIG. 4 shows an example of the
そのデータ構造は、上述のQA情報125における各組合せのIDをキーとして、当該組合せにおける回答での所定単語の有無といったデータから成るレコードの集合体である。
The data structure is a collection of records composed of data such as the presence or absence of a predetermined word in the answer in the combination, using the ID of each combination in the above-mentioned
図4の例では、上述の単語として、単語1「住所変更」、単語2「本人」、単語3「来店」、単語4「法定代理人」、・・・、といったものを示している。また、こうした単語の有無については「1」で「有」、「0」で「無」を示している。
In the example of FIG. 4, as the above-mentioned words, the
したがって、例えば、ID「TEXT1」なる組合せにおける回答では、単語1「住所変更」は「1」、単語2「本人」は「1」、単語3「来店」は「1」、単語4「法定代理人」は「0」、となっている。また、例えばID「TEXT2」なる組合せにおける回答では、単語1「住所変更」は「1」、単語2「本人」は「1」、単語3「来店」は「0」、単語4「法定代理人」は「0」、となっている。また、例えばID「TEXT3」なる組合せにおける回答では、単語1「住所変更」は「1」、単語2「本人」は「0」、単語3「来店」は「0」、単語4「法定代理人」は「1」、となっている。また、例えばID「TEXT4」なる組合せにおける回答では、単語1「住所変更」は「1」、単語2「本
人」は「0」、単語3「来店」は「0」、単語4「法定代理人」は「0」、となっている。
Therefore, for example, in the answer in the combination of ID "TEXT1", the
なお、マトリクス126には、複数のマトリクスが含まれうる。例えば、QA情報125における各回答のうち、所定期間における回答実績が所定基準以上の頻出回答であるものに関する形態素解析結果に基づき、当該頻出回答における各単語の有無を記述した頻出回答向けマトリクスが想定できる。また他にも、QA情報125における各回答のうち、上述の頻出回答以外の非頻出回答であるものに関する形態素解析結果に基づき、当該非頻出回答における各単語の有無を記述した非頻出回答向けマトリクスも想定できる。
---質問生成方法の手順について---
The
--- About the procedure of question generation method ---
以下、本実施形態における質問生成方法の実際手順について図に基づき説明する。以下で説明する質問生成方法に対応する各種動作は、質問生成装置100がメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
ここではまず、マトリクス126の生成手順について説明する。図5は本実施形態における質問生成方法のフロー例1を示す図である。
Hereinafter, the actual procedure of the question generation method in the present embodiment will be described with reference to the figure. Various operations corresponding to the question generation method described below are realized by a program read by the
Here, first, the procedure for generating the
この場合、質問生成装置100は、QA情報125における各組合せにおける回答(説明文)欄の値、すなわち文章に対して形態素解析を実行する(s1)。質問生成装置100は、形態素解析プログラムを予め保持し、適宜に呼び出して利用出来るものとする。
In this case, the
上述の形態素解析により、解析対象となる文章において意味を有する最小単位を特定できることとなる。例えば、「本人によるご来店の住所変更・・・」という回答に関して得た形態素解析結果は、「本人」、「来店」、「住所変更」、を少なくとも含む単語群となる。 By the above-mentioned morphological analysis, the smallest unit having meaning in the text to be analyzed can be specified. For example, the morphological analysis result obtained for the answer "change of address of visit by the person" is a word group including at least "person", "visit", and "change of address".
続いて、質問生成装置100は、s1で得た形態素解析結果である単語群に基づき、上述の各回答(説明文)における各単語の有無に応じた所定値を、所定の雛形マトリクスに設定し、マトリクスを生成する(s2)。
Subsequently, the
上述の雛形マトリクスは、図4で例示したマトリクス126におけるテーブル構造に対応したマトリクスを想定できる。また、各単語の有無に応じた所定値は、同じく図4で例示したマトリクス126における、該当単語が「有」の場合の「1」、該当単語が「無」の場合の「0」、を想定できる。
また、質問生成装置100は、s2で生成したマトリクスを記憶部101のマトリクス126として格納し(s3)、処理を終了する。
As the above-mentioned template matrix, a matrix corresponding to the table structure in the
Further, the
続いて図6は、本実施形態の質問生成方法を示すシーケンス例1を示す図である。ここで、或る顧客がユーザ端末200を操作し、問い合わせ画面(図7Aの画面600)にて、「来店し住所変更したい」といった問い合わせ内容を入力し、当該問い合わせを質問生成装置100に送信してきたとする。
Subsequently, FIG. 6 is a diagram showing a sequence example 1 showing the question generation method of the present embodiment. Here, a customer operates the
一方、これを受ける質問生成装置100は、記憶部101におけるQA情報125に対し、上述の問い合わせ内容が含むキーワード(「来店」、「住所変更」)による検索処理を実行する(s10)。
On the other hand, the
具体的には、質問生成装置100は、QA情報125における各レコードの「質問」欄の値と、上述の問い合わせ内容が含むキーワード(「来店」、「住所変更」)との照合処理を実行し、該当するレコードを候補説明文に関するレコードとして特定する。
Specifically, the
続いて、質問生成装置100は、マトリクス126における要素のうち、s10で特定したレコードに関するものを当該レコードのIDに基づき特定し、ここで特定した要素に関して決定木分析を実行する(s11)。なお、決定木分析の手法自体は、既存のものを適宜に採用すればよい。
Subsequently, the
これにより、s10の検索で特定された複数のレコードを、それぞれのレコードが含む単語の有無に基づいて分別するシナリオが生成できる。その結果、上述の単語の有無に応じた問いかけである分岐判定項目、を質問文とした質問木が生成される。なお、図6では、質問木を「決定木」と記している(以下同様)。 As a result, it is possible to generate a scenario in which a plurality of records identified by the search of s10 are sorted based on the presence or absence of words included in each record. As a result, a question tree is generated with the branch determination item, which is a question depending on the presence or absence of the above-mentioned word, as a question sentence. In FIG. 6, the question tree is referred to as a "decision tree" (the same applies hereinafter).
続いて、質問生成装置100は、s11の決定木分析で得た質問木の段数が予め定めた基準を越えるか判定する(s12)。質問木における段数とは、最初の分岐判定項目から最終的に回答を導く最後の分岐判定項目までの、分岐判定項目の数である。
Subsequently, the
この判定の結果、上述の段数が基準を超える場合、質問生成装置100は、図8で別途示すシーケンス例に処理を遷移させる。この遷移は、現状の質問木では顧客に対して問いかけの回数が多いため、その回数を低減するとの意図に基づくものである。
As a result of this determination, when the number of stages described above exceeds the standard, the
一方、上述の判定の結果、段数が基準を超えない場合、質問生成装置100は、s11で得た質問木を、例えばメモリ103における所定の記憶領域に格納する(s13)。
On the other hand, if the number of stages does not exceed the standard as a result of the above determination, the
また、質問生成装置100は、当該質問木における最上位の段数における分岐判定項目に対応した質問(以下、問いかけ)を、上述のユーザ端末200に出力する(s14)。
Further, the
ユーザ端末200は、上述の問いかけを表示して(例:図7Bの画面610)、顧客からの回答を取得する。また、ユーザ端末200は、ここで得た回答を質問生成装置100に返す。
The
他方、質問生成装置100は、ユーザ端末200から送信されてきた回答、すなわち最初の問いかけに対する回答を得て、上述の質問木に適用し、当該質問木における最終段すなわち回答に至るまで、各段の分岐判定項目に応じた問いかけを繰り返し実行する(s15~s16)。質問生成装置100は、回答に至った場合、これをユーザ端末200に出力し(図7Cの画面620)、処理を終了する。
On the other hand, the
なお、上述のs12での判定の結果、質問木における段数が基準を超える場合、質問生成装置100は、図8のシーケンス例で示すように、ユーザ端末200に対し、追加キーワード(図中では「質問絞り込み」)の要求メッセージを通知する(s21)。
As a result of the above-mentioned determination in s12, when the number of stages in the question tree exceeds the standard, the
一方、ユーザ端末200は、上述の追加キーワードの要求メッセージを表示し、顧客から、「代理人」などといった追加キーワードの入力を受け付ける(図9Aの画面800)。また、質問生成装置100は、ここで受け付けた追加キーワードを質問生成装置100に返信する。
On the other hand, the
質問生成装置100は、ユーザ端末200から追加キーワードを受信し、既にs10の検索で用いたキーワード(例:「住所変更」)に当該追加キーワード(例:「代理人」)を加えたアンド検索を、QA情報125にて実行する(s22)。
The
具体的には、質問生成装置100は、QA情報125における各レコードの「質問」欄の値と、上述の問い合わせ内容が含むキーワード(「住所変更」および「代理人」)との
照合処理を実行し、該当するレコードを新たな候補説明文に関するレコードとして特定する。
Specifically, the
続いて、質問生成装置100は、マトリクス126における要素のうち、s22で特定したレコードに関するものを当該レコードのIDに基づき特定し、ここで特定した要素に関して決定木分析を実行する(s23)。
Subsequently, the
これにより、s22の検索で特定された新たな候補説明文に対応する複数のレコードを、それぞれのレコードが含む単語の有無に基づいて分別するシナリオが生成できる。その結果、上述の単語の有無に応じた問いかけである分岐判定項目、を質問文とした新たな質問木が生成される。
続いて、質問生成装置100は、s23の決定木分析で得た新たな質問木の段数が予め定めた基準を越えるか判定する(s24)。
As a result, it is possible to generate a scenario in which a plurality of records corresponding to the new candidate explanations identified by the search of s22 are sorted based on the presence or absence of words included in each record. As a result, a new question tree is generated with the branch determination item, which is a question depending on the presence or absence of the above-mentioned word, as a question sentence.
Subsequently, the
この判定の結果、上述の段数が基準を超える場合、質問生成装置100は、s21に処理を遷移させる。この遷移は、現状の質問木では顧客に対して問いかけの回数が多いため、その回数を低減するとの意図に基づくものである。
As a result of this determination, when the above-mentioned number of stages exceeds the standard, the
一方、上述の判定の結果、段数が基準を超えない場合、質問生成装置100は、s23で得た質問木を、例えばメモリ103における所定の記憶領域に格納し(s25)、処理を終了する。
On the other hand, if the number of stages does not exceed the standard as a result of the above determination, the
ここで、上述のマトリクスと質問木との関係を踏まえた、質問木の生成概念例を図10に示す。図10で示す具体例は、QA情報125におけるレコードのうち「TEXT1」~「TEXT4」に関して「単語1」~「単語4」の各単語の有無を規定したマトリクス700と、このマトリクス700を決定木分析の対象とした場合の質問木750、を示している。
Here, FIG. 10 shows an example of the concept of generating a question tree based on the relationship between the above matrix and the question tree. Specific examples shown in FIG. 10 are a
この場合、顧客からの初回の質問751、すなわちユーザ端末200から受けた問い合わせの内容は、「住所変更」である。また、この「住所変更」なるキーワードを回答(説明文)に含むレコードをQA情報125で特定すると、「TEXT1」~「TEXT4」が特定されたものとする。
In this case, the content of the
すると、この「TEXT1」~「TEXT4」のうちいずれかを、当該顧客からの問い合わせに対する回答として特定する必要がある。よってこの「TEXT1」~「TEXT4」における「単語1」~「単語4」の各有無に基づく決定木分析により、「TEXT1」~「TEXT4」を切り分ける、質問木750が生成される。
Then, it is necessary to specify any one of the "TEXT1" to "TEXT4" as an answer to the inquiry from the customer. Therefore, the decision tree analysis based on the presence or absence of each of "
図10の例では、分岐判定項目752~757、すなわち顧客への問いかけとして、「本人」か否か、「本人」である場合に「来店」するか否か、を順次問いかけすることで、当該顧客に提示すべき回答760~763として「TEXT1」と「TEXT2」とを切り分けできる。
In the example of FIG. 10, the
また、「本人」ではない場合に、それは「法定代理人」か否か、を順次問いかけすることで、当該顧客に提示すべき回答760~763として「TEXT3」と「TEXT4」とを切り分けできる。
In addition, if the customer is not the "principal", by sequentially asking whether or not it is a "legal agent", "TEXT3" and "TEXT4" can be separated as
続いて、質問木生成を効率化する工夫について説明する。図11は本実施形態における質問生成方法のフロー例2を示す図であり、図12は本実施形態における質問木の生成概念例2を示す図である。 Next, we will explain how to improve the efficiency of question tree generation. FIG. 11 is a diagram showing a flow example 2 of the question generation method in the present embodiment, and FIG. 12 is a diagram showing a question tree generation concept example 2 in the present embodiment.
この場合、質問生成装置100は、上述のs10で得た候補説明文のうち、各候補説明文を横断して頻出する単語を含んでいるものを優先候補説明文として特定する(s30)。
In this case, the
具体的には、質問生成装置100は、例えば、マトリクス126における各候補説明文に関する各単語の有無の値を参照し、最多の候補説明文に存在する単語、2番目に多い候補説明文に存在する単語、および、3番目に多い候補説明文に存在する単語、を特定し、当該単語らを含んでいる候補説明文に関するIDをマトリクス126にて特定する。
Specifically, the
なお、上述の最多の候補説明文に存在する単語、2番目に多い候補説明文に存在する単語、および、3番目に多い候補説明文に存在する単語、を特定するに際し、QA情報125における各候補説明文のレコードの「質問」欄の値を参照し、該当単語を特定するとしてもよい。
In addition, in specifying the word existing in the above-mentioned most candidate explanation sentence, the word existing in the second most candidate explanation sentence, and the word existing in the third most candidate explanation sentence, each in the
また、質問生成装置100は、上述のs11における質問木の生成に際し、マトリクス126における要素のうち、s30で特定した優先候補説明文のレコードに関するものを当該レコードのIDに基づき特定して頻出単語マトリクス(図12の頻出単語マトリクス810参照)を生成し、この頻出単語マトリクスに関して決定木分析を実行する(s31)。
Further, when the question tree is generated in s11, the
これにより、s30で優先候補説明文として特定された複数のレコードを、それぞれのレコードが含む単語の有無に基づいて分別するシナリオが生成できる。その結果、上述の単語の有無に応じた問いかけである分岐判定項目、を質問文とした頻出単語向け質問木(図12の頻出単語向け質問木820参照)が生成される。
As a result, it is possible to generate a scenario in which a plurality of records specified as priority candidate explanations in s30 are separated based on the presence or absence of words included in each record. As a result, a question tree for frequent words (see
続いて、質問生成装置100は、s31の決定木分析で得た頻出単語向け質問木における所定段の分岐判定項目で、候補説明文(s10で得ているもの)を区分しきれているか判定する(s32)。具体的には、頻出単語向け質問木において、複数の回答が1つの分岐判定項目(最終段のもの)に紐付けられている構成(図12の頻出単語向け質問木820における構成830)が存在するか判定する。
Subsequently, the
上述の判定の結果、候補説明文を区分しきれている場合(s32:y)、質問生成装置100は、当該頻出単語向け質問木を、例えばメモリ103における所定の記憶領域に格納し(s33)、処理を終了する。
As a result of the above determination, when the candidate explanatory texts have been completely divided (s32: y), the
他方、上述の判定の結果、候補説明文を区分しきれていない場合(s32:n)、質問生成装置100は、上述の候補説明文のうち、優先候補説明文以外の非優先候補説明文を特定する(s34)。
On the other hand, as a result of the above-mentioned determination, when the candidate explanations are not completely classified (s32: n), the
また、質問生成装置100は、マトリクス126における要素のうち、s34で特定した非優先候補説明文のレコードに関するものを当該レコードのIDに基づき特定して非頻出単語マトリクス(図12の非頻出単語マトリクス830参照)を生成し、この非頻出単語マトリクスに関して決定木分析を実行する(s35)。
Further, the
これにより、s34で非優先候補説明文として特定された複数のレコードを、それぞれのレコードが含む単語の有無に基づいて分別するシナリオが生成できる。その結果、上述の単語の有無に応じた問いかけである分岐判定項目、を質問文とした非頻出単語向け質問木(図12の非頻出単語向け質問木840参照)が生成される。
また、質問生成装置100は、当該非頻出単語向け質問木を、例えばメモリ103にお
ける所定の記憶領域に格納し(s36)、処理を終了する。
As a result, it is possible to generate a scenario in which a plurality of records specified as non-priority candidate explanations in s34 are separated based on the presence or absence of words included in each record. As a result, a question tree for non-frequent words (see
Further, the
また、質問木生成を効率化する別の工夫について説明する。図13は本実施形態における質問生成方法のフロー例3を示す図であり、図14は本実施形態における質問木の生成概念例3を示す図である。 In addition, another device to improve the efficiency of question tree generation will be explained. FIG. 13 is a diagram showing a flow example 3 of the question generation method in the present embodiment, and FIG. 14 is a diagram showing a question tree generation concept example 3 in the present embodiment.
この場合、質問生成装置100は、QA情報125における各レコードのうち、例えば、回答実績の値が所定基準以上の頻出回答であるものを特定し、当該レコードにおける形態素解析結果欄の値を取得する(s40)。
In this case, the
続いて、質問生成装置100は、上述のs40で得た形態素解析結果欄の値、すなわち単語群に基づき、当該頻出回答における各単語の有無を記述した頻出回答向けマトリクス(図14の頻出回答向けマトリクス910参照)を生成する(s41)。
Subsequently, the
続いて、質問生成装置100は、ユーザ端末200からの問い合わせを受信し、当該問い合わせが含むキーワードに基づき、s40で特定している頻出回答のうち当該キーワードを含むものを優先候補説明文として特定する(s42)。
Subsequently, the
また、質問生成装置100は、s41で生成している頻出回答向けマトリクスにおける、上述の優先候補説明文(s42で特定したもの)に関するものを当該優先候補説明文のIDに基づき特定し、ここで特定した要素に関して決定木分析を実行する(s43)。
Further, the
これにより、s42で優先候補説明文として特定された複数のレコードを、それぞれのレコードが含む単語の有無に基づいて分別するシナリオが生成できる。その結果、頻出回答向け質問木(図14の頻出回答向け質問木920参照)が生成される。
As a result, it is possible to generate a scenario in which a plurality of records specified as priority candidate explanations in s42 are separated based on the presence or absence of words included in each record. As a result, a question tree for frequent answers (see
続いて、質問生成装置100は、s43の決定木分析で得た頻出回答向け質問木における所定段の分岐判定項目で、優先候補説明文(s42で得ているもの)を区分しきれているか判定する(s44)。具体的には、頻出回答向け質問木において、複数の回答が1つの分岐判定項目(最終段のもの)に紐付けられている構成(図14の頻出回答向け質問木920における構成930)が存在するか判定する。
Subsequently, the
上述の判定の結果、優先候補説明文を区分しきれている場合(s44:y)、質問生成装置100は、当該頻出回答向け質問木を、例えばメモリ103における所定の記憶領域に格納し(s45)、処理を終了する。
As a result of the above determination, when the priority candidate explanatory text has been completely divided (s44: y), the
他方、上述の判定の結果、優先候補説明文を区分しきれていない場合(s44:n)、質問生成装置100は、QA情報125における各レコードのうち、上述の頻出回答以外の非頻出回答における形態素解析結果欄の値を取得する(s46)。
On the other hand, as a result of the above-mentioned determination, when the priority candidate explanatory text is not completely classified (s44: n), the
続いて、質問生成装置100は、上述のs46で得た形態素解析結果欄の値、すなわち単語群に基づき、当該非頻出回答における各単語の有無を記述した非頻出回答向けマトリクス(図14の非頻出回答向けマトリクス915参照)を生成する(s47)。
また、質問生成装置100は、この非頻出回答向けマトリクスに関して決定木分析を実行する(s48)。
Subsequently, the
In addition, the
これにより、非優先候補説明文である複数のレコードを、それぞれのレコードが含む単語の有無に基づいて分別するシナリオが生成できる。その結果、上述の単語の有無に応じた問いかけである分岐判定項目、を質問文とした非頻出回答向け質問木(図14の非頻出回答向け質問木940参照)が生成される。
また、質問生成装置100は、当該非頻出回答向け質問木を、例えばメモリ103における所定の記憶領域に格納し(s49)、処理を終了する。
As a result, it is possible to generate a scenario in which a plurality of records that are non-priority candidate explanations are separated based on the presence or absence of words contained in each record. As a result, a question tree for non-frequent answers (see
Further, the
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
こうした本実施形態によれば、質問木を効率的に自動生成可能となる。
Although the best mode for carrying out the present invention has been specifically described above, the present invention is not limited to this, and various modifications can be made without departing from the gist thereof.
According to this embodiment, the question tree can be efficiently and automatically generated.
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の質問生成装置において、前記演算部は、前記生成した質問木の段数が所定基準を越える場合、前記端末に追加キーワードの要求メッセージを通知し、当該端末から追加キーワードを取得する処理を更に実行し、前記候補説明文の特定に際し、前記キーワードおよび前記追加キーワードに基づき、前記各説明文のうち前記キーワードおよび前記追加キーワードを含むものを新たな候補説明文として特定し、前記質問木の生成に際し、前記マトリクスにおける前記新たな候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした新たな質問木を生成し、前記新たな質問木の段数が前記所定基準を超えなくなるまで、前記追加キーワードの取得、前記新たな候補説明文の特定、および、前記新たな質問木の生成、を繰り返し行うものである、としてもよい。 The description herein reveals at least the following: That is, in the question generation device of the present embodiment, when the number of stages of the generated question tree exceeds a predetermined standard, the calculation unit notifies the terminal of a request message for the additional keyword and acquires the additional keyword from the terminal. Further processing is performed, and when the candidate explanation is specified, the keyword and the additional keyword are included in each of the explanations based on the keyword and the additional keyword, and the candidate description is specified as a new candidate explanation, and the question is asked. When generating a tree, a decision tree analysis is performed based on the description of the new candidate explanation in the matrix, a new question tree with a branch judgment item as a question sentence is generated, and the number of stages of the new question tree is the above. The acquisition of the additional keyword, the identification of the new candidate explanatory text, and the generation of the new question tree may be repeated until the predetermined standard is not exceeded.
これによれば、質問木の段数が多すぎる、すなわち問い合わせを行ってきた顧客とのやりとりが多くなりすぎることになる場合、これを効果的に回避すること可能となる。ひいては、質問木をより効率的に自動生成可能となる。 According to this, when the number of steps of the question tree is too large, that is, the number of interactions with the customer who has made an inquiry becomes too large, it is possible to effectively avoid this. As a result, the question tree can be automatically generated more efficiently.
また、本実施形態の質問生成装置において、前記演算部は、前記候補説明文のうち、各候補説明文を横断して頻出する単語を含んでいるものを優先候補説明文として特定し、前記質問木の生成に際し、前記マトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出単語向け質問木を生成するものである、としてもよい。 Further, in the question generation device of the present embodiment, the calculation unit specifies, among the candidate explanations, a word that frequently appears across each candidate explanation as a priority candidate explanation, and asks the question. When generating a tree, a decision tree analysis may be performed based on the description of the priority candidate explanatory text in the matrix to generate a question tree for frequently-used words using a branch determination item as a question sentence.
これによれば、候補説明文の群の中で広く出現する単語を含む候補説明文を優先的に使用し、質問木を生成するため、共通性が推定される事項間でポピュラーな内容の問い合わせに対して効率的に説明文すなわち回答を導く可能性を高める。ひいては、質問木をより効率的に自動生成可能となる。 According to this, since candidate explanations including words that appear widely in the group of candidate explanations are preferentially used to generate a question tree, inquiries about popular contents among items that are presumed to have commonality. Increase the possibility of efficiently deriving an explanation, that is, an answer. As a result, the question tree can be automatically generated more efficiently.
また、本実施形態の質問生成装置において、前記演算部は、前記頻出単語向け質問木における所定段の分岐判定項目で前記候補説明文を区分しきれていない場合、前記候補説明文のうち、前記優先候補説明文以外の非優先候補説明文を特定し、前記マトリクスにおける前記非優先候補説明文に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出単語向け質問木を生成するものである、としてもよい。 Further, in the question generation device of the present embodiment, when the calculation unit cannot completely classify the candidate explanatory text in the branch determination item of the predetermined stage in the question tree for frequently-used words, the candidate explanatory text is described as described above. A non-priority candidate description other than the priority candidate description is specified, and a decision tree analysis starting from the branch determination item of the predetermined stage is executed based on the description of the non-priority candidate description in the matrix, and the non-frequent occurrence occurs. It may be to generate a question tree for words.
これによれば、上述の頻出単語向け質問木での説明文すなわち回答の導出が難しい状況に対して的確に対応し、ひいては、質問木をより効率的に自動生成可能となる。 According to this, it is possible to accurately deal with the situation where it is difficult to derive the explanatory text, that is, the answer in the above-mentioned question tree for frequently-used words, and by extension, the question tree can be automatically generated more efficiently.
また、本実施形態の質問生成装置において、前記演算部は、前記各説明文のうち、所定期間において回答として出力された実績が所定基準以上の頻出回答であるものに関する形態素解析結果に基づき、前記頻出回答における各単語の有無を記述した頻出回答向けマトリクスの生成を行い、所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記頻出回答のうち前記キーワードを含むものを優先候補説明文として特定し、前記頻出回答向けマトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出回答向け質問木を生成するものである、としてもよい。 Further, in the question generation device of the present embodiment, the calculation unit describes the above-mentioned explanatory texts based on the morphological analysis result regarding the frequently-appearing answers whose actual results output as answers in a predetermined period are more than a predetermined standard. A matrix for frequent answers that describes the presence or absence of each word in the frequent answers is generated, an inquiry is received from a predetermined terminal, and based on the keywords included in the inquiry, those containing the keywords are given priority candidate explanations. It is also possible to execute a decision tree analysis based on the description regarding the priority candidate explanatory text in the matrix for frequent answers to generate a question tree for frequent answers with the branch determination item as the question text. ..
これによれば、例えば最近の顧客が望む回答の傾向等を踏まえて、効率的に回答を導く質問木を生成しやすくなる。ひいては、質問木をより効率的に自動生成可能となる。 According to this, it becomes easy to generate a question tree that efficiently guides the answer, for example, based on the tendency of the answer desired by the customer in recent years. As a result, the question tree can be automatically generated more efficiently.
また、本実施形態の質問生成装置において、前記演算部は、前記頻出回答向け質問木における所定段の分岐判定項目で前記優先候補説明文を区分しきれていない場合、前記各説明文のうち、前記頻出回答以外の非頻出回答であるものに関する形態素解析結果に基づき、前記非頻出回答における各単語の有無を記述した非頻出回答向けマトリクスの生成を行い、前記非頻出回答向けマトリクスにおける前記非頻出回答に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出回答向け質問木を生成するものである、としてもよい。 Further, in the question generation device of the present embodiment, when the calculation unit cannot completely classify the priority candidate explanatory text in the branch determination item of the predetermined stage in the question tree for frequent answers, among the above-mentioned explanatory texts, Based on the morphological analysis results for non-frequent answers other than the frequent answers, a matrix for non-frequent answers describing the presence or absence of each word in the non-frequent answers is generated, and the non-frequent answers in the non-frequent answers matrix are generated. Based on the description of the answer, the decision tree analysis starting from the branch determination item of the predetermined stage may be executed to generate the question tree for the infrequent answer.
これによれば、上述の頻出回答向け質問木での説明文すなわち回答の導出が難しい状況に対して的確に対応し、ひいては、質問木をより効率的に自動生成可能となる。 According to this, it is possible to accurately deal with the above-mentioned explanatory text in the question tree for frequent answers, that is, the situation where it is difficult to derive the answer, and by extension, the question tree can be automatically generated more efficiently.
また、本実施形態の質問生成方法において、前記情報処理装置が、前記生成した質問木の段数が所定基準を越える場合、前記端末に追加キーワードの要求メッセージを通知し、当該端末から追加キーワードを取得する処理を更に実行し、前記候補説明文の特定に際し、前記キーワードおよび前記追加キーワードに基づき、前記各説明文のうち前記キーワードおよび前記追加キーワードを含むものを新たな候補説明文として特定し、前記質問木の生成に際し、前記マトリクスにおける前記新たな候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした新たな質問木を生成し、前記新たな質問木の段数が前記所定基準を超えなくなるまで、前記追加キーワードの取得、前記新たな候補説明文の特定、および、前記新たな質問木の生成、を繰り返し行う、としてもよい。 Further, in the question generation method of the present embodiment, when the information processing device notifies the terminal of a request message for an additional keyword when the number of stages of the generated question tree exceeds a predetermined standard, the additional keyword is acquired from the terminal. Further, when specifying the candidate explanatory text, the keyword and the additional keyword are included in the respective explanatory texts based on the keyword and the additional keyword, and the candidate explanatory text is specified as a new candidate explanatory text. When generating the question tree, the decision tree analysis is executed based on the description about the new candidate explanation in the matrix, a new question tree with the branch judgment item as the question sentence is generated, and the number of stages of the new question tree is set. The acquisition of the additional keyword, the identification of the new candidate explanatory text, and the generation of the new question tree may be repeated until the predetermined criteria are not exceeded.
また、本実施形態の質問生成方法において、前記情報処理装置が、前記候補説明文のうち、各候補説明文を横断して頻出する単語を含んでいるものを優先候補説明文として特定し、前記質問木の生成に際し、前記マトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出単語向け質問木を生成する、としてもよい。 Further, in the question generation method of the present embodiment, the information processing apparatus specifies, among the candidate explanations, a word that frequently appears across each candidate explanation as a priority candidate explanation, and the above-mentioned When generating the question tree, the decision tree analysis may be executed based on the description of the priority candidate explanatory text in the matrix to generate the question tree for frequently-used words with the branch determination item as the question sentence.
また、本実施形態の質問生成方法において、前記情報処理装置が、前記頻出単語向け質問木における所定段の分岐判定項目で前記候補説明文を区分しきれていない場合、前記候補説明文のうち、前記優先候補説明文以外の非優先候補説明文を特定し、前記マトリクスにおける前記非優先候補説明文に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出単語向け質問木を生成する、としてもよい。 Further, in the question generation method of the present embodiment, when the information processing apparatus cannot completely classify the candidate explanatory text in the branch determination item of the predetermined stage in the question tree for frequently-used words, the candidate explanatory text is among the candidate explanatory texts. A non-priority candidate description other than the priority candidate description is specified, and based on the description of the non-priority candidate description in the matrix, a decision tree analysis starting from the branch determination item of the predetermined stage is executed to perform non-priority candidate description. You may generate a question tree for frequently-used words.
また、本実施形態の質問生成方法において、前記情報処理装置が、前記各説明文のうち、所定期間において回答として出力された実績が所定基準以上の頻出回答であるものに関する形態素解析結果に基づき、前記頻出回答における各単語の有無を記述した頻出回答向けマトリクスの生成を行い、所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記頻出回答のうち前記キーワードを含むものを優先候補説明文として特定し、前記頻出回答向けマトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出回答向け質問木を生成する、としてもよい。 Further, in the question generation method of the present embodiment, the information processing apparatus is based on the morphological analysis result of each of the above-mentioned explanatory texts, in which the actual result output as an answer in a predetermined period is a frequent answer of a predetermined standard or more. A matrix for frequent answers that describes the presence or absence of each word in the frequent answers is generated, an inquiry is received from a predetermined terminal, and based on the keywords included in the inquiry, those including the keywords are given as priority candidate explanations. It may be specified as a sentence, and a decision tree analysis may be executed based on the description regarding the priority candidate explanatory statement in the frequently-appearing answer matrix to generate a question tree for frequent-appearing answers using a branch determination item as a question sentence.
また、本実施形態の質問生成方法において、前記情報処理装置が、前記頻出回答向け質問木における所定段の分岐判定項目で前記優先候補説明文を区分しきれていない場合、前記各説明文のうち、前記頻出回答以外の非頻出回答であるものに関する形態素解析結果に基づき、前記非頻出回答における各単語の有無を記述した非頻出回答向けマトリクスの生
成を行い、前記非頻出回答向けマトリクスにおける前記非頻出回答に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出回答向け質問木を生成する、としてもよい。
Further, in the question generation method of the present embodiment, when the information processing apparatus cannot completely classify the priority candidate explanatory text in the branch determination item of the predetermined stage in the question tree for frequent answers, among the above-mentioned explanatory texts. Based on the morphological analysis results for non-frequent answers other than the frequent answers, a matrix for non-frequent answers describing the presence or absence of each word in the non-frequent answers is generated, and the non-frequent answers in the non-frequent answers matrix. Based on the description of the frequent answer, the decision tree analysis starting from the branch determination item of the predetermined stage may be executed to generate the question tree for the non-frequent answer.
10 ネットワーク
100 質問生成装置
101 記憶部
102 プログラム
103 メモリ
104 演算部
105 入力部
106 出力部
107 通信部
125 情報
126 情報
127 情報
200 ユーザ端末
10
Claims (12)
前記各説明文の形態素解析結果に基づき、前記各説明文における各単語の有無を記述したマトリクスの生成を行う処理と、所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記各説明文のうち前記キーワードを含むものを候補説明文として特定する処理と、前記マトリクスにおける前記候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした質問木を生成する処理と、を実行する演算部と、
を備えることを特徴とする質問生成装置。 A storage unit that holds each explanation for each predetermined item,
Based on the morphological analysis result of each explanation, the process of generating a matrix describing the presence or absence of each word in each explanation, and the inquiry received from a predetermined terminal, each explanation is based on the keyword included in the inquiry. A process of specifying a sentence containing the keyword as a candidate explanation sentence, and a process of executing a decision tree analysis based on the description of the candidate explanation sentence in the matrix and generating a question tree using a branch judgment item as a question sentence. And the arithmetic unit that executes
A question generator characterized by being equipped with.
前記生成した質問木の段数が所定基準を越える場合、
前記所定端末に追加キーワードの要求メッセージを通知し、当該所定端末から追加キーワードを取得する処理を更に実行し、
前記候補説明文の特定に際し、前記キーワードおよび前記追加キーワードに基づき、前記各説明文のうち前記キーワードおよび前記追加キーワードを含むものを新たな候補説明文として特定し、
前記質問木の生成に際し、前記マトリクスにおける前記新たな候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした新たな質問木を生成し、
前記新たな質問木の段数が前記所定基準を超えなくなるまで、前記追加キーワードの取得、前記新たな候補説明文の特定、および、前記新たな質問木の生成、を繰り返し行うものである、
ことを特徴とする請求項1に記載の質問生成装置。 The arithmetic unit
When the number of steps of the generated question tree exceeds the predetermined standard,
The process of notifying the predetermined terminal of the request message of the additional keyword and further executing the process of acquiring the additional keyword from the predetermined terminal is executed.
In specifying the candidate explanation, based on the keyword and the additional keyword, the one containing the keyword and the additional keyword among the explanations is specified as a new candidate explanation.
When generating the question tree, a decision tree analysis is executed based on the description regarding the new candidate explanation in the matrix, and a new question tree with the branch determination item as the question is generated.
The acquisition of the additional keyword, the identification of the new candidate explanation, and the generation of the new question tree are repeated until the number of stages of the new question tree does not exceed the predetermined standard.
The question generator according to claim 1.
前記候補説明文のうち、各候補説明文を横断して頻出する単語を含んでいるものを優先候補説明文として特定し、
前記質問木の生成に際し、前記マトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出単語向け質問木を生成するものである、
ことを特徴とする請求項1に記載の質問生成装置。 The arithmetic unit
Among the candidate explanations, those containing words that frequently appear across each candidate explanation are specified as priority candidate explanations.
When generating the question tree, a decision tree analysis is executed based on the description regarding the priority candidate explanatory text in the matrix, and a question tree for frequently-used words with the branch determination item as the question sentence is generated.
The question generator according to claim 1.
前記頻出単語向け質問木における所定段の分岐判定項目で前記候補説明文を区分しきれていない場合、前記候補説明文のうち、前記優先候補説明文以外の非優先候補説明文を特定し、
前記マトリクスにおける前記非優先候補説明文に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出単語向け質問木を生成するものである、
ことを特徴とする請求項3に記載の質問生成装置。 The arithmetic unit
When the candidate explanations are not completely classified by the branch determination items in the predetermined stage in the question tree for frequently-used words, the non-priority candidate explanations other than the priority candidate explanations are specified among the candidate explanations.
Based on the description of the non-priority candidate explanatory text in the matrix, a decision tree analysis starting from the branch determination item of the predetermined stage is executed to generate a question tree for non-frequent words.
The question generator according to claim 3, wherein the question generator is characterized by the above.
前記各説明文のうち、所定期間において回答として出力された実績が所定基準以上の頻出回答であるものに関する形態素解析結果に基づき、前記頻出回答における各単語の有無を記述した頻出回答向けマトリクスの生成を行い、
所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記頻出回答のうち前記キーワードを含むものを優先候補説明文として特定し、
前記頻出回答向けマトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出回答向け質問木を生成するものである、
ことを特徴とする請求項1に記載の質問生成装置。 The arithmetic unit
Generation of a matrix for frequent answers that describes the presence or absence of each word in the frequent answers based on the morphological analysis results of each of the above explanations for which the actual results output as answers in a predetermined period are frequent answers exceeding a predetermined standard. And
Upon receiving an inquiry from a predetermined terminal, based on the keyword included in the inquiry, the frequently-used answers including the keyword are specified as priority candidate explanations.
A decision tree analysis is executed based on the description regarding the priority candidate explanatory text in the matrix for frequent answers, and a question tree for frequent answers with the branch determination item as the question text is generated.
The question generator according to claim 1.
前記頻出回答向け質問木における所定段の分岐判定項目で前記優先候補説明文を区分しきれていない場合、
前記各説明文のうち、前記頻出回答以外の非頻出回答であるものに関する形態素解析結果に基づき、前記非頻出回答における各単語の有無を記述した非頻出回答向けマトリクスの生成を行い、
前記非頻出回答向けマトリクスにおける前記非頻出回答に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出回答向け質問木を生成するものである、
ことを特徴とする請求項5に記載の質問生成装置。 The arithmetic unit
When the priority candidate explanation is not completely classified by the branch judgment item in the predetermined stage in the question tree for frequent answers.
Based on the morphological analysis results of the non-frequent answers other than the frequent answers among the above explanations, a matrix for the non-frequent answers describing the presence or absence of each word in the non-frequent answers was generated.
Based on the description of the non-frequent answers in the matrix for non-frequent answers, a decision tree analysis starting from the branch determination item of the predetermined stage is executed to generate a question tree for non-frequent answers.
The question generator according to claim 5.
前記各説明文の形態素解析結果に基づき、前記各説明文における各単語の有無を記述したマトリクスの生成を行う処理と、
所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記各説明文のうち前記キーワードを含むものを候補説明文として特定する処理と、
前記マトリクスにおける前記候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした質問木を生成する処理と、
を実行することを特徴とする質問生成方法。 An information processing device equipped with a storage unit that holds each explanation for each predetermined item
Based on the morphological analysis result of each explanation, a process of generating a matrix describing the presence or absence of each word in each explanation, and a process of generating a matrix.
A process of receiving an inquiry from a predetermined terminal and specifying, among the above-mentioned explanatory texts, those including the keyword as candidate explanatory texts based on the keywords included in the inquiry.
A process of executing a decision tree analysis based on the description of the candidate explanation in the matrix and generating a question tree using the branch determination item as a question.
A question generation method characterized by running.
前記生成した質問木の段数が所定基準を越える場合、
前記所定端末に追加キーワードの要求メッセージを通知し、当該所定端末から追加キーワードを取得する処理を更に実行し、
前記候補説明文の特定に際し、前記キーワードおよび前記追加キーワードに基づき、前記各説明文のうち前記キーワードおよび前記追加キーワードを含むものを新たな候補説明文として特定し、
前記質問木の生成に際し、前記マトリクスにおける前記新たな候補説明文に関する記述に基づき決定木分析を実行し、分岐判定項目を質問文とした新たな質問木を生成し、
前記新たな質問木の段数が前記所定基準を超えなくなるまで、前記追加キーワードの取得、前記新たな候補説明文の特定、および、前記新たな質問木の生成、を繰り返し行う、
ことを特徴とする請求項7に記載の質問生成方法。 The information processing device
When the number of steps of the generated question tree exceeds the predetermined standard,
The process of notifying the predetermined terminal of the request message of the additional keyword and further executing the process of acquiring the additional keyword from the predetermined terminal is executed.
In specifying the candidate explanation, based on the keyword and the additional keyword, the one containing the keyword and the additional keyword among the explanations is specified as a new candidate explanation.
When generating the question tree, a decision tree analysis is executed based on the description regarding the new candidate explanation in the matrix, and a new question tree with the branch determination item as the question is generated.
The acquisition of the additional keyword, the identification of the new candidate explanation, and the generation of the new question tree are repeated until the number of stages of the new question tree does not exceed the predetermined standard.
The question generation method according to claim 7, wherein the question is generated.
前記候補説明文のうち、各候補説明文を横断して頻出する単語を含んでいるものを優先候補説明文として特定し、
前記質問木の生成に際し、前記マトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出単語向け質問木を生成する、
ことを特徴とする請求項7に記載の質問生成方法。 The information processing device
Among the candidate explanations, those containing words that frequently appear across each candidate explanation are specified as priority candidate explanations.
When generating the question tree, a decision tree analysis is executed based on the description regarding the priority candidate explanatory text in the matrix, and a question tree for frequently-used words with the branch determination item as the question sentence is generated.
The question generation method according to claim 7, wherein the question is generated.
前記頻出単語向け質問木における所定段の分岐判定項目で前記候補説明文を区分しきれていない場合、前記候補説明文のうち、前記優先候補説明文以外の非優先候補説明文を特定し、
前記マトリクスにおける前記非優先候補説明文に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出単語向け質問木を生成する、
ことを特徴とする請求項9に記載の質問生成方法。 The information processing device
When the candidate explanations are not completely classified by the branch determination items in the predetermined stage in the question tree for frequently-used words, the non-priority candidate explanations other than the priority candidate explanations are specified among the candidate explanations.
Based on the description of the non-priority candidate explanatory text in the matrix, a decision tree analysis starting from the branch determination item of the predetermined stage is executed to generate a question tree for non-frequent words.
The question generation method according to claim 9, wherein the question is generated.
前記各説明文のうち、所定期間において回答として出力された実績が所定基準以上の頻出回答であるものに関する形態素解析結果に基づき、前記頻出回答における各単語の有無を記述した頻出回答向けマトリクスの生成を行い、
所定端末から問い合わせを受信し、当該問い合わせが含むキーワードに基づき、前記頻出回答のうち前記キーワードを含むものを優先候補説明文として特定し、
前記頻出回答向けマトリクスにおける前記優先候補説明文に関する記述に基づき決定木分析を実行して、分岐判定項目を質問文とした頻出回答向け質問木を生成する、
ことを特徴とする請求項7に記載の質問生成方法。 The information processing device
Generation of a matrix for frequent answers that describes the presence or absence of each word in the frequent answers based on the morphological analysis results of each of the above explanations for which the actual results output as answers in a predetermined period are frequent answers exceeding a predetermined standard. And
Upon receiving an inquiry from a predetermined terminal, based on the keyword included in the inquiry, the frequently-used answers including the keyword are specified as priority candidate explanations.
A decision tree analysis is executed based on the description regarding the priority candidate explanatory text in the matrix for frequent answers, and a question tree for frequent answers with the branch determination item as the question text is generated.
The question generation method according to claim 7, wherein the question is generated.
前記頻出回答向け質問木における所定段の分岐判定項目で前記優先候補説明文を区分しきれていない場合、
前記各説明文のうち、前記頻出回答以外の非頻出回答であるものに関する形態素解析結果に基づき、前記非頻出回答における各単語の有無を記述した非頻出回答向けマトリクスの生成を行い、
前記非頻出回答向けマトリクスにおける前記非頻出回答に関する記述に基づき、前記所定段の分岐判定項目を起点にした決定木分析を実行して、非頻出回答向け質問木を生成する、
ことを特徴とする請求項11に記載の質問生成方法。 The information processing device
When the priority candidate explanation is not completely classified by the branch judgment item in the predetermined stage in the question tree for frequent answers.
Based on the morphological analysis results of the non-frequent answers other than the frequent answers among the above explanations, a matrix for the non-frequent answers describing the presence or absence of each word in the non-frequent answers was generated.
Based on the description of the non-frequent answers in the matrix for non-frequent answers, a decision tree analysis starting from the branch determination item of the predetermined stage is executed to generate a question tree for non-frequent answers.
The question generation method according to claim 11, wherein the question is generated.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018189979A JP7028746B2 (en) | 2018-10-05 | 2018-10-05 | Question generator and question generation method |
PCT/JP2019/038845 WO2020071398A1 (en) | 2018-10-05 | 2019-10-02 | Question generation device and question generation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018189979A JP7028746B2 (en) | 2018-10-05 | 2018-10-05 | Question generator and question generation method |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020060846A JP2020060846A (en) | 2020-04-16 |
JP2020060846A5 JP2020060846A5 (en) | 2021-03-04 |
JP7028746B2 true JP7028746B2 (en) | 2022-03-02 |
Family
ID=70055554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018189979A Active JP7028746B2 (en) | 2018-10-05 | 2018-10-05 | Question generator and question generation method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7028746B2 (en) |
WO (1) | WO2020071398A1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021505596A (en) | 2017-12-06 | 2021-02-18 | 江▲蘇▼恒瑞医▲薬▼股▲フン▼有限公司Jiangsu Hengrui Medicine Co., Ltd. | Salt of phenylpropionamide derivative and its production method |
CN112948608B (en) * | 2021-02-01 | 2023-08-22 | 北京百度网讯科技有限公司 | Picture searching method and device, electronic equipment and computer readable storage medium |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011108085A (en) | 2009-11-19 | 2011-06-02 | Nippon Hoso Kyokai <Nhk> | Knowledge construction device and program |
JP2017102733A (en) | 2015-12-02 | 2017-06-08 | パナソニックIpマネジメント株式会社 | Retrieval support method, retrieval support device and program |
JP2017530435A (en) | 2014-06-30 | 2017-10-12 | アマゾン・テクノロジーズ・インコーポレーテッド | Interactive interface for machine learning model evaluation |
JP2018005624A (en) | 2016-07-04 | 2018-01-11 | パナソニックIpマネジメント株式会社 | Decision tree generation device, decision tree generation method, decision tree generation program and query system |
-
2018
- 2018-10-05 JP JP2018189979A patent/JP7028746B2/en active Active
-
2019
- 2019-10-02 WO PCT/JP2019/038845 patent/WO2020071398A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011108085A (en) | 2009-11-19 | 2011-06-02 | Nippon Hoso Kyokai <Nhk> | Knowledge construction device and program |
JP2017530435A (en) | 2014-06-30 | 2017-10-12 | アマゾン・テクノロジーズ・インコーポレーテッド | Interactive interface for machine learning model evaluation |
JP2017102733A (en) | 2015-12-02 | 2017-06-08 | パナソニックIpマネジメント株式会社 | Retrieval support method, retrieval support device and program |
JP2018005624A (en) | 2016-07-04 | 2018-01-11 | パナソニックIpマネジメント株式会社 | Decision tree generation device, decision tree generation method, decision tree generation program and query system |
Non-Patent Citations (1)
Title |
---|
中島 浩之、外2名,レレバンスフィードバックにおける検索語の共起関係推定処理の高速化,情報処理学会論文誌,日本,社団法人情報処理学会,2001年10月15日,第42巻,第10号,p.2429-2440 |
Also Published As
Publication number | Publication date |
---|---|
JP2020060846A (en) | 2020-04-16 |
WO2020071398A1 (en) | 2020-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180053125A1 (en) | Tag-based performance framework for contact center | |
US10586174B2 (en) | Methods and systems for finding and ranking entities in a domain specific system | |
JP6533048B2 (en) | Compliance check system and compliance check program | |
CN115812209A (en) | Machine learning feature recommendation | |
JP2020013492A (en) | Information processing device, system, method and program | |
KR101575276B1 (en) | Virtual counseling system | |
US20070016581A1 (en) | Category setting support method and apparatus | |
US20200342165A1 (en) | Management of annotation jobs | |
JP7028746B2 (en) | Question generator and question generation method | |
CN110209780B (en) | Question template generation method and device, server and storage medium | |
US11194883B2 (en) | Alert driven interactive interface to a website mining system | |
JP2019139746A (en) | Information search system and method | |
JP2017219899A (en) | Knowledge search device, knowledge search method and knowledge search program | |
CN112470216B (en) | Voice application platform | |
CN113033941A (en) | Customer complaint case distribution method, apparatus, device and storage medium | |
JP6614589B2 (en) | Compliance check system and compliance check program | |
US20210271698A1 (en) | Computer-readable recording medium recording answering program, answering method, and answering device | |
US11799734B1 (en) | Determining future user actions using time-based featurization of clickstream data | |
KR102710905B1 (en) | Apparatus, method and computer program for summarizing document | |
JPH10207893A (en) | Knowledge information display device and knowledge information output method | |
JPH11238064A (en) | Data base generating method, information storage and retrieval device, and recording medium | |
JP7475922B2 (en) | Knowledge information creation support device | |
JPWO2019187019A1 (en) | Customer support system and customer support method | |
JP3674427B2 (en) | Information providing server and information providing method | |
JP2018013819A (en) | Business matching support system, and business matching support method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210115 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7028746 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |