JP2021005391A - Text monitoring system, method for monitoring text, and program - Google Patents
Text monitoring system, method for monitoring text, and program Download PDFInfo
- Publication number
- JP2021005391A JP2021005391A JP2020149529A JP2020149529A JP2021005391A JP 2021005391 A JP2021005391 A JP 2021005391A JP 2020149529 A JP2020149529 A JP 2020149529A JP 2020149529 A JP2020149529 A JP 2020149529A JP 2021005391 A JP2021005391 A JP 2021005391A
- Authority
- JP
- Japan
- Prior art keywords
- text
- texts
- monitoring
- representative
- predetermined condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 179
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000003247 decreasing effect Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 description 56
- 238000011156 evaluation Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 24
- 239000000284 extract Substances 0.000 description 17
- 230000007547 defect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、テキスト監視システム、テキスト監視方法、及び、記録媒体に関し、特に、テキストを用いて監視を行うテキスト監視システム、テキスト監視方法、及び、記録媒体に関する。 The present invention relates to a text monitoring system, a text monitoring method, and a recording medium, and more particularly to a text monitoring system, a text monitoring method, and a recording medium for monitoring using text.
収集したテキストから、製品に対する不具合報告や、クレーム等の事象の発生を監視する技術として、特定のキーワードを含むテキストの数を監視する方法が知られている。例えば、特許文献1には、収集した文書から、風評規則に従って、風評表現を抽出する技術が開示されている。特定のキーワードを含むテキストの監視では、予め、監視対象の事象のキーワードを定義する必要がある。
A method of monitoring the number of texts containing a specific keyword is known as a technique for monitoring the occurrence of an event such as a defect report or a complaint for a product from the collected texts. For example,
キーワードの定義が不要な監視技術として、例えば、テキスト間のキーワードの共有度合いをもとに、テキストをクラスタに分類し、各クラスタに分類されたテキストの数を監視する方法が考えられる。 As a monitoring technique that does not require the definition of keywords, for example, a method of classifying texts into clusters based on the degree of sharing of keywords between texts and monitoring the number of texts classified in each cluster can be considered.
しかしながら、一般に、監視対象のテキストには、複数の観点が混在していることがある。このため、キーワードの共有度合いをもとにテキストの分類を行っても、観点の見落とし、或いは、異なる観点のテキストの同じクラスタへの分類等により、各クラスタの観点が不明確になることがある。したがって、キーワードの共有度合いをもとに生成されたクラスタを用いてテキストの監視をした場合、事象の検出精度が低いことがある。 However, in general, the text to be monitored may have a mixture of viewpoints. For this reason, even if texts are classified based on the degree of sharing of keywords, the viewpoints of each cluster may become unclear due to oversight of viewpoints or classification of texts from different viewpoints into the same cluster. .. Therefore, when text is monitored using a cluster generated based on the degree of keyword sharing, the event detection accuracy may be low.
図25は、キーワードの共有度合いをもとにしたクラスタリング結果の例を示す図である。図25のテキストは、自動車の不具合に係るテキストである。これらのテキストは、「不具合」、「発進」、「周辺」等のキーワードを共有しているため、同じクラスタに分類される。しかしながら、このクラスタに分類されるテキストの数が増加したときにアラートが通知されても、クラスタ内に含まれるテキストは同じ事象に係るテキストではないため、ユーザは、どのような事象が増加したかを正確に把握できない。 FIG. 25 is a diagram showing an example of clustering results based on the degree of sharing of keywords. The text in FIG. 25 is a text relating to a malfunction of an automobile. These texts are classified into the same cluster because they share keywords such as "fault", "start", and "periphery". However, even if an alert is notified when the number of texts classified in this cluster increases, the text contained in the cluster is not the text related to the same event, so the user can see what kind of event has increased. I can't figure out exactly.
なお、関連技術として、非特許文献1には、テキスト間の含意関係を抽出し、含意関係があるテキストを同じクラスタに分類する、含意クラスタリング技術が開示されている。また、特許文献2には、テキスト間の含意関係をもとに、含意関係を表す含意グラフを生成する技術が開示されている。特許文献3には、対話テキストの集合から発話を抽出し、含意関係がある発話を発話クラスタとして抽出する技術が開示されている。
As a related technique, Non-Patent
上述のように、キーワードの共有度合いをもとに生成されたクラスタを用いて事象の監視を行った場合、事象の検出精度が低いという技術課題があった。 As described above, when event monitoring is performed using a cluster generated based on the degree of keyword sharing, there is a technical problem that the event detection accuracy is low.
本発明の目的は、上述の技術課題を解決し、テキストを用いた監視において、事象の検出精度を向上できる、テキスト監視システム、テキスト監視方法、及び、記録媒体を提供することである。 An object of the present invention is to provide a text monitoring system, a text monitoring method, and a recording medium capable of solving the above-mentioned technical problems and improving the detection accuracy of an event in monitoring using text.
本発明の一態様における分析支援システムは、第1のテキストを取得するテキスト取得手段と、第2のテキストの指定を受け付ける受付手段と、前記取得した第1のテキストのうち、前記指定を受け付けた第2のテキストを含意する第1のテキストの数が所定の条件を満たすか否かを監視する監視手段と、前記所定の条件を満たす場合に、前記所定の条件を満たすことが把握可能な画面を表示する表示制御手段と、を備え、前記第2のテキストと、前記第2のテキストを含意する前記第1のテキストとの関係は、前記第1のテキストの内容が真であるならば前記第2のテキストの内容が真である、ことを示す。 The analysis support system according to one aspect of the present invention has received the designation of the text acquisition means for acquiring the first text, the reception means for accepting the designation of the second text, and the acquired first text. A monitoring means for monitoring whether or not the number of the first texts including the second text satisfies a predetermined condition, and a screen capable of grasping that the predetermined condition is satisfied when the predetermined condition is satisfied. The relationship between the second text and the first text implying the second text is such that if the content of the first text is true, the relationship between the second text and the first text is provided. Indicates that the content of the second text is true.
本発明の一態様における分析支援方法は、コンピュータに具備されたテキスト取得手段が、第1のテキストを取得し、前記コンピュータに具備された受付手段が、第2のテキストの指定を受け付け、前記コンピュータに具備された監視手段が、前記取得した第1のテキストのうち、前記指定を受け付けた第2のテキストを含意する第1のテキストの数が所定の条件を満たすか否かを監視し、前記コンピュータに具備された表示制御手段が、前記所定の条件を満たす場合に、前記所定の条件を満たすことが把握可能な画面を表示する分析支援方法であって、前記第2のテキストと、前記第2のテキストを含意する前記第1のテキストとの関係は、前記第1のテキストの内容が真であるならば前記第2のテキストの内容が真である、ことを示す。 In the analysis support method according to one aspect of the present invention, the text acquisition means provided in the computer acquires the first text, the reception means provided in the computer receives the designation of the second text, and the computer. The monitoring means provided in the above monitors whether or not the number of the first texts including the second text that has received the designation among the acquired first texts satisfies a predetermined condition. An analysis support method for displaying a screen on which it is possible to grasp that the predetermined condition is satisfied when the display control means provided in the computer satisfies the predetermined condition, the second text and the second text. The relationship with the first text, which implies the second text, indicates that if the content of the first text is true, then the content of the second text is true.
本発明の一態様におけるプログラムは、コンピュータに、第1のテキストを取得し、第2のテキストの指定を受け付け、前記取得した第1のテキストのうち、前記指定を受け付けた第2のテキストを含意する第1のテキストの数が所定の条件を満たすか否かを監視し、前記所定の条件を満たす場合に、前記所定の条件を満たすことが把握可能な画面を表示する処理を実行させるプログラムであって、前記第2のテキストと、前記第2のテキストを含意する前記第1のテキストとの関係は、前記第1のテキストの内容が真であるならば前記第2のテキストの内容が真である、ことを示す。 The program according to one aspect of the present invention acquires the first text, accepts the designation of the second text, and includes the second text of the acquired first text that has accepted the designation. A program that monitors whether or not the number of first texts to be used satisfies a predetermined condition, and if the predetermined condition is satisfied, executes a process of displaying a screen that can be grasped that the predetermined condition is satisfied. The relationship between the second text and the first text implying the second text is that if the content of the first text is true, the content of the second text is true. Indicates that.
本発明の技術効果は、テキストを用いた監視において、事象の検出精度を向上できることである。 The technical effect of the present invention is that the accuracy of event detection can be improved in monitoring using text.
はじめに、本発明の実施の形態で用いるテキストのクラスタリング手法である、含意クラスタリングについて説明する。含意クラスタリングでは、非特許文献1に記載されているように、テキスト間の意味の関係である、含意関係をもとにクラスタリングを行う。本発明の実施の形態では、含意関係を、特許文献2と同様に、次のように定義する。すなわち、第1のテキストの内容が真であるならば第2のテキストの内容が真である場合、第1のテキストが第2のテキストを含意(entailment)すると定義する。また、第1のテキストの内容から第2のテキストの内容が読み取れる場合、第1のテキストが第2のテキストを含意すると定義してもよい。含意クラスタリングを用いることにより、分析対象のテキストに含まれる観点をもれなく、かつ、クラスタ内のテキストが共通に含意し、クラスタの概要を表す代表テキストとともに抽出できる。
First, implication clustering, which is a text clustering method used in the embodiment of the present invention, will be described. In implication clustering, as described in Non-Patent
含意関係の理解を容易にするため、具体例を用いて説明する、
<具体例1>
第1のテキスト:オバマ大統領はホワイトハウスに住んでいる。
第2のテキスト:オバマ大統領はアメリカに住んでいる。
In order to facilitate understanding of implications, explanations will be given using specific examples.
<Specific example 1>
First text: President Obama lives in the White House.
Second text: President Obama lives in the United States.
この場合、第1のテキストの内容が真であるならば第2のテキストの内容が真であるので、第1のテキストが第2のテキストを含意するといえる。 In this case, if the content of the first text is true, then the content of the second text is true, so it can be said that the first text implies the second text.
<具体例2>
第1のテキスト:犬養毅首相は海軍将校らに暗殺された。
第2のテキスト:犬養毅首相は亡くなった
この場合、第1のテキストの内容が真であるならば第2のテキストの内容が真であるので、第1のテキストが第2のテキストを含意するといえる。
<Specific example 2>
First text: Prime Minister Tsuyoshi Inukai was assassinated by naval officers.
Second text: Prime Minister Tsuyoshi Inukai died In this case, if the content of the first text is true, then the content of the second text is true, so if the first text implies the second text I can say.
ここで、「代表テキスト」と「要素テキスト」を定義する。テキストの集合に対して含意クラスタリング処理を実行すると、代表テキストと要素テキストとが決定される。代表テキストと要素テキストとの関係は、要素テキストの内容が真であるならば代表テキストの内容が真である、という関係である。すなわち、代表テキストと要素テキストとの関係は、要素テキストは代表テキストを含意するという関係である。 Here, "representative text" and "element text" are defined. When the implication clustering process is executed on a set of texts, the representative text and the element texts are determined. The relationship between the representative text and the element text is that if the content of the element text is true, then the content of the representative text is true. That is, the relationship between the representative text and the element text is that the element text implies the representative text.
図24は、本発明の実施の形態における、代表テキストと要素テキストの関係の例を示す図である。代表テキストと要素テキストの理解を容易にするため、図24を用いて説明する。図24は、T1からT11までの11個のテキストについて、含意クラスタリング処理を実行した様子を示す。図24における円形のシンボルは一つのテキストを示す。図24における矢印は、矢印の元のテキストが矢印の先のテキストを含意することを示す。図24において、テキストT6、T7、T11が、テキストT1を含意している。同様に、テキストT2、T3、T7、T10が、テキストT5を含意しており、テキストT2、T4、T7、T8が、テキストT9を含意している。このとき、テキストT6、T7、T11は、代表テキストT1の要素テキストである。同様に、テキストT2、T3、T7、T10は、代表テキストT5の要素テキストである。同様に、テキストT2、T4、T7、T8は、代表テキストT9の要素テキストである。 FIG. 24 is a diagram showing an example of the relationship between the representative text and the element text in the embodiment of the present invention. In order to facilitate the understanding of the representative text and the element text, the description will be made with reference to FIG. FIG. 24 shows how the implication clustering process was executed for 11 texts from T1 to T11. The circular symbol in FIG. 24 indicates a piece of text. The arrow in FIG. 24 indicates that the original text of the arrow implies the text at the tip of the arrow. In FIG. 24, the texts T6, T7, T11 imply text T1. Similarly, texts T2, T3, T7, and T10 imply text T5, and texts T2, T4, T7, and T8 imply text T9. At this time, the texts T6, T7, and T11 are element texts of the representative text T1. Similarly, the texts T2, T3, T7, and T10 are element texts of the representative text T5. Similarly, the texts T2, T4, T7, and T8 are element texts of the representative text T9.
ここで、代表テキスト自身が要素テキストとして扱われてもよい。例えば、テキストT1、T6、T7、T11が代表テキストT1の要素テキストでもよい。 Here, the representative text itself may be treated as an element text. For example, the texts T1, T6, T7, and T11 may be element texts of the representative text T1.
(第1の実施の形態)
本発明の第1の実施の形態について説明する。
(First Embodiment)
The first embodiment of the present invention will be described.
はじめに、本発明の第1の実施の形態の構成を説明する。 First, the configuration of the first embodiment of the present invention will be described.
図2は、本発明の第1の実施の形態における、監視システム1の構成を示すブロック図である。
FIG. 2 is a block diagram showing the configuration of the
図2を参照すると、本発明の第1の実施の形態における監視システム1は、テキスト取得部10、テキスト記憶部20、含意関係抽出部30、代表テキスト抽出部40、代表テキスト記憶部50、判定部60、監視部70、及び、表示制御部80を含む。監視システム1は、本発明のテキスト監視システムの一実施形態である。
Referring to FIG. 2, the
テキスト取得部10は、監視対象のテキストを取得する。
The
テキスト記憶部20は、テキスト取得部10が取得したテキストを示すテキストデータを記憶する。
The
図5は、本発明の第1の実施の形態における、テキストデータの例を示す図である。図5の例は、監視対象のテキストが、自動車の不具合報告における「現象」に係る、自然言語のテキストの場合の例である。テキストデータは、テキストの取得日時、及び、テキストを含む。なお、テキストの前の括弧内の符号は、テキストの識別子を示す。 FIG. 5 is a diagram showing an example of text data in the first embodiment of the present invention. The example of FIG. 5 is an example in which the text to be monitored is a natural language text related to the "phenomenon" in the defect report of the automobile. The text data includes the acquisition date and time of the text and the text. The code in parentheses before the text indicates the text identifier.
監視対象のテキストは、例えば、文書(不具合報告書等)から抽出される。この場合、テキストは、例えば、所定の形式に従って、複数のカテゴリ(不具合の現象、原因、対策等)毎に記載された文書中の、監視対象のカテゴリ(現象)に対する記載を取得することにより抽出される。また、テキストは、自由形式で記述された文書から、監視対象のカテゴリに係る記載部分を特定することにより抽出されてもよい。また、テキストは、例えば、コールセンタ等における会話を音声認識することにより生成した、コールログから抽出されてもよい。また、テキストは、口コミサイトや、ブログ、SNS(ソーシャルネットワーキングサービス)から抽出されてもよい。 The text to be monitored is extracted from, for example, a document (defect report, etc.). In this case, the text is extracted, for example, by acquiring the description for the category (phenomenon) to be monitored in the document described for each of a plurality of categories (phenomenon, cause, countermeasure, etc. of the defect) according to a predetermined format. Will be done. In addition, the text may be extracted from the document described in free form by specifying the description part related to the category to be monitored. Further, the text may be extracted from a call log generated by voice recognition of a conversation in a call center or the like, for example. In addition, the text may be extracted from word-of-mouth sites, blogs, and SNS (social networking services).
含意関係抽出部30は、監視対象のテキストの内、含意関係抽出対象のテキスト(以下、抽出対象テキストとも記載する)を用いて、含意関係を抽出する。ここで、抽出対象テキストとして、例えば、複数の所定の長さの監視期間(定期的な監視期間)の内の最初の監視期間等、特定の監視期間の全テキストや、特定の監視期間の一部(所定数や所定の部分期間)のテキストが用いられる。
The implication
代表テキスト抽出部40は、抽出された含意関係から代表テキストを抽出し、代表テキスト、及び、代表テキストを含意する要素テキストが設定されたクラスタを生成する。
The representative
代表テキスト記憶部50は、代表テキスト抽出部40が生成したクラスタに係る情報を示す代表テキスト情報を記憶する。
The representative
判定部60は、監視期間毎に、新たに取得された(テキストデータに追加された)各テキストが、各代表テキストを含意するか(各クラスタに属するか)どうかを判定する。
The
監視部70は、監視期間毎に、各代表テキストを含意するテキストの数を監視し、監視結果を、表示制御部80を介して出力する。本発明の第1の実施の形態では、監視結果の出力として、代表テキストを含意するテキストの数が所定の通知条件を満たした場合に、通知を行う。ここで、通知条件として、例えば、テキストの数に係る下限の閾値(テキストの数が閾値以上であれば通知)が用いられる。
The
表示制御部80は、監視結果(通知内容)を表示するための通知画面90を生成し、ユーザ等に表示する。
The
なお、監視システム1は、CPU(Central Processing Unit)とプログラムを記憶した記憶媒体を含み、プログラムにもとづく制御によって動作するコンピュータであってもよい。
The
図3は、本発明の第1の実施の形態における、コンピュータにより実現された監視システム1の構成を示すブロック図である。
FIG. 3 is a block diagram showing a configuration of a
監視システム1は、CPU2、ハードディスクやメモリ等の記憶デバイス3(記憶媒体)、他の装置等と通信を行う通信デバイス4、マウスやキーボード等の入力デバイス5、及び、ディスプレイ等の出力デバイス6を含む。
The
CPU2は、テキスト取得部10、含意関係抽出部30、代表テキスト抽出部40、判定部60、監視部70、及び、表示制御部80の機能を実現するためのコンピュータプログラムを実行する。記憶デバイス3は、テキスト記憶部20、及び、代表テキスト記憶部50のデータを記憶する。出力デバイス6は、ユーザ等へ、通知画面90を出力する。入力デバイス5は、ユーザ等から、例えば、通知条件等の指定を受け付ける。また、通信デバイス4が、他の装置等へ通知画面90を出力してもよい。
The
また、図2に示された監視システム1の各構成要素は、独立した論理回路でもよい。
Further, each component of the
また、図2に示された監視システム1の各構成要素は、有線または無線で接続された複数の物理的な装置に分散的に配置されていてもよい。
Further, each component of the
次に、本発明の第1の実施の形態の動作を説明する。 Next, the operation of the first embodiment of the present invention will be described.
ここでは、テキスト取得部10が、例えば、図示しない記憶部等に定期的にアクセスすることにより、不具合報告に係る文書から監視対象のテキストを抽出し、図5のようなテキストデータを、テキスト記憶部20に保存していると仮定する。
Here, the
また、テキストの監視は監視期間(1ヶ月)毎に行われると仮定する。さらに、含意関係抽出対象のテキスト(抽出対象テキスト)は、最初の監視期間のテキストの内の、先頭の所定数のテキストであると仮定する。 It is also assumed that text monitoring is performed every monitoring period (1 month). Further, it is assumed that the text to be extracted with implications (text to be extracted) is the first predetermined number of texts in the text of the first monitoring period.
図4は、本発明の第1の実施の形態における、監視システム1の動作を示すフローチャートである。
FIG. 4 is a flowchart showing the operation of the
はじめに、含意関係抽出部30は、最初の監視期間において、テキスト記憶部20に保存されている、抽出対象テキスト間の含意関係を抽出する(ステップS101)。
First, the implication
ここで、含意関係抽出部30は、例えば、特許文献2と同様の判定処理を行うことにより、テキスト間の含意関係を抽出する。この場合、含意関係抽出部30は、テキストに含まれる内容語を比較し、被覆率を算出することにより、含意関係の有無を判定する。なお、含意関係抽出部30は、テキスト間の含意関係を抽出できれば、特許文献2と異なる判定処理により、テキスト間の含意関係を判定してもよい。
Here, the implication
図6は、本発明の第1の実施の形態における、含意関係の抽出結果の例を示す図である。図6において、矢印の元のテキストは、先のテキストを含意することを示す。図6の例では、テキストT6、T7、T11、…が、テキストT1「警告灯が点灯した」を含意している。同様に、テキストT2、T3、T7、T10、…が、テキストT5「異音がする」を含意しており、テキストT2、T4、T7、T8、…が、テキストT9「エンストした」を含意している。 FIG. 6 is a diagram showing an example of the extraction result of the implication relationship in the first embodiment of the present invention. In FIG. 6, the original text of the arrow indicates that it implies the previous text. In the example of FIG. 6, the texts T6, T7, T11, ... Imply the text T1 "warning light turned on". Similarly, texts T2, T3, T7, T10, ... Imply text T5 "abnormal noise", and texts T2, T4, T7, T8, ... Imply text T9 "stall". ing.
例えば、含意関係抽出部30は、図5における、取得日時が監視期間「2015/1」内の抽出対象テキストから、図6のような含意関係を抽出する。
For example, the implication
代表テキスト抽出部40は、抽出された含意関係から代表テキストを抽出し、クラスタを生成する(ステップS102)。代表テキスト抽出部40は、例えば、非特許文献1の技術と同様に、含意関係抽出部30により抽出された含意関係をもとに、クラスタを生成する。ここで、抽出対象テキストの内、他のテキストにより含意されるテキストがクラスタの代表テキスト、当該代表テキストを含意するテキストが当該クラスタの要素テキストに設定される。テキストが複数の代表テキストを含意する場合、当該テキストは、複数のクラスタの要素テキストに設定される。なお、本発明の実施の形態では、あるクラスタの代表テキストに設定されたテキスト自身も、当該クラスタの代表テキストを含意する要素テキストとして設定される。代表テキスト抽出部40は、各クラスタの代表テキストの識別子を当該クラスタの要素テキストの識別子と関連付けた代表テキスト情報を、代表テキスト記憶部50に保存する。
The representative
図7は、本発明の第1の実施の形態における、代表テキスト情報の例を示す図である。図7の例では、テキストT1「警告灯が点灯した」、T5「異音がする」、及び、T9「エンストした」が、それぞれ、クラスタC1、C2、及び、C3の代表テキストに設定されている。また、テキストT1とテキストT1を含意するテキストT6、T7、T11…が、クラスタC1の要素テキストに設定されている。同様に、テキストT5とテキストT5を含意するテキストが、クラスタC2の要素テキストに設定され、テキストT9とテキストT9を含意するテキストが、クラスタC3の要素テキストに設定されている。 FIG. 7 is a diagram showing an example of representative text information in the first embodiment of the present invention. In the example of FIG. 7, the texts T1 "warning light turned on", T5 "abnormal noise", and T9 "stall" are set as the representative texts of clusters C1, C2, and C3, respectively. There is. Further, the texts T6, T7, T11 ... Implying the text T1 and the text T1 are set as the element texts of the cluster C1. Similarly, the text including the text T5 and the text T5 is set as the element text of the cluster C2, and the text including the text T9 and the text T9 is set as the element text of the cluster C3.
例えば、代表テキスト抽出部40は、図6の含意関係をもとに、図7のような代表テキスト情報を生成する。
For example, the representative
なお、代表テキスト抽出部40は、さらに、異なるクラスタ間の要素テキストの重複の度合いをもとに、当該異なるクラスタを一つのクラスタに統合してもよい。
The representative
次に、判定部60は、各監視期間において、テキスト記憶部20に保存されている、当該監視期間に新たに取得された(テキストデータに追加された)各テキストが、各代表テキストを含意するかどうかを判定する(ステップS103)。
Next, in each monitoring period, the
監視部70は、各代表テキストについて、当該代表テキストを含意するテキストの数を集計する(ステップS104)。ここで、監視期間のテキストに、抽出対象テキストが含まれる場合、当該抽出対象テキストの数も、集計対象のテキストとして用いられる。また、監視部70は、どの代表テキストにも含意しないテキストの数を、「その他」のテキストの数として集計する。
The
監視部70は、監視期間の、各代表テキストを含意するテキストの数が、所定の通知条件を満足するかどうかを判定する(ステップS105)。
The
ステップS105で、所定の通知条件を満たす代表テキストがある場合(ステップS105/Y)、監視部70は、表示制御部80を介して通知を行う(ステップS106)。ここで、表示制御部80は、通知画面90を生成し、ユーザ等に表示する。
In step S105, when there is a representative text satisfying a predetermined notification condition (step S105 / Y), the
さらに、「その他」のテキストの数が所定の抽出閾値未満の間、ステップS103からの処理が、監視期間毎に繰り返される(ステップS107/N)。 Further, while the number of "other" texts is less than the predetermined extraction threshold, the process from step S103 is repeated for each monitoring period (step S107 / N).
図8は、本発明の第1の実施の形態における、各代表テキストを含意するテキストの数の例である。 FIG. 8 is an example of the number of texts implying each representative text in the first embodiment of the present invention.
例えば、監視部70は、監視期間「2015/1」、「2015/2」、…の各々において、図8のように、各代表テキストT1、T5、T9を含意するテキストの数を集計する。
For example, the
ここで、例えば、通知条件が、テキストの数に係る下限の閾値「100以上」の場合、監視期間「2015/5」における、代表テキストT5「異音がする」を含意するテキストの数が通知条件を満たす。したがって、監視部70は、監視期間「2015/5」の事象「異音がする」に関して、通知を行う。
Here, for example, when the notification condition is the lower limit threshold value “100 or more” related to the number of texts, the number of texts including the representative text T5 “abnormal noise” in the monitoring period “2015/5” is notified. Satisfy the conditions. Therefore, the
図9は、本発明の第1の実施の形態における、通知画面90の例を示す図である。
FIG. 9 is a diagram showing an example of the
図9の例では、通知画面90は、通知領域91、代表テキスト表示領域92、時系列表示領域93、及び、テキスト表示領域94を含む。
In the example of FIG. 9, the
通知領域91には、通知対象の監視期間(通知閾値の超過が検出された監視期間)や通知対象の代表テキスト(通知閾値を超過した代表テキスト)が表示される。
In the
代表テキスト表示領域92の「クラスタ」欄には、例えば、各クラスタの代表テキストが表示される。また、「件数」欄には、例えば、通知対象の監視期間における、各代表テキストを含意するテキストの数が表示される。
In the "cluster" column of the representative
時系列表示領域93には、例えば、監視期間毎の、各代表テキストを含意するテキストの数(時系列)を示すグラフが表示される。
In the time
テキスト表示領域94の「詳細テキスト」欄には、例えば、通知対象の監視期間における、通知対象の代表テキストを含意するテキストが、取得日時の順番で表示される。
In the "detailed text" field of the
表示制御部80は、図9のような通知画面90を、ユーザ等に表示する。
The
ユーザ等は、図9の通知画面90の通知領域91を参照し、発生数が多い(または、少ない)事象を、概要レベルで把握できる。また、ユーザ等は、テキスト表示領域94を参照し、当該通知対象の事象の詳細を把握できる。
The user or the like can refer to the
また、「その他」のテキストの数が、所定の抽出閾値以上の場合(ステップS107/Y)、ステップS101からの処理が行われる。 Further, when the number of "other" texts is equal to or greater than the predetermined extraction threshold value (step S107 / Y), the processing from step S101 is performed.
図10は、本発明の第1の実施の形態における、監視期間毎の、各代表テキストを含意するテキストの数の他の例である。 FIG. 10 is another example of the number of texts implying each representative text for each monitoring period in the first embodiment of the present invention.
ここで、例えば、抽出閾値が「10」の場合、監視期間「2016/4」における、「その他」のテキストの数が抽出閾値以上である。したがって、含意関係抽出部30は、例えば、次の監視期間「2016/5」の抽出対象テキストから、再び、含意関係を抽出する。そして、代表テキスト抽出部40は、抽出された含意関係から、再び、代表テキストを抽出し、クラスタを生成する。ここで、代表テキスト抽出部40が、代表テキストT1、T5、T9に加えて、新たな代表テキストT201「オイルが漏れている」を抽出したと仮定する。
Here, for example, when the extraction threshold value is “10”, the number of “other” texts in the monitoring period “2016/4” is equal to or greater than the extraction threshold value. Therefore, the implication
監視期間「2016/8」において、代表テキストT201「オイルが漏れている」を含意するテキストの数が通知条件を満たす。したがって、監視部70は、監視期間「2016/8」の事象「オイルが漏れている」に関して通知を行う。
In the monitoring period "2016/8", the number of texts implying the representative text T201 "oil is leaking" satisfies the notification condition. Therefore, the
以上により、本発明の第1の実施の形態の動作が完了する。 As described above, the operation of the first embodiment of the present invention is completed.
なお、本発明の第1の実施の形態では、クラスタリング対象のテキストが、自動車の不具合報告に係るテキストである場合を例に説明した。しかしながら、これに限らず、クラスタリング対象のテキストは、様々な現象や原因、対策、意見、評価、苦情、要望等、どのような内容に係るテキストでもよい。 In the first embodiment of the present invention, a case where the text to be clustered is a text related to a defect report of an automobile has been described as an example. However, the text to be clustered is not limited to this, and the text related to any content such as various phenomena, causes, countermeasures, opinions, evaluations, complaints, requests, etc. may be used.
また、本発明の第1の実施の形態では、含意関係抽出対象のテキスト(抽出対象テキスト)として、特定の監視期間のテキスト(全テキストや一部のテキスト)を用いた。そして、当該監視期間のテキストから抽出された含意関係をもとに、代表テキストが抽出され、当該代表テキストが、当該監視期間以降の監視期間の監視に用いられた。また、その他の代表テキストの数が所定の抽出閾値以上の場合に、新たな監視期間のテキストから含意関係が再抽出され、当該含意関係をもとに代表テキストが再抽出された。 Further, in the first embodiment of the present invention, the text (all texts or a part of the texts) of a specific monitoring period was used as the text to be extracted (extracted text). Then, a representative text was extracted based on the implication relationship extracted from the text of the monitoring period, and the representative text was used for monitoring the monitoring period after the monitoring period. Further, when the number of other representative texts was equal to or more than a predetermined extraction threshold value, the implication relation was re-extracted from the text of the new monitoring period, and the representative text was re-extracted based on the implication relation.
しかしながら、これに限らず、抽出対象テキストとして、各監視期間のテキストを用いてもよい。この場合、監視期間ごとに、当該監視期間のテキストから含意関係の再抽出、代表テキストの再抽出が行われ、当該代表テキストが、当該監視期間の監視に用いられる。 However, the present invention is not limited to this, and the text of each monitoring period may be used as the text to be extracted. In this case, for each monitoring period, the implication relationship is re-extracted from the text of the monitoring period and the representative text is re-extracted, and the representative text is used for monitoring the monitoring period.
また、これに限らず、抽出対象テキストとして、各監視期間までに取得したテキスト(当該監視期間以前のテキスト)を用いてもよい。この場合、監視期間ごとに、当該監視期間のテキストが抽出対象テキストに追加され、含意関係の再抽出、代表テキストの再抽出が行われる。 Further, the present invention is not limited to this, and the text acquired by each monitoring period (text before the monitoring period) may be used as the text to be extracted. In this case, for each monitoring period, the text of the monitoring period is added to the extraction target text, and the implication relationship is re-extracted and the representative text is re-extracted.
また、代表テキスト抽出部40は、代表テキストの再抽出により新たな代表テキストが抽出された場合、当該新たな代表テキストを、表示制御部80を介して通知してもよい。
Further, when a new representative text is extracted by re-extracting the representative text, the representative
また、代表テキスト抽出部40は、抽出された代表テキストの内、監視対象の代表テキストの指定をユーザ等から受け付け、監視部70は、当該指定された代表テキストについて、含意するテキストの数を監視してもよい。
Further, the representative
また、本発明の第1の実施の形態では、通知条件として、テキストの数に係る下限の閾値を用いた。しかしながら、これに限らず、通知条件として、上限の閾値(テキストの数が閾値以下であれば通知)、または、増加量もしくは減少量の下限の閾値(テキストの数の増加量もしくは減少量が閾値以上であれば通知)が用いられてもよい。また、通知条件として、テキストの数や増減量の閾値以外に、テキストの数や増減量に係る、所定の統計量や分布の条件が設定されていてもよい。 Further, in the first embodiment of the present invention, the lower limit threshold value related to the number of texts is used as the notification condition. However, not limited to this, as a notification condition, an upper threshold (notification if the number of texts is less than or equal to the threshold) or a lower threshold of the increase or decrease (the increase or decrease in the number of texts is the threshold). If the above is the case, notification) may be used. Further, as the notification condition, a predetermined statistic or distribution condition related to the number of texts or the amount of increase / decrease may be set in addition to the threshold value of the number of texts or the amount of increase / decrease.
次に、本発明の第1の実施の形態の基本的な構成を説明する。 Next, the basic configuration of the first embodiment of the present invention will be described.
図1は、本発明の第1の実施の形態の基本的な構成を示すブロック図である。図1を参照すると、本発明の監視システム1(テキスト監視システム)は、テキスト取得部10、判定部60、及び、監視部70を含む。監視システム1は、テキスト間の含意関係に基づいて抽出された、他のテキストが含意するテキストである代表テキストを記憶する記憶部にアクセス可能に接続される。テキスト取得部10は、監視対象のテキストを取得する。判定部60は、取得したテキストが代表テキストを含意するかを判定する。監視部70は、代表テキストを含意するテキストの数を監視し、監視結果を出力する。
FIG. 1 is a block diagram showing a basic configuration of the first embodiment of the present invention. Referring to FIG. 1, the monitoring system 1 (text monitoring system) of the present invention includes a
次に、本発明の第1の実施の形態の効果を説明する。 Next, the effect of the first embodiment of the present invention will be described.
本発明の第1の実施の形態によれば、テキストを用いた監視において、事象の検出精度を向上できる。その理由は、判定部60が、取得したテキストが代表テキストを含意するかを判定し、監視部70は、代表テキストを含意するテキストの数を監視し、監視結果を出力するためである。これにより、ユーザは、明確な概要レベルの観点毎に、発生数が多い(または、少ない)事象を把握できる。
According to the first embodiment of the present invention, the accuracy of detecting an event can be improved in monitoring using text. The reason is that the
また、本発明の第1の実施の形態によれば、テキストを用いた監視において、事前に監視対象を定義することなく監視を行うことができる。その理由は、代表テキスト抽出部40が、監視対象のテキスト間の含意関係から代表テキストを抽出するためである。
Further, according to the first embodiment of the present invention, in monitoring using a text, monitoring can be performed without defining a monitoring target in advance. The reason is that the representative
(第2の実施の形態)
次に、本発明の第2の実施の形態について説明する。
(Second Embodiment)
Next, a second embodiment of the present invention will be described.
本発明の第2の実施の形態では、特定の種別の代表テキストを含意するテキストの数の合計を監視する点において、本発明の第1の実施の形態と異なる。 A second embodiment of the present invention differs from the first embodiment of the present invention in that it monitors the total number of texts implying a particular type of representative text.
はじめに、本発明の第2の実施の形態の構成を説明する。 First, the configuration of the second embodiment of the present invention will be described.
図11は、本発明の第2の実施の形態における、監視システム1の構成を示すブロック図である。
FIG. 11 is a block diagram showing the configuration of the
図11を参照すると、本発明の第2の実施の形態の監視システム1は、本発明の第1の実施の形態の監視システム1の構成に加えて、対象種別記憶部65を含む。
Referring to FIG. 11, the
対象種別記憶部65は、監視対象の代表テキストの種別を示す、対象種別情報を記憶する。
The target
図15は、本発明の第2の実施の形態における、対象種別情報の例を示す図である。対象種別情報は、代表テキストの種別(「種別」欄)、通知条件(「通知条件」欄)、及び、当該種別に分類される代表テキスト(「クラスタ欄」)を含む。図15の例では、代表テキストの種別として、「悪い評価」、及び、「良い評価」が設定されている。また、通知条件として、各種別の代表テキストに含意するテキストの数の合計に係る下限の閾値が設定されている。 FIG. 15 is a diagram showing an example of target type information in the second embodiment of the present invention. The target type information includes the type of the representative text (“type” column), the notification condition (“notification condition” column), and the representative text classified into the type (“cluster column”). In the example of FIG. 15, "bad evaluation" and "good evaluation" are set as the types of representative texts. Further, as a notification condition, a lower limit threshold value relating to the total number of texts implied in each type of representative text is set.
代表テキスト抽出部40は、抽出した代表テキストを、対象種別情報で示される種別に分類する。ここで、代表テキスト抽出部40は、所定の分類ルールに従って、抽出した代表テキストを種別に分類する。この場合、分類ルールには、例えば、種別毎に、キーワードや表現が定義され、当該キーワードや表現を含む代表テキストが、対応する種別に分類される。また、代表テキスト抽出部40は、抽出した代表テキストをユーザ等に出力し、ユーザ等から、当該代表テキストの種別の指定を受け付けてもよい。
The representative
監視部70は、対象種別情報で示される各種別について、当該種別の代表テキストを含意するテキストの数の合計が、当該種別に対して設定された通知条件を満たす場合に、通知を行う。
The
表示制御部80は、監視結果(通知内容)を表示するための通知画面100を生成し、ユーザ等に表示する。
The
次に、本発明の第2の実施の形態の動作を説明する。 Next, the operation of the second embodiment of the present invention will be described.
上述のステップS102で、代表テキスト抽出部40は、抽出した代表テキストを、対象種別情報で示される種別に分類する。
In step S102 described above, the representative
ステップS104で、監視部70は、対象種別情報で示される各種別について、当該種別の代表テキストを含意するテキストの数の合計を集計する。
In step S104, the
ステップS105で、監視部70は、監視期間における、各種別のテキストの数の合計が、当該種別に対して設定された通知条件を満たすかどうかを判定する。通知条件を満たす場合、監視部70は、ステップS106で、通知を行う。
In step S105, the
次に、本発明の第2の実施の形態の動作の具体例を説明する。 Next, a specific example of the operation of the second embodiment of the present invention will be described.
図12は、本発明の第2の実施の形態における、テキストデータの例を示す図である。図12の例は、監視対象のテキストが、テレビ製品の「評価」に係るテキストである場合の例である。ここでは、テキスト取得部10が、図12のようなテキストデータを、テキスト記憶部20に保存していると仮定する。また、対象種別情報には、図15のような種別、及び、通知条件が設定されていると仮定する。
FIG. 12 is a diagram showing an example of text data in the second embodiment of the present invention. The example of FIG. 12 is an example in which the text to be monitored is the text related to the "evaluation" of the television product. Here, it is assumed that the
図13は、本発明の第2の実施の形態における、含意関係の抽出結果の例を示す図である。 FIG. 13 is a diagram showing an example of the extraction result of the implication relationship in the second embodiment of the present invention.
含意関係抽出部30は、例えば、図12における、取得日時が監視期間「2015/1」内の抽出対象テキストから、図13に示すように、含意関係を抽出する。
The implication
図14は、本発明の第2の実施の形態における、代表テキスト情報の例を示す図である。 FIG. 14 is a diagram showing an example of representative text information in the second embodiment of the present invention.
代表テキスト抽出部40は、図13の含意関係をもとに、図14のような代表テキスト情報を生成する。そして、代表テキスト抽出部40は、代表テキストT304「価格が高い」を種別「悪い評価」に、代表テキストT305「機能性が高い」、T306「デザインがよい」を種別「良い評価」に分類し、図15のように、対象種別情報に設定する。
The representative
図16は、本発明の第2の実施の形態における、各種別の代表テキストを含意するテキストの数の合計の例である。 FIG. 16 is an example of the total number of texts implying different representative texts in the second embodiment of the present invention.
例えば、監視部70は、監視期間「2015/1」、「2015/2」、…の各々において、図16のように、種別「悪い評価」、「良い評価」の各々の代表テキストを含意するテキストの数の合計を集計する。
For example, the
ここで、監視期間「2015/5」における、種別「良い評価」の代表テキストを含意するテキストの数の合計が通知条件を満たす。したがって、監視部70は、監視期間「2015/5」の種別「良い評価」の事象に関して通知を行う。
Here, the total number of texts including the representative text of the type "good evaluation" in the monitoring period "2015/5" satisfies the notification condition. Therefore, the
図17は、本発明の第2の実施の形態における、通知画面100の例を示す図である。
FIG. 17 is a diagram showing an example of the
図17の例では、通知画面100は、通知領域101、種別表示領域102、代表テキスト表示領域103、時系列表示領域104、及び、テキスト表示領域105を含む。
In the example of FIG. 17, the
通知領域101には、通知対象の監視期間や通知対象の種別が表示される。
In the
種別表示領域102の「種別」欄には、例えば、各種別が表示される。また、「件数」欄には、例えば、通知対象の監視期間における、各種別の代表テキストを含意するテキストの数の合計が表示される。
In the "type" column of the
代表テキスト表示領域103の「クラスタ」欄には、例えば、通知対象の種別の代表テキストが表示される。また、「件数」欄には、例えば、通知対象の監視期間における、各代表テキストを含意するテキストの数が表示される。
In the "cluster" column of the representative
時系列表示領域104には、例えば、監視期間毎の、各種別の代表テキストを含意するテキストの数の合計(時系列)を示すグラフが表示される。
In the time-
テキスト表示領域105の「詳細テキスト」欄には、通知対象の監視期間における、通知対象の種別の代表テキストを含意するテキストが、例えば、取得日時の順番で表示される。
In the "detailed text" field of the
表示制御部80は、図17のような通知画面100を、ユーザ等に表示する。
The
ユーザ等は、図17の通知画面100の通知領域101を参照し、発生数が多い(または、少ない)事象の種別を把握できる。特定の種別が、製品に係る「良い評価」や「悪い評価」であれば、ユーザ等は、当該製品に対してどのような評価がされているかを容易に把握できる。また、ユーザ等は、テキスト表示領域105を参照し、「良い評価」や「悪い評価」の具体的な内容を確認できる。
The user or the like can refer to the
以上により、本発明の第2の実施の形態の動作が完了する。 As described above, the operation of the second embodiment of the present invention is completed.
次に、本発明の第2の実施の形態の効果を説明する。 Next, the effect of the second embodiment of the present invention will be described.
本発明の第2の実施の形態によれば、発生数が多い(または、少ない)事象の種別を容易に把握できる。その理由は、監視部70が、所定の種別に属する代表テキストを含意するテキストの数の合計を監視するためである。
According to the second embodiment of the present invention, the types of events with a large number of occurrences (or a small number of occurrences) can be easily grasped. The reason is that the
(第3の実施の形態)
次に、本発明の第3の実施の形態について説明する。
(Third Embodiment)
Next, a third embodiment of the present invention will be described.
本発明の第3の実施の形態では、監視結果として、異なる監視期間の間での、各代表テキストを含意するテキストの数の増減傾向を出力する点において、本発明の第1の実施の形態と異なる。 In the third embodiment of the present invention, as a monitoring result, an increasing / decreasing tendency of the number of texts including each representative text is output between different monitoring periods. Different from.
はじめに、本発明の第3の実施の形態の構成を説明する。 First, the configuration of the third embodiment of the present invention will be described.
本発明の第3の実施の形態の構成を示すブロック図は、本発明の第1の実施の形態(図2)と同様である。 The block diagram showing the configuration of the third embodiment of the present invention is the same as that of the first embodiment of the present invention (FIG. 2).
監視部70は、監視結果として、異なる監視期間の間での、各代表テキストを含意するテキストの数の増減傾向(比較結果)を出力する。
As the monitoring result, the
表示制御部80は、監視結果(増減傾向)を表示するための比較画面110を生成し、ユーザ等に表示(出力)する。
The
次に、本発明の第3の実施の形態の動作を説明する。 Next, the operation of the third embodiment of the present invention will be described.
図18は、本発明の第3の実施の形態における、監視システム1の動作を示すフローチャートである。
FIG. 18 is a flowchart showing the operation of the
はじめに、含意関係抽出部30は、上述のステップS101と同様に、抽出対象テキスト間の含意関係を抽出する(ステップS201)。ここで、含意関係抽出部30は、抽出対象テキストとして、複数の監視期間の全テキストを用いて、含意関係を抽出する。
First, the implication
代表テキスト抽出部40は、上述のステップS102と同様に、抽出された含意関係から代表テキストを抽出し、クラスタを生成する(ステップS202)。
The representative
判定部60は、上述のステップS103と同様に、各監視期間に取得された各テキストが、各代表テキストを含意するかどうかを判定する(ステップS203)。
Similar to step S103 described above, the
監視部70は、上述のステップS104と同様に、各代表テキストについて、当該代表テキストを含意するテキストの数を集計する(ステップS204)。
Similar to step S104 described above, the
判定部60、及び、監視部70は、全ての監視期間について、ステップS203、S204の処理を繰り返す(ステップS205)。
The
監視部70は、異なる監視期間の間で、各代表テキストを含意するテキストの数を比較する(ステップS206)。
The
監視部70は表示制御部80を介して、各代表テキストを含意するテキストの数の増減傾向(比較結果)を出力する(ステップS207)。ここで、表示制御部80は、比較画面110を生成し、ユーザ等に表示する。
The
次に、本発明の第3の実施の形態の動作の具体例を説明する。 Next, a specific example of the operation of the third embodiment of the present invention will be described.
図19は、本発明の第3の実施の形態における、テキストデータの例を示す図である。ここでは、本発明の第2の実施の形態と同様に、監視対象のテキストが、テレビ製品の「評価」に係るテキストであると仮定する。また、監視部70が、テレビ製品に係るキャンペーンの前の1ヶ月の監視期間(キャンペーン前)とキャンペーンの後の1ヶ月の監視期間(キャンペーン後)との間で、代表テキストを含意するテキストの数を比較すると仮定する。そして、図19のようなテキストデータが、テキスト記憶部20に保存されていると仮定する。また、含意関係抽出対象のテキスト(抽出対象テキスト)は、キャンペーン前とキャンペーン後の両方の監視期間の全テキストであると仮定する。
FIG. 19 is a diagram showing an example of text data in the third embodiment of the present invention. Here, it is assumed that the text to be monitored is the text related to the "evaluation" of the television product, as in the second embodiment of the present invention. In addition, the
図20は、本発明の第3の実施の形態における、含意関係の抽出結果の例を示す図である。 FIG. 20 is a diagram showing an example of the extraction result of the implication relationship in the third embodiment of the present invention.
含意関係抽出部30は、例えば、図19の全テキストから、図20に示すように、含意関係を抽出する。
The implication
図21は、本発明の第3の実施の形態における、代表テキスト情報の例を示す図である。図21の例では、テキストT501「価格が高い」、T601「デザインがよい」、及び、T604「機能性が高い」が、それぞれ、クラスタC1、C2、及び、C3の代表テキストに設定されている。 FIG. 21 is a diagram showing an example of representative text information in the third embodiment of the present invention. In the example of FIG. 21, the texts T501 "high price", T601 "good design", and T604 "high functionality" are set as the representative texts of the clusters C1, C2, and C3, respectively. ..
代表テキスト抽出部40は、図20の含意関係をもとに、図21のような代表テキスト情報を生成する。
The representative
図22は、本発明の第3の実施の形態における、各代表テキストを含意するテキストの数の例である。 FIG. 22 is an example of the number of texts implying each representative text in the third embodiment of the present invention.
例えば、監視部70は、キャンペーン前の監視期間「2015/1」とキャンペーン後の監視期間「2015/2」の各々において、図22のように、各代表テキストT501、T601、T604を含意するテキストの数を集計する。
For example, the
また、監視部70は、監視期間「2015/1」と「2015/2」との間で、各代表テキストT501、T601、T604を含意するテキストの数を比較する。ここで、代表テキストT501を含意するテキストの数は、キャンペーン前の監視期間「2015/1」には100であったが、キャンペーン後の監視期間「2015/2」には0である。したがって、監視部70は、代表テキストT501のクラスタの「削除」を検出する。また、代表テキストT601を含意するテキストの数は、キャンペーン前には0であったが、キャンペーン後には100である。したがって、監視部70は、代表テキストT501のクラスタの「追加」を検出する。さらに、代表テキストT604を含意するテキストの数は、キャンペーン前には50であったが、キャンペーン後には200である。したがって、代表テキストT604を含意するテキストの数の「増加」を検出する。なお、同様に、監視部70は、代表テキストを含意するテキストの数の「減少」を検出してもよい。
In addition, the
図23は、本発明の第3の実施の形態における、比較画面110の例を示す図である。
FIG. 23 is a diagram showing an example of the
図23の例では、比較画面110は、代表テキスト表示領域111、及び、時系列表示領域112を含む。
In the example of FIG. 23, the
代表テキスト表示領域111の「クラスタ」欄には、例えば、各代表テキストが表示される。また、「件数」欄には、例えば、監視期間毎の、各代表テキストを含意するテキストの数が表示される。「比較結果」欄には、各代表テキストを含意するテキストの数の比較結果(クラスタの「削除」や「追加」、テキストの数の「増加」や「減少」)が表示される。
For example, each representative text is displayed in the "cluster" column of the representative
例えば、表示制御部80は、図23のような比較画面110を、ユーザ等に表示する。
For example, the
ユーザ等は、図23の比較画面110を参照し、異なる監視期間の間で追加もしくは削除されたクラスタ、または、発生数が増加もしくは減少した事象を把握できる。ここで、例えば、代表テキストT601「デザインがよい」やT604「機能性が高い」のように、良い評価に係る事象のクラスタの追加や、良い評価に係る事象が増加していた場合、キャンペーンにより、評価が改善されたことがわかる。一方、良い評価に係る事象のクラスタの削除や、良い評価に係る事象が減少していた場合、キャンペーンにより、評価が改悪されたことがわかる。同様に、例えば、代表テキストT501「価格が高い」のように、悪い評価に係る事象のクラスタの削除や、悪い評価に係る事象が減少していた場合も、キャンペーンにより、評価が改善されたことがわかる。また、悪い評価に係る事象のクラスタの追加や、悪い評価に係る事象が増加していた場合も、キャンペーンにより、評価が改悪されたことがわかる。
The user or the like can refer to the
以上により、本発明の第3の実施の形態の動作が完了する。 As described above, the operation of the third embodiment of the present invention is completed.
次に、本発明の第3の実施の形態の効果を説明する。 Next, the effect of the third embodiment of the present invention will be described.
本発明の第3の実施の形態によれば、異なる監視期間の間で、追加もしくは削除されたクラスタ、または、発生数が増加もしくは減少した事象を容易に把握できる。その理由は、監視部70が、異なる監視期間の間での、各代表テキストを含意するテキストの数の増減傾向を出力するためである。
According to the third embodiment of the present invention, it is possible to easily grasp the clusters added or deleted, or the events in which the number of occurrences increased or decreased during different monitoring periods. The reason is that the
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。 Although the present invention has been described above with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made within the scope of the present invention in terms of the structure and details of the present invention.
以下、参考形態の例を付記する。 Hereinafter, an example of the reference form will be added.
(付記1)
テキスト間の含意関係に基づいて、含意関係があるテキストを同じグループに分類することによりクラスタリングされた情報源と、前記情報源に追加されたテキストと同一グループに属するクラスタを特定する特定手段と、前記特定したクラスタに属するテキストの数を計算して、所定のタイミングで提示する提示手段と、を備える、テキスト監視システム。
(Appendix 1)
Sources clustered by classifying texts with implications into the same group based on the implications between texts, and specific means of identifying clusters that belong to the same group as the text added to the source. A text monitoring system comprising a presentation means for calculating the number of texts belonging to the identified cluster and presenting them at a predetermined timing.
本発明は、大量文書データから事象を監視するシステムに適用できる。例えば、本発明は、製品やサービスの改善、マーケティング、営業活動の効率化のために、コールログや顧客の意見等を監視するシステムに適用できる。また、本発明は、製品の不具合や製品に対する評価や要望を監視するシステム、学術文献等の内容を監視するシステムにも適用できる。 The present invention can be applied to a system for monitoring an event from a large amount of document data. For example, the present invention can be applied to a system for monitoring call logs, customer opinions, etc. in order to improve products and services, improve marketing, and improve the efficiency of sales activities. The present invention can also be applied to a system for monitoring product defects, evaluations and requests for products, and a system for monitoring the contents of academic literature and the like.
1 監視システム
2 CPU
3 記憶デバイス
4 通信デバイス
5 入力デバイス
6 出力デバイス
10 テキスト取得部
20 テキスト記憶部
30 含意関係抽出部
40 代表テキスト抽出部
50 代表テキスト記憶部
60 判定部
70 監視部
80 表示制御部
90 通知画面
91 通知領域
92 代表テキスト表示領域
93 時系列表示領域
94 テキスト表示領域
100 通知画面
101 通知領域
102 種別表示領域
103 代表テキスト表示領域
104 時系列表示領域
105 テキスト表示領域
110 比較画面
111 代表テキスト表示領域
112 時系列表示領域
1
3 Storage device 4
Claims (8)
第2のテキストの指定を受け付ける受付手段と、
前記取得した第1のテキストのうち、前記指定を受け付けた第2のテキストを含意する第1のテキストの数が所定の条件を満たすか否かを監視する監視手段と、
前記所定の条件を満たす場合に、前記所定の条件を満たすことが把握可能な画面を表示する表示制御手段と、
を備え、
前記第2のテキストと、前記第2のテキストを含意する前記第1のテキストとの関係は、前記第1のテキストの内容が真であるならば前記第2のテキストの内容が真である、ことを示す
分析支援システム。 Text acquisition means to acquire the first text,
A reception means that accepts the designation of the second text,
A monitoring means for monitoring whether or not the number of the first texts including the second text that has received the designation among the acquired first texts satisfies a predetermined condition, and
A display control means for displaying a screen that can be grasped to satisfy the predetermined condition when the predetermined condition is satisfied
With
The relationship between the second text and the first text implying the second text is that if the content of the first text is true, then the content of the second text is true. An analysis support system that shows that.
請求項1に記載の分析支援システム。 The analysis support system according to claim 1, wherein the monitoring means monitors whether or not the number of first texts including the second text that has received the designation exceeds a threshold value.
請求項1に記載の分析支援システム。 The analysis according to claim 1, wherein the monitoring means monitors whether or not the number of first texts including the second text that has received the designation satisfies a predetermined condition in a plurality of predetermined periods. Support system.
請求項3に記載の分析支援システム。 The monitoring means monitors whether or not the total number of the first texts including the second text belonging to a predetermined type satisfies the predetermined condition in the plurality of predetermined periods. The analysis support system according to claim 3.
請求項3または4に記載の分析支援システム。 The predetermined condition is that the number of the first texts is equal to or more than or equal to a predetermined threshold value, or an increase or decrease in the number of the first texts during different periods among the plurality of periods. The analysis support system according to claim 3 or 4, wherein the amount is equal to or greater than a predetermined threshold value.
請求項1に記載の分析支援システム。 The analysis support system according to claim 1, wherein the monitoring means monitors an increasing / decreasing tendency of the number of the first texts including the second texts that have received the designation.
前記コンピュータに具備された受付手段が、第2のテキストの指定を受け付け、
前記コンピュータに具備された監視手段が、前記取得した第1のテキストのうち、前記指定を受け付けた第2のテキストを含意する第1のテキストの数が所定の条件を満たすか否かを監視し、
前記コンピュータに具備された表示制御手段が、前記所定の条件を満たす場合に、前記所定の条件を満たすことが把握可能な画面を表示する
分析支援方法であって、
前記第2のテキストと、前記第2のテキストを含意する前記第1のテキストとの関係は、前記第1のテキストの内容が真であるならば前記第2のテキストの内容が真である、ことを示す
分析支援方法。 The text acquisition means provided in the computer acquires the first text and
The reception means provided in the computer accepts the designation of the second text,
The monitoring means provided in the computer monitors whether or not the number of the first texts including the second text that has received the designation among the acquired first texts satisfies a predetermined condition. ,
An analysis support method for displaying a screen on which it is possible to grasp that the predetermined condition is satisfied when the display control means provided in the computer satisfies the predetermined condition.
The relationship between the second text and the first text implying the second text is that if the content of the first text is true, then the content of the second text is true. An analysis support method that shows that.
第1のテキストを取得し、
第2のテキストの指定を受け付け、
前記取得した第1のテキストのうち、前記指定を受け付けた第2のテキストを含意する第1のテキストの数が所定の条件を満たすか否かを監視し、
前記所定の条件を満たす場合に、前記所定の条件を満たすことが把握可能な画面を表示する
処理を実行させるプログラムであって、
前記第2のテキストと、前記第2のテキストを含意する前記第1のテキストとの関係は、前記第1のテキストの内容が真であるならば前記第2のテキストの内容が真である、ことを示す
プログラム。 On the computer
Get the first text,
Accepts the specification of the second text,
Among the acquired first texts, it is monitored whether or not the number of the first texts including the second texts that have accepted the designation satisfies a predetermined condition.
A program that executes a process of displaying a screen that can be grasped that the predetermined conditions are satisfied when the predetermined conditions are satisfied.
The relationship between the second text and the first text implying the second text is that if the content of the first text is true, then the content of the second text is true. A program that shows that.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020149529A JP6954426B2 (en) | 2019-05-08 | 2020-09-07 | Text monitoring system, text monitoring method, and program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019088031A JP6763454B2 (en) | 2019-05-08 | 2019-05-08 | Text monitoring system, text monitoring method, and program |
JP2020149529A JP6954426B2 (en) | 2019-05-08 | 2020-09-07 | Text monitoring system, text monitoring method, and program |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019088031A Division JP6763454B2 (en) | 2019-05-08 | 2019-05-08 | Text monitoring system, text monitoring method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021005391A true JP2021005391A (en) | 2021-01-14 |
JP6954426B2 JP6954426B2 (en) | 2021-10-27 |
Family
ID=74097356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020149529A Active JP6954426B2 (en) | 2019-05-08 | 2020-09-07 | Text monitoring system, text monitoring method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6954426B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011075707A (en) * | 2009-09-29 | 2011-04-14 | Nec Corp | Information analysis device and method, and program |
WO2013058118A1 (en) * | 2011-10-20 | 2013-04-25 | 日本電気株式会社 | Text implication assessment device, text implication assessment method, and computer-readable recording medium |
WO2013161850A1 (en) * | 2012-04-26 | 2013-10-31 | 日本電気株式会社 | Text mining system, text mining method, and program |
JP2014170277A (en) * | 2013-03-01 | 2014-09-18 | International Business Maschines Corporation | Information processing device, information processing method and program |
-
2020
- 2020-09-07 JP JP2020149529A patent/JP6954426B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011075707A (en) * | 2009-09-29 | 2011-04-14 | Nec Corp | Information analysis device and method, and program |
WO2013058118A1 (en) * | 2011-10-20 | 2013-04-25 | 日本電気株式会社 | Text implication assessment device, text implication assessment method, and computer-readable recording medium |
WO2013161850A1 (en) * | 2012-04-26 | 2013-10-31 | 日本電気株式会社 | Text mining system, text mining method, and program |
JP2014170277A (en) * | 2013-03-01 | 2014-09-18 | International Business Maschines Corporation | Information processing device, information processing method and program |
Also Published As
Publication number | Publication date |
---|---|
JP6954426B2 (en) | 2021-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10884891B2 (en) | Interactive detection of system anomalies | |
US10496815B1 (en) | System, method, and computer program for classifying monitored assets based on user labels and for detecting potential misuse of monitored assets based on the classifications | |
US9367603B2 (en) | Systems and methods for behavioral segmentation of users in a social data network | |
US11042525B2 (en) | Extracting and labeling custom information from log messages | |
JP2016505975A (en) | Method and apparatus for evaluating demographics of users using social media | |
US20180268052A1 (en) | Analysis of information in a combination of a structured database and an unstructured database | |
CN108629605A (en) | Real-time questionnaire method for pushing based on online customer service | |
US20170132237A1 (en) | Display system, method and computer readable recording media for an issue | |
CN111382182A (en) | Data processing method and device, electronic equipment and storage medium | |
US9792377B2 (en) | Sentiment trent visualization relating to an event occuring in a particular geographic region | |
JP6536671B2 (en) | Text visualization system, text visualization method, and program | |
JP6763454B2 (en) | Text monitoring system, text monitoring method, and program | |
CN108664492B (en) | Method and device for pushing content to user, electronic equipment and storage medium | |
CN111858245A (en) | Abnormal data analysis method and device, electronic equipment and storage medium | |
WO2016147218A1 (en) | Text monitoring system, text monitoring method, and recording medium | |
JP6954426B2 (en) | Text monitoring system, text monitoring method, and program | |
JP2019053763A (en) | Text visualization system, text visualization method and program | |
US10489514B2 (en) | Text visualization system, text visualization method, and recording medium | |
CN104240107A (en) | Community data screening system and method thereof | |
KR101568800B1 (en) | Real-time issue search word sorting method and system | |
JP2005165754A (en) | Text mining analysis apparatus, text mining analysis method, and text mining analysis program | |
CN105979287B (en) | Program keyword extraction and statistics method and device | |
JP2019053764A (en) | Text visualization system, text visualization method and program | |
KR102440037B1 (en) | Integrated customer service method and server performing the same | |
CN114547406A (en) | Data monitoring method, system, storage medium and electronic device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200907 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210831 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210913 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6954426 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |