[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPH0477857A - Improper expression detecting device - Google Patents

Improper expression detecting device

Info

Publication number
JPH0477857A
JPH0477857A JP2186226A JP18622690A JPH0477857A JP H0477857 A JPH0477857 A JP H0477857A JP 2186226 A JP2186226 A JP 2186226A JP 18622690 A JP18622690 A JP 18622690A JP H0477857 A JPH0477857 A JP H0477857A
Authority
JP
Japan
Prior art keywords
inappropriate
message
word
warning
expressions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2186226A
Other languages
Japanese (ja)
Inventor
Masahiro Oku
雅博 奥
Kenji Imamura
賢治 今村
Muneyuki Horii
統之 堀井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2186226A priority Critical patent/JPH0477857A/en
Publication of JPH0477857A publication Critical patent/JPH0477857A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To automatically detect only the improper expressions for each type of written messages by providing a module which applies the warnings for the improper expressions based on the contents of an improper expression dictionary. CONSTITUTION:When a written message and its type are received from a user, the message is analyzed at a morpheme analyzing part 3 and the morpheme information is given to each word. Then an improper expression dictionary 7 is retrieved and an improper expression detecting part 4 detects automatically whether the message includes an improper expression or not in a field to which the message belongs. If so, a warning is produced based on the contents of the dictionary 7 and the message is outputted. Thus only the improper expressions can be surely detected out of the input written messages for each type of these messages.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、通信文に含まれる不適切な表現を、その通信
文の種別から自動的に判断して検出することができる不
適切表現検出装置に関するものである。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention provides an inappropriate expression detection method that can automatically determine and detect inappropriate expressions contained in a communication based on the type of the communication. It is related to the device.

〔従来の技術〕[Conventional technology]

通信文において不適切となる表現は、その通信文が属す
る分野(通信文種別)により異なる。例えば、通信文種
別か「弔(悔やみ)」の場合には、′おめでとう″の表
現は不適切であるが、「慶(祝い)JJの場合には不適
切とはならない。このように、通信文における不適切表
現は通信文種別により異なるため、その検出は自動的に
は行えず、全て人手で検出され、訂正されていた。
The expressions that are inappropriate in a communication differ depending on the field (communication type) to which the communication belongs. For example, the expression ``congratulations'' is inappropriate in the case of a message type of ``condolences,'' but it is not inappropriate in the case of ``congratulations.'' Inappropriate expressions in sentences differ depending on the type of communication, so they cannot be detected automatically and are all detected and corrected manually.

また、新聞に含まれる禁止語を検出する装置においては
、文を単語単位に分割する際に用いる辞書の中に、予め
禁止語を登録しておき、この禁止語を用いて単語分割が
成功したときに、その単語を禁止語としていた。なお、
この禁止語の場合には、分野(通信文種別に対応する)
によらずに−定のものが登録されていた。この種の従来
文献としては、第33回情報処理学会全国大会45−9
゜p、、p、  1.719(1,986)に記載され
ている。
In addition, in a device that detects prohibited words contained in newspapers, prohibited words are registered in advance in the dictionary used when dividing sentences into word units, and words are successfully divided using these prohibited words. At times, the word was considered a forbidden word. In addition,
In the case of this prohibited word, the field (corresponding to the message type)
A fixed number was registered regardless of the condition. Conventional literature of this type includes the 33rd Information Processing Society of Japan National Conference 45-9
It is described in ゜p,, p, 1.719 (1,986).

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

前述のように、従来の装置においては、(イ)ワードプ
ロセッサによる禁則処理の場合、行頭と行末の禁則文字
や記号を自動的に訂正するのみであり、不適切な表現等
は訂正できない。
As described above, in the case of (a) prohibition processing using a word processor, conventional devices only automatically correct prohibited characters and symbols at the beginning and end of a line, and cannot correct inappropriate expressions.

また、(ロ)通信文の不適切表現を人手により検出する
場合、人間が行うため、検出漏れが生じるおそれがあり
、しかも不適切表現の判断基準が人により異なっていた
Furthermore, (b) when manually detecting inappropriate expressions in correspondence, there is a risk that detections may be missed because the detection is done by humans, and the criteria for determining inappropriate expressions differs from person to person.

また、(ハ)新聞に含まれる禁止語を検出する装置の場
合、通信文種別に無関係に禁止語を検出するため、該当
する通信文種別に対して不適切ではない表現までも検出
してしまい、しかも、不適切表現を単語として検出する
ため、不適切な文字を含む表現(例えば、「慶(祝い)
jにおける文字′“死′″)は、全て登録する必要があ
った。
In addition, (c) a device that detects prohibited words contained in newspapers detects prohibited words regardless of the type of correspondence, so it may detect expressions that are not inappropriate for the type of correspondence. , Moreover, in order to detect inappropriate expressions as words, expressions that include inappropriate characters (for example, ``celebration'')
All characters ``death'') in j had to be registered.

本発明の目的は、これら従来の課題を解決し、通信文が
属する通信文種別において不適切である表現のみを自動
的に検出することが可能な不適切表現検出装置を提供す
ることにある。
An object of the present invention is to provide an inappropriate expression detection device that can solve these conventional problems and automatically detect only expressions that are inappropriate in the type of message to which a message belongs.

[課題を解決するための手段〕 上記目的を達成するため、本発明の不適切表現検出装置
は、通信文種別毎に不適切である表現を配列し、不適切
表現毎に該表現の不適切さのレベルを表わす警告レベル
と該警告の内容とを1組として記述した不適切表現辞書
を具備するとともに、例えば、慶、弔、祝い、悔みを含
む通信文種別を入力する手段と、通信文を入力する手段
と、入力された通信文を単語単位に分割して、単語毎に
形態素情報を付与するモジュールと、そのモジュルの実
行により分割された単語毎に、単語の原型情報をキーと
して不適切表現辞書を検索し、単語が入力された上記通
信文種別で不適切な表現であるか否かを判定するモジュ
ールと、そのモジュルの実行により不適切な表現を含む
と判定された単語に、不適切表現辞書の内容に従って不
適切表現の警告レベルと警告内容とを付与するモジュー
ルと、そのモジュールの実行により付与された警告レベ
ルと警告内容とともに、入力された通信文を出力する手
段とを具備することに特徴がある。
[Means for Solving the Problems] In order to achieve the above object, the inappropriate expression detection device of the present invention arranges inappropriate expressions for each type of communication, and identifies inappropriate expressions for each inappropriate expression. It is equipped with an inappropriate expression dictionary in which a warning level representing the level of the person's behavior and the contents of the warning are described as a set, and a means for inputting a message type including, for example, congratulations, condolence, congratulations, and regrets; a module that divides the input correspondence into words and adds morphological information to each word; and a module that divides the input correspondence into words and adds morphological information to each word; A module that searches an appropriate expression dictionary and determines whether a word is an inappropriate expression for the input communication type, and a word that is determined to include an inappropriate expression by executing the module. It is equipped with a module that assigns a warning level and warning content for inappropriate expressions according to the contents of an inappropriate expression dictionary, and a means for outputting the input message along with the warning level and warning content assigned by executing the module. There is a characteristic in doing.

〔作  用〕[For production]

本発明においては、通信文種別毎に不適切となる表現を
集め、不適切表現毎にその表現の不適切さのレベルを表
わす警報レベルとその警告の内容を記述した不適切表現
辞書を作成しておく。そして、利用者から通信文とその
通信文が属する通信文種別を入力として受けると、先ず
その通信文を形態素解析し、各単語に形態素情報を付与
する。
In the present invention, inappropriate expressions are collected for each type of communication, and an inappropriate expression dictionary is created that describes the warning level indicating the level of inappropriateness of each inappropriate expression and the content of the warning. I'll keep it. When the message and the message type to which the message belongs are received from the user as input, the message is first morphologically analyzed and morpheme information is added to each word.

次に、上記不適切表現辞書を検索することにより、その
通信文中にその通信文の属する分野(通信文種別)にお
いて不適切な表現が存在するか否かを自動的に検出する
。その通信文に不適切表現が存在すると判定した場合に
は、不適切表現辞書の内容に従って警告を付与した後、
その通信文を出力する。これにより、その通信の通信文
種別において不適切な表現のみを、入力された通信文中
から確実に検出することができる。
Next, by searching the inappropriate expression dictionary, it is automatically detected whether or not there is an inappropriate expression in the field (communication type) to which the communication belongs in the communication. If it is determined that the message contains inappropriate expressions, a warning is given according to the contents of the inappropriate expression dictionary, and then
Output the message. This makes it possible to reliably detect only expressions that are inappropriate for the message type of the communication from the input message.

〔実施例] 以下、本発明の実施例を、図面により詳細に説明する。〔Example] Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

第1図は、本発明の一実施例を示す不適切表現検出装置
の基本ブロック図である。
FIG. 1 is a basic block diagram of an inappropriate expression detection device showing an embodiment of the present invention.

第1図において、9はCPUやメモリ等から構成される
不適切表現検出装置本体、1は通信文の種別を入力する
通信文種別入力部、2は不適切表現を検出すべき対象と
なる通信文を入力する通信文人力部、3は形態素解析を
行う形態素解析部、4は不適切な表現を検出する不適切
表現検出部、5は不適切表現検出部4で検出された表現
に対して、警告のレベルと警告内容とを付与する警告付
与部、6は通信文と警告レベルと警告内容とを出力する
出力部、7は不適切表現を登録する不適切表現辞書、8
はデイスプレィやプリンタ等の出力装置である。ここで
、不適切表現辞書7は表現を登録するためのメモリ装置
、出力装置8はデイスプレィ、プリンタあるいはディス
ク等のハードウェア装置、通信文種別入力部1はキーボ
ード、テンキー等の入力装置、通信文人力部2はワード
プロセッサ等の文字入力装置、および出力部6はドライ
バ、レジスタ等であって、いずれもハードウェアである
。これに対して、形態素解析部3、不適切表現検出部4
、および警告付与部5は、それぞれの機能をプロセッサ
で実行するためのプログラムモジュールであり、不適切
表現検出装置9内のメモリ内に格納されている。
In FIG. 1, reference numeral 9 denotes the main body of the inappropriate expression detection device consisting of a CPU, memory, etc., 1 denotes a message type input unit for inputting the type of message, and 2 denotes a communication from which inappropriate expressions are to be detected. 3 is a morphological analysis unit that performs morphological analysis; 4 is an inappropriate expression detection unit that detects inappropriate expressions; and 5 is a unit for expressions detected by the inappropriate expression detection unit 4. , a warning adding section that gives a warning level and warning content, 6 an output part that outputs a message, a warning level, and a warning content, 7 an inappropriate expression dictionary that registers inappropriate expressions, 8
is an output device such as a display or printer. Here, the inappropriate expression dictionary 7 is a memory device for registering expressions, the output device 8 is a hardware device such as a display, printer, or disk, and the message type input section 1 is an input device such as a keyboard, numeric keypad, etc. The human power section 2 is a character input device such as a word processor, and the output section 6 is a driver, register, etc., both of which are hardware. On the other hand, the morphological analysis unit 3, inappropriate expression detection unit 4
, and the warning adding unit 5 are program modules for executing their respective functions with a processor, and are stored in the memory of the inappropriate expression detection device 9.

通信文種別入力部1が利用者から通信文の種別(慶、弔
、祝い、悔み等)の入力を受は取るとともに、通信文人
力部2が利用者から通信文自体の入力を受は取る。これ
により形態素解析部3は、通信文人力部2で受は取った
通信文を単語単位に分割し、各単語に原型情報、品詞や
活用形等の形態素情報を付与する。次に、不適切表現検
出部4は、不適切表現辞書7を検索して、受は取った通
信文種別において不適切となる表現が、入力された通信
文中に含まれる場合には、この表現を検出する。
The message type input unit 1 receives input from the user about the type of message (congratulations, condolence, congratulations, regrets, etc.), and the communication human resources unit 2 receives input from the user about the message itself. . Thereby, the morphological analysis section 3 divides the correspondence received by the correspondence human resources section 2 into word units, and gives each word morphological information such as prototype information, part of speech, and conjugated form. Next, the inappropriate expression detection unit 4 searches the inappropriate expression dictionary 7, and if the input message contains an expression that is inappropriate in the received message type, this expression Detect.

次に、警告付与部5は、不適切表現検出部4で検出され
た不適切表現に対して、警告のレベル(致命的、注意等
)と警告内容(禁句、忌み語、または注意語等)を付与
する。次に、出力部6は、入力された通信文を、その通
信文種別とその通信文に含まれる不適切表現の警告レベ
ルおよび警告内容とともに、出力装置8に出力する。
Next, the warning giving unit 5 determines the level of the warning (fatal, caution, etc.) and the content of the warning (forbidden phrase, hateful word, cautionary word, etc.) for the inappropriate expression detected by the inappropriate expression detecting unit 4. Grant. Next, the output unit 6 outputs the input message to the output device 8 along with the type of the message, the warning level of inappropriate expressions included in the message, and the content of the warning.

第2図は、第1図における不適切表現辞書のレコード・
フォーマット図である。
Figure 2 shows the records of the inappropriate expression dictionary in Figure 1.
It is a format diagram.

第2図に示すように、不適切表現辞書7は、不適切表現
となり得る単語の原型情報10、あるいは不適切表現と
なり得る文字をキーとして持ち、原型情報10毎にこれ
が不適切となる通信文の種別11と、その警告のレベル
(致命的なレベルが、あるいは注意的なレベルか等)1
2、および警告の内容13とを記述したレコード14か
らなる辞書である。すなわち、不適切表現辞書7は、1
0〜13のフィールドからなるレコード14を複数レコ
ード分登録したものである。
As shown in FIG. 2, the inappropriate expression dictionary 7 has prototype information 10 of words that can be inappropriate expressions or characters that can be inappropriate expressions as keys, and for each prototype information 10, this is a message that is inappropriate. Type 11 and its warning level (fatal level or cautionary level, etc.)1
This dictionary is made up of records 14 that describe warning information 2 and warning content 13. In other words, the inappropriate expression dictionary 7 is 1
A plurality of records 14 consisting of fields 0 to 13 are registered.

原型情報フィールド10は、不適切表現辞書7を検索す
るときのキーとなる部分であり、通信文種別フィールド
11は、このレコードの原型情報が不適切となる通信文
の種別を記述した部分である。警告レベルフィールド1
2は、このレコードの原型情報を持つ単語が致命的に不
適切なのか、あるいは注意して用いるべきものなのか等
の警告のレベルを記述する部分であり、警告内容フィー
ルド13は、このレコードの原型情報を持つ単語が、忌
み文字であるか、差別語であるか、注意語であるか等の
警告内容を記述する部分である。
The prototype information field 10 is a key part when searching the inappropriate expression dictionary 7, and the message type field 11 is a part that describes the type of communication for which the prototype information of this record is inappropriate. . Warning level field 1
2 is a part that describes the warning level, such as whether the word with the prototype information of this record is fatally inappropriate or should be used with caution. This is a part that describes warning contents such as whether a word with prototype information is a disliked character, a discriminatory word, a cautionary word, etc.

第3図は、本発明の不適切表現検出装置の処理フローチ
ャートである。
FIG. 3 is a processing flowchart of the inappropriate expression detection device of the present invention.

先ず、通信文種別入力部1では、利用者からの通信文種
別(慶、弔、祝い、悔やみ等)の入力を受ける(ステッ
プSl)。入力された通信文種別は、不適切表現検出部
4に転送される。
First, the message type input unit 1 receives an input of the type of message (congratulations, condolence, congratulations, condolences, etc.) from the user (step Sl). The input message type is transferred to the inappropriate expression detection section 4.

次に、通信文人力部2では、利用者からの通信文の入力
を受ける(ステップS2)。入力された通信文は、形態
素解析部3に転送される。
Next, the correspondence human resources department 2 receives input of a correspondence from the user (step S2). The input message is transferred to the morphological analysis section 3.

形態素解析部3では、入力された通信文を単語分割し、
さらに各単語に原型情報や品詞等の付与を行い、その結
果を不適切表現検出部4に転送する。ここでは、通信文
の単語数をnとし、第1番目の単語を処理するために、
i=1と置く(ステップS3)。
The morphological analysis unit 3 divides the input correspondence into words,
Further, prototype information, parts of speech, etc. are added to each word, and the results are transferred to the inappropriate expression detection section 4. Here, the number of words in the message is n, and in order to process the first word,
Set i=1 (step S3).

不適切表現検出部4では、第1番目の単語の持つ原型情
報をキーとして、不適切表現辞書7を検索する(ステッ
プS4)。
The inappropriate expression detection unit 4 searches the inappropriate expression dictionary 7 using the prototype information of the first word as a key (step S4).

検索が成功した場合には(ステップS5のYES)、キ
ーである原型情報に対する不適切表現辞書7の中の情報
を取得した後、ステップS6に移る。また、検索が失敗
した場合には(ステップS5のNo)、ステップS8に
移る。
If the search is successful (YES in step S5), the information in the inappropriate expression dictionary 7 corresponding to the key prototype information is acquired, and then the process moves to step S6. If the search fails (No in step S5), the process moves to step S8.

検索が成功した場合には、原型情報に対するレコード中
の通信文種別を検出し、通信文種別が利用者が入力した
通信文種別(ステップS1で入力)と一致するか否かを
判定する(ステップS6)。
If the search is successful, the message type in the record for the prototype information is detected, and it is determined whether the message type matches the message type input by the user (input in step S1) (step S6).

致する場合には、ステップS7に移り、不一致の場合に
は、ステップS8に移る。
If they match, the process moves to step S7, and if they do not match, the process moves to step S8.

警告付与部6では、第j番目の単語、つまり不適切表現
として検出され、通信文種別が一致した単語に対して、
警告の内容を警告のレベルとともにその単語に付与する
(ステップS7)。
The warning adding unit 6 issues a message to the jth word, that is, a word detected as an inappropriate expression and whose message type matches.
The content of the warning is given to the word along with the warning level (step S7).

その単語に対する処理は終了したので、次の単語に移る
ため、単語番号1を+1し、j=i+1とする(ステッ
プ38)。
Since the processing for that word has been completed, in order to move on to the next word, word number 1 is incremented by 1, so that j=i+1 (step 38).

全単語の処理が終了しているか否かを判定しくi>n?
)(ステップS9)、終了している場合には、ステップ
S10に移り、まだ未処理の単語が存在する場合には、
ステップS4に戻る。
To determine whether all words have been processed, i>n?
) (step S9), if it has been completed, the process moves to step S10, and if there are still unprocessed words,
Return to step S4.

出力部6では、入力された通信文を、その通信文種別と
、そのレコードに含まれる不適切表現の警告レベルと警
告内容とともに出力装置8に出力する(ステップ510
)。
The output unit 6 outputs the input message to the output device 8 together with the message type, the warning level and warning content of inappropriate expressions included in the record (step 510
).

第4図は、第1図における形態素解析部で用いられる辞
書の内容例を示す図である。
FIG. 4 is a diagram showing an example of the contents of a dictionary used in the morphological analysis section in FIG. 1.

形態素解析部3では、入力された通信文を単語に分割し
、各単語に原型情報や品詞、活用形等を付与する。その
場合、通常の単語辞書を参照しながら上記処理を行う。
The morphological analysis unit 3 divides the input communication into words, and assigns prototype information, part of speech, conjugation, etc. to each word. In that case, the above process is performed while referring to a normal word dictionary.

通常の単語辞書には、例えば、第4図に示すように、文
章を区切った状態である「単語表記Jと、それに対応す
る「原型情報」と、その原型情報の「品詞用と、単語表
記の「活用形」が記述されている。なお、この第4図の
辞書内容は、後述する具体例で利用される。
For example, as shown in Figure 4, a normal word dictionary contains ``word notation J'' and its corresponding ``prototype information,'' which are divided sentences, and ``part of speech'' and word notation for the prototype information. The ``conjugated form'' of is described. Note that the contents of the dictionary shown in FIG. 4 will be used in a specific example described later.

第5図は、第1図における不適切表現辞書の内容例を示
す図である。
FIG. 5 is a diagram showing an example of the contents of the inappropriate expression dictionary in FIG. 1.

第5図に示すように、不適切表現辞書7には、「原型情
報Jと、その原型情報に属する「通信文種別Jと、不適
切である場合の「警告レベルよと、その「警告内容」と
がルーコードとして記述されている。第5図中、原型情
報のF*死*Jは、文字「死」を含む原型情報を持つ単
語が全て不適切表現となり得ることを表わしている。こ
の第5図の不適切表現辞書7の内容は、後述する具体例
で利用される。
As shown in FIG. 5, the inappropriate expression dictionary 7 includes "prototype information J, the message type J belonging to the prototype information, the warning level if it is inappropriate, and the warning content". ” is written as a roux code. In FIG. 5, the prototype information F*death*J indicates that all words with prototype information including the character "death" can be inappropriate expressions. The contents of the inappropriate expression dictionary 7 shown in FIG. 5 will be used in specific examples described later.

第6図は、本発明の具体例1の処理過程を説明する図で
ある。
FIG. 6 is a diagram illustrating the processing process of specific example 1 of the present invention.

通信文種別入力部1と通信文人力部2において、(通信
文種別) 慶 〈通 信 文〉 結婚、おめでとう 上記の通信文種別と通信文を受けたと仮定する(第3図
のステップSt、S2)。
In the message type input section 1 and the message human power section 2, it is assumed that (message type) ``Congratulations on your marriage'' and the above message type have been received (steps St and S2 in Fig. 3). ).

形態素解析部3では、通信文を単語単位に分割し、各単
語に形態素情報を付与するが、形態素解析部3で用いる
辞書が第4図の内容であるとすると、形態素解析の結果
は、第11 (1)に示すようになる。すなわち、単語
は「結婚」、「、」、「おめでとう」、「。」の4個で
あるため、n4.1=1とする(第3図のステップS3
)。
The morphological analysis unit 3 divides the correspondence into word units and assigns morphological information to each word.If the dictionary used by the morphological analysis unit 3 has the contents shown in Figure 4, the results of the morphological analysis are as follows: 11 (1). That is, since there are four words: "marriage", ",", "congratulations", and ".", n4.1 is set to 1 (step S3 in Figure 3).
).

不適切表現検出部4では、先ず第1番目の単語の原型情
報「結婚Jをキーとして不適切表現辞書7を検索するが
、不適切表現辞書7が第5図に示す内容であるとすると
、検索に失敗する。第2番目の単語の原型情報In、 
JJと第4番目の単語の原型情報「。」についても、同
じように失敗する(第3図のステップ4〜8)。第3番
目の単語「おめでとう」では、第3番目の単語の原型情
報「おめでとう」をキーとして不適切表現辞書7を検索
すると、不適切表現辞書7が第5図に示す内容であるた
め、検索に成功する(第3図のステップS4、S5)。
The inappropriate expression detection unit 4 first searches the inappropriate expression dictionary 7 using the prototype information of the first word "marriage J" as a key. Assuming that the inappropriate expression dictionary 7 has the contents shown in FIG. Search fails. Second word prototype information In,
The same failure occurs for the prototype information "." of JJ and the fourth word (steps 4 to 8 in FIG. 3). For the third word "Congratulations", when the inappropriate expression dictionary 7 is searched using the prototype information of the third word "Congratulations" as a key, the inappropriate expression dictionary 7 has the content shown in FIG. (Steps S4 and S5 in FIG. 3).

しかし、通信文種別人ツノ部1で入力された通信文種別
が「慶」であるのに対して、不適切表現辞書7中に記述
されている「おめでとう」のレコードでは、通信文種別
が「弔jである。従って、入力された通信文の通信文種
別と不適切表現辞書7中の通信文種別とは不一致であり
、rおめでとうJは通信文種別のr慶Jにおいては不適
切ではないと判定される(第3図のステップS6)。
However, while the message type input in the message type human horn section 1 is "Kei", in the record of "Congratulations" written in the inappropriate expression dictionary 7, the message type is "Kei". Condolences J. Therefore, the message type of the input message and the message type in the inappropriate expression dictionary 7 do not match, and r Congratulations J is not inappropriate in the message type r Kei J. (Step S6 in FIG. 3).

これで、不適切表現検出部4の処理は終了する(第3図
のステップS9)。
This completes the process of the inappropriate expression detection unit 4 (step S9 in FIG. 3).

第6図(2)に示すように、不適切表現なしという警告
付与が警告付与部5から出力される。出力部6では、入
力された通信文には不適切表現が含まれていないため、
第6図(3)に示すように、出ノJ装置8に対して通信
文と通信文種別のみを出力する。
As shown in FIG. 6(2), the warning adding section 5 outputs a warning that there is no inappropriate expression. In the output unit 6, since the input message does not contain inappropriate expressions,
As shown in FIG. 6(3), only the message and the type of message are output to the output device 8.

こめように、不適切表現辞書7に同一通信文が含まれて
いる場合でも、通信文種別が異なるときには、不適切と
は判定しない。
In other words, even if the same message is included in the inappropriate expression dictionary 7, if the types of the messages are different, the messages will not be determined to be inappropriate.

第7図は、本発明の具体例2の処理過程を示す説明図で
ある。
FIG. 7 is an explanatory diagram showing the processing process of the second specific example of the present invention.

入力部1および2に対して、次のような通信文と通信文
種別か入力される。
The following messages and types of messages are input to input units 1 and 2.

く通信文種別〉 弔 〈通 信 文〉 結婚、おめでとう。Message type: Condolences <Message> Congratulations on your marriage.

すなわち、具体例2では、具体例1と同じ通信文である
が、通信文種別が異なっている。換言すれば、具体例2
は、通信文種別を誤って入力した場合に相当する。
That is, in specific example 2, the message is the same as in specific example 1, but the message type is different. In other words, specific example 2
This corresponds to a case where the message type is input incorrectly.

この場合にも、具体例】と同じように処理されるが、具
体例1とは異なり、丁おめでとう」が不適切表現として
検出される(第7図(2)参照)。これは、不適切表現
辞書7の内容の「おめでとう」が通信文種別T弔」にお
いて不適切であることを示しているからである。この場
合、警告付与部5では、致命的、禁句であることを付与
して、出力部6に転送する。出力結果は、第7図(3)
に示すようになる。この結果を得た利用者は、通信文と
通信文種別が一致していないことを知る。具体例2では
、利用者は通信文種別の入力の誤りに気がつくことにな
る。
In this case as well, processing is performed in the same manner as in Example 1, but unlike Example 1, ``Congratulations!'' is detected as an inappropriate expression (see FIG. 7 (2)). This is because the content of the inappropriate expression dictionary 7 indicates that "congratulations" is inappropriate in the message type T condolence. In this case, the warning adding section 5 adds a message indicating that it is a fatal or taboo phrase, and transfers it to the output section 6. The output result is shown in Figure 7 (3)
It becomes as shown in . The user who obtains this result knows that the message and the message type do not match. In Example 2, the user notices an error in inputting the message type.

このように、通信文種別が通信文の内容に合致していな
い場合、通信文に含まれる不適切表現を検出することに
より、通信文種別の誤りを検出することが可能である。
In this way, when the message type does not match the content of the message, it is possible to detect an error in the message type by detecting inappropriate expressions included in the message.

第8図は1.本発明の具体例3の処理過程を示す説明図
である。
Figure 8 shows 1. FIG. 7 is an explanatory diagram showing a processing process in Example 3 of the present invention.

通信文種別入力部1と通信文人力部2において、次のよ
うな通信文種別と通信文を受は取る(第3図のステップ
SL、2)。
The message type input section 1 and the message human resource section 2 receive the following message types and messages (step SL, 2 in FIG. 3).

(通信文種別〉 慶 (通 信 文〉 風が吹けば共にさえぎり、死ぬときも
二外−緒、そんな二人で いてください。
(Message type) Kei (Correspondence) When the wind blows, we will block it together, and even when we die, we will be together, so please be the two of us.

具体例3では、具体例1,2と異なる通信文が入力され
る。具体例1と同じように、形態素解析部3で解析した
結果、第8図(1)に示すような原型情報と品詞と活用
形が得られる。この場合には、単語が19個であるため
、n−19となる(第3図のステップ33)。不適切表
現辞書7の内容は第5図に示すような内容であるため、
「さえぎるJと「死ぬ」の2個以外の17個については
、不適切表現辞書7の検索に失敗する。これらの失敗の
処理については、具体例1の「結婚」等と同じ処理にな
る。ここでは、不適切表現辞書7に記述された「さえぎ
るjと「死ぬ」の処理について、説明する。
In the third specific example, a message different from those in the first and second specific examples is input. As in Example 1, as a result of analysis by the morphological analysis unit 3, prototype information, parts of speech, and conjugations as shown in FIG. 8(1) are obtained. In this case, since there are 19 words, the number is n-19 (step 33 in FIG. 3). Since the contents of the inappropriate expression dictionary 7 are as shown in Fig. 5,
The search in the inappropriate expression dictionary 7 fails for 17 words other than the two words ``obstruct J'' and ``die''. The processing for these failures is the same as for "marriage" in the first specific example. Here, the processing of ``object j'' and ``death'' described in the inappropriate expression dictionary 7 will be explained.

「さえぎる」は第6番目の単語であって、不適切表現辞
書7中に記述されている。通信文種別入力部1で入力さ
れた通信文種別は「慶Jであり、不適切表現辞書7中の
「さえぎるjが不適切となる通信文種別も「慶Jである
。従って、両者は一致するので、「さえぎるJは不適切
表現として検出され、処理は警告付与部5の処理に移る
“Saeguru” is the sixth word and is written in the inappropriate expression dictionary 7. The message type input in the message type input section 1 is ``Keio J,'' and the message type in which ``object j'' is inappropriate in the inappropriate expression dictionary 7 is also ``Keio J.'' Therefore, the two match. Therefore, "Interrupting J" is detected as an inappropriate expression, and the processing moves to the processing of the warning adding unit 5.

警告付与部5では、「さえぎる」に対する不適切表現辞
書7の内容(警告レベル−注意、警告内容−注意語)を
「さえぎる」に付与する(第3図のステップ87)。
The warning assigning unit 5 assigns the contents of the inappropriate expression dictionary 7 (warning level - caution, warning content - caution word) for "object" to "object" (step 87 in FIG. 3).

次に、第8番目の単語「死ぬ」に関しては、不適切表現
辞書7の中に原型情報としては存在しないが、「*死*
J、つまり、文字「死Jを含む全ての文が不適切表現と
なり得ることを表わしているため、この場合にも不適切
表現として検出される。警告付与部5では、不適切表現
辞書7の内容(警告レベル一致命的、警告内容=忌み文
字)を「死ぬ町に付与する(第3図のステップS7)。
Next, regarding the eighth word "death", it does not exist as prototype information in the inappropriate expression dictionary 7, but "*death*
J, that is, all sentences containing the character "death J" indicate that they can be inappropriate expressions, so they are detected as inappropriate expressions in this case as well. Add the content (warning level matching fatal, warning content = abominable characters) to the town that will die (step S7 in Figure 3).

この状態を、第8図(2)に示している。This state is shown in FIG. 8(2).

最後の出力部6では、不適切表現として検出された「さ
えぎる」と「死ぬ町の2つに関する情報が、通信文と通
信文種別とともに出力装置8に出力される(第3図のス
テップ510)。その出力の状態は、第8図(3)に示
す通りである。
The last output unit 6 outputs information regarding the two words "Saeguru" and "Death Town" that were detected as inappropriate expressions to the output device 8 along with the message and the type of message (Step 510 in FIG. 3). The state of the output is as shown in FIG. 8(3).

このようにして、不適切表現辞書7に含まれ、かつ通信
文種別が入力されたものと一致する場合には、不適切表
現を検出して、これに対応する警告を出力する。さらに
、不適切さの程度に応じて、致命的であるか、注意のレ
ベルであるかについても出力する。また、不適切表現辞
書7の内容が「水死水Jのような文字であれば、この文
字を含む全ての表現を不適切であるどして検出する。
In this way, if the inappropriate expression is included in the inappropriate expression dictionary 7 and the message type matches the input one, the inappropriate expression is detected and a corresponding warning is output. Furthermore, depending on the degree of inappropriateness, it is also output whether the level is fatal or cautionary. Further, if the content of the inappropriate expression dictionary 7 is a character such as ``Water death water J'', all expressions containing this character are detected as inappropriate.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明によれば、入力された通信
文種別に応じて、不適切であるが否かを判定するので、
該当する通信文種別において不適切である表現のみを検
出することができる。その場合に、不適切表現辞書を用
いるので、そこに記述されている限り、不適切表現の検
出漏れは生じない。また、機械的に不適切表現を検出す
るので、利用者によるばらつきはない。さらに、不適切
表現検出の際に、文字単位の検出が可能であるため、そ
の文字を含む全ての単語を不適切表現辞書に記述する必
要がなくなる。
As explained above, according to the present invention, it is determined whether or not the inputted message is inappropriate depending on the type of message.
Only expressions that are inappropriate in the corresponding message type can be detected. In this case, since an inappropriate expression dictionary is used, no inappropriate expressions will be missed as long as they are written there. Additionally, since inappropriate expressions are detected mechanically, there is no variation among users. Furthermore, when detecting inappropriate expressions, character-by-character detection is possible, so there is no need to write all words containing that character in the inappropriate expression dictionary.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示す不適切表現検出装置の
全体構成図、第2図は第1図における不適切表現辞書の
内容説明図、第3図は本発明の不適切表現検出装置の処
理フローチャート、第4図は第1図の形態素解析部で利
用される辞書(単語辞書)の内容を示す図、第5図は本
発明の不適切表現辞書の内容例を示す図、第6図は本発
明の具体例1の処理過程を示す説明図、第7図は本発明
の具体例2の処理過程を示す説明図、第8図は本発明の
具体例3の処理過程を示す説明図である。 1:通信文種別入力部、2:通信文人ノコ部、3形態素
解析部、4:不適切表現検出部、5:警告付与部、6:
出力部、7:不適切表現辞書、8:出力装置、14:不
適切表現辞書のルコード。
Fig. 1 is an overall configuration diagram of an inappropriate expression detection device showing an embodiment of the present invention, Fig. 2 is an explanatory diagram of the contents of the inappropriate expression dictionary in Fig. 1, and Fig. 3 is an inappropriate expression detection according to the present invention. 4 is a diagram showing the contents of the dictionary (word dictionary) used in the morphological analysis section of FIG. 1; FIG. 5 is a diagram showing an example of the contents of the inappropriate expression dictionary of the present invention; FIG. 6 is an explanatory diagram showing the processing process of specific example 1 of the present invention, FIG. 7 is an explanatory diagram showing the processing process of specific example 2 of the present invention, and FIG. 8 is an explanatory diagram showing the processing process of specific example 3 of the present invention. It is an explanatory diagram. 1: Correspondence type input section, 2: Correspondence writer section, 3 Morphological analysis section, 4: Inappropriate expression detection section, 5: Warning section, 6:
Output unit, 7: Inappropriate expression dictionary, 8: Output device, 14: Code of inappropriate expression dictionary.

Claims (1)

【特許請求の範囲】[Claims] (1)通信文種別毎に不適切である表現を配列し、不適
切表現毎に該表現の不適切さのレベルを表わす警告レベ
ルと該警告の内容とを1組として記述した不適切表現辞
書を具備するとともに、例えば、慶、弔、祝い、悔みを
含む通信文種別を入力する手段と、通信文を入力する手
段と、入力された該通信文を単語単位に分割して、単語
毎に形態素情報を付与するモジュールと、該モジュール
の実行により分割された単語毎に、該単語の原型情報を
キーとして上記不適切表現辞書を検索し、該単語が入力
された上記通信文種別で不適切な表現であるか否かを判
定するモジュールと、該モジュールの実行により不適切
な表現を含むと判定された単語に、上記不適切表現辞書
の内容に従って不適切表現の警告レベルと警告内容とを
付与するモジュールと、該モジュールの実行により付与
された警告レベルと警告内容とともに、入力された通信
文を出力する手段とを具備することを特徴とする不適切
表現検出装置。
(1) An inappropriate expression dictionary in which inappropriate expressions are arranged for each type of message, and for each inappropriate expression, a warning level indicating the level of inappropriateness of the expression and the content of the warning are described as a set. For example, a means for inputting the type of message including congratulations, condolence, congratulations, and regrets, a means for inputting the message, and a means for dividing the inputted message into word units and dividing the input message into words. A module that adds morphological information, and for each word divided by the execution of this module, searches the above-mentioned inappropriate expression dictionary using the prototype information of the word as a key, and searches the above-mentioned inappropriate expression dictionary to find out whether the word is inappropriate in the above-mentioned communication type into which the word is input. A module that determines whether an expression is inappropriate or not, and a warning level and warning content for inappropriate expressions are assigned to words that are determined to include inappropriate expressions by execution of the module, according to the contents of the inappropriate expression dictionary. What is claimed is: 1. An inappropriate expression detection device comprising: a module for assigning warnings; and means for outputting an input message along with a warning level and content of the warning assigned by executing the module.
JP2186226A 1990-07-13 1990-07-13 Improper expression detecting device Pending JPH0477857A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2186226A JPH0477857A (en) 1990-07-13 1990-07-13 Improper expression detecting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2186226A JPH0477857A (en) 1990-07-13 1990-07-13 Improper expression detecting device

Publications (1)

Publication Number Publication Date
JPH0477857A true JPH0477857A (en) 1992-03-11

Family

ID=16184569

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2186226A Pending JPH0477857A (en) 1990-07-13 1990-07-13 Improper expression detecting device

Country Status (1)

Country Link
JP (1) JPH0477857A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015072614A (en) * 2013-10-03 2015-04-16 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Method for detecting expression capable of becoming dangerous expression by relying on specific theme and electronic device and program for electronic device for detecting the same expression
JP2016194864A (en) * 2015-04-01 2016-11-17 株式会社イージェーワークス Input support apparatus, input support method, and program
JP2018160159A (en) * 2017-03-23 2018-10-11 日本電信電話株式会社 Uttered sentence determining device, method, and program
CN109739733A (en) * 2018-12-27 2019-05-10 深圳市计通智能技术有限公司 A kind of the Multifactor Combination analysis alarm method and system of data monitoring

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015072614A (en) * 2013-10-03 2015-04-16 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Method for detecting expression capable of becoming dangerous expression by relying on specific theme and electronic device and program for electronic device for detecting the same expression
US9575959B2 (en) 2013-10-03 2017-02-21 International Business Machines Corporation Detecting dangerous expressions based on a theme
US10275447B2 (en) 2013-10-03 2019-04-30 International Business Machines Corporation Detecting dangerous expressions based on a theme
US11010552B2 (en) 2013-10-03 2021-05-18 International Business Machines Corporation Detecting expressions learned based on a theme and on word correlation and co-occurence
JP2016194864A (en) * 2015-04-01 2016-11-17 株式会社イージェーワークス Input support apparatus, input support method, and program
JP2018160159A (en) * 2017-03-23 2018-10-11 日本電信電話株式会社 Uttered sentence determining device, method, and program
CN109739733A (en) * 2018-12-27 2019-05-10 深圳市计通智能技术有限公司 A kind of the Multifactor Combination analysis alarm method and system of data monitoring

Similar Documents

Publication Publication Date Title
US11386269B2 (en) Fault-tolerant information extraction
JP2002117027A (en) Feeling information extracting method and recording medium for feeling information extracting program
US20080040352A1 (en) Method for creating a disambiguation database
JPH0477857A (en) Improper expression detecting device
KR20020059555A (en) Searching engine and searching method
JPH08115330A (en) Method for retrieving similar document and device therefor
JP4047894B2 (en) Document proofing apparatus and program storage medium
JPH0785040A (en) Inscription nonuniformity detecting method and kana/ kanji converting method
JP3187671B2 (en) Electronic dictionary display
JP2776069B2 (en) Document inspection device
JP2004280323A (en) Question document summarization device, question response search device, and question document summarization program
JP2006294069A (en) Document corrector and program storage medium
JP3045886B2 (en) Character processing device with handwriting input function
JP3118880B2 (en) Japanese sentence processor
Hema et al. Malayalam spell checker using n-gram method
JPH087046A (en) Document recognition device
JP2009009583A (en) Method for segmenting non-segmented text using syntactic parse
CN114970493A (en) Method and device for generating markup corpus, terminal equipment and storage medium
JPS63234348A (en) Back-up system for correction of sentence
JPH0778137A (en) Method for appending comment and document processor
JPH0468466A (en) Kana / kanji converting device
JPH01128157A (en) Japanese word document producer
JPH08335250A (en) Misused character correcting device
JP2002183129A (en) Word registering method
JPH07110816A (en) Device for registering translation dictionary