JPH0248938B2 - - Google Patents
Info
- Publication number
- JPH0248938B2 JPH0248938B2 JP56198941A JP19894181A JPH0248938B2 JP H0248938 B2 JPH0248938 B2 JP H0248938B2 JP 56198941 A JP56198941 A JP 56198941A JP 19894181 A JP19894181 A JP 19894181A JP H0248938 B2 JPH0248938 B2 JP H0248938B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- characters
- dictionary
- data
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000001514 detection method Methods 0.000 claims description 6
- 235000016496 Panda oleosa Nutrition 0.000 description 4
- 240000000220 Panda oleosa Species 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000000034 method Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Processing Or Creating Images (AREA)
- Machine Translation (AREA)
Description
【発明の詳細な説明】
本発明は、日本語情報処理システムにおいて文
字例データに含まれる誤り文字の検出・修正を支
援する装置に関するものである。
字例データに含まれる誤り文字の検出・修正を支
援する装置に関するものである。
従来、例えばワードプロセツサとして商品化さ
れている言語処理システムにおいては、単語を綴
りの文字列として収容した辞書を用い、入力され
るデータ(文章、単語など)の文字列を該辞書に
収容されている単語の文字列と比較・照合するこ
とにより入力文字列の誤りを検出し、該入力文字
列に誤りが含まれている場合には辞書に収容され
ている単語の文字(列)に置き換えることによ
り、誤りを訂正するように構成されていた。例え
ば、英語のワードプロセツサの場合には単語毎に
区切られて入力される文字列を、一文字ずつ辞書
中の単語と照合し、文字の順序も含めて一致する
文字の数が最大の単語を入力された単語と見なし
て、一致しない文字を誤りとして辞書中の対応す
る単語の文字で置き換えることにより、誤り文字
の訂正を行つている。しかしながら日本語文章を
対象にした場合には漢字の字種が多いこと、ま
た、2字の漢字で構成される単語が多いため誤り
文字の判定が困難なこと(2字の単語の場合はど
ちらが誤りかが判らない)、さらに文章が分かち
書きされないため単語の切出しが難しいこと、な
どの日本語自体が有する種々の(計算機処理上
の)問題点のためにデータ中に含まれる誤りを自
動的に検出し、修正することは難しく、入手によ
るチエツクによらざるを得なかつた。
れている言語処理システムにおいては、単語を綴
りの文字列として収容した辞書を用い、入力され
るデータ(文章、単語など)の文字列を該辞書に
収容されている単語の文字列と比較・照合するこ
とにより入力文字列の誤りを検出し、該入力文字
列に誤りが含まれている場合には辞書に収容され
ている単語の文字(列)に置き換えることによ
り、誤りを訂正するように構成されていた。例え
ば、英語のワードプロセツサの場合には単語毎に
区切られて入力される文字列を、一文字ずつ辞書
中の単語と照合し、文字の順序も含めて一致する
文字の数が最大の単語を入力された単語と見なし
て、一致しない文字を誤りとして辞書中の対応す
る単語の文字で置き換えることにより、誤り文字
の訂正を行つている。しかしながら日本語文章を
対象にした場合には漢字の字種が多いこと、ま
た、2字の漢字で構成される単語が多いため誤り
文字の判定が困難なこと(2字の単語の場合はど
ちらが誤りかが判らない)、さらに文章が分かち
書きされないため単語の切出しが難しいこと、な
どの日本語自体が有する種々の(計算機処理上
の)問題点のためにデータ中に含まれる誤りを自
動的に検出し、修正することは難しく、入手によ
るチエツクによらざるを得なかつた。
本発明は上記従来の欠点を除去するため、日本
語文の文字列の文字間の接続可否から誤り文字の
候補を検出し、誤り文字の候補に類似した文字の
うちその前及び又は後の文字と接続可能な文字を
修正文字の候補として出力するようにしたもの
で、その目的とするところは日本語文の誤り文字
の検出・修正作業の効率を上げることにある。以
下、図面について詳細に説明する。
語文の文字列の文字間の接続可否から誤り文字の
候補を検出し、誤り文字の候補に類似した文字の
うちその前及び又は後の文字と接続可能な文字を
修正文字の候補として出力するようにしたもの
で、その目的とするところは日本語文の誤り文字
の検出・修正作業の効率を上げることにある。以
下、図面について詳細に説明する。
第1図は本発明の一実施例を示すもので、図中
1は入力部、2は2文字分の日本語のデータを一
時記憶するレジスタ、3は2文字分のデータを一
時記憶するバツフア3aを有する制御部、4は照
合回路、5は日本語文の相連なる2文字の接続可
否を内容とした文字連接辞書を記憶する記憶部
(以下、説明の簡略のため単に文字連接辞書と称
す。)、6は出力部、7は誤り符号発生回路7−
1、候補開始符号発生回路7−2,候補終了符号
発生回路7−3よりなる符号発生回路、8は検索
回路、9は個々の文字に対してその特徴によつて
類似する文字を分類した文字分類辞書を記憶した
記憶部(以下、説明の簡略のため単に文字分類辞
書と称す。)である。レジスタ2は2文字分のデ
ータ格納領域を有するシフトレジスタで構成さ
れ、制御部3の制御の下に入力部1より入力した
文字のデータを一時記憶し、1文字毎に出力部6
に送出する如くなつている。
1は入力部、2は2文字分の日本語のデータを一
時記憶するレジスタ、3は2文字分のデータを一
時記憶するバツフア3aを有する制御部、4は照
合回路、5は日本語文の相連なる2文字の接続可
否を内容とした文字連接辞書を記憶する記憶部
(以下、説明の簡略のため単に文字連接辞書と称
す。)、6は出力部、7は誤り符号発生回路7−
1、候補開始符号発生回路7−2,候補終了符号
発生回路7−3よりなる符号発生回路、8は検索
回路、9は個々の文字に対してその特徴によつて
類似する文字を分類した文字分類辞書を記憶した
記憶部(以下、説明の簡略のため単に文字分類辞
書と称す。)である。レジスタ2は2文字分のデ
ータ格納領域を有するシフトレジスタで構成さ
れ、制御部3の制御の下に入力部1より入力した
文字のデータを一時記憶し、1文字毎に出力部6
に送出する如くなつている。
文字連接辞書5の内容は、例えば第2図に示す
如く、相連なる2文字のうち第1文字を行に配列
した文字に、第2文字を列に配列した文字にそれ
ぞれ対応させ、日本語の言葉として存在するとこ
ろの連接を構成する2文字の交点に‘1”の値
を、日本語の言葉として存在しないところの連接
を構成する2文字の交点“0”の値をそれぞれ与
えたものである。ここで、前記“1”の値の代り
にその言葉として使用頻度を表わすような値を用
いることも可能である。なお、図面上では漢字同
士の組み合せしか示されていないが、実際にはか
なと漢字、かな同士等についての接続可否も含ま
れている。
如く、相連なる2文字のうち第1文字を行に配列
した文字に、第2文字を列に配列した文字にそれ
ぞれ対応させ、日本語の言葉として存在するとこ
ろの連接を構成する2文字の交点に‘1”の値
を、日本語の言葉として存在しないところの連接
を構成する2文字の交点“0”の値をそれぞれ与
えたものである。ここで、前記“1”の値の代り
にその言葉として使用頻度を表わすような値を用
いることも可能である。なお、図面上では漢字同
士の組み合せしか示されていないが、実際にはか
なと漢字、かな同士等についての接続可否も含ま
れている。
誤り符号発生回路7−1,候補開始符号発生回
路7−2、候補終了符号発生回路7−3は制御部
3により駆動され、それぞれ誤り符号“/”(ス
ラツシユ)、候補開始符号“〔”(始め大括弧)、候
補終了符号“〕”(終り大括弧)を出力部6に出力
する如くなつている。なお、誤り符号としては
JIS−C6226の符号表の空領域にシステム独自に
定めた2バイト符号でもよい。
路7−2、候補終了符号発生回路7−3は制御部
3により駆動され、それぞれ誤り符号“/”(ス
ラツシユ)、候補開始符号“〔”(始め大括弧)、候
補終了符号“〕”(終り大括弧)を出力部6に出力
する如くなつている。なお、誤り符号としては
JIS−C6226の符号表の空領域にシステム独自に
定めた2バイト符号でもよい。
文字分類辞書9の内容は、例えば第3図に示す
如く、JIS−C6226のコード順に見出しの漢字を
配列し、各漢字に対応してその漢字と「読み」が
共通の漢字を分類し並べたものと、第4図に示す
如く、あいうえお順に見出しのひらがなを配列
し、各ひらがなに対応してそのひらがなと「形」
が類似したひらがなを分類し並べたものと、更に
図示しないが、かたかな、アルフアベツト等の
「形」が類似したものを並べたものとを組み合せ
たもの、または第5図に示す如く、見出しの漢字
に対応してその漢字と「形」が類似した漢字を分
類し並べたものと前記第4図のもの等とを組み合
せたもの、あるいはこれらをすべて組み合せたも
のである。
如く、JIS−C6226のコード順に見出しの漢字を
配列し、各漢字に対応してその漢字と「読み」が
共通の漢字を分類し並べたものと、第4図に示す
如く、あいうえお順に見出しのひらがなを配列
し、各ひらがなに対応してそのひらがなと「形」
が類似したひらがなを分類し並べたものと、更に
図示しないが、かたかな、アルフアベツト等の
「形」が類似したものを並べたものとを組み合せ
たもの、または第5図に示す如く、見出しの漢字
に対応してその漢字と「形」が類似した漢字を分
類し並べたものと前記第4図のもの等とを組み合
せたもの、あるいはこれらをすべて組み合せたも
のである。
次に動作について説明する。まず入力部1より
入力した漢字、かな及び句読点等の混合する日本
語の文字列データのうち先頭及び2番目のデータ
をそれぞれレジスタ2に第1文字及び第2文字と
して取り込む。制御部3はレジスタ2内の2文字
のデータをそのままバツフア3aに書き込み、更
に照合回路4に送る。照合回路4は該レジスタ2
の第1文字および第2文字のデータを文字連接辞
書5の行および列の文字データにアクセスし、そ
の交点の値を制御部3に送出する。該照合回路4
からの値が“1”(即ち、レジスタ2内の2つの
文字が日本語として正しく連接する場合)であれ
ば、制御部3はレジスタ2内の第1文字のデータ
をそのまま出力部6に送出し、第2文字を前記第
1文字を格納した領域に移し、入力部1から次の
1文字をレジスタ2に取り込む。この後、レジス
タ2内の新しい第1文字、第2文字のデータをバ
ツフア3aに書き込み、前記同様に文字連接の照
合を行なう。
入力した漢字、かな及び句読点等の混合する日本
語の文字列データのうち先頭及び2番目のデータ
をそれぞれレジスタ2に第1文字及び第2文字と
して取り込む。制御部3はレジスタ2内の2文字
のデータをそのままバツフア3aに書き込み、更
に照合回路4に送る。照合回路4は該レジスタ2
の第1文字および第2文字のデータを文字連接辞
書5の行および列の文字データにアクセスし、そ
の交点の値を制御部3に送出する。該照合回路4
からの値が“1”(即ち、レジスタ2内の2つの
文字が日本語として正しく連接する場合)であれ
ば、制御部3はレジスタ2内の第1文字のデータ
をそのまま出力部6に送出し、第2文字を前記第
1文字を格納した領域に移し、入力部1から次の
1文字をレジスタ2に取り込む。この後、レジス
タ2内の新しい第1文字、第2文字のデータをバ
ツフア3aに書き込み、前記同様に文字連接の照
合を行なう。
照合回路4からの値が“0”(即ち、レジスタ
2内の2つの文字が日本語として連接しない場
合)であれば、制御部3は誤り符号発生回路7−
1より誤り符号“/”を出力部6に出力させ、更
にレジスタ2内の第1文字のデータを出力部6に
送出し次の1文字を入力部1より取り込む。但
し、ここではバツフア3aの内容はそのままとす
る。次に制御部3は候補開始符号発生回路7−2
より候補開始符号“〔”を出力部6に出力させ、
バツフア3a内の第1文字のデータを検索回路8
に送る。検索回路8は該第1文字のデータを見出
しとして文字分類辞書9を検索し、類似した対応
文字を制御部3へ送出する。制御部3は前記類似
した文字を順次第1文字としてバツフア3a内の
第2文字と組み合せた2文字のデータを照合回路
4に送る。照合回路4は文字連接辞書5にアクセ
スし、前記各2文字の接続可否をチエツクし、
“0”または“1”の値を制御部3へ出力する。
制御部3は該照合回路4からの値によつて前記類
似した文字のうちバツフア3a内の第2文字の直
前に存在し得る文字のみを出力部6に順次送出
し、この後、候補終了符号発生回路7−3から候
補終了符号“〕”を出力部6に送出させる。
2内の2つの文字が日本語として連接しない場
合)であれば、制御部3は誤り符号発生回路7−
1より誤り符号“/”を出力部6に出力させ、更
にレジスタ2内の第1文字のデータを出力部6に
送出し次の1文字を入力部1より取り込む。但
し、ここではバツフア3aの内容はそのままとす
る。次に制御部3は候補開始符号発生回路7−2
より候補開始符号“〔”を出力部6に出力させ、
バツフア3a内の第1文字のデータを検索回路8
に送る。検索回路8は該第1文字のデータを見出
しとして文字分類辞書9を検索し、類似した対応
文字を制御部3へ送出する。制御部3は前記類似
した文字を順次第1文字としてバツフア3a内の
第2文字と組み合せた2文字のデータを照合回路
4に送る。照合回路4は文字連接辞書5にアクセ
スし、前記各2文字の接続可否をチエツクし、
“0”または“1”の値を制御部3へ出力する。
制御部3は該照合回路4からの値によつて前記類
似した文字のうちバツフア3a内の第2文字の直
前に存在し得る文字のみを出力部6に順次送出
し、この後、候補終了符号発生回路7−3から候
補終了符号“〕”を出力部6に送出させる。
次に制御部3は候補開始符号発生部回路7−2
より出力部6に候補開始符号“〔”を送出させ、
バツフア3a内の第2文字のデータを検索回路8
に送り、該第2文字を見出しとして文字分類辞書
9を検索させる。検索回路8は、該文字分類辞書
9よりバツフア3a内の第2文字に類似した文字
を制御部3へ送出し、制御部3は該文字を順次第
2文字としてバツフア3a内の第1文字と組み合
せた2文字のデータを照合回路4へ送り、文字連
接辞書5によつて接続可否をチエツクさせる。該
チエツクの結果に従つて制御部3はバツフア3a
内の第1文字の直後に接続し得る文字のみを出力
部6に順次送出し、その後、候補終了符号発生回
路7−3より候補終了符号“〕”を出力部6に送
出させる。
より出力部6に候補開始符号“〔”を送出させ、
バツフア3a内の第2文字のデータを検索回路8
に送り、該第2文字を見出しとして文字分類辞書
9を検索させる。検索回路8は、該文字分類辞書
9よりバツフア3a内の第2文字に類似した文字
を制御部3へ送出し、制御部3は該文字を順次第
2文字としてバツフア3a内の第1文字と組み合
せた2文字のデータを照合回路4へ送り、文字連
接辞書5によつて接続可否をチエツクさせる。該
チエツクの結果に従つて制御部3はバツフア3a
内の第1文字の直後に接続し得る文字のみを出力
部6に順次送出し、その後、候補終了符号発生回
路7−3より候補終了符号“〕”を出力部6に送
出させる。
次に制御部3はレジスタ2内の次の2文字分の
データをバツフア3aに新しく書き込み、前記同
様に文字連接の照合を行ない、以下これを繰り返
す。
データをバツフア3aに新しく書き込み、前記同
様に文字連接の照合を行ない、以下これを繰り返
す。
第6図は前記実施例で説明した処理の流れをフ
ローで示したものである。
ローで示したものである。
第7図は前記実施例における入力文字列と出力
文字列の一例を示すもので、図中ai,aij(i,j
≧1)は日本語文の各文字を表わしている。ここ
では入力文字列中、2番目の文字a2が誤り文字で
あつた場合(即ちa1a2及びa2a3という文字連接が
日本語に存在しない)を示している。(a2の下線
は誤り文字であることを示すために付したもの
で、実際の文字列には記されていない。)出力文
字列中、〔a11a12……〕はa1に類似した文字であ
つてその後にa2が接続可能なもの、即ちa2が正し
く入力された文字でa1が誤り文字であると見なし
た場合のa1の代りになり得る修正文字の候補の集
合である。また〔a21a22……〕はa2に類似した文
字であつてその前にa1が接続可能なもの、即ちa1
が正しく入力された文字でa2が誤り文字であると
見なした場合のa2の代りになり得る修正文字の候
補の集合である。また〔a′21a′22…〕,〔a31a32…〕
についても前記同様であるが、〔a′21a′22…〕はa3
が接続することができる文字の集合であり、一般
には〔a21a22…〕とは異なる。ここで、第7図で
はa1a2及びa2a3という文字連接が日本語に存在し
ない場合を示したが、日本語に存在しない文字連
接はa1a2,a2a3のいずれか一方のみであつても良
い。
文字列の一例を示すもので、図中ai,aij(i,j
≧1)は日本語文の各文字を表わしている。ここ
では入力文字列中、2番目の文字a2が誤り文字で
あつた場合(即ちa1a2及びa2a3という文字連接が
日本語に存在しない)を示している。(a2の下線
は誤り文字であることを示すために付したもの
で、実際の文字列には記されていない。)出力文
字列中、〔a11a12……〕はa1に類似した文字であ
つてその後にa2が接続可能なもの、即ちa2が正し
く入力された文字でa1が誤り文字であると見なし
た場合のa1の代りになり得る修正文字の候補の集
合である。また〔a21a22……〕はa2に類似した文
字であつてその前にa1が接続可能なもの、即ちa1
が正しく入力された文字でa2が誤り文字であると
見なした場合のa2の代りになり得る修正文字の候
補の集合である。また〔a′21a′22…〕,〔a31a32…〕
についても前記同様であるが、〔a′21a′22…〕はa3
が接続することができる文字の集合であり、一般
には〔a21a22…〕とは異なる。ここで、第7図で
はa1a2及びa2a3という文字連接が日本語に存在し
ない場合を示したが、日本語に存在しない文字連
接はa1a2,a2a3のいずれか一方のみであつても良
い。
前記の如くして検出された誤り文字の候補、及
び誤り文字に置き換わる修正文字の候補は一般に
人間の判断によつて正誤を決定され、誤り文字の
修正が行われる。そのために使用される表示装
置、正誤指示装置、文字指定装置、文字入力装置
等(図示せず)は本発明装置の後(実施例では出
力部6の後)に配置される如くなる。
び誤り文字に置き換わる修正文字の候補は一般に
人間の判断によつて正誤を決定され、誤り文字の
修正が行われる。そのために使用される表示装
置、正誤指示装置、文字指定装置、文字入力装置
等(図示せず)は本発明装置の後(実施例では出
力部6の後)に配置される如くなる。
なお、文字連接辞書5の内容は前述した通りで
あるが、この辞書を作成する際の日本語文の対象
として、例えば国語辞書に収録されている“語”
を用いれば、“単語”内での文字の接続可否条件
の辞書とすることができる。また、一般の文章全
体における文字の接続可否条件の辞書とする場合
には本発明装置を適用して誤り文字を検出・修正
する対象の入力文字列データから作成することが
できる。但し、文字連接辞書5の作成の際に対象
とした入力データの言葉の範囲と実際に検出・修
正支援処理を行なう入力データの言葉の範囲とが
異なる(例えば法律用語と医学用語のように分野
が異なる)ような場合には、検出された誤りが全
て誤りであるとは限らない。
あるが、この辞書を作成する際の日本語文の対象
として、例えば国語辞書に収録されている“語”
を用いれば、“単語”内での文字の接続可否条件
の辞書とすることができる。また、一般の文章全
体における文字の接続可否条件の辞書とする場合
には本発明装置を適用して誤り文字を検出・修正
する対象の入力文字列データから作成することが
できる。但し、文字連接辞書5の作成の際に対象
とした入力データの言葉の範囲と実際に検出・修
正支援処理を行なう入力データの言葉の範囲とが
異なる(例えば法律用語と医学用語のように分野
が異なる)ような場合には、検出された誤りが全
て誤りであるとは限らない。
また文字分類辞書9内の漢字に対応する部分
が、第3図に示すような“読み”による分類の場
合は、50音配列のタブレツト形入力装置のように
各漢字が“読み”を手掛りにして入力されるよう
な入力装置を使用して入力された文字列のデータ
の誤り検出・修正に有効であり、第5図に示すよ
うな“形”による分類の場合は、漢字OCRのよ
うに各漢字が“形”を手掛りにして入力されるよ
うな入力装置によつて入力された文字列のデータ
の誤り検出・修正に有効である。
が、第3図に示すような“読み”による分類の場
合は、50音配列のタブレツト形入力装置のように
各漢字が“読み”を手掛りにして入力されるよう
な入力装置を使用して入力された文字列のデータ
の誤り検出・修正に有効であり、第5図に示すよ
うな“形”による分類の場合は、漢字OCRのよ
うに各漢字が“形”を手掛りにして入力されるよ
うな入力装置によつて入力された文字列のデータ
の誤り検出・修正に有効である。
誤り符号、候補開始符号、候補終了符号等は必
ずしも全て必要なわけではなく、少なくすること
も可能である。(例えば、誤り符号“/”は説明
を容易にするためのもので、省略してもよい。) 誤り文字検出・修正の精度の向上は2文字だけ
でなく、3文字、4文字……とより長い範囲の文
字間で連接をチエツクすることによつてなし得
る。これは付属語、代名詞、形式名詞などと付属
語との接続のチエツクに有効である。
ずしも全て必要なわけではなく、少なくすること
も可能である。(例えば、誤り符号“/”は説明
を容易にするためのもので、省略してもよい。) 誤り文字検出・修正の精度の向上は2文字だけ
でなく、3文字、4文字……とより長い範囲の文
字間で連接をチエツクすることによつてなし得
る。これは付属語、代名詞、形式名詞などと付属
語との接続のチエツクに有効である。
以上説明したように本発明によれば、日本語文
の文字列データに含まれる誤り文字の候補を検出
し、更にその文字に代るべき修正用の文字の候補
を出力するため、従来すべて人手に頼つていた日
本語文のデータチエツク(いわゆるベリフアイ)
の作業の一部を分担させることができ、作業の効
率を上げることができるとともに誤り文字検出・
修正の精度を上げることができる利点がある。
の文字列データに含まれる誤り文字の候補を検出
し、更にその文字に代るべき修正用の文字の候補
を出力するため、従来すべて人手に頼つていた日
本語文のデータチエツク(いわゆるベリフアイ)
の作業の一部を分担させることができ、作業の効
率を上げることができるとともに誤り文字検出・
修正の精度を上げることができる利点がある。
なお、本発明は日本語ワードプロセツサ、漢字
OCR、音声認識による日本語入力装置等、いわ
ゆる日本語入力装置すべてに適用でき、また、一
度入力されて出来上がつたデータ(例えばデータ
ベースに収容されているデータ)の誤り文字検
出・修正にも適用できる。
OCR、音声認識による日本語入力装置等、いわ
ゆる日本語入力装置すべてに適用でき、また、一
度入力されて出来上がつたデータ(例えばデータ
ベースに収容されているデータ)の誤り文字検
出・修正にも適用できる。
図面は本発明の説明に供するもので、第1図は
本発明の一実施例を示す誤り文字検出・修正支援
装置のブロツク構成図、第2図は文字連接辞書の
内容の一例を示す説明図、第3図、第4図及び第
5図は文字分類辞書の内容の一例を示す説明図、
第6図は第1図の装置における処理のフローチヤ
ート、第7図は入力文字列と出力文字列の一列を
示す説明図である。 1……入力部、2……レジスタ、3……制御
部、4……照合回路、5……文字連接辞書、6…
…出力部、7……符号発生回路、8……検索回
路、9……文字分類辞書。
本発明の一実施例を示す誤り文字検出・修正支援
装置のブロツク構成図、第2図は文字連接辞書の
内容の一例を示す説明図、第3図、第4図及び第
5図は文字分類辞書の内容の一例を示す説明図、
第6図は第1図の装置における処理のフローチヤ
ート、第7図は入力文字列と出力文字列の一列を
示す説明図である。 1……入力部、2……レジスタ、3……制御
部、4……照合回路、5……文字連接辞書、6…
…出力部、7……符号発生回路、8……検索回
路、9……文字分類辞書。
Claims (1)
- 1 日本語文の文字列のうち相連なる2文字以上
を一時記憶する第1の手段と、日本語文の相連な
る少なくとも2文字の接続可否を内容とする文字
連接辞書を記憶する第2の手段と、個々の文字に
対してその特徴によつて類似する文字を分類した
文字分類辞書を記憶する第3の手段と、前記第1
の手段の内容と第2の手段の内容とを照合し誤り
文字の候補を検出する第4の手段と、該誤り文字
の候補に類似する文字を前記第3の手段より検索
し前記第2の手段の内容と照合して第1の手段の
他の文字と接続可能な文字のみを選択して出力す
る第5の手段とからなる誤り文字検出・修正支援
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56198941A JPS5899829A (ja) | 1981-12-10 | 1981-12-10 | 誤り文字検出・修正支援装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP56198941A JPS5899829A (ja) | 1981-12-10 | 1981-12-10 | 誤り文字検出・修正支援装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5899829A JPS5899829A (ja) | 1983-06-14 |
JPH0248938B2 true JPH0248938B2 (ja) | 1990-10-26 |
Family
ID=16399508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP56198941A Granted JPS5899829A (ja) | 1981-12-10 | 1981-12-10 | 誤り文字検出・修正支援装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5899829A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0746358B2 (ja) * | 1988-01-13 | 1995-05-17 | 三洋電機株式会社 | 接続性検定装置 |
JPH01291366A (ja) * | 1988-05-18 | 1989-11-22 | Nec Corp | 文法格認識方式 |
-
1981
- 1981-12-10 JP JP56198941A patent/JPS5899829A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS5899829A (ja) | 1983-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7853874B2 (en) | Spelling and grammar checking system | |
US5680628A (en) | Method and apparatus for automated search and retrieval process | |
US5521816A (en) | Word inflection correction system | |
JP4301515B2 (ja) | 文章表示方法、情報処理装置、情報処理システム、プログラム | |
US5485372A (en) | System for underlying spelling recovery | |
US5845306A (en) | Context based system for accessing dictionary entries | |
US5161245A (en) | Pattern recognition system having inter-pattern spacing correction | |
JPH07325828A (ja) | 文法チェックシステム | |
JPH07325829A (ja) | 文法チェックシステム | |
JPH07325824A (ja) | 文法チェックシステム | |
JPS6359660A (ja) | 情報処理装置 | |
JPH0248938B2 (ja) | ||
JP3975825B2 (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
WO2022059556A1 (ja) | 文書検索装置 | |
JP3470927B2 (ja) | 自然語解析方法及び装置 | |
JPH07325825A (ja) | 英文法チェックシステム装置 | |
JP3109187B2 (ja) | 形態素解析方式 | |
JP3390567B2 (ja) | 誤字訂正装置 | |
JP3045886B2 (ja) | 手書き入力機能付き文字処理装置 | |
JPH10207889A (ja) | 文書校正装置 | |
JP2776069B2 (ja) | 文章検査装置 | |
JP2002297585A (ja) | 英文名詞句の区分方法,英文構文情報生成方法および装置 | |
JPH1078953A (ja) | 住所表記変換方法および住所表記チェック方法 | |
JPS62212871A (ja) | 文章読み上げ校正装置 | |
JPH087046A (ja) | 文書認識装置 |