JPS6356756A - コレクト機能付欧文作成装置 - Google Patents
コレクト機能付欧文作成装置Info
- Publication number
- JPS6356756A JPS6356756A JP61202871A JP20287186A JPS6356756A JP S6356756 A JPS6356756 A JP S6356756A JP 61202871 A JP61202871 A JP 61202871A JP 20287186 A JP20287186 A JP 20287186A JP S6356756 A JPS6356756 A JP S6356756A
- Authority
- JP
- Japan
- Prior art keywords
- character
- string
- dictionary
- main dictionary
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006870 function Effects 0.000 title claims description 8
- 230000011218 segmentation Effects 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims description 22
- 238000012217 deletion Methods 0.000 abstract description 3
- 230000037430 deletion Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〈産業上の利用分野〉
この発明はコレクト機能付欧文作成装置に関ケろ。
〈従来の技術〉
従来より、英単語情報を取り扱う計算機ノステム、ワー
ドプロセッサー装置、タイプライタ−装(η等の欧文作
成装置においては、入力した英単語の綴りに誤りはない
かどうかのヂエックをする5r二めに、通常は辞書を備
えている。そして、さらに、今[1では単に綴り間退い
の単語を指摘4〜る他に、正解候補の単語をシステム側
が供給する機能がつけられるようになった。現在よく使
用されている方法は、下記の4つの処理を組合せた方法
であるが、これでも統計的には正解単語は80%台の精
度でしか得られない。
ドプロセッサー装置、タイプライタ−装(η等の欧文作
成装置においては、入力した英単語の綴りに誤りはない
かどうかのヂエックをする5r二めに、通常は辞書を備
えている。そして、さらに、今[1では単に綴り間退い
の単語を指摘4〜る他に、正解候補の単語をシステム側
が供給する機能がつけられるようになった。現在よく使
用されている方法は、下記の4つの処理を組合せた方法
であるが、これでも統計的には正解単語は80%台の精
度でしか得られない。
i) 1文字置換 例 5tataon −* 5t
ation(aをiに置換える) 2)1文字削除 例 5tatioon −+ 5ta
tion(0を1文字削除) 3) 1文字追加 例 5taton−4stati
on(iGtと0の間に追加) 4)隣接文字反転例 5tatre −) 5tate
r(reをerに反転さ什る) ところで、過去においては、英単語の入力は原稿をみな
がらキーボードから入力していくのが大半であったが、
今日では、0CR(光学文字読取装置)等を用いて直接
活字データを入力するというように、データ入力の仕方
も変わりつつある。
ation(aをiに置換える) 2)1文字削除 例 5tatioon −+ 5ta
tion(0を1文字削除) 3) 1文字追加 例 5taton−4stati
on(iGtと0の間に追加) 4)隣接文字反転例 5tatre −) 5tate
r(reをerに反転さ什る) ところで、過去においては、英単語の入力は原稿をみな
がらキーボードから入力していくのが大半であったが、
今日では、0CR(光学文字読取装置)等を用いて直接
活字データを入力するというように、データ入力の仕方
も変わりつつある。
そのため、発生するスペルエラーの内訳も、単なるキー
入力間違いよりも、綴りの非常に似通った文字の認識間
違いのエラーが総エラーの中で占めろ割合が大きくなっ
てきている。そのため、従来の1文字置換、1文字削除
。1文字追加、隣接文字反転という処理では極めて低い
精度でしか正解候補単語が得られない。
入力間違いよりも、綴りの非常に似通った文字の認識間
違いのエラーが総エラーの中で占めろ割合が大きくなっ
てきている。そのため、従来の1文字置換、1文字削除
。1文字追加、隣接文字反転という処理では極めて低い
精度でしか正解候補単語が得られない。
〈発明の目的〉
そこで、この発明は、誤読される文字または文字列の入
力データに対応づけて正解候補を記憶しているセグメン
テーションテーブルを参照することによって、より精度
の高い正解候補単語をU(袷できるようにすることにあ
る。
力データに対応づけて正解候補を記憶しているセグメン
テーションテーブルを参照することによって、より精度
の高い正解候補単語をU(袷できるようにすることにあ
る。
〈発明の構成〉
上記目的を達成するため、この発明のコレクト機能付欧
文作成装置は、入力装置から入力された文字情報を記憶
する記憶装置と、メイン辞書領域と誤読される文字また
は文字列の入力データに対応づけて正解候補を記憶して
いるセグメンテーションテーブルとを有する辞書装置と
、上記記憶装置に記憶された文字列がメイン辞書に有る
か否かを判別し、上記文字列がメイン辞書に有る場合に
は、その文字列を出力装置に出力する一方、上記文字列
がメイン辞書にない場合には、1文字置換、1文字削除
、1文字追加、隣接文字反転の4処理のいずれかまたは
その組み合せを行なって、その処理後の文字列がメイン
辞書にあるか否かを判別し、上記処理後の文字列がメイ
ン辞書に有る場合には、処理後の文字列を出力装置に出
力する一方、上記処理後の文字列がメイン辞書にない場
合には、上記文字列を分解し、分解後の文字または文字
列がセグメンテーションテーブルにおける誤読される文
字または文字列と一致する場合には、上記文字または文
字列を正解候補に入れ替えて、この入れ替えた後の文字
列がメイン辞書にあるか否かを判別して、上記文字列か
上記メイン辞書にある場合には、上記文字列を出力装置
に出力する制御装置を備え1こことを特徴としている。
文作成装置は、入力装置から入力された文字情報を記憶
する記憶装置と、メイン辞書領域と誤読される文字また
は文字列の入力データに対応づけて正解候補を記憶して
いるセグメンテーションテーブルとを有する辞書装置と
、上記記憶装置に記憶された文字列がメイン辞書に有る
か否かを判別し、上記文字列がメイン辞書に有る場合に
は、その文字列を出力装置に出力する一方、上記文字列
がメイン辞書にない場合には、1文字置換、1文字削除
、1文字追加、隣接文字反転の4処理のいずれかまたは
その組み合せを行なって、その処理後の文字列がメイン
辞書にあるか否かを判別し、上記処理後の文字列がメイ
ン辞書に有る場合には、処理後の文字列を出力装置に出
力する一方、上記処理後の文字列がメイン辞書にない場
合には、上記文字列を分解し、分解後の文字または文字
列がセグメンテーションテーブルにおける誤読される文
字または文字列と一致する場合には、上記文字または文
字列を正解候補に入れ替えて、この入れ替えた後の文字
列がメイン辞書にあるか否かを判別して、上記文字列か
上記メイン辞書にある場合には、上記文字列を出力装置
に出力する制御装置を備え1こことを特徴としている。
〈実施例〉
以下、この発明を図示の実施例により詳細に説明する。
第1図において、lはキーボード、タブレット装置、o
cn、磁気テープ等の英文字の単語情報データを入力す
る入力装置、2は入力装置1から入力された文字情報を
記憶する例えばコアメモリ、ICメモリ、磁気ディスク
等の記憶装置、3は記憶装置2に保存されている編集後
の文字単語データを出力する例えばプリンター、ディス
プレイ装置、磁気テープ、磁気ディスク等の出力装置、
/1はメイン辞書領域、ユーザ辞書領域およびセグメン
テーションテーブルを有して、記憶装置に格納している
文字単語データの綴り情報の間合せに対して、有効な情
報を供給する辞書装置、5は上記入力装置11記憶装置
2、出力装置3および辞書装置4間の信号のやりとりを
制御すると共に、後記する入力単語の文字列のコレクト
処理を行なう例えばコンピュータからなる制御装置であ
る。
cn、磁気テープ等の英文字の単語情報データを入力す
る入力装置、2は入力装置1から入力された文字情報を
記憶する例えばコアメモリ、ICメモリ、磁気ディスク
等の記憶装置、3は記憶装置2に保存されている編集後
の文字単語データを出力する例えばプリンター、ディス
プレイ装置、磁気テープ、磁気ディスク等の出力装置、
/1はメイン辞書領域、ユーザ辞書領域およびセグメン
テーションテーブルを有して、記憶装置に格納している
文字単語データの綴り情報の間合せに対して、有効な情
報を供給する辞書装置、5は上記入力装置11記憶装置
2、出力装置3および辞書装置4間の信号のやりとりを
制御すると共に、後記する入力単語の文字列のコレクト
処理を行なう例えばコンピュータからなる制御装置であ
る。
上記セグメンテーションテーブルは誤読される文字また
は文字列の入力データに正解候補の文字または文字列を
対応づけて記憶している。すなわち、第3図は2文字接
触の誤読データ(入力データ)に正解候補を対応づけた
セグメンテーンヨンテーブルを示し、第4図は1文字が
切れたための誤読データ(入力データ)に正解候補の文
字を対応づけたセグメンテーションテーブルを示してい
る。
は文字列の入力データに正解候補の文字または文字列を
対応づけて記憶している。すなわち、第3図は2文字接
触の誤読データ(入力データ)に正解候補を対応づけた
セグメンテーンヨンテーブルを示し、第4図は1文字が
切れたための誤読データ(入力データ)に正解候補の文
字を対応づけたセグメンテーションテーブルを示してい
る。
第2図はこのコレクト機能付欧文作成装置のコレクト処
理のフローチャートである。まず、ステップSz、St
で、入力単語の文字列がメイン辞書とユーザー辞書にあ
るかチェックする。この場合の辞書構造は、ハツシュ(
Hash)法を使用した方法や連枝式を使用した方法や
マイクロプロ(Micr。
理のフローチャートである。まず、ステップSz、St
で、入力単語の文字列がメイン辞書とユーザー辞書にあ
るかチェックする。この場合の辞書構造は、ハツシュ(
Hash)法を使用した方法や連枝式を使用した方法や
マイクロプロ(Micr。
P ro)社の旧ワードスタ(Word 5tar)の
辞t4f tM成方法(A−Z順に頭文字データを横配
列にその単語を構成する文字数を縦順にした2次元のイ
ンデックスをらとにした方法)等、どの方法でもかまわ
ない。文字列がメイン辞書やユーザ辞書にある場合は、
その文字列は正しいものとして、記憶装置2に記憶し、
さらに出力装置3から出力する。このようなメイン辞書
やユーザ辞書に文字列が登録されていないときには、ス
テップS3. S4. S5゜S6に進み、前述の4つ
の処理を行なう。すなわち、単語の長さCの構成要素C
=C,・・・Ci・・・CQからの正しい綴り候補は、 1) 1文字置換 位置i、!≦1≦ρにある文字C
iをそれ以外のC*と置換える。
辞t4f tM成方法(A−Z順に頭文字データを横配
列にその単語を構成する文字数を縦順にした2次元のイ
ンデックスをらとにした方法)等、どの方法でもかまわ
ない。文字列がメイン辞書やユーザ辞書にある場合は、
その文字列は正しいものとして、記憶装置2に記憶し、
さらに出力装置3から出力する。このようなメイン辞書
やユーザ辞書に文字列が登録されていないときには、ス
テップS3. S4. S5゜S6に進み、前述の4つ
の処理を行なう。すなわち、単語の長さCの構成要素C
=C,・・・Ci・・・CQからの正しい綴り候補は、 1) 1文字置換 位置i、!≦1≦ρにある文字C
iをそれ以外のC*と置換える。
2) 1文字削除 位置i、1≦l≦Qにある文字C
iを除去する。
iを除去する。
3)1文字追加 位置iとi+I、o≦i≦Qの間に仮
想した文字C*を挿入する。
想した文字C*を挿入する。
4)隣接文字反転位置iと1−1−1.1≦i≦ρ−1
とにあるci、ci+1を反転する。
とにあるci、ci+1を反転する。
の処理によって新たに導きだせる新単語がメイン辞書ま
たはユーザ辞書にあるかチェックし、あるときは一致す
る単語を記憶装置2に格納する。
たはユーザ辞書にあるかチェックし、あるときは一致す
る単語を記憶装置2に格納する。
ここまでの処理で誤った綴りの訂正は、80%台の訂正
率が得られるという統計的数字がでている。しかし、ま
だlO数%台の誤り率は発生している。そのため、ステ
ップS7に進んで上記4つの処理に加えて、第3,4図
のセグメンテーンヨンテーブルを参照することによって
、より精度の高い正解候補の単語が供給できる。このセ
グメンテーノヨンテーブルは単語を構成している文字列
を分解しており、このセグメンテーンヨンテーブルに登
録されている文字列と同じ文字列の場合に、その後にあ
る候補文字列と入替えて新しい正解単語候補を提供する
。これがメイン辞書あるいはユーザ辞書にある単語と同
一かどうかチェックし、一致していれば正しい単語候補
として記憶装置2、出力装置3に供給する。このように
して、精度の高い正解単語を供給できろ。
率が得られるという統計的数字がでている。しかし、ま
だlO数%台の誤り率は発生している。そのため、ステ
ップS7に進んで上記4つの処理に加えて、第3,4図
のセグメンテーンヨンテーブルを参照することによって
、より精度の高い正解候補の単語が供給できる。このセ
グメンテーノヨンテーブルは単語を構成している文字列
を分解しており、このセグメンテーンヨンテーブルに登
録されている文字列と同じ文字列の場合に、その後にあ
る候補文字列と入替えて新しい正解単語候補を提供する
。これがメイン辞書あるいはユーザ辞書にある単語と同
一かどうかチェックし、一致していれば正しい単語候補
として記憶装置2、出力装置3に供給する。このように
して、精度の高い正解単語を供給できろ。
なお、第3.4図に示すセグメンテーンヨンテーブルは
、従来の4つの処理と重複するパターンを省いている。
、従来の4つの処理と重複するパターンを省いている。
〈発明の効果〉
以上より明らかなように、この発明のコレクト機能付欧
文作成装置は、従来の1文字置換、1文字削除、1文字
追加、隣接文字反転の4つの処理に加えて、誤読される
文字または文字列に対応づけて正解候補を記憶している
セグメンテーノヨンテーブルを参照して、正解候補単語
を捜し出して供給するので、辞書から供給される単語の
精度を大幅に向上できる。
文作成装置は、従来の1文字置換、1文字削除、1文字
追加、隣接文字反転の4つの処理に加えて、誤読される
文字または文字列に対応づけて正解候補を記憶している
セグメンテーノヨンテーブルを参照して、正解候補単語
を捜し出して供給するので、辞書から供給される単語の
精度を大幅に向上できる。
第1図はこの発明の一実施例のコレクト機能付欧文作成
装置のブロック図、第2図はコレクト処理のフローチャ
ート、第3.4図はセグメンテーションテーブルの説明
図である。 l・・入力装置、2・・・記憶装置、3・・・出力装置
、4・・1γ書装置、5・・・制御装置。 特 許 出 願 人 シャープ株式会社代 理 人
弁理士 前出 葆 外2名第1 図 第2図 第3図 11f4図 本
装置のブロック図、第2図はコレクト処理のフローチャ
ート、第3.4図はセグメンテーションテーブルの説明
図である。 l・・入力装置、2・・・記憶装置、3・・・出力装置
、4・・1γ書装置、5・・・制御装置。 特 許 出 願 人 シャープ株式会社代 理 人
弁理士 前出 葆 外2名第1 図 第2図 第3図 11f4図 本
Claims (1)
- (1)入力装置から入力された文字情報を記憶する記憶
装置と、 メイン辞書領域と誤読される文字または文字列の入力デ
ータに対応づけて正解候補を記憶しているセグメンテー
ションテーブルとを有する辞書装置と、 上記記憶装置に記憶された文字列がメイン辞書に有るか
否かを判別し、上記文字列がメイン辞書に有る場合には
、その文字列を出力装置に出力する一方、上記文字列が
メイン辞書にない場合には、1文字置換、1文字削除、
1文字追加、隣接文字反転の4処理のいずれかまたはそ
の組み合せを行なって、その処理後の文字列がメイン辞
書にあるか否かを判別し、上記処理後の文字列がメイン
辞書に有る場合には、処理後の文字列を出力装置に出力
する一方、上記処理後の文字列がメイン辞書にない場合
には、上記文字列を分解し、分解後の文字または文字列
がセグメンテーションテーブルにおける誤読される文字
または文字列と一致する場合には、上記文字または文字
列を正解候補に入れ替えて、この入れ替えた後の文字列
がメイン辞書にあるか否かを判別して、上記文字列が上
記メイン辞書にある場合には、上記文字列を出力装置に
出力する制御装置を備えたことを特徴とするコレクト機
能付欧文作成装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61202871A JPS6356756A (ja) | 1986-08-28 | 1986-08-28 | コレクト機能付欧文作成装置 |
EP87112445A EP0257641A3 (en) | 1986-08-28 | 1987-08-27 | Documentation machine with spelling correction feature |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61202871A JPS6356756A (ja) | 1986-08-28 | 1986-08-28 | コレクト機能付欧文作成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6356756A true JPS6356756A (ja) | 1988-03-11 |
Family
ID=16464574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61202871A Pending JPS6356756A (ja) | 1986-08-28 | 1986-08-28 | コレクト機能付欧文作成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6356756A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10232865A (ja) * | 1997-02-19 | 1998-09-02 | Sharp Corp | スペルチェック装置 |
JP2010505208A (ja) * | 2006-09-27 | 2010-02-18 | アカデミア シニカ | タイピング効率向上のためのタイピング候補の生成方法 |
-
1986
- 1986-08-28 JP JP61202871A patent/JPS6356756A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10232865A (ja) * | 1997-02-19 | 1998-09-02 | Sharp Corp | スペルチェック装置 |
JP2010505208A (ja) * | 2006-09-27 | 2010-02-18 | アカデミア シニカ | タイピング効率向上のためのタイピング候補の生成方法 |
US8364468B2 (en) | 2006-09-27 | 2013-01-29 | Academia Sinica | Typing candidate generating method for enhancing typing efficiency |
US8594999B2 (en) | 2006-09-27 | 2013-11-26 | Academia Sinica | Typing candidate generating method for enhancing typing efficiency |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5161245A (en) | Pattern recognition system having inter-pattern spacing correction | |
US4689768A (en) | Spelling verification system with immediate operator alerts to non-matches between inputted words and words stored in plural dictionary memories | |
US4991094A (en) | Method for language-independent text tokenization using a character categorization | |
EP0277356B1 (en) | Spelling error correcting system | |
JPH0247768B2 (ja) | ||
US4650349A (en) | Speed typing apparatus and method | |
JPS61502495A (ja) | 暗号解析装置 | |
US5148367A (en) | European language processing machine with a spelling correction function | |
US5331557A (en) | Audio-video coding system for Chinese characters | |
EP0097818A2 (en) | Spelling verification method and typewriter embodying said method | |
KR100736561B1 (ko) | 오타수정장치와 그 방법 및 이동통신단말기 | |
JPS6356756A (ja) | コレクト機能付欧文作成装置 | |
JP2003331214A (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
JPS5960691A (ja) | 光学文字読取装置 | |
JPH0244459A (ja) | 日本文訂正候補文字抽出方法 | |
JPS6356757A (ja) | コレクト機能付欧文作成装置 | |
JP2939945B2 (ja) | ローマ字住所認識装置 | |
JP2634926B2 (ja) | かな漢字変換装置 | |
JP3387421B2 (ja) | 単語入力支援装置及び単語入力支援方法 | |
JP3045886B2 (ja) | 手書き入力機能付き文字処理装置 | |
CN117764694A (zh) | 风险账户识别方法、装置、电子设备和存储介质 | |
JPH0589281A (ja) | 誤読修正・検出方法 | |
JPH06251204A (ja) | 文字認識装置 | |
JPH04123185A (ja) | 文書認識方式 | |
JPH03129568A (ja) | 文書処理装置 |