[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPS63268081A - 文書の文字を認識する方法及び装置 - Google Patents

文書の文字を認識する方法及び装置

Info

Publication number
JPS63268081A
JPS63268081A JP62093435A JP9343587A JPS63268081A JP S63268081 A JPS63268081 A JP S63268081A JP 62093435 A JP62093435 A JP 62093435A JP 9343587 A JP9343587 A JP 9343587A JP S63268081 A JPS63268081 A JP S63268081A
Authority
JP
Japan
Prior art keywords
rectangle
list
character
position data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62093435A
Other languages
English (en)
Inventor
真野 隆司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP62093435A priority Critical patent/JPS63268081A/ja
Priority to EP88105799A priority patent/EP0287027B1/en
Priority to DE88105799T priority patent/DE3883578T2/de
Priority to US07/181,894 priority patent/US4926490A/en
Publication of JPS63268081A publication Critical patent/JPS63268081A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 」朶上の利月公夏 本発明は、イメージ走査装置に対して傾けられた文書の
文字を認識する方法に関する。
従来舊術及び間叫博2 文書上の文字を認識するために光字的文字認識(OCR
)技法が用いられてきた。OCR技法は。
文書のイメージを走査し、走査動作により発生されたア
ナログ信号を閾値と比較して文書のイメージを表わす2
通信号を発生し、2通信号をイメージ・バッファに記憶
し、文字イメージを切出し即ち文書のイメージを各文字
の個別イメージに切出し、そして切出された文字イメー
ジを認識して、認識結果を出力する工程を含む。
切出しは、各文字行を分けることを含む、第1B図を参
照するに、イメージ・バッファ202に記憶されている
文書201のイメージが示されている。第1B図は、文
書201が走査装置に対して傾かないで走査されたこと
を示している0文字行を互いに分離するために射影技法
が、用いられてきた。全文字の影が射影されて射影20
3及び204を発生する射影203及び204は、イメ
ージ・バッファ202のY軸方向における第1及び第2
文字行の位置を表わす。第1C図に示すように、文書が
走査装置に対して傾けられた場合に問題が生じる1文書
205が傾けられると、第1及び第2文字行を含む長い
射影207が生じる。この場合、第1文字行の文字は第
2文字行の文字から分離されておらず、2つの文字行は
単一文字行として扱われ両文字行の文字は互いに混合さ
れ、そしてこの文4!205のOCRの結果を示す出カ
ブリント・アラ上に単一文字行内に印刷される。
文字行相互間の分離を確実にするには、標準のA4サイ
ズの文書の最大傾き角度は約1°である。
更に傾いた文書の文字行の分離を行なうために、特願昭
56−204636号は、第1C図の垂直方向の点線2
06で示すように文字行を複数個のブロック209,2
10に分け、各ブロック毎にブロック射影208を発生
し、ブロック209の文字の切出しをブロック射影20
8に基づいて行なう技法を開示している。更に、1文字
行の文字を認識するために、1つのブロック209と次
のブロック210の連続性が調べられる。この特願昭5
6−204636号は上記問題をいくらか解決はするが
、ブロック相互間の連続性を見出すのに複雑なプロセス
を必要とする。射影を用いる技法の固有的な問題点は、
文書の水平方向において文字及び写真が混在する時に十
分に動作しないということである。
IBM Journal of Re5earch a
nd Development、 1971年第15巻
の第153−165頁のR,L。
Hoffman及びJ、WoMcCulloughの論
文“Segmentation Methods fo
r Recognition ofMachine−P
rinted Characters”は、近接してい
る文字を分離するアルゴリズムを説明している。走査さ
れた文字の垂直密度即ち各垂直走査線の黒画素の数が調
べられ、そして低密度の走査線が文字相互間の境界とし
て選択される。従って、この論文の方法は本発明のもの
と明らかに相違する。
IBM Journal of Re5earch a
nd Deve、lopment、 1982年第26
巻の第647−656頁ノに、 Y。
Vong、 R,G、 Ca5ey及びF、 M、 W
ahlの論文“Docu+1ent Analysis
 System”は、文書のためのオフィス・システム
の概念を示している。ここには、前述の投影法を用いて
文字を切り出すことが示されており、従って、この論文
の概念は、本発明のものとは明らかに相違する。
1982年のProceedings of 6th 
InternationalConference o
n Pattern Recognitionにおける
R、 G、 Ca5ey及びG、 Nagyによる論文
“Recursive Segmentation a
nd C1assificationof Compo
site Character Patterns”は
、数個の文字が接続されてしまった場合の切り出しの方
法を説明している。切り出しの最初のステップとして上
記1i1ongの論文の方法が用いられる。そして、切
り出されたブロックがいくつかの接続された文字のもの
であると思われる場合に用いるアルゴリズムが示されて
いる。この論文の概念は、本発明のものとは明らかに相
違する。
IBM Journal of Re5earch a
nd Development、 1983年の第27
巻の第386−399頁のR,G。
Ca5ey及びC,R,Jihによる論文“A Pro
cessor−Based OCRSystem”はO
CRシステムの一般的方法を説明している。このアルゴ
リズムでは、基線の検出後に文字が切り出される。又、
決定クリ−のアルゴリズムが示されている。この論文は
、本発明の考えを示していない。
1984年のProcaedin’gs of IEE
E7thInternational Confere
nce on PatternRecognition
におけるR、 G、 Ca5ey、 S、 K、 Ch
ai及びに、 Y、 Vongによる論文“Unsup
ervisedConstruction of De
cision Networks forPatter
n C1assification”は認識アルゴリズ
ムを示すに留まり、切り出しについては述べていない。
問題、べを 決する手段 従って1本発明の主な目的は、文書の文字及び記号を認
識する方法及び装置を提供する事である。
本発明の他の目的は、イメージ走査装置に対して傾けら
れた文書の文字及び記号を認識する方法及び装置を提供
することである。
文書はイメージ走査装置により走査され、そして文書の
イメージを表わすイメージ・データはイメージ記憶手段
に記憶される。イメージ記憶手段内の複数文字行の各イ
メージの外側境界に接してこれを囲む矩形が発生され、
そしてイメージ記憶手段のXY座標における矩形の4つ
の辺の位置が検出される。この検出された4つの辺の位
置に基づいて矩形の寸法が計算され、そして各矩形の寸
法が、認識されるべき文字及び記号に対して予期される
寸法のレンジと比較される。この寸法のレンジ内に入る
矩形の位置が位置データとして第1テーブルに記憶され
、この時複数文字行に亘る文字及び記号の矩形の位置デ
ータは、XY座標のX軸の方向に沿う一端の矩形から他
端の矩形の順序で第1リストに配列される。
第1リストの矩形の位置データが上記配列順序で逐次的
に取出されて各矩形の寸法が調べられそして全矩形の平
均寸法が調べられる。再び第1リストの矩形の位置デー
タが上記配列の順序で逐次的に取出され上記平均寸法を
基にして設定された寸法レンジに入る第1矩形が見い出
される。この取り出し動作は続けられ、第1矩形の左下
角からのX及びY方向の予定距離内に左下角がある第2
の矩形が見い出される。この取り出し動作が続けられ、
第2矩形の左下角からのX及びY方向の予定距離内に左
下角がある第3矩形が見い出される。
この条件を満たす1文字行の予定数の矩形を見い出すよ
うに上記動作が続けられる。予定数の矩形が見い出され
ると、これらの矩形の左下角の位置に基づいてXY座標
におけるこの文字行の傾きが計算され、そしてこの検出
された傾きを文書の傾きとして扱う。
再び第1リストの矩形の位置データが上記配列の順序で
逐次的に取り出されそしてY軸における各矩形の下辺の
位置が上記文書の傾き分だけ補正される。この補正され
た位置を本明細書では板想位置と呼ぶ、この取り出し動
作の間に計算された板想位置のうち、文書上の一番高い
位置にある板想位置が検出され、そしてこの検出された
一番高い板想位置がレジスタに記憶される。
再び、第1リストの矩形の位置データが上記配列順序で
逐次的に取り出され、そして各矩形の板想位置が再び計
算される。そして、各矩形の位想位置が、上記レジスタ
に記憶されている最も萬い位置からの予定レンジ内に入
るか否かの比較が行なわれる。このレンジは、例えば小
文字のp、 yの如く文字の基線よりも下に延びる脚部
を有する文字の矩形を補えるように選択される。この取
り出し及び比較動作の間、上記レンジ内に入る矩形の位
置データが第1リストから第2リストに移され、そして
この動作の終了時には、第1文字行の矩形の位置データ
が、第1文字の矩形から最後の文字の矩形の順番で第2
リストに記憶され終えている。
認識ユニットは第2リストに記憶されている矩形の位置
データを逐次的に取り出し、これらの位置データにより
指定される矩形により囲まれている上記イメージ記憶手
段内のイメージ・データを読出し、そしてこのイメージ
・データを認識する。
ヌー施夛−の一説−功− 第1A図を参照するに、複数文字行を含む文書1が示さ
れている。図を簡単にするために、3文字行だけが示さ
れている。更に、本発明の理解を容易にするために、文
書上の文字の間隔は水平及び垂直の両方向において実際
の文書の場合よりも広げられている。従って、各文字行
は第1A図に示されたよりも多い文字を含む。
文書はXY座標において傾斜角度θだけ傾けられて示さ
れている。
文書1は第2図に示す文書走査装置21により走査され
る。文書走査袋@21には、光源、光学的センサ・アレ
イ及びこれらに対して文書1を相対的に移動させる手段
が設けられている。光学的センサ・アレイは、2.54
cn当り240画素の密度即ち解像度で配列された例え
ばCCD素子の如き複数個の光学的感知素子を含む。例
えば210mの幅のA4サイズの文書を走査するには2
016個の光学的センサ素子を水平方向に配列すること
が必要であり、そして各素子は1画素を形成する。光源
からの光は文書1により反射され、そして文書のイメー
ジを表わす反射光が光学的センサ・アレイにより検出さ
れ、画素のアナログ信号が発生される。アナログ信号は
第2図の閾値回路22に供給され、そしてこの回路は、
アナログ信号を閾値レベルと比較する。もしもアナログ
信号が閾値レベルを超すならば閾値回路22は白レベル
を表わす2進0信号を発生する。もしもアナログ信号が
閾値レベルを超えないならば、閾値回路22は黒レベル
を表わす2進1信号を発生する。
水平方向に1列で配列された光学的センサ素子は第1A
図の走査線2を規定する。文書1が光学的センサ素子に
関して相対移動されるにつれて、走査線2は文書1の上
をY方向に下方に移動し、そして文書1のイメージは逐
次イメージ・バッファ23に記憶される。
第2図に制御ユニット20が示されている。制御ユニッ
ト2oは、第2図の全ブロックの動作を制御する。図面
を簡略にするために、制御ユニット20及びブロックの
間の接続は第2図に示されていない。
本発明に従う処理動作は概略的に次のように分けられる
(A)文書のイメージの走査及び記憶。
(B)テーブル・メモリ25に第1リストを作成するた
めの文字イメージの切出し、及びこれの位置の検出。
(C)文書の傾き角度の検出。
(D)テーブル・メモリ25の第1リストの内容の配列
を変えてテーブル・メモリ30に第2リストを作成。
(E)第2リストの内容により指定される文字イメージ
の認識。
上記(A)乃至(E)について次に詳述する。
−(−A−Σ−匁井Φ/−ん−−21と走査−及L1回
憶イメージ・バッファ23は、文書1の一部分例えば傾
いた文書の3文字行分を記憶する小さな記憶容量23A
を有するものと仮定する。
制御ユニット20は、操作者により走査装置21の開始
スイッチの押し下げ、又は後述する工程(E)の処理の
終了に応答してイメージ・バッファ23の記憶動作を開
始する。第1A図に示されているのは文書1の開始部で
あるので、開始スイッチの押し下げlこより制御ユニッ
ト20は動作を開始する。制御ユニット20は走査装置
21、閾値回路22及びイメージ・バッファ23を制御
し。
走査動作を開始し、走査装置21からの電気的信号を閾
値回路22に送り、そして閾値回路22からのイメージ
・データをイメージ・バッファ23に記憶する。制御ユ
ニット20は、走査及び記憶動作をモニタし゛、そして
イメージ・バッファ23がイメージ・データで満たされ
た時に上記動作を停止し、そして次の動作(B)を開始
する。これらの動作は第3図のブロック301及び30
2として示されている。
B テーブル25に 1リストを作成するため制御ユニ
ット20は、文字位置検出装置24を付勢する。これは
、イメージ・バッファ23をアクセスして上部から下部
に向う順番で水平ビット線のデータを逐次的に取出す。
この動作の目的は、(i)各文字イメージを囲む矩形を
発生することにより各文字イメージを切出すこと即ち走
査された文書のイメージを各文字の個別イメージに分け
ること、(…)イメージ・バッファ23のXY座標にお
ける各矩形の位置を検出すること、並びに(iii)各
矩形の位置を表わすデータをテーブル25(第2図)に
記憶して第1リストを作成することである。この動作C
B)は第3図でブロック303として示されている。上
記(i)、(ii)及び(iii)の動作の詳細な説明
は次の通りである。
(i)文字位置検出装置24によって、イメージ・バッ
ファ23の水平データ・ビット線が上部から下部に向っ
て逐次取出される1文字位置検出装置24は各ビット線
におけるビット1即ち黒画素の存在を調べ、黒画素のパ
ターンの外側エツジに接する矩形を発生し、そしてXY
座標における矩形の位置を計算する0文字1は、予期さ
れる文字及び記号の寸法よりも小さく若しくは大きい写
真、こすれた黒い痕跡、長い線等を含むことがある6文
字位置検出装置24は、これ等を検出して、そして無視
する。第1A図及び第4図を参照して詳細に説明すると
、走査線2は、イメージ・バッファ23のデータ・ビッ
ト線に対応する。ビット線2Aが文字位置検出装置24
に送られると、これは文字Aの上部の黒画素を検出する
。連続するビット線グループ41が文字位置検出装置2
4に送られるにつれて、この装置は矩形42を発生する
。文字位置検出装置24は、供給されるビット線におけ
る黒画連部ちイメージの連続性を調べ、そして連続性を
検出したならば矩形を成長させる。
第4図を参照するに、43及び44により示されるよう
にビット線グループ45及び46における黒画素の連続
性の存在に基づき矩形は次第に成長される。ビット線2
Gはビット線グループ46の最後のビット線である0文
字位置検出装置24は、ビット線2C+1即ちビット線
2Cの次のビット線を調べることによりY方向における
黒画素の連続性の欠如を検出する。同様に、文字位置検
出装@24はX方向における連続性の欠如を検出する。
次いで、文字位置検出装@24は、ビット線2Bにおい
てX方向における黒画素の終端を検出し、そして線2C
においてY方向における黒画速の終端を検出し、そして
矩形の成長を止めて固定し。
これにより文字Aの連続黒画素グループの外側エツジに
接する矩形44が発生される。
(ii)文字位置検出装置24が矩形44を完成すると
、これは第4図に示すように、この文字Aを囲む矩形4
4のXY座標における次の位置を計算する。
YTA・・・・イメージ・バッファ23のY軸における
文字Aの矩形の上のエツジの位置。
YBA・・・・イメージ・バッファ23のY軸における
文字Aの矩形の下のエツジの位置。
XLA・・・・イメージ・バッファ23のX軸における
文字Aの矩形の左エツジの位置。
XRA・・・・イメージ・バッファ23のX軸における
文字Aの矩形の右エツジの位置。
ここで第1番目の文字はX若しくはY軸を表わし、第2
番目の文字は上、下、左若しくは右のエツジを表わし、
そして第3番目の文字は、完成した矩形により囲まれる
文字を表わす。
ここで1文字位置検出装置24は、連続した黒画素グル
ープが文字Aを表わすか否かの識別は行なわないことに
注目されたい。文字位置検出装置24は、連続した黒画
素グループの夫々に接する矩形並びにこれの位置及び寸
法を検出するだけである。
次に、文字位置検出装置24は、矩形のX及びY方向の
寸法が、認識されるべき文字及び記号の予期される寸法
に対して設定された範囲内に入るか否かを調べる。前述
の如く、これの目的は文字及び記号の寸法以外の寸法の
黒点、長い線、写真等を無視することである6文字位置
検出装置24が上記寸法以外の矩形を見い出した時には
、この装@24は、この矩形の位置データを次の工程(
iii)で記憶することなく無視する。
(iii)文字位置検出装@24は、下記表1に示すよ
うな第1リストを作成するために位置データYTA、Y
BA、XLA及びXRAをテーブル・メモリ25のアド
レス2のエントリイに記憶する。
エントリイ・アドレス1は、テーブル・アクセスが開始
する時の初期エントリイである。文字位置検出装置24
は、エントリイ1のポインタにアドレス2を記憶する。
このポインタのアドレス2は次にアクセスされるべきエ
ントリイが2であることを示す。エントリイ2のポイン
タOはこのエントリイ2が最後のエントリイであること
を表わす。そしてテーブル・アクセス動作は終了する。
同様にして文字位置検出装@24は、第1A図に示すよ
うに文字11 rI+を囲む矩形45を完成してそして
位置データYTr、YBr、XLr及びXRrを計算す
る。矩形45の下エツジはビット線2D上にある。文字
位置検出装置24は、位置データYTr、YBr、XL
r及びXRrを表2に示すようにエントリイ3に記憶し
、そしてXLrをXLAに比較して、どちらの矩形が値
x=Oに近いかを調べる。この場合には、文字“A”の
矩形が文字1(rI+の矩形の左側にあるので、文字位
置検出装置24はエントリイ2のポインタとしてアドレ
ス3を記憶する。
文字“A”、“r”′B”及び“C”が処理され終えた
時のテーブル・メモリ25内の第1リストの内容は次の
通りである。
表3=第1リスト 処理が進むにつれ、エントリイのポインタが、II C
II、II B Hl”A”及び”r”の順番で即ち文
書1の左から右へ向う方向で位置データをアクセスする
ように変えられることに注目されたい。
即ち、テーブル・エントリイ1はポインタ5を記憶し、
これはエントリイ5をアクセスする。そしてここには文
字“CIIの矩形の位置データ及びポインタ4が記憶さ
れているので次にエントリイ4をアドレスしそしてここ
には文字“B TJの矩形の位置データ及びポインタ2
が記憶されているので次にエントリイ2をアドレスし、
エントリイ2は文字“A”の矩形の位置データ及びポイ
ンタ3を記憶し、そして文字“r”の矩形のエントリイ
3をアドレスする。
文字位置検出装置24が新たな矩形を完成する毎に、こ
の装置24は、この新たな矩形のX軸の位置を既に第1
リストに記憶されている古い矩形のX軸の位置と比較し
、そしてこれら新たな矩形及び古い矩形のポインタを、
これら矩形に対するアクセス動作がX軸の方向の左端の
矩形から右端の矩形へ順序でなされるように修正できる
ことが明らかである。イメージ・バッファ23に記憶さ
れている全ての文字イメージが処理され終えた時のテー
ブル・メモリ25内の第1リストの内容を次の表4に示
す。
4: 1リスト テーブル・メモリ25の第1リストのポインタは、第1
リストへの初期アクセスはエントリイ・アドレス1へな
され、そして残りのエントリイは第1A図の下側部分に
示されている順序でアクセスされる。即ち、表4に示す
第1リストにおいて、複数個の矩形の位置データは、イ
メージ・バッファ23のXY座標のX軸の方向において
最も左の矩形から最も右の矩形へ向う順番で配列されて
いる。そして制御ユニット20は、動作CB)の終了を
検知しそして次の動作(C)を開始する。
(C文書の傾きの検 この動作においては文書1の1つの文字行に属する矩形
が取り出され、そしてXY座標における文書1の傾きが
検出される。
詳細な動作は次の通りである。
(i)制御ユニット20は傾き計算装置26(第2図)
を付勢する。傾き計算装置26はテーブル・メモリ25
の第1リスト(表4)の全てのエントリイをポインタが
示す順番でアクセスして、各矩形の位置データ即ち上下
左右のエツジの値を取出し、そしてX及びY軸方向にお
ける各矩形の寸法を計算する。そして傾き計算装置26
は全ての矩形の平均寸法を計算する。この動作は第3図
でブロック304として示されている。
(n)値き計算装置26は再び第1リスト(表4)をポ
インタが示す順序でアクセスして平均寸法から成る許容
範囲内にある第1番目の矩形を見い出す。第1番目の矩
形を見い出すと、傾き計算装置26はこの矩形の下エツ
ジ及び左エツジのデータ即ち左下角のデータをレジスタ
(図示せず)に記憶する。
説明中の例では、第1矩形は文字りの矩形である。そし
て傾き計算装置26は第1リストのアクセスを続け、第
1矩形の右側に位置され且つ次の条件(1)及び(2)
を満足し且つ上記許容範囲内にある第2番目の矩形を見
い出す。
Xf+X、≦Xs≦x f+ x、  −・−・(1)
yt−y1≦Ys≦Yf+Y、  ・−・・(2)これ
らの値は第5A図で示す位置及び距離を表わす。
Xf、Yf・・・・第1矩形51の左下角の位置。
Xs、Ys・・・・第2矩形52の左下角の位置。
xl・・・・Xfからの予定距離。
x2・・・・Xfからの予定距離。
Yl・・・・Yfからの予定距離。
値X1は、第1矩形が例えば“Q″のように幅の狭い文
字の矩形である場合に対応できるように実験的に選択さ
れる。値x2も、第2矩形が第1矩形からダブル・スペ
ースだけ離れている場合に対応できるように実験的に選
択される。同様に、値Y1及びY2も、文書1の最大傾
斜角度5°の場合に対応できる様に実験的に選択される
。値Y2の選択に当って他の考慮すべき点は、文字のベ
ース・ラインよりも下の延長部を有する例えばit P
l#の如き文字を排除することである。これの理由は、
文書1の傾きが下記に説明する如く、複数個の矩形の左
下角の位置に基づいて決定されるからである。
値X1、x2、Yl及びY2は、第5A、5B及び50
図に示す領域53を規定する。上述の条件(1)及び(
2)は第2矩形の左下角(Xs、Ys)が領域53内に
入るか否かを決定する。第5A図の第2矩形52は条件
(1)及び(2)を満足する。第5B図の第2矩形55
は条件(1)及び(2)を満足しない。第5C図の矩形
57は条件(1)を満足するが、条件(2)を満足しな
い。
傾き計算装置26が条件(1)及び(2)を満足する第
2矩形(第1A図の場合には文字tic″′の矩形)を
見い出すと、この第2矩形の左下角の位置データを前述
のレジスタ(図示せず)に記憶する。今やこの傾き検出
装置26のレジスタは第1及び第2矩形の左下角の位置
データを記憶していることに注目されたい。そして傾き
計算装置26は、第1リスト(表4)のアクセスをつづ
けて第2矩形の領域53内に左下角が入る第3矩形を見
い出す。第3矩形を見い出すと、傾き計算装置26は、
この第3矩形(説明中の例では文字“B”の矩形)の左
下角の位置データを上記レジスタに記憶する。このよう
にして、傾き計算装置26は、先行矩形の領域53内に
左下角が位置する一連の矩形を見い出し、そしてこれら
見い出された矩形の数が予定の数、例えば15に達した
か否かを調べる。この数15は、標準フォーマットの標
準英文レターは1文字行内に少なくとも15個の平均寸
法の文字を有するという仮定に基づいて選択された。他
の数を用いることも可能である。 文字りの矩形を第1
矩形として指定することにより開始した上記第1リスト
の第1サーチの終了時には、傾き計算装置26は、文字
り、C,B及びAの4つの矩形を見い出し終えている。
この数は15よりも小さいので、傾き計算装置26は上
記レジスタの値をリセットし、文字Cを第1矩形として
指定して第1リストの第2のサーチを開始する。しかし
ながら1文字C,B及びAの夫々の矩形を第1矩形とし
て指定してつづいて3回行なわれるサーチでは、領域5
3に入る即ち条件(1)及び(2)を満足する矩形を1
5個見い出すことはできない。傾き計算装置26は文字
Qを第1矩形として指定することにより第5番目のサー
チを開始する。ここで第1A図の文書1の文字Qで始ま
る第2文字行が図では7文字しか含まないように示され
ているが15個の平均的寸法の文字を含んでいると仮定
する。第5番目のサーチの終了時に、傾き計算装@26
は、15個の矩形が見い出されたことが判る。そして見
い出された15個の矩形の左下角を表わす位置データは
前記レジスタに記憶されている。傾き計算装置26はレ
ジスタ内のこれら位置データを取り出し、そしてこの分
野で周知の最小二乗法を用いることにより第2文字行の
傾き角度θを発生する。そして傾き計算装@26はこの
傾き角度θを文書1の傾き角度として後の処理で使用す
るために保持する。これらの動作は第3図でブロック3
05として示されている。
制御ユニットは動作(C)の終了を検出しそして次の動
作(D)を開始する。
第1リストの内容の再配列の目的は、第1リストに記憶
されている全ての矩形の中から1文字行に属する文字及
び記号の矩形を見い出して、これらの矩形の位置データ
を取出し、そしてこれらをテーブル・メモリ30に記憶
して第2リストを作成することである。次の詳細な説明
は、第1A図に示す文jv1の第1文字行に属する文字
り、C1B、Aの矩形の位置データをテーブル・メモリ
30に記憶して第2リストを作成する動作に関する。
詳細な説明は次の如くである。
(i)制御ユニット20は第2図の1行選択装置27を
付勢する。1行選択袋@27は傾き計算装置26から前
記傾き角度θの値を受けとり、これをレジスタ28に記
憶する。1行選択装置27は表4のテーブル・メモリ2
5内の第1リストをアクセスし、ポインタが示す順番に
即ち第1A図の下側部分に示す文字の順番に各矩形の下
エツジ及び左エツジの値を逐次取出す。第1リストから
最初に取出される値YBD及びXLDは、XY座標にお
ける文字りの矩形の左下角の位置を表わす。
1行選択袋@27は次の計算を行なう。
YB= (XLD  X tan θ) 十Y B D
・・−・(3)この値YBは、第6図に示す如く、傾き
角度θを補正するように文書上が時計方向に回転された
時のY軸方向における矩形の左下角の板想位置を表わす
。この板想位置YBは1行選択装置27のレジスタ27
に記憶される。次に、1行選択装置27は、文字Qの矩
形の位置データYBQ及びXLQを取り出しそしてこの
矩形に対する左下角に対する仮想位@YBを発生し、そ
して文字aの矩形に対する板想位置YBと文字りの矩形
に対する板想位置VBとを比較して、どちらの値が小さ
いかを調べる。この場合には、文字りの矩形に対する値
YBが選択されそしてレジスタ29の内容即ち文字りの
矩形に対する値YBは変更されない。
このようにして1行選択装置27は第1リスト(表4)
の全ての位置データを連続的にアクセスして各矩形毎に
板想位置YBを計算し、そしてレジスタ29内の古い値
BYに対して新たな値YBを比較し、そしてもしも新た
な値が古い値よりも小さければレジスタ29内の値を新
たな値に取替える。この結果、全ての矩形のうちで最も
小さい値YBがレジスタ29に記憶される。最小値YB
は、第6図に示す如く、文書1上で最も上の位置にある
第1文字行の矩形の値YBを表わす。この動作は第3図
でブロック306として示されている。
(…)1行選択装置27は、テーブル・メモリ25内の
第1リスト(表4)を、ポインタで指定される順序で即
ち第1A図の下側部分に示す順序で再びアクセスする。
1行選択袋@27は、文字りの矩形の位置データYBD
及びXLDを取出しそして上述の計算(3)を行なう。
そして、1行選択装置27は、この計算された値YBが
第6図に示すレンジ61に入るか否かを調べる。レンジ
61の下限は、基線よりも下に延長部を有する文字例え
ば小文字のp及びyの矩形を補えるように選択されてい
る。この場合、答はイエスであるので、即ち文字りは第
1文字行に属すると判断して、1行選択装置27は、文
字りの矩形の4つの位置データ即ちテーブル・メモリ2
5の第1リスト(表4)のエントリイアのYTD、YB
D、XLD及びXRDを取り出し、テーブル・メモリ3
0の第2リストのエントリイ1に記憶する。又、1行選
択装置27は、第1リストのエントリイ1のポインタ7
を文字りの矩形のエントリイアのポインタ13に取替え
、そしてこのエントリイアの内容を消去する。
このポインタの変′更は、消去されたエントリイアをス
キップして次の文字Qのエントリイを指すためである。
次に、1行選択装置27は、第1リストのエントリイ1
3の文字Qの矩形の4つの位置データを取出しそして上
述の計算及び比較を行なう。この比較は、文字aの矩形
に対して計算された値YBが第1文字行に対して設定さ
れたレンジ61に入らないことを示す。即ち文字Qが第
1文字行に属さないことを示す。1行選択装置は文字α
の矩形についてはこれ以上何も行なわず、そしてエント
リイ13のポインタにより指定されるエントリイ18を
アクセスし上記の計算及び比較を繰返す。
比較は、文字“t”の矩形の計算値YBがレンジ61に
入らないことを示し、従って1行選択装置27は、文字
“t 71の矩形の処理を終了して、エントリイ18の
ポインタ5により指定されるエントリイ5をアクセスす
る。エントリイ5は、第1文字行の文字Cの矩形の4つ
の位置データを記憶している。比較は文字Cの矩形の計
算値BYがレンジ61に入ることを示し、そして1行選
択装置27は、文字Cが第1文字行に属すると判断する
1行選択装置27は、文字Cの矩形の4つの位置データ
即ち第1リストのエントリイ5のYTClYBC,XL
C及びXRCを取出してテーブル・メモリ30の第2リ
ストのエントリイ2に記憶する。又、1行選択装置27
は、第1リストのエントリイ18のポインタ5をエント
リイ5のポインタ12に取替えそしてエントリイ5の内
容を消去する。これによりエントリイ5は後の動作でス
キップされ、文字“t”の矩形の後に文字“m ”の矩
形がつづく。このようにして1行選択装置27は、第1
リストの各矩形について上述の動作を繰り返し行なう。
第1リストの全エントリイについて上述の動作を終了し
た時点における変更後の第1リスト及び新しい第2リス
トの内容は次の表5及び表6に夫々示す通りである。
第2リストの作成及び第1リストの修正は第3図でブロ
ック307として示されている6制御ユニツト20は動
作(D)を終了しそして次の動作(E)を開始する。
一5=修正tの、1リスト 壱」−り剃ヱ」ジ(旦 各ニーえの一契庫− 第2リストに記憶されている位置データ即ち、YTD、
YBD、XLD、XRD、・・・・、YTA。
YBA、XLA、XRAは、イメージ・バッファ23内
に記憶されている文字イメージD、C,B、Aを夫々囲
む矩形の位置を示すことに注目された゛い。
制御ユニット20は、認識ユニット31を付勢すること
により動作(E)を開始する。認識ユニット31には、
この分野で周知の文字イメージを認識するための決定ツ
リーが設けられている。この決定ツリーについては詳述
しない。認識ユニット31は、テーブル・メモリ3oの
第2リストのエントリイ1をアクセスして1文字りを囲
む矩形の位置を表わす位置データYTD、YBD、XL
D及びXRDを取出す。そして認識ユニット31は、イ
メージ・バッファ23のうちこの矩形により囲まれてい
るイメージ・データを取出す。認識ユニット31は、決
定ツリーを用いて文字りのイメージを認識しそして結果
を出力バッファ32に記憶する。次に、認識ユニット3
1は、第2リストのエントリイ2の位置データYTC,
YBC1XLC及びXRCを取出しそして上述の動作を
行ないそして文字Cの認識結果を出力バッファ32゛に
記憶する。認識ユニット31は、第2リストに記憶され
ている全ての位置データが使用され終える迄上述の動作
を繰り返す。この動作は第3図でブロック308として
示されている。
制御ユニット20は動作(E)の終了を検出し、そして
出力バッファ32の内容を出力装置に供給する。第1A
図に示す文書1の第1文字行の4文字が認識され終えた
ことに注目されたい、制御ユニット20は、第1リスト
の文字の矩形のうちの最も高い上辺の位置即ち文字rの
矩形の上辺の位置を調べる。第1A図を参照するに、こ
の上辺はビット線2Bに位置づけられている。制御ユニ
ット20は、イメージ・バッファ23の一番上のビット
線とビット線2Bとの間の上側記憶領域が、次の文字イ
メージを記憶するのに利用できることが判る。制御ユニ
ット20は走査装置21を付勢して上記法の文書イメー
ジを上側記憶領域に記憶し、そしてこの上側記憶領域の
ビット線のアドレスを、最初に記憶された文字イメージ
の最後のビット線23Bに連続するように修正する。即
ち、上側記憶領域の一番上のビット線にはアドレス23
B+1が割当てられ、第2#fi目のビット線にはアド
レス23B+2が割当てられ、以下向じようになされ、
その結果イメージ・バッファ23内において最初に記憶
された文書イメージに対するこの新たに記憶された文書
イメージの連続性が保たれる。
イメージ・バッファ23が新たな文書イメージで満たさ
れると、制御ユニット20は動作(B)乃至(E)を行
なう。
動作(E)が終了した時、制御ユニット20は、文書1
の全文字が認識され終える迄上述の動作を繰返す。各文
字行の認識の終了時に、制御ユニット20は、例えばプ
リンタ、表示装置等の出力装置に出力バッファ32の内
容を供給し、これにより操作者は文書1の文字認識の結
果を得ることができる。
反時計方向に傾けられた文書1を用いて本発明を説明し
たが1本発明は時計方向に傾けられた文書の文字を認識
出来ることが明らかである。
実施例においては1文字及び記号の切出しは、ワードの
文字が左から右へ書かれている文書について説明された
。本発明は、第1リストのポインタを文字行の右側から
左端へ向う順序で配列し、そして第5A図の領域53を
矩形51の左側に配置することにより反対方向即ち、右
から左に向って書かれている文字及び記号を切出すこと
が可能である。
套Jゆ拗i− 3種類のフォント即ちCourier 10、Cour
ier 12及びPrestage elite 12
を用いそして文字行和瓦間がシングル・スペースの文書
を認識するために本発明を用いた実験は、時計若しくは
反時計方向に最大6″の角度だけ傾斜された文書の文字
が。
文字行の明確な分離を示して、即ち、第2文字行の文字
が第1及び第3文字行に現われることなく認識された。
【図面の簡単な説明】
第1A図は本発明に従って認識されイメージ・バッファ
23に記憶された傾いた文書のイメージを示す図、第1
B及び第1C図は文書の文字イメージを切出す従来技法
を示す図、第2図は本発明の方法を行なう回路構成のブ
ロック図、第3図は本発明の方法のフロー・チャート、
第4図は文字Aの外側境界に接する矩形の4つのエツジ
の位置の検出を示す図、第5A図、第5BLi!l及び
第5C図は先行する矩形の左下角からX及びY軸方向の
所定距離内に左下角が位置する矩形の検出を示す図、第
6図は矩形の板想位置の発生を示す図。 1・・・・文書、20・・・・制御ユニット、21・・
・・走査装置、22・・・・閾値回路、23・・・・イ
メージ・バッファ、24・・・・文字位置検出装置、2
5・・・・テーブル・メモリ、26・・・・傾き計算装
置、27・・・・1行選択装置、31・・・・認識ユニ
ット、32・・・・出力バッファ。 出願人  インターナショナル・ビジネス・マシーンズ
・コーポレーション 代理人  弁理士  岡  1) 次  生(外1名) 第1C図 第1B図 YXLA         XRA 第4図 第5A図

Claims (12)

    【特許請求の範囲】
  1. (1)文書のイメージをイメージ記憶手段に記憶し、上
    記イメージ記憶手段に記憶されている複数文字行の各文
    字イメージの外側境界に接する矩形の上記イメージ記憶
    手段のXY座標内の位置を検出して上記矩形の位置を表
    わす位置データを発生し、上記XY座標のX軸の方向の
    一端から他端に向う順序で複数個の上記矩形の位置デー
    タを配列したリストを作成し、 上記リスト内の上記位置データのY座標情報に基づいて
    1文字行のY座標レンジを検出し、上記Y座標レンジに
    入る矩形の位置データを用いて上記イメージ記憶手段か
    ら上記文字イメージを読出し認識することを特徴とする
    文書の文字を認識する方法。
  2. (2)文書のイメージを表わすイメージ・データをイメ
    ージ記憶手段に記憶し、 上記イメージ記憶手段に記憶されている複数文字行の各
    文字イメージ・データの外側境界に接する矩形の上記イ
    メージ記憶手段のXY座標の位置を検出し、上記矩形の
    位置を表わす位置データを発生し、 上記矩形の位置データを記憶して、上記複数個の上記矩
    形の位置データを、上記XY座標のX軸の方向の一端か
    ら他端に向う順序で配列した第1リストを形成し、 上記第1リストの矩形のうち1文字行に属する予定数の
    矩形を選択して該矩形の位置データを調べ、上記XY座
    標における上記文書の傾きを検出し、 上記第1リストの各矩形のY座標位置を上記傾きだけ補
    正した板想位置を発生し、第1文字行に属する矩形の位
    置データを上記第1リストから第2リストに移し、 上記第2リスト内の上記位置データにより指定される矩
    形により囲まれたイメージ・データを上記イメージ記憶
    手段から文字認識手段に供給する工程を含む、文書の文
    字を認識する方法。
  3. (3)上記矩形の位置を検出する工程は、上記イメージ
    記憶手段に記憶された上記文書の個別イメージの外側境
    界に接する複数個の矩形を発生する工程と、各矩形が、
    認識されるべき文字及び記号に対して予じめ設定された
    大きさの範囲に入るか否かを調べる工程を含むことを特
    徴とする特許請求の範囲第(2)項記載の文書の文字を
    認識する方法。
  4. (4)上記位置データは、上記XY座標における上記矩
    形の上辺、下辺、左辺及び右辺の位置を表わすことを特
    徴とする特許請求の範囲第(2)項記載の文書の文字を
    認識する方法。
  5. (5)上記位置データを調べる工程は、上記第1リスト
    を探索して、先行矩形の左下角からX及びY軸方向の予
    定距離内に存在する矩形を予定の数だけ検出する工程と
    、該検出された矩形の左下角の位置の計算を行ない上記
    文書の傾きを検出する工程とを含むことを特徴とする特
    許請求の範囲第(2)項記載の文書の文字を認識する方
    法。
  6. (6)上記仮想位置を発生する工程は、上記第1リスト
    の上記矩形の位置データを上記配列の順序で逐次的に読
    出す工程と、各矩形のY座標位置を上記傾きだけ補正し
    た仮想位置を発生する工程、上記文書上の一番高い位置
    にある仮想位置をレジスタに記憶する工程と、上記第1
    リストの上記矩形の位置データを再び逐次読出す工程と
    、該読出された矩形の仮想位置を発生する工程と、該発
    生された仮想位置が、上記レジスタ内の上記仮想位置か
    らの予定範囲内にあるか否かを調べる工程と、仮想位置
    が上記予定範囲内にある矩形の位置データを上記第1リ
    ストから上記第2リストに移す工程とを含むことを特徴
    とする特許請求の範囲第(2)項記載の文書の文字を認
    識する方法。
  7. (7)文書のイメージを記憶する記憶手段と、上記記憶
    手段に記憶されている複数の文字の夫々のイメージの外
    側境界に接する矩形の位置を検出してその位置データを
    発生する手段と、 上記位置データのX座標情報に基づいて上記矩形をX軸
    の方向の一端から他端に向けて順序づける手段と、 上記順序づけられた矩形のY座標情報に基づいて文字行
    に属する矩形を選択する手段と、 該矩形の位置データを用いて上記記憶手段から文字イメ
    ージを取出し該文字イメージを認識する手段とを備えた
    文字認識装置。
  8. (8)上記位置データを発生する手段は、各矩形が認識
    されるべき文字及び記号の大きさの範囲に入るか否かを
    調べ、上記大きさの範囲に入る矩形の位置データを発生
    することを特徴とする特許請求の範囲第(7)項記載の
    文字認識装置。
  9. (9)上記位置データは、上記イメージ記憶手段のXY
    座標における上記矩形の上辺、下辺、左辺及び右辺の位
    置を表わすことを特徴とする特許請求の範囲第(7)項
    記載の文字認識装置。
  10. (10)上記順序づける手段は、上記文字の複数文字行
    の矩形の位置データを上記XY座標のX軸の方向の一端
    から他端に向かう順序で配列して記憶する第1リストを
    記憶する第1テーブル・メモリを有することを特徴とす
    る特許請求の範囲第(7)項記載の文字認識装置。
  11. (11)上記矩形を選択する手段は、上記第1リストの
    上記矩形の位置データを上記配列の順序で逐次的に読出
    し、先行矩形の左下角からX及びY軸方向の予定距離内
    に左下角が存在する矩形を予定の数だけ検出し、該検出
    された矩形の左下角の位置に基づいて上記文書の傾きを
    検出し、上記第1リストの上記矩形の位置データを上記
    順序で再び読出して、各矩形のY座標位置を上記傾きだ
    け補正した仮想位置を発生し、上記文書上の一番高い位
    置にある仮想位置をレジスタに記憶し、上記第1リスト
    の上記矩形の位置データを上記順序で再び読出して各矩
    形のY座標位置を上記傾きだけ補正した仮想位置を発生
    し、該発生された仮想位置が上記レジスタ内の仮想位置
    からの予定範囲内にあるか否かを調べ、仮想位置が上記
    予定範囲内にある矩形の位置データを上記第1リストか
    ら第2リストに移すことを特徴とする特許請求の範囲第
    (7)項記載の文字認識装置。
  12. (12)上記認識手段は、上記第2リストの矩形の位置
    データを逐次的に読出し該矩形により囲まれたイメージ
    ・データを上記記憶手段から読出して認識することを特
    徴とする特許請求の範囲第(7)項記載の文字認識装置
JP62093435A 1987-04-17 1987-04-17 文書の文字を認識する方法及び装置 Pending JPS63268081A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP62093435A JPS63268081A (ja) 1987-04-17 1987-04-17 文書の文字を認識する方法及び装置
EP88105799A EP0287027B1 (en) 1987-04-17 1988-04-12 Method and apparatus for recognising characters printed on a document
DE88105799T DE3883578T2 (de) 1987-04-17 1988-04-12 Verfahren und Gerät zur Erkennung von gedruckten Zeichen auf einem Beleg.
US07/181,894 US4926490A (en) 1987-04-17 1988-04-15 Method and apparatus for recognizing characters on a document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62093435A JPS63268081A (ja) 1987-04-17 1987-04-17 文書の文字を認識する方法及び装置

Publications (1)

Publication Number Publication Date
JPS63268081A true JPS63268081A (ja) 1988-11-04

Family

ID=14082232

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62093435A Pending JPS63268081A (ja) 1987-04-17 1987-04-17 文書の文字を認識する方法及び装置

Country Status (4)

Country Link
US (1) US4926490A (ja)
EP (1) EP0287027B1 (ja)
JP (1) JPS63268081A (ja)
DE (1) DE3883578T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03250866A (ja) * 1989-12-12 1991-11-08 Sharp Corp 画像読取装置およびこの画像読取装置を用いるファクシミリ装置

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0816918B2 (ja) * 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法
JP2930612B2 (ja) * 1989-10-05 1999-08-03 株式会社リコー 画像形成装置
US5187753A (en) * 1989-12-08 1993-02-16 Xerox Corporation Method and apparatus for identification and correction of document skew
US5245676A (en) * 1989-12-21 1993-09-14 Xerox Corporation Determination of image skew angle from data including data in compressed form
EP0461817A3 (en) * 1990-06-15 1993-11-18 American Telephone & Telegraph Image segmenting apparatus and methods
US5172422A (en) * 1991-05-13 1992-12-15 Eastman Kodak Company Fast character segmentation of skewed text lines for optical character recognition
US5253305A (en) * 1991-06-25 1993-10-12 Industrial Technology Research Institute Character boundary identification method and system
US6373997B1 (en) 1991-07-30 2002-04-16 Xerox Corporation Coarse and fine skew measurement
US5267325A (en) * 1991-09-06 1993-11-30 Unisys Corporation Locating characters for character recognition
CA2077970C (en) * 1991-11-19 1999-02-23 Daniel P. Huttenlocher Optical word recognition by examination of word shape
US5276742A (en) * 1991-11-19 1994-01-04 Xerox Corporation Rapid detection of page orientation
CA2077969C (en) * 1991-11-19 1997-03-04 Daniel P. Huttenlocher Method of deriving wordshapes for subsequent comparison
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
US5321770A (en) * 1991-11-19 1994-06-14 Xerox Corporation Method for determining boundaries of words in text
US5452374A (en) * 1992-04-06 1995-09-19 Ricoh Corporation Skew detection and correction of a document image representation
US5568571A (en) * 1992-12-14 1996-10-22 University Microfilms, Inc. Image enhancement system
EP0635803A3 (en) * 1993-06-18 1995-06-07 Omron Tateisi Electronics Co Image processing method and apparatus.
US5818976A (en) * 1993-10-25 1998-10-06 Visioneer, Inc. Method and apparatus for document skew and size/shape detection
KR960006101B1 (ko) * 1993-11-11 1996-05-08 대우전자주식회사 광자기 디스크재생시스템의 광픽업장치
US5410611A (en) * 1993-12-17 1995-04-25 Xerox Corporation Method for identifying word bounding boxes in text
JP3445394B2 (ja) * 1993-12-17 2003-09-08 ゼロックス・コーポレーション 少なくとも二つのイメージセクションの比較方法
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
JP3602596B2 (ja) * 1995-02-22 2004-12-15 株式会社東芝 ドキュメントファイリング装置および方法
JP4114959B2 (ja) 1995-06-20 2008-07-09 キヤノン株式会社 画像処理方法及び装置
US5848186A (en) * 1995-08-11 1998-12-08 Canon Kabushiki Kaisha Feature extraction system for identifying text within a table image
US5638466A (en) * 1995-08-30 1997-06-10 Horizon Marketing Corporation Aka Wordwand Method and apparatus for deskewing images of symbols having a non-linear baseline
JP3006466B2 (ja) * 1995-09-28 2000-02-07 日本電気株式会社 文字入力装置
US6256412B1 (en) * 1996-03-04 2001-07-03 Ricoh Company, Ltd. Image recognition method and apparatus using image rotation information
US5835638A (en) * 1996-05-30 1998-11-10 Xerox Corporation Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
US6157738A (en) * 1996-06-17 2000-12-05 Canon Kabushiki Kaisha System for extracting attached text
US5912996A (en) * 1997-03-06 1999-06-15 Canon Kabushiki Kaisha Method of enhancing the signal-to-noise within the pixel image of a hand entered symbol
GB9711022D0 (en) 1997-05-28 1997-07-23 Rank Xerox Ltd Text/image selection from document images
JP3558493B2 (ja) * 1997-06-10 2004-08-25 富士通株式会社 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4170441B2 (ja) * 1997-11-28 2008-10-22 富士通株式会社 文書画像傾き検出装置および文書画像傾き検出プログラムの記憶媒体
US6298157B1 (en) * 1998-02-27 2001-10-02 Adobe Systems Incorporated Locating and aligning embedded images
TW457458B (en) * 1998-06-01 2001-10-01 Canon Kk Image processing method, device and storage medium therefor
US6449397B1 (en) * 1999-04-05 2002-09-10 Mustek Systems Inc. Image processing system for scanning a rectangular document
JP4610687B2 (ja) * 1999-11-15 2011-01-12 コニカミノルタホールディングス株式会社 原稿読み取り装置
US6687421B1 (en) * 2000-03-17 2004-02-03 International Business Machines Corporation Skew detection of text in a noisy digitized image
US6912325B2 (en) * 2000-05-17 2005-06-28 Eastman Kodak Company Real time electronic registration of scanned documents
US6999635B1 (en) * 2002-05-01 2006-02-14 Unisys Corporation Method of reducing background noise by tracking character skew
EP1413444B1 (en) * 2002-10-23 2007-05-30 Hewlett Packard Company, a Delaware Corporation Media skew compensation in printer device
TWI267800B (en) * 2003-06-13 2006-12-01 Lite On Technology Corp Automatic correction method of tilted image
US7508984B2 (en) * 2003-07-31 2009-03-24 Ricoh Company, Ltd. Language recognition method, system and software
JP4553241B2 (ja) * 2004-07-20 2010-09-29 株式会社リコー 文字方向識別装置、文書処理装置及びプログラム並びに記憶媒体
JP4607633B2 (ja) * 2005-03-17 2011-01-05 株式会社リコー 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
WO2007142227A1 (ja) * 2006-06-07 2007-12-13 Nec Corporation 画像方向判定装置、画像方向判定方法、および画像方向判定用プログラム
US20080225340A1 (en) * 2007-03-14 2008-09-18 Ricoh Company, Limited Image processing apparatus, image processing method, and computer program product
US8620080B2 (en) * 2008-09-26 2013-12-31 Sharp Laboratories Of America, Inc. Methods and systems for locating text in a digital image
US8175388B1 (en) 2009-01-30 2012-05-08 Adobe Systems Incorporated Recognizing text at multiple orientations
KR101621848B1 (ko) * 2009-12-14 2016-06-01 삼성전자주식회사 화상처리장치 및 방법
US8384917B2 (en) * 2010-02-15 2013-02-26 International Business Machines Corporation Font reproduction in electronic documents
US20130156288A1 (en) * 2011-12-19 2013-06-20 De La Rue North America Inc. Systems And Methods For Locating Characters On A Document
JP5874474B2 (ja) * 2012-03-21 2016-03-02 富士ゼロックス株式会社 画像情報登録システム、画像情報登録プログラム
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
JP7031465B2 (ja) * 2018-04-18 2022-03-08 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US11010423B2 (en) * 2018-08-20 2021-05-18 Accenture Global Solutions Limited Populating data fields in electronic documents
EP4242988A1 (en) * 2022-03-11 2023-09-13 Tata Consultancy Services Limited Method and system to detect a text from multimedia content captured at a scene

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58101373A (ja) * 1981-12-14 1983-06-16 Nippon Telegr & Teleph Corp <Ntt> 文字図形入力方法
JPS58146973A (ja) * 1982-02-25 1983-09-01 Ricoh Co Ltd 文字行および文字の切出し方法
JPS58169293A (ja) * 1982-03-31 1983-10-05 Toshiba Corp 文字切り出し方式
JPS6172374A (ja) * 1984-09-17 1986-04-14 Toshiba Corp 文字認識装置
JPS61193276A (ja) * 1985-02-20 1986-08-27 Fujitsu Ltd 文字列抽出方式

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4013999A (en) * 1974-08-15 1977-03-22 Recognition Equipment Incorporated Single read station acquisition for character recognition
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58101373A (ja) * 1981-12-14 1983-06-16 Nippon Telegr & Teleph Corp <Ntt> 文字図形入力方法
JPS58146973A (ja) * 1982-02-25 1983-09-01 Ricoh Co Ltd 文字行および文字の切出し方法
JPS58169293A (ja) * 1982-03-31 1983-10-05 Toshiba Corp 文字切り出し方式
JPS6172374A (ja) * 1984-09-17 1986-04-14 Toshiba Corp 文字認識装置
JPS61193276A (ja) * 1985-02-20 1986-08-27 Fujitsu Ltd 文字列抽出方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03250866A (ja) * 1989-12-12 1991-11-08 Sharp Corp 画像読取装置およびこの画像読取装置を用いるファクシミリ装置

Also Published As

Publication number Publication date
EP0287027A3 (en) 1991-07-10
EP0287027B1 (en) 1993-09-01
US4926490A (en) 1990-05-15
DE3883578T2 (de) 1994-04-21
DE3883578D1 (de) 1993-10-07
EP0287027A2 (en) 1988-10-19

Similar Documents

Publication Publication Date Title
JPS63268081A (ja) 文書の文字を認識する方法及び装置
EP0629078B1 (en) Apparatus for processing and reproducing image information
JP2930612B2 (ja) 画像形成装置
JP2536966B2 (ja) テキスト編集システム
US5528732A (en) Reprographic device for making copies with multi-spaced lines
US5003614A (en) Image processing system
US5129012A (en) Detecting line segments and predetermined patterns in an optically scanned document
JP3962891B2 (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
US5509092A (en) Method and apparatus for generating information on recognized characters
US5642473A (en) Paper saving reprographic device
US6163623A (en) Method and apparatus for recognizing images of documents and storing different types of information in different files
US5592574A (en) Method and apparatus for expansion of white space in document images on a digital scanning device
US5355421A (en) Method of noise detection and noise apparatus
US20010043742A1 (en) Communication document detector
JP2008108114A (ja) 文書処理装置および文書処理方法
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JPH11219409A (ja) 文書読取装置
EP0701226B1 (en) Method for segmenting handwritten lines of text in a scanned image
JP2976990B2 (ja) 文字認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH103517A (ja) 文書画像傾き角検出装置
JP2762476B2 (ja) 清書装置
KR20220005688A (ko) 인쇄된 문서의 디지털화 방법
JPH0432985A (ja) 文字認識装置