JP2003016385A - 画像処理装置、方法、プログラム、及び記憶媒体 - Google Patents
画像処理装置、方法、プログラム、及び記憶媒体Info
- Publication number
- JP2003016385A JP2003016385A JP2001200732A JP2001200732A JP2003016385A JP 2003016385 A JP2003016385 A JP 2003016385A JP 2001200732 A JP2001200732 A JP 2001200732A JP 2001200732 A JP2001200732 A JP 2001200732A JP 2003016385 A JP2003016385 A JP 2003016385A
- Authority
- JP
- Japan
- Prior art keywords
- ruled line
- image
- area
- pixel group
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/155—Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
合、記入された文字画像領域の抽出を誤る場合があっ
た。 【解決手段】 本発明は、抽出した画像領域において、
行罫線及び列罫線の少なくともいずれかに接触する所望
の画素群に対してラベリングを行なうことによって、該
画素群が罫線の一部を構成する画素であるか識別して、
前記画像領域から、該罫線の一部を構成する画素を除去
する。
Description
表に記入された文字画像を切り出すための画像処理装
置、方法、プログラム、及び記憶媒体に関するものであ
る。
字の読み取りを行う場合、ドロップアウトカラーで作成
された帳票を使用し、このドロップアウトカラーと異な
る色で記入された文字を読み取って認識するように構成
されていることが多いが、ドロップアウトカラー帳票
は、読取装置の光源の条件に適合する色を用いて印刷し
配布するため、コストがかかり利便性も悪い。
を用いた方がコストも利便性もよいが、非ドロップアウ
トカラー帳票では、色を用いて文字と枠線とを区別する
ことはできないため、非ドロップアウトカラー帳票を認
識する方法として以下のような方法が考えられている。
置や大きさを帳票定義として記憶しておき、読み取ろう
とする入力帳票と帳票定義の位置ずれを修正した後、入
力帳票と帳票定義を重ねあわせて差分を読み取ることに
より、記入文字を抽出する方法があった。しかし、この
方法では、あらかじめ帳票定義を記憶しておく必要があ
るため、記憶されている帳票定義以外の帳票が入力され
た場合、対応できないという問題点がある。そこで、あ
らかじめ帳票定義を記憶しておかなくても、画像から文
字記入枠と該文字記入枠内の文字を認識する技術が考え
られている。
縦・横に一定長さ以上連続する黒ランを罫線として抽出
する。その際、枠の角に丸みのある場合など黒ランが一
定長さ以上連続しないため、縦罫線と横罫線とが途切れ
てしまう場合があるが、その際はその縦罫線と横罫線が
交差するまで仮想的に延長し、その延長部分が閾値以下
なら双方が接続しているとみなして、矩形枠として認識
するように構成されている。しかしながら、この場合、
枠の認識時には直線矩形として扱っているので、枠内の
文字を抽出する際に角の丸み部分が文字として切り出さ
れて誤認識される場合がある。
が所定値以上の縦・横方向のランを罫線とし、端点が近
い縦罫線と横罫線のペアの交差点に、あらかじめ用意さ
れた角部パターンをマッチングさせ、類似度が大きけれ
ば角部がそのパターンであるとするように構成されてい
る。この場合、あらかじめ多数の角部パターンを記憶し
ておく必要があり、多くのメモリを必要としてしまう。
また、これ以外の角部であった場合、認識できない。
抽出した罫線の端点から斜め成分を検出することにより
丸角候補領域を抽出し、更に、端点間の斜め方向の画素
密度分布を識別して丸角部を決定、もしくは、n次関数
を用いて罫線の端点を結ぶパターンを生成してマッチン
グを行なうことにより、丸角部を決定するように構成さ
れている。しかしながら画素密度分布を用いて丸角部を
識別する方法では、角部にかすれがあるときなどの画素
密度の分布の変化が少ない場合、丸角部と認識されない
場合がある。また、丸角部パターンを生成してマッチン
グを行なう方法では、あらかじめ多数の丸角部パターン
を記憶しておく必要はないが、n次関数を用いてパター
ンを生成する処理およびマッチング処理を行なう必要が
あるので、処理に時間がかかってしまう。
記従来例では、多くのメモリを消費したり、マッチング
などの時間のかかる処理を行なう必要があったり、認識
精度が悪かったり、罫線の丸み部分が文字として切り出
されて誤認識されてしまうというような問題点があっ
た。
れたもので、文字記入枠の角が丸い場合でも、枠内の文
字を正しく抽出することを目的とする。
に、本発明の画像処理装置は、文書画像から行方向の罫
線を抽出する行方向罫線抽出手段と、前記文書画像から
列方向の罫線を抽出する列方向罫線抽出手段と、前記行
方向罫線抽出手段によって抽出された行方向罫線と前記
列方向罫線抽出手段により抽出された列方向罫線とで囲
まれた領域に基づいて画像領域を抽出する画像領域抽出
手段と、前記画像領域抽出手段で抽出された画像領域に
おいて、前記行方向罫線および前記列方向罫線の少なく
ともいずれかに接触する所望の画素群に対してラベリン
グを行なうことによって、該画素群が罫線の一部を構成
する画素であるか識別して、前記画像領域から、該罫線
の一部を構成する画素を除去する除去手段とを備えるこ
とを特徴とする。
の画像処理方法は、文書画像から行方向の罫線を抽出す
る行方向罫線抽出ステップと、前記文書画像から列方向
の罫線を抽出する列方向罫線抽出ステップと、前記行方
向罫線抽出ステップで抽出された行方向罫線と前記列方
向罫線抽出ステップで抽出された列方向罫線とで囲まれ
た領域に基づいて画像領域を抽出する画像領域抽出ステ
ップと、前記画像領域抽出ステップで抽出された画像領
域において、前記行方向罫線および前記列方向罫線の少
なくともいずれかに接触する所望の画素群に対してラベ
リングを行なうことによって、該画素群が罫線の一部を
構成する画素であるか識別して、前記画像領域から、該
罫線の一部を構成する画素を除去する除去ステップとを
備えることを特徴とする。
形態を実施するための帳票画像から文字を読み取る画像
処理装置の構成を示すブロック図である。101はRO
M102に格納されている制御プログラムに従って本装
置全体の制御を行うCPU、102はCPU101が実
行する後述するフローチャートに示す処理など本装置の
制御プログラム等を格納するROM、103は文書画像
等を記憶し、CPU101のワークエリアとなるRA
M、104は磁気ディスク等の外部記憶装置であり、1
05はディスプレイ、106はキーボード、107はマ
ウス等のポインティングデバイス、108は画像を読み
取るためのイメージスキャナである。また、109はネ
ットワークインターフェースであり、図示しない遠隔地
に存在する装置と通信し、プログラムやデータなどを読
み込んだり、書き込んだりする。なお、本実施形態を実
現させるためにCPU101は、制御プログラムを、前
述したようにROM102から読み込んで実行するよう
にしてもよいし、外部記憶装置104から読み込んで実
行するようにしてもよいし、ネットワークを介して接続
された外部装置から受け取って実行するようにしてもよ
い。
本実施形態1を、図2乃至図7を用いて詳細に説明す
る。
とに文字記入枠が設定されているような帳票を対象とす
る。なお、本実施形態では簡単のため、読み取った画像
を2値化した帳票画像を対象として扱う。
れた文字を切り出す手順を示すフローチャートである。
108等の光電変換装置から読み込まれ二値化された画
像(以下「二値画像」)、あるいは、すでに読み込まれ
外部記憶装置104等に記憶している二値画像から、横
方向の罫線(以下「横罫線」)の位置を検出する。
方向の座標値と罫線の太さを表すために、一つの横罫線
に対し、横罫線の上端の垂直方向座標値と下端の垂直方
向座標値とで表現する。
ら横罫線の位置を検出する場合、簡単に検出する手順の
例をあげると、垂直な射影面に対して黒画素の水平方向
ヒストグラムを取り、ピークの度数があらかじめ決めて
ある閾値以上存在する部分のピークの立ち上がり、立下
り位置を横罫線の位置とする。なお、検出精度を高める
ため、あらかじめ傾き除去やかすれの補完、記入枠の外
接矩形を抽出することで処理領域を決めるようにしても
よい。その場合、閾値は外接矩形の幅の2分の1などと
すればよい。また、横罫線の位置の検出は、本件出願人
による出願である特願2000−380612号に記載
されているような技術を使用してもよい。
できたかどうか判断する。横罫線が2本以上抽出できな
かった場合は、文字記入枠が存在しないとして処理を終
了する。
できた場合は、ステップS203に進んで、2つの横罫
線の間、すなわち上の横罫線の下側の座標と下の横罫線
の上側の座標の間に存在する縦罫線の位置を検出する。
つの横罫線の間に存在する黒画素の垂直方向ヒストグラ
ムを取り、ピークの度数が閾値以上の部分を縦罫線とし
て識別する。この場合の閾値は、横罫線の間の80%以
上などとすればよい。なお、縦罫線の位置の検出におい
ても特願2000−380612号に記載されているよ
うな技術を使用してもよい。
できたか否かを判断し、2本以上抽出できなかった場合
には、文字記入枠が存在しないとして処理を終了する。
テップS205にて、抽出した横罫線と縦罫線で囲まれ
た内側の矩形領域部分を文字記入枠領域として抽出す
る。図5は図4を上記ステップを用いて文字記入枠領域
を抽出した結果である。この時点では、「1」が縦罫線
と認識されているため、504と505は文字記入枠領
域が二分割された形となっている。
206で文字記入枠の標準ピッチを求める。標準ピッチ
は、各文字記入枠のピッチの分布などから決定する。す
なわち、処理を行う範囲内の文字記入枠のピッチは、す
べて均等であるという前提のもと、文字記入枠の各ピッ
チの分布をカウントし、個数が最大となる文字記入枠の
ピッチを標準ピッチとする。
で、誤って分割された領域であると判断される場合、ス
テップS207で標準ピッチになるように結合してい
く。その結果、図5の504と505は結合され、文字
記入枠と一致した領域が得られる。
外接矩形を用いて画像を抽出する。ここでは、孤立点ノ
イズや、罫線に接触したノイズ等の影響を取り除くた
め、公知のノイズ除去を行ってもよい。また抽出された
画像があらかじめ定めた大きさより小さい場合、その画
像はノイズと判断し、画像が存在しないとしてもよい。
あるかどうか判断し、ないと判断されれば、ステップS
213でその文字記入枠を空欄とする。
あると判断されれば、ステップS210に進み、抽出さ
れた画像に罫線の一部を含んでいるかどうか判断を行な
い、罫線の一部を含んでいると判断した場合、その部分
を除去する。
示す。ステップS207で求められた罫線内部矩形領域
508を例にすると、まず、罫線内部矩形領域508に
基づいて図4から矩形の画像を切り出し、更に、その切
り出した矩形領域内部の黒画素に外接する外接矩形を図
6(a)の破線部分601で表している。罫線内部矩形
領域508に基づいて、枠内の画像を抽出しようとする
と、罫線の一部である丸み部分を含んでしまう。その結
果、図6(b)に示すように罫線の一部である602、
603が残ってしまい、この図6(b)に対して、その
まま文字認識を行うと誤認識してしまうことになる。
た場合の除去(ステップS210)について、右上の角
が丸い場合を例にして、図3のフローチャートを使用し
て詳細に説明する。ここでは、あらかじめステップS2
07で求められた罫線内部矩形領域508の座標と、ス
テップS208で罫線内部矩形領域508に基づき求め
られた黒画素の外接矩形601の座標が記憶されている
前提で説明を行う。また、座標は帳票画像の左上を原点
とし、X座標は左から右、Y座標は上から下に値が大き
くなるものとする。
8について、上端のY座標をT、右端のX座標をR、領
域の高さをH、幅をWとする。ステップS302では、
抽出された黒画素の外接矩形601の上端のY座標を
t、右端のX座標をrとする。
08の右端のX座標Rと黒画素外接矩形601の右端の
X座標rが同じかどうか判断する。同じであると判断し
た場合、ステップS304に進み、罫線内部矩形領域5
08の上端から高さの1/6下がった所より、黒画素外
接矩形601の上端が上にあるかどうか判断する。上に
あればステップS307に進み、なければ処理を終了す
る。なお、ここで使用した1/6という値、及び、以下
で説明する各閾値は、本発明を説明するための一例であ
り、これらの値に限ったものではない。
断されれば、ステップS305に進み、罫線内部矩形領
域508の上端のY座標Tと、黒画素外接矩形601の
上端のY座標tが同じかを判断し、同じでなければ処理
を終了する。同じであると判断されればステップS30
6に進み、罫線内部矩形領域508の右端から幅の1/
6左側より、黒画素外接矩形601の右端が右にあるか
を調べる。右にあればステップS307に進み、なけれ
ば処理を終了する。
508の右半分の領域範囲で該領域の上端に接する黒画
素をラベリングし、同一ラベルがつけられた黒画素の最
も下端の黒画素が、罫線内部矩形領域の上半分の領域内
にあるもの(高さの1/2よりも上にあるもの)を取り
出す。
508の上半分の領域範囲で、該領域範囲の右端に接す
る黒画素をラベリングし、同一ラベルがつけられた黒画
素の最も左端の黒画素が、罫線内部矩形領域の右半分の
領域内にあるもの(幅の1/2よりも右にあるもの)を
取り出す。
された画像の外接矩形を求める。図7を例に説明する
と、(a)は原画像であり、(b)はラベリング後の画
像である。ラベリング処理によりラベル1とラベル2の
2つの塊を取り出した。求める外接矩形は2つの塊を含
む矩形である。
左上と右下を通る直線を求め、ステップS311で、ラ
ベリングされたそれぞれの画素が、直線の左右にいくつ
あるかを数える。罫線の一部であれば、画素の大部分は
直線の右側に存在するはずなので、左右の画素数の比較
により罫線の一部かどうかを判断できる。
より右側の画素数が少なければ処理を終了し、多ければ
ステップS313に進み、外接矩形601からラベリン
グされた画素を除去する。図7の例では、ラベル1、ラ
ベル2とも直線の左側に画素がないので、これら2つの
ラベルの画素は除去される。
を行なうことにより、罫線の一部を含んで画像が抽出さ
れても、罫線部分だけを除去することが可能である。
像に対して文字認識処理を行なう。罫線部分を含まない
ため、帳票に記入された文字を正確に文字認識すること
ができる。
線内部領域の境界に接している黒画素を対象にラベリン
グし、それぞれに対し判断基準を適用して除去するの
で、丸み部分で罫線が切れても罫線部分を除去できる。
ングされた画素の座標から導き出すので、角の丸みの大
きさが変化したり、丸みが楕円弧状に変形しても、罫線
を含まないように文字記入枠から文字画像を抽出でき
る。
がないのでメモリを節約することができる。また、複数
の角部のパターンとマッチング処理を行なう必要がな
く、処理時間を短縮することができる。
り装置が実行する他の実施形態として、ステップS21
0における、角に文字の一部が重なっている場合の角の
罫線部分を除去する説明を図8のフローチャート及び図
9を用いて説明する。
字記入枠の一例を示しているものである。右上の角が丸
くなっていて、そこに文字の一部がはみ出て記入されて
いる。
にして説明する。
部矩形領域の上端のY座標をT、右端のX座標をR、高
さをH、幅をWとして設定する。ステップS802で
は、抽出された黒画素の外接矩形の上端のY座標をt、
右端のX座標をrとする。
右端Rと黒画素の外接矩形の右端rの座標が同じかどう
か判断する。同じであると判断した場合、ステップS8
04で罫線内部矩形領域の上端から高さの1/6下がっ
た所より、黒画素外接矩形の上端が上にあるかどうか判
断する。上にあればステップS807に進み、なければ
処理を終了する。なお、ここで使用した1/6という
値、及び、以下で説明する各閾値は、本発明を説明する
ための一例であり、これらの値に限ったものではない。
た場合、ステップS805に進み、罫線内部矩形領域の
上端Tと黒画素外接矩形の上端の座標が同じかどうか判
断し、同じでなければ処理を終了する。同じである場
合、ステップS806で罫線内部矩形領域の右端から幅
の1/6左側より、黒画素外接矩形の右端が右にあるか
どうか判断を行なう。右にあると判断すればステップS
807に進み、なければ処理を終了する。
半分の領域範囲で罫線内部矩形領域の上端をスキャン
し、最も左にある黒画素の位置を求める(901)。S
808で罫線内部矩形領域の上半分の領域範囲で罫線内
部矩形領域の右端をスキャンし、最も下にある黒画素の
位置を求める(902)。
線(破線904)より右上にある画素だけを対象にラベ
リングする。
素のうち、罫線内部矩形領域の上端に接し、最も右側に
ある画素を含むラベルを選択する。
素のうち、罫線内部矩形領域の右端に接し、最も上側に
ある画素を含むラベルを選択する。なお、罫線にかすれ
等がなければ、通常、S810で選択されたラベルとS
811で選択されたラベルは同一になる。
が複数ある場合、S812において、それらが接近して
いるかどうか判断する。接近していなければ、角の部分
の罫線画像ではないとし、処理を終了する。接近してい
るかどうかの判断は、各ラベリングされた黒画素画像の
外接矩形が重なるかどうか、もしくは外接矩形間の距離
が所定の画素(例えば1画素)以内にあるかどうかを調
べることによって判断する。
線内部領域上端に接し、最も左側にある画素の位置を求
める(901)。
線内部領域右端に接し、最も下側にある画素の位置を求
める(903)。
罫線に接触していなければ、S813で求めた画素の位
置はS807で求めた画素の位置と、S814の画素の
位置はS808で求めた画素の位置と同一となる。この
段階で、抽出画像に含まれる角の丸み部分の開始位置が
得られる。
814で得られた位置を(R,Y)とすると、S815
で、(X,T)と(R,Y)を結ぶ直線(破線905)
によって、前記ラベリングされて選択された画像が分割
されるかを調べる。罫線と交差する文字がなければ画像
は分割されない。分割された場合、S816に進み、分
割点(906)からラベリングされている画素の輪郭を
(R,T)方向に輪郭線追跡し、輪郭の方向が大きく変
化する点(907、908)を探す。罫線と交差する線
の幅が2画素以上なら、輪郭上にある画素は2つ存在
し、それぞれについて追跡する。幅が1画素なら、輪郭
上にある画素の上側の輪郭と下側の輪郭を追跡する。
07、908)が求められ、S817で2点間を結ぶ直
線でラベリングされた画像を分割し、その右上側にある
画像をラベリング画像として残す。
線の一部であると判断し、S818で除去する。
下についても、同様な処理で、罫線部分を除去する。そ
うすることにより、罫線部分を除去した文字画像を抽出
することができる。
象とする画像の領域を制限してラベリングし、そこから
更に罫線の丸み部分の場所を特定しているので、文字の
一部が丸み部分を貫いている場合でも罫線部分のみを除
去し、枠内の文字は残すことができる。
数の機器(例えばホストコンピュータ、インタフェイス
機器、リーダ、プリンタなど)から構成されるシステム
に適用しても、一つの機器からなる装置(例えば、複写
機、ファクシミリ装置など)に適用してもよい。
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納された
プログラムコードを読み出し実行することによっても、
達成されることは言うまでもない。この場合、記憶媒体
から読み出されたプログラムコード自体が前述した実施
形態の機能を実現することになり、そのプログラムコー
ドを記憶した記憶媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実
行することにより、前述した実施形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼働しているオペレーティングシステ
ム(OS)などが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることは言うまでもない。
を、ネットワークで接続された外部装置から必要に応じ
て読み込み、CPUにて実行するように構成してもよ
い。
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードが格納されることになる。この記憶
媒体の一例を図10に示す。図10は、本発明に係る帳
票読み取り装置で読みだし可能な各種データ処理プログ
ラムを格納する記憶媒体のメモリマップの例を示す図で
ある。なお、特に図示しないが、各種プログラムで用い
るデータも該記憶媒体のディレクトリに管理されてい
る。また、各種プログラムをコンピュータにインストー
ルするためのプログラム等が記憶される場合もある。
角が丸い罫線で構成された文字記入枠であっても、罫線
の一部を文字として抽出することがなくなり、文字記入
枠内の文字を正しく抽出できる。また、記入された文字
を正しく抽出できるので、文字認識率も向上する。
でいるかどうかを自動的に判断し、枠線の一部を含む場
合は、該一部を除去するので、あらかじめ枠の形状を指
定する必要もなくなる。
ク図である。
すフローチャートである。
例を示すフローチャートである。
図である。
処理を説明する図である。
の一部を含んでいる一例を説明する図である。
た結果を説明する図である。
例を示すフローチャートである。
の一例を説明する図である。
能な各種データ処理プログラムを格納する記憶媒体のメ
モリマップを説明する図である。
Claims (12)
- 【請求項1】 文書画像から行方向の罫線を抽出する行
方向罫線抽出手段と、 前記文書画像から列方向の罫線を抽出する列方向罫線抽
出手段と、 前記行方向罫線抽出手段によって抽出された行方向罫線
と前記列方向罫線抽出手段により抽出された列方向罫線
とで囲まれた領域に基づいて画像領域を抽出する画像領
域抽出手段と、 前記画像領域抽出手段で抽出された画像領域において、
前記行方向罫線および前記列方向罫線の少なくともいず
れかに接触する所望の画素群に対してラベリングを行な
うことによって、該画素群が罫線の一部を構成する画素
であるか識別して、前記画像領域から、該罫線の一部を
構成する画素を除去する除去手段とを備えることを特徴
とする画像処理装置。 - 【請求項2】 前記除去手段は、前記ラベリングされた
画素群に基づいて境界を設定し、前記ラベリングされた
画素群の前記境界の内外における画素数をそれぞれ計測
し、その計測結果にしたがって、前記ラベリングされた
画素群が前記罫線の一部を構成する画素であるか識別し
て、前記画像領域から、該罫線の一部を構成する画素を
除去することを特徴とする請求項1に記載の画像処理装
置。 - 【請求項3】 前記除去手段は、前記ラベリングされた
画素群に基づいて境界を設定し、該境界と前記ラベリン
グされた画素群とが交差する位置を識別し、該交差位置
から輪郭線追跡を行なって、該輪郭線追跡の結果に基づ
いて、前記ラベリングされた画素群の中から前記罫線の
一部を構成する画素を識別して、前記画像領域から、該
罫線の一部を構成する画素を除去することを特徴とする
請求項1に記載の画像処理装置。 - 【請求項4】 前記ラベリングは、前記画像領域のうち
の所定の領域内の画素に対してのみ行なうことを特徴と
する請求項1乃至3のいずれかに記載の画像処理装置。 - 【請求項5】 前記除去手段で該罫線の一部を構成する
画素を除去された前記画像領域の画像を文字認識する文
字認識手段を更に備えることを特徴とする請求項1乃至
4のいずれかに記載の画像処理装置。 - 【請求項6】 文書画像から行方向の罫線を抽出する行
方向罫線抽出ステップと、 前記文書画像から列方向の罫線を抽出する列方向罫線抽
出ステップと、 前記行方向罫線抽出ステップで抽出された行方向罫線と
前記列方向罫線抽出ステップで抽出された列方向罫線と
で囲まれた領域に基づいて画像領域を抽出する画像領域
抽出ステップと、 前記画像領域抽出ステップで抽出された画像領域におい
て、前記行方向罫線および前記列方向罫線の少なくとも
いずれかに接触する所望の画素群に対してラベリングを
行なうことによって、該画素群が罫線の一部を構成する
画素であるか識別して、前記画像領域から、該罫線の一
部を構成する画素を除去する除去ステップとを備えるこ
とを特徴とする画像処理方法。 - 【請求項7】 前記除去ステップでは、前記ラベリング
された画素群に基づいて境界を設定し、前記ラベリング
された画素群の前記境界の内外における画素数をそれぞ
れ計測し、その計測結果にしたがって、前記ラベリング
された画素群が前記罫線の一部を構成する画素であるか
識別して、前記画像領域から、該罫線の一部を構成する
画素を除去することを特徴とする請求項6に記載の画像
処理方法。 - 【請求項8】 前記除去ステップでは、前記ラベリング
された画素群に基づいて境界を設定し、該境界と前記ラ
ベリングされた画素群とが交差する位置を識別し、該交
差位置から輪郭線追跡を行なって、該輪郭線追跡の結果
に基づいて、前記ラベリングされた画素群の中から前記
罫線の一部を構成する画素を識別して、前記画像領域か
ら、該罫線の一部を構成する画素を除去することを特徴
とする請求項6に記載の画像処理方法。 - 【請求項9】 前記ラベリングは、前記画像領域のうち
の所定の領域内の画素に対してのみ行なうことを特徴と
する請求項6乃至8のいずれかに記載の画像処理方法。 - 【請求項10】 前記除去ステップで該罫線の一部を構
成する画素を除去された前記画像領域の画像を文字認識
する文字認識ステップを更に備えることを特徴とする請
求項6乃至9のいずれかに記載の画像処理方法。 - 【請求項11】 請求項6乃至10のいずれかに記載の
画像処理方法をコンピュータに実現させるための画像処
理プログラム。 - 【請求項12】 請求項6乃至10のいずれかに記載の
画像処理方法をコンピュータに実現させるための画像処
理プログラムを格納した記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001200732A JP4078045B2 (ja) | 2001-07-02 | 2001-07-02 | 画像処理装置、方法、プログラム、及び記憶媒体 |
US10/153,769 US7103220B2 (en) | 2001-07-02 | 2002-05-24 | Image processing apparatus, method and program, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001200732A JP4078045B2 (ja) | 2001-07-02 | 2001-07-02 | 画像処理装置、方法、プログラム、及び記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003016385A true JP2003016385A (ja) | 2003-01-17 |
JP4078045B2 JP4078045B2 (ja) | 2008-04-23 |
Family
ID=19037807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001200732A Expired - Fee Related JP4078045B2 (ja) | 2001-07-02 | 2001-07-02 | 画像処理装置、方法、プログラム、及び記憶媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7103220B2 (ja) |
JP (1) | JP4078045B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4909311B2 (ja) * | 2008-03-31 | 2012-04-04 | 富士通フロンテック株式会社 | 文字認識装置 |
CN105528602A (zh) * | 2015-10-30 | 2016-04-27 | 小米科技有限责任公司 | 区域识别方法及装置 |
CN105528607B (zh) * | 2015-10-30 | 2019-02-15 | 小米科技有限责任公司 | 区域提取方法、模型训练方法及装置 |
CN111260631B (zh) * | 2020-01-16 | 2023-05-05 | 成都地铁运营有限公司 | 一种高效刚性接触线结构光光条提取方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04270485A (ja) * | 1991-02-26 | 1992-09-25 | Sony Corp | 印刷文字認識装置 |
JP3304512B2 (ja) | 1993-06-25 | 2002-07-22 | 松下電器産業株式会社 | 表認識装置 |
JP3431267B2 (ja) | 1994-04-14 | 2003-07-28 | 株式会社リコー | 表処理方法及び装置 |
JP2730665B2 (ja) * | 1994-12-15 | 1998-03-25 | 北陸先端科学技術大学院大学長 | 文字認識装置および方法 |
JP3574584B2 (ja) | 1998-12-16 | 2004-10-06 | 富士通株式会社 | 表画像処理装置及びそのプログラム記憶媒体 |
-
2001
- 2001-07-02 JP JP2001200732A patent/JP4078045B2/ja not_active Expired - Fee Related
-
2002
- 2002-05-24 US US10/153,769 patent/US7103220B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP4078045B2 (ja) | 2008-04-23 |
US7103220B2 (en) | 2006-09-05 |
US20030002062A1 (en) | 2003-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JPH08287184A (ja) | 画像切り出し装置及び文字認識装置 | |
US7630572B2 (en) | Image processing apparatus, image processing method, and computer program | |
JP5322517B2 (ja) | 画像処理装置および方法 | |
JP4078045B2 (ja) | 画像処理装置、方法、プログラム、及び記憶媒体 | |
JP4867894B2 (ja) | 画像認識装置、画像認識方法及びプログラム | |
JP3095470B2 (ja) | 文字認識装置 | |
JP3517077B2 (ja) | パターン抽出装置及びパターン領域の切り出し方法 | |
JP4738645B2 (ja) | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 | |
JP3077929B2 (ja) | 文字切出し方式 | |
JP3113217B2 (ja) | 破線認識方法 | |
JP5830996B2 (ja) | 画像処理装置及びプログラム | |
JP3566738B2 (ja) | 網掛け領域処理方法および網掛け領域処理装置 | |
JP2023034823A (ja) | 画像処理装置、画像処理装置の制御方法およびプログラム | |
JP2002366900A (ja) | 光学式文字読取装置 | |
JP3190794B2 (ja) | 文字切り出し装置 | |
JP4810995B2 (ja) | 画像処理装置、方法及びプログラム | |
JP2003030585A (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
JPH08171609A (ja) | 文字列高速抽出装置 | |
JP4878057B2 (ja) | 文字認識方法,プログラム及び記録媒体 | |
KR20220168787A (ko) | 만주어의 글자 추출 방법 및 이를 수행하는 시스템 | |
JP3239965B2 (ja) | 文字認識装置 | |
JP2789835B2 (ja) | 表枠検出方法及び装置 | |
JP4571447B2 (ja) | 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置 | |
JPH05114048A (ja) | 文字認識方法及びその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070913 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080204 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110208 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120208 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130208 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140208 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |