[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2003168076A - 画像処理方法およびその装置 - Google Patents

画像処理方法およびその装置

Info

Publication number
JP2003168076A
JP2003168076A JP2001367675A JP2001367675A JP2003168076A JP 2003168076 A JP2003168076 A JP 2003168076A JP 2001367675 A JP2001367675 A JP 2001367675A JP 2001367675 A JP2001367675 A JP 2001367675A JP 2003168076 A JP2003168076 A JP 2003168076A
Authority
JP
Japan
Prior art keywords
character
image
elements
character string
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001367675A
Other languages
English (en)
Other versions
JP3965983B2 (ja
Inventor
Yoshihito Hashimoto
良仁 橋本
Kazutaka Ikeda
和隆 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2001367675A priority Critical patent/JP3965983B2/ja
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to DE60208817T priority patent/DE60208817T2/de
Priority to PCT/JP2002/012470 priority patent/WO2003046807A1/en
Priority to EP02783679A priority patent/EP1449153B1/en
Priority to KR1020037009646A priority patent/KR100567362B1/ko
Priority to US10/466,765 priority patent/US7480410B2/en
Priority to CNB028041275A priority patent/CN100489885C/zh
Priority to TW091134716A priority patent/TWI221587B/zh
Publication of JP2003168076A publication Critical patent/JP2003168076A/ja
Application granted granted Critical
Publication of JP3965983B2 publication Critical patent/JP3965983B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【課題】 通常の2値化処理などでは1文字毎に正しく
切り出せない状態の文字であっても、各文字を正しく認
識する。 【解決手段】 複数の文字部分に分断した状態の文字を
含む原画像1から、各文字部分の抽出をするステップ
と、少なくとも一の文字を構成する一の要素または複数
の要素を選択し、これを種々組合せて少なくとも1つの
合成画像を作成し、これを画像処理にかけて特徴量を計
算し、これをバックプロパゲーションネットワークに入
力し、その出力を、少なくとも1つの合成画像に含まれ
る一の要素または複数の要素に対する一致度および認識
結果とする、これら一連の処理を、一の要素または複数
の要素毎に実行するステップと、その一の要素または複
数の要素毎に、最大の一致度および認識結果となった要
素を選択して出力するステップとを備えた。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ニューラルネット
技術を用いて、文字を認識する画像処理方法およびその
装置に関するものである。
【0002】
【従来の技術】従来、正解画像を文字種分メモリに保持
し、それら正解画像の文字と認識対象の文字とを比較す
ることにより、文字を認識する画像処理方法がある。し
かし、正解画像の文字と比較する従来の方法では、文字
種を1文字づつ照合するので、認識するべき文字の数に
比例して認識を完了するのに時間がかかるという問題が
ある。
【0003】この問題を解決する手法に、認識するべき
文字を2値化してその大きさを正規化した後にニューラ
ルネットに入力してその文字を認識する方法がある。
【0004】また、インクジェットプリンタなどで印刷
されたドット文字を認識する場合、ドット文字に対して
膨張処理を施して、各ドット間を連結させた上で、その
ドット文字を認識する方法が知られている。
【0005】
【発明が解決しようとする課題】しかしながら、ニュー
ラルネットを用いる方法では、認識するべき文字を2値
化すると、文字同士が離れていたり、背景にノイズがあ
る場合、文字を正しく抽出することができないために、
正しい認識結果を得ることができない。
【0006】また、膨張処理で各ドット間を連結させる
方法では、文字間隔が狭いと、膨張処理で文字同士が接
触してしまい、各文字を正しく分離することができず、
正しい認識結果を得ることができない。
【0007】さらに、認識するべき文字に罫線が引かれ
ている場合、文字の印刷面が梨地である場合などでは、
文字と背景とを分離することができないために、正しい
認識結果を得ることができない。
【0008】本発明は、上記事情に鑑みてなされたもの
であり、通常の2値化処理などでは1文字毎に正しく切
り出せない状態の文字であっても、各文字を正しく認識
することができる画像処理方法およびその装置を提供す
ることを目的とする。
【0009】
【課題を解決するための手段】上記課題を解決するため
の請求項1記載の発明の画像処理方法は、本来連続する
部分が複数の文字部分に分断した状態にある文字を少な
くとも含む画像から、2値化処理または濃淡フィルタな
どで少なくとも各文字部分の抽出をするステップと、こ
のステップによる抽出結果から、少なくとも一の文字を
構成する一の要素または複数の要素を選択し、この一の
要素または複数の要素を種々組合せて少なくとも1つの
合成画像を作成し、この少なくとも1つの合成画像を画
像処理にかけて特徴量を計算し、この特徴量を既に認識
対象の文字パターンに対して学習の終了しているバック
プロパゲーションネットワークに入力して認識処理を行
い、そしてそのバックプロパゲーションネットワークの
出力を、前記少なくとも1つの合成画像に含まれる一の
要素または複数の要素に対する一致度および認識結果と
する、これら一連の処理を、前記抽出結果から選択され
る少なくとも一の文字を構成する一の要素または複数の
要素毎に実行するステップと、前記少なくとも一の文字
を構成する一の要素または複数の要素毎に、最大の一致
度および認識結果となった要素を選択して、それら一致
度および認識結果のうち少なくとも認識結果を出力する
ステップとを有することを特徴とする。
【0010】請求項2記載の発明は、請求項1記載の画
像処理方法において、互いに隣接する文字が接触した状
態にある文字列を、文字を構成する線の本数に対して重
み付けを行ってその文字列の文字の配列方向に投影する
ことにより各投影値を求め、これらの各投影値のうち、
文字の形状から自動的に設定されるしきい値またはオペ
レータが入力したしきい値よりも低い投影値による分布
形状が谷を形成する部分で、前記接触した状態にある文
字列を分断して、前記画像を得ることを特徴とする。
【0011】請求項3記載の発明は、請求項1記載の画
像処理方法において、互いに隣接する文字が接触した状
態にある文字列であるか否かを自動的に判定し、互いに
隣接する文字が接触した状態にある文字列に対しては、
文字を構成する線の本数に対して重み付けを行ってその
文字列の文字の配列方向に投影することにより各投影値
を求め、これらの各投影値のうち、文字の形状から自動
的に設定されるしきい値またはオペレータが入力したし
きい値よりも低い投影値による分布形状が谷を形成する
部分で、前記接触した状態にある文字列を分断し、本来
連続する部分が複数の文字部分に分断した状態にある文
字については、それら文字部分をそのままとして、前記
画像を得ることを特徴とする。
【0012】請求項4記載の発明は、請求項2記載の画
像処理方法において、複数のドットからなるドット文字
を含む文字列に対して、方向選択性の膨張処理を施し
て、前記互いに隣接する文字が接触した状態にある文字
列を得ることを特徴とする。
【0013】請求項5記載の発明は、請求項1記載の画
像処理方法において、互いに隣接する文字が接触した状
態にある文字列を予め設定した値で強制的に分断して前
記画像を得ることを特徴とする。
【0014】請求項6記載の発明の画像処理装置は、本
来連続する部分が複数の文字部分に分断した状態にある
文字を少なくとも含む画像から、2値化処理または濃淡
フィルタなどで少なくとも各文字部分の抽出をする手段
と、この手段による抽出結果から、少なくとも一の文字
を構成する一の要素または複数の要素を選択し、この一
の要素または複数の要素を種々組合せて少なくとも1つ
の合成画像を作成し、この少なくとも1つの合成画像を
画像処理にかけて特徴量を計算し、この特徴量を既に認
識対象の文字パターンに対して学習の終了しているバッ
クプロパゲーションネットワークに入力して認識処理を
行い、そしてそのバックプロパゲーションネットワーク
の出力を、前記少なくとも1つの合成画像に含まれる一
の要素または複数の要素に対する一致度および認識結果
とする、これら一連の処理を、前記抽出結果から選択さ
れる少なくとも一の文字を構成する一の要素または複数
の要素毎に実行する手段と、前記少なくとも一の文字を
構成する一の要素または複数の要素毎に、最大の一致度
および認識結果となった要素を選択して、それら一致度
および認識結果のうち少なくとも認識結果を出力する手
段とを備えることを特徴とする。
【0015】請求項7記載の発明は、請求項6記載の画
像処理装置において、互いに隣接する文字が接触した状
態にある文字列を、文字を構成する線の本数に対して重
み付けを行ってその文字列の文字の配列方向に投影する
ことにより各投影値を求め、これらの各投影値のうち、
文字の形状から自動的に設定されるしきい値またはオペ
レータが入力したしきい値よりも低い投影値による分布
形状が谷を形成する部分で、前記接触した状態にある文
字列を分断して、前記画像を得る手段をさらに備えるこ
とを特徴とする。
【0016】
【発明の実施の形態】(第1実施形態)図1は本発明に
係る第1実施形態の画像処理の手順の説明図、図2は同
画像処理の対象となる文字列の一例を示す図、図3は同
画像処理中の概略領域作成処理のフロー図、図4は同画
像処理中の認識処理のフロー図、図5は図3,図4の処
理過程の様子を示す図であり、これらの図を参照しなが
ら第1実施形態について説明する。
【0017】第1実施形態の画像処理方法は、文字列を
含む原画像から各文字を切り出してそれを認識するため
の方法であり、撮像条件または対象ワークの条件の不良
等に起因して、図2に示すように、各文字における本来
連続する部分が複数の文字部分に分断され、通常の2値
化処理または投影処理ではそれら各文字を1文字毎に正
しく切り出せない状態の文字列を含む原画像1から、各
文字における分断された各文字部分を正しい文字となる
ように組み合わせることにより、正しい文字の認識結果
を返す。
【0018】すなわち、本画像処理方法では、まず、図
1(a)の例に示す原画像1から、2値化処理または濃
淡フィルタなどで、図1(b)に示すように、少なくと
も各文字部分の抽出を行う。ここで、図1(b)の例で
は、分断された文字部分の他にノイズ部分も抽出されて
いるが、例えば2値化処理の場合、文字部分とそのノイ
ズ部分との区別がつかないので、そのノイズ部分も文字
部分として取り扱われることになる。また、文字が文字
部分に分断されていない場合には、その文字が抽出され
ることになる。このため、以下ではこれらを抽出結果の
「要素」と呼ぶことにする。
【0019】次いで、上記抽出結果から、少なくとも一
の文字を構成する確率の高い一の要素または複数の要素
を選択する。第1実施形態では、後述の概略領域作成処
理手順により、図1(c)の例に示す矩形状の外枠に囲
まれた概略領域を決定することにより、少なくとも一の
文字を構成する確率の高い一の要素または複数の要素を
選択する。ここで、概略領域に含まれる文字が文字部分
に分断されていない場合には、その概略領域には、少な
くとも一の文字を構成する要素が含まれることになる。
また、概略領域に含まれる文字が複数の文字部分に分断
した状態にある場合、その概略領域には、少なくとも一
の文字を構成する複数の要素が含まれることになる。
【0020】次いで、上記概略領域で選択した一の要素
または複数の要素を種々組合せて少なくとも1つの合成
画像を作成し、この少なくとも1つの合成画像を画像処
理にかけて特徴量を計算し、この特徴量を既に認識対象
の文字パターンに対して学習の終了しているバックプロ
パゲーションネットワークに入力して認識処理を行い、
そしてそのバックプロパゲーションネットワークの出力
を、上記少なくとも1つの合成画像に含まれる一の要素
または複数の要素に対する一致度および認識結果とす
る、これら一連の処理を、概略領域(抽出結果から選択
される少なくとも一の文字を構成する一の要素または複
数の要素)毎に実行する。ここで、概略領域で選択され
る要素が複数有る場合、これら複数の要素が種々組み合
わされて、各組毎に合成画像が作成されることになる
が、この場合、各合成画像に含まれる各要素は、処理毎
に、より良い一致度および認識結果に更新される。従っ
て、上記処理の終了時点で、概略領域毎に、各要素は、
自信を含む全ての組みでの最大の一致度および認識結果
を対応付けられて保持していることになる。
【0021】次いで、図1(d)に示すように、概略領
域毎に、最大の一致度および認識結果となった要素を選
択して、それら一致度および認識結果のうち少なくとも
認識結果を出力する。同図は、概略領域毎に、最大の一
致度および認識結果になった各文字部分を一まとめにし
ている様子を示している。その一まとめにされた各文字
部分の一致度および認識結果が、その各文字部分を囲む
矩形状の枠内の文字の一致度および認識結果となる。
【0022】このような処理を効率的に実行するため、
第1実施形態では、概略領域作成処理を先に実行してそ
の後で認識処理を行う2段構えになっている。すなわ
ち、まず、各要素の組合せを計算する際の計算量を減ら
すため、図3のフローに従って認識対象文字の概略領域
を決定する。次いで、図4のフローに従って各概略領域
内の要素の種々の組みに対して認識処理を行う。
【0023】まず、図3を用いて概略領域作成処理につ
いて説明すると、図3(a)の“組合せ開始部分領域選
択”のステップでは、従来の方法(2値化処理または濃
淡フィルタなど)で抽出した各要素を、外接矩形の左上
端点のX座標の昇順でソートし、ソートされた各要素の
うち、先頭の要素を概略領域の先頭要素として選択す
る。
【0024】“結合領域選択”および“領域結合”のス
テップでは、ソートされた各要素のうち、次の要素を選
択してこの領域を概略領域に加え、これを拡張する。
【0025】“結合領域外接矩形計算”のステップで
は、概略領域内の組み合わされた各要素の外接矩形の左
上端点の座標の最小値および右下端点の座標の最大値
を、それぞれその概略領域の左上端点および右下端点と
し、これら左上端点および右下端点から、拡張された概
略領域の大きさを計算する。
【0026】“サイズオーバー判定”のステップでは、
概略領域の大きさが予め設定した値(例えばバックプロ
パゲーションネットワークに既に学習されている文字パ
ターンの幅平均値の2倍)を超えるか否かを判定し、超
えなければ“OK”として次の“ギャップ判定”のステ
ップに進む。一方、超えれば“NG”として、“結合領
域から削除”のステップに進み、上記拡張された概略領
域に加えられた領域を除外する。この後、“結合領域選
択”のステップに戻る。
【0027】“ギャップ判定”のステップでは、概略領
域内の要素間の距離が予め設定した値(例えばバックプ
ロパゲーションネットワークに既に学習されている文字
パターンのギャップ幅平均値の40%)以上離れている
か否かを判定し、離れていなければ“OK”として次の
“サイズ未達判定”のステップに進む。一方、離れてい
れば“NG”として、“結合領域から削除”のステップ
に進み、上記拡張された概略領域に加えられた領域を除
外する。この後、“結合領域選択”のステップに戻る。
例えば、図5(a)において、“0”の領域に対して、
“1”の領域は結合ないし連結されるが、“2”の領域
は“0”の領域との間隔が広いために結合されない。
【0028】“サイズ未達判定”のステップでは、概略
領域の大きさが所定の大きさより小さいサイズ未達であ
るか否かの判定を行い、サイズ未達でなければ“OK”
として次の“概略領域確定”のステップに進む。一方、
サイズ未達であれば“NG”として“結合領域選択”の
ステップに戻る。
【0029】“概略領域確定”のステップでは、このス
テップまで到達した概略領域を確定した概略領域として
保存する。
【0030】“全領域終了”のステップでは、ソートさ
れた各要素の全てが選択されたか否かを判定し、全てが
選択されたならば、“Yes”として図3(a)の処理
を終了し、次の図3(b)の処理に進む。一方、全てが
選択されていなければ、“No”として“結合領域選
択”で選択されるべき要素の順番を次の順番にずらし、
“組合せ開始部分領域選択”のステップに戻る。
【0031】この図3(a)の処理を実行することによ
り、概略領域が候補として複数設定されることになる。
【0032】図3(b)の“概略領域選択”のステップ
では、設定された複数の概略領域から一の概略領域を選
択する。
【0033】“他領域に包括されるか?”のステップで
は、選択された概略領域が他の概略領域に包括されてい
るか否かを判定し、包括されていれば“Yes”とし
て、その選択された概略領域を“削除”し、“全領域終
了”のステップに進む。一方、包括されていなければ
“No”として、“他領域と80%以上重なるか?”の
ステップに進み、選択された概略領域が他の概略領域と
予め設定した割合(例えば小さい方の面積の80%)以
上重なるか否かを判定し、重なれば“Yes”として、
処理数低減のため“領域結合”を行い、この後、“全領
域終了”のステップに進み、重ならなければ“No”と
して“全領域終了”のステップに進む。
【0034】“全領域終了”のステップでは、設定され
た複数の概略領域から全ての概略領域が選択されたか否
かを判定し、選択されたならば“Yes”として図3
(b)の処理を終了する。選択されていなければ“N
o”として“概略領域選択”のステップに戻り、残りの
概略領域から一の概略領域を選択して、同様の処理を繰
り返す。
【0035】この図3(b)の処理を実行することによ
り、重複する概略領域の一方が削除され、また予め設定
した割合以上重なる概略領域同士が統合されて、最終的
な概略領域が複数設定されることになる。例えば、図5
(b)に示すような複数の要素が抽出されたとき、図5
(c),(d)に示すような概略領域が設定される。
【0036】これら複数の概略領域について図4の認識
処理が実行されることになるが、図4の認識処理を概略
領域内の各要素に制限するのは、計算量を低減するため
である。またこの場合、概略領域内に少なくとも1個の
認識対象文字が含まれることになり、その中心付近の要
素が認識対象文字の部分である確率が高くなる効果が得
られる。
【0037】次に、図4の認識処理について、理解を容
易にするため、根幹となる処理手順を先に説明し、その
後で各種判定処理について説明する。
【0038】まず、設定された複数の概略領域から一の
概略領域を選択する。
【0039】次いで、その概略領域内の要素を左上端点
のX座標で昇順ソートした配列(以下「配列A」とい
う)および左上端点のX座標と概略領域の中心X座標と
の距離で昇順ソートした配列(以下「配列B」という)
を作成する。そして、文字は概略領域の中心付近に存在
する確率が高いため、結合する領域は概略領域の中心か
らのX方向距離の昇順で選択される。すなわち、配列A
から先頭の要素を選択して認識対象文字の要素候補の1
つとし(“組合せ開始部分領域選択”)、配列Bから先
頭の要素を選択し(“結合領域選択”)、これを配列A
の要素候補と組み合わせて合成画像を作成し(“領域結
合”)、そしてその合成画像に対して認識処理を実行す
る(“文字画像取得”、“ニューロ入力データ計算”お
よび“文字認識実行”)。
【0040】次いで、配列Bから次の要素を選択し、こ
れを合成画像と組み合わせて新しい合成画像とし、これ
に対して認識処理を行う(前側の“全領域終了”、“N
o”、“結合領域選択”、“領域結合”、“文字画像取
得”、“ニューロ入力データ計算”および“文字認識実
行”)。
【0041】このように、上記一連の処理を配列Bの全
ての要素について繰り返し行い、これら全ての要素につ
いての全繰り返し処理を配列Aの要素1個に対する処理
とする。
【0042】すなわち、配列Bの全ての要素について上
記一連の処理が終了すると、配列Aから次の要素を順次
選択し、配列Aから全ての要素が選択されるまで上記の
処理を繰り返し実行する(最終ステップの“全領域終
了”、“No”および“組合せ開始部分領域選択”
等)。
【0043】以上の処理を、設定された複数の概略領域
の全てについて実行し、全ての要素の一致度および認識
結果を調べ、同じ一致度および認識結果を持つ各要素を
一文字として一まとめにし、その一致度および認識結果
をその一文字の一致度および認識結果として出力する。
【0044】次に、各種判定処理について説明すると、
上記処理過程において、合成画像に対する認識処理によ
る一致度がそれまでの一致度を超える度に、その新しい
一致度および認識結果を、その合成画像を構成している
全ての要素の一致度および認識結果として保存する
(“一致度最大?”、“Yes”および“最大一致度、
認識結果入替”)。この処理は、配列Aの文字部分単体
(配列Bの要素と組み合わせない状態)でも実行され
る。これは、分断されていない文字が混在する場合があ
るためである。
【0045】また、以下の場合、配列Bの要素は合成画
像に加えられない。・合成画像の大きさが予め設定した
値(例えばバックプロパゲーションネットワークに既に
学習されている文字パターンの幅の平均値の1.2倍)
を超える場合(“サイズオーバー判定”、“NG”およ
び“結合領域から削除”)。・合成画像領域内に、予め
設定した値(例えばバックプロパゲーションネットワー
クに既に学習されている文字パターンの幅平均値の40
%)以上離れている場合(“ギャップ判定”、“NG”
および“結合領域から削除”)。・既に判定処理の終了
している組合せの場合(“未確認の組合せ”、“NG”
および“結合領域から削除”)。
【0046】また、以下の場合、バックプロパゲーショ
ンネットワークによる認識を行わずに次の合成画像の作
成に移る。・合成画像の大きさが予め設定した値(例え
ばバックプロパゲーションネットワークに既に学習され
ている文字パターンサイズの平均値の0.8倍)未満の
場合(“サイズ未達判定”および“NG”)。・合成画
像の外接矩形のアスペクト比(垂直方向の幅/水平方向
の幅)が予め設定した値(例えばバックプロパゲーショ
ンネットワークに既に学習されている文字パターンの最
小値の0.5倍〜最大値の1.5倍の範囲)から外れて
いる場合(“縦横比判定”および“NG”)。
【0047】さらに、以下の場合、一致度がそれまでの
一致度を超えても一致度および認識結果の更新を行わな
い。・合成画像の縦横比が、認識結果が示す文字として
バックプロパゲーションネットワークに学習されている
文字パターンの縦横比の予め設定している許容範囲(例
えば0.5倍〜1.5倍)から外れている場合(“認識
文字縦横比判定”および“NG”)。
【0048】ここで、図5(e)の例において、
“3”,“4”の各要素は、それぞれの組合せで最大一
致度となり、“×”の各要素(図ではノイズ部分)は、
どの組合せでも“3”,“4”のものより一致度が低
く、この場合、“3”の各要素を組みとし、“4”の各
要素を組みとして切り出されることになる。なお、図4
の“結合領域外接矩形計算”の処理は、図3のそれとほ
ぼ同様である。
【0049】ところで、上記処理を行うプログラムを画
像処理装置に組み込むことにより、大略、本来連続する
部分が複数の文字部分に分断した状態にある文字を少な
くとも含む画像から、2値化処理または濃淡フィルタな
どで少なくとも各文字部分の抽出をする処理機能と、こ
の処理機能による抽出結果から、少なくとも一の文字を
構成する一の要素または複数の要素を選択し、この一の
要素または複数の要素を種々組合せて少なくとも1つの
合成画像を作成し、この少なくとも1つの合成画像を画
像処理にかけて特徴量を計算し、この特徴量を既に認識
対象の文字パターンに対して学習の終了しているバック
プロパゲーションネットワークに入力して認識処理を行
い、そしてそのバックプロパゲーションネットワークの
出力を、上記少なくとも1つの合成画像に含まれる一の
要素または複数の要素に対する一致度および認識結果と
する、これら一連の処理を、抽出結果から選択される少
なくとも一の文字を構成する一の要素または複数の要素
毎に実行する処理機能と、少なくとも一の文字を構成す
る一の要素または複数の要素毎に、最大の一致度および
認識結果となった要素を選択して、それら一致度および
認識結果のうち少なくとも認識結果を出力する処理機能
とを備える画像処理装置が得られる。
【0050】この画像処理装置によっても、特徴量を通
じて得られる一致度および認識結果のうち、最大の一致
度および認識結果になった一の要素または複数の要素を
選択することにより、この選択した一の要素または複数
の要素で一の文字が構成される確率が極めて高くなるか
ら、その選択した一の要素または複数の要素に対する一
致度および認識結果を認識対象の文字の一致度および認
識結果とすることにより、通常の2値化処理などでは1
文字毎に正しく切り出せない状態の文字であっても、各
文字を正しく認識することができる。
【0051】(第2実施形態)図6は本発明に係る第2
実施形態の画像処理の対象となる文字列の一例を示す
図、図7は同画像処理の特徴部分のフロー図、図8は図
7の処理過程の様子を示す図であり、これらの図を参照
しながら第2実施形態について説明する。
【0052】第2実施形態の画像処理方法は、撮像条件
または対象ワークの条件の不良等に起因して、図6に示
すように、互いに隣接する一部の文字同士が接触し、そ
の接触部分が文字線の幅より太いために、通常の2値化
処理または投影処理ではそれら各文字を1文字毎に正し
く切り出せない状態の文字列を含む原画像1Aに対し
て、文字そのものが分断されることを許容した上で、接
触した文字の分断処理を行い、分断された文字に対して
は第1実施形態と同様の連結処理を行うことにより、接
触した文字が正しい文字となるように切り出し、正しい
文字の認識結果を返す。
【0053】すなわち、まず、図8(a)に示すような
原画像1Aから、図8(b)に示すように従来の方法で
文字領域を抽出し、抽出された文字領域をその文字の配
列方向に平行な軸(投影軸)に投影する(図7の“文字
の並び方向に平行な直線に文字領域を投影”、図8
(c))。
【0054】図8(c)において、投影処理は投影軸に
垂直な方向に文字領域の外接矩形内を走査し、その走査
線上の画素数を数え(文字領域の抽出処理で文字領域の
画素の濃度値を1、背景要素を0としている場合は1の
画素の数)、それを投影軸の1点(走査線の出ている
点)の投影値とすることで行う。対象文字の構成してい
る(1の)画素と接触によって発生している(1の)画
素との区別をつけ易くするため、走査線上の領域数(1
の画素が連結してできている島の数)をこの投影値に乗
ずる。
【0055】この投影値に対してしきい値処理を行い、
しきい値以上の領域R1をまず抽出する(図7の“輝度
値がしきい値以上の領域R1を抽出”)。次いで、しき
い値未満の領域R2を調べ、そこに明確な谷が存在する
かどうかを調査し、明確な谷が存在する場合、その明確
な谷で領域R2を切断し、隣接する領域R1と結合する
(図7の“しきい値未満の領域R2で谷が明確な領域を
抽出”、“谷で領域R2を分割”、“分割領域を隣接す
る領域R1に結合”、図8(d),(e))。
【0056】なお、谷の判定には、例えば、投影値の微
分値を利用し、その微分値が設定したしきい値以上であ
れば明確な谷であるとする方法が考えられる。
【0057】そして、領域R1のみを選択し、第1実施
形態と同様の処理を行うことで、接触した文字を正しい
文字となるように分断する。これにより、正しい認識結
果を返すことが可能となる。
【0058】最初に領域R1を抽出する際のしきい値を
自動で設定することも可能である。例えば、最初にしき
い値を0にして領域R1を抽出し、予め設定した値(例
えばバックプロパゲーションネットワークに既に学習さ
れている文字パターンの縦横比平均値)と、例えば抽出
された領域R1の内で最大の長さを持つ領域と文字領域
の垂直方向の幅で計算される縦横比とを比較し、領域R
1の縦横比が大きければそのときのしきい値を採用し、
条件を満たさなければしきい値を1つ増やして同様の評
価を行う。この処理を条件が満たされるまで繰り返すこ
とで、自動的にしきい値を決定することができる。
【0059】領域R1の最大幅が0になれば、その文字
領域は文字単体で存在し、あるいは分断されて文字部分
になっているとみなして、そのまま分断文字の接触処理
で使用する。しきい値評価の特徴量はアスペクト比だけ
でなく、文字領域の水平方向の幅でも良い。
【0060】(第3実施形態)図9は本発明に係る第3
実施形態の画像処理の対象となる文字列の一例および同
画像処理による最終結果の一例を示す図であり、この図
を参照しながら第3実施形態について説明する。
【0061】第3実施形態の画像処理方法は、図9
(a)に示すように、ある文字における本来連続する部
分が文字部分に分断していたり、互いに隣接する文字同
士が接触していたりする文字列を含む原画像1Bに対
し、接触した文字かどうかを自動的に判定し、接触した
文字については第2実施形態の画像処理方法を適用する
一方、分断されている文字については各文字部分をその
まま使用し、全体に対して第1実施形態の画像処理方法
を適用することにより、図9(b)に示すように、文字
の分断および接触状態が混在する文字列でも、接触した
文字を正しい文字となるように処理し、正しい認識結果
を返す。
【0062】(第4実施形態)図10は本発明に係る第
4実施形態の画像処理の対象となる文字列の一例および
同画像処理過程の様子を示す図であり、この図を参照し
ながら第4実施形態について説明する。
【0063】第4実施形態の画像処理方法は、複数のド
ットからなるドット文字が複数配列された文字列を含む
原画像から、少なくとも一部の文字が接触した状態とな
る文字列を作成し、この文字列に対して第2実施形態と
同様の画像処理方法を適用する。
【0064】図10(a)の例に示すような原画像1C
の場合、従来の方法で文字領域を抽出して図10(b)
に示すような画像を得る。この画像に対し、抽出した文
字領域の配列方向(水平方向)に沿って膨張処理を施
し、この膨張処理後の画像に対し、前述の配列方向と直
交する方向(垂直方向)に沿って膨張処理を施して、図
10(c)に示すような画像を得る。次いで、この膨張
した文字領域を含む画像に対して、第2実施形態と同様
の画像処理を実行することにより、第1および第2実施
形態と同様の処理を直接実行する場合より、処理速度お
よび処理の信頼性を向上させることができる。
【0065】なお、膨張処理は、文字領域の外接矩形内
を走査し、1の画素があれば指定された方向(水平ある
いは垂直方向)の前後の指定された範囲の背景画素を1
の画素に置き換えることで行う。
【0066】図10(a)に示すように、互いに隣接す
る文字間隔が狭いためにドットの膨張を行うと、互いに
隣接する文字同士が連結してしまう場合でも、第4実施
形態の画像処理方法を用いることで、同一文字中のドッ
ト間は連結させ、別の文字同士は正しく分断させて、正
しい文字認識を行うことができる。
【0067】(第5実施形態)図11は本発明に係る第
5実施形態の画像処理の対象となる文字列の一例および
同画像処理過程の様子を示す図であり、この図を参照し
ながら第5実施形態について説明する。
【0068】第5実施形態の画像処理方法では、図11
(a)に示すような、互いに隣接する一部の文字同士が
接触してその接触領域が広い状態にある文字列を含む原
画像1Dから、従来の方法で文字領域を抽出する。
【0069】この後、図11(b)に示す文字領域の外
接矩形領域を、予め設定した値(例えばバックプロパゲ
ーションネットワークに既に学習されている文字パター
ンの水平および垂直方向の最小幅の1/2)の大きさの
領域に強制的に分断する(図11(d))。ただし、文
字領域の面積が、予め設定した値(例えばバックプロパ
ゲーションネットワークに既に学習されている文字パタ
ーンの平均面積の1.2倍)より小さい場合、この処理
は実行しない。
【0070】次いで、強制的に分断された文字部分領域
に対して、第1実施形態と同様の画像処理を実行する。
これにより、文字同士の接触領域が広く、第2実施形態
の投影処理では分断不可能な文字列であっても、接触し
た文字を正しい文字となるように分断することができる
ので、正しい認識結果を返すことができる。
【0071】また、第5実施形態の画像処理方法は、文
字列の配列方向に無関係に文字認識が行えるため、文字
列が波型に並んでいる場合や、縦方向に並んだ場合でも
問題なく切り出しが行える。
【0072】
【発明の効果】以上のことから明らかなように、請求項
1記載の発明の画像処理方法は、本来連続する部分が複
数の文字部分に分断した状態にある文字を少なくとも含
む画像から、2値化処理または濃淡フィルタなどで少な
くとも各文字部分の抽出をするステップと、このステッ
プによる抽出結果から、少なくとも一の文字を構成する
一の要素または複数の要素を選択し、この一の要素また
は複数の要素を種々組合せて少なくとも1つの合成画像
を作成し、この少なくとも1つの合成画像を画像処理に
かけて特徴量を計算し、この特徴量を既に認識対象の文
字パターンに対して学習の終了しているバックプロパゲ
ーションネットワークに入力して認識処理を行い、そし
てそのバックプロパゲーションネットワークの出力を、
前記少なくとも1つの合成画像に含まれる一の要素また
は複数の要素に対する一致度および認識結果とする、こ
れら一連の処理を、前記抽出結果から選択される少なく
とも一の文字を構成する一の要素または複数の要素毎に
実行するステップと、前記少なくとも一の文字を構成す
る一の要素または複数の要素毎に、最大の一致度および
認識結果となった要素を選択して、それら一致度および
認識結果のうち少なくとも認識結果を出力するステップ
とを有するので、特徴量を通じて得られる一致度および
認識結果のうち、最大の一致度および認識結果になった
一の要素または複数の要素を選択することにより、この
選択した一の要素または複数の要素で一の文字が構成さ
れる確率が極めて高くなるから、その選択した一の要素
または複数の要素に対する一致度および認識結果を認識
対象の文字の一致度および認識結果とすることにより、
通常の2値化処理などでは1文字毎に正しく切り出せな
い状態の文字であっても、各文字を正しく認識すること
ができる。
【0073】請求項2記載の発明は、請求項1記載の画
像処理方法において、互いに隣接する文字が接触した状
態にある文字列を、文字を構成する線の本数に対して重
み付けを行ってその文字列の文字の配列方向に投影する
ことにより各投影値を求め、これらの各投影値のうち、
文字の形状から自動的に設定されるしきい値またはオペ
レータが入力したしきい値よりも低い投影値による分布
形状が谷を形成する部分で、前記接触した状態にある文
字列を分断して、前記画像を得るので、互いに隣接する
文字が接触した状態にある文字列を正しい文字となるよ
うに切り出すことができ、正しい認識結果を返すことが
できる。
【0074】請求項3記載の発明は、請求項1記載の画
像処理方法において、互いに隣接する文字が接触した状
態にある文字列であるか否かを自動的に判定し、互いに
隣接する文字が接触した状態にある文字列に対しては、
文字を構成する線の本数に対して重み付けを行ってその
文字列の文字の配列方向に投影することにより各投影値
を求め、これらの各投影値のうち、文字の形状から自動
的に設定されるしきい値またはオペレータが入力したし
きい値よりも低い投影値による分布形状が谷を形成する
部分で、前記接触した状態にある文字列を分断し、本来
連続する部分が複数の文字部分に分断した状態にある文
字については、それら文字部分をそのままとして、前記
画像を得るので、認識対象の文字列が文字の分断および
接触状態が混在する文字列であっても、正しい文字とな
るように切り出すことができ、正しい認識結果を返すこ
とができる。
【0075】請求項4記載の発明は、請求項2記載の画
像処理方法において、複数のドットからなるドット文字
を含む文字列に対して、方向選択性の膨張処理を施し
て、前記互いに隣接する文字が接触した状態にある文字
列を得るので、請求項1記載の発明または請求項2記載
の発明をドット文字に対して直接適用する場合よりも処
理速度および信頼性を向上させることができる。また、
文字間隔が狭いためにドットの膨張を行うと、文字同士
が連結してしまう場合でも、同一文字中のドット間は連
結させ、別の文字同士は正しく分断させることができる
ので、正しい文字認識が可能となる。
【0076】請求項5記載の発明は、請求項1記載の画
像処理方法において、互いに隣接する文字が接触した状
態にある文字列を予め設定した値で強制的に分断して前
記画像を得るので、例えば文字同士が接触する領域が広
く、請求項2記載の発明では分断が困難である場合で
も、互いに隣接する文字が接触した状態にある文字列を
正しい文字となるように分断することができ、正しい文
字認識が可能となる。また、文字列の配列方向に無関係
に文字認識を行えるため、文字列が波型に並んでいる場
合や、縦方向に並んでいる場合でも、問題なく切り出し
および認識を行うことができる。
【0077】請求項6記載の発明の画像処理装置は、本
来連続する部分が複数の文字部分に分断した状態にある
文字を少なくとも含む画像から、2値化処理または濃淡
フィルタなどで少なくとも各文字部分の抽出をする手段
と、この手段による抽出結果から、少なくとも一の文字
を構成する一の要素または複数の要素を選択し、この一
の要素または複数の要素を種々組合せて少なくとも1つ
の合成画像を作成し、この少なくとも1つの合成画像を
画像処理にかけて特徴量を計算し、この特徴量を既に認
識対象の文字パターンに対して学習の終了しているバッ
クプロパゲーションネットワークに入力して認識処理を
行い、そしてそのバックプロパゲーションネットワーク
の出力を、前記少なくとも1つの合成画像に含まれる一
の要素または複数の要素に対する一致度および認識結果
とする、これら一連の処理を、前記抽出結果から選択さ
れる少なくとも一の文字を構成する一の要素または複数
の要素毎に実行する手段と、前記少なくとも一の文字を
構成する一の要素または複数の要素毎に、最大の一致度
および認識結果となった要素を選択して、それら一致度
および認識結果のうち少なくとも認識結果を出力する手
段とを備えるので、通常の2値化処理などでは1文字毎
に正しく切り出せない状態の文字であっても、各文字を
正しく認識することができる。
【0078】請求項7記載の発明は、請求項6記載の画
像処理装置において、互いに隣接する文字が接触した状
態にある文字列を、文字を構成する線の本数に対して重
み付けを行ってその文字列の文字の配列方向に投影する
ことにより各投影値を求め、これらの各投影値のうち、
文字の形状から自動的に設定されるしきい値またはオペ
レータが入力したしきい値よりも低い投影値による分布
形状が谷を形成する部分で、前記接触した状態にある文
字列を分断して、前記画像を得る手段をさらに備えるの
で、互いに隣接する文字が接触した状態にある文字列を
正しい文字となるように切り出すことができ、正しい認
識結果を返すことができる。
【図面の簡単な説明】
【図1】本発明に係る第1実施形態の画像処理の手順の
説明図であり、ディスプレイ上に表示した中間調画像を
プリンタで出力した図面代用写真である。
【図2】同画像処理の対象となる文字列の一例を示す図
であり、ディスプレイ上に表示した中間調画像をプリン
タで出力した図面代用写真である。
【図3】同画像処理中の概略領域作成処理のフロー図で
ある。
【図4】同画像処理中の認識処理のフロー図である。
【図5】図3,図4の処理過程の様子を示す図であり、
ディスプレイ上に表示した中間調画像をプリンタで出力
した図面代用写真である。
【図6】本発明に係る第2実施形態の画像処理の対象と
なる文字列の一例を示す図であり、ディスプレイ上に表
示した中間調画像をプリンタで出力した図面代用写真で
ある。
【図7】同画像処理の特徴部分のフロー図である。
【図8】図7の処理過程の様子を示す図であり、ディス
プレイ上に表示した中間調画像をプリンタで出力した図
面代用写真である。
【図9】本発明に係る第3実施形態の画像処理の対象と
なる文字列の一例および同画像処理による最終結果の一
例を示す図であり、ディスプレイ上に表示した中間調画
像をプリンタで出力した図面代用写真である。
【図10】本発明に係る第4実施形態の画像処理の対象
となる文字列の一例および同画像処理過程の様子を示す
図であり、ディスプレイ上に表示した中間調画像をプリ
ンタで出力した図面代用写真である。
【図11】本発明に係る第5実施形態の画像処理の対象
となる文字列の一例および同画像処理過程の様子を示す
図であり、ディスプレイ上に表示した中間調画像をプリ
ンタで出力した図面代用写真である。
【符号の説明】
1,1A,1B,1C,1D 原画像

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 本来連続する部分が複数の文字部分に分
    断した状態にある文字を少なくとも含む画像から、2値
    化処理または濃淡フィルタなどで少なくとも各文字部分
    の抽出をするステップと、 このステップによる抽出結果から、少なくとも一の文字
    を構成する一の要素または複数の要素を選択し、この一
    の要素または複数の要素を種々組合せて少なくとも1つ
    の合成画像を作成し、この少なくとも1つの合成画像を
    画像処理にかけて特徴量を計算し、この特徴量を既に認
    識対象の文字パターンに対して学習の終了しているバッ
    クプロパゲーションネットワークに入力して認識処理を
    行い、そしてそのバックプロパゲーションネットワーク
    の出力を、前記少なくとも1つの合成画像に含まれる一
    の要素または複数の要素に対する一致度および認識結果
    とする、これら一連の処理を、前記抽出結果から選択さ
    れる少なくとも一の文字を構成する一の要素または複数
    の要素毎に実行するステップと、 前記少なくとも一の文字を構成する一の要素または複数
    の要素毎に、最大の一致度および認識結果となった要素
    を選択して、それら一致度および認識結果のうち少なく
    とも認識結果を出力するステップとを有することを特徴
    とする画像処理方法。
  2. 【請求項2】 互いに隣接する文字が接触した状態にあ
    る文字列を、文字を構成する線の本数に対して重み付け
    を行ってその文字列の文字の配列方向に投影することに
    より各投影値を求め、これらの各投影値のうち、文字の
    形状から自動的に設定されるしきい値またはオペレータ
    が入力したしきい値よりも低い投影値による分布形状が
    谷を形成する部分で、前記接触した状態にある文字列を
    分断して、前記画像を得ることを特徴とする請求項1記
    載の画像処理方法。
  3. 【請求項3】 互いに隣接する文字が接触した状態にあ
    る文字列であるか否かを自動的に判定し、互いに隣接す
    る文字が接触した状態にある文字列に対しては、文字を
    構成する線の本数に対して重み付けを行ってその文字列
    の文字の配列方向に投影することにより各投影値を求
    め、これらの各投影値のうち、文字の形状から自動的に
    設定されるしきい値またはオペレータが入力したしきい
    値よりも低い投影値による分布形状が谷を形成する部分
    で、前記接触した状態にある文字列を分断し、本来連続
    する部分が複数の文字部分に分断した状態にある文字に
    ついては、それら文字部分をそのままとして、前記画像
    を得ることを特徴とする請求項1記載の画像処理方法。
  4. 【請求項4】 複数のドットからなるドット文字を含む
    文字列に対して、方向選択性の膨張処理を施して、前記
    互いに隣接する文字が接触した状態にある文字列を得る
    ことを特徴とする請求項2記載の画像処理方法。
  5. 【請求項5】 互いに隣接する文字が接触した状態にあ
    る文字列を予め設定した値で強制的に分断して前記画像
    を得ることを特徴とする請求項1記載の画像処理方法。
  6. 【請求項6】 本来連続する部分が複数の文字部分に分
    断した状態にある文字を少なくとも含む画像から、2値
    化処理または濃淡フィルタなどで少なくとも各文字部分
    の抽出をする手段と、 この手段による抽出結果から、少なくとも一の文字を構
    成する一の要素または複数の要素を選択し、この一の要
    素または複数の要素を種々組合せて少なくとも1つの合
    成画像を作成し、この少なくとも1つの合成画像を画像
    処理にかけて特徴量を計算し、この特徴量を既に認識対
    象の文字パターンに対して学習の終了しているバックプ
    ロパゲーションネットワークに入力して認識処理を行
    い、そしてそのバックプロパゲーションネットワークの
    出力を、前記少なくとも1つの合成画像に含まれる一の
    要素または複数の要素に対する一致度および認識結果と
    する、これら一連の処理を、前記抽出結果から選択され
    る少なくとも一の文字を構成する一の要素または複数の
    要素毎に実行する手段と、 前記少なくとも一の文字を構成する一の要素または複数
    の要素毎に、最大の一致度および認識結果となった要素
    を選択して、それら一致度および認識結果のうち少なく
    とも認識結果を出力する手段とを備えることを特徴とす
    る画像処理装置。
  7. 【請求項7】 互いに隣接する文字が接触した状態にあ
    る文字列を、文字を構成する線の本数に対して重み付け
    を行ってその文字列の文字の配列方向に投影することに
    より各投影値を求め、これらの各投影値のうち、文字の
    形状から自動的に設定されるしきい値またはオペレータ
    が入力したしきい値よりも低い投影値による分布形状が
    谷を形成する部分で、前記接触した状態にある文字列を
    分断して、前記画像を得る手段をさらに備えることを特
    徴とする請求項6記載の画像処理装置。
JP2001367675A 2001-11-30 2001-11-30 画像処理方法およびその装置 Expired - Fee Related JP3965983B2 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP2001367675A JP3965983B2 (ja) 2001-11-30 2001-11-30 画像処理方法およびその装置
PCT/JP2002/012470 WO2003046807A1 (en) 2001-11-30 2002-11-28 Image recognition method and apparatus for the same method
EP02783679A EP1449153B1 (en) 2001-11-30 2002-11-28 Character separation method and device for recognition
KR1020037009646A KR100567362B1 (ko) 2001-11-30 2002-11-28 영상 인식 방법 및 그 방법을 위한 장치
DE60208817T DE60208817T2 (de) 2001-11-30 2002-11-28 Verfahren und Vorrichtung zur Buchstabenseparation für deren Erkennung
US10/466,765 US7480410B2 (en) 2001-11-30 2002-11-28 Image recognition method and apparatus for the same method
CNB028041275A CN100489885C (zh) 2001-11-30 2002-11-28 图像识别方法及实现该方法的设备
TW091134716A TWI221587B (en) 2001-11-30 2002-11-29 Image recognition method and apparatus for the same method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001367675A JP3965983B2 (ja) 2001-11-30 2001-11-30 画像処理方法およびその装置

Publications (2)

Publication Number Publication Date
JP2003168076A true JP2003168076A (ja) 2003-06-13
JP3965983B2 JP3965983B2 (ja) 2007-08-29

Family

ID=19177389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001367675A Expired - Fee Related JP3965983B2 (ja) 2001-11-30 2001-11-30 画像処理方法およびその装置

Country Status (8)

Country Link
US (1) US7480410B2 (ja)
EP (1) EP1449153B1 (ja)
JP (1) JP3965983B2 (ja)
KR (1) KR100567362B1 (ja)
CN (1) CN100489885C (ja)
DE (1) DE60208817T2 (ja)
TW (1) TWI221587B (ja)
WO (1) WO2003046807A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012027877A (ja) * 2010-07-28 2012-02-09 Musashi Eng Co Ltd 投票用紙の読取装置および読取方法
JP2012194705A (ja) * 2011-03-15 2012-10-11 Omron Corp 画像処理装置、画像処理方法および画像処理プログラム
JPWO2016006076A1 (ja) * 2014-07-10 2017-04-27 富士機械製造株式会社 部品装着座標の作成方法および部品装着座標の作成装置
US11275961B2 (en) 2017-12-22 2022-03-15 Beijing Sensetime Technology Development Co., Ltd. Character image processing method and apparatus, device, and storage medium

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060193520A1 (en) * 2005-02-28 2006-08-31 Takeshi Mita Object detection apparatus, learning apparatus, object detection system, object detection method and object detection program
KR100987110B1 (ko) * 2008-12-12 2010-10-12 (주)씨프로 카메라 모듈용 지지장치
CN102385707A (zh) * 2010-08-30 2012-03-21 阿里巴巴集团控股有限公司 一种数字图像识别的方法、装置及爬虫服务器
TWI602155B (zh) * 2013-02-08 2017-10-11 威聯通科技股份有限公司 利用影像內容不連續性增強物件偵測之方法
US9361536B1 (en) * 2014-12-16 2016-06-07 Xerox Corporation Identifying user marks using patterned lines on pre-printed forms
CN105138963A (zh) * 2015-07-31 2015-12-09 小米科技有限责任公司 图片场景判定方法、装置以及服务器
TWI607387B (zh) * 2016-11-25 2017-12-01 財團法人工業技術研究院 字符辨識系統及其字符辨識方法
CN111598076B (zh) * 2020-05-25 2023-05-02 北京明略软件系统有限公司 一种标签图像中日期检测处理方法及装置
JP7137170B1 (ja) * 2021-03-22 2022-09-14 楽天グループ株式会社 情報処理装置、情報処理方法およびプログラム

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5991582A (ja) 1982-11-16 1984-05-26 Nec Corp 文字読取装置
JPH0782524B2 (ja) 1983-03-31 1995-09-06 株式会社東芝 光学的文字読取装置
JPH0614372B2 (ja) 1984-01-23 1994-02-23 日本電信電話株式会社 文字読取方法
JPS6129982A (ja) 1984-07-21 1986-02-12 Nippon Telegr & Teleph Corp <Ntt> オンライン手書き文字列認識方式
JPS62190574A (ja) 1986-02-18 1987-08-20 Mitsubishi Electric Corp 文字パタ−ン切り出し装置
JPS62223890A (ja) 1986-03-26 1987-10-01 Hitachi Ltd ダイナミツク型ram
US5048100A (en) * 1988-12-15 1991-09-10 Michael Kuperstein Self organizing neural network method and system for general classification of patterns
JP2944102B2 (ja) 1989-05-26 1999-08-30 烈 山川 ファジィニューロン
US5151951A (en) * 1990-03-15 1992-09-29 Sharp Kabushiki Kaisha Character recognition device which divides a single character region into subregions to obtain a character code
CA2081406C (en) * 1991-12-23 1997-09-16 Chinmoy Bhusan Bose Method and apparatus for connected and degraded text recognition
JP3187899B2 (ja) 1991-12-25 2001-07-16 松下電器産業株式会社 文字認識装置
US5481621A (en) 1992-05-28 1996-01-02 Matsushita Electric Industrial Co., Ltd. Device and method for recognizing an image based on a feature indicating a relative positional relationship between patterns
US6041141A (en) 1992-09-28 2000-03-21 Matsushita Electric Industrial Co., Ltd. Character recognition machine utilizing language processing
JPH06180771A (ja) 1992-12-11 1994-06-28 Matsushita Electric Ind Co Ltd 英文字認識装置
US6212299B1 (en) 1992-12-11 2001-04-03 Matsushita Electric Industrial Co., Ltd. Method and apparatus for recognizing a character
WO1994027251A1 (en) * 1993-05-18 1994-11-24 Massachusetts Institute Of Technology Automated reading system and method
JPH07175894A (ja) 1993-11-05 1995-07-14 Toshiba Corp ニューラルネットワークと文字認識方法と電子部品実装検査装置及びそれを用いた管理方法
US5542006A (en) * 1994-06-21 1996-07-30 Eastman Kodak Company Neural network based character position detector for use in optical character recognition
JPH08212290A (ja) 1995-02-06 1996-08-20 Nippon Signal Co Ltd:The パターン識別における特徴量作成装置
JPH09305710A (ja) 1996-05-15 1997-11-28 Mitsubishi Heavy Ind Ltd 2値化装置
US6266445B1 (en) 1998-03-13 2001-07-24 Canon Kabushiki Kaisha Classification-driven thresholding of a normalized grayscale image
GB2343045B (en) 1998-10-21 2003-03-05 Racal Res Ltd Systems and methods for processing digital image data
EP1089214A3 (en) 1999-09-30 2005-01-26 Matsushita Electric Industrial Co., Ltd. Apparatus and method for image recognition

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012027877A (ja) * 2010-07-28 2012-02-09 Musashi Eng Co Ltd 投票用紙の読取装置および読取方法
JP2012194705A (ja) * 2011-03-15 2012-10-11 Omron Corp 画像処理装置、画像処理方法および画像処理プログラム
JPWO2016006076A1 (ja) * 2014-07-10 2017-04-27 富士機械製造株式会社 部品装着座標の作成方法および部品装着座標の作成装置
US11275961B2 (en) 2017-12-22 2022-03-15 Beijing Sensetime Technology Development Co., Ltd. Character image processing method and apparatus, device, and storage medium

Also Published As

Publication number Publication date
EP1449153B1 (en) 2006-01-18
EP1449153A1 (en) 2004-08-25
US20040071345A1 (en) 2004-04-15
JP3965983B2 (ja) 2007-08-29
US7480410B2 (en) 2009-01-20
KR100567362B1 (ko) 2006-04-03
KR20030076620A (ko) 2003-09-26
WO2003046807A1 (en) 2003-06-05
TW200300539A (en) 2003-06-01
DE60208817D1 (de) 2006-04-06
CN100489885C (zh) 2009-05-20
TWI221587B (en) 2004-10-01
CN1489745A (zh) 2004-04-14
DE60208817T2 (de) 2006-09-14

Similar Documents

Publication Publication Date Title
KR100525692B1 (ko) 컬러 화상 처리 장치 및 패턴 추출 장치
JP2951814B2 (ja) 画像抽出方式
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP2822189B2 (ja) 文字認識装置及び方法
JP3251918B2 (ja) 光学式文字認識システムにおける2値化方法
JP2003168076A (ja) 画像処理方法およびその装置
JP2002024836A (ja) ディジタルイメージから表題を抽出する方法
JP4558232B2 (ja) 画像処理方法、画像処理装置および画像処理方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US20020181792A1 (en) Image data compressing method and restoring method
JP3438440B2 (ja) 画像処理装置
JPH0877362A (ja) 画像処理装置
JPH05166002A (ja) ソース画像を分析する方法
JPH1031716A (ja) 文字行抽出方法および装置
EP1296283A2 (en) Half-tone dot elimination method and system thereof
JPH0950527A (ja) 枠抽出装置及び矩形抽出装置
US20110187721A1 (en) Line drawing processing apparatus, storage medium storing a computer-readable program, and line drawing processing method
EP0689168B1 (en) Image processing method and apparatus
JP2845107B2 (ja) 画像処理装置
JP4492258B2 (ja) 文字・図形の認識方法および検査方法
JP3150762B2 (ja) グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式
JP2008225654A (ja) 画像処理方法、画像処理装置、及び、プログラム、プログラム記憶媒体
JP2001092965A (ja) 文字照合装置および文字照合方法
JPH0581474A (ja) 文字列抽出方法および文字領域検出方法
JPH0981743A (ja) 文字・図形処理装置及び文字・図形処理方法
JP3104355B2 (ja) 特徴抽出装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070508

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070521

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100608

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100608

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100608

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100608

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110608

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 5

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120608

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees