[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPH06215181A - 文字・文字列切り出し方法および文字認識装置 - Google Patents

文字・文字列切り出し方法および文字認識装置

Info

Publication number
JPH06215181A
JPH06215181A JP5007798A JP779893A JPH06215181A JP H06215181 A JPH06215181 A JP H06215181A JP 5007798 A JP5007798 A JP 5007798A JP 779893 A JP779893 A JP 779893A JP H06215181 A JPH06215181 A JP H06215181A
Authority
JP
Japan
Prior art keywords
character
area
character string
value
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5007798A
Other languages
English (en)
Inventor
Shigeru Owada
茂 大和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Engineering Co Ltd
Original Assignee
Hitachi Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Engineering Co Ltd filed Critical Hitachi Engineering Co Ltd
Priority to JP5007798A priority Critical patent/JPH06215181A/ja
Publication of JPH06215181A publication Critical patent/JPH06215181A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】刻印文字等の低品質な濃淡文字画像から、正確
かつ高速に所望の文字を切り出す手段を提供すること。 【構成】例えば、撮像装置1、画像データ記憶手段2
1、行切り出し手段22、濃度ヒストグラム算出手段2
3、最適文字領域算出手段24、文字切り出し枠決定手
段25、文字認識手段26、および文字認識辞書手段2
7を有して構成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、CCDカメラ等の撮像
装置より入力された濃淡文字画像データにもとづき、文
字を切り出す方法に係り、特に、刻印文字画像等の低品
質な濃淡画像データから文字を切り出すのに好適な処理
方法および該方法を使用した文字認識装置に関する。
【0002】
【従来の技術】従来、刻印文字画像等の濃淡画像データ
からの、いわゆる文字切り出しは、特開昭61−201
384号公報記載のように、最初に2値化のための最適
なしきい値を算出し、該しきい値により対象画像データ
を2値化信号とし、該2値化された画像データにもとづ
き垂直射影ヒストグラム等を作成して、文字切り出しを
行う方法が考えられている。
【0003】しかしながら、刻印文字画像には、図5に
示すように不要なノイズが多く混入しあい、背景と文字
線の濃度の差が少なく、照明装置の影響により、文字線
の濃度反転が発生する等の弊害があるため、一般に、1
つのしきい値によって、正しい2値化データの作成が行
えるような、最適なしきい値の算出は困難であるといえ
る。
【0004】また、かかる問題点に対し、特開平2−1
88890号公報記載のような、濃淡画像データを各小
領域に分割し、その分割領域ごとに最適な、2値化のた
めのしきい値を設定して、画像データを2値化する方法
が提案されている。
【0005】さらに、刻印文字画像データの2値化を行
わずに、濃淡画像のまま文字を切り出す方法も存在し、
かかる方法においては、データ2値化後に使用する垂直
射影ヒストグラムと同様に、各画素の濃度を累積した濃
度ヒストグラムを用いる手法や、「電子情報通信学会論
文誌D−II Vol.J72-D-II No.9(1989年)1
407〜1414頁」記載のように、各隣接する画素の
濃度差(「ばらつき度」と称している)を用いて切り出
す方法が考えだされている。
【0006】図6に、濃度ヒストグラムの算出例を、図
7に、ばらつき度の算出例をそれぞれ示す。図6、7に
は、最適なしきい値が得られたと仮定した場合(実際に
は、この最適なしきい値を求めることが困難である場合
が多い)の文字切り出し成功例を記載しており、しきい
値との比較を行うことにより、図中の文字切り出し枠を
得ている。
【0007】
【発明が解決しようとする課題】さて、前記各分割領域
ごとに2値化のしきい値を算出し、濃淡画像データを2
値化した後文字を切り出す方法では、図5に示すよう
に、文字のうちある部分のみに濃度反転が発生している
場合には、正確な2値化が行われないという問題、ある
いは、文字切り出し処理のための時間がかかるという問
題を有している。また、濃度ヒストグラムを用いた処理
方法では、背景と文字線の濃度差が大きく、かつ、背景
の濃度が一定である場合には有効であるものの、前述の
ように、刻印文字画像は、背景の濃度の変動、ノイズ等
が発生しやすいため、正確に文字を切り出せない場合が
頻繁に発生する。
【0008】図8に、濃度ヒストグラムを用いた手法に
よる文字切り出しの失敗例を示す。図8に示すように、
文字列領域中で濃度の変化、ノイズが発生している場合
等には、算出した濃度ヒストグラムが複雑な形状を有す
るため、しきい値の設定が、非常に困難となり、図8下
段図に示すように、文字の切り出し失敗が発生してしま
う場合多い(本図では、文字「3」において、切り出し
失敗が発生している)。 また、特に、図8にて示す場
合は、この濃度ヒストグラムの形状を見てもわかるよう
に、全ての文字を正確に切り出すためのしきい値の設定
は、殆ど不可能であることがわかり、またかかる状況は
実際には頻繁に発生することも経験的事実の示すところ
である。
【0009】さらに、以上のべてきた2値化を用いた方
法や、濃度をそのまま用いた方法では、処理前に文字線
と背景の濃度の関係、すなわち、文字線の濃度が高く、
背景の濃度が低いか、あるいは、文字線の濃度が低く、
背景の濃度が高いかを予め判定、あるいは、設定する必
要があるという問題点もあわせ持っており、刻印文字の
ように、撮像対象物の向きによっては、文字線と背景の
濃度反転が頻繁に発生するような場合には、上記方法で
はできない。
【0010】次に、隣接画素の濃度差(ばらつき度)を
用いた処理方法では、文字線から背景への変化部分や、
背景から文字線への変化部分における「濃度差」を利用
しているため、前記文字線と背景の濃度の関係を予め判
定、あるいは、設定する必要はないが、その濃度差の値
が非常に微小であったり、濃度差を算出する走査方向
に、文字線部分しか存在しない、例えば縦棒1本の部分
等や、走査方向に文字線部分が少ししか存在しない、例
えば横棒1本のみの部分等では、その特徴があらわれに
くく、切り出し失敗が頻繁に発生する問題を有してい
る。
【0011】図9に、ばらつき度を用いた処理方法にお
ける失敗例を示す。図9に示すように、「3」や「6」
等の文字の構成を考慮すると、3本の横棒が通っている
ため、文字のばらつき度はかなり大きくなり、文字切り
出しを容易に行えるが、一方「1」や「7」等の文字の
構成を考慮すると、縦棒1本や横棒1本の部分のばらつ
き度は低くなっており、文字切り出し失敗が(図9で
は、文字「1」を2つに分離して切り出してしまってい
る)発生しやすい。
【0012】すなわち、ばらつき度は、文字の形状によ
って、その出力のされやすさに直接の影響を受けるもの
であると言うことができる。また、特に図9に示す場合
には、このばらつき度にもとずき、全ての文字を正確に
切り出すためのしきい値の設定は不可能であり、このよ
うな状況も実際には頻繁に発生する。
【0013】さらに、図6と図9は、同じ濃淡文字画像
データであるが、この画像データに対し、濃度ヒストグ
ラムを用いた手法によっては、正確に文字を切り出すこ
とができるが、ばらつき度を用いた手法によっては、正
確に文字を切り出すことはできない。同様に、図7と図
8は、同じ濃淡文字画像データであるが、この画像デー
タに対し、濃度ヒストグラムを用いた手法によっては、
正確に文字を切り出せないが、ばらつき度を用いた手法
によっては、正確に文字を切り出している。
【0014】このことから、濃度ヒストグラムとばらつ
き度は、相反する弱点を有する処理方法であるというこ
とが言える。本発明の目的は、このような濃度ヒストグ
ラム、ばらつき度を用いた手法の弱点を克服し、正確に
文字を切り出す方法および装置を提供することにある。
【0015】特に、本処理方法の従来技術との相違点
は、従来技術では、文字の両端の座標を、濃度ヒストグ
ラム、ばらつき度等のデータを用いて検出するのである
が、本方法では、各画素の座標を中心に考えた場合、該
中心点に文字の存在する確率として、「最適文字領域
値」を算出しており、その最大の点、すなわち、文字の
中心の座標を求めて文字を切り出す点である。上記手法
は文字のみならず、文字列も扱える。
【0016】
【課題を解決するための手段】上記課題を解決するた
め、以下の手段が考えられる。入力された文字の濃淡画
像データより、切り出し対象である文字画像が存在する
領域を切り出す方法であって、文字画像の並んでいる領
域である文字列に対して平行方向に存在する各画素に対
応する座標ごとに、該座標における、前記文字列に対し
て垂直方向に存在する各画素の濃度値を累積した濃度ヒ
ストグラムを生成し、前記各座標を中心として、予め設
定した、処理対象たる文字の平均文字サイズから定まる
領域における前記濃度ヒストグラムの平均値(文字領域
濃度ヒストグラム平均値)と、前記、文字の平均サイズ
から定まる領域の左右に存在する、予め設定した文字間
サイズ領域における、前記濃度ヒストグラムの平均値
(文字間領域濃度ヒストグラム平均値)を算出し、さら
に、文字領域濃度ヒストグラム平均値が文字間領域濃度
ヒストグラム平均値より大きな場合、その差を各座標ご
とに算出し、該算出値を最適文字領域値とし、さらに、
該最適文字領域値と予め設定したしきい値との比較を行
い、最適文字領域値がしきい値を越えた領域を示す座標
値の最大幅を文字が存在する領域として、該領域を各座
標について求めていき、該各領域における最適文字領域
値が最大値を示す座標点を文字の中心座標として選出
し、該中心座標を中心とし左右に、前記予め設定した文
字の平均サイズで与えられる領域を付加した領域を、文
字の切り出し枠として文字を切り出す方法である。
【0017】また、入力された文字を構成する画素の濃
度データより、切り出し対象である文字画像が存在する
領域を切り出す方法であって、文字画像の並んでいる領
域である文字列に対して平行方向に存在する各画素に対
応する座標ごとに、該座標における、前記文字列に対し
て垂直方向に存在する各画素の濃度差を算出し、その濃
度差を累積した濃度差ヒストグラムを生成し、前記各座
標を中心として、予め設定した、処理対象たる文字の平
均文字サイズから定まる領域における、前記濃度差ヒス
トグラムの平均値(文字領域濃度差ヒストグラム平均
値)と、前記、文字の平均サイズから定まる領域の左右
に存在する、予め設定した文字間サイズ領域における、
前記濃度差ヒストグラムの平均値(文字間領域濃度差ヒ
ストグラム平均値)を算出し、さらに、文字領域濃度差
ヒストグラム平均値が文字間領域濃度差ヒストグラム平
均値より大きな場合、その差を各座標ごとに算出し、該
算出値を最適文字領域値とし、さらに、該最適文字領域
値と予め設定したしきい値との比較を行い、最適文字領
域値がしきい値を越えた領域を示す座標値の最大幅を文
字が存在する領域として、該領域を各座標について求め
ていき、該各領域における最適文字領域値が最大値を示
す座標点を文字の中心座標として選出し、該中心座標を
中心とし左右に、前記予め設定した文字の平均サイズで
与えられる領域を付加した領域を、文字の切り出し枠と
して文字を切り出す文字切り出し方法も考えられる。さ
らに、入力された文字列の濃淡画像データより、切り出
し対象である文字列画像が存在する領域を切り出す方法
であって、文字列画像に対し垂直方向に存在する各画素
に対応する座標ごとに、該座標における、前記文字列に
対して平行方向に存在する各画素の濃度値を累積した文
字列濃度ヒストグラムを生成し、前記各座標を中心とし
て、予め設定した、処理対象たる文字列の平均文字高さ
から定まる領域における前記文字列濃度ヒストグラムの
平均値(文字列領域濃度ヒストグラム平均値)と、前
記、文字列の平均文字高さから定まる領域の左右に存在
する、予め設定した文字列間サイズの領域における、前
記文字列濃度ヒストグラムの平均値(文字列間領域濃度
ヒストグラム平均値)を算出し、さらに、文字列領域濃
度ヒストグラム平均値が文字列間領域濃度ヒストグラム
平均値より大きな場合、その差を各座標ごとに算出し、
該算出値を最適文字列領域値とし、さらに、該最適文字
列領域値と予め設定したしきい値との比較を行い、最適
文字列領域値がしきい値を越えた領域を示す座標値の最
大幅を文字列が存在する領域として、該領域を各座標に
ついて求めていき、該各領域における最適文字列領域値
が最大値を示す座標点を文字列の中心座標として選出
し、該中心座標を中心とし左右に、前記予め設定した文
字高さの平均サイズで与えられる領域を付加した領域
を、文字列の切り出し枠として文字列を切り出す文字列
切り出し方法も考えられる。
【0018】加えて、入力された文字列を構成する画素
の濃度データより、切り出し対象である文字列画像が存
在する領域を切り出す方法であって、文字列画像に対し
垂直方向に存在する各画素に対応する座標ごとに、該座
標における、前記文字列に対して平行方向に存在する各
画素の濃度差を算出し、その濃度差を累積した文字列濃
度差ヒストグラムを生成し、前記各座標を中心として、
予め設定した、処理対象たる文字列の平均文字高さから
定まる領域における、前記文字列濃度差ヒストグラムの
平均値(文字列領域濃度差ヒストグラム平均値)と、前
記、文字列の平均文字高さから定まる領域の左右に存在
する、予め設定した文字列間サイズの領域における、前
記濃度差ヒストグラムの平均値(文字列間領域濃度差ヒ
ストグラム平均値)を算出し、さらに、文字列領域濃度
差ヒストグラム平均値と文字列間領域濃度差ヒストグラ
ム平均値より大きな場合、その差を各座標ごとに算出
し、該算出値を最適文字列領域値とし、さらに、該最適
文字列領域値と予め設定したしきい値との比較を行い、
最適文字列領域値がしきい値を越えた領域を示す座標値
の最大幅を文字列が存在する領域として、該領域を各座
標について求めていき、該各領域における最適文字列領
域値が最大値を示す座標点を文字列の中心座標として選
出し、該中心座標を中心とし左右に、前記予め設定した
文字高さの平均サイズで与えられる領域を付加した領域
を、文字列の切り出し枠として文字列を切り出す文字列
切り出し方法でもよい。
【0019】上記方法を用い、文字列および文字の切り
出しを行う手段として、以下の手段が考えられる。
【0020】まず、入力された文字列の濃淡画像データ
にもとづき、文字列画像に対し垂直方向に存在する各画
素に対応する座標ごとに、該座標における、前記文字列
に対して平行方向に存在する各画素の濃度値を累積した
文字列濃度ヒストグラムを生成する手段と、前記各座標
を中心として、予め設定した、処理対象たる文字列の平
均文字高さから定まる領域における前記文字列濃度ヒス
トグラムの平均値(文字列領域濃度ヒストグラム平均
値)と、前記、文字列の平均文字高さから定まる領域の
左右に存在する、予め設定した文字列間サイズの領域に
おける、前記文字列濃度ヒストグラムの平均値(文字列
間領域濃度ヒストグラム平均値)を算出し、さらに、文
字列領域濃度ヒストグラム平均値が文字列間領域濃度ヒ
ストグラム平均値より大きな場合、その差を各座標ごと
に算出し、該算出値を最適文字列領域値とする手段と、
該最適文字列領域値と予め設定したしきい値との比較を
行い、最適文字列領域値がしきい値を越えた領域を示す
座標値の最大幅を文字列が存在する領域として、該領域
を各座標について求めていき、該各領域における最適文
字列領域値が最大値を示す座標点を文字列の中心座標と
して選出し、該中心座標を中心とし左右に、前記予め設
定した文字高さの平均サイズで与えられる領域を付加し
た領域を、文字列の切り出し枠として文字列を切り出す
手段と、入力された文字の濃淡画像データにもとづい
て、文字画像の並んでいる領域である文字列に対して平
行方向に存在する各画素に対応する座標ごとに、該座標
における、前記文字列に対して垂直方向に存在する各画
素の濃度値を累積した濃度ヒストグラムを生成する手段
と、前記各座標を中心として、予め設定した、処理対象
たる文字の平均文字サイズから定まる領域における前記
濃度ヒストグラムの平均値(文字領域濃度ヒストグラム
平均値)と、前記、文字の平均サイズから定まる領域の
左右に存在する、予め設定した文字間サイズ領域におけ
る、前記濃度ヒストグラムの平均値(文字間領域濃度ヒ
ストグラム平均値)を算出し、さらに、文字領域濃度ヒ
ストグラム平均値が文字間領域濃度ヒストグラム平均値
より大きな場合、その差を各座標ごとに算出し、該算出
値を最適文字領域値とする手段と、該最適文字領域値と
予め設定したしきい値との比較を行い、最適文字領域値
がしきい値を越えた領域を示す座標値の最大幅を文字が
存在する領域として、該領域を各座標について求めてい
き、該各領域における最適文字領域値が最大値を示す座
標点を文字の中心座標として選出し、該中心座標を中心
とし左右に、前記予め設定した文字の平均サイズで与え
られる領域を付加した領域を、文字の切り出し枠として
文字を切り出す手段と、各切り出された文字の画像デー
タを認識する手段と、認識結果の文字コードを出力する
手段を有して構成される刻印文字認識装置である。
【0021】また、入力された文字列の濃淡画像データ
にもとづき、文字列画像に対し垂直方向に存在する各画
素に対応する座標ごとに、該座標における、前記文字列
に対して平行方向に存在する各画素の濃度値を累積した
文字列濃度ヒストグラムを生成する手段と、前記各座標
を中心として、予め設定した、処理対象たる文字列の平
均文字高さから定まる領域における前記文字列濃度ヒス
トグラムの平均値(文字列領域濃度ヒストグラム平均
値)と、前記、文字列の平均文字高さから定まる領域の
左右に存在する、予め設定した文字列間サイズの領域に
おける、前記文字列濃度ヒストグラムの平均値(文字列
間領域濃度ヒストグラム平均値)を算出し、さらに、文
字列領域濃度ヒストグラム平均値が文字列間領域濃度ヒ
ストグラム平均値より大きな場合、その差を各座標ごと
に算出し、該算出値を最適文字列領域値とする手段と、
該最適文字列領域値と予め設定したしきい値との比較を
行い、最適文字列領域値がしきい値を越えた領域を示す
座標値の最大幅を文字列が存在する領域として、該領域
を各座標について求めていき、該各領域における最適文
字列領域値が最大値を示す座標点を文字列の中心座標と
して選出し、該中心座標を中心とし左右に、前記予め設
定した文字高さの平均サイズで与えられる領域を付加し
た領域を、文字列の切り出し枠として文字列を切り出す
手段と、入力された文字を構成する画素の濃度データに
もとづいて文字画像の並んでいる領域である文字列に対
して平行方向に存在する各画素に対応する座標ごとに、
該座標における、前記文字列に対して垂直方向に存在す
る各画素の濃度差を算出し、その濃度差を累積した濃度
差ヒストグラムを生成する手段と、前記各座標を中心と
して、予め設定した、処理対象たる文字の平均文字サイ
ズから定まる領域における、前記濃度差ヒストグラムの
平均値(文字領域濃度差ヒストグラム平均値)と、前
記、文字の平均サイズから定まる領域の左右に存在す
る、予め設定した文字間サイズ領域における、前記濃度
差ヒストグラムの平均値(文字間領域濃度差ヒストグラ
ム平均値)を算出し、さらに、文字領域濃度差ヒストグ
ラム平均値が文字間領域濃度差ヒストグラム平均値より
大きな場合、その差を各座標ごとに算出し、該算出値を
最適文字領域値とする手段と、該最適文字領域値と予め
設定したしきい値との比較を行い、最適文字領域値がし
きい値を越えた領域を示す座標値の最大幅を文字が存在
する領域として、該領域を各座標について求めていき、
該各領域における最適文字領域値が最大値を示す座標点
を文字の中心座標として選出し、該中心座標を中心とし
左右に、前記予め設定した文字の平均サイズで与えられ
る領域を付加した領域を、文字の切り出し枠として文字
を切り出す手段と、各切り出された文字の画像データを
認識する手段と、認識結果の文字コードを出力する手段
を有して構成される刻印文字認識装置でもよい。
【0022】さらに、入力された文字列を構成する画素
の濃度データにもとづいて、文字列画像に対し垂直方向
に存在する各画素に対応する座標ごとに、該座標におけ
る、前記文字列に対して平行方向に存在する各画素の濃
度差を算出し、その濃度差を累積した文字列濃度差ヒス
トグラムを生成する手段と、前記各座標を中心として、
予め設定した、処理対象たる文字列の平均文字高さから
定まる領域における、前記文字列濃度差ヒストグラムの
平均値(文字列領域濃度差ヒストグラム平均値)と、前
記、文字列の平均文字高さから定まる領域の左右に存在
する、予め設定した文字列間サイズの領域における、前
記濃度差ヒストグラムの平均値(文字列間領域濃度差ヒ
ストグラム平均値)を算出し、さらに、文字列領域濃度
差ヒストグラム平均値と文字列間領域濃度差ヒストグラ
ム平均値より大きな場合、その差を各座標ごとに算出
し、該算出値を最適文字列領域値とする手段と、該最適
文字列領域値と予め設定したしきい値との比較を行い、
最適文字列領域値がしきい値を越えた領域を示す座標値
の最大幅を文字列が存在する領域として、該領域を各座
標について求めていき、該各領域における最適文字列領
域値が最大値を示す座標点を文字列の中心座標として選
出し、該中心座標を中心とし左右に、前記予め設定した
文字高さの平均サイズで与えられる領域を付加した領域
を、文字列の切り出し枠として文字列を切り出す手段
と、入力された文字の濃淡画像データにもとづいて、文
字画像の並んでいる領域である文字列に対して平行方向
に存在する各画素に対応する座標ごとに、該座標におけ
る、前記文字列に対して垂直方向に存在する各画素の濃
度値を累積した濃度ヒストグラムを生成する手段と、前
記各座標を中心として、予め設定した、処理対象たる文
字の平均文字サイズから定まる領域における前記濃度ヒ
ストグラムの平均値(文字領域濃度ヒストグラム平均
値)と、前記、文字の平均サイズから定まる領域の左右
に存在する、予め設定した文字間サイズ領域における、
前記濃度ヒストグラムの平均値(文字間領域濃度ヒスト
グラム平均値)を算出し、さらに、文字領域濃度ヒスト
グラム平均値が文字間領域濃度ヒストグラム平均値より
大きな場合、その差を各座標ごとに算出し、該算出値を
最適文字領域値とする手段と、該最適文字領域値と予め
設定したしきい値との比較を行い、最適文字領域値がし
きい値を越えた領域を示す座標値の最大幅を文字が存在
する領域として、該領域を各座標について求めていき、
該各領域における最適文字領域値が最大値を示す座標点
を文字の中心座標として選出し、該中心座標を中心とし
左右に、前記予め設定した文字の平均サイズで与えられ
る領域を付加した領域を、文字の切り出し枠として文字
を切り出す手段と、各切り出された文字の画像データを
認識する手段と、認識結果の文字コードを出力する手段
を有して構成される刻印文字認識装置も考えられる。
【0023】加えて、入力された文字列を構成する画素
の濃度データにもとづいて、文字列画像に対し垂直方向
に存在する各画素に対応する座標ごとに、該座標におけ
る、前記文字列に対して平行方向に存在する各画素の濃
度差を算出し、その濃度差を累積した文字列濃度差ヒス
トグラムを生成する手段と、前記各座標を中心として、
予め設定した、処理対象たる文字列の平均文字高さから
定まる領域における、前記文字列濃度差ヒストグラムの
平均値(文字列領域濃度差ヒストグラム平均値)と、前
記、文字列の平均文字高さから定まる領域の左右に存在
する、予め設定した文字列間サイズの領域における、前
記濃度差ヒストグラムの平均値(文字列間領域濃度差ヒ
ストグラム平均値)を算出し、さらに、文字列領域濃度
差ヒストグラム平均値と文字列間領域濃度差ヒストグラ
ム平均値より大きな場合、その差を各座標ごとに算出
し、該算出値を最適文字列領域値とする手段と、該最適
文字列領域値と予め設定したしきい値との比較を行い、
最適文字列領域値がしきい値を越えた領域を示す座標値
の最大幅を文字列が存在する領域として、該領域を各座
標について求めていき、該各領域における最適文字列領
域値が最大値を示す座標点を文字列の中心座標として選
出し、該中心座標を中心とし左右に、前記予め設定した
文字高さの平均サイズで与えられる領域を付加した領域
を、文字列の切り出し枠として文字列を切り出す手段
と、入力された文字を構成する画素の濃度データにもと
づいて、文字画像の並んでいる領域である文字列に対し
て平行方向に存在する各画素に対応する座標ごとに、該
座標における、前記文字列に対して垂直方向に存在する
各画素の濃度差を算出し、その濃度差を累積した濃度差
ヒストグラムを生成する手段と、前記各座標を中心とし
て、予め設定した、処理対象たる文字の平均文字サイズ
から定まる領域における、前記濃度差ヒストグラムの平
均値(文字領域濃度差ヒストグラム平均値)と、前記、
文字の平均サイズから定まる領域の左右に存在する、予
め設定した文字間サイズ領域における、前記濃度差ヒス
トグラムの平均値(文字間領域濃度差ヒストグラム平均
値)を算出し、さらに、文字領域濃度差ヒストグラム平
均値が文字間領域濃度差ヒストグラム平均値より大きな
場合、その差を各座標ごとに算出し、該算出値を最適文
字領域値とする手段と、該最適文字領域値と予め設定し
たしきい値との比較を行い、最適文字領域値がしきい値
を越えた領域を示す座標値の最大幅を文字が存在する領
域として、該領域を各座標について求めていき、該各領
域における最適文字領域値が最大値を示す座標点を文字
の中心座標として選出し、該中心座標を中心とし左右
に、前記予め設定した文字の平均サイズで与えられる領
域を付加した領域を、文字の切り出し枠として文字を切
り出す手段と、各切り出された文字の画像データを認識
する手段と、認識結果の文字コードを出力する手段を有
して構成される刻印文字認識装置も好ましい。
【0024】
【作用】本発明の目的は、濃度ヒストグラム生成処理
と、最適文字領域算出処理と、文字切り出し枠決定処理
手段を有して構成される手段により達成される。本発明
では、特に最適文字領域算出処理を設けたことにより、
文字の両端の座標ではなく、文字の中心の座標を検出し
て、文字切り出しを行うことが特徴である。上記構成に
より、濃度ヒストグラム算出処理は、入力された濃淡文
字画像データにもとづき、文字列領域中の文字列と平行
に存在する各画素の座標ごとに、文字列と直角に存在す
る各画素の濃度を累積した濃度ヒストグラムを求め、こ
れを最適文字領域算出処理へ出力するように動作する。
最適文字領域算出処理は、文字列と平行に存在する各画
素の座標ごとに、その座標を中心とし、予め設定した文
字の平均サイズの領域における濃度ヒストグラムの平均
値(「文字領域濃度ヒストグラム平均値」と称する)
と、その文字の平均サイズの領域の左右の外側の予め設
定した文字間サイズの領域における、濃度ヒストグラム
の平均値(「文字間領域濃度ヒストグラム平均値」と称
する)を算出し、文字領域濃度ヒストグラム平均値が、
文字間領域濃度ヒストグラム平均値より大きい場合に、
その差を、その座標における最適文字領域値として記憶
し、それを、文字切り出し枠決定処理手段へ出力するよ
うに動作する。
【0025】文字切り出し枠決定処理手段は、予め設定
したしきい値と、前記最適文字領域値の比較を行い、し
きい値以上となっている最適文字領域値のグループを求
め、その各グループごとに、最適文字領域値の最大値と
なっている座標を算出する。次に、その各最大値の座標
を文字の中心として、予め設定した文字の平均サイズ分
だけ座標を拡げることにより、文字切り出し枠を決定す
るようにして、最終的に文字を切り出す。
【0026】なお、上記手法は文字の切り出しのみでな
く、文字列の切り出しも行えることはいうまでもない。
さらに、各画素における濃度を累積した濃度ヒストグラ
ムの、もならず、各画素における濃度の差分、差分の2
乗値を累積した濃度差ヒストグラムのほか、文字の存在
に対応して与えられる関数なら何でも利用できることも
言うまでもない。
【0027】
【実施例】以下に、本発明の実施例について図面を参照
して説明する。図1に、本発明を使用した文字認識装置
の構成図の一例を示す。本文字認識装置1は、撮像装置
1および電子計算機2を有して構成され、さらに、電子
計算機2は、画像データ記憶手段21、行切り出し手段
22、濃度ヒストグラム算出手段23、最適文字領域算
出手段24、文字切り出し枠決定手段25、文字認識手
段26、および文字認識辞書手段27を備えて構成され
ている。
【0028】なお、撮像装置1を除く各手段は、例え
ば、CPU、ROM、RAM、C−MOS等の電子デバ
イスおよび所定の記憶手段に格納されたソフトウエアに
よって実現される。
【0029】CCDカメラ等の撮像装置1により入力さ
れた濃淡文字画像データは、電子計算機2に備えられた
画像データ記憶手段21に記憶される。行切り出し手段
22は、前記画像データ記憶手段21内に格納されてい
る画像データにより、文字列領域の座標を算出する手段
である。濃度ヒストグラム生成手段23は、前記文字列
領域の座標の示す画像データ記憶手段21内の画像デー
タより、文字列と平行に存在する各画素の座標ごとの濃
度ヒストグラムを生成する手段である。また、最適文字
領域算出手段24は、作成された濃度ヒストグラムよ
り、予め設定した、文字の平均サイズおよび文字間サイ
ズを使用して、各座標ごとの最適文字領域値を算出する
手段である。また、文字切り出し枠決定手段25は、前
記最適文字領域値と予め設定した、しきい値との比較を
行い、文字画像の中心座標を算出し、これにより、文字
の切り出し枠の座標を決定する手段である。
【0030】さらに、文字認識手段26は、前記文字切
り出し枠の座標の示す画像データ記憶手段21内の画像
データと、文字認識辞書手段27中の辞書とを、パター
ンマッチング等の認識方式を用いて認識し、得られた文
字コードを出力する手段である。なお、図示していない
が文字認識手段26の出力結果を表示するための表示手
段(例えば、CRT、液晶ディスプレイ等)、印字手段
(プリンター等)等を備えた構成にするのが好ましい。
【0031】次に、図2に、本発明の全体処理フローを
示す。ステップ101では、前記画像データ記憶手段2
1に格納されている画像データより、文字列と直角方向
に存在する各画素の座標ごとに、例えば、文字列と平行
方向に存在する各画素の濃度を累積した濃度ヒストグラ
ムを求め、その濃度ヒストグラムと、予め設定したしき
い値との比較により、文字列ごとの領域の座標を算出す
る。これにより、いわゆる文字行の切り出し処理が完了
する。次にステップ102では、前記算出された文字列
全てに対し、ステップ103〜105の処理を行うよう
にする。まず、ステップ103では、前記文字列の画像
データより、文字列と平行方向に存在する各画素の座標
ごとに、文字列と直角方向に存在する各画素の濃度を累
積した濃度ヒストグラムを作成する。
【0032】次のステップ104における処理について
は、図3、4を参照して説明する。
【0033】図3は、最適文字領域算出手段24の動作
をフローにて示している。図4は、文字「6」と「L」
の最適文字領域値の算出例を示しており、(a)は、文
字画像の例(実際は、濃淡画像であるが、簡単のため2
値画像を記載している)、(b)は、その画像の文字列
と平行方向に存在する各画素の座標ごとの濃度ヒストグ
ラムの作成例であり、各座標ごとの濃度ヒストグラムの
値を、以下に示す表1に示している。また、(c)は、
前記濃度ヒストグラムより算出した各座標ごとの最適文
字領域値の例であり、各座標ごとの最適文字領域値を、
以下に示す表2に記す。(d)は、(c)の最適文字領
域値より文字切り出し枠を算出した結果を示している。
【0034】
【表1】
【0035】
【表2】
【0036】さて、ステップ201では、前記濃度ヒス
トグラムの全座標に対し、ステップ202〜206の処
理を行うようにする。
【0037】ステップ202では、濃度ヒストグラムの
ある座標を中心として、予め設定した文字の平均サイズ
の領域での濃度ヒストグラムの平均値を算出する。ここ
で、予め設定した文字の平均サイズとは、文字幅の平均
値であり、文字の平均サイズを、例えば「7」と仮定し
て、図4(b)の座標7を例にとって説明すると、座標
7を中心とした文字の平均サイズ7の文字領域の座標
は、座標4〜座標10であるので、文字領域の濃度ヒス
トグラムの合計は、表1より、 130+100+110+90+80+110+120
=740 となり、文字領域濃度ヒストグラム平均値は、740/
7=105となる。
【0038】次に、ステップ203では、前記ステップ
202の座標を中心として、文字の平均サイズの左右の
外側の、予め設定した文字間サイズの領域の濃度ヒスト
グラムの平均値を求める。
【0039】ここで、予め設定した文字間サイズとは、
隣りあう文字との間隔を意味し、文字間サイズを2(文
字の平均サイズは7)と仮定して、図4(b)の座標7
を例にとって説明すると、座標7の場合の文字間領域の
座標は、座標2〜3、座標11〜12であるので、その
文字間領域の濃度ヒストグラムの合計は、表1より 4+5+5+5=19 となり、文字間領域濃度ヒストグラム平均値は、19/
4=4となる。ステップ204では、以上の方法により
求めた文字領域濃度ヒストグラム平均値と文字間領域濃
度ヒストグラム平均値の比較を行なう。文字領域濃度ヒ
ストグラム平均値が、文字間領域濃度ヒストグラム平均
値より大きい場合(ステップ205の処理を行う)は、
その差を、その座標における最適文字領域値として記憶
する。
【0040】図4(b)の座標7を例にとると、前述の
ように文字領域濃度ヒストグラム平均値が105、文字
間領域濃度ヒストグラム平均値が4であるので、座標7
の最適文字領域値は、105−4=101となる。
【0041】逆に、文字間領域濃度ヒストグラム平均値
が文字領域濃度ヒストグラム平均値より大きい場合(ス
テップ206の処理を行う)は、最適文字領域値を0と
する。 以上の処理を濃度ヒストグラムの全座標に対し
て行うと、表2に示す各座標ごとの最適文字領域値が求
まる。
【0042】ただし、対象領域の両端の部分(図4の座
標1〜5と座標20〜24の部分)については、領域外
の場所に文字領域の一部や文字間領域がとられることと
なるので、その場合は、両端の外側の濃度ヒストグラム
を「0」と仮定して実行する。 さて、ステップ105
は、前記ステップ104により求められた各座標ごとの
最適文字領域値と、予め設定したしきい値との比較を行
い、しきい値以上となる最適文字領域値のグループを算
出する。
【0043】図4(c)を参照して説明すると、しきい
値を「10」と仮定した場合、最適文字領域値が、しき
い値「10」より大きいグループは、表2より座標4〜
8と、座標16〜17の2つである。
【0044】次に、その各グループごとに最適文字領域
値が最大となっている座標を算出する。表2より、座標
4〜8のグループ中での最大値は、座標7の「101」
であり、座標16〜17のグループ中での最大値は、座
標17の「56」である。
【0045】そして、その各々の最大値の座標を中心と
して、予め設定されている文字の平均サイズ分左右に拡
げた座標を算出し、それを文字切り出し枠とする。
【0046】図4(c)の場合では、文字の平均サイズ
を7と仮定したので、座標7を中心とする文字切り出し
枠は座標4〜10、座標17を中心とする文字切り出し
枠は座標14〜20となり、図4(d)に示すように正
確に文字切り出し枠が求まることになる。以上の処理に
より、入力された濃淡文字画像データ中の文字全てにつ
いて文字切り出し枠を算出した後、ステップ106にお
いて、各切り出された文字画像と、予め用意した文字認
識辞書とをパターンマッチング等の認識方式により認識
せしめ、その文字コードを出力する。
【0047】ここで、本実施例では、行切り出し後の各
行に対する文字切り出しの方法を示しているが、本処理
をそのまま行切り出しへ応用することも可能であり、か
かる場合には、予め設定する文字の平均サイズを文字の
高さとし、文字間サイズを行間とすることで、前述の処
理と同様に、正確に文字列の領域の切り出しが可能とな
る。
【0048】本発明の実行結果を図10、11に示す。
図10は、図8の濃度ヒストグラムを使用して切り出
し、切り出し失敗の発生した画像を、図8に示している
濃度ヒストグラムより、最適文字領域値を算出して、文
字切り出しを行った場合の結果である。次の図11は、
図9のばらつき度を使用して切り出し、切り出し失敗の
発生した画像を、図9に示している、ばらつき度を濃度
ヒストグラムのデータと仮定して最適文字領域値を算出
して、文字切り出しを行った場合の結果である。
【0049】図10、11いずれを見てもわかるよう
に、正確に、文字切り出しが行われている。また、しき
い値の設定に関しては、図10、11に示す、しきい値
変動可能範囲中のしきい値であれば、どのような値に設
定しても、正確に文字を切り出すことが可能であり、従
来の濃度ヒストグラム、ばらつき度等のの非常に微妙な
しきい値の設定に比べ、設定が容易となる。
【0050】特に、濃度ヒストグラム、ばらつき度を使
用した文字切り出しの失敗例を示す図8、9において
は、図中の文字全てを、正確に切り出すためのしきい値
は、存在せず(つまり、しきい値をどこに設定しても、
必ずいずれかの文字の切り出し失敗が発生する)、この
ようなデータから、図10、11に示すように、容易に
文字の切り出しが可能なデータを生成することができる
本発明は、非常に有効な手段であると言える。
【0051】また、図11に示すように、本発明の最適
文字領域算出処理は、濃度ヒストグラム以外のデータに
対しても適用可能であり、本発明は、応用性に富む発明
である。例えば、各画素における濃度の差分、差分の2
乗値等の累積値により作成した濃度差ヒストグラムを用
いても良い。さらには、文字情報の存在に対応して与え
られる関数なら、いかなるものでも利用できるのであ
る。
【0052】さらに、本発明は、文字の切り出しを対象
として説明してきたが、本手法により、文字列自体も切
り出せることも言うまでもない。したがって、文字列お
よび文字を切り出す手段を兼ね備え、与えられた文字情
報から、最初に文字列を、次に該文字列における文字を
切り出す装置も考えられる。
【0053】さらに、かかる装置においては、文字認識
手段を設け、該手段は、例えばパターンマッチング法等
によって、切り出された文字を認識せしめることも可能
である。かかる認識結果を出力する構成にしておけば、
一層使用しやすい装置を実現できることになる。ここで
認識結果としては、例えば当該認識手段が認識した文字
コードを出力するように構成しておけばよい。かかる認
識手段は、例えば、CPU、ROM、RAM、および格
納されたソフトウエア等によって実現できる。
【0054】さらに、出力手段としては、例えばプリン
ター等の印字装置、CRT、液晶、ELディスプレイ等
の表示装置等が考えられる。
【0055】
【発明の効果】本発明によれば、従来の技術で切り出し
が困難であった、刻印文字等の低品質な濃淡画像データ
より、高速かつ正確に、文字行および文字の切り出しが
可能となる。したがって、文字行および文字の切り出し
失敗による誤認識を減少せしめることが可能となり、文
字認識率の向上が達成できる。
【図面の簡単な説明】
【図1】本発明にかかる文字認識装置の構成図である。
【図2】本発明にかかる全体処理を示すフロー図であ
る。
【図3】最適文字領域算出処理の処理フロー図である。
【図4】最適文字領域算出処理の実行例の説明図であ
る。
【図5】刻印文字濃淡画像の特徴の説明図である。
【図6】濃度ヒストグラムの算出例である。
【図7】ばらつき度の算出例である。
【図8】濃度ヒストグラムを使用した方式による文字切
り出しの失敗例である。
【図9】ばらつき度を使用した方式による文字切り出し
の失敗例である。
【図10】最適文字領域値の算出例である。
【図11】最適文字領域値の算出例である。
【符号の説明】
1…撮像装置、2…電子計算機、21…画像データ記憶
手段、22…行切り出し手段、23…濃度ヒストグラム
算出手段、24…最適文字領域算出手段、25…文字切
り出し枠決定手段、26…文字認識手段、27…文字認
識辞書手段

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】入力された文字の濃淡画像データより、切
    り出し対象である文字画像が存在する領域を切り出す方
    法であって、文字画像の並んでいる領域である文字列に
    対して平行方向に存在する各画素に対応する座標ごと
    に、該座標における、前記文字列に対して垂直方向に存
    在する各画素の濃度値を累積した濃度ヒストグラムを生
    成し、前記各座標を中心として、予め設定した、処理対
    象たる文字の平均文字サイズから定まる領域における前
    記濃度ヒストグラムの平均値(文字領域濃度ヒストグラ
    ム平均値)と、前記、文字の平均サイズから定まる領域
    の左右に存在する、予め設定した文字間サイズ領域にお
    ける、前記濃度ヒストグラムの平均値(文字間領域濃度
    ヒストグラム平均値)を算出し、さらに、文字領域濃度
    ヒストグラム平均値が文字間領域濃度ヒストグラム平均
    値より大きな場合、その差を各座標ごとに算出し、該算
    出値を最適文字領域値とし、 さらに、該最適文字領域値と予め設定したしきい値との
    比較を行い、最適文字領域値がしきい値を越えた領域を
    示す座標値の最大幅を文字が存在する領域として、該領
    域を各座標について求めていき、該各領域における最適
    文字領域値が最大値を示す座標点を文字の中心座標とし
    て選出し、該中心座標を中心とし左右に、前記予め設定
    した文字の平均サイズで与えられる領域を付加した領域
    を、文字の切り出し枠として文字を切り出すことを特徴
    とする文字切り出し方法。
  2. 【請求項2】入力された文字を構成する画素の濃度デー
    タより、切り出し対象である文字画像が存在する領域を
    切り出す方法であって、文字画像の並んでいる領域であ
    る文字列に対して平行方向に存在する各画素に対応する
    座標ごとに、該座標における、前記文字列に対して垂直
    方向に存在する各画素の濃度差を算出し、その濃度差を
    累積した濃度差ヒストグラムを生成し、前記各座標を中
    心として、予め設定した、処理対象たる文字の平均文字
    サイズから定まる領域における、前記濃度差ヒストグラ
    ムの平均値(文字領域濃度差ヒストグラム平均値)と、
    前記、文字の平均サイズから定まる領域の左右に存在す
    る、予め設定した文字間サイズ領域における、前記濃度
    差ヒストグラムの平均値(文字間領域濃度差ヒストグラ
    ム平均値)を算出し、さらに、文字領域濃度差ヒストグ
    ラム平均値が文字間領域濃度差ヒストグラム平均値より
    大きな場合、その差を各座標ごとに算出し、該算出値を
    最適文字領域値とし、 さらに、該最適文字領域値と予め設定したしきい値との
    比較を行い、最適文字領域値がしきい値を越えた領域を
    示す座標値の最大幅を文字が存在する領域として、該領
    域を各座標について求めていき、該各領域における最適
    文字領域値が最大値を示す座標点を文字の中心座標とし
    て選出し、該中心座標を中心とし左右に、前記予め設定
    した文字の平均サイズで与えられる領域を付加した領域
    を、文字の切り出し枠として文字を切り出すことを特徴
    とする文字切り出し方法。
  3. 【請求項3】入力された文字列の濃淡画像データより、
    切り出し対象である文字列画像が存在する領域を切り出
    す方法であって、文字列画像に対し垂直方向に存在する
    各画素に対応する座標ごとに、該座標における、前記文
    字列に対して平行方向に存在する各画素の濃度値を累積
    した文字列濃度ヒストグラムを生成し、前記各座標を中
    心として、予め設定した、処理対象たる文字列の平均文
    字高さから定まる領域における前記文字列濃度ヒストグ
    ラムの平均値(文字列領域濃度ヒストグラム平均値)
    と、前記、文字列の平均文字高さから定まる領域の左右
    に存在する、予め設定した文字列間サイズの領域におけ
    る、前記文字列濃度ヒストグラムの平均値(文字列間領
    域濃度ヒストグラム平均値)を算出し、さらに、文字列
    領域濃度ヒストグラム平均値が文字列間領域濃度ヒスト
    グラム平均値より大きな場合、その差を各座標ごとに算
    出し、該算出値を最適文字列領域値とし、 さらに、該最適文字列領域値と予め設定したしきい値と
    の比較を行い、最適文字列領域値がしきい値を越えた領
    域を示す座標値の最大幅を文字列が存在する領域とし
    て、該領域を各座標について求めていき、該各領域にお
    ける最適文字列領域値が最大値を示す座標点を文字列の
    中心座標として選出し、該中心座標を中心とし左右に、
    前記予め設定した文字高さの平均サイズで与えられる領
    域を付加した領域を、文字列の切り出し枠として文字列
    を切り出すことを特徴とする文字列切り出し方法。
  4. 【請求項4】入力された文字列を構成する画素の濃度デ
    ータより、切り出し対象である文字列画像が存在する領
    域を切り出す方法であって、文字列画像に対し垂直方向
    に存在する各画素に対応する座標ごとに、該座標におけ
    る、前記文字列に対して平行方向に存在する各画素の濃
    度差を算出し、その濃度差を累積した文字列濃度差ヒス
    トグラムを生成し、前記各座標を中心として、予め設定
    した、処理対象たる文字列の平均文字高さから定まる領
    域における、前記文字列濃度差ヒストグラムの平均値
    (文字列領域濃度差ヒストグラム平均値)と、前記、文
    字列の平均文字高さから定まる領域の左右に存在する、
    予め設定した文字列間サイズの領域における、前記濃度
    差ヒストグラムの平均値(文字列間領域濃度差ヒストグ
    ラム平均値)を算出し、さらに、文字列領域濃度差ヒス
    トグラム平均値と文字列間領域濃度差ヒストグラム平均
    値より大きな場合、その差を各座標ごとに算出し、該算
    出値を最適文字列領域値とし、 さらに、該最適文字列領域値と予め設定したしきい値と
    の比較を行い、最適文字列領域値がしきい値を越えた領
    域を示す座標値の最大幅を文字列が存在する領域とし
    て、該領域を各座標について求めていき、該各領域にお
    ける最適文字列領域値が最大値を示す座標点を文字列の
    中心座標として選出し、該中心座標を中心とし左右に、
    前記予め設定した文字高さの平均サイズで与えられる領
    域を付加した領域を、文字列の切り出し枠として文字列
    を切り出すことを特徴とする文字列切り出し方法。
  5. 【請求項5】入力された文字列の濃淡画像データにもと
    づき、文字列画像に対し垂直方向に存在する各画素に対
    応する座標ごとに、該座標における、前記文字列に対し
    て平行方向に存在する各画素の濃度値を累積した文字列
    濃度ヒストグラムを生成する手段と、前記各座標を中心
    として、予め設定した、処理対象たる文字列の平均文字
    高さから定まる領域における前記文字列濃度ヒストグラ
    ムの平均値(文字列領域濃度ヒストグラム平均値)と、
    前記、文字列の平均文字高さから定まる領域の左右に存
    在する、予め設定した文字列間サイズの領域における、
    前記文字列濃度ヒストグラムの平均値(文字列間領域濃
    度ヒストグラム平均値)を算出し、さらに、文字列領域
    濃度ヒストグラム平均値が文字列間領域濃度ヒストグラ
    ム平均値より大きな場合、その差を各座標ごとに算出
    し、該算出値を最適文字列領域値とする手段と、該最適
    文字列領域値と予め設定したしきい値との比較を行い、
    最適文字列領域値がしきい値を越えた領域を示す座標値
    の最大幅を文字列が存在する領域として、該領域を各座
    標について求めていき、該各領域における最適文字列領
    域値が最大値を示す座標点を文字列の中心座標として選
    出し、該中心座標を中心とし左右に、前記予め設定した
    文字高さの平均サイズで与えられる領域を付加した領域
    を、文字列の切り出し枠として文字列を切り出す手段
    と、 入力された文字の濃淡画像データにもとづいて、文字画
    像の並んでいる領域である文字列に対して平行方向に存
    在する各画素に対応する座標ごとに、該座標における、
    前記文字列に対して垂直方向に存在する各画素の濃度値
    を累積した濃度ヒストグラムを生成する手段と、前記各
    座標を中心として、予め設定した、処理対象たる文字の
    平均文字サイズから定まる領域における前記濃度ヒスト
    グラムの平均値(文字領域濃度ヒストグラム平均値)
    と、前記、文字の平均サイズから定まる領域の左右に存
    在する、予め設定した文字間サイズ領域における、前記
    濃度ヒストグラムの平均値(文字間領域濃度ヒストグラ
    ム平均値)を算出し、さらに、文字領域濃度ヒストグラ
    ム平均値が文字間領域濃度ヒストグラム平均値より大き
    な場合、その差を各座標ごとに算出し、該算出値を最適
    文字領域値とする手段と、該最適文字領域値と予め設定
    したしきい値との比較を行い、最適文字領域値がしきい
    値を越えた領域を示す座標値の最大幅を文字が存在する
    領域として、該領域を各座標について求めていき、該各
    領域における最適文字領域値が最大値を示す座標点を文
    字の中心座標として選出し、該中心座標を中心とし左右
    に、前記予め設定した文字の平均サイズで与えられる領
    域を付加した領域を、文字の切り出し枠として文字を切
    り出す手段と、各切り出された文字の画像データを認識
    する手段と、認識結果の文字コードを出力する手段を有
    して構成される刻印文字認識装置。
  6. 【請求項6】入力された文字列の濃淡画像データにもと
    づき、文字列画像に対し垂直方向に存在する各画素に対
    応する座標ごとに、該座標における、前記文字列に対し
    て平行方向に存在する各画素の濃度値を累積した文字列
    濃度ヒストグラムを生成する手段と、前記各座標を中心
    として、予め設定した、処理対象たる文字列の平均文字
    高さから定まる領域における前記文字列濃度ヒストグラ
    ムの平均値(文字列領域濃度ヒストグラム平均値)と、
    前記、文字列の平均文字高さから定まる領域の左右に存
    在する、予め設定した文字列間サイズの領域における、
    前記文字列濃度ヒストグラムの平均値(文字列間領域濃
    度ヒストグラム平均値)を算出し、さらに、文字列領域
    濃度ヒストグラム平均値が文字列間領域濃度ヒストグラ
    ム平均値より大きな場合、その差を各座標ごとに算出
    し、該算出値を最適文字列領域値とする手段と、該最適
    文字列領域値と予め設定したしきい値との比較を行い、
    最適文字列領域値がしきい値を越えた領域を示す座標値
    の最大幅を文字列が存在する領域として、該領域を各座
    標について求めていき、該各領域における最適文字列領
    域値が最大値を示す座標点を文字列の中心座標として選
    出し、該中心座標を中心とし左右に、前記予め設定した
    文字高さの平均サイズで与えられる領域を付加した領域
    を、文字列の切り出し枠として文字列を切り出す手段
    と、 入力された文字を構成する画素の濃度データにもとづい
    て文字画像の並んでいる領域である文字列に対して平行
    方向に存在する各画素に対応する座標ごとに、該座標に
    おける、前記文字列に対して垂直方向に存在する各画素
    の濃度差を算出し、その濃度差を累積した濃度差ヒスト
    グラムを生成する手段と、前記各座標を中心として、予
    め設定した、処理対象たる文字の平均文字サイズから定
    まる領域における、前記濃度差ヒストグラムの平均値
    (文字領域濃度差ヒストグラム平均値)と、前記、文字
    の平均サイズから定まる領域の左右に存在する、予め設
    定した文字間サイズ領域における、前記濃度差ヒストグ
    ラムの平均値(文字間領域濃度差ヒストグラム平均値)
    を算出し、さらに、文字領域濃度差ヒストグラム平均値
    が文字間領域濃度差ヒストグラム平均値より大きな場
    合、その差を各座標ごとに算出し、該算出値を最適文字
    領域値とする手段と、該最適文字領域値と予め設定した
    しきい値との比較を行い、最適文字領域値がしきい値を
    越えた領域を示す座標値の最大幅を文字が存在する領域
    として、該領域を各座標について求めていき、該各領域
    における最適文字領域値が最大値を示す座標点を文字の
    中心座標として選出し、該中心座標を中心とし左右に、
    前記予め設定した文字の平均サイズで与えられる領域を
    付加した領域を、文字の切り出し枠として文字を切り出
    す手段と、各切り出された文字の画像データを認識する
    手段と、認識結果の文字コードを出力する手段を有して
    構成される刻印文字認識装置。
  7. 【請求項7】入力された文字列を構成する画素の濃度デ
    ータにもとづいて、文字列画像に対し垂直方向に存在す
    る各画素に対応する座標ごとに、該座標における、前記
    文字列に対して平行方向に存在する各画素の濃度差を算
    出し、その濃度差を累積した文字列濃度差ヒストグラム
    を生成する手段と、前記各座標を中心として、予め設定
    した、処理対象たる文字列の平均文字高さから定まる領
    域における、前記文字列濃度差ヒストグラムの平均値
    (文字列領域濃度差ヒストグラム平均値)と、前記、文
    字列の平均文字高さから定まる領域の左右に存在する、
    予め設定した文字列間サイズの領域における、前記濃度
    差ヒストグラムの平均値(文字列間領域濃度差ヒストグ
    ラム平均値)を算出し、さらに、文字列領域濃度差ヒス
    トグラム平均値と文字列間領域濃度差ヒストグラム平均
    値より大きな場合、その差を各座標ごとに算出し、該算
    出値を最適文字列領域値とする手段と、該最適文字列領
    域値と予め設定したしきい値との比較を行い、最適文字
    列領域値がしきい値を越えた領域を示す座標値の最大幅
    を文字列が存在する領域として、該領域を各座標につい
    て求めていき、該各領域における最適文字列領域値が最
    大値を示す座標点を文字列の中心座標として選出し、該
    中心座標を中心とし左右に、前記予め設定した文字高さ
    の平均サイズで与えられる領域を付加した領域を、文字
    列の切り出し枠として文字列を切り出す手段と、 入力された文字の濃淡画像データにもとづいて、文字画
    像の並んでいる領域である文字列に対して平行方向に存
    在する各画素に対応する座標ごとに、該座標における、
    前記文字列に対して垂直方向に存在する各画素の濃度値
    を累積した濃度ヒストグラムを生成する手段と、前記各
    座標を中心として、予め設定した、処理対象たる文字の
    平均文字サイズから定まる領域における前記濃度ヒスト
    グラムの平均値(文字領域濃度ヒストグラム平均値)
    と、前記、文字の平均サイズから定まる領域の左右に存
    在する、予め設定した文字間サイズ領域における、前記
    濃度ヒストグラムの平均値(文字間領域濃度ヒストグラ
    ム平均値)を算出し、さらに、文字領域濃度ヒストグラ
    ム平均値が文字間領域濃度ヒストグラム平均値より大き
    な場合、その差を各座標ごとに算出し、該算出値を最適
    文字領域値とする手段と、該最適文字領域値と予め設定
    したしきい値との比較を行い、最適文字領域値がしきい
    値を越えた領域を示す座標値の最大幅を文字が存在する
    領域として、該領域を各座標について求めていき、該各
    領域における最適文字領域値が最大値を示す座標点を文
    字の中心座標として選出し、該中心座標を中心とし左右
    に、前記予め設定した文字の平均サイズで与えられる領
    域を付加した領域を、文字の切り出し枠として文字を切
    り出す手段と、各切り出された文字の画像データを認識
    する手段と、認識結果の文字コードを出力する手段を有
    して構成される刻印文字認識装置。
  8. 【請求項8】入力された文字列を構成する画素の濃度デ
    ータにもとづいて、文字列画像に対し垂直方向に存在す
    る各画素に対応する座標ごとに、該座標における、前記
    文字列に対して平行方向に存在する各画素の濃度差を算
    出し、その濃度差を累積した文字列濃度差ヒストグラム
    を生成する手段と、前記各座標を中心として、予め設定
    した、処理対象たる文字列の平均文字高さから定まる領
    域における、前記文字列濃度差ヒストグラムの平均値
    (文字列領域濃度差ヒストグラム平均値)と、前記、文
    字列の平均文字高さから定まる領域の左右に存在する、
    予め設定した文字列間サイズの領域における、前記濃度
    差ヒストグラムの平均値(文字列間領域濃度差ヒストグ
    ラム平均値)を算出し、さらに、文字列領域濃度差ヒス
    トグラム平均値と文字列間領域濃度差ヒストグラム平均
    値より大きな場合、その差を各座標ごとに算出し、該算
    出値を最適文字列領域値とする手段と、該最適文字列領
    域値と予め設定したしきい値との比較を行い、最適文字
    列領域値がしきい値を越えた領域を示す座標値の最大幅
    を文字列が存在する領域として、該領域を各座標につい
    て求めていき、該各領域における最適文字列領域値が最
    大値を示す座標点を文字列の中心座標として選出し、該
    中心座標を中心とし左右に、前記予め設定した文字高さ
    の平均サイズで与えられる領域を付加した領域を、文字
    列の切り出し枠として文字列を切り出す手段と、 入力された文字を構成する画素の濃度データにもとづい
    て、文字画像の並んでいる領域である文字列に対して平
    行方向に存在する各画素に対応する座標ごとに、該座標
    における、前記文字列に対して垂直方向に存在する各画
    素の濃度差を算出し、その濃度差を累積した濃度差ヒス
    トグラムを生成する手段と、前記各座標を中心として、
    予め設定した、処理対象たる文字の平均文字サイズから
    定まる領域における、前記濃度差ヒストグラムの平均値
    (文字領域濃度差ヒストグラム平均値)と、前記、文字
    の平均サイズから定まる領域の左右に存在する、予め設
    定した文字間サイズ領域における、前記濃度差ヒストグ
    ラムの平均値(文字間領域濃度差ヒストグラム平均値)
    を算出し、さらに、文字領域濃度差ヒストグラム平均値
    が文字間領域濃度差ヒストグラム平均値より大きな場
    合、その差を各座標ごとに算出し、該算出値を最適文字
    領域値とする手段と、該最適文字領域値と予め設定した
    しきい値との比較を行い、最適文字領域値がしきい値を
    越えた領域を示す座標値の最大幅を文字が存在する領域
    として、該領域を各座標について求めていき、該各領域
    における最適文字領域値が最大値を示す座標点を文字の
    中心座標として選出し、該中心座標を中心とし左右に、
    前記予め設定した文字の平均サイズで与えられる領域を
    付加した領域を、文字の切り出し枠として文字を切り出
    す手段と、各切り出された文字の画像データを認識する
    手段と、認識結果の文字コードを出力する手段を有して
    構成される刻印文字認識装置。
JP5007798A 1993-01-20 1993-01-20 文字・文字列切り出し方法および文字認識装置 Pending JPH06215181A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5007798A JPH06215181A (ja) 1993-01-20 1993-01-20 文字・文字列切り出し方法および文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5007798A JPH06215181A (ja) 1993-01-20 1993-01-20 文字・文字列切り出し方法および文字認識装置

Publications (1)

Publication Number Publication Date
JPH06215181A true JPH06215181A (ja) 1994-08-05

Family

ID=11675663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5007798A Pending JPH06215181A (ja) 1993-01-20 1993-01-20 文字・文字列切り出し方法および文字認識装置

Country Status (1)

Country Link
JP (1) JPH06215181A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002216113A (ja) * 2001-01-16 2002-08-02 Fujitsu Ten Ltd 物体認識装置
JP2008097589A (ja) * 2006-09-13 2008-04-24 Keyence Corp 文字切り出し装置、方法およびプログラム
US8139862B2 (en) 2006-09-13 2012-03-20 Keyence Corporation Character extracting apparatus, method, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002216113A (ja) * 2001-01-16 2002-08-02 Fujitsu Ten Ltd 物体認識装置
JP2008097589A (ja) * 2006-09-13 2008-04-24 Keyence Corp 文字切り出し装置、方法およびプログラム
US8139862B2 (en) 2006-09-13 2012-03-20 Keyence Corporation Character extracting apparatus, method, and program
US8139861B2 (en) 2006-09-13 2012-03-20 Keyence Corporation Character extracting apparatus, method, and program

Similar Documents

Publication Publication Date Title
US7054485B2 (en) Image processing method, apparatus and system
US7715628B2 (en) Precise grayscale character segmentation apparatus and method
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
JP2761467B2 (ja) 画像切り出し装置及び文字認識装置
JP2014164528A (ja) 文字認識装置、文字認識方法及びプログラム
JP4565396B2 (ja) 画像処理装置および画像処理プログラム
JP2000251082A (ja) 文書画像傾き検出装置
JPH09311905A (ja) 行検出方法および文字認識装置
JP2006155126A (ja) 車両番号認識装置
JPH06215181A (ja) 文字・文字列切り出し方法および文字認識装置
CN113537216B (zh) 一种点阵字体文本行倾斜校正方法及装置
JP3303246B2 (ja) 画像処理装置
JP3331095B2 (ja) 車載用画像処理装置
JP2011018175A (ja) 文字認識装置及び文字認識方法
JP2827960B2 (ja) 宛名行抽出装置
JP3311551B2 (ja) イメージデータ入力処理方法およびその装置
CN115700824A (zh) 文字分割方法、电子设备及存储介质
JPH0816719A (ja) 文字切り出し方法とこれを用いた文字認識方法及び装置
JP2007328652A (ja) 画像処理装置および画像処理プログラム
JP2003271897A (ja) 文字認識装置、画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JP2612383B2 (ja) 文字認識処理方式
JP3381803B2 (ja) 傾き角検出装置
CN117252767A (zh) 文本图片矫正方法及装置
JPH04291479A (ja) 罫線認識方法及び表処理方法