JPH06215181A

JPH06215181A - 文字・文字列切り出し方法および文字認識装置

Info

Publication number: JPH06215181A
Application number: JP5007798A
Authority: JP
Inventors: Shigeru Owada; 茂大和田
Original assignee: Hitachi Engineering Co Ltd
Current assignee: Hitachi Engineering Co Ltd
Priority date: 1993-01-20
Filing date: 1993-01-20
Publication date: 1994-08-05

Abstract

(57)【要約】【目的】刻印文字等の低品質な濃淡文字画像から、正確
かつ高速に所望の文字を切り出す手段を提供すること。【構成】例えば、撮像装置１、画像データ記憶手段２
１、行切り出し手段２２、濃度ヒストグラム算出手段２
３、最適文字領域算出手段２４、文字切り出し枠決定手
段２５、文字認識手段２６、および文字認識辞書手段２
７を有して構成される。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ＣＣＤカメラ等の撮像
装置より入力された濃淡文字画像データにもとづき、文
字を切り出す方法に係り、特に、刻印文字画像等の低品
質な濃淡画像データから文字を切り出すのに好適な処理
方法および該方法を使用した文字認識装置に関する。

【０００２】

【従来の技術】従来、刻印文字画像等の濃淡画像データ
からの、いわゆる文字切り出しは、特開昭６１−２０１
３８４号公報記載のように、最初に２値化のための最適
なしきい値を算出し、該しきい値により対象画像データ
を２値化信号とし、該２値化された画像データにもとづ
き垂直射影ヒストグラム等を作成して、文字切り出しを
行う方法が考えられている。

【０００３】しかしながら、刻印文字画像には、図５に
示すように不要なノイズが多く混入しあい、背景と文字
線の濃度の差が少なく、照明装置の影響により、文字線
の濃度反転が発生する等の弊害があるため、一般に、１
つのしきい値によって、正しい２値化データの作成が行
えるような、最適なしきい値の算出は困難であるといえ
る。

【０００４】また、かかる問題点に対し、特開平２−１
８８８９０号公報記載のような、濃淡画像データを各小
領域に分割し、その分割領域ごとに最適な、２値化のた
めのしきい値を設定して、画像データを２値化する方法
が提案されている。

【０００５】さらに、刻印文字画像データの２値化を行
わずに、濃淡画像のまま文字を切り出す方法も存在し、
かかる方法においては、データ２値化後に使用する垂直
射影ヒストグラムと同様に、各画素の濃度を累積した濃
度ヒストグラムを用いる手法や、「電子情報通信学会論
文誌Ｄ−ＩＩ Vol.J72-D-ＩＩ No.9（１９８９年）１
４０７〜１４１４頁」記載のように、各隣接する画素の
濃度差（「ばらつき度」と称している）を用いて切り出
す方法が考えだされている。

【０００６】図６に、濃度ヒストグラムの算出例を、図
７に、ばらつき度の算出例をそれぞれ示す。図６、７に
は、最適なしきい値が得られたと仮定した場合（実際に
は、この最適なしきい値を求めることが困難である場合
が多い）の文字切り出し成功例を記載しており、しきい
値との比較を行うことにより、図中の文字切り出し枠を
得ている。

【０００７】

【発明が解決しようとする課題】さて、前記各分割領域
ごとに２値化のしきい値を算出し、濃淡画像データを２
値化した後文字を切り出す方法では、図５に示すよう
に、文字のうちある部分のみに濃度反転が発生している
場合には、正確な２値化が行われないという問題、ある
いは、文字切り出し処理のための時間がかかるという問
題を有している。また、濃度ヒストグラムを用いた処理
方法では、背景と文字線の濃度差が大きく、かつ、背景
の濃度が一定である場合には有効であるものの、前述の
ように、刻印文字画像は、背景の濃度の変動、ノイズ等
が発生しやすいため、正確に文字を切り出せない場合が
頻繁に発生する。

【０００８】図８に、濃度ヒストグラムを用いた手法に
よる文字切り出しの失敗例を示す。図８に示すように、
文字列領域中で濃度の変化、ノイズが発生している場合
等には、算出した濃度ヒストグラムが複雑な形状を有す
るため、しきい値の設定が、非常に困難となり、図８下
段図に示すように、文字の切り出し失敗が発生してしま
う場合多い（本図では、文字「３」において、切り出し
失敗が発生している）。また、特に、図８にて示す場
合は、この濃度ヒストグラムの形状を見てもわかるよう
に、全ての文字を正確に切り出すためのしきい値の設定
は、殆ど不可能であることがわかり、またかかる状況は
実際には頻繁に発生することも経験的事実の示すところ
である。

【０００９】さらに、以上のべてきた２値化を用いた方
法や、濃度をそのまま用いた方法では、処理前に文字線
と背景の濃度の関係、すなわち、文字線の濃度が高く、
背景の濃度が低いか、あるいは、文字線の濃度が低く、
背景の濃度が高いかを予め判定、あるいは、設定する必
要があるという問題点もあわせ持っており、刻印文字の
ように、撮像対象物の向きによっては、文字線と背景の
濃度反転が頻繁に発生するような場合には、上記方法で
はできない。

【００１０】次に、隣接画素の濃度差（ばらつき度）を
用いた処理方法では、文字線から背景への変化部分や、
背景から文字線への変化部分における「濃度差」を利用
しているため、前記文字線と背景の濃度の関係を予め判
定、あるいは、設定する必要はないが、その濃度差の値
が非常に微小であったり、濃度差を算出する走査方向
に、文字線部分しか存在しない、例えば縦棒１本の部分
等や、走査方向に文字線部分が少ししか存在しない、例
えば横棒１本のみの部分等では、その特徴があらわれに
くく、切り出し失敗が頻繁に発生する問題を有してい
る。

【００１１】図９に、ばらつき度を用いた処理方法にお
ける失敗例を示す。図９に示すように、「３」や「６」
等の文字の構成を考慮すると、３本の横棒が通っている
ため、文字のばらつき度はかなり大きくなり、文字切り
出しを容易に行えるが、一方「１」や「７」等の文字の
構成を考慮すると、縦棒１本や横棒１本の部分のばらつ
き度は低くなっており、文字切り出し失敗が（図９で
は、文字「１」を２つに分離して切り出してしまってい
る）発生しやすい。

【００１２】すなわち、ばらつき度は、文字の形状によ
って、その出力のされやすさに直接の影響を受けるもの
であると言うことができる。また、特に図９に示す場合
には、このばらつき度にもとずき、全ての文字を正確に
切り出すためのしきい値の設定は不可能であり、このよ
うな状況も実際には頻繁に発生する。

【００１３】さらに、図６と図９は、同じ濃淡文字画像
データであるが、この画像データに対し、濃度ヒストグ
ラムを用いた手法によっては、正確に文字を切り出すこ
とができるが、ばらつき度を用いた手法によっては、正
確に文字を切り出すことはできない。同様に、図７と図
８は、同じ濃淡文字画像データであるが、この画像デー
タに対し、濃度ヒストグラムを用いた手法によっては、
正確に文字を切り出せないが、ばらつき度を用いた手法
によっては、正確に文字を切り出している。

【００１４】このことから、濃度ヒストグラムとばらつ
き度は、相反する弱点を有する処理方法であるというこ
とが言える。本発明の目的は、このような濃度ヒストグ
ラム、ばらつき度を用いた手法の弱点を克服し、正確に
文字を切り出す方法および装置を提供することにある。

【００１５】特に、本処理方法の従来技術との相違点
は、従来技術では、文字の両端の座標を、濃度ヒストグ
ラム、ばらつき度等のデータを用いて検出するのである
が、本方法では、各画素の座標を中心に考えた場合、該
中心点に文字の存在する確率として、「最適文字領域
値」を算出しており、その最大の点、すなわち、文字の
中心の座標を求めて文字を切り出す点である。上記手法
は文字のみならず、文字列も扱える。

【００１６】

【課題を解決するための手段】上記課題を解決するた
め、以下の手段が考えられる。入力された文字の濃淡画
像データより、切り出し対象である文字画像が存在する
領域を切り出す方法であって、文字画像の並んでいる領
域である文字列に対して平行方向に存在する各画素に対
応する座標ごとに、該座標における、前記文字列に対し
て垂直方向に存在する各画素の濃度値を累積した濃度ヒ
ストグラムを生成し、前記各座標を中心として、予め設
定した、処理対象たる文字の平均文字サイズから定まる
領域における前記濃度ヒストグラムの平均値（文字領域
濃度ヒストグラム平均値）と、前記、文字の平均サイズ
から定まる領域の左右に存在する、予め設定した文字間
サイズ領域における、前記濃度ヒストグラムの平均値
（文字間領域濃度ヒストグラム平均値）を算出し、さら
に、文字領域濃度ヒストグラム平均値が文字間領域濃度
ヒストグラム平均値より大きな場合、その差を各座標ご
とに算出し、該算出値を最適文字領域値とし、さらに、
該最適文字領域値と予め設定したしきい値との比較を行
い、最適文字領域値がしきい値を越えた領域を示す座標
値の最大幅を文字が存在する領域として、該領域を各座
標について求めていき、該各領域における最適文字領域
値が最大値を示す座標点を文字の中心座標として選出
し、該中心座標を中心とし左右に、前記予め設定した文
字の平均サイズで与えられる領域を付加した領域を、文
字の切り出し枠として文字を切り出す方法である。

【００１７】また、入力された文字を構成する画素の濃
度データより、切り出し対象である文字画像が存在する
領域を切り出す方法であって、文字画像の並んでいる領
域である文字列に対して平行方向に存在する各画素に対
応する座標ごとに、該座標における、前記文字列に対し
て垂直方向に存在する各画素の濃度差を算出し、その濃
度差を累積した濃度差ヒストグラムを生成し、前記各座
標を中心として、予め設定した、処理対象たる文字の平
均文字サイズから定まる領域における、前記濃度差ヒス
トグラムの平均値（文字領域濃度差ヒストグラム平均
値）と、前記、文字の平均サイズから定まる領域の左右
に存在する、予め設定した文字間サイズ領域における、
前記濃度差ヒストグラムの平均値（文字間領域濃度差ヒ
ストグラム平均値）を算出し、さらに、文字領域濃度差
ヒストグラム平均値が文字間領域濃度差ヒストグラム平
均値より大きな場合、その差を各座標ごとに算出し、該
算出値を最適文字領域値とし、さらに、該最適文字領域
値と予め設定したしきい値との比較を行い、最適文字領
域値がしきい値を越えた領域を示す座標値の最大幅を文
字が存在する領域として、該領域を各座標について求め
ていき、該各領域における最適文字領域値が最大値を示
す座標点を文字の中心座標として選出し、該中心座標を
中心とし左右に、前記予め設定した文字の平均サイズで
与えられる領域を付加した領域を、文字の切り出し枠と
して文字を切り出す文字切り出し方法も考えられる。さ
らに、入力された文字列の濃淡画像データより、切り出
し対象である文字列画像が存在する領域を切り出す方法
であって、文字列画像に対し垂直方向に存在する各画素
に対応する座標ごとに、該座標における、前記文字列に
対して平行方向に存在する各画素の濃度値を累積した文
字列濃度ヒストグラムを生成し、前記各座標を中心とし
て、予め設定した、処理対象たる文字列の平均文字高さ
から定まる領域における前記文字列濃度ヒストグラムの
平均値（文字列領域濃度ヒストグラム平均値）と、前
記、文字列の平均文字高さから定まる領域の左右に存在
する、予め設定した文字列間サイズの領域における、前
記文字列濃度ヒストグラムの平均値（文字列間領域濃度
ヒストグラム平均値）を算出し、さらに、文字列領域濃
度ヒストグラム平均値が文字列間領域濃度ヒストグラム
平均値より大きな場合、その差を各座標ごとに算出し、
該算出値を最適文字列領域値とし、さらに、該最適文字
列領域値と予め設定したしきい値との比較を行い、最適
文字列領域値がしきい値を越えた領域を示す座標値の最
大幅を文字列が存在する領域として、該領域を各座標に
ついて求めていき、該各領域における最適文字列領域値
が最大値を示す座標点を文字列の中心座標として選出
し、該中心座標を中心とし左右に、前記予め設定した文
字高さの平均サイズで与えられる領域を付加した領域
を、文字列の切り出し枠として文字列を切り出す文字列
切り出し方法も考えられる。

【００１８】加えて、入力された文字列を構成する画素
の濃度データより、切り出し対象である文字列画像が存
在する領域を切り出す方法であって、文字列画像に対し
垂直方向に存在する各画素に対応する座標ごとに、該座
標における、前記文字列に対して平行方向に存在する各
画素の濃度差を算出し、その濃度差を累積した文字列濃
度差ヒストグラムを生成し、前記各座標を中心として、
予め設定した、処理対象たる文字列の平均文字高さから
定まる領域における、前記文字列濃度差ヒストグラムの
平均値（文字列領域濃度差ヒストグラム平均値）と、前
記、文字列の平均文字高さから定まる領域の左右に存在
する、予め設定した文字列間サイズの領域における、前
記濃度差ヒストグラムの平均値（文字列間領域濃度差ヒ
ストグラム平均値）を算出し、さらに、文字列領域濃度
差ヒストグラム平均値と文字列間領域濃度差ヒストグラ
ム平均値より大きな場合、その差を各座標ごとに算出
し、該算出値を最適文字列領域値とし、さらに、該最適
文字列領域値と予め設定したしきい値との比較を行い、
最適文字列領域値がしきい値を越えた領域を示す座標値
の最大幅を文字列が存在する領域として、該領域を各座
標について求めていき、該各領域における最適文字列領
域値が最大値を示す座標点を文字列の中心座標として選
出し、該中心座標を中心とし左右に、前記予め設定した
文字高さの平均サイズで与えられる領域を付加した領域
を、文字列の切り出し枠として文字列を切り出す文字列
切り出し方法でもよい。

【００１９】上記方法を用い、文字列および文字の切り
出しを行う手段として、以下の手段が考えられる。

【００２０】まず、入力された文字列の濃淡画像データ
にもとづき、文字列画像に対し垂直方向に存在する各画
素に対応する座標ごとに、該座標における、前記文字列
に対して平行方向に存在する各画素の濃度値を累積した
文字列濃度ヒストグラムを生成する手段と、前記各座標
を中心として、予め設定した、処理対象たる文字列の平
均文字高さから定まる領域における前記文字列濃度ヒス
トグラムの平均値（文字列領域濃度ヒストグラム平均
値）と、前記、文字列の平均文字高さから定まる領域の
左右に存在する、予め設定した文字列間サイズの領域に
おける、前記文字列濃度ヒストグラムの平均値（文字列
間領域濃度ヒストグラム平均値）を算出し、さらに、文
字列領域濃度ヒストグラム平均値が文字列間領域濃度ヒ
ストグラム平均値より大きな場合、その差を各座標ごと
に算出し、該算出値を最適文字列領域値とする手段と、
該最適文字列領域値と予め設定したしきい値との比較を
行い、最適文字列領域値がしきい値を越えた領域を示す
座標値の最大幅を文字列が存在する領域として、該領域
を各座標について求めていき、該各領域における最適文
字列領域値が最大値を示す座標点を文字列の中心座標と
して選出し、該中心座標を中心とし左右に、前記予め設
定した文字高さの平均サイズで与えられる領域を付加し
た領域を、文字列の切り出し枠として文字列を切り出す
手段と、入力された文字の濃淡画像データにもとづい
て、文字画像の並んでいる領域である文字列に対して平
行方向に存在する各画素に対応する座標ごとに、該座標
における、前記文字列に対して垂直方向に存在する各画
素の濃度値を累積した濃度ヒストグラムを生成する手段
と、前記各座標を中心として、予め設定した、処理対象
たる文字の平均文字サイズから定まる領域における前記
濃度ヒストグラムの平均値（文字領域濃度ヒストグラム
平均値）と、前記、文字の平均サイズから定まる領域の
左右に存在する、予め設定した文字間サイズ領域におけ
る、前記濃度ヒストグラムの平均値（文字間領域濃度ヒ
ストグラム平均値）を算出し、さらに、文字領域濃度ヒ
ストグラム平均値が文字間領域濃度ヒストグラム平均値
より大きな場合、その差を各座標ごとに算出し、該算出
値を最適文字領域値とする手段と、該最適文字領域値と
予め設定したしきい値との比較を行い、最適文字領域値
がしきい値を越えた領域を示す座標値の最大幅を文字が
存在する領域として、該領域を各座標について求めてい
き、該各領域における最適文字領域値が最大値を示す座
標点を文字の中心座標として選出し、該中心座標を中心
とし左右に、前記予め設定した文字の平均サイズで与え
られる領域を付加した領域を、文字の切り出し枠として
文字を切り出す手段と、各切り出された文字の画像デー
タを認識する手段と、認識結果の文字コードを出力する
手段を有して構成される刻印文字認識装置である。

【００２１】また、入力された文字列の濃淡画像データ
にもとづき、文字列画像に対し垂直方向に存在する各画
素に対応する座標ごとに、該座標における、前記文字列
に対して平行方向に存在する各画素の濃度値を累積した
文字列濃度ヒストグラムを生成する手段と、前記各座標
を中心として、予め設定した、処理対象たる文字列の平
均文字高さから定まる領域における前記文字列濃度ヒス
トグラムの平均値（文字列領域濃度ヒストグラム平均
値）と、前記、文字列の平均文字高さから定まる領域の
左右に存在する、予め設定した文字列間サイズの領域に
おける、前記文字列濃度ヒストグラムの平均値（文字列
間領域濃度ヒストグラム平均値）を算出し、さらに、文
字列領域濃度ヒストグラム平均値が文字列間領域濃度ヒ
ストグラム平均値より大きな場合、その差を各座標ごと
に算出し、該算出値を最適文字列領域値とする手段と、
該最適文字列領域値と予め設定したしきい値との比較を
行い、最適文字列領域値がしきい値を越えた領域を示す
座標値の最大幅を文字列が存在する領域として、該領域
を各座標について求めていき、該各領域における最適文
字列領域値が最大値を示す座標点を文字列の中心座標と
して選出し、該中心座標を中心とし左右に、前記予め設
定した文字高さの平均サイズで与えられる領域を付加し
た領域を、文字列の切り出し枠として文字列を切り出す
手段と、入力された文字を構成する画素の濃度データに
もとづいて文字画像の並んでいる領域である文字列に対
して平行方向に存在する各画素に対応する座標ごとに、
該座標における、前記文字列に対して垂直方向に存在す
る各画素の濃度差を算出し、その濃度差を累積した濃度
差ヒストグラムを生成する手段と、前記各座標を中心と
して、予め設定した、処理対象たる文字の平均文字サイ
ズから定まる領域における、前記濃度差ヒストグラムの
平均値（文字領域濃度差ヒストグラム平均値）と、前
記、文字の平均サイズから定まる領域の左右に存在す
る、予め設定した文字間サイズ領域における、前記濃度
差ヒストグラムの平均値（文字間領域濃度差ヒストグラ
ム平均値）を算出し、さらに、文字領域濃度差ヒストグ
ラム平均値が文字間領域濃度差ヒストグラム平均値より
大きな場合、その差を各座標ごとに算出し、該算出値を
最適文字領域値とする手段と、該最適文字領域値と予め
設定したしきい値との比較を行い、最適文字領域値がし
きい値を越えた領域を示す座標値の最大幅を文字が存在
する領域として、該領域を各座標について求めていき、
該各領域における最適文字領域値が最大値を示す座標点
を文字の中心座標として選出し、該中心座標を中心とし
左右に、前記予め設定した文字の平均サイズで与えられ
る領域を付加した領域を、文字の切り出し枠として文字
を切り出す手段と、各切り出された文字の画像データを
認識する手段と、認識結果の文字コードを出力する手段
を有して構成される刻印文字認識装置でもよい。

【００２２】さらに、入力された文字列を構成する画素
の濃度データにもとづいて、文字列画像に対し垂直方向
に存在する各画素に対応する座標ごとに、該座標におけ
る、前記文字列に対して平行方向に存在する各画素の濃
度差を算出し、その濃度差を累積した文字列濃度差ヒス
トグラムを生成する手段と、前記各座標を中心として、
予め設定した、処理対象たる文字列の平均文字高さから
定まる領域における、前記文字列濃度差ヒストグラムの
平均値（文字列領域濃度差ヒストグラム平均値）と、前
記、文字列の平均文字高さから定まる領域の左右に存在
する、予め設定した文字列間サイズの領域における、前
記濃度差ヒストグラムの平均値（文字列間領域濃度差ヒ
ストグラム平均値）を算出し、さらに、文字列領域濃度
差ヒストグラム平均値と文字列間領域濃度差ヒストグラ
ム平均値より大きな場合、その差を各座標ごとに算出
し、該算出値を最適文字列領域値とする手段と、該最適
文字列領域値と予め設定したしきい値との比較を行い、
最適文字列領域値がしきい値を越えた領域を示す座標値
の最大幅を文字列が存在する領域として、該領域を各座
標について求めていき、該各領域における最適文字列領
域値が最大値を示す座標点を文字列の中心座標として選
出し、該中心座標を中心とし左右に、前記予め設定した
文字高さの平均サイズで与えられる領域を付加した領域
を、文字列の切り出し枠として文字列を切り出す手段
と、入力された文字の濃淡画像データにもとづいて、文
字画像の並んでいる領域である文字列に対して平行方向
に存在する各画素に対応する座標ごとに、該座標におけ
る、前記文字列に対して垂直方向に存在する各画素の濃
度値を累積した濃度ヒストグラムを生成する手段と、前
記各座標を中心として、予め設定した、処理対象たる文
字の平均文字サイズから定まる領域における前記濃度ヒ
ストグラムの平均値（文字領域濃度ヒストグラム平均
値）と、前記、文字の平均サイズから定まる領域の左右
に存在する、予め設定した文字間サイズ領域における、
前記濃度ヒストグラムの平均値（文字間領域濃度ヒスト
グラム平均値）を算出し、さらに、文字領域濃度ヒスト
グラム平均値が文字間領域濃度ヒストグラム平均値より
大きな場合、その差を各座標ごとに算出し、該算出値を
最適文字領域値とする手段と、該最適文字領域値と予め
設定したしきい値との比較を行い、最適文字領域値がし
きい値を越えた領域を示す座標値の最大幅を文字が存在
する領域として、該領域を各座標について求めていき、
該各領域における最適文字領域値が最大値を示す座標点
を文字の中心座標として選出し、該中心座標を中心とし
左右に、前記予め設定した文字の平均サイズで与えられ
る領域を付加した領域を、文字の切り出し枠として文字
を切り出す手段と、各切り出された文字の画像データを
認識する手段と、認識結果の文字コードを出力する手段
を有して構成される刻印文字認識装置も考えられる。

【００２３】加えて、入力された文字列を構成する画素
の濃度データにもとづいて、文字列画像に対し垂直方向
に存在する各画素に対応する座標ごとに、該座標におけ
る、前記文字列に対して平行方向に存在する各画素の濃
度差を算出し、その濃度差を累積した文字列濃度差ヒス
トグラムを生成する手段と、前記各座標を中心として、
予め設定した、処理対象たる文字列の平均文字高さから
定まる領域における、前記文字列濃度差ヒストグラムの
平均値（文字列領域濃度差ヒストグラム平均値）と、前
記、文字列の平均文字高さから定まる領域の左右に存在
する、予め設定した文字列間サイズの領域における、前
記濃度差ヒストグラムの平均値（文字列間領域濃度差ヒ
ストグラム平均値）を算出し、さらに、文字列領域濃度
差ヒストグラム平均値と文字列間領域濃度差ヒストグラ
ム平均値より大きな場合、その差を各座標ごとに算出
し、該算出値を最適文字列領域値とする手段と、該最適
文字列領域値と予め設定したしきい値との比較を行い、
最適文字列領域値がしきい値を越えた領域を示す座標値
の最大幅を文字列が存在する領域として、該領域を各座
標について求めていき、該各領域における最適文字列領
域値が最大値を示す座標点を文字列の中心座標として選
出し、該中心座標を中心とし左右に、前記予め設定した
文字高さの平均サイズで与えられる領域を付加した領域
を、文字列の切り出し枠として文字列を切り出す手段
と、入力された文字を構成する画素の濃度データにもと
づいて、文字画像の並んでいる領域である文字列に対し
て平行方向に存在する各画素に対応する座標ごとに、該
座標における、前記文字列に対して垂直方向に存在する
各画素の濃度差を算出し、その濃度差を累積した濃度差
ヒストグラムを生成する手段と、前記各座標を中心とし
て、予め設定した、処理対象たる文字の平均文字サイズ
から定まる領域における、前記濃度差ヒストグラムの平
均値（文字領域濃度差ヒストグラム平均値）と、前記、
文字の平均サイズから定まる領域の左右に存在する、予
め設定した文字間サイズ領域における、前記濃度差ヒス
トグラムの平均値（文字間領域濃度差ヒストグラム平均
値）を算出し、さらに、文字領域濃度差ヒストグラム平
均値が文字間領域濃度差ヒストグラム平均値より大きな
場合、その差を各座標ごとに算出し、該算出値を最適文
字領域値とする手段と、該最適文字領域値と予め設定し
たしきい値との比較を行い、最適文字領域値がしきい値
を越えた領域を示す座標値の最大幅を文字が存在する領
域として、該領域を各座標について求めていき、該各領
域における最適文字領域値が最大値を示す座標点を文字
の中心座標として選出し、該中心座標を中心とし左右
に、前記予め設定した文字の平均サイズで与えられる領
域を付加した領域を、文字の切り出し枠として文字を切
り出す手段と、各切り出された文字の画像データを認識
する手段と、認識結果の文字コードを出力する手段を有
して構成される刻印文字認識装置も好ましい。

【００２４】

【作用】本発明の目的は、濃度ヒストグラム生成処理
と、最適文字領域算出処理と、文字切り出し枠決定処理
手段を有して構成される手段により達成される。本発明
では、特に最適文字領域算出処理を設けたことにより、
文字の両端の座標ではなく、文字の中心の座標を検出し
て、文字切り出しを行うことが特徴である。上記構成に
より、濃度ヒストグラム算出処理は、入力された濃淡文
字画像データにもとづき、文字列領域中の文字列と平行
に存在する各画素の座標ごとに、文字列と直角に存在す
る各画素の濃度を累積した濃度ヒストグラムを求め、こ
れを最適文字領域算出処理へ出力するように動作する。
最適文字領域算出処理は、文字列と平行に存在する各画
素の座標ごとに、その座標を中心とし、予め設定した文
字の平均サイズの領域における濃度ヒストグラムの平均
値（「文字領域濃度ヒストグラム平均値」と称する）
と、その文字の平均サイズの領域の左右の外側の予め設
定した文字間サイズの領域における、濃度ヒストグラム
の平均値（「文字間領域濃度ヒストグラム平均値」と称
する）を算出し、文字領域濃度ヒストグラム平均値が、
文字間領域濃度ヒストグラム平均値より大きい場合に、
その差を、その座標における最適文字領域値として記憶
し、それを、文字切り出し枠決定処理手段へ出力するよ
うに動作する。

【００２５】文字切り出し枠決定処理手段は、予め設定
したしきい値と、前記最適文字領域値の比較を行い、し
きい値以上となっている最適文字領域値のグループを求
め、その各グループごとに、最適文字領域値の最大値と
なっている座標を算出する。次に、その各最大値の座標
を文字の中心として、予め設定した文字の平均サイズ分
だけ座標を拡げることにより、文字切り出し枠を決定す
るようにして、最終的に文字を切り出す。

【００２６】なお、上記手法は文字の切り出しのみでな
く、文字列の切り出しも行えることはいうまでもない。
さらに、各画素における濃度を累積した濃度ヒストグラ
ムの、もならず、各画素における濃度の差分、差分の２
乗値を累積した濃度差ヒストグラムのほか、文字の存在
に対応して与えられる関数なら何でも利用できることも
言うまでもない。

【００２７】

【実施例】以下に、本発明の実施例について図面を参照
して説明する。図１に、本発明を使用した文字認識装置
の構成図の一例を示す。本文字認識装置１は、撮像装置
１および電子計算機２を有して構成され、さらに、電子
計算機２は、画像データ記憶手段２１、行切り出し手段
２２、濃度ヒストグラム算出手段２３、最適文字領域算
出手段２４、文字切り出し枠決定手段２５、文字認識手
段２６、および文字認識辞書手段２７を備えて構成され
ている。

【００２８】なお、撮像装置１を除く各手段は、例え
ば、ＣＰＵ、ＲＯＭ、ＲＡＭ、Ｃ−ＭＯＳ等の電子デバ
イスおよび所定の記憶手段に格納されたソフトウエアに
よって実現される。

【００２９】ＣＣＤカメラ等の撮像装置１により入力さ
れた濃淡文字画像データは、電子計算機２に備えられた
画像データ記憶手段２１に記憶される。行切り出し手段
２２は、前記画像データ記憶手段２１内に格納されてい
る画像データにより、文字列領域の座標を算出する手段
である。濃度ヒストグラム生成手段２３は、前記文字列
領域の座標の示す画像データ記憶手段２１内の画像デー
タより、文字列と平行に存在する各画素の座標ごとの濃
度ヒストグラムを生成する手段である。また、最適文字
領域算出手段２４は、作成された濃度ヒストグラムよ
り、予め設定した、文字の平均サイズおよび文字間サイ
ズを使用して、各座標ごとの最適文字領域値を算出する
手段である。また、文字切り出し枠決定手段２５は、前
記最適文字領域値と予め設定した、しきい値との比較を
行い、文字画像の中心座標を算出し、これにより、文字
の切り出し枠の座標を決定する手段である。

【００３０】さらに、文字認識手段２６は、前記文字切
り出し枠の座標の示す画像データ記憶手段２１内の画像
データと、文字認識辞書手段２７中の辞書とを、パター
ンマッチング等の認識方式を用いて認識し、得られた文
字コードを出力する手段である。なお、図示していない
が文字認識手段２６の出力結果を表示するための表示手
段（例えば、ＣＲＴ、液晶ディスプレイ等）、印字手段
（プリンター等）等を備えた構成にするのが好ましい。

【００３１】次に、図２に、本発明の全体処理フローを
示す。ステップ１０１では、前記画像データ記憶手段２
１に格納されている画像データより、文字列と直角方向
に存在する各画素の座標ごとに、例えば、文字列と平行
方向に存在する各画素の濃度を累積した濃度ヒストグラ
ムを求め、その濃度ヒストグラムと、予め設定したしき
い値との比較により、文字列ごとの領域の座標を算出す
る。これにより、いわゆる文字行の切り出し処理が完了
する。次にステップ１０２では、前記算出された文字列
全てに対し、ステップ１０３〜１０５の処理を行うよう
にする。まず、ステップ１０３では、前記文字列の画像
データより、文字列と平行方向に存在する各画素の座標
ごとに、文字列と直角方向に存在する各画素の濃度を累
積した濃度ヒストグラムを作成する。

【００３２】次のステップ１０４における処理について
は、図３、４を参照して説明する。

【００３３】図３は、最適文字領域算出手段２４の動作
をフローにて示している。図４は、文字「６」と「Ｌ」
の最適文字領域値の算出例を示しており、（ａ）は、文
字画像の例（実際は、濃淡画像であるが、簡単のため２
値画像を記載している）、（ｂ）は、その画像の文字列
と平行方向に存在する各画素の座標ごとの濃度ヒストグ
ラムの作成例であり、各座標ごとの濃度ヒストグラムの
値を、以下に示す表１に示している。また、（ｃ）は、
前記濃度ヒストグラムより算出した各座標ごとの最適文
字領域値の例であり、各座標ごとの最適文字領域値を、
以下に示す表２に記す。（ｄ）は、（ｃ）の最適文字領
域値より文字切り出し枠を算出した結果を示している。

【００３４】

【表１】

【００３５】

【表２】

【００３６】さて、ステップ２０１では、前記濃度ヒス
トグラムの全座標に対し、ステップ２０２〜２０６の処
理を行うようにする。

【００３７】ステップ２０２では、濃度ヒストグラムの
ある座標を中心として、予め設定した文字の平均サイズ
の領域での濃度ヒストグラムの平均値を算出する。ここ
で、予め設定した文字の平均サイズとは、文字幅の平均
値であり、文字の平均サイズを、例えば「７」と仮定し
て、図４（ｂ）の座標７を例にとって説明すると、座標
７を中心とした文字の平均サイズ７の文字領域の座標
は、座標４〜座標１０であるので、文字領域の濃度ヒス
トグラムの合計は、表１より、１３０＋１００＋１１０＋９０＋８０＋１１０＋１２０
＝７４０となり、文字領域濃度ヒストグラム平均値は、７４０／
７＝１０５となる。

【００３８】次に、ステップ２０３では、前記ステップ
２０２の座標を中心として、文字の平均サイズの左右の
外側の、予め設定した文字間サイズの領域の濃度ヒスト
グラムの平均値を求める。

【００３９】ここで、予め設定した文字間サイズとは、
隣りあう文字との間隔を意味し、文字間サイズを２（文
字の平均サイズは７）と仮定して、図４（ｂ）の座標７
を例にとって説明すると、座標７の場合の文字間領域の
座標は、座標２〜３、座標１１〜１２であるので、その
文字間領域の濃度ヒストグラムの合計は、表１より４＋５＋５＋５＝１９となり、文字間領域濃度ヒストグラム平均値は、１９／
４＝４となる。ステップ２０４では、以上の方法により
求めた文字領域濃度ヒストグラム平均値と文字間領域濃
度ヒストグラム平均値の比較を行なう。文字領域濃度ヒ
ストグラム平均値が、文字間領域濃度ヒストグラム平均
値より大きい場合（ステップ２０５の処理を行う）は、
その差を、その座標における最適文字領域値として記憶
する。

【００４０】図４（ｂ）の座標７を例にとると、前述の
ように文字領域濃度ヒストグラム平均値が１０５、文字
間領域濃度ヒストグラム平均値が４であるので、座標７
の最適文字領域値は、１０５−４＝１０１となる。

【００４１】逆に、文字間領域濃度ヒストグラム平均値
が文字領域濃度ヒストグラム平均値より大きい場合（ス
テップ２０６の処理を行う）は、最適文字領域値を０と
する。以上の処理を濃度ヒストグラムの全座標に対し
て行うと、表２に示す各座標ごとの最適文字領域値が求
まる。

【００４２】ただし、対象領域の両端の部分（図４の座
標１〜５と座標２０〜２４の部分）については、領域外
の場所に文字領域の一部や文字間領域がとられることと
なるので、その場合は、両端の外側の濃度ヒストグラム
を「０」と仮定して実行する。さて、ステップ１０５
は、前記ステップ１０４により求められた各座標ごとの
最適文字領域値と、予め設定したしきい値との比較を行
い、しきい値以上となる最適文字領域値のグループを算
出する。

【００４３】図４（ｃ）を参照して説明すると、しきい
値を「１０」と仮定した場合、最適文字領域値が、しき
い値「１０」より大きいグループは、表２より座標４〜
８と、座標１６〜１７の２つである。

【００４４】次に、その各グループごとに最適文字領域
値が最大となっている座標を算出する。表２より、座標
４〜８のグループ中での最大値は、座標７の「１０１」
であり、座標１６〜１７のグループ中での最大値は、座
標１７の「５６」である。

【００４５】そして、その各々の最大値の座標を中心と
して、予め設定されている文字の平均サイズ分左右に拡
げた座標を算出し、それを文字切り出し枠とする。

【００４６】図４（ｃ）の場合では、文字の平均サイズ
を７と仮定したので、座標７を中心とする文字切り出し
枠は座標４〜１０、座標１７を中心とする文字切り出し
枠は座標１４〜２０となり、図４（ｄ）に示すように正
確に文字切り出し枠が求まることになる。以上の処理に
より、入力された濃淡文字画像データ中の文字全てにつ
いて文字切り出し枠を算出した後、ステップ１０６にお
いて、各切り出された文字画像と、予め用意した文字認
識辞書とをパターンマッチング等の認識方式により認識
せしめ、その文字コードを出力する。

【００４７】ここで、本実施例では、行切り出し後の各
行に対する文字切り出しの方法を示しているが、本処理
をそのまま行切り出しへ応用することも可能であり、か
かる場合には、予め設定する文字の平均サイズを文字の
高さとし、文字間サイズを行間とすることで、前述の処
理と同様に、正確に文字列の領域の切り出しが可能とな
る。

【００４８】本発明の実行結果を図１０、１１に示す。
図１０は、図８の濃度ヒストグラムを使用して切り出
し、切り出し失敗の発生した画像を、図８に示している
濃度ヒストグラムより、最適文字領域値を算出して、文
字切り出しを行った場合の結果である。次の図１１は、
図９のばらつき度を使用して切り出し、切り出し失敗の
発生した画像を、図９に示している、ばらつき度を濃度
ヒストグラムのデータと仮定して最適文字領域値を算出
して、文字切り出しを行った場合の結果である。

【００４９】図１０、１１いずれを見てもわかるよう
に、正確に、文字切り出しが行われている。また、しき
い値の設定に関しては、図１０、１１に示す、しきい値
変動可能範囲中のしきい値であれば、どのような値に設
定しても、正確に文字を切り出すことが可能であり、従
来の濃度ヒストグラム、ばらつき度等のの非常に微妙な
しきい値の設定に比べ、設定が容易となる。

【００５０】特に、濃度ヒストグラム、ばらつき度を使
用した文字切り出しの失敗例を示す図８、９において
は、図中の文字全てを、正確に切り出すためのしきい値
は、存在せず（つまり、しきい値をどこに設定しても、
必ずいずれかの文字の切り出し失敗が発生する）、この
ようなデータから、図１０、１１に示すように、容易に
文字の切り出しが可能なデータを生成することができる
本発明は、非常に有効な手段であると言える。

【００５１】また、図１１に示すように、本発明の最適
文字領域算出処理は、濃度ヒストグラム以外のデータに
対しても適用可能であり、本発明は、応用性に富む発明
である。例えば、各画素における濃度の差分、差分の２
乗値等の累積値により作成した濃度差ヒストグラムを用
いても良い。さらには、文字情報の存在に対応して与え
られる関数なら、いかなるものでも利用できるのであ
る。

【００５２】さらに、本発明は、文字の切り出しを対象
として説明してきたが、本手法により、文字列自体も切
り出せることも言うまでもない。したがって、文字列お
よび文字を切り出す手段を兼ね備え、与えられた文字情
報から、最初に文字列を、次に該文字列における文字を
切り出す装置も考えられる。

【００５３】さらに、かかる装置においては、文字認識
手段を設け、該手段は、例えばパターンマッチング法等
によって、切り出された文字を認識せしめることも可能
である。かかる認識結果を出力する構成にしておけば、
一層使用しやすい装置を実現できることになる。ここで
認識結果としては、例えば当該認識手段が認識した文字
コードを出力するように構成しておけばよい。かかる認
識手段は、例えば、ＣＰＵ、ＲＯＭ、ＲＡＭ、および格
納されたソフトウエア等によって実現できる。

【００５４】さらに、出力手段としては、例えばプリン
ター等の印字装置、ＣＲＴ、液晶、ＥＬディスプレイ等
の表示装置等が考えられる。

【００５５】

【発明の効果】本発明によれば、従来の技術で切り出し
が困難であった、刻印文字等の低品質な濃淡画像データ
より、高速かつ正確に、文字行および文字の切り出しが
可能となる。したがって、文字行および文字の切り出し
失敗による誤認識を減少せしめることが可能となり、文
字認識率の向上が達成できる。

【図面の簡単な説明】

【図１】本発明にかかる文字認識装置の構成図である。

【図２】本発明にかかる全体処理を示すフロー図であ
る。

【図３】最適文字領域算出処理の処理フロー図である。

【図４】最適文字領域算出処理の実行例の説明図であ
る。

【図５】刻印文字濃淡画像の特徴の説明図である。

【図６】濃度ヒストグラムの算出例である。

【図７】ばらつき度の算出例である。

【図８】濃度ヒストグラムを使用した方式による文字切
り出しの失敗例である。

【図９】ばらつき度を使用した方式による文字切り出し
の失敗例である。

【図１０】最適文字領域値の算出例である。

【図１１】最適文字領域値の算出例である。

【符号の説明】

１…撮像装置、２…電子計算機、２１…画像データ記憶
手段、２２…行切り出し手段、２３…濃度ヒストグラム
算出手段、２４…最適文字領域算出手段、２５…文字切
り出し枠決定手段、２６…文字認識手段、２７…文字認
識辞書手段

Claims

【特許請求の範囲】

【請求項１】入力された文字の濃淡画像データより、切
り出し対象である文字画像が存在する領域を切り出す方
法であって、文字画像の並んでいる領域である文字列に
対して平行方向に存在する各画素に対応する座標ごと
に、該座標における、前記文字列に対して垂直方向に存
在する各画素の濃度値を累積した濃度ヒストグラムを生
成し、前記各座標を中心として、予め設定した、処理対
象たる文字の平均文字サイズから定まる領域における前
記濃度ヒストグラムの平均値（文字領域濃度ヒストグラ
ム平均値）と、前記、文字の平均サイズから定まる領域
の左右に存在する、予め設定した文字間サイズ領域にお
ける、前記濃度ヒストグラムの平均値（文字間領域濃度
ヒストグラム平均値）を算出し、さらに、文字領域濃度
ヒストグラム平均値が文字間領域濃度ヒストグラム平均
値より大きな場合、その差を各座標ごとに算出し、該算
出値を最適文字領域値とし、さらに、該最適文字領域値と予め設定したしきい値との
比較を行い、最適文字領域値がしきい値を越えた領域を
示す座標値の最大幅を文字が存在する領域として、該領
域を各座標について求めていき、該各領域における最適
文字領域値が最大値を示す座標点を文字の中心座標とし
て選出し、該中心座標を中心とし左右に、前記予め設定
した文字の平均サイズで与えられる領域を付加した領域
を、文字の切り出し枠として文字を切り出すことを特徴
とする文字切り出し方法。
【請求項２】入力された文字を構成する画素の濃度デー
タより、切り出し対象である文字画像が存在する領域を
切り出す方法であって、文字画像の並んでいる領域であ
る文字列に対して平行方向に存在する各画素に対応する
座標ごとに、該座標における、前記文字列に対して垂直
方向に存在する各画素の濃度差を算出し、その濃度差を
累積した濃度差ヒストグラムを生成し、前記各座標を中
心として、予め設定した、処理対象たる文字の平均文字
サイズから定まる領域における、前記濃度差ヒストグラ
ムの平均値（文字領域濃度差ヒストグラム平均値）と、
前記、文字の平均サイズから定まる領域の左右に存在す
る、予め設定した文字間サイズ領域における、前記濃度
差ヒストグラムの平均値（文字間領域濃度差ヒストグラ
ム平均値）を算出し、さらに、文字領域濃度差ヒストグ
ラム平均値が文字間領域濃度差ヒストグラム平均値より
大きな場合、その差を各座標ごとに算出し、該算出値を
最適文字領域値とし、さらに、該最適文字領域値と予め設定したしきい値との
比較を行い、最適文字領域値がしきい値を越えた領域を
示す座標値の最大幅を文字が存在する領域として、該領
域を各座標について求めていき、該各領域における最適
文字領域値が最大値を示す座標点を文字の中心座標とし
て選出し、該中心座標を中心とし左右に、前記予め設定
した文字の平均サイズで与えられる領域を付加した領域
を、文字の切り出し枠として文字を切り出すことを特徴
とする文字切り出し方法。
【請求項３】入力された文字列の濃淡画像データより、
切り出し対象である文字列画像が存在する領域を切り出
す方法であって、文字列画像に対し垂直方向に存在する
各画素に対応する座標ごとに、該座標における、前記文
字列に対して平行方向に存在する各画素の濃度値を累積
した文字列濃度ヒストグラムを生成し、前記各座標を中
心として、予め設定した、処理対象たる文字列の平均文
字高さから定まる領域における前記文字列濃度ヒストグ
ラムの平均値（文字列領域濃度ヒストグラム平均値）
と、前記、文字列の平均文字高さから定まる領域の左右
に存在する、予め設定した文字列間サイズの領域におけ
る、前記文字列濃度ヒストグラムの平均値（文字列間領
域濃度ヒストグラム平均値）を算出し、さらに、文字列
領域濃度ヒストグラム平均値が文字列間領域濃度ヒスト
グラム平均値より大きな場合、その差を各座標ごとに算
出し、該算出値を最適文字列領域値とし、さらに、該最適文字列領域値と予め設定したしきい値と
の比較を行い、最適文字列領域値がしきい値を越えた領
域を示す座標値の最大幅を文字列が存在する領域とし
て、該領域を各座標について求めていき、該各領域にお
ける最適文字列領域値が最大値を示す座標点を文字列の
中心座標として選出し、該中心座標を中心とし左右に、
前記予め設定した文字高さの平均サイズで与えられる領
域を付加した領域を、文字列の切り出し枠として文字列
を切り出すことを特徴とする文字列切り出し方法。
【請求項４】入力された文字列を構成する画素の濃度デ
ータより、切り出し対象である文字列画像が存在する領
域を切り出す方法であって、文字列画像に対し垂直方向
に存在する各画素に対応する座標ごとに、該座標におけ
る、前記文字列に対して平行方向に存在する各画素の濃
度差を算出し、その濃度差を累積した文字列濃度差ヒス
トグラムを生成し、前記各座標を中心として、予め設定
した、処理対象たる文字列の平均文字高さから定まる領
域における、前記文字列濃度差ヒストグラムの平均値
（文字列領域濃度差ヒストグラム平均値）と、前記、文
字列の平均文字高さから定まる領域の左右に存在する、
予め設定した文字列間サイズの領域における、前記濃度
差ヒストグラムの平均値（文字列間領域濃度差ヒストグ
ラム平均値）を算出し、さらに、文字列領域濃度差ヒス
トグラム平均値と文字列間領域濃度差ヒストグラム平均
値より大きな場合、その差を各座標ごとに算出し、該算
出値を最適文字列領域値とし、さらに、該最適文字列領域値と予め設定したしきい値と
の比較を行い、最適文字列領域値がしきい値を越えた領
域を示す座標値の最大幅を文字列が存在する領域とし
て、該領域を各座標について求めていき、該各領域にお
ける最適文字列領域値が最大値を示す座標点を文字列の
中心座標として選出し、該中心座標を中心とし左右に、
前記予め設定した文字高さの平均サイズで与えられる領
域を付加した領域を、文字列の切り出し枠として文字列
を切り出すことを特徴とする文字列切り出し方法。
【請求項５】入力された文字列の濃淡画像データにもと
づき、文字列画像に対し垂直方向に存在する各画素に対
応する座標ごとに、該座標における、前記文字列に対し
て平行方向に存在する各画素の濃度値を累積した文字列
濃度ヒストグラムを生成する手段と、前記各座標を中心
として、予め設定した、処理対象たる文字列の平均文字
高さから定まる領域における前記文字列濃度ヒストグラ
ムの平均値（文字列領域濃度ヒストグラム平均値）と、
前記、文字列の平均文字高さから定まる領域の左右に存
在する、予め設定した文字列間サイズの領域における、
前記文字列濃度ヒストグラムの平均値（文字列間領域濃
度ヒストグラム平均値）を算出し、さらに、文字列領域
濃度ヒストグラム平均値が文字列間領域濃度ヒストグラ
ム平均値より大きな場合、その差を各座標ごとに算出
し、該算出値を最適文字列領域値とする手段と、該最適
文字列領域値と予め設定したしきい値との比較を行い、
最適文字列領域値がしきい値を越えた領域を示す座標値
の最大幅を文字列が存在する領域として、該領域を各座
標について求めていき、該各領域における最適文字列領
域値が最大値を示す座標点を文字列の中心座標として選
出し、該中心座標を中心とし左右に、前記予め設定した
文字高さの平均サイズで与えられる領域を付加した領域
を、文字列の切り出し枠として文字列を切り出す手段
と、入力された文字の濃淡画像データにもとづいて、文字画
像の並んでいる領域である文字列に対して平行方向に存
在する各画素に対応する座標ごとに、該座標における、
前記文字列に対して垂直方向に存在する各画素の濃度値
を累積した濃度ヒストグラムを生成する手段と、前記各
座標を中心として、予め設定した、処理対象たる文字の
平均文字サイズから定まる領域における前記濃度ヒスト
グラムの平均値（文字領域濃度ヒストグラム平均値）
と、前記、文字の平均サイズから定まる領域の左右に存
在する、予め設定した文字間サイズ領域における、前記
濃度ヒストグラムの平均値（文字間領域濃度ヒストグラ
ム平均値）を算出し、さらに、文字領域濃度ヒストグラ
ム平均値が文字間領域濃度ヒストグラム平均値より大き
な場合、その差を各座標ごとに算出し、該算出値を最適
文字領域値とする手段と、該最適文字領域値と予め設定
したしきい値との比較を行い、最適文字領域値がしきい
値を越えた領域を示す座標値の最大幅を文字が存在する
領域として、該領域を各座標について求めていき、該各
領域における最適文字領域値が最大値を示す座標点を文
字の中心座標として選出し、該中心座標を中心とし左右
に、前記予め設定した文字の平均サイズで与えられる領
域を付加した領域を、文字の切り出し枠として文字を切
り出す手段と、各切り出された文字の画像データを認識
する手段と、認識結果の文字コードを出力する手段を有
して構成される刻印文字認識装置。
【請求項６】入力された文字列の濃淡画像データにもと
づき、文字列画像に対し垂直方向に存在する各画素に対
応する座標ごとに、該座標における、前記文字列に対し
て平行方向に存在する各画素の濃度値を累積した文字列
濃度ヒストグラムを生成する手段と、前記各座標を中心
として、予め設定した、処理対象たる文字列の平均文字
高さから定まる領域における前記文字列濃度ヒストグラ
ムの平均値（文字列領域濃度ヒストグラム平均値）と、
前記、文字列の平均文字高さから定まる領域の左右に存
在する、予め設定した文字列間サイズの領域における、
前記文字列濃度ヒストグラムの平均値（文字列間領域濃
度ヒストグラム平均値）を算出し、さらに、文字列領域
濃度ヒストグラム平均値が文字列間領域濃度ヒストグラ
ム平均値より大きな場合、その差を各座標ごとに算出
し、該算出値を最適文字列領域値とする手段と、該最適
文字列領域値と予め設定したしきい値との比較を行い、
最適文字列領域値がしきい値を越えた領域を示す座標値
の最大幅を文字列が存在する領域として、該領域を各座
標について求めていき、該各領域における最適文字列領
域値が最大値を示す座標点を文字列の中心座標として選
出し、該中心座標を中心とし左右に、前記予め設定した
文字高さの平均サイズで与えられる領域を付加した領域
を、文字列の切り出し枠として文字列を切り出す手段
と、入力された文字を構成する画素の濃度データにもとづい
て文字画像の並んでいる領域である文字列に対して平行
方向に存在する各画素に対応する座標ごとに、該座標に
おける、前記文字列に対して垂直方向に存在する各画素
の濃度差を算出し、その濃度差を累積した濃度差ヒスト
グラムを生成する手段と、前記各座標を中心として、予
め設定した、処理対象たる文字の平均文字サイズから定
まる領域における、前記濃度差ヒストグラムの平均値
（文字領域濃度差ヒストグラム平均値）と、前記、文字
の平均サイズから定まる領域の左右に存在する、予め設
定した文字間サイズ領域における、前記濃度差ヒストグ
ラムの平均値（文字間領域濃度差ヒストグラム平均値）
を算出し、さらに、文字領域濃度差ヒストグラム平均値
が文字間領域濃度差ヒストグラム平均値より大きな場
合、その差を各座標ごとに算出し、該算出値を最適文字
領域値とする手段と、該最適文字領域値と予め設定した
しきい値との比較を行い、最適文字領域値がしきい値を
越えた領域を示す座標値の最大幅を文字が存在する領域
として、該領域を各座標について求めていき、該各領域
における最適文字領域値が最大値を示す座標点を文字の
中心座標として選出し、該中心座標を中心とし左右に、
前記予め設定した文字の平均サイズで与えられる領域を
付加した領域を、文字の切り出し枠として文字を切り出
す手段と、各切り出された文字の画像データを認識する
手段と、認識結果の文字コードを出力する手段を有して
構成される刻印文字認識装置。
【請求項７】入力された文字列を構成する画素の濃度デ
ータにもとづいて、文字列画像に対し垂直方向に存在す
る各画素に対応する座標ごとに、該座標における、前記
文字列に対して平行方向に存在する各画素の濃度差を算
出し、その濃度差を累積した文字列濃度差ヒストグラム
を生成する手段と、前記各座標を中心として、予め設定
した、処理対象たる文字列の平均文字高さから定まる領
域における、前記文字列濃度差ヒストグラムの平均値
（文字列領域濃度差ヒストグラム平均値）と、前記、文
字列の平均文字高さから定まる領域の左右に存在する、
予め設定した文字列間サイズの領域における、前記濃度
差ヒストグラムの平均値（文字列間領域濃度差ヒストグ
ラム平均値）を算出し、さらに、文字列領域濃度差ヒス
トグラム平均値と文字列間領域濃度差ヒストグラム平均
値より大きな場合、その差を各座標ごとに算出し、該算
出値を最適文字列領域値とする手段と、該最適文字列領
域値と予め設定したしきい値との比較を行い、最適文字
列領域値がしきい値を越えた領域を示す座標値の最大幅
を文字列が存在する領域として、該領域を各座標につい
て求めていき、該各領域における最適文字列領域値が最
大値を示す座標点を文字列の中心座標として選出し、該
中心座標を中心とし左右に、前記予め設定した文字高さ
の平均サイズで与えられる領域を付加した領域を、文字
列の切り出し枠として文字列を切り出す手段と、入力された文字の濃淡画像データにもとづいて、文字画
像の並んでいる領域である文字列に対して平行方向に存
在する各画素に対応する座標ごとに、該座標における、
前記文字列に対して垂直方向に存在する各画素の濃度値
を累積した濃度ヒストグラムを生成する手段と、前記各
座標を中心として、予め設定した、処理対象たる文字の
平均文字サイズから定まる領域における前記濃度ヒスト
グラムの平均値（文字領域濃度ヒストグラム平均値）
と、前記、文字の平均サイズから定まる領域の左右に存
在する、予め設定した文字間サイズ領域における、前記
濃度ヒストグラムの平均値（文字間領域濃度ヒストグラ
ム平均値）を算出し、さらに、文字領域濃度ヒストグラ
ム平均値が文字間領域濃度ヒストグラム平均値より大き
な場合、その差を各座標ごとに算出し、該算出値を最適
文字領域値とする手段と、該最適文字領域値と予め設定
したしきい値との比較を行い、最適文字領域値がしきい
値を越えた領域を示す座標値の最大幅を文字が存在する
領域として、該領域を各座標について求めていき、該各
領域における最適文字領域値が最大値を示す座標点を文
字の中心座標として選出し、該中心座標を中心とし左右
に、前記予め設定した文字の平均サイズで与えられる領
域を付加した領域を、文字の切り出し枠として文字を切
り出す手段と、各切り出された文字の画像データを認識
する手段と、認識結果の文字コードを出力する手段を有
して構成される刻印文字認識装置。
【請求項８】入力された文字列を構成する画素の濃度デ
ータにもとづいて、文字列画像に対し垂直方向に存在す
る各画素に対応する座標ごとに、該座標における、前記
文字列に対して平行方向に存在する各画素の濃度差を算
出し、その濃度差を累積した文字列濃度差ヒストグラム
を生成する手段と、前記各座標を中心として、予め設定
した、処理対象たる文字列の平均文字高さから定まる領
域における、前記文字列濃度差ヒストグラムの平均値
（文字列領域濃度差ヒストグラム平均値）と、前記、文
字列の平均文字高さから定まる領域の左右に存在する、
予め設定した文字列間サイズの領域における、前記濃度
差ヒストグラムの平均値（文字列間領域濃度差ヒストグ
ラム平均値）を算出し、さらに、文字列領域濃度差ヒス
トグラム平均値と文字列間領域濃度差ヒストグラム平均
値より大きな場合、その差を各座標ごとに算出し、該算
出値を最適文字列領域値とする手段と、該最適文字列領
域値と予め設定したしきい値との比較を行い、最適文字
列領域値がしきい値を越えた領域を示す座標値の最大幅
を文字列が存在する領域として、該領域を各座標につい
て求めていき、該各領域における最適文字列領域値が最
大値を示す座標点を文字列の中心座標として選出し、該
中心座標を中心とし左右に、前記予め設定した文字高さ
の平均サイズで与えられる領域を付加した領域を、文字
列の切り出し枠として文字列を切り出す手段と、入力された文字を構成する画素の濃度データにもとづい
て、文字画像の並んでいる領域である文字列に対して平
行方向に存在する各画素に対応する座標ごとに、該座標
における、前記文字列に対して垂直方向に存在する各画
素の濃度差を算出し、その濃度差を累積した濃度差ヒス
トグラムを生成する手段と、前記各座標を中心として、
予め設定した、処理対象たる文字の平均文字サイズから
定まる領域における、前記濃度差ヒストグラムの平均値
（文字領域濃度差ヒストグラム平均値）と、前記、文字
の平均サイズから定まる領域の左右に存在する、予め設
定した文字間サイズ領域における、前記濃度差ヒストグ
ラムの平均値（文字間領域濃度差ヒストグラム平均値）
を算出し、さらに、文字領域濃度差ヒストグラム平均値
が文字間領域濃度差ヒストグラム平均値より大きな場
合、その差を各座標ごとに算出し、該算出値を最適文字
領域値とする手段と、該最適文字領域値と予め設定した
しきい値との比較を行い、最適文字領域値がしきい値を
越えた領域を示す座標値の最大幅を文字が存在する領域
として、該領域を各座標について求めていき、該各領域
における最適文字領域値が最大値を示す座標点を文字の
中心座標として選出し、該中心座標を中心とし左右に、
前記予め設定した文字の平均サイズで与えられる領域を
付加した領域を、文字の切り出し枠として文字を切り出
す手段と、各切り出された文字の画像データを認識する
手段と、認識結果の文字コードを出力する手段を有して
構成される刻印文字認識装置。