[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP3671682B2 - 画像認識装置 - Google Patents

画像認識装置 Download PDF

Info

Publication number
JP3671682B2
JP3671682B2 JP20491298A JP20491298A JP3671682B2 JP 3671682 B2 JP3671682 B2 JP 3671682B2 JP 20491298 A JP20491298 A JP 20491298A JP 20491298 A JP20491298 A JP 20491298A JP 3671682 B2 JP3671682 B2 JP 3671682B2
Authority
JP
Japan
Prior art keywords
document
image data
image
reliability
inclination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP20491298A
Other languages
English (en)
Other versions
JP2000036908A (ja
Inventor
和弘 上田
祥二 今泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP20491298A priority Critical patent/JP3671682B2/ja
Publication of JP2000036908A publication Critical patent/JP2000036908A/ja
Application granted granted Critical
Publication of JP3671682B2 publication Critical patent/JP3671682B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Facsimile Scanning Arrangements (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、デジタル複写機、ファクシミリなどにおいて画像入力装置から読み取られた原稿画像を認識する画像認識装置に関する。
【0002】
【従来の技術】
従来、例えば、自動原稿搬送装置(Auto Document Feeder、以下、「ADF」という。)を備えたデジタル複写機において、複数枚の原稿を連続して読み取ってコピーする場合、読み取られた原稿の向きに応じてコピーが排出されるので、原稿をADFにセットする際に、各原稿が一律に同じ方向を向いているか否かを確認する必要があった。しかし、このような確認作業は結構手間がかかるものであり、原稿枚数が多ければ、それだけ反対方向の原稿を見落とすおそれも大きくなる。
【0003】
このような不都合を避けるため、原稿を読み取り、生成した画像データからまず原稿の方向を判別し(このような原稿の方向の判別を、以下、「天地認識」という。)、その画像出力が紙面に対して適切な方向になるように画像データを回転処理して出力する方法が考えられている。天地認識の方法は種々考案されており、例えば、特開平9−9040号公報には、原稿の中で文書画像と認識される部分に関し、主走査方向及び副走査方向についてのヒストグラムを取得することにより、天地認識を行う技術が開示されている。
【0004】
図10は、上記従来の天地認識の方法について説明するための図である。同図に示されるように、画像入力装置に入力された文書画像データから、主走査方法及び副走査方向に関して取得されたヒストグラムを用いて、文字行の向きや、行の先頭の文字位置を認識することにより、天地認識を行うことができる。
【0005】
より具体的には、取得されたヒストグラムの立ち上がりエッジの数と立ち下がりエッジの数、両者の和及び差を、主走査方向のヒストグラム及び副走査方向のヒストグラムについてそれぞれ算出する。図10に示したような横書きの文書画像であれば、主走査方向のヒストグラム(a)の立ち上がりエッジの数と立ち下がりエッジの数がほぼ等しくなる他、両者の和は、副走査方向のヒストグラム(b)と比較して多くなる。主走査方向のヒストグラム(a)には、行を表すピークと、行間に相当するピークのない部分が交互に検出されるからである。
【0006】
また、図10の例における副走査方向のヒストグラム(b)からは、行の先頭の文字位置を認識することができる。即ち、行の先頭の文字位置は比較的一定しているため、ヒストグラムの立ち上がりエッジが数箇所に集中するのに対し、行の最後の文字位置は、文章によってまちまちであり、従って行の最後の文字位置によるヒストグラムの立ち下がりエッジは、比較的分散して発生するので、その立ち上がりエッジの数と立ち下がりエッジの数との差が大きければ当該原稿の上下を認識できる。
【0007】
以上のような認識により、文字行の向きと、行の先頭の文字位置を検出することができ、かかる検出結果に基づいて天地認識を行うことができる。これらの認識は、縦書きの原稿についても適用することが可能である。
【0008】
【発明が解決しようとする課題】
しかしながら、上記従来の技術は、例えば原稿がADFを介してセットされる際に傾いてしまったような場合に、正確な天地認識ができない場合があるという問題を有していた。
【0009】
即ち、原稿が傾いていしまったような場合には、図11に示すように行間や、先頭の文字位置を正確に認識することが可能なヒストグラムを取得することができず、取得されたヒストグラムを用いて天地認識を行っても正確な認識を行うことができないからである。このような問題は、原稿に記載された文字行自体が傾いているような場合にも起こりうる。
【0010】
本発明は、上記の問題点に鑑み、原稿が傾いている場合においても、天地認識を行うことができる画像認識装置を提供することを目的とする。
【0011】
本発明の第2の目的は、原稿に記載された文字行自体が傾いているような場合においても、より正確な天地認識を行うことができる画像認識装置を提供することである。
【0012】
【課題を解決するための手段】
上記課題を解決するために、本発明の第1の画像認識装置は、原稿を読み取り第1の画像データを生成する画像読み取り手段と、前記原稿の傾きを検出する原稿傾き検出手段と、前記原稿傾き検出手段により検出された原稿の傾きに基づいて、前記画像読み取り手段により生成された第1の画像データの傾きを補正して、第2の画像データを生成する傾き補正手段と、前記画像読み取り手段により生成された第1の画像データ、及び、前記傾き補正手段により生成された第2の画像データのうち、何れの画像データに基づいて原稿の方向を認識するかを判断する判断手段と、前記判断手段により判断された第1の画像データ、及び第2の画像データのうちの何れかの画像データに基づいて、原稿の方向を認識する原稿方向認識手段とを備えることを特徴とする。
【0013】
また、本発明の第2の画像認識装置は、原稿を読み取り画像データを生成する画像読み取り手段と、前記原稿の傾きを検出する原稿傾き検出手段と、前記原稿傾き検出手段により検出された原稿の傾きに基づいて、前記画像読み取り手段により生成された第1の画像データの傾きを補正して、第2の画像データを生成する傾き補正手段と、前記画像読み取り手段により生成された第1の画像データ、及び前記傾き補正手段により生成された第2の画像データのそれぞれに基づいて、原稿の方向の認識を行う場合の、認識の信頼度に関する情報を取得する信頼度取得手段と、前記信頼度取得手段により第1の画像データに基づいて取得された信頼度に関する情報と、前記信頼度取得手段により第2の画像データに基づいて取得された信頼度に関する情報とを比較する比較手段と、前記比較手段による比較の結果、信頼度が高い方の画像データに基づいて、原稿の方向を認識する原稿方向認識手段とを備えることを特徴とする。
【0014】
【発明の実施の形態】
本発明に係る画像認識装置の一適用例であるデジタル複写機(以下、単に「複写機」という。)について、以下に添付の図面を参照しながら説明する。
【0015】
(1)複写機全体の構成
まず、本発明に係る画像認識装置が適用される複写機の全体の構成を図1により説明する。
同図に示すように、この複写機は、ADF10と、画像読取部30と、プリンタ部50と、給紙部70とからなる。
【0016】
ADF10は、原稿を自動的に画像読取部30に搬送する装置であって、原稿給紙トレイ11に載置された原稿は、給紙ローラ12、捌きローラ13により1枚ずつ分離されて下方に送られ、搬送ベルト14によって、プラテンガラス31上の原稿読取位置まで搬送される。
原稿読取位置に搬送された原稿は、画像読取部30のスキャナ32によりスキャンされた後、再び、搬送ベルト14により図の右方向に送られ、排紙ローラ15を経て原稿排紙トレイ16上に排出される。
【0017】
画像読取部30は、上記プラテンガラス31の原稿読取位置に搬送された原稿の画像を光学的に読み取るものであって、スキャナ32、CCDカラーイメージセンサ(以下、単に「CCDセンサ」という。)38などから構成される。
【0018】
スキャナ32には、露光ランプ33と、この露光ランプ33の照射による原稿からの反射光をプラテンガラス31に平行な方向に光路変更するミラー34が設置され、図の矢印方向に移動することによりプラテンガラス31上の原稿をスキャンする。原稿からの反射光はミラー34に反射された後、さらにミラー35、36および集光レンズ37を介してCCDセンサ38まで導かれ、ここで電気信号に変換されて画像データが生成される。
【0019】
当該画像データは、制御部100内の画像信号処理部110(図2参照)においてA/D変換されてデジタル信号となり、シェーディング補正や濃度変換処理を加えられ、さらに公知の誤差拡散処理等を加えられた後、高解像度画像メモリ120(同図2)に格納される。高解像度画像メモリ120に格納された画像データは、後述するようにCPU190でなされた天地認識の結果に応じて回転処理され、プリンタ部50のレーザダイオード(以下、「LD」とも表記する。)51の駆動信号となる。
【0020】
プリンタ部50は、公知の電子写真方式により記録シート上に画像を形成するものであって、上記駆動信号を受信するとレーザダイオード51を駆動してレーザ光を出射させる。レーザ光は、所定の角速度で回転するポリゴンミラー52側面のミラー面で反射され、fθレンズ53、ミラー54、55を介して、感光体ドラム56の表面を露光走査する。
【0021】
この感光体ドラム56は、上記露光を受ける前にクリーニング部57で感光体表面の残留トナーを除去され、さらにイレーサランプ(図示せず)の照射を受けて除電された後、帯電チャージャ58により一様に帯電されており、このように一様に帯電した状態で上記露光を受けると、感光体ドラム56表面に静電潜像が形成される。
【0022】
現像器59は、感光体ドラム56表面に形成された上記静電潜像を可視化する。
【0023】
一方、給紙部70には、2つの用紙カセット71、72が設けられており、上述の感光体ドラム56の露光および現像の動作と同期して、必要なサイズの記録シートが、用紙カセット71、72のいずれかから、給紙ローラ711もしくは721の駆動により給紙される。給紙された記録シートは、感光体ドラム56の下方で当該感光体ドラム56の表面に接触し、転写チャージャ60の静電力により、感光体ドラム56表面に形成されていたトナー像が当該記録シート表面に転写される。
【0024】
その後、記録シートは、分離チャージャ61の静電力によって感光体ドラム56の表面から引き剥され、搬送ベルト62により定着部63に搬送される。
記録シートに転写されたトナー像は、定着部63において内部にヒータを備えた定着ローラ64で加熱されながら押圧されることにより定着される。定着後の記録シートは、排出ローラ65により排紙トレイ66上に排出される。
【0025】
また、画像読取部30の前面の操作しやすい位置には、操作パネル90が設けられており、コピー枚数を入力するテンキーやコピー開始を指示するスタートキー、各種のコピーモードを設定するための設定キー、上記設定キーなどにより設定されたモードをメッセージで表示する表示部などが設けられている。
【0026】
(2)制御部100の構成
次に、本実施の形態において、上記複写機の内部に設置される制御部100の構成を、図2のブロック図を参照しながらより詳細に説明する。
同図に示すように制御部100は、画像信号処理部110と、高解像度画像メモリ120と、傾き検出部125と、回転処理部130と、LD駆動部140と、解像度変換部150と、第1低解像度認識用メモリ160と、傾き補正部170と、第2低解像度認識用メモリ180と、CPU190等からなる。
【0027】
画像信号処理部110は、A/Dコンバータ、シェーディング補正部、MTF補正部や、変倍部、γ補正部などを備えており、CCDセンサ38より入力された原稿の画像データは、A/Dコンバータでデジタルの多値信号に変換され、シェーディング補正部で露光ランプ33の照度ムラやCCDセンサ38の感度ムラが補正された後、MTF補正部でエッジ強調などの画質改善のための処理を受け、さらに変倍部やγ補正部でそれぞれ変倍処理、γ補正処理を加えられた後に、高解像度画像メモリ120および解像度変換部150に送られる。
【0028】
なお、本実施の形態のCCDセンサ38からは、反射率濃度変換された濃度データが出力されているものとする。
【0029】
傾き検出部125は、読み取られた原稿の傾き検出処理を行う。傾き検出処理の詳細については後述する。
回転処理部130は、高解像度画像メモリ120から目的のページの画像データを読み出して、CPU190からの回転角情報に基づき、必要に応じて画像データを回転処理してから、LD駆動部140に転送する。なお、この回転処理は、画像データのメモリアドレスを変更する公知の技術(例えば、特開昭60ー126769号公報参照)によってなされる。
【0030】
LD駆動部140は、高解像度画像メモリ120から出力された画像データについて、内部のROMに格納された制御プログラムに基づいてLD51へ送り、記録シートへの画像形成を実行する。
【0031】
解像度変換処理部150は、画像信号処理部110を経由した高解像度画像データを低解像度の画像データに変換する。解像度変換された画像データは、まず第1低解像度認識用メモリ160に書き込まれる。本実施の形態では、CCDセンサ38で読み取られた400DPIまたは600DPIの画像データを、25DPIまたは40DPIの低解像度に変換する。解像度変換は、具体的には、例えば縦4画素×横4画素の16画素を取り出し、取り出された16画素の濃度の最大値を取得して、それを1画素の濃度とする処理を、所定の解像度となるまで繰り返し実行することにより行うことができる。
【0032】
傾き補正部170は、傾き検出部125において検出された原稿の傾きに基づいて、第1低解像度認識用メモリ160に格納された画像データの補正を行う。ここで、補正とは、具体的には、検出された原稿の傾き分だけ、画像データを回転させることをいう。なお、本実施の形態の説明では、回転処理部130において行われる天地認識に基づく回転処理と区別するため、傾き補正のための回転処理を「傾き補正処理」という。
【0033】
傾き補正部170において傾き補正処理された低解像度画像データは、第2低解像度認識用メモリ180に格納される。
本実施の形態の画像認識装置では、第2低解像度認識用メモリ180に格納される傾き補正処理された低解像度画像データに基づいて天地認識を行うこともできるし、後述の如く、第1低解像度認識用メモリ160に格納された画像データ、及び第2低解像度認識用メモリ180に格納された画像データについて、それぞれの画像データを天地認識に用いた場合の認識信頼度を求め、より信頼度が高いと判定された方の画像データを用いて天地認識を行うようにすることもできる。
【0034】
即ち、本実施の形態の画像認識装置では、前述の特開平9−9040号公報に開示されている方法を用いて天地認識を行うこととしているが、当該天地認識に用いるヒストグラムの取得にあたっては、原稿の傾き分を補正すれば、正確な天地認識を行うことが可能なヒストグラムを取得することができる場合が多いと考えられる。原稿中の文字行は、原稿と平行に記載されているのが通常であるからである。
【0035】
しかしながら、例えば原稿に記載されている文字行自体が、原稿に対して傾いているような場合には、原稿の傾き分を補正しても、却って正確な天地認識が妨げられる場合も有り得る。従って、本実施の形態の画像認識装置では、傾き補正前の画像データと、傾き補正後の画像データとについて、それぞれを天地認識に用いた場合の認識信頼度を求め、信頼度の高い方の画像データを用いて天地認識を行うようにすることもできるようにしている。信頼度の算出の方法については後述する。
【0036】
(3)制御部100の処理
本実施の形態の制御部100は、CCDセンサ38より読み取られた画像データについて、原稿の傾きの検出処理(以下、「傾き検出処理」という。)、傾きの補正処理(以下、「傾き補正処理」という。)、傾き補正処理が行われていない画像データ、及び傾き補正処理を行った画像データからのヒストグラム取得処理(ヒストグラム取得処理は、傾き補正処理を行った画像データのみについて実行するようにしてもよい。)、取得されたヒストグラムから、原稿方向の認識に用いる場合の認識の信頼度を取得する信頼度取得処理、取得された信頼度を比較する信頼度比較処理、比較の結果、より信頼度の高いヒストグラムに基づいて原稿の方向を認識する天地認識処理を行う。この天地認識処理自体は、上記従来技術と同様にヒストグラムのエッジカウントにより行う。
【0037】
傾き検出処理、傾き補正処理、ヒストグラム取得処理、信頼度取得処理、信頼度比較処理、天地認識処理は、第1低解像度認識用メモリ160、及び第2低解像度認識用メモリ180に格納された解像度変換処理後の画像データに基づいてCPU190で実行される。
【0038】
以下、CPU190の処理内容について詳細に説明するが、これらの処理を指示するプログラムはROM192に格納されており、また必要に応じてRAM191が作業用のメモリ領域として利用される。
【0039】
なお、ヒストグラム取得処理を、傾き補正後の画像データのみについて実行した場合には、信頼度取得処理、信頼度比較処理は不要となり、天地認識処理を、ヒストグラム取得処理にて得られた、傾き補正後の画像データについてのヒストグラムに基づいて行えばよい。以下、本実施の形態の制御部100の処理内容について説明する。
【0040】
図3は、信頼度取得処理等を行う場合の本実施の形態における制御部100の処理内容を示すフローチャートである。以下、同図に基づいて、制御部100の処理内容について詳細に説明する。
【0041】
(3−1)原稿の傾き検出処理
制御部100は、まずCCDセンサ38による原稿読み取り結果に基づいて原稿の傾き検出処理を行う(S301)。
ここで、原稿ガラスで読み取られる原稿が傾いている場合の傾き検出処理について詳細に説明する。この処理は、傾き検出部125によって行われる。図4に示すように、原稿400は、右上端を基準とする原稿ガラス31の上に原稿400の複写面を下向きに置かれている。原稿ガラス31の長手方向がスキャン読み取りの副走査方向であり、それに垂直な方向が主走査方向である。同図に示した例では、原稿400は、画像基準から離れて置かれ、その位置は副走査方向と平行ではない。この例では、原稿400は読み取り領域からはみ出ていない。
【0042】
また、本実施の形態の複写機では、原稿押さえ(ADFの搬送ベルト14)を橙色に着色してあり、露光ランプの光の原稿押さえによる反射光が、CCDセンサ38にとって、分光感度が小さい色となるようにしている。即ち、原稿押さえの橙色は、CCDセンサ38にとって黒色であるのと同じに考えることができる一方、原稿の地肌は、通常白色であるため、原稿と原稿押さえとを区別することが可能である。このことを利用して、原稿のエッジを検出し、原稿の傾き角度を検出することができる。
【0043】
図5と図6は、原稿400(破線で示す)が読み取り領域(実線で示す長方形)からはみ出ていない場合の読み取った画像のイメージを示す。
画像信号処理部110では、少なくとも原稿の範囲を含む長方形領域の画像データを処理して、原稿が存在する原稿領域の検出を行い、原稿の周囲(すなわちエッジ部)のすべての座標から、図に示すように長方形の原稿の四隅の座標を検出する。ここで、主走査方向がX軸であり、副走査方向がY軸であるとする。XmaxとXminとは、最大と最小のX座標であり、YmaxとYminとは、最大と最小のY座標である。
【0044】
残りの2つのX座標については、Y座標がYminである頂点のX座標をX1とし、Y座標がYmaxである頂点のX座標をX2とする。また、残りの2つのY座標のうちX座標がXminである頂点のY座標をY1とし、X座標がXmaxである頂点のY座標をY2とする。
従って、図5の例では、原稿の四隅のX座標とY座標は、(X1,Ymin)、(Xmax,Y2)、(Xmin,Y1)、(X2,Ymax)となる。原稿400の4辺の長さを、a、b、c、dとすると、各辺の長さは原稿の四隅の座標から下記の(数1)を用いて計算できる。
【0045】
【数1】
Figure 0003671682
【0046】
また、図6の例では、原稿の傾きの方向は図5の場合と異なるが、原稿の四隅の座標は、(Xmin,Y1)、(X1,Ymin)、(X2,Ymax)、(Xmax,Y2)となる。従って、この場合にも、四辺の長さa、b、c、dは上記(数1)に示した式で計算できる。
【0047】
ここで、原稿が傾いていた場合の画像データを補正するための編集処理パラメータは、次のようになる。まず、X1−Xmin<Y1−Yminの場合(図5)、
回転座標: (X1,Ymin)
回転角θ: tan-1{(X1−Xmin)/(Y1−Ymin)}
【0048】
また、X1−Xmin>Y1−Yminの場合(図6)、
回転座標: (Xmin,Y1)
回転角θ: tan-1{(Y1−Ymin)/(X1−Xmin)}
【0049】
ここで、回転座標とは、図の左上端に近い隅の座標である。また、回転角θは、上記回転座標の位置を基準として画像データを回転し、読み取り領域に対して平行にするための回転角度である。ここで、検出された編集処理パラメータが傾き補正処理に用いられる。
【0050】
以上に説明した内容に基づいた、傾き検出処理における制御部100の処理内容について以下に説明する。
【0051】
図7は、傾き検出処理の詳細な処理内容を示すフローチャートである。同図に示されるように、傾き検出処理では、まず原稿領域においてエッジ部の座標を抽出し、抽出した複数の座標からなる線分を原稿領域の各辺とみなす(S701)。次に、Xmin点とXmax点の座標及びYmin点とYmax点の座標を抽出する(S702、S703)。
【0052】
X1−Xmin<Y1−Yminであれば(S704:Yes)、−tan-1((X1−Xmin)/(Y1−Ymin))を傾き角θ’とする(S705)。
傾き角θ’は、上記編集処理パラメータとして求められた回転角θに加えて回転方向を考慮するようにしたものである。
【0053】
また、X1−Xmin>Y1−Yminであれば(S706:Yes)、tan-1((Y1−Ymin)/(X1−Xmin))を傾き角θ’とする(S707)。
また、X1−Xmin=Y1−Ymin=0であれば(S708:Yes)、主走査方向及び副走査方向のいずれについても原稿が傾いていないと考えられる場合であるから、傾き角θ’を0とする(S709)。
【0054】
以上のいずれにも該当しない場合、即ち、X1−Xmin=Y1−Yminであって、両者の値が0でない場合には、傾き角θ’を45°と設定する(S710)。
【0055】
(3−2)任意角回転による傾き補正処理
傾き検出処理を終了すると、図3のフローチャートに戻って、制御部100は、検出された傾きに基づく傾き補正処理を行う。即ち、傾き角θ’が0°でない場合(S302:Yes)について、傾き補正処理を行う(S303)。
【0056】
前述の如く、傾き補正とは、原稿の傾きが検出された場合に、画像データを傾斜角だけ回転処理して、傾いていない画像を得ることをいう。従って、読み取られた原稿が傾いていたときでも、原稿が傾いていない場合と同様の画像データを得ることができる。
【0057】
傾き補正処理は、傾き検出部125において取得された編集パラメータに基づいて、傾き補正部170において行われるが、この傾き補正処理は、第1低解像度認識用メモリ160に格納されている低解像度画像データに対する、傾き角θ’分の任意角回転処理であり、その処理方法は、既に公知の技術である。従って、ここでの詳細な説明は省略するが、極めて簡略に説明すると、下記の(数2)に示す式を用いることにより、座標(X,Y)が角度θだけ回転されて座標(U,V)となることを利用する。
【0058】
【数2】
Figure 0003671682
【0059】
(3−3)認識信頼度に関する制御部100の処理
制御部100は、CCDセンサ38により読み取られた原稿の画像データに基づいて、上述のごとく原稿の傾きを検出し、傾き補正処理を行った場合、及び傾き補正処理を行わない場合について、それぞれ信頼度を取得する(図3、S304)。ここで、傾き補正を行った画像データのみを天地認識に利用する場合は信頼度に関する処理が不要となることは前述の通りであるが、信頼度を取得した場合には、より信頼度の高い方の画像データを用いて、以後の天地認識処理を行うようにする(図3、S305以下)。
【0060】
天地認識処理の結果として、適切な方向で文書画像データが出力されるように、回転処理部130に対して回転角情報が出力される。
【0061】
ここで、信頼度取得処理について、二つの方法を挙げて説明する。まず、第1の方法として、ヒストグラムから算出されるMTF値を用いる信頼度の取得方法について説明する。
ここで、「MTF値」とは、ヒストグラムを取得した場合に、そのヒストグラムの数ライン毎の高さの最大値(以下、「max値」という。)、及び最小値(以下、「min値」という。)を取得した場合に、以下の式(数3)により算出される値をいう(以下、MTF値を取得するために分割された数ラインにより形成される領域を「ライン領域」と称する)。
【0062】
【数3】
Figure 0003671682
【0063】
図8は、MTF値の算出について説明するための図である。同図(a)は、原稿400に記載された文字行が原稿の向きに平行である場合の例を示す。同図において、410は取得された主走査方向のヒストグラムを表し、Rはライン領域を示す。
【0064】
同図(a)に示されるように、文字行が原稿の向きに平行である場合には、主走査方向のヒストグラムに、行を表すピークが検出される。一方、文字が存在しない部分では、ヒストグラムのピークは検出されないため、ライン領域毎に見ると、いずれのライン領域でも、min値は0となる。即ち、上記(数3)より、いずれのライン領域でもMTF値は1となる。上記(数3)からわかるように、1はMTF値の最大値である。従って、ライン領域毎のMTF値の、原稿内の平均値を取ると、文字行に傾きがない場合、即ち、天地認識を行うのに適当なヒストグラムが得られる状態においては、MTF値の平均値は高くなるといえる。
【0065】
一方、図8(b)に示されるように、文字行が傾いている場合には、主走査方向のヒストグラムのピークの幅が広がる場合があるため、ライン領域におけるmax値とmin値の差が小さい場合、即ち、MTF値が小さい場合が発生する。従って、原稿内のMTF値の平均値を取得すると、文字行が傾いている場合、即ち、天地認識を行うのに適当なヒストグラムが得られない状態においては、MTF値の平均値が低くなる場合が多いと考えられる。以上の内容から、原稿内のMTF値の平均値の高い方が、認識信頼度は高いと判断できる。
【0066】
次に、第2の方法として、ヒストグラムのエッジカウントを利用した認識信頼度の取得方法について説明する。
ヒストグラムのエッジカウントを使用した方法とは、ヒストグラムを取得した場合に、そのヒストグラム値が増える方向の変化点(以下、「立ち上がりエッジ」という。)と、減る方向の変化点(以下、「立ち下がりエッジ」という。)の数をそれぞれカウントすると、通常の原稿では立ち下がりエッジの数の方が多くなることを利用したものである。これは、従来技術として説明した、特開平9−9040号公報に記載された天地認識でも用いている方法である。
【0067】
図9は、エッジカウントを利用した認識信頼度の取得方法について説明するための図である。同図の例において、400は原稿、420は取得された副走査方向のヒストグラムを表す。また、同図(a)は、文字行に傾きがない場合の例、同図(b)は、文字行が原稿方向と平行であるが、センタリングされている場合の例、同図(c)は、文字行が傾いている場合の例を示すものである。
【0068】
同図(a)のように、文字行が傾いていない場合、即ち、天地認識を行うために適切なヒストグラムを取得することができる場合においては、立ち上がりエッジの数と、立ち下がりエッジの数との差が大きくなる。文章の先頭位置がある程度一定しているため、立ち上がりエッジが2となるのに対し、文章の終わりの位置は分散していることから、立ち下がりエッジが4となるからである。
【0069】
しかし、同図(b)に示されるように文字行がセンタリングされている場合や、同図(c)に示されるように文字行が傾きを持った場合には、立ち上がりエッジの数と、立ち下がりエッジの数との差があまり顕著に現れない。
エッジカウントを利用した信頼度認識とは、以上に説明したような内容に基づき、立ち上がりエッジの数と立ち下がりエッジの数との差が大きいほど、認識信頼度が高いと判定するものである。
【0070】
以上に説明したような方法のいずれか、または両方を用いて認識信頼度を取得すると、取得された信頼度を比較し(S305)、信頼度が大きいと判定された方の低解像度画像データを用いて、以下の天地認識処理を行う。即ち、補正後の画像データの信頼度の方が大きい場合には(S305:Yes)、補正後の情報を用いて天地認識処理を行い(S306)、それ以外の場合には(S305:No)、補正前の情報を用いて天地認識処理を行う(S307)。なお、ステップS302において、傾き角θ’が0であった場合には、傾き補正や、信頼度に関する処理を行う必要がないため、そのままの情報を用いて、天地認識処理を行う(S308)。
【0071】
以上のような処理を行うことにより、原稿ガラス上にセットされた原稿が傾いている場合や、原稿に記載された文字行自体が傾いているような場合においても、より正確な天地認識を行うことができる。
【0072】
なお、本実施の形態では、主として認識信頼度の取得を行う場合の例について、詳細に説明を行ったが、上述の如く、認識信頼度を考慮せず、原稿の傾き補正処理を行った画像データを用いて天地認識処理を行っても、原稿ガラス上にセットされた原稿が傾いている場合に、より正確な天地認識を行うことが可能となる。その場合には、具体的には、図3のフローチャートにおいて、ステップS303からステップS306に進むようにすればよい。
【0073】
また、本実施の形態では、モノクロ複写機に適用される画像認識装置の場合について説明したが、フルカラー複写機にも適用することは可能である。ただし、この場合には、原稿から生成した画像データから、有彩色のカラーデータを予めキャンセルする回路を組み込んでおき、モノクロのみの画像データのみから天地認識を行う方が望ましい。文字部分のほとんどはモノクロだからである。
【0074】
さらに、上記認識信頼度の取得に際して、第1の方法及び第2の方法を併用する場合であれば、それぞれの方法により取得された認識信頼度を同等に取り扱うだけでなく、一定の重み付けをして最終的な認識信頼度を算出するようにすることもできる。
【0075】
また、本実施の形態では、認識信頼度に関して、横書きの原稿を用いた場合について説明したが、認識信頼度の取得に関する第1の方法及び第2の方法のいずれを用いる場合でも、主走査方向及び副走査方向の両方のヒストグラムを取得することにより、原稿が横書きである場合でも、縦書きである場合でも適用することが可能である。具体的には、例えば、主走査方向及び副走査方向のヒストグラムから、認識信頼度を表す値をそれぞれ取得し、信頼度の大きい方を採用するようにすればよい。
【0076】
また、本実施の形態では、原稿方向の判別に際して、画像データのヒストグラムのエッジカウントを求める方法を用いたが、ヒストグラムを利用する他の方法を用いることも可能である。例えば、ヒストグラムを利用して画像データから文字を切り出し、パターンマッチングする方法により、原稿方向の判別を行うようにしてもよい。
【0077】
【発明の効果】
以上に説明したように、本発明の第1の画像認識装置によれば、原稿傾き検出手段により検出された原稿の傾きに基づいて、画像データを補正する傾き補正手段と、画像読み取り手段により生成された傾き補正前の画像データ、及び前記傾き補正手段により補正された画像データのうち、何れの画像データに基づいて原稿の方向を認識するかを判断する判断手段と、前記判断手段により判断された画像データに基づいて、原稿の方向を認識する原稿方向認識手段とを備えることにより、原稿ガラス上にセットされた原稿が傾いている場合や、原稿に記載された文字行自体が傾いているような場合においても、的確に天地認識を行うことができるという効果がある。
【0078】
また、本発明の第2の画像認識装置によれば、原稿傾き検出手段により検出された原稿の傾きに基づいて、画像データを補正する傾き補正手段と、画像読み取り手段により生成された傾き補正前の画像データ、及び傾き補正手段により補正された画像データのそれぞれに基づいて、原稿の方向の認識を行う場合の、認識の信頼度に関する情報を取得する信頼度取得手段と、傾き補正前の画像データに基づいて取得された信頼度に関する情報と、傾きが補正された画像データに基づいて取得された信頼度に関する情報とを比較する比較手段と、前記比較手段による比較の結果、信頼度が高い方の画像データに基づいて、原稿の方向を認識する原稿方向認識手段とを備えることにより、原稿に記載された文字行自体が傾いているような場合でも、より正確な天地認識を行うことができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明に係る画像認識装置が適用される複写機の全体の構成を示す図である。
【図2】本発明に係る画像認識装置が適用される複写機の制御部の構成を示すブロック図である。
【図3】本実施の形態の画像認識装置における制御部の処理内容を示すフローチャートである。
【図4】本発明に係る画像認識装置における原稿の傾き検出の方法について説明するための図である。
【図5】本発明に係る画像認識装置における原稿の傾き検出の方法について説明するための図である。
【図6】本発明に係る画像認識装置における原稿の傾き検出の方法について説明するための図である。
【図7】傾き検出処理の詳細な内容を示すフローチャートである。
【図8】MTF値の算出について説明するための図である。
【図9】ヒストグラムのエッジカウントを利用した認識信頼度の取得方法について説明するための図である。
【図10】従来の天地認識処理について説明するための図である。
【図11】従来の天地認識処理の問題点について説明するための図である。
【符号の説明】
38 CCDセンサ
100 制御部
110 画像信号処理部
120 高解像度画像メモリ
125 傾き検出部
130 回転処理部
140 LD駆動部
150 解像度変換部
160 第1低解像度認識用メモリ
170 傾き補正部
180 第2低解像度用認識メモリ
190 CPU
191 RAM
192 ROM

Claims (5)

  1. 原稿を読み取り第1の画像データを生成する画像読み取り手段と、
    記原稿の傾きを検出する原稿傾き検出手段と、
    前記原稿傾き検出手段により検出された原稿の傾きに基づいて、前記画像読み取り手段により生成された第1の画像データの傾きを補正して、第2の画像データを生成する傾き補正手段と、
    前記画像読み取り手段により生成された第1の画像データ、及び、前記傾き補正手段により生成された第2の画像データのうち、何れの画像データに基づいて原稿の方向を認識するかを判断する判断手段と、
    前記判断手段により判断された第1の画像データ、及び第2の画像データのうちの何れかの画像データに基づいて、原稿の方向を認識する原稿方向認識手段と
    を備えることを特徴とする画像認識装置。
  2. 前記判断手段は、
    前記画像読み取り手段により生成された第1の画像データ、及び前記傾き補正手段により生成された第2の画像データのそれぞれに基づいて、原稿の方向の認識を行う場合の、認識の信頼度に関する情報を取得する信頼度取得手段と、
    前記信頼度取得手段により第1の画像データに基づいて取得された信頼度に関する情報と、前記信頼度取得手段により第2の画像データに基づいて取得された信頼度に関する情報とを比較する比較手段とを含み
    前記原稿方向認識手段は、
    前記比較手段による比較の結果、信頼度が高い方の画像データに基づいて、原稿の方向を認識すること
    を特徴とする請求項1に記載の画像認識装置。
  3. 前記信頼度取得手段は、
    画像データについてのヒストグラムから算出されるMTF値に基づいて信頼度に関する情報を取得すること
    を特徴とする請求項に記載の画像認識装置。
  4. 前記信頼度取得手段は、
    画像データについてのヒストグラムの立ち上がりエッジ数と立ち下がりエッジ数とに基づいて、信頼度に関する情報を取得すること
    を特徴とする請求項に記載の画像認識装置。
  5. 前記傾き補正手段、及び前記判断手段は、
    原稿傾き検出手段により検出された原稿の傾きがなかった場合には、処理を行わず、
    前記原稿方向認識手段は、
    原稿傾き検出手段により検出された原稿の傾きがなかった場合には、前記画像読み取り手段により生成された第1の画像データに基づいて、原稿の方向を認識すること
    を特徴とする請求項1から4までの何れか1項に記載の画像認識装置。
JP20491298A 1998-07-21 1998-07-21 画像認識装置 Expired - Fee Related JP3671682B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20491298A JP3671682B2 (ja) 1998-07-21 1998-07-21 画像認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20491298A JP3671682B2 (ja) 1998-07-21 1998-07-21 画像認識装置

Publications (2)

Publication Number Publication Date
JP2000036908A JP2000036908A (ja) 2000-02-02
JP3671682B2 true JP3671682B2 (ja) 2005-07-13

Family

ID=16498447

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20491298A Expired - Fee Related JP3671682B2 (ja) 1998-07-21 1998-07-21 画像認識装置

Country Status (1)

Country Link
JP (1) JP3671682B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7119926B2 (en) 2000-12-12 2006-10-10 Canon Kabushiki Kaisha Dust and dirt detection in image reading apparatus having original flow scanning function
JP2005311766A (ja) 2004-04-22 2005-11-04 Fuji Xerox Co Ltd 画像読み取り装置
JP4847378B2 (ja) * 2007-03-19 2011-12-28 株式会社リコー 画像処理装置、画像処理方法、プログラム及びコンピュータ読取可能な記録媒体
JP4502001B2 (ja) 2007-12-20 2010-07-14 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置および画像処理方法
JP2009181594A (ja) * 2009-05-18 2009-08-13 Fuji Xerox Co Ltd 画像読み取り装置
JP6450604B2 (ja) * 2015-01-28 2019-01-09 オリンパス株式会社 画像取得装置及び画像取得方法
EP3358816B1 (en) * 2015-09-29 2020-03-04 Kyocera Document Solutions Inc. Image-reading device and image-forming device
JP5950317B1 (ja) * 2016-02-25 2016-07-13 有限会社Ics Sakabe コード認識システム、コード認識方法、コード認識プログラム、及び荷物仕分システム

Also Published As

Publication number Publication date
JP2000036908A (ja) 2000-02-02

Similar Documents

Publication Publication Date Title
US8009931B2 (en) Real-time processing of grayscale image data
JP7211238B2 (ja) エッジ検出装置、傾き補正装置、読取装置、画像処理装置およびエッジ検出方法
JP7131415B2 (ja) 傾き検出装置、読取装置、画像処理装置および傾き検出方法
JP4570670B2 (ja) 画像処理装置、画像読取装置、画像形成装置、画像処理方法、画像処理プログラム、記録媒体
US10194051B2 (en) Device for detecting amount of skew in document and image processing apparatus
JP5114114B2 (ja) 画像形成装置
JP3695163B2 (ja) 画像形成装置
US7688343B2 (en) Device for measuring sheet length and image forming apparatus
JP3671682B2 (ja) 画像認識装置
JP5645689B2 (ja) 画像処理装置及びこれを備えた画像形成装置
JPH06103410A (ja) 画像処理装置
JP2010011359A (ja) 画像処理装置、画像形成装置、画像処理装置の制御方法、制御プログラム、記録媒体
US11496633B2 (en) Image processing apparatus and server apparatus with interactive refinement of streak detection, control method therefor, and storage medium
JP3396006B2 (ja) デジタル複写機
US7555172B2 (en) Dynamic range detection and adjustment
JP3629962B2 (ja) 画像認識装置
JP3629969B2 (ja) 画像認識装置
JP3629959B2 (ja) 画像認識装置
JP2018133693A (ja) 原稿搬送装置および画像形成装置
JP3081083B2 (ja) 画像処理装置
JP2021100220A (ja) 画像処理装置及び画像処理方法
JP3675181B2 (ja) 画像認識装置
JP3078421B2 (ja) デジタル画像形成装置及びデジタル画像形成装置のレーザ走査光補正方法
CN115379060A (zh) 图像读取装置以及图像处理方法
JP2000022898A (ja) 傾き量検出装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041207

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050128

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050203

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20050203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050411

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090428

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090428

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100428

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110428

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120428

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130428

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140428

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees