[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPH0737103A - 傾き角度検出装置 - Google Patents

傾き角度検出装置

Info

Publication number
JPH0737103A
JPH0737103A JP5182568A JP18256893A JPH0737103A JP H0737103 A JPH0737103 A JP H0737103A JP 5182568 A JP5182568 A JP 5182568A JP 18256893 A JP18256893 A JP 18256893A JP H0737103 A JPH0737103 A JP H0737103A
Authority
JP
Japan
Prior art keywords
density change
image
tilt angle
change direction
density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5182568A
Other languages
English (en)
Inventor
Seiji Tatsuta
成示 龍田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP5182568A priority Critical patent/JPH0737103A/ja
Priority to US08/276,117 priority patent/US5668898A/en
Publication of JPH0737103A publication Critical patent/JPH0737103A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】直線状の文字列が存在せず文字等の画像構成要
素が散在している場合にも、それらの位置関係に依存す
ることなく傾き角度を検出可能にする。 【構成】文書等の画像を光学的に走査して得られた濃淡
画像の少なくとも一部を記憶する濃淡画像記憶部7と、
この濃淡画像記憶部7に記憶された濃淡画像から濃度変
化方向を検出する濃度変化方向検出部8と、この濃度変
化方向検出部8によって検出された濃度変化方向の分布
状態から画像構成要素の傾き角度を検出する傾き角度検
出部9とを具備する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像読取装置の傾き角
度検出装置に関する。
【0002】
【従来の技術】従来より、印刷文書を光学的に読取り、
ディジタル画像として蓄積・伝送する場合、圧縮効率を
高めるために文書の構造を理解し、文字部分を認識して
コ―ド化したり、画像部分を切り出して圧縮するといっ
た処理が行なわれている。しかし、文書が傾いて入力さ
れた場合はこれらの文書の内容を正確に把握することが
できないため、前処理として入力文書の傾き角度を検出
しそれを補正する処理を行なう必要がある。
【0003】傾いて入力された文書画像からその傾き角
度を検出する手段として、文字の直列性を利用する方法
が一般に行なわれている。従来の技術としては、例え
ば、特開昭63−282584号公報に示されているよ
うに、2値化された入力文書画像に対して、上記文書の
文字列方向に直交と見なされる2つの側縁から連続する
白画素の数を計数(ペリフエラル特徴)し、その1次微
分値の正負それぞれの平均値から回転方向を判別し、回
転方向に応じて上記ペリフエラル特徴の対応点を抽出す
ることによって傾き角度を検出するものがある。
【0004】これは図14に示すように、文書を光学的
に走査して得られた文書画像を2値化する2値化処理部
1と、上記2値化処理部1で2値化された文書画像に対
して、その行方向に直交と見なされる2つの側縁からペ
リフエラル特徴を抽出するペリフエラル特徴抽出部2
と、上記ペリフエラル特徴を1次微分する1次微分処理
部3と、上記1次微分値の正負それぞれの平均値から回
転方向を判別する回転方向検出部4と、上記回転方向に
応じて2つのペリフエラル特徴の対応点を抽出する対応
点抽出部5と、上記対応点を用いて傾き角度を検出する
傾き角度検出部6とから構成されている。
【0005】上記した構成において、2値化処理部1で
2値化された文書画像は、ペリフエラル特徴抽出部2で
そのペリフエラル特徴が抽出される。これは、上記文書
画像中の文字列方向に直交と見なされる2つの側縁、例
えば文字列の並びが水平方向の場合は左右の側縁から画
像を走査して、最初の黒画素にぶつかるまでの白画素を
計数することによって行なわれる。ここで抽出された左
右のペリフエラル特徴は、1次微分処理部3でそれぞれ
1次微分される。回転方向検出部4では、1次微分され
た左右のペリフエラル特徴の一方、例えば左側の値に対
して、正負それぞれの平均値を計算し、正の平均値の方
が大きい場合は正回転、負の平均値の方が大きい場合は
負回転として回転方向を判別する。対応点抽出部5で
は、左右ペリフエラル特徴の変化点を検出し上記回転方
向に応じてその対応関係を見いだす。傾き角度検出部6
では、上記対応点を用いて傾き角度を検出する。これに
より、入力文書画像の傾き角度の検出を行なうことがで
きる。
【0006】他にも、画像の輪郭抽出とともに外接長方
形を求め、その底辺の長さを特徴量、左下頂点を位置座
標として、走査角度を順次変化させて特徴量を積分し、
最も先鋭となる方向を決めることによって傾き角度を検
出する方法(1989年信学全大秋D−183)や、入
力画像の対角線上の位置に対する白黒の変化状況から傾
き角検出候補点を決定し、その点から各角度に対する白
画素の連続性を調べ、注目点をずらして、最も長い白ラ
ンの検出された角度幅の中心を求めることによって傾き
角度を検出する方法(1989年信学全大春D−25
9)や、入力画像を走査し、白画素から黒画素への変化
の回数から複雑度を求め、水平方向の複雑度から傾き角
検出候補領域を決定し、走査角度を順次変化させて複雑
度の最も先鋭となる方向を決めることによって傾き角度
を検出する方法(1992年信学全大春D−570)等
が提案されている。
【0007】
【発明が解決しようとする課題】ところで、文書画像の
傾き角度検出において、直線状の文字列が存在しないよ
うな場合にも効率よく傾き検出を行なうためには、文字
自体の傾き等、局所的な領域から傾きを検出することが
要求される。しかしながら、従来の技術では文書の文字
の直列性を利用して傾き角度を検出していたので、直線
状の文字列が存在しない場合には傾きが検出できないと
いう欠点があった。
【0008】また、従来の傾き角度検出処理は複雑であ
り、処理時間が長く、ハ―ド規模も大きいという欠点も
あった。本発明の傾き角度検出装置はこのような課題に
着目してなされたものであり、その目的とするところ
は、直線状の文字列が存在せず、文字等の画像構成要素
が散在している場合にも、それらの位置関係に依存する
ことなく傾き角度検出が可能であり、さらに、処理が簡
単で、ハ―ド規模も小さくてすむ傾き角度検出装置を提
供することにある。
【0009】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明の傾き角度検出装置は、文書等の画像を光
学的に走査して得られた濃淡画像の少なくとも一部を記
憶する濃淡画像記憶手段と、この濃淡画像記憶手段に記
憶された濃淡画像から濃度変化方向を検出する濃度変化
方向検出手段と、この濃度変化方向検出手段によって検
出された濃度変化方向の分布状態から画像構成要素の傾
き角度を検出する傾き角度検出手段とを具備する。
【0010】
【作用】すなわち、本発明の傾き角度検出装置において
は、文書等の画像を光学的に走査して得られた濃淡画像
の少なくとも一部を記憶し、この記憶された濃淡画像を
使用して濃度変化方向を検出する。そして、検出された
濃度変化方向の分布状態から画像構成要素の傾き角度を
検出する。
【0011】
【実施例】以下図面を参照して本発明の第1実施例を詳
細に説明する。本実施例においては、読取られた画像中
の文字等、局所領域における構成要素自体の傾きを求め
ることによって、それら画像構成要素の位置関係に依存
することなく傾き角度検出を行なうことを可能としたも
のである。このための手段として、対象とする画像構成
要素が多くの水平線、垂直線から構成されている性質を
利用して画像構成要素を含む局所領域中の各画素につい
て濃度変化方向を求め、その分布形状を調べることによ
って、画像構成要素自体の傾きを検出する。
【0012】図1は上記したことを実現するための傾き
角度検出装置の概念図である。同図において、濃淡画像
記憶部7は文書等を光学的に走査して得られた濃淡画像
の少なくとも一部を記憶する。濃度変化方向検出部8は
濃淡画像記憶部7で記憶された濃淡画像から濃度変化方
向を検出する。傾き角度検出部9は、濃度変化方向検出
部8で検出された濃度変化方向の分布状態から文字等の
構成要素の傾き角度を検出する。
【0013】図3は上記した図1に示す傾き角度検出装
置の具体的構成を示す図である。同図において、濃淡画
像記憶部7は文書等を光学的に走査して得られた濃淡画
像を記憶する濃淡画像メモリ10を含む。濃度変化方向
検出部8は、濃淡画像メモリ10に記憶された濃淡画像
を平滑化する平滑化回路11と、上記平滑化画像を記憶
する平滑画像メモリ12と、この平滑画像メモリ12に
記憶された平滑画像を水平方向に走査し、差分をとる水
平方向差分処理回路13と、垂直方向に同様の走査を行
なう垂直方向差分処理回路14と、上記水平・垂直方向
差分値に基づいて濃度変化の方向を算出する角度変換回
路15とを具備する。
【0014】さらに、傾き角度検出部9は前記角度変換
回路15で算出された角度の累積度数を各角度毎に計数
してヒストグラムを作成する累積度数計数回路16と、
上記累積度数の分布パタ―ンから傾き角度を示すパタ―
ンのずれを検出する傾き角度検出回路17と、この傾き
角度検出回路17で検出された角度をあらかじめ定めら
れた入力画像の傾き角度の範囲内になるように補正し、
出力する傾き角度補正回路18とを具備する。
【0015】上記した構成において、撮像装置によって
取り込まれた濃淡画像は、濃淡画像メモリ10に記憶さ
れる。濃淡画像メモリ10に記憶された濃淡画像は、平
滑化回路11によって平滑化され、平滑画像メモリ12
に記憶される。平滑化回路としては種々のものが考えら
れるが、例えば、注目画素の値を注目画素とその8近傍
における値の平均値で置き換えるような構成とする。水
平方向差分処理回路13、および垂直方向差分処理回路
14では、平滑画像メモリ12に記憶された平滑画像を
それぞれ水平・垂直方向に走査して差分値を求め、それ
を角度変換回路15に送る。
【0016】角度変換回路15では、例えば、水平・垂
直方向差分値の比を求め、逆正接のテ―ブルを参照する
ことにより濃度変化方向の角度を算出する。そして、累
積度数計数回路16では、角度変換回路15で求められ
た角度の累積度数を各角度毎に計数してヒストグラムを
作成する。
【0017】上記した操作を図2(a)、(b)を用い
てさらに説明する。今、注目画素の位置を(i,j)と
し、その輝度をyi,j で表すことにする。ここで、水平
方向隣接画素との輝度の差分値Δhi,j 、および、垂直
方向隣接画素との輝度の差分値Δvi,j は、それぞれ以
下のように表される。
【0018】Δhi,j =yi,j −yi+1,j Δvi,j
=yi,j −yi,j+1 このとき、この3つの画素が成す微小輝度平面の法線ベ
クトルnは、(Δh,Δv,1)となり、従って、この
微小部分における濃度変化方向θi,jは、以下のように
表される。
【0019】 θi,j =atan(Δvi,j /Δhi,j ) このようにして、対象画像領域に対して順次θi,j を求
め、θの累積度数を各角度毎に計数してヒストグラムを
作成する。但し、ノイズの影響を小さくするために、法
線ベクトルnの大きさが所定の閾値より小さい画素につ
いては計数しないものとする。
【0020】一般的な性質として、日本語の文書では文
章中での漢字の割合が高く、特に見出し等、文字が散在
しているばあいには、漢字で書かれている場合が多い。
そして、活字体漢字は多くの水平線、垂直線から構成さ
れているので、文章領域において、上記のように濃度変
化方向θの累積度数分布を調べると漢字の水平、垂直成
分によって90°間隔でピ―クを生じるパタ―ンが得ら
れる。漢字が傾いていない場合にはピ―クは0°と90
°に現れるが、漢字が傾くにつれてピ―ク位置もずれて
いく。したがって、このピ―ク位置を傾き角度検出回路
17で検出し、この角度をあらかじめ定められた入力画
像の傾きの範囲内になるように傾き角度補正回路18で
補正することによって文書の傾きを検出することができ
る。
【0021】この場合、傾き角度検出回路17として
は、最大値を検索する簡単なピ―ク位置検出回路でよい
が、対象領域が傾いていないときのヒストグラム形状か
らの移動量を調べるために、予め用意したパタ―ンとの
相関をとり、そのピ―ク位置を検出する回路など種々の
ものが考えられる。
【0022】なお、本実施例では差分値を求める前に平
滑化を行なっているが、これは濃度変化方向のヒストグ
ラムのピ―クをより先鋭なものとするための処理であ
り、平滑化してから差分値を求める代わりに、図4のよ
うなPrewittフィルタを用いて差分値を求めても同様の
効果が得られる。
【0023】しかしながら、本実施例では上記平滑化回
路は必ずしも必須の構成要素ではなく、対象とする画像
の性質に応じて適宜組み込めばよい。図13は平滑化回
路の効果を調べるために傾き角度30°のサンプル画像
を用いて、線分の傾き方向のヒストグラムを求めた結果
を示す図である。図13(a)の40は、平滑化しない
場合の線分の傾き方向のヒストグラムであり、図13
(b)の41は、平滑化した場合のヒストグラムを示し
ている。また、図13(c)の42は上記サンプル画像
を4値化して作成した画像に対して求めた、平滑化しな
い場合のヒストグラムであり、図13(d)の43は、
平滑化した場合のヒストグラムを示している。
【0024】これらの図から明らかなように、平滑化回
路を有しない場合にも傾き検出は可能であるが、平滑化
回路を有する構成とすることで、ヒストグラムのピ―ク
をより先鋭なものとし、正確な傾き角度検出が可能とな
る。また、階調の少ない画像ではヒストグラムが離散的
な値しかとらないため、平滑化回路の効果はより顕著に
現れる。
【0025】また、検出される角度を濃度変化方向では
なく、見かけ上の線分の傾きと一致させるために、θを
図5に示すように定義し、以下の式にしたがって算出す
ることもできる。
【0026】θ=atan(Δh/Δv) 図6はサンプル画像に対して第1実施例の構成による傾
き角度検出を行い、線分の傾き方向の累積度数分布を調
べた結果を示す図である。図6(a)の21は、傾き角
度−15°の場合のサンプル画像であり、図6(d)の
22はこのときの線分の傾き方向のヒストグラムを示し
ている(但し、Δh2 +Δv2 ≧100)。
【0027】同様に、図6(b)の23,図6(e)の
24は傾き角度+15°の場合、図6(c)の25,図
6(f)の26は、傾き角度+30°の場合のサンプル
画像とヒストグラムをそれぞれ示している。
【0028】図中、最も先鋭なピ―クは、それぞれ、7
5°,15°,30°で生じているが、前提条件として
入力画像の傾きが±45°の範囲にあると仮定している
ので、傾き角度補正回路18によって75°はそれと垂
直な−15°に置換され、出力される傾き角度はそれぞ
れ、−15°,+15°,+30°となる。
【0029】このようにして、文字の位置関係に依存す
ることなく文書画像の傾き角度検出が可能となる。以
上、上記した第1実施例によれば、活字体漢字の性質を
利用して、活字体漢字を含む局所領域の濃度変化方向か
ら活字体漢字を構成している線分の傾き角度を求め、そ
の累積度数分布形状を調べることによって文書の傾き角
度を検出しているので、直線状の文字列が存在せず、文
字が散在している場合にも、文字の位置関係に依存する
ことなく文書画像の傾き角度検出が可能である。また文
字自体の傾き角度を検出しているので、極端な場合1文
字でも検出が可能である。また、像域分離処理後の文書
画像を対象とすることによって、効率的に傾き角度検出
を行なうことができる。
【0030】さらに第1実施例では、活字体漢字のよう
に多くの水平・垂直線から構成されている領域を対象と
しているので、水平・垂直それぞれ一方向への差分のみ
で傾き角度検出が行なえ、構成を簡単にすることが可能
となる。
【0031】以下に本発明の第2実施例を説明する。こ
の実施例においては、第1実施例の図3における濃度変
化方向検出部8を図7に示すような構成とする。なお、
前記図3に示したものと同一または、相当部分には同一
符号を用いてその説明は省略する。
【0032】図7において、14′は平滑画像メモリ1
2に記憶された平滑画像を第1垂直方向差分処理回路1
4とは逆の方向に走査し、差分をとる第2垂直方向差分
処理回路である。27は、水平方向差分処理回路13、
および第1垂直方向差分処理回路14により得られた水
平・垂直方向差分値が同符号か否かを判定し、同符号の
場合のみ、角度変換回路15へ値を出力する符号判定回
路である。さらに27′は、水平方向差分処理回路13
および第2垂直方向差分処理回路14′により得られた
差分値について符号判定回路27と同様の処理を行なう
符号判定回路である。
【0033】上記した構成において、第2垂直方向差分
処理回路14′では、平滑画像メモリ12に記憶された
平滑画像を第1垂直方向差分処理回路14とは逆の方向
に走査し、差分値を求める。すなわち、第2垂直方向差
分処理回路14′により得られる差分値Δv′は以下の
ように表される。
【0034】Δv′i,j =yi,j −yi,j-1 そして符号判定回路27では、水平方向差分処理回路1
3、および第1垂直方向差分処理回路14により得られ
た水平・垂直方向差分値が同符号か否かを判定し、同符
号の場合のみ角度変換回路15へ値を出力する。また、
符号判定回路27′では、水平方向差分処理回路13、
および第2垂直方向差分処理回路14′により得られた
差分値について符号判定回路27と同様の処理を行な
う。すなわち、角度変換回路15で求められる濃度の変
化方向θ′i,j は、以下のように表される。
【0035】 θ′i,j =−atan(Δv′i,j /Δhi,j ) こうして第2実施例では、符号判定回路27,27′に
よってatanの値が制限されるので、次の関係が常に
満足される。
【0036】θ>0 θ′<0 すなわち、正の傾きを持つ線分に対してはθの値が、負
の傾きを持つ線分に対してはθ′の値が選択的に用いら
れることになる。
【0037】この操作を図8を用いてさらに説明する。
図8(a)は第1実施例と同様、隣接4画素のうち左上
の3画素について、水平方向差分値Δhi,j および、第
1垂直方向差分値Δvi,j を求め、微小輝度平面Sの法
線方向を求めている。一方、図8(b)では、隣接4画
素のうち左下の3画素について、水平方向差分値Δh
i,j および、第2垂直方向差分値Δv′i,j を求め、微
小輝度平面S′の法線方向を求めている。この例の場
合、図8(a)では、Δh、Δvが共に正で同符号なの
に対し、図8(b)ではΔhが正でΔvが負と異符号に
なっているので、この隣接4画素については微小輝度平
面Sが設定され、θの値が選択されたことになる。
【0038】このように、本実施例では2つの微小輝度
平面から濃度の変化方向を求めているが、これは以下の
理由による。隣接画素との差分値から濃度変化方向を求
める場合、角度分布のピ―クを急峻にするためには、水
平方向差分値と垂直方向差分値が同符号になるように微
小輝度平面を設定するのが望ましい。活字体漢字のよう
に多くの水平・垂直線から構成されている領域を対象と
する場合には問題ないが、バ―コ―ドのように多くの水
平、もしくは垂直線のみから構成されている領域を対象
とする場合には、線分が負の傾きを持つ場合に両差分値
が異符号となり角度分布のピ―クが鈍ってしまうため、
傾き角度が正確に求められないなどの不都合が生じるお
それがある。
【0039】そこで、図8(a),図8(b)のよう
に、隣接4画素のうち3画素が成す4つの微小輝度平面
のうち2つの微小輝度平面を設定し、双方について水平
・垂直差分値が同符号であるか否かを判定し、同符号の
場合のみ角度変換するような構成として、傾き角度検出
を行なう。隣接4画素がほぼ同一平面上にある場合、こ
の2つの微小輝度平面のうちどちらか一方は上記の条件
を満たすので、濃度変化方向は、正負共にピ―クの急峻
な角度分布が得られるようになる。
【0040】図9は本実施例における線分の傾き方向の
累積度数分布を調べた結果を示す図である。図9(a)
の28は、傾き角度−15°の場合のサンプル画像であ
り、図9(d)の29はこのときの線分の傾き方向のヒ
ストグラム(但し、Δh2 +Δv2 ≧100)を示して
いる。同様に、図9(b)の30、図9(e)の31
は、傾き角度+30°の場合、図9(c)の32、図9
(f)の33は、傾き角度+60°の場合のサンプル画
像とヒストグラムをそれぞれ示している。図より、線分
の傾きの正負に関わらず、急峻なピ―クが現れている様
子がわかる。
【0041】このようにして得られた線分の傾き方向の
累積度数分布から、第1実施例と同様の処理によって傾
き角度検出を行なう。したがって、文字の位置関係に依
存することなく文書画像の傾き角度検出が可能となる。
【0042】上記した第2実施例によれば、活字体漢字
の性質を利用して、活字体漢字を含む局所領域の濃度変
化方向から活字体漢字を構成している線分の傾き角度を
求め、その累積度数分布形状を調べることによって文書
の傾き角度を検出しているので、直線状の文字列が存在
せず、文字が散在している場合にも、文字の位置関係に
依存することなく文書画像の傾き角度検出が可能であ
る。また、文字自体の傾き角度を検出しているので、極
端な場合1文字でも検出が可能であり、また、像域分離
処理後の文書画像を対象とすることによって、効率的に
傾き角度検出を行なうことができる。
【0043】さらに第2実施例では、2方向からの差分
値を用いて濃度変化方向を求めているので、方向性を持
つ画像構成要素であれば、活字体漢字のように多くの水
平・垂直線から構成されている領域だけでなく、バ―コ
―ドのように特定の方向にのみ直線が存在するような領
域も対象として傾き角度検出することが可能である。
【0044】なお、同様な効果を得るための構成とし
て、図7における第2垂直方向差分処理回路14′を、
図10に示すように垂直方向差分処理回路14の出力を
遅延する遅延回路34と遅延出力の符号を反転させる符
号反転回路35とに置き換えた構成とすることも可能で
ある。これは、以下に示す式にしたがい、第2垂直方向
差分値Δv′を求める代わりに、先に求めた垂直方向差
分値Δvを記憶しておき、その符号を反転させた値を用
いるものである。
【0045】 Δv′i,j =yi,j −yi,j-1 =−(yi,(j-1) −yi,(j-1)+1 ) =−Δvi,j-1 これによって、図7と同様の効果を得ることができる。
【0046】以下に本発明の第3実施例を説明する。こ
の実施例では、第1実施例の図3における濃度変化方向
検出部8および傾き角度検出部9を図12に示すような
構成とする。なお、前記図3に示したものと同一また
は、相当部分には同一符号を用いてその説明は省略す
る。
【0047】同図において、36は、水平方向差分処理
回路13、および垂直方向差分処理回路14により得ら
れた水平・垂直方向差分値のΔH−ΔV平面上での位置
(濃度変化ベクトル)を記憶する差分値記憶回路であ
り、37は、差分値記憶回路36に記憶された濃度変化
ベクトルのΔH−ΔV平面上での分布パタ―ンを認識す
るパタ―ン認識回路であり、38は、パタ―ン認識回路
37で認識されたパタ―ン形状より傾き角度を検出する
傾き角度検出回路である。
【0048】上記した構成において、差分値記憶回路3
6では、水平方向差分処理回路13、および垂直方向差
分処理回路14の差分処理回路によって得られた水平・
垂直方向差分値Δh,Δvを要素とする濃度変化ベクト
ルを記憶し、パタ―ン認識回路37では、差分値記憶回
路36に記憶された各画素に対応する濃度変化ベクトル
のΔH−ΔV平面上での分布パタ―ンを認識する。そし
て、傾き角度検出回路38では、パターン認識回路37
で認識されたパタ―ン形状より傾き角度を検出する。
【0049】この操作を図11を用いてさらに説明す
る。図11(a)のような活字体漢字領域に対して、図
12の構成によって水平・垂直方向の差分値Δh,Δv
の分布を求めると、図11(b)のような十文字のパタ
―ンが得られる。この十文字のパタ―ンは文字が回転す
るにつれて同じように回転するので、このパタ―ンを認
識し、回転角を求めれば傾き角度が検出できる。
【0050】パタ―ン認識回路37としては、例えば、
近似や相関を利用したものや、統計的手法によるもの、
ニュ―ラルネット等を用いることができる。また、予め
学習を行なうことによって、パタ―ンに方向性が現れる
対象であれば、あらゆる画像構成要素についても傾き角
度検出を行なうことが可能となる。このようにして、文
字の位置関係に依存することなく文書画像の傾き角度検
出が可能となる。
【0051】上記した第3実施例によれば、画像構成要
素の方向性を利用して、直交する2方向に画像を走査し
て差分をとり、差分値のΔH−ΔV平面上での分布形状
を調べることによって文書の傾き角度を検出しているの
で、文字等の画像構成要素の位置関係に依存することな
く文書等の画像の傾き角度検出が可能である。また、画
像構成要素自体の傾き角度を検出しているので、極端な
場合1文字でも検出が可能であり、また、像域分離処理
後の文書画像を対象とすることによって、効率的に傾き
角度検出を行なうことができる。
【0052】さらに第3実施例では、差分値のΔH−Δ
V平面上での分布形状を調べることによって文書等の画
像の傾き角度を検出しているので、活字体漢字やバ―コ
―ド等、分布パタ―ンに方向性が現れるような領域は全
て傾き角度検出の対象とすることが可能である。
【0053】また、以上の実施例において、濃度変化方
向検出部8、傾き角度検出部9は、第1実施例〜第3実
施例に掲げたものに限られるものではなく、その他の公
知の技術を用いて構成することも可能である。また、こ
れらの組合せも、実施例に掲げたものに限られるもので
はなく、各処理部を交換して構成することも可能であ
る。また、これら実施例に示した装置における画像処理
はソフトウェア上で行なうようにしてもよいことは勿論
である。
【0054】
【発明の効果】以上詳述したように、本発明の傾き角度
検出装置は、文書等の画像を光学的に走査して得られた
濃淡画像の少なくとも一部を記憶する濃淡画像記憶手段
と、この濃淡画像記憶手段に記憶された濃淡画像から濃
度変化方向を検出する濃度変化方向検出手段と、この濃
度変化方向検出手段によって検出された濃度変化方向の
分布状態から画像構成要素の傾き角度を検出する傾き角
度検出手段とを具備し、直線状の文字列が存在せず、文
字が散在している場合にも、対象領域の濃度変化方向の
分布状態を求めることによって、文字の位置関係に依存
することなく文書画像の傾き角度検出が可能となる。ま
た、文字自体の傾き角度を検出しているので、極端な場
合1文字でも検出が可能であり、また像域分離処理後の
文書画像を対象とすることによって、効率的に傾き角度
検出を行なうことができる。
【図面の簡単な説明】
【図1】本発明に係る傾き角度検出装置の概念図であ
る。
【図2】濃度変化方向算出手段の説明図である。
【図3】本発明に係る傾き角度検出装置の第1実施例を
示す構成図である。
【図4】差分フィルタの説明図である。
【図5】濃度変化方向を線分の傾き角度に置換する手段
の説明図である。
【図6】傾き角度検出例の説明図である。
【図7】本発明に係る傾き角度検出装置の第2実施例を
示す構成図である。
【図8】微小輝度平面の設定手段の説明図である。
【図9】第2実施例における傾き角度検出例の説明図で
ある。
【図10】第2実施例と同様の効果をもつ別構成の説明
図である。
【図11】濃度変化ベクトルの分布の説明図である。
【図12】本発明に係る傾き角度検出装置の第3実施例
を示す構成図である。
【図13】平滑回路を使用した場合と使用しない場合に
おける線分の傾き方向のヒストグラムを示す図である。
【図14】従来の傾き角度検出装置の構成を示す図であ
る。
【符号の説明】
7…濃淡画像記憶部、8…濃度変化方向検出部、9…傾
き角度検出部、10…濃淡画像メモリ、11…平滑化回
路、12…平滑画像メモリ、13…水平方向差分処理回
路、14…垂直方向差分処理回路、15…角度変換回
路、16…累積度数計数回路、17…傾き角度検出回
路、18…傾き角度補正回路。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 文書等の画像を光学的に走査して得られ
    た濃淡画像の少なくとも一部を記憶する濃淡画像記憶手
    段と、 この濃淡画像記憶手段に記憶された濃淡画像から濃度変
    化方向を検出する濃度変化方向検出手段と、 この濃度変化方向検出手段によって検出された濃度変化
    方向の分布状態から画像構成要素の傾き角度を検出する
    傾き角度検出手段と、 を具備したことを特徴とする傾き角度検出装置。
  2. 【請求項2】 前記濃度変化方向検出手段は、濃淡画像
    を平滑化する平滑化手段と、この平滑化手段により平滑
    化された濃淡画像から、所定の位置関係の画素が形成す
    る微小輝度平面の法線方向を差分値の比によって求める
    差分処理手段とを具備したことを特徴とする請求項1記
    載の傾き角度検出装置。
  3. 【請求項3】 前記差分処理手段は、前記微小輝度平面
    の法線方向を少なくとも2つ以上求めるように複数の差
    分処理手段を具備したことを特徴とする請求項2記載の
    傾き角度検出装置。
  4. 【請求項4】 前記傾き角度検出手段は、濃度変化方向
    検出手段により検出された濃度変化ベクトルの分布形状
    を認識するパターン認識手段を具備したことを特徴とす
    る請求項1記載の傾き角度検出装置。
JP5182568A 1993-07-23 1993-07-23 傾き角度検出装置 Pending JPH0737103A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP5182568A JPH0737103A (ja) 1993-07-23 1993-07-23 傾き角度検出装置
US08/276,117 US5668898A (en) 1993-07-23 1994-07-15 Device for detecting the inclination of image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5182568A JPH0737103A (ja) 1993-07-23 1993-07-23 傾き角度検出装置

Publications (1)

Publication Number Publication Date
JPH0737103A true JPH0737103A (ja) 1995-02-07

Family

ID=16120558

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5182568A Pending JPH0737103A (ja) 1993-07-23 1993-07-23 傾き角度検出装置

Country Status (2)

Country Link
US (1) US5668898A (ja)
JP (1) JPH0737103A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6248427B1 (en) 1995-08-16 2001-06-19 Zweckform Etikettiertechnik Gmbh Adhesive label
JP2009244102A (ja) * 2008-03-31 2009-10-22 Fujitsu Ltd 移動方向算出装置、移動方向算出プログラムおよび移動方向算出方法
WO2011155161A1 (ja) * 2010-06-11 2011-12-15 パナソニック株式会社 画像処理装置および画像処理方法

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6345104B1 (en) * 1994-03-17 2002-02-05 Digimarc Corporation Digital watermarks and methods for security documents
US7116781B2 (en) * 1993-11-18 2006-10-03 Digimarc Corporation Counteracting geometric distortions in watermarking
US7171016B1 (en) 1993-11-18 2007-01-30 Digimarc Corporation Method for monitoring internet dissemination of image, video and/or audio files
US6560349B1 (en) 1994-10-21 2003-05-06 Digimarc Corporation Audio monitoring using steganographic information
JP3534128B2 (ja) * 1995-01-24 2004-06-07 オムロン株式会社 書類の上下方向検知方法及び装置
US5889884A (en) * 1995-05-23 1999-03-30 Minolta Co., Ltd. Image forming apparatus capable of recognizing top and bottom of document image
KR100207426B1 (ko) * 1996-05-08 1999-07-15 전주범 무늬의 크기와 방향성을 이용한 텍스쳐 분류 장치
US6229924B1 (en) 1996-05-16 2001-05-08 Digimarc Corporation Method and apparatus for watermarking video images
JP3099771B2 (ja) * 1997-05-07 2000-10-16 日本電気株式会社 文字認識方法、装置及び文字認識プログラムを記録した記録媒体
JP3471578B2 (ja) * 1997-08-29 2003-12-02 シャープ株式会社 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
JPH11220298A (ja) * 1998-02-02 1999-08-10 Matsushita Electric Ind Co Ltd 電子部品実装方法
JP3747643B2 (ja) * 1998-08-07 2006-02-22 コニカミノルタホールディングス株式会社 傾き補正装置及び画像読取装置
JP2000182066A (ja) * 1998-10-07 2000-06-30 Advantest Corp 画像処理装置
US6285802B1 (en) 1999-04-08 2001-09-04 Litton Systems, Inc. Rotational correction and duplicate image identification by fourier transform correlation
US6959098B1 (en) * 1999-11-30 2005-10-25 Digimarc Corporation Method and system for determining image transformation
US6873728B2 (en) * 2002-01-16 2005-03-29 Eastman Kodak Company Vertical black line removal implementation
US7567721B2 (en) * 2002-01-22 2009-07-28 Digimarc Corporation Digital watermarking of low bit rate video
CN1183436C (zh) * 2002-04-03 2005-01-05 摩托罗拉公司 用于手写字符的方向确定及其识别
US7577841B2 (en) 2002-08-15 2009-08-18 Digimarc Corporation Watermark placement in watermarking of time varying media signals
JP2004129022A (ja) * 2002-10-04 2004-04-22 Pfu Ltd 画像読取装置
JP4439829B2 (ja) * 2003-03-11 2010-03-24 財団法人国際科学振興財団 データ分析装置およびデータ認識装置
JP4552681B2 (ja) * 2005-02-14 2010-09-29 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法、および画像処理プログラム
US8260047B2 (en) * 2008-06-23 2012-09-04 Texas Instruments Incorporated System and method for determining high frequency content in an analog image source
KR101405410B1 (ko) * 2010-10-20 2014-06-24 고려대학교 산학협력단 객체 검출 장치 및 시스템
JP5693418B2 (ja) * 2011-08-29 2015-04-01 株式会社Pfu 画像処理装置、画像処理方法、画像処理プログラム及び画像処理システム
US10783400B2 (en) 2018-04-06 2020-09-22 Dropbox, Inc. Generating searchable text for documents portrayed in a repository of digital images utilizing orientation and text prediction neural networks

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5425782B2 (ja) * 1973-03-28 1979-08-30
US4558461A (en) * 1983-06-17 1985-12-10 Litton Systems, Inc. Text line bounding system
JPS63282584A (ja) * 1987-05-14 1988-11-18 Sony Corp 回転角度検出方法
US5060276A (en) * 1989-05-31 1991-10-22 At&T Bell Laboratories Technique for object orientation detection using a feed-forward neural network
JP3320759B2 (ja) * 1991-12-26 2002-09-03 株式会社東芝 文書画像傾き検出装置およびその方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6248427B1 (en) 1995-08-16 2001-06-19 Zweckform Etikettiertechnik Gmbh Adhesive label
JP2009244102A (ja) * 2008-03-31 2009-10-22 Fujitsu Ltd 移動方向算出装置、移動方向算出プログラムおよび移動方向算出方法
WO2011155161A1 (ja) * 2010-06-11 2011-12-15 パナソニック株式会社 画像処理装置および画像処理方法
US9088715B2 (en) 2010-06-11 2015-07-21 Panasonic Intellectual Property Corporation Of America Image processing apparatus and image processing method for image correction

Also Published As

Publication number Publication date
US5668898A (en) 1997-09-16

Similar Documents

Publication Publication Date Title
JPH0737103A (ja) 傾き角度検出装置
CN107609549B (zh) 一种自然场景下证件图像的文本检测方法
US8818099B2 (en) Document image binarization and segmentation using image phase congruency
EP0543593B1 (en) Method for determining boundaries of words in text
US5563403A (en) Method and apparatus for detection of a skew angle of a document image using a regression coefficient
EP0543590B1 (en) Method for comparing word shapes
EP1269394B1 (en) Improved method for image binarization
US5506918A (en) Document skew detection/control system for printed document images containing a mixture of pure text lines and non-text portions
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US5647027A (en) Method of image enhancement using convolution kernels
EP2434431A1 (en) Method and device for classifying image
WO2014160433A2 (en) Systems and methods for classifying objects in digital images captured using mobile devices
JP2002208007A (ja) スキャンした文書の自動式検出
EP1462986A3 (en) Device and method for correcting skew of object in image
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN111461131A (zh) 身份证号码信息识别方法、装置、设备及存储介质
US7151859B2 (en) Method and system for correcting direction or orientation of document image
CN112818983B (zh) 一种利用图片相识度判断字符倒置的方法
Valizadeh et al. A novel hybrid algorithm for binarization of badly illuminated document images
JP4132766B2 (ja) 画像処理装置および方法
Kleber et al. Robust skew estimation of handwritten and printed documents based on grayvalue images
KR100503724B1 (ko) 화상에서의 객체 탐색 방법
Lehal et al. A range free skew detection technique for digitized Gurmukhi script documents
JP3303246B2 (ja) 画像処理装置
Hadi et al. A novel approach of skew estimation and correction in persian manuscript text using radon transform

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20021008