[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2004185183A - 画像修正装置、文字認識方法及び画像修正プログラム - Google Patents

画像修正装置、文字認識方法及び画像修正プログラム Download PDF

Info

Publication number
JP2004185183A
JP2004185183A JP2002349551A JP2002349551A JP2004185183A JP 2004185183 A JP2004185183 A JP 2004185183A JP 2002349551 A JP2002349551 A JP 2002349551A JP 2002349551 A JP2002349551 A JP 2002349551A JP 2004185183 A JP2004185183 A JP 2004185183A
Authority
JP
Japan
Prior art keywords
data
image
pixel
color data
maximum value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002349551A
Other languages
English (en)
Other versions
JP4222013B2 (ja
Inventor
Tetsuji Makino
哲司 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2002349551A priority Critical patent/JP4222013B2/ja
Publication of JP2004185183A publication Critical patent/JP2004185183A/ja
Application granted granted Critical
Publication of JP4222013B2 publication Critical patent/JP4222013B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Color Image Communication Systems (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Processing Of Color Television Signals (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】デジタル画像のRGBデータの分布状況を基に認識率の向上を実現し得る画像修正装置及び画像修正プログラムの提供。
【解決手段】画像入力部17から1フレーム分のデジタル画像データが入力されると(ステップP1)、入力された画像データはRAMに転送され、ビットマップイメージで展開される(ステップP2)。RAM14への展開が終わると、画像修正処理プログラムにしたがって処理対象のR、G、Bの値と周囲のデータのR、G、Bの値を比較し、処理対象が減光処理の対象(背景)なのか文字(前景)なのかを判定し、減光処理の対象について光量均一化による補正を行う。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、デジタルカメラ等の撮像装置で撮影した画像の修正技術に関する。
【0002】
【従来の技術】
デジタルカメラ等の電子撮像装置で書類など平面を撮影したデジタル画像データはフラットヘッドスキャナーで得たデジタル画像データと異なり、レンズの特性上周辺部に図7(a)に示すような暗い影72、73が発生する。これはレンズ周辺部を通過した光量が低下していくためで、撮影対象が文字の場合、この減光作用により認識困難になることが知られている。このような減光作用に対しては、レンズの特性のみで考える場合、レンズの形状に沿った同心円上に光量調整を行えば補正が可能となる。
【0003】
例えば、撮影レンズの周辺減光に関するレンズ情報に基いて画像データの周辺減光を補正するようにした電子カメラ(特許文献1)、撮影レンズの特性を取得し、その特性を画像の特性に応じて展開し、この減光量を用いて画像の周辺減光を行うようにした画像処理装置(特許文献2)、撮影レンズの中心からの距離に基いて全画素に対して周辺画像の減光分を補正し、周辺部の画像の濃度に中心部の画像の濃度よりも重みをつけた状態の画像全体の濃度バランスに基いて前記減光分の補正の強度度合いを設定するようにした画像処理装置(特許文献3)、撮影時に写真フィルムに周辺減光の強さに対応する情報を記憶しておき、最盛時にこの情報を読み取って周辺減光補正を行う方法(特許文献4)がある。
【0004】
【特許文献1】
特開2002−190979号公報
【特許文献2】
特開2000−41183号公報
【特許文献3】
特開平11−355511号公報
【特許文献4】
特開平10−13667号公報
【0005】
【発明が解決しようとする課題】
しかしながら、上記特許文献1〜4に開示されているような従来の周辺減光対策はレンズ特性を重視して光量の増減を行うようにしているため、ムラが出る場合があり、また、外部からの光による光量分布の変化を吸収できないなどの課題があった。
【0006】
本発明は、上記従来の周辺減光対策の課題を解消するためになされたものであり、デジタル画像のRGBデ―タの分布状況を基に認識率の向上を実現し得る画像修正装置及び画像修正プログラムの提供を目的とする。特に、撮影した画像を文字認識する文字認識装置に適用して好適な画像修正装置及び画像修正プログラムの提供を目的とする。
【0007】
【課題を解決するための手段】
上記課題を解決するために、第1の発明の画像修正装置は、デジタル画像データをメモリに取り込む画像データ取り込み手段と、メモリに取り込まれたデジタル画像データの全画素の中からR、G、Bの最大値を取得する最大値取得手段と、画像中の所定領域内の画素の色データのうち、最も高い頻度で出現する色データを取得する最多色データ取得手段と、所定領域内の処理対象画素の色データが最多色データ取得手段によって取得された色データと略同等か否かを判定する判定手段と、判定手段によって、処理対象画素の色データが最多色データ取得手段によって取得された色データと略同等とされた場合に、R、G、Bの最大値と処理対象画素の色データのR、G、Bの最大値との差を所定領域内の各画素のR、G、Bにそれぞれ同量ずつ加算する加算手段と、を備えたことを特徴とする。
【0008】
また、第2の発明の画像修正装置は、デジタル画像データをメモリに取り込む画像データ取り込み手段と、画素の輝度を取得する輝度取得手段と、メモリに取り込まれたデジタル画像データの全画素の中から取得された輝度の最大値を取得する最大値取得手段と、画像中の所定領域内の画素の輝度データのうち、最も高い頻度で出現する輝度データを取得する最多輝度データ取得手段と、所定領域内の処理対象画素の輝度データが最多輝度データ取得手段によって取得された輝度データと略同等か否かを判定する判定手段と、判定手段によって、処理対象画素の輝度データが最多輝度データ取得手段によって取得された輝度データと略同等とされた場合に、輝度の最大値と処理対象画素の色データの輝度の最大値との差を所定領域内の各画素の輝度にそれぞれ同量ずつ加算する加算手段と、を備えたことを特徴とする。
【0009】
また、第3の発明は上記第1又は第2の発明の画像修正装置において、更に、文字認識手段を備え、修正された画像データを用いて文字認識を行うことを特徴とする。
【0010】
また、第4の発明は上記第1、第2の又は第3のいずれかの発明の画像修正装置において、所定領域は矩形であることを特徴とする。
【0011】
また、第5の発明の文字認識方法は、デジタル画像データをメモリに取り込むステップと、メモリに取り込まれたデジタル画像データの全画素の中からR、G、Bの最大値を取得するステップと、画像中の所定領域内の画素の色データのうち、最も高い頻度で出現する色データを取得するステップと、所定領域内の処理対象画素の色データが最多色データ取得手段によって取得された色データと略同等か否かを判定するステップと、処理対象画素の色データが取得された色データと略同等とされた場合に、R、G、Bの最大値と処理対象画素の色データのR、G、Bの最大値との差を所定領域内の各画素のR、G、Bにそれぞれ同量ずつ加算するステップと、ステップにより得られた画像データを基に文字認識を行うステップと、を備えたことを特徴とする。
【0012】
また、第6の発明の画像修正プログラムは、画像の周辺減光を修正する画像修正装置で実行されるプログラムであって、デジタル画像データを読み取るステップと、読み取られたデジタル画像データをメモリに取り込ませるステップと、メモリに取り込まれたデジタル画像データの全画素の中からR、G、Bのそれぞれ独立して取りうる最大値を取得させるステップと、画像中の矩形領域内の画素の色データのうち、最も高い頻度で出現する色データを取得させるステップと、矩形領域内の処理対象画素の色データが最多色データ取得手段によって取得された色データと略同等か否かを判定させるステップと、判定によって、処理対象画素の色データが最多色データ取得手段によって取得された色データと略同等であるとされた場合に、R、G、Bの最大値と処理対象画素の色データのR、G、Bの最大値との差を算出させるステップと、算出された差を矩形領域内の各画素のR、G、Bにそれぞれ同量ずつ加算させるステップと、を備えたことを特徴とする。
【0013】
【発明の実施の形態】
図1は本発明に基く画像修正装置のハードウエア構成の一実施例を示すブロック図であり、画像修正装置1は装置全体の動作を制御するCPU11と、ユーザがデータ入力や操作指示を行うキー入力部12と、画像等を表示する表示部13と、プログラムを一時駐在させると共に、入力されたデジタル画像データ(以下、単に画像データと記す)の一時記憶及び画像修正時の作業用領域として用いられるRAM14と、磁気ディスク読取装置等の保存記憶部15と保存記憶部15に内蔵又は装着される記憶媒体16と、画像データを入力する画像入力部17とイメージプリンター等からなる印刷部18とを備えている。
【0014】
なお、画像修正装置1に図示のように画像(文字イメージ)から文字認識を行う文字認識処理部22及び文字認識処理の際用いる辞書23を付加することにより、画像修正機能を備えた文字認識装置を構成することができる。このようにした場合は画像修正機能付き文字認識装置は本発明に基く周辺減光対策を施した画像(文字イメージ)に対して文字認識を行うことができるのでデジタルカメラ等の撮像装置で撮影した文字イメージ(画像データ)を取り込んで減光対策等の画像修正処理により明瞭となった文字イメージを基に文字認識を行うことができるので高い認識率による文字認識が実現できる。
【0015】
RAM14には入力バッファから転送される画像データを一時記憶する領域、矩形範囲中の最多色を調べるためのテーブル(図6)を一時記憶するためのテーブル領域、OSや本発明に基く画像修正処理プログラム等のプログラムを駐在させる領域、定数や、計算値、取得値等を保持するための一時記憶領域等が割り付けられている。
【0016】
保存記憶部15には修正処理された画像データを保存記憶する画像記憶領域と、OSや図3に示すような動作の実行指示を行う画像修正処理プログラム等のプログラム群を記憶するプログラム駐在領域が割り付けられている。
【0017】
なお、画像修正処理プログラムは最大値MaxColorを取得するためのサブプログラム1(図4)及び矩形範囲中に出現する最多色を取得するためのサブプログラム2(図5)を含み、これらのプログラムは画像修正装置1の初期設定時または任意の時点にインストールされプログラム記憶領域に記憶される。また、画像修正装置1が起動されると記憶媒体16から読み出され、RAM14の実行プログラム駐在領域に駐在する。
【0018】
画像入力部17は、デジタルカメラ等の撮像装置から取り出されたメモリーカードに書き込まれている画像データを読み取るメモリーカードリーダやCD−ROMリーダ等の画像記録媒体読取装置からなる。
【0019】
なお、画像入力部17に代えて、又は併設して、図示のようにデジタルカメラ100等の撮像装置とケーブル接続又は赤外線等の近距離無線接続による画像データ入力を行う外部インターフェイス19、又は有線又は無線通信網を介してデジタルカメラ200等の撮像装置から送信される画像データを入力する通信インターフェイス20を備えるようにしてもよい。
【0020】
文字認識処理部22は、例えば、画像イメージから1文字ずつ文字イメージを切り出して正規化し、特徴を抽出して辞書23に登録されている文字の特徴と比較して文字認識を行う。
【0021】
また、本発明の画像修正処理は実施例ではプログラム(画像修正プログラム)で構成され、CPU11は画像修正プログラム(図3〜図5)に従って画像修正処理を実行するが、専用の画像修正処理部21を備えるようにしてもよい。
【0022】
図2は本発明の画像修正装置の動作の概要を示すフローチャートであり、画像入力部17(又は、外部インターフェイス19、通信インターフェイス20)から1フレーム分の画像データ(デジタルデータ)が入力されると(ステップP1)、CPU11は入力された画像データを入力バッファからRAM14に転送しビットマップイメージで展開(一時記憶)する。ビットマップデータの一例としては、1つの画素を24ビットで表現し、R、G、B成分をそれぞれ8ビットで表現している(ステップP2)。
【0023】
RAM14への展開が終わると、CPU11は画像修正処理プログラムに従って図3のフローチャートに示すような動作で処理対象のR、G、Bの値と周囲のデータのR、G、Bの値を比較し、処理対象が減光処理の対象(背景)なのか文字(前景)なのかを判定し、減光処理の対象について光量均一化による補正を行う(ステップP3)。
なお、画像修正装置1が文字認識処理部22を備えている場合には、更に、上記ステップP3で補正後の画像について文字認識処理を行なう(ステップP4)。
【0024】
(画像修正処理動作)
図3は図2に示したステップP3での画像修正処理動作の一実施例を示すフローチャートである。
図3で、CPU11は、まず、サブプログラム1に従って図4のフローチャートに示すような動作で、RAM14に展開された入力画像の全データ領域{(X−n,Y−m)〜(X+n,Y+m)}をサーチし、それぞれ独立して取り得る最大値MaxColor(R or G or B)を取得してRAM14に保持(一時記憶)し、ステップS2に進む(ステップS1)。
【0025】
次に、画像データの原点(X=0、Y=0)を画像の左上隅に定め(ステップS2)、サブプログラム2に従って図5のフローチャートに示すような動作で、RAM14に展開された矩形範囲{(X−n,Y−m)〜(X+n,Y+m)}の中に出現する最多色AveColor(R、G、B)を取得してRAM14に保持(一時記憶)し、ステップS4に進む(ステップS3)。なおここで矩形範囲を取るのがベストモードであるが楕円など矩形に限定されるものではない。
【0026】
次に、上記ステップS3で取得した矩形範囲{(X−n,Y−m)〜(X+n,Y+m)}の中のうち最多色の色データ(R、G、B)の値と処理対象の画素(座標(X、Y))の色データ(R、G、B)の値との差の絶対値abs(AveColor−(X、Y))と閾値を比較し、差の絶対値が閾値より小さい場合は背景色と判定してステップS5に進み、そうでない場合は文字(線分)等のような前景色と判定してステップS8に進む(ステップS4)。
【0027】
次に、画素(座標(X、Y))のR、G、Bのうち最大値TopByteを取得し(ステップS5)、MaxColorとの差(R+、G+、B+)を算出し、ステップS7に進む(ステップS6)。
算出された最大値との差分値、R+、G+、B+を背景色である現在の処理対象の各画素のR、G、Bの値にそれぞれ同量ずつ加算してR、G、Bを補正する(ステップS7)。
【0028】
次に、座標Xが全データ領域の幅の値を超えているか否かを調べ、超えている場合はステップS10に進み、超えていない場合はステップS9に進む(ステップS8)。座標Xが全データ領域の横幅の値を超えていない場合は座標Xに1ドット幅の値を加えて次の矩形範囲に出現する最多色を取得するためにステップS3に進む(ステップS9)。
【0029】
また、座標Xが全データ領域の横幅の値を超えている場合は、座標Yが全データ領域の縦幅の値を超えているか否かを調べ、超えている場合は全画像データ領域について補正処理を終了したものとして画像補正処理動作を終了し、超えていない場合はステップS11に進む(ステップS10)。座標Yが全データ領域の縦幅の値を超えていない場合は座標Yに1ドット幅の値を加えて次の矩形範囲に出現する最多色を取得するためにステップS3に進む(ステップS11)。
【0030】
また、画像修正装置1が文字認識処理部22を備えている場合には、更に、文字認識処理部22は上記ステップS1〜S11で修正後の画像イメージから1文字ずつ文字イメージを切り出して正規化し、正規化後の文字イメージの特徴を抽出して辞書23に登録されている文字の特徴と比較し文字認識を行い、認識結果を出力する(ステップS12)。
【0031】
上記図3のフローチャートのステップS4により、矩形範囲内の処理対象画素の色データ(R、G、B)が最多色AveColorと略同等か否かを判定することができ、上記ステップS5により、処理対象画素の色データが最多色データと略同等とされた場合に、R、G、Bの最大値と処理対象画素の色データのR、G、Bの最大値との差を矩形範囲内の各画素のR、G、Bにそれぞれ同量ずつ加算することができるので、上記図3に示したフローチャートの動作により、処理対象の画素(座標(X、Y))のR、G、Bの値と、その周囲の最多色のR、G、Bの値を比較することにより単に背景として補正処理してよいデータかそれとも文字などの前景データかを判定することができる。そして、ステップS7で画像データの光量を均一化して周辺減光等を排除するので、画像を鮮明にできる。
【0032】
また、前景データについてはステップS8以降に示すように補正処理をバイパスするので、従来のように文字の欠損が発生せず図7(c)に示すように文字等の情報が明瞭に表示され、見やすくなる。
【0033】
また、上記ステップS12により、デジタルカメラ等の撮像装置で撮影した文字イメージ(画像データ)を取り込んで減光対策等の画像修正処理により明瞭となった文字イメージを基に文字認識を行うことができるのでデジタルカメラ等で撮影した文字についても高い文字認識率が実現できる。
【0034】
なお、上記ステップS2では画像データの原点(X=0、Y=0)を画像の左上隅に定めるものとしたが、これに限定されない。左下隅を原点としてもよく、右上隅または右下隅を原点としてもよく、画像の中心を原点としてもよい。但し、原点の位置を左上隅以外とする場合はステップS9、S11での加算値を原点の位置にしたがって変更する必要がある。
【0035】
(サブプログラム1による動作)
図4は最大値を取得するためのサブプログラムによる動作例を示すフローチャートである。
まず、画像データの原点(X=0、Y=0)を画像の左上隅に定め、RAM14の最大値MaxColor(R、G、B)エリアを0クリアし(ステップS1−1)、指定座標(X、Y)の画素のR、G、Bの値をそれぞれ取得する。ここで、R=Red(X、Y)、G=Green(X、Y)、B=Blue(X、Y)である(ステップS1−2)。
【0036】
次に、上記ステップS1−1で取得したR、G、Bの中の最大値MaxRGBを取得し(ステップS1−3)、MaxRGBとMaxColorとを比較し、MaxRGB<MaxColorの場合にはステップS1−6に進み、そうでない場合にはステップS1−5に進む(ステップS1−4)。MaxRGB<MaxColorでない場合はMaxColorにMaxRGBを代入してステップS1−6に進む(ステップS1−5)。
【0037】
次に、座標Xが全データ領域の横幅の値より小さいか否かを調べ、超えていない場合はステップS1−7に進み、超えている場合はステップS1−8に進む(ステップS1−6)。座標Xが全データ領域の横幅を超えていない場合は座標Xに1ビット幅の値を加えて次の矩形範囲の最多色を取得するためにステップS1−2に進む(ステップS1−7)。
【0038】
座標Xが全データ領域の横幅の値を超えている場合は、座標Yが全データ領域の縦幅の値を超えているか否かを調べ、超えていない場合はステップS1−9に進み、超えている場合は全画像データ領域についてMaxColor取得動作を終了したものとしてサブプログラムによる動作を終了して図3のフローチャートのステップS1に復帰する(ステップS1−8)。座標Yが全データ領域の縦幅の値を超えていない場合は座標Yに1ビット幅の値を加えてステップS1−2に進む(ステップS1−9)。
【0039】
なお、上記ステップS1−1では画像データの原点(X=0、Y=0)を画像の左上隅に定めるものとしたが、これに限定されない。左下隅を原点としてもよく、右上隅または右下隅を原点としてもよく、画像の中心を原点としてもよい。但し、原点の位置を左上隅以外とする場合はステップS1−7、S1−9での加算値を原点の位置にしたがって変更する必要がある。
【0040】
(サブプログラム2による動作)
図5は矩形範囲中に出現する最多色を取得するためのサブプログラムによる動作例を示すフローチャートである。また、図6は処理対象データを中心とした任意の領域中(実施例では矩形範囲)で最も多く出現した色(最多色色データ)を調べるためのテーブルの構成例を示す図であり、符号60−1、60−2、・・はテーブル60を構成するテーブルデータを示し、符号61−1、61−2、・・は各テーブルデータが示す色の出現頻度格納欄を示し、出現頻度格納欄61−1、61−2、・・・はカウンタとして機能する。また、各テーブルデータ60−1、60−2、・・のR、G、BはR、G、B値の格納欄を意味する。また、図5ではテーブル60(図6)をTable[]として示している。テーブル60はRAM14のテーブル領域に生成される。なお、図6の構成ではテーブル60は任意領域のサイズの4倍(出現頻度+R、G、B)+1(データ数)分の領域を必要とするが、テーブルは図6の構成に限定されない。
【0041】
図3のフローチャートのステップS2からステップS3に進むとCPU11はサブプログラム2に従い、図6に示すようなテーブル60のテーブルデータ60−1、60−2、・・・を0クリアして初期化し(ステップ3−1)、指定座標(X、Y)の画素のR、G、Bの値をそれぞれ取得する。ここで、R=Red(X、Y)、G=Green(X、Y)、B=Blue(X、Y)である(ステップS3−2)。
【0042】
次に、テーブル60のテーブルデータ60−1、60−2、・・・のうちすでに値が格納されているテーブルデータのR、G、B格納欄の値と閾値を比較し閾値以内のデータがあるか否かを調べ(ステップS3−3)、閾値以内のデータがない場合はステップS3−5に進み、ある場合はステップS3−6に進む(ステップS3−4)。
【0043】
閾値以内のデータがない場合は、テーブル60の空いたテーブルデータのR、G、B格納欄に上記ステップS3−2で取得した指定座標(X、Y)の画素のR、G、Bの値をそれぞれ格納(=記憶)し、ステップS3−7に進む(ステップS3−5)。
【0044】
また、閾値以内のデータがある場合は存在した色のデータテーブルのカウンタ(出現頻度格納欄)に1を加えて更新し、ステップS3−7に進む(ステップS3−6)。
【0045】
次に、矩形範囲内の画素について閾値以内のデータがあるか否かを調べ終わったか否かを調べ、調べ終わった場合にはステップS3−8に進み、そうでない場合はステップS3−2に戻る(ステップS3−7)。
【0046】
次に、テーブル60の各テーブルデータ60−1、60−2、・・・の出現頻度欄61−1、61−2、・・・をサーチして出現頻度が最大のテーブルデータが表す色(=R、G、B)をAveColor(R、G、B)にセットし、図3のステップS3に復帰する(ステップS3−8)。
【0047】
図7はデジタル画像に発生した周辺減光や補正処理の結果等の説明図である。図7(a)は従来技術による周辺減光の説明図であり、背景色が同じ色である場合でも左下、右下に暗い領域72、73(斜線の部分)が背景色とは別の色で出現する。なお、正確に中心から同心円状に出現しないのは撮影時の外光が影響を及ぼすためである。また、図7(b)は単純に同系色の輝度を上げたり、或いは置き換えを行った場合の例であり、文字71が消え、符号71’で表すように不明瞭なイメージとなる。
【0048】
また、図7(c)は本発明の画像修正処理後の画像であり、処理対象(文字71)の画素の周囲の色データ(R、G、B)から処理対象の画素が背景なのか前景(文字)なのかを判断し、背景の場合に周囲の色データ(R、G、B)の分布状況を基に光量均一化を行ない、減光部の補正を行っているので、図示のように文字71は消失せず明瞭なイメージとなる。
【0049】
(変形例)
なお、上記実施例の説明では処理対象の画素(座標(X、Y))のR、G、Bと、その周囲の最多色のR、G、Bを比較して単に背景として補正処理してよいデータかそれとも文字などの前景データかを判定するようにしたが、R、G、Bから輝度を導き出し、その輝度を比較に用いるようにしてもよい。この場合、図3のステップS1の前段にRAM14に取り込まれた画像データの全画素のR、G、Bから輝度を導出するステップを設け、図3のフローチャートのステップS1以下、図4のフローチャートのステップS1−1以下、図5のフローチャートのステップS3−1以下及びそれらステップの説明でR、G、Bを輝度に、色データを輝度データに置き換えればよい。また、R、G、Bから輝度を導出する方法は公知の方法(変換式)を用いて行うことができる。
また、R、G、Bのデータに限定せず、映像信号YUVデータのYデータを利用してもよい。
以上、本発明の一実施例及び変形例について説明したが本発明は上記実施例及び変形例に限定されるものではなく、種々の変形実施が可能であることはいうまでもない。
【0050】
【発明の効果】
上記説明したように、第1の発明の画像修正装置によれば、処理対象の画素(座標(X、Y))のR、G、Bの値と、その周囲の最多色のR、G、Bの値を比較することにより単に背景として補正処理してよいデータかそれとも文字などの前景データかを判定し、画像データの光量を均一化して周辺減光等を排除するので、補正後も、従来のように周辺に暗部等が出現せず、文字のような線画像も明瞭なイメージとなる。
【0051】
また、第2の発明の画像修正装置ではR、G、Bに代えて輝度を用いるので、第1の発明と同様の効果を得ることができる。
【0052】
また、第3の発明の画像修正装置では、修正した画像データを基に文字認識を行うので、より認識制度を上げることができる。
【0053】
また、第4の発明の画像修正装置では、処理対象の所定の領域を矩形としたので、コンピュータのプログラムが組みやすく演算も速いという効果がある。
【0054】
また、第5の発明の文字認識方法によれば、単に背景として補正処理してよいデータかそれとも文字などの前景データかを判定し、画像データの光量を均一化して周辺減光等を排除するので、補正後も、従来のように周辺に暗部等が出現せず、文字のような線画像も明瞭なイメージとなり、より文字認識率を向上させることができる。
【0055】
また、第6の発明の画像修正プログラムによれば、プログラムにより第1の発明と同様の効果を得ることができるので、画像修正プログラムをインストールすれば市販されているパソコンを画像修正装置として用いることができるので、デジタルカメラ等の撮像装置のエンドユーザも容易に画像の減光補正を行うことができる。
【図面の簡単な説明】
【図1】本発明に基く画像修正装置のハードウエア構成の一実施例を示すブロック図である。
【図2】本発明の画像修正装置の動作の概要を示すフローチャートである。
【図3】画像修正処理動作の一実施例を示すフローチャートである。
【図4】最大値を取得するためのサブプログラムによる動作例を示すフローチャートである。
【図5】矩形範囲中に出現する最多色を取得するためのサブプログラムによる動作例を示すフローチャートである。
【図6】矩形範囲中に出現する最多色を調べるためのテーブルの構成例を示す図である。
【図7】デジタル画像に発生した周辺減光や補正処理の結果等の説明図である。
【符号の説明】
11 CPU(画像データ取り込み手段、最大値取得手段、輝度取得手段、最多色データ取得手段、判定手段、加算手段、最多輝度データ取得手段)
14 RAM(メモリ)
17 画像入力部(画像データ取り込み手段)
19 外部インターフェイス(画像データ取り込み手段)
20 通信インターフェイス(画像データ取り込み手段)
60 テーブル(最多色データ取得手段、最多輝度データ取得手段)

Claims (6)

  1. デジタル画像データをメモリに取り込む画像データ取り込み手段と、
    前記メモリに取り込まれたデジタル画像データの全画素の中からR、G、Bの最大値を取得する最大値取得手段と、
    画像中の所定領域内の画素の色データのうち、最も高い頻度で出現する色データを取得する最多色データ取得手段と、
    前記所定領域内の処理対象画素の色データが前記最多色データ取得手段によって取得された色データと略同等か否かを判定する判定手段と、
    前記判定手段によって、前記処理対象画素の色データが前記最多色データ取得手段によって取得された色データと略同等とされた場合に、前記R、G、Bの最大値と前記処理対象画素の色データのR、G、Bの最大値との差を前記所定領域内の各画素のR、G、Bにそれぞれ同量ずつ加算する加算手段と、
    を備えたことを特徴とする画像修正装置。
  2. デジタル画像データをメモリに取り込む画像データ取り込み手段と、
    画素の輝度を取得する輝度取得手段と、
    前記メモリに取り込まれたデジタル画像データの全画素の中から前記取得された輝度の最大値を取得する最大値取得手段と、
    画像中の所定領域内の画素の輝度データのうち、最も高い頻度で出現する輝度データを取得する最多輝度データ取得手段と、
    前記所定領域内の処理対象画素の輝度データが前記最多輝度データ取得手段によって取得された輝度データと略同等か否かを判定する判定手段と、
    前記判定手段によって、前記処理対象画素の輝度データが前記最多輝度データ取得手段によって取得された輝度データと略同等とされた場合に、前記輝度の最大値と前記処理対象画素の色データの輝度の最大値との差を前記所定領域内の各画素の輝度にそれぞれ同量ずつ加算する加算手段と、
    を備えたことを特徴とする画像修正装置。
  3. 更に、文字認識手段を備え、前記修正された画像データを用いて文字認識を行うことを特徴とする請求項1または2記載の画像修正装置。
  4. 前記所定領域は矩形であることを特徴とする請求項1、2または3のいずれかに記載の画像修正装置。
  5. デジタル画像データをメモリに取り込むステップと、
    前記メモリに取り込まれたデジタル画像データの全画素の中からR、G、Bの最大値を取得するステップと、
    画像中の所定領域内の画素の色データのうち、最も高い頻度で出現する色データを取得するステップと、
    前記所定領域内の処理対象画素の色データが前記最多色データ取得手段によって取得された色データと略同等か否かを判定するステップと、
    前記処理対象画素の色データが前記取得された色データと略同等とされた場合に、前記R、G、Bの最大値と前記処理対象画素の色データのR、G、Bの最大値との差を前記所定領域内の各画素のR、G、Bにそれぞれ同量ずつ加算するステップと、
    前記ステップにより得られた画像データを基に文字認識を行うステップと、
    を備えたことを特徴とする文字認識方法。
  6. 画像の周辺減光を修正する画像修正装置で実行されるプログラムであって、
    デジタル画像データを読み取るステップと、読み取られたデジタル画像データをメモリに取り込ませるステップと、
    前記メモリに取り込まれたデジタル画像データの全画素の中からR、G、Bのそれぞれ独立して取りうる最大値を取得させるステップと、
    画像中の矩形領域内の画素の色データのうち、最も高い頻度で出現する色データを取得させるステップと、
    前記矩形領域内の処理対象画素の色データが前記最多色データ取得手段によって取得された色データと略同等か否かを判定させるステップと、
    前記判定によって、前記処理対象画素の色データが前記最多色データ取得手段によって取得された色データと略同等であるとされた場合に、前記R、G、Bの最大値と前記処理対象画素の色データのR、G、Bの最大値との差を算出させるステップと、
    前記算出された差を前記矩形領域内の各画素のR、G、Bにそれぞれ同量ずつ加算させるステップと、
    を備えたことを特徴とする画像修正プログラム。
JP2002349551A 2002-12-02 2002-12-02 画像修正装置、文字認識方法及び画像修正プログラム Expired - Fee Related JP4222013B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002349551A JP4222013B2 (ja) 2002-12-02 2002-12-02 画像修正装置、文字認識方法及び画像修正プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002349551A JP4222013B2 (ja) 2002-12-02 2002-12-02 画像修正装置、文字認識方法及び画像修正プログラム

Publications (2)

Publication Number Publication Date
JP2004185183A true JP2004185183A (ja) 2004-07-02
JP4222013B2 JP4222013B2 (ja) 2009-02-12

Family

ID=32752054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002349551A Expired - Fee Related JP4222013B2 (ja) 2002-12-02 2002-12-02 画像修正装置、文字認識方法及び画像修正プログラム

Country Status (1)

Country Link
JP (1) JP4222013B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680342B2 (en) 2004-08-16 2010-03-16 Fotonation Vision Limited Indoor/outdoor classification in digital images
US7868922B2 (en) 2006-02-14 2011-01-11 Tessera Technologies Ireland Limited Foreground/background segmentation in digital images
US7912285B2 (en) * 2004-08-16 2011-03-22 Tessera Technologies Ireland Limited Foreground/background segmentation in digital images with differential exposure calculations
CN102175040A (zh) * 2011-03-05 2011-09-07 铁岭铁光仪器仪表有限责任公司 采用计算机程序进行燃炉多燃烧器独立熄火报警监控系统
US8212897B2 (en) 2005-12-27 2012-07-03 DigitalOptics Corporation Europe Limited Digital image acquisition system with portrait mode
US8363908B2 (en) 2006-05-03 2013-01-29 DigitalOptics Corporation Europe Limited Foreground / background separation in digital images
CN103716505A (zh) * 2012-09-28 2014-04-09 北京蒙恬科技有限公司 图像识别系统及方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7680342B2 (en) 2004-08-16 2010-03-16 Fotonation Vision Limited Indoor/outdoor classification in digital images
US7912285B2 (en) * 2004-08-16 2011-03-22 Tessera Technologies Ireland Limited Foreground/background segmentation in digital images with differential exposure calculations
US7957597B2 (en) 2004-08-16 2011-06-07 Tessera Technologies Ireland Limited Foreground/background segmentation in digital images
US8175385B2 (en) 2004-08-16 2012-05-08 DigitalOptics Corporation Europe Limited Foreground/background segmentation in digital images with differential exposure calculations
US8212897B2 (en) 2005-12-27 2012-07-03 DigitalOptics Corporation Europe Limited Digital image acquisition system with portrait mode
US7868922B2 (en) 2006-02-14 2011-01-11 Tessera Technologies Ireland Limited Foreground/background segmentation in digital images
US8363908B2 (en) 2006-05-03 2013-01-29 DigitalOptics Corporation Europe Limited Foreground / background separation in digital images
CN102175040A (zh) * 2011-03-05 2011-09-07 铁岭铁光仪器仪表有限责任公司 采用计算机程序进行燃炉多燃烧器独立熄火报警监控系统
CN102175040B (zh) * 2011-03-05 2012-09-05 铁岭铁光仪器仪表有限责任公司 采用计算机程序进行燃炉多燃烧器独立熄火报警监控系统
CN103716505A (zh) * 2012-09-28 2014-04-09 北京蒙恬科技有限公司 图像识别系统及方法

Also Published As

Publication number Publication date
JP4222013B2 (ja) 2009-02-12

Similar Documents

Publication Publication Date Title
US7734098B2 (en) Face detecting apparatus and method
US8442347B2 (en) Information processing apparatus, information processing method, program, and imaging apparatus including optical microscope
US7358994B2 (en) Image processing apparatus, image processing method, recording medium thereof, and program thereof
TWI467495B (zh) 利用全彩像素映射邊緣
CN107018407B (zh) 信息处理装置、评价用图、评价系统、以及性能评价方法
CN112351195B (zh) 图像处理方法、装置和电子系统
JP2008527852A (ja) ディジタル・カメラの画像のホワイト・バランス補正
US8249321B2 (en) Image processing apparatus and method for red eye detection
CN111368819A (zh) 光斑检测方法和装置
WO2010089836A1 (ja) 画像処理装置
JP2007074578A (ja) 画像処理装置、撮影装置、及びプログラム
JP2018137636A (ja) 画像処理装置及び画像処理プログラム
JP4222013B2 (ja) 画像修正装置、文字認識方法及び画像修正プログラム
US20040247197A1 (en) Correction parameter determining method, correction parameter determining apparatus, computer program, and recording medium
US7277576B2 (en) Active color correction to compensate for near field color cast
JP3950551B2 (ja) 画像処理方法、装置および記録媒体
CN113824894A (zh) 曝光控制方法、装置、设备及存储介质
JP2005346474A (ja) 画像処理方法及び装置及びプログラム及び記憶媒体
JP2003219180A (ja) 画像処理方法、画像処理装置、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
JP2007219899A (ja) 個人識別装置、個人識別方法および個人識別プログラム
JP2000013625A (ja) 画像処理方法、装置および記録媒体
JP2002117402A (ja) 画像処理方法及びその装置
WO2021147316A1 (zh) 物体识别方法及装置
JP2003274180A (ja) 画像処理装置、画像処理方法、プリンタドライバ、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
JP3473832B2 (ja) ディジタル画像の自動補正方法及びそのシステム

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040507

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050527

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060208

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060406

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080519

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080701

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081028

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081110

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111128

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111128

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121128

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131128

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees