[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5776419B2 - 画像処理装置、画像処理プラグラム - Google Patents

画像処理装置、画像処理プラグラム Download PDF

Info

Publication number
JP5776419B2
JP5776419B2 JP2011167177A JP2011167177A JP5776419B2 JP 5776419 B2 JP5776419 B2 JP 5776419B2 JP 2011167177 A JP2011167177 A JP 2011167177A JP 2011167177 A JP2011167177 A JP 2011167177A JP 5776419 B2 JP5776419 B2 JP 5776419B2
Authority
JP
Japan
Prior art keywords
image
pixel
determination
pixels
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011167177A
Other languages
English (en)
Other versions
JP2013030090A (ja
Inventor
近藤 真樹
真樹 近藤
良平 小澤
良平 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2011167177A priority Critical patent/JP5776419B2/ja
Priority to EP12178351.8A priority patent/EP2551796B1/en
Priority to US13/562,166 priority patent/US8837836B2/en
Publication of JP2013030090A publication Critical patent/JP2013030090A/ja
Application granted granted Critical
Publication of JP5776419B2 publication Critical patent/JP5776419B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/77Determining position or orientation of objects or cameras using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

本発明は、対象領域の特徴を判定する技術に関する。
画像を表す画像データに基づいて、画像内の対象領域の特徴を判定する技術が知られている。対象領域の特徴を正しく判定できれば、特徴に応じた画像処理を施すことができる等のメリットがある。例えば、画像を複数のブロックに分割し、ブロックごとにコントラストを算出する。そして、各ブロックのコントラストに基づいて、各ブロックを写真、文字等に分類する技術が知られている(例えば、特許文献1)。
特開平5−225378号公報
しかしながら、対象領域が文字であるか否かをより高い精度で判定する技術が求められていた。
本発明の主な利点は、対象領域が文字であるか否かをより高い精度で判定する技術を提供することである。
本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の形態または適用例として実現することが可能である。
[形態]画像を表す画像データを用いて、前記画像内の対象領域を構成する複数の画素を、オブジェクトを構成するオブジェクト画素と、前記オブジェクトを除いた背景を構成する背景画素と、に分類する分類部と、
前記オブジェクト画素の数と前記背景画素の数との比率に応じた第1の特徴値を算出する第1の特徴値算出部と、
画素値の分布範囲の広さに関する第2の特徴値を算出する第2の特徴値算出部と、
第1の基準値より多くの画素が有する階調値の数に関する第3の特徴値を算出する第3の特徴値算出部と、
前記対象領域が、前記第1の特徴値に関する第1の条件を満たすか否かを判定する第1の判定部と、
前記対象領域が、前記第2の特徴値に関する第2の条件を満たすか否かを判定する第2の判定部と、
前記対象領域が、前記第3の特徴値に関する第3の条件を満たすか否かを判定する第3の判定部と、
前記第1の判定部による判定結果と前記第2の判定部による判定結果と前記第3の判定部による判定結果とを用いて、前記対象領域が、文字を表す文字領域であるか否かを特定する属性特定部と、
を備える、画像処理装置。
[適用例1]画像を表す画像データを用いて、前記画像内の対象領域を構成する複数の画素を、オブジェクトを構成するオブジェクト画素と、前記オブジェクトを除いた背景を構成する背景画素と、に分類する分類部と、前記対象領域が、前記オブジェクト画素と前記背景画素との関係に関する第1の条件を満たすか否かを判定する第1の判定部と、前記対象領域が、前記複数の画素の画素値に関する第2の条件を満たすか否かを判定する第2の判定部と、前記第1の判定部による判定結果と前記第2の判定部による判定結果とを用いて、前記対象領域が、文字を表す文字領域であるか否かを特定する属性特定部と、を備える、画像処理装置。
上記構成によれば、対象領域を構成する複数の画素を、オブジェクト画素と背景画素とに分類する。複数の画素の画素値に関する第2の条件を満たすか否かに加えて、オブジェクト画素と背景画素との関係に関する第1の条件を満たすか否かを判定する。そして、これらの判定結果を用いて、対象領域が文字領域であるか否かを精度良く特定できる。
[適用例2]画像を表す画像データを用いて、前記画像内の対象領域と、前記対象領域の周囲に位置する周囲領域と、を特定する領域特定部と、前記周囲領域を構成する画素の画素値を用いて、前記対象領域を構成する複数の画素を、オブジェクトを表すオブジェクト画素と、前記オブジェクトを除いた背景を表す背景画素と、に分類する分類部と、前記オブジェクト画素の数と前記背景画素の数との比率に応じた特徴値を算出する特徴値算出部と、前記対象領域が前記特徴値に関する条件を満たすか否かに基づいて、前記対象領域が文字を表す文字領域であるか否かを特定する属性特定部と、を備える画像処理装置。
上記構成によれば、対象領域を構成する複数の画素を、周囲領域を構成する画素の画素値を用いて、オブジェクト画素と背景画素とに分類し、オブジェクト画素の数と背景画素の数との比率に応じた特徴値に関する条件を満たすか否かを判定する。そして、判定結果を用いて、対象領域が文字領域であるか否かを精度良く特定することができる。
なお、本発明は、種々の形態で実現することが可能であり、例えば、画像処理サーバ、画像処理システム、画像処理方法、これらの機能を実現するためのコンピュータプログラム、そのコンピュータプログラムを記録した記録媒体、等の形態で実現することができる。
実施例における画像処理装置としての複合機200の構成を示すブロック図。 画像処理の処理ステップを示すフローチャート。 対象画像Gおよびエッジ画像Eの一例を示す図。 判定画像BGの一例を示す図。 領域判定処理の処理ステップを示すフローチャート。 輝度分布を表すヒストグラムの一例を示す図。 判定テーブル292の一例を示す図。 属性が「文字」である画像領域の典型例について説明する図。 属性が「描画」である画像領域の典型例について説明する図。 属性が「写真」である画像領域の典型例について説明する図。
A.実施例:
A−1.複合機の構成:
次に、本発明の実施の形態を実施例に基づき説明する。図1は、実施例における画像処理装置としての複合機200の構成を示すブロック図である。
複合機200は、CPU210と、ROMとRAMとを含む内部記憶装置240と、所定の方式(例えば、インクジェット、レーザー)で画像を印刷するプリンタ部250と、光電変換素子(例えば、CCD、CMOS)を用いて原稿を読み取るスキャナ部260と、タッチパネルなどの操作部270と、デジタルカメラ300やパーソナルコンピュータ400やUSBメモリ(図示省略)などの外部装置とデータ通信を行うための通信部280と、ハードディスクドライブやEEPROMなどの外部記憶装置290と、を備えている。
内部記憶装置240には、CPU210が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域241が設けられている。外部記憶装置290は、複合機200を制御するための種々のコンピュータプログラム291と、後述する画像処理において参照される判定テーブル292と、後述する画像処理の対象となる画像データ293を格納している。コンピュータプログラム291は、コンピュータ読み取り可能な記録媒体に記録された形態で提供され得る。ここでいう記録媒体は、CD−ROM、USBストレージなどの着脱可能な記録媒体、ROMやRAMなどの計算機の内部記憶装置、ハードディスクドライブなどの計算機に接続される外部記憶装置を含む。画像データ293は、スキャナ部260を用いて原稿を読み取ることによって生成された画像データを含んでも良く、外部装置から通信部280を介して取得された画像データを含んでも良い。例えば、画像データ293は、デジタルカメラ300によって生成された画像データや、パーソナルコンピュータ400にインストールされた文書作成や画像作成のためのアプリケーションプログラムによって生成された画像データを含んでも良い。
CPU210は、コンピュータプログラム291を実行することにより、後述する画像処理を実行する画像処理部M100として機能する。画像処理部M100は、領域特定部M110と、エッジ強度算出部M120と、領域判定部M130とを備えている。領域判定部M130は、二値化処理部M131と、画素密度算出部M132と、色分布算出部M133と、画素密度判定部M134と、色分布判定部M135と、属性特定部M136とを備えている。これらの各機能部が実行する処理については後述する。
A−2.画像処理:
画像処理部M100は、画像データを用いて、画像データが表す画像の内容を判定する一連の処理を実行する。図2は、画像処理の処理ステップを示すフローチャートである。
ステップS100では、画像処理部M100は、処理対象とする画像データ(対象画像データ)を選択する。例えば、画像処理部M100は、対象画像データを指定する指定指示を操作部270を介してユーザから受け付け、指定指示において指定された対象画像データを、外部記憶装置290に格納された複数の画像データ293の中から選択する。
図3は、対象画像データが表す対象画像G(図3(a))、および、エッジ画像データが表すエッジ画像E(図3(b))の一例を示す図である。この対象画像Gは、背景画像Bg1と、文字を表すオブジェクトである第1の文字オブジェクトOb2および第2の文字オブジェクトOb4と、写真を表すオブジェクトである写真オブジェクトOb3と、描画を表すオブジェクトである描画オブジェクトOb5とを含んでいる。ここで、描画は、イラスト、表、線図、模様などを含む。以下では、対象画像データは、RGB画素データによって構成されたビットマップデータであるものとして説明する。RGB画素データは、レッド(R)、グリーン(G)、ブルー(B)の3つの成分値(各成分値は、例えば、256階調の階調値)を含む画素データである。なお、画素データの成分値を画素値とも呼ぶ。対象画像データが他のデータ形式である場合には、画像処理部M100は、対象画像データを上述したビットマップデータに変換した後に、以下の処理を行う。
ステップS200では、画像処理部M100の領域特定部M110は、対象画像データを用いて、エッジ画像を表すエッジ画像データを作成する。エッジ画像データは、対象画像データを構成する複数のRGB画素データの各成分値に対して、sobelフィルタを適用して得られる。エッジ画像データは、対象画像を構成する複数の画素にそれぞれ対応する複数のRGB画素データによって構成される。このRGB画素データは、対象画像の対応する画素のエッジ強度をR、G、Bの各成分値についてそれぞれ表した画素データである。具体的には、エッジ画像における画素位置(x,y)の画素の所定の成分値S(x、y)は、対象画像における9つの画素の成分値Sに対応するそれぞれの成分値Pを用いて、以下の式(1)によって算出される。

...式(1)
ここで、上記式(1)に示すように、9つの画素は、エッジ画像における画素位置(x,y)に対応する対象画像における画素位置(x,y)を中心とした上下左右の9つの位置の画素である。上記式(1)の第1項および第2項は、9つの位置の画素の画素値に、対応する係数をそれぞれ乗じた値の和の絶対値である。上記式(1)から解るように、エッジ画像の画素データ(画素のエッジ強度)は、対象画像において、互いに近接する第1の画素の成分値(画素値)と、第2の画素の成分値との差を用いて算出される。なお、エッジ画像の作成には、Sobelフィルタに限らず、Prewittフィルタ、Robertsフィルタなど種々のエッジ検出用フィルタが利用できる。
図3(b)には、図3(a)に示す対象画像Gに基づくエッジ画像Eが示されている。なお、図3(b)では、図を見やすくするために、エッジ強度が小さい画素を白で、エッジ強度が大きい画素を黒で示している。エッジ画像Eには、対象画像Gの各オブジェクトOb2〜Ob5のエッジEg2〜Eg5が含まれていることが解る。
ステップS300では、領域特定部M110は、エッジ画像Eに対して複数の単位ブロックB(図3(b))を設定する。単位ブロックBは、エッジ画像Eに対して格子状に配置されたブロックである。1つの単位ブロックBは、例えば、エッジ画像Eの画素を1単位として、その1単位の画素をN行×N列(Nは所定の自然数)に並べた大きさを有する。単位ブロックBは、後述するように、対象画像における領域を特定する際の最小の単位である単位領域である。Nの大きさは、任意の設計値とされるが、例えば、10〜50程度に設定される。エッジ画像Eと対象画像Gと同じサイズ(縦および横の画素数)であるので、単位ブロックBは対象画像Gに対して設定されていると言うこともできる。領域特定部M110は、単位ブロックの設定に対応して、判定画像BGを設定する。
図4は、判定画像BGの一例を示す図である。判定画像BGを構成する各画素(判定画素)BPは、上述した複数の単位ブロックBのそれぞれに対応している。判定画像BGの各画素の画素値は、対応する単位ブロックBに関する各種の情報(例えば、後述する領域識別情報)を表す値が用いられる。判定画像BGが設定された段階では、判定画像BGの全ての画素の画素値が0にされる(初期化される)。
ステップS400では、領域特定部M110は、所定の選択順序に従って、複数の単位ブロックBの中から処理対象の判定ブロックを選択する。ここで、本実施例では、1つの判定ブロックは、2行×2列の4つの単位ブロックから構成される。選択順序の一例を説明する。エッジ画像Eおける左上端の判定ブロックU11が最初に選択される(図3(b))。そして、1つの単位ブロックBだけ右方向にずれた判定ブロックU12、さらに、1つの単位ブロックBだけ右方向にずれた判定ブロックU13が順次に選択される(図3(b))。そして、順次に右方向に1つの単位ブロックBずつずれたグループが選択された結果、エッジ画像Eおける右上端の判定ブロックU1nが選択されると、次に、判定ブロックU11より1つの単位ブロックBだけ下方向にずれた判定ブロックU21が選択される(図3(b))。そして、順次に右方向に1つの単位ブロックBずつずれた判定ブロックが選択される。これを繰り返して右下端の判定ブロックUnn(図3(b))まで順次に選択される。この選択方式では、1つの単位ブロックBが複数の判定ブロックに含まれるので、1つの単位ブロックBは、複数回に亘って選択され得る。例えば、図3(b)においてハッチングで示した上端から2ブロック目で左端から2ブロック目の単位ブロックBは、4回に亘って選択される。
ステップS500では、画像処理部M100のエッジ強度算出部M120は、処理対象の判定ブロックのエッジ強度(領域エッジ強度)を算出する。具体的には、エッジ強度算出部M120は、本実施例では、領域エッジ強度を示す特徴値として、判定ブロック(4つの単位ブロックB)内の全てのエッジ画像Eの画素について、各成分値(R、G、B)の平均値(ERave、EGave、EBave)を算出する。ここで、領域エッジ強度を示す特徴値として、上記各成分値の平均値に代えて、各成分値の中間値や最頻値を用いても良く、少なくとも一つの成分値が所定のしきい値より大きい画素の数などを用いても良い。
ステップS600では、領域特定部M110は、処理対象の判定ブロック(4つの単位ブロックB)が均一ブロックであるか否かを判定する。均一ブロックは、領域エッジ強度が所定基準より小さい領域である。実施例では、領域特定部M110は、処理対象の判定ブロックの上述した領域エッジ強度を示す3つの特徴値(ERave、EGave、EBave)を、それぞれの特徴値について定められた基準値(ETr、ETg、ETb)と比較する。この比較の結果、ERave<ETr、かつ、EGave<ETg、かつ、EBave<ETbが成立する場合には、領域特定部M110は、処理対象の判定ブロック(4つの単位ブロックB)は、均一ブロックであると判定する。逆に、ERave≧ETr、および、EGave≧ETg、および、EBave≧ETbのうちの少なくとも一つが成立する場合には、領域特定部M110は、処理対象の判定ブロック(4つの単位ブロックB)を均一ブロックであるとは判定しない。画像処理部M100は、処理対象の判定ブロックが均一ブロックであると判定した場合には(ステップS600:YES)、ステップS700に処理を移行し、処理対象の判定ブロックが均一ブロックであると判定しない場合には(ステップS600:NO)、ステップ700の処理を省略し、ステップ800に処理を以降する。
ステップS700では、領域特定部M110は、ステップS600における判定結果に基づいて、判定画像BGの画素値を更新する。具体的には、領域特定部M110は、判定画像BGにおいて、均一ブロックであると判定された単位ブロックBに対応する画素の画素値を「1」にする。
ステップS800では、領域特定部M110は、全ての判定ブロックを選択したか否かを判定する。全ての判定ブロックを選択していない場合には(ステップS800:NO)、領域特定部M110は、ステップS400に戻って、新たな処理対象の判定ブロックを選択する。全ての処理対象とすべき判定ブロックを選択した場合には(ステップS800:YES)、領域特定部M110は、ステップS900に処理を移行する。
図4(a)には、ステップS900に移行する段階での判定画像BGの一例を示している。1つの単位ブロックBが、複数の判定ブロックに属するので、領域特定部M110は、1つの単位ブロックBについて複数回の判定(ステップS600)を行い得る。一度でも均一ブロックであると判定された単位ブロックBは、最終的に均一ブロックに分類され、一度も均一ブロックであると判定されない単位ブロックBは、最終的に非均一ブロックに分類される。ステップS900に移行する段階では、判定画像BGの各画素の画素値は、「0」、および、「1」のいずれかの値となっている。画素値「0」は、その画素に対応する単位ブロックBが非均一ブロックに分類されたことを示している。画素値「1」は、その画素に対応する単位ブロックBが均一ブロックに分類されたことを示している
ステップS900では、領域特定部M110は、単位ブロックBを複数のグループに分類して、グループごとに識別子を付すラベリング処理を実行する。具体的には、領域特定部M110は、判定画像BGにおいて、画素値が「0」であり互いに隣接する複数の画素を同じグループとし、画素値が「1」であり互いに隣接する複数の画素を同じグループとする。そして、領域特定部M110は、同じグループに属する画素は同じ画素値を有し、異なるグループに属する画素は異なる画素値を有するように、判定画像BGの画素値を更新する。この結果、判定画像BGにおいて、同じ画素値を有する画素で構成される画像領域が特定される。
図4(b)には、ラベリング処理後の判定画像BGの一例が図示されている。図4(b)の例では、5つの画像領域PG1〜PG5が特定されていることが解る。このように、判定画像BGにおいて特定された画像領域に対応して、単位ブロックBを最小単位とする画像領域が、対象画像Gにおいて特定される。以上の説明から解るように、ラベリング処理後の判定画像BGの画素値は、対象画像Gにおいて特定された画像領域を識別する領域識別子と言うことができる。
図3、図4に示す例では、判定画像BGの画像領域PG1〜PG5(図4(b))にそれぞれ対応する対象画像Gの画像領域として、背景画像Bg1、第1の文字オブジェクトOb2、写真オブジェクトOb3、第2の文字オブジェクトOb4、描画オブジェクトOb5に対応する領域A1〜A5(図3(a))が特定されている。なお、対象画像Gにおいて特定される画像領域は、非均一領域と均一領域とのうちのいずれかである。非均一領域は、非均一ブロックに分類された単位ブロックBに対応する領域である。均一領域は、均一ブロックに分類された単位ブロックBに対応する領域である。図3(a)の例では、背景画像Bg1に対応する画像領域A1は、均一領域であり、各オブジェクトOb2〜Ob5に対応する画像領域A2〜A5は、非均一領域である。上述したように互いに隣接する非均一ブロックは、1つの画像領域(非均一領域)として特定されるために、非均一領域は基本的に均一領域に囲まれている。
以上の説明から解るように、上述したステップS200〜ステップS900までの処理は、対象画像Gにおいて、非均一領域と、非均一領域の周囲に位置する(隣接する)均一領域とを特定する領域特定処理である。
ステップS1000では、画像処理部M100は、対象画像Gにおいて特定された非均一領域(画像領域A2〜A5)の中から1つの非均一領域を、対象領域として選択する。ステップS1100では、画像処理部M100の領域判定部M130は、対象領域として選択された非均一領域の属性を判定する領域判定処理を実行する。
図5は、領域判定処理の処理ステップを示すフローチャートである。ステップS1110では、領域判定部M130は、対象領域である非均一領域の周囲に位置する均一領域(以下、単に周囲領域とも呼ぶ。)を特定する。例えば、対象領域である非均一領域が画像領域A2(図3(a))である場合には、領域判定部M130は、背景画像Bg1に対応する画像領域A1の全体を周囲領域として特定する。これに代えて、領域判定部M130は、画像領域A1のうちの一部の領域、例えば、対象領域である画像領域A2の近傍の一部の領域を周囲領域として特定しても良い。例えば、図4(b)の判定画像BGにおいて符号RG2で示す領域に対応する画像領域、すなわち、背景画像Bg1に対応する画像領域A1のうち、対象領域の周囲を囲む所定幅(例えば、1つの単位ブロックB分の幅)の環状の領域を周囲領域としても良い。
ステップS1120では、領域判定部M130は、対象画像Gにおいて特定した周囲領域の色の平均値(ARave、AGave、ABave)を算出する。すなわち、領域判定部M130は、周囲領域を構成する全画素について、RGB画素データの各成分値(画素値)の平均値を算出する。平均値に代えて、最頻値や、中間値などを採用しても良い。
ステップS1130では、領域判定部M130の二値化処理部M131は、平均値(ARave、AGave、ABave)を用いて、対象領域の二値化を行う。すなわち、二値化処理部M131は、対象領域を構成する各画素を「0」および「1」のいずれかに二値化することによって、対象領域を構成する各画素を、「1」に対応するオブジェクト画素と、「0」に対応する背景画素とに分類する。具体的には、対象領域を構成する画素iのRGB画素データの成分値(Ri、Gi、Bi)が、以下の式(2)〜式(4)を全て満たす場合には、画素iの画素値は「0」とされ、式(2)〜式(4)のいずれかを満たさない場合には、画素iの画素値は「1」にされる。
ARave−Th1<Ri<ARave+Th1 ...(2)
AGave−Th1<Gi<AGave+Th1 ...(3)
ABave−Th1<Bi<ABave+Th1 ...(4)
式(2)〜式(4)から解るように、周囲領域の色の平均値(平均画素値)と、画素iの成分値(画素値)との差の絶対値が、基準値Th1より小さい場合に、画素iは、背景画素に分類される。そして、周囲領域の色の平均値(平均画素値)と、画素iの成分値(画素値)との差の絶対値が、基準値Th1以上である場合に、画素iは、オブジェクト画素に分類される。
ステップS1140では、領域判定部M130の画素密度算出部M132は、オブジェクト画素の画素密度Dを算出する。画素密度Dは、対象領域に占めるオブジェクト画素の割合を示す値である。画素密度Dは、以下の式(5)で表される。
D=No/Na=No/(No+Nb) ...(5)
ここで、Noは、オブジェクト画素の数、Naは、対象領域を構成する全ての画素の数(対象領域の画素の総数)、Nbは、背景画素の数、をそれぞれ表す。画素密度Dは、1/{1+(Nb/No)}と表すことができることから明らかなように、オブジェクト画素の数Noと背景画素の数Nbとの比率に応じた特徴値と言うことができる。
ステップS1150では、領域判定部M130の色分布算出部M133は、対象領域を構成する画素の輝度分布を算出する。本実施例では、色分布算出部M133は、対象領域を構成する画素のうち、オブジェクト画素についての輝度分布を算出する。
図6は、輝度分布を表すヒストグラムの一例を示す図である。図6(a)のヒストグラムは、横軸に輝度値Y(256階調)を取り、各輝度値を有する画素の数を縦軸にプロットして得られる。色分布算出部M133は、図6(a)に示すようなヒストグラムで表される輝度分布データを生成する。すなわち、色分布算出部M133は、全てのオブジェクト画素の輝度値Yを算出し、輝度値Yが取り得る階調(例えば、256階調)ごとに、その輝度値Yを有する画素の数をカウントする。対象領域を構成する画素の輝度値Yは、RGB画素データ(R、G、B)を用いて、例えば、以下の式(6)によって算出される。
輝度値Y=((0.298912×R)+(0.586611×G)+(0.114478×B)) ...(6)
ステップS1160では、色分布算出部M133は、算出した輝度分布(輝度分布データ)を用いて、分布幅Wを算出する。分布幅Wは、本実施例では、基準値Th2よりも多くの画素が有する輝度値Yのうちの最大値と、基準値Th2よりも多くの画素が有する輝度値Yのうちの最小値との差である(図6(a))。分布幅Wは、輝度値の分布の特徴を表す特徴値であって、輝度値の分布範囲の広さを示す特徴値であると言える。
ステップS1170では、色分布算出部M133は、算出した輝度分布を用いて、色数Cを算出する。色数Cは、図6(a)に示すように、本実施例では、基準値Th2より多くの画素が有する輝度値Yの数である。輝度値Yが異なれば、その画素の色が異なるので、異なる輝度値Yの数(輝度値Yの種類の数)は、異なる色の数(色の種類の数)を表している。すなわち、色数Cは、異なる輝度値Yの数を示す特徴値であると言える。
ステップS1180では、領域判定部M130は、上述した画素密度Dと、分布幅Wと、色数Cとに基づいて、対象領域の属性を特定する。例えば、領域判定部M130は、上述した画素密度D、分布幅W、色数Cのそれぞれが、所定の条件を満たすか否かを判定する。具体的には、領域判定部M130の画素密度判定部M134は、対象領域のオブジェクト画素の画素密度Dが、画素密度基準値Dth以上であるか否かを判定する。そして、領域判定部M130の色分布判定部M135は、上述した分布幅Wが、分布幅基準値Wth以上であるか否かを判定する。また、色分布判定部M135は、上述した色数Cが、色数基準値Cth以上であるか否かを判定する。そして、領域判定部M130の属性特定部M136は、画素密度判定部M134による画素密度Dに関する判定結果と、色分布判定部M135による分布幅Wに関する判定結果および色数Cに関する判定結果と、を用いて、対象領域の属性を特定する。
図7は、判定テーブル292の一例を示す図である。属性特定部M136は、対象領域の属性を特定する際に、外部記憶装置290に格納された判定テーブル292(図1)を参照する。図7に示すように、判定テーブル292には、画素密度Dに関する条件の判定結果と、分布幅Wに関する条件の判定結果と、色数Cに関する条件の判定結果との組み合わせに対して、対象領域の属性として特定されるべき特定結果が対応付けられている。判定テーブル292に従って、対象領域の属性を判定すると、領域判定部M130は、領域判定処理を終了する。
図2:ステップS1200では、領域判定部M130は、全ての非均一領域を対象領域として選択したか否かを判断する。選択されていない非均一領域がある場合には(ステップS1200:YES)、領域判定部M130は、ステップS1000に戻る。全ての非均一領域が選択済みである場合には(ステップS1200:No)、画像処理部M100は、画像処理を終了する。この画像処理の後には、例えば、属性が特定された画像領域ごとに、属性に応じた画質調整処理が施される。例えば、「写真」と特定された画像領域には、ホワイトバランス、明るさなどを調整する処理が施され、「文字」と特定された画像領域には、シャープネス、コントラストを強くする処理が施され得る。
ここで、属性が「文字」「描画」「写真」である各画像領域の典型例について説明する。図8は、属性が「文字」である画像領域の典型例について説明する図である。図8(a)は、対象画像Gにおける第2の文字オブジェクトOb4を含む画像領域A4を示している。図8(b)は、画像領域A4を二値化した二値画像BV4を示している。図8(c)は、画像領域A4のオブジェクト画素OPの輝度分布を示すヒストグラムを示している。
画像領域A4には、3色の文字を含んでいる(図8(a))。画像領域A4のヒストグラムは、3色のそれぞれに対応する3種類の輝度値の画素のみが存在することを示している(図8(c))。このように、文字は少ない種類の色で表現される場合が多いために、属性が「文字」である画像は、後述する属性が「写真」である画像と比較して、色数Cが少なくなる傾向がある。また、図8(b)に示す例では、オブジェクト画素OPの領域の面積は、背景画素BPの領域の面積より小さい。このように、文字は、線によって構成されることが多く、塗りつぶされた領域を含むことは少ないために、属性が「文字」である画像は、領域全体の面積に占めるオブジェクトの面積の割合が比較的小さく、後述する属性が「写真」や「描画」である画像と比較して、オブジェクト画素OPの画素密度Dが小さくなる傾向がある。
また、属性が「文字」である画像は、読みやすさの点から、背景画素BPの色と、オブジェクト画素OPの色との輝度の差が大きくされやすい。例えば、背景画素BPの色の輝度が大きい(例えば、白色などの薄い色)場合には、文字のオブジェクト画素OPの色の輝度は小さい(例えば、黒色などの濃い色)ことが多い。逆に、背景画素BPの色の輝度が小さい場合には、文字のオブジェクト画素OPの色の輝度は大きいことが多い。この結果、属性が「文字」である画像の分布幅Wは比較的小さいことが多い(図8(c))。
図9は、属性が「描画」である画像領域の典型例について説明する図である。図9(a)は、対象画像Gにおける描画オブジェクトOb5を含む画像領域A5を示している。図9(b)は、画像領域A5を二値化した二値画像BV5を示している。図9(c)は、画像領域A5のオブジェクト画素OPの輝度分布を示すヒストグラムを示している。
画像領域A5には、4色の文字を含んでいる(図9(a))。画像領域A5のヒストグラムは、4色のそれぞれに対応する4種類の輝度値の画素のみが存在することを示している(図9(c))。このように、属性が「描画」である画像は、後述する属性が「写真」である画像と比較して、色数Cが少なくなる傾向がある。また、図9(b)に示す例では、オブジェクト画素OPの領域の面積は、背景画素BPの領域の面積より大きい。このように、描画は、線だけでなく、塗りつぶされた領域を含むことが多いために、属性が「描画」である画像は、上述した属性が「文字」である画像と比較して、オブジェクト画素OPの画素密度Dが大きくなる傾向がある。
図10は、属性が「写真」である画像領域の典型例について説明する図である。図10(a)は、対象画像Gにおける写真オブジェクトOb3を含む画像領域A3を示している。図10(b)は、画像領域A3を二値化した二値画像BV3を示している。図10(c)は、画像領域A3のオブジェクト画素OPの輝度分布を示すヒストグラムを示している。
画像領域A3は、階調性に富み、多数の色を含んでいる(図10(a))。このために、画像領域A3のヒストグラムは、広い輝度値の範囲に亘る他種類の輝度値の画素が存在することを示すものとなる(図10(c))。このように、属性が「写真」である画像は、上述した属性が「文字」や「描画」である画像と比較して、色数Cが多く、分布幅Wが大きくなる傾向がある。また、図10(b)に示す例では、オブジェクト画素OPの領域の面積は、背景画素BPの領域の面積より大きい。このように、写真の領域は多様な色の画素で埋められることが多いために、属性が「写真」である画像は、上述した属性が「文字」である画像と比較して、オブジェクト画素OPの画素密度Dが大きくなる傾向がある。
判定テーブル292から解るように、対象領域の属性が「文字」であると判定される場合は、以下の2つである。
(1−1)色数C<Cth、かつ、画素密度D<Dth
(1−2)分布幅W<Wth、かつ、色数C≧Cth、かつ、画素密度D<Dth
また、対象領域の属性が「描画」であると判定される場合は、以下の1つである。
(2−1)色数C<Cth、かつ、画素密度D≧Dth
また、対象領域の属性が「写真」であると判定される場合は、以下の2つである。
(3−1)分布幅W≧Wth、かつ、色数C≧Cth
(3−2)分布幅W<Wth、かつ、色数C≧Cth、かつ、画素密度D≧Dth
本実施例では、(1−1)に示す場合に、対象領域の属性を「文字」であると判定するので、上述した色数Cが比較的少なく、画素密度Dが比較的小さいという、典型的な文字の特徴を有する画像領域(図8参照)の属性を、正しく特定することができる。
本実施例では、(2−1)に示す場合に、対象領域の属性を「描画」であると判定するので、上述した色数Cが比較的少なく、画素密度Dが比較的大きいという、典型的な描画の特徴を有する画像領域(図9参照)の属性を、正しく特定することができる。
本実施例では、(3−1)に示す場合に、対象領域の属性を「写真」であると判定するので、上述した分布幅Wが比較的大きく、色数Cが比較的多いという、典型的な写真の特徴を有する画像領域(図10参照)の属性を、正しく特定することができる。
次に、分布幅Wは比較的小さいが、色数Cは比較的多い場合には、色数Cが比較的多い点で「文字」「描画」の典型的な特徴を備えるとは言えず、分布幅Wが比較的小さい点で「写真」の典型的な特徴を備えるとは言えない。このような典型的でない場合について説明する。
分布幅Wが比較的小さく、かつ、色数Cが比較的多く、かつ、画素密度Dが比較的小さい場合には、分布幅Wが比較的小さい点、画素密度Dが比較的小さい点の2点で、「文字」の特徴に合致している。一方、「写真」の特徴に合致している点は、色数Cが比較的多い点だけであり、「描画」の特徴に合致している点は、見られない。本実施例では、上述した(1−2)の場合には、対象領域の属性は、「文字」であると判定するので、典型的ではないものの、特徴の合致点の多さに基づいて、精度良く対象領域の属性を特定することができる。
分布幅Wが比較的小さく、かつ、色数Cが比較的多く、かつ、画素密度Dが比較的大きい場合には、色数Cは比較的多い点、画素密度Dが比較的大きい点の2点で、「写真」の特徴に合致している。「写真」である場合には、例えば、露出アンダーである暗い写真や、露出オーバーである明るい写真のように、輝度の分布幅Wが比較的小さい場合も想定できる。一方、「文字」の特徴に合致している点は、分布幅Wが比較的小さい点だけであり、「描画」の特徴に合致している点は、画素密度Dが比較的大きい点だけである。本実施例では、上述した(3−2)の場合には、対象領域の属性は、「写真」であると判定するので、典型的ではないものの、特徴の合致点の多さなどに基づいて、精度良く対象領域の属性を特定することができる。
以上の説明から解るように、本実施例の画像処理部M100は、分布幅Wおよび色数Cなどのオブジェクト画素の画素値に関する条件を満たすか否かに加えて、オブジェクト画素の画素密度Dに関する条件を満たすか否かを判定する。画像処理部M100は、これらの判定結果を用いて、対象画像の属性を精度良く特定することができる。具体的には、上述したように、色数Cが比較的少ない場合には、色数Cに関する条件だけでは、対象領域の属性が「文字」であるか「描画」であるかを特定することは困難である場合があるが、さらに、画素密度Dに関する条件を判定することによって、精度良く、対象領域の属性が「文字」であるか「描画」であるかを判定することができる。また、分布幅Wが比較的小さく、かつ、色数Cが比較的多い場合には、分布幅Wと色数Cに関する条件だけでは、対象領域の属性を特定することが困難であるが、さらに、画素密度Dに関する条件を判定することによって、精度良く、対象領域の属性が「文字」であるか「写真」であるかを判定することができる。
さらに、画像処理部M100の領域特定部M110は、対象領域としての非均一領域と、対象領域の周囲に位置する周囲領域としての均一領域とを特定する。そして、画像処理部M100の二値化処理部M131は、周囲領域を構成する画素の画素値を用いて、対象領域を構成する複数の画素をオブジェクト画素と背景画素とに分類する。したがって、周囲画像の画素値を用いて、対象領域の複数の画素を、オブジェクト画素と背景画素とに、正しく分類することができる。
より具体的には、領域判定部M130は、周囲画像を構成する複数の画素の平均画素値、すなわち、周囲領域の色の平均値(ARave、AGave、ABave)を算出する。そして、二値化処理部M131は、周囲領域の色の平均値と、対象領域を構成する画素iのRGB画素データの成分値(Ri、Gi、Bi)との差の絶対値が、基準値Th1より小さい場合に、その画素iを背景画素に分類する。そして、二値化処理部M131は、背景画素に分類された画素以外の画素を、オブジェクト画素に分類する。この結果、周囲領域の色(画素値)から背景画素の色(画素値)を予測することができ、その予測に基づいて、対象領域を構成する複数の画素を、背景画素とオブジェクト画素とに分類する。この結果、例えば、背景画素とオブジェクト画素との差が小さい場合であっても、対象領域を構成する複数の画素を、正しく背景画素とオブジェクト画素とに分類することができる。
また、画像処理部M100は、処理対象の単位ブロックBを構成する複数の画素の間の画素値の差をエッジ抽出フィルタによって抽出して、処理対象の単位ブロックBのエッジ強度(ERave、EGave、EBave))を算出している。そして、エッジ強度算出部M120は、エッジ強度(ERave、EGave、EBave)と、基準値(ETr、ETg、ETb)との比較によって、処理対象の単位ブロックBが均一ブロックであるか否かを判定している。この結果、対象領域としての非均一領域と、周囲領域としての均一領域とを、適切に特定することができる。
さらに、複合機200は、画素密度Dに関する条件による判定結果と、色数Cおよび分布幅Wに関する条件による判定結果と、属性の特定結果(「文字」「描画」「写真」のいずれであるか)と、が対応付けられた判定テーブル292を格納する外部記憶装置290を備える。そして、領域判定部M130の属性特定部M136は、判定テーブル292を用いて、容易に対象領域が文字領域であるか否かを特定することができる。
領域判定部M130は、分布幅Wに関する条件と、色数Cに関する条件とを用いて、対象領域の属性を精度良く特定することができる。上述したように、画素密度Dが比較的大きい場合には、画素密度Dに関する条件だけでは、対象領域の属性が「描画」であるか「写真」であるかを特定することは困難である。本実施例の領域判定部M130は、分布幅Wと色数Cの条件を加えて判定することで、正しく対象領域の属性を判定することができる。また、領域判定部M130は、画素密度Dが画素密度基準値Dthより小さいである場合には、基本的には、領域判定部M130は、対象領域の属性が「文字」であると判断している。しかしながら、領域判定部M130は、分布幅Wが分布幅基準値Wth以上であり、かつ、色数Cが色数基準値Cth以上である場合には、画素密度Dの値に拘わらず、対象領域の属性が「写真」であると判断している。このように領域判定部M130は、分布幅Wおよび色数Cに関する条件を用いて、対象領域の属性を精度良く特定することができる。
本実施例における二値化処理部M131は、請求項における分類部の例であり、本実施例における画素密度判定部M134は、請求項における第1の判定部の例であり、本実施例における色分布判定部M135は、請求項における第2の判定部の例である。本実施例における画素密度算出部M132は、請求項における第1の特徴値算出部の例である本実施例における色分布算出部M133は、請求項における第2の特徴値算出部の例である。
B.変形例:
この発明は上記実施例に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能である。
(1)上記実施例では、色分布算出部M133は、図6(a)に示すようなヒストグラムで表される輝度分布データを生成しているが、これに代えて、図6(b)に示すようなヒストグラムで表される輝度分布データを生成しても良い。この例では、輝度値Yが取り得る階調(例えば、256階調)を、所定数、具体的には、例えば、20の輝度クラスに割り当てている。1つの輝度クラスには、12または13階調の連続する輝度値Yが割り当てられる。そして、クラス番号が小さいほど、小さな輝度値Yが割り当てられ、クラス番号が大きいほど、大きな輝度値Yが割り当てられる。例えば、クラス番号が「1」の輝度クラスには、輝度値0〜12、クラス番号が「2」の輝度クラスには、輝度値13〜25、クラス番号が「20」の輝度クラスには、輝度値244〜255がそれぞれ割り当てられる。そして、色分布算出部M133は、輝度クラスごとに、その輝度クラスに属する輝度値Yを有する画素の数をカウントして、輝度分布データを生成する。
この場合には、分布幅Wは、図6(b)に示すように、有効最小クラスから有効最大クラスまでの幅を輝度クラスの数を用いて表した値であっても良い。ここで、有効最大クラスは、基準値Th5よりも多くの画素が属する輝度クラス(有効輝度クラスとも呼ぶ。)のうち、最も大きい輝度値Yが割り当てられている輝度クラスである。有効最小クラスは、基準値Th5よりも多くの画素が属する輝度クラスのうち、最も小さい輝度値Yが割り当てられている輝度クラスである。具体的には、分布幅Wは、有効最大クラスのクラス番号Wmaxと、有効最小クラスのクラス番号Wminを用いて、W=Wmax−Wmin+1と表されても良い。この場合、図6(b)に示す例では、分布幅Wは、19−1+1=19である。また、色数Cは、有効輝度クラスの数で表されても良い。この場合、図6(b)に示す例では、色数Cは、15である。このように、分布幅Wは、輝度値Yの分布の特徴を表す特徴値であって、輝度値の分布範囲の広さと相関を有する特徴値であることが好ましい。また、分布幅Wは、輝度値の分布範囲の広さを評価できる評価値であることが好ましいと言うこともできる。同様に、色数Cは、輝度値Yの分布の特徴を表す特徴値であって、異なる輝度値の数(種類の数)と相関を有する特徴値であることが好ましい。また、色数Cは、異なる輝度値の数を評価できる評価値であることが好ましい。このような場合には、分布幅Wおよび色数Cの取りうる値に応じた適切な分布幅基準値Wthおよび色数基準値Cthを設定することによって、実施例のように、対象画像の属性を適切に特定することができる。
なお、分布幅W、色数Cは、輝度値Yについての特徴値に限られず、画素データの成分値(R、G、B)についての特徴値であっても良いし、HSB色空間などの明度についての特徴値であっても良い。すなわち、画素の画素値または画素値を変換して得られる値に基づいて得られる様々な値についての特徴値が用いられ得る。一般的には、分布幅W、色数Cは、画素の画素値の分布の特徴を表す特徴値であることが好ましい。
(2)なお、上記実施例におけるオブジェクト画素の画素密度Dに代えて、背景画素の画素密度BDを採用しても良い。オブジェクト画素の画素密度Dと背景画素の画素密度BDは、D=1−BDの関係にあるので、画素密度基準値Dthの値および判定条件の不等号を適切に設定すれば、背景画素の画素密度BDを用いて、実施例と実質的に同一の判定を行うことができる。同様に、オブジェクト画素の数を背景画素の数で割った値や背景画素の数をオブジェクト画素の数で割った値を用いても、実施例と実質的に同一の判定を行うことができる。一般的には、オブジェクト画素の数と背景画素の数との比率に応じた特徴値を採用することが好ましい。
さらには、属性を特定するための判定条件には、画素密度Dに関する条件のような、オブジェクト画素の数と背景画素の数との比率に関する条件に限らず、オブジェクト画素と背景画素との関係に関する様々な条件が用いられ得る。例えば、対象領域におけるオブジェクト画素と背景画素との位置関係、例えば、オブジェクト画素と背景画素とが、ある方向に沿って交互に存在しているか否かなどが採用され得る。
(3)領域判定部M130は、色数Cおよび分布幅Wを用いることなく、画素密度Dのみを用いて、対象画像の属性が「文字」であるか否かを特定しても良い。上述したように、画素密度Dが比較的小さい場合には、対象画像の属性が「文字」である可能性が高いので、画素密度Dを用いて、精度よく対象画像の属性が「文字」であるか否かを特定することができる。
(4)上記実施例では、周囲領域の色の平均値を用いて、対象領域を構成する画素の分類(二値化)することにより分類精度を向上させているが、周囲領域を用いることなく、かかる分類を行っても良い。この場合には、周囲領域を特定することなく、低い計算負荷で対象領域を構成する画素の分類を行うことができる。また、周囲領域が存在しない場合、例えば、画像全体を対象領域として対象領域の属性を特定する場合であっても、対象領域の属性を特定することができる。
(5)上記実施例では、対象画像を構成する画素を、オブジェクト画素と背景画素とに分類しているが、ここで、オブジェクト画素は、対象画像において属性の判定対象となるべきオブジェクトを構成する画素であり、背景画素はそれ以外の画素である。例えば、青色のオブジェクトのみを属性の判定対象とする場合には、対象画像を構成する画素を、青色のオブジェクトを構成する画素を、オブジェクト画素として分類し、それ以外の画素、例えば、他の色のオブジェクトを構成する画素、背景を構成する画素、ノイズ成分などを背景画素に分類しても良い。
(6)上記実施例では、領域判定部M130は、周囲領域として均一領域を特定しているが、均一領域に限らず、例えば、均一、非均一に拘わらず、対象領域の外縁に沿って存在している任意の大きさの領域を周囲領域として特定しても良い。また、領域特定部M110は、対象領域の特定(非均一領域の特定)や、均一領域であるか非均一領域であるかの判定を、領域のエッジ強度を用いて行っているが、これに限られない。例えば、対象領域の特定、周囲領域の特定は、例えば、ユーザからの領域指定指示を、操作部270を介して受け付けることによって行われても良い。また、均一領域であるか非均一否かの判定も、同様に、ユーザが黙視によって判定した判定結果を、操作部270を介して受け付けることによって行われても良い。
(7)判定テーブル292はテーブル形式に限定されず、領域判定部M130が参照することのできる判定情報であれば良い。また、判定テーブル292のような判定情報を外部記憶装置290に格納することに代えて、例えば、判定情報を外部のサーバ等にアクセスして取得することとしても良い。
(8)画像処理部M100の機能を実現する装置は、複合機200に限らず、様々な装置、例えば、プリンタ、デジタルカメラ、スキャナなどの画像関連機器の内部のコンピュータ、あるいは、汎用のパーソナルコンピュータ、サーバなどの計算機であっても良い。また、1つの筐体の装置に限らず、複数の筐体内にそれぞれ配置された複数の計算機を含む計算機システム(例えば、いわゆるクラウドコンピューティングを実現する分散型の計算機システム)によって、画像処理部M100の機能が実現されても良い。この場合には、画像処理部M100の機能を実現する計算機システムの全体が、請求項における画像処理装置に対応する。
(9)上記実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。
200...複合機、210...CPU、240...内部記憶装置、250...プリンタ部、260...スキャナ部、270...操作部、280...通信部、290...外部記憶装置、291...コンピュータプログラム、292...判定テーブル、M100...画像処理部、M110...領域特定部、M120...エッジ強度算出部、M130...領域判定部、M131...二値化処理部、M132...画素密度算出部、M133...色分布算出部、M134...画素密度判定部、M135...色分布判定部、M136...属性特定部画像領域

Claims (9)

  1. 画像を表す画像データを用いて、前記画像内の対象領域を構成する複数の画素を、オブジェクトを構成するオブジェクト画素と、前記オブジェクトを除いた背景を構成する背景画素と、に分類する分類部と、
    前記オブジェクト画素の数と前記背景画素の数との比率に応じた第1の特徴値を算出する第1の特徴値算出部と、
    画素値の分布範囲の広さに関する第2の特徴値を算出する第2の特徴値算出部と、
    第1の基準値より多くの画素が有する階調値の数に関する第3の特徴値を算出する第3の特徴値算出部と、
    前記対象領域が、前記第1の特徴値に関する第1の条件を満たすか否かを判定する第1の判定部と、
    前記対象領域が、前記第2の特徴値に関する第2の条件を満たすか否かを判定する第2の判定部と、
    前記対象領域が、前記第3の特徴値に関する第3の条件を満たすか否かを判定する第3の判定部と、
    前記第1の判定部による判定結果と前記第2の判定部による判定結果と前記第3の判定部による判定結果とを用いて、前記対象領域が、文字を表す文字領域であるか否かを特定する属性特定部と、
    を備える、画像処理装置。
  2. 請求項1に記載の画像処理装置であって、
    前記属性判定部は、前記第1の特徴値が第2の基準値未満であり、かつ、前記第2の特徴値が第3の基準値未満であり、かつ、前記第3の特徴値が第4の基準値以上である場合、および、前記第1の特徴値が前記第2の基準値未満であり、かつ、前記第3の特徴値が前記第4の基準値未満である場合に、前記対象領域が、前記文字領域であると特定する、画像処理装置。
  3. 請求項1または請求項2に記載の画像処理装置であって、
    前記属性特定部は、前記第1の判定部による判定結果と前記第2の判定部による判定結果と前記第3の判定部による判定結果とを用いて、前記対象領域が、写真を表す写真領域であるか否かを特定する、画像処理装置。
  4. 請求項1ないし請求項3のいずれかに記載の画像処理装置であって、
    前記属性特定部は、前記第1の判定部による判定結果と前記第2の判定部による判定結果と前記第3の判定部による判定結果とを用いて、前記対象領域が、描画を表す描画領域であるか否かを特定する、画像処理装置。
  5. 請求項1ないし請求項のいずれかに記載の画像処理装置であって、さらに、
    前記画像データを用いて、前記画像において、前記対象領域と前記対象領域の周囲に位置する周囲領域とを特定する領域特定部を備え、
    前記分類部は、前記周囲領域を構成する画素の画素値を用いて、前記対象領域を構成する複数の画素を、前記オブジェクト画素と前記背景画素とに分類する、画像処理装置。
  6. 請求項に記載の画像処理装置であって、さらに、
    前記画像内の領域を構成する第1の画素の画素値と第2の画素の画素値との差を用いて、前記画像内の領域のエッジ強度を算出するエッジ強度算出部を備え、
    前記領域特定部は、前記エッジ強度が第1の基準値以上である領域を、前記対象領域として特定し、前記エッジ強度が前記第1の基準値より小さいである領域を、前記周囲領域として特定する、画像処理装置。
  7. 請求項または請求項に記載の画像処理装置であって、
    前記分類部は、前記対象領域を構成する画素のうち、前記周囲領域を構成する複数の画素の平均画素値との差が第2の基準値より小さい画素値を有する画素を前記背景画素として分類し、前記対象領域を構成する画素のうち、前記背景画素を除いた画素を前記オブジェクト画素として分類する、画像処理装置。
  8. 請求項1ないし請求項のいずれかに記載の画像処理装置であって、さらに、
    前記第1の条件による判定結果と、前記第2の条件による判定結果と、前記文字領域であるか否かを含む特定結果と、が対応付けられた判定情報を格納する判定情報格納部を備え、
    前記属性特定部は、前記判定情報を用いて、前記対象領域が前記文字領域であるか否かを特定する、画像処理装置。
  9. 画像を表す画像データを用いて、前記画像内の対象領域を構成する複数の画素を、オブジェクトを構成するオブジェクト画素と、前記オブジェクトを除いた背景を構成する背景画素と、に分類する分類機能と、
    前記オブジェクト画素の数と前記背景画素の数との比率に応じた第1の特徴値を算出する第1の特徴値算出機能と、
    画素値の分布範囲の広さに関する第2の特徴値を算出する第2の特徴値算出機能と、
    第1の基準値より多くの画素が有する階調値の数に関する第3の特徴値を算出する第3の特徴値算出機能と、
    前記対象領域が、前記第1の特徴値に関する第1の条件を満たすか否かを判定する第1の判定機能と、
    前記対象領域が、前記第2の特徴値に関する第2の条件を満たすか否かを判定する第2の判定機能と、
    前記対象領域が、前記第3の特徴値に関する第3の条件を満たすか否かを判定する第3の判定機能と、
    前記第1の判定部による判定結果と前記第2の判定部による判定結果と前記第3の判定部による判定結果とを用いて、前記対象領域が、文字を表す文字領域であるか否かを特定する属性特定機能と、
    をコンピュータに実現させる、画像処理プログラム。
JP2011167177A 2011-07-29 2011-07-29 画像処理装置、画像処理プラグラム Active JP5776419B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011167177A JP5776419B2 (ja) 2011-07-29 2011-07-29 画像処理装置、画像処理プラグラム
EP12178351.8A EP2551796B1 (en) 2011-07-29 2012-07-27 Image processing device identifying attribute of region included in image
US13/562,166 US8837836B2 (en) 2011-07-29 2012-07-30 Image processing device identifying attribute of region included in image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011167177A JP5776419B2 (ja) 2011-07-29 2011-07-29 画像処理装置、画像処理プラグラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2015135873A Division JP6024795B2 (ja) 2015-07-07 2015-07-07 画像処理装置、画像処理プラグラム

Publications (2)

Publication Number Publication Date
JP2013030090A JP2013030090A (ja) 2013-02-07
JP5776419B2 true JP5776419B2 (ja) 2015-09-09

Family

ID=46690391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011167177A Active JP5776419B2 (ja) 2011-07-29 2011-07-29 画像処理装置、画像処理プラグラム

Country Status (3)

Country Link
US (1) US8837836B2 (ja)
EP (1) EP2551796B1 (ja)
JP (1) JP5776419B2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5842441B2 (ja) 2011-07-29 2016-01-13 ブラザー工業株式会社 画像処理装置およびプログラム
JP5776419B2 (ja) * 2011-07-29 2015-09-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5853470B2 (ja) 2011-07-29 2016-02-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5796392B2 (ja) 2011-07-29 2015-10-21 ブラザー工業株式会社 画像処理装置、および、コンピュータプラグラム
JP5958023B2 (ja) * 2012-03-30 2016-07-27 ブラザー工業株式会社 画像処理装置および画像処理プログラム
JP5935454B2 (ja) 2012-03-30 2016-06-15 ブラザー工業株式会社 画像処理装置および画像処理プログラム
JP6184115B2 (ja) * 2013-02-01 2017-08-23 キヤノン株式会社 画像処理方法及び画像処理装置
US9779513B2 (en) 2013-03-13 2017-10-03 Rakuten, Inc. Image processing device, image processing method, and image processing program
JP6098298B2 (ja) * 2013-03-29 2017-03-22 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
CN104298982B (zh) * 2013-07-16 2019-03-08 深圳市腾讯计算机系统有限公司 一种文字识别方法及装置
US9995905B2 (en) * 2013-11-07 2018-06-12 Samsung Electronics Co., Ltd. Method for creating a camera capture effect from user space in a camera capture system
JP6658078B2 (ja) 2016-02-25 2020-03-04 ブラザー工業株式会社 画像処理装置、コンピュータプログラム、および、システム
JP6769045B2 (ja) 2016-02-29 2020-10-14 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
JP6747103B2 (ja) 2016-06-30 2020-08-26 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
JP7193773B2 (ja) 2018-03-30 2022-12-21 ブラザー工業株式会社 制御装置、および、コンピュータプログラム
JP7063063B2 (ja) * 2018-03-30 2022-05-09 ブラザー工業株式会社 情報処理装置のためのプログラムおよび情報処理装置
JP6978728B2 (ja) 2018-03-30 2021-12-08 ブラザー工業株式会社 制御装置、および、コンピュータプログラム
CN110163050B (zh) * 2018-07-23 2022-09-27 腾讯科技(深圳)有限公司 一种视频处理方法及装置、终端设备、服务器及存储介质
GB2577989B (en) * 2018-09-30 2021-03-24 Lenovo Beijing Co Ltd Information processing method and electronic device
JP7185186B2 (ja) 2019-02-01 2022-12-07 ブラザー工業株式会社 画像処理装置、機械学習モデルをトレーニングする方法、および、コンピュータプログラム
US11448503B2 (en) * 2019-06-12 2022-09-20 Microsoft Technology Licensing, Llc Correction for pixel-to-pixel signal diffusion

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0656618B2 (ja) 1986-05-20 1994-07-27 国際電信電話株式会社 画像情報の文字・図形分離方法
JPH03290774A (ja) * 1990-04-06 1991-12-20 Fuji Facom Corp 文書画像の文章領域抽出装置
JPH04106670A (ja) * 1990-08-27 1992-04-08 Seiko Epson Corp 文書画像処理装置
IL98293A (en) 1991-05-28 1994-04-12 Scitex Corp Ltd A method for distinguishing between text and graphics
JPH05225378A (ja) 1991-06-03 1993-09-03 Fujitsu Ltd 文書画像の領域分割システム
JP3058489B2 (ja) 1991-09-20 2000-07-04 シャープ株式会社 文字列抽出方法
JPH06208625A (ja) 1993-01-11 1994-07-26 Canon Inc 画像処理方法及び装置
EP0587450B1 (en) 1992-09-11 2004-11-17 Canon Kabushiki Kaisha Image processing method and apparatus
JP2871601B2 (ja) 1995-08-15 1999-03-17 日本電気株式会社 文字列検出装置及び方法
DE69938486T2 (de) 1998-11-06 2009-04-09 Canon K.K. Bildverarbeitungsverfahren, -system und -gerät, und Speichermedium
DE69937871T2 (de) 1998-12-02 2008-12-24 Xerox Corp. Verfahren und Vorrichtung zur Bildsegmentierung
US6643400B1 (en) 1999-03-31 2003-11-04 Minolta Co., Ltd. Image processing apparatus and method for recognizing specific pattern and recording medium having image processing program recorded thereon
JP3918381B2 (ja) 1999-10-25 2007-05-23 富士ゼロックス株式会社 画像処理装置および画像処理方法
JP2001297303A (ja) * 2000-02-09 2001-10-26 Ricoh Co Ltd 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP2002176564A (ja) 2000-12-07 2002-06-21 Canon Inc 画像読取装置及びその制御方法
JP2004038456A (ja) * 2002-07-02 2004-02-05 Minolta Co Ltd 画像処理装置、画像処理プログラムおよびディジタルカメラ
KR20040069865A (ko) * 2003-01-30 2004-08-06 삼성전자주식회사 영상화면 내의 글자영역 확장장치 및 방법
JP4383157B2 (ja) 2003-05-15 2009-12-16 株式会社リコー 画像処理装置、プログラム及び記憶媒体
US8520093B2 (en) * 2003-08-05 2013-08-27 DigitalOptics Corporation Europe Limited Face tracker and partial face tracker for red-eye filter method and apparatus
DE10352341A1 (de) 2003-11-06 2005-11-03 Mediacare Gmbh & Co. Kg Verfahren zur Veränderung der Abmessungen eines elektronisch gespeicherten Bildes
EP1555804A3 (en) * 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium
US7343046B2 (en) 2004-02-12 2008-03-11 Xerox Corporation Systems and methods for organizing image data into regions
JP4617730B2 (ja) 2004-06-15 2011-01-26 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
JP2006085665A (ja) 2004-08-18 2006-03-30 Ricoh Co Ltd 画像処理装置、画像処理プログラム、記憶媒体、画像処理方法および画像形成装置
KR100643759B1 (ko) * 2004-12-01 2006-11-10 삼성전자주식회사 문서 압축 장치 및 그 방법
JP4641414B2 (ja) * 2004-12-07 2011-03-02 キヤノン株式会社 文書画像検索装置、文書画像検索方法、プログラム、記憶媒体
ATE501487T1 (de) * 2004-12-21 2011-03-15 Canon Kk Segmentierung eines digitalen bildes und herstellung einer kompakten repräsentation
JP4137890B2 (ja) 2005-01-21 2008-08-20 シャープ株式会社 画像処理装置、画像形成装置、画像読取処理装置、画像処理方法、画像処理プログラムおよびコンピュータ読み取り可能な記録媒体
JP2006251902A (ja) * 2005-03-08 2006-09-21 Fuji Xerox Co Ltd 翻訳文書画像生成装置、翻訳文書画像生成プログラム及び翻訳文書画像生成方法
JP4579759B2 (ja) * 2005-04-22 2010-11-10 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US20070236707A1 (en) 2006-04-06 2007-10-11 Kabushiki Kaisha Toshiba Image processing apparatus, image processing method and image processing program
JP2007310775A (ja) 2006-05-22 2007-11-29 Murata Mach Ltd 画像処理装置及び画像処理方法
JP4829835B2 (ja) 2006-06-12 2011-12-07 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータ読み取り可能な記憶媒体
JP4135752B2 (ja) 2006-06-12 2008-08-20 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
CN101123682B (zh) 2006-08-11 2011-06-22 松下电器产业株式会社 可减少图像振铃噪声的方法、装置及集成电路
US7865032B2 (en) 2006-09-22 2011-01-04 Hewlett-Packard Development Company, L.P. Methods and systems for identifying an ill-exposed image
JP4240107B2 (ja) 2006-10-27 2009-03-18 コニカミノルタビジネステクノロジーズ株式会社 領域判定方法、領域判定装置、画像処理装置、およびコンピュータプログラム
JP4821663B2 (ja) * 2007-03-12 2011-11-24 日本電気株式会社 文字ノイズ除去装置、文字ノイズ除去方法、文字ノイズ除去プログラム
JP2008282095A (ja) 2007-05-08 2008-11-20 Canon Inc OCR(OpticalCharacterRecognize)ソフトウエア
JP5165443B2 (ja) * 2007-06-14 2013-03-21 株式会社フジクラ 石英系マルチコア光ファイバ
CN101436248B (zh) 2007-11-14 2012-10-24 佳能株式会社 用于根据图像生成文本字符串的方法和设备
US8532374B2 (en) * 2007-12-05 2013-09-10 Canon Kabushiki Kaisha Colour document layout analysis with multi-level decomposition
JP5028337B2 (ja) * 2008-05-30 2012-09-19 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、及び記憶媒体
US8320674B2 (en) * 2008-09-03 2012-11-27 Sony Corporation Text localization for image and video OCR
JP5046243B2 (ja) * 2008-09-17 2012-10-10 株式会社リコー 画像処理装置、画像処理方法、およびプログラム
US8285035B2 (en) 2008-12-05 2012-10-09 Xerox Corporation 3+1 layer mixed raster content (MRC) images having a text layer and processing thereof
US8351691B2 (en) * 2008-12-18 2013-01-08 Canon Kabushiki Kaisha Object extraction in colour compound documents
JP5233739B2 (ja) * 2009-02-25 2013-07-10 富士ゼロックス株式会社 画像処理装置、画像読取装置及び画像形成装置
KR101566196B1 (ko) * 2009-03-02 2015-11-05 삼성전자주식회사 히스토그램 분석을 이용한 영상 분류 방법 및 장치, 이를 이용한 문자 인식 방법 및 장치
JP5312166B2 (ja) * 2009-04-13 2013-10-09 キヤノン株式会社 画像処理装置及び制御方法及びプログラム
JP2010252194A (ja) 2009-04-17 2010-11-04 Canon Inc 画像処理装置及び画像処理方法
US8254694B2 (en) 2009-06-08 2012-08-28 Xerox Corporation Thin line detection in scanned image data
US7844118B1 (en) 2009-07-01 2010-11-30 Xerox Corporation Image segmentation system and method with improved thin line detection
US8335379B2 (en) * 2009-12-28 2012-12-18 Xerox Corporation System and method for cleanup of MRC images for improved compression and image quality
JP5500996B2 (ja) * 2010-01-06 2014-05-21 キヤノン株式会社 画像処理装置及び画像処理方法
JP5526874B2 (ja) 2010-03-09 2014-06-18 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5733907B2 (ja) * 2010-04-07 2015-06-10 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5220828B2 (ja) * 2010-11-11 2013-06-26 シャープ株式会社 画像処理装置、画像形成装置、画像読取装置、画像処理方法、プログラム及び記録媒体
JP5796392B2 (ja) 2011-07-29 2015-10-21 ブラザー工業株式会社 画像処理装置、および、コンピュータプラグラム
JP5853470B2 (ja) 2011-07-29 2016-02-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5842441B2 (ja) 2011-07-29 2016-01-13 ブラザー工業株式会社 画像処理装置およびプログラム
JP5776419B2 (ja) * 2011-07-29 2015-09-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP6157138B2 (ja) * 2012-03-30 2017-07-05 キヤノン株式会社 画像処理装置

Also Published As

Publication number Publication date
EP2551796B1 (en) 2023-10-18
US8837836B2 (en) 2014-09-16
JP2013030090A (ja) 2013-02-07
EP2551796A3 (en) 2017-12-13
US20130028520A1 (en) 2013-01-31
EP2551796A2 (en) 2013-01-30

Similar Documents

Publication Publication Date Title
JP5776419B2 (ja) 画像処理装置、画像処理プラグラム
JP5958023B2 (ja) 画像処理装置および画像処理プログラム
JP5935454B2 (ja) 画像処理装置および画像処理プログラム
US9088754B2 (en) Image processing device determining characteristic quantity relating to number of colors
JP5853470B2 (ja) 画像処理装置、画像処理プラグラム
EP2750365B1 (en) Image processing device and computer program
US8929663B2 (en) Image processing device identifying region in image as one of uniform region and nonuniform region
US9106876B2 (en) Image processing device setting color conversion method to method adequate for image to be converted
JP5796392B2 (ja) 画像処理装置、および、コンピュータプラグラム
US9253368B2 (en) Image processing device setting binary value without using dither matrix when prescribed condition is satisfied
US9235773B2 (en) Image processing device capable of determining types of images accurately
JP6024795B2 (ja) 画像処理装置、画像処理プラグラム
JP6031921B2 (ja) 画像処理装置およびプログラム
US20080310715A1 (en) Applying a segmentation engine to different mappings of a digital image
US9781308B2 (en) Non-transitory computer-readable medium
JP2009301090A (ja) 画像処理装置および画像処理プログラム
JP5884605B2 (ja) 画像処理装置およびプログラム
JP5949399B2 (ja) 画像処理装置およびプログラム
JP5069599B2 (ja) 映像変換装置、映像変換方法および映像変換プログラム
JP2000099701A (ja) 画像色処理装置、画像色処理方法および記録媒体
JP6372409B2 (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
JP5846011B2 (ja) 画像処理装置およびプログラム
JP2022032548A (ja) 情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140523

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150622

R150 Certificate of patent or registration of utility model

Ref document number: 5776419

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150