[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2006093880A - 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 - Google Patents

画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 Download PDF

Info

Publication number
JP2006093880A
JP2006093880A JP2004273971A JP2004273971A JP2006093880A JP 2006093880 A JP2006093880 A JP 2006093880A JP 2004273971 A JP2004273971 A JP 2004273971A JP 2004273971 A JP2004273971 A JP 2004273971A JP 2006093880 A JP2006093880 A JP 2006093880A
Authority
JP
Japan
Prior art keywords
character
handwritten
encoding
image
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004273971A
Other languages
English (en)
Other versions
JP2006093880A5 (ja
Inventor
Shigeo Fukuoka
茂雄 福岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004273971A priority Critical patent/JP2006093880A/ja
Publication of JP2006093880A publication Critical patent/JP2006093880A/ja
Publication of JP2006093880A5 publication Critical patent/JP2006093880A5/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】 原稿中の文字、手書き画像にかかわらず、そのエッジを明瞭に維持しつつ、且つ、自然画がある場合には自然画の階調性も維持し、圧縮率の高いデータファイルを生成する。
【解決手段】 領域識別部104は、入力した画像データ中の活字で構成される文字領域と、非文字領域とを識別し、それぞれの座標データを生成する。また、手書き領域判定部は、文字線画属性情報を出力する画素判定部109からの情報と非文字領域座標データに基づいて手書き領域を判定する。塗り潰し部106は、文字領域座標データ及び手書き領域座標データで示される領域に内にある文字部分を背景の色で塗り潰し、画像全体に自然画を含む高周波成分のない状態の画像データを生成する。そして、その結果をJPEG符号化部108で符号化する。また、文字領域、手書き領域については、文字のエッジを維持するMMR符号化部112、115で符号化する。
【選択図】 図11

Description

本発明は、画像データを入力し、符号化して出力する技術に関するものである。
近年、スキャナの普及により文書の電子化が進んでいる。A4サイズ1枚の原稿を300dpiの解像度、フルカラーで読取ると、その画像データは実に24Mバイトものデータ量になり、記憶管理するにはメモリを逼迫するし、ネットワークを介して他のデバイスにメール等で転送する場合にはネットワークトラフィックの問題にもなる。よって、画像データに対する圧縮技術は重要である。
例えば、フルカラー画像圧縮としてJPEGが知られている。JPEGは写真などの自然画像を圧縮するには非常に効果も高く、画質も良いことで知られている。かかる圧縮技術を用いると、上記のデータ量の問題は緩和される。
しかしその一方で、JPEGは原稿中の文字部などの高周波部分を持つ画像についてはモスキートノイズと呼ばれる画像劣化が発生し、圧縮率も悪い。
そこで領域分割を行い、写真領域と文字領域が混在する画像から文字成分を抜いた下地部分のJPEG圧縮し、抜いた文字成分は色情報と文字の位置を示す成分としてMMR圧縮する技術が知られている(特許文献1、2)。
特開2002−77633公報 特開2003−309727公報
上記の圧縮方式では、コンピュータで作成され、プリンタにて印刷された印刷物を読取り対象としている。従って、原稿中の文字に手書きで修正等を加えたりすると、手書き部位は非文字として扱われ、JPEG圧縮対象として処理される。JPEGは先に説明したように、自然画に有効な圧縮技術であるものの、文字や線画については画質劣化が発生しやすいものであるから、手書き画像が重畳された文字は、その周辺の文字(言い変えれば手書き画像が重畳されていない文字)と比べると視覚的な画質が見劣りする場合があった。
本発明はかかる課題に鑑みなされたものであり、原稿中の文字、手書き画像、自然画が混在するような画像の符号化をする場合に、文字、手書き画像のエッジを明瞭に維持しつつ、自然画がある場合には自然画の階調性も維持し、圧縮率の高いデータファイルを生成する技術を提供しようとするものである。
この課題を解決するため、例えば本発明の画像処理装置は以下の構成を備える。すなわち、
入力画像中の文字領域を判定し、文字領域座標情報並びに非文字領域座標情報を生成する文字領域判定手段と、
注目画素が文字・線画にあるか否かを示す属性情報を入力し、当該属性情報と、前記非文字領域座標情報に基づいて手書き領域を判定し、手書き領域座標情報を生成する手書き領域判定手段と、
前記文字領域座標情報及び前記手書き領域座標情報に基づき、前記入力画像中の文字及び手書きされた部位を、周辺の色で塗りつぶす塗り潰し手段と、
該塗り潰し手段で塗り潰して得られた画像全体を階調画像用の符号化手段で符号化する第1の符号化手段と、
前記文字及び手書きされた部位を、文字線画用の符号化手段で符号化する第2の符号化手段と、
前記第1、第2の符号化手段で得られたそれぞれの符号化データを1つのデータファイルに含めて出力する出力手段とを備える。
本発明によれば、原稿中の文字、手書き画像にかかわらず、そのエッジが明瞭に維持しつつ、且つ、自然画がある場合には自然画の階調性も維持し、圧縮率の高いデータファイルを生成することが可能になる。
以下添付図面に従って、本発明に係る実施形態を詳細に説明する。
図1は実施形態におけるシステム構成図である。図示において、100は複合機(MFP)であって、ネットワークスキャナ、ネットワークプリンタ、複写機として機能するものである。200は複合機100で読み取られた原稿画像データ等のファイルを記憶するファイルサーバ、301及び302はパーソナルコンピュータ等のクライアントPCであり、400はこれら各装置を接続するためのいネットワークである。
上記構成において、クライアントPCは複合機100をネットワークプリンタとして活用すると共に、ファイルサーバ200にネットワーク上の各クライアントで共有するファイルを格納することになる。
本実施形態における複合機100は、上記のようにネットワークプリンタ、複写機としても機能するものであるが、これらの機能は本発明には直接には関係がないので、以下では、複合機100のスキャナ機能にについて説明することとする。
図2は読取り対象の原稿の一例を示している。図示に示すように、自然画、文字(文章)を含み、尚且つ、文章の一部に手書きで修正がなされた例を示している。文章は黒のみではなく、赤、青等一般的にプリンターで印刷し得る色文字が混在していても構わない。また、図示では、「開発の新しい技術」という文字列が「新規開発技術」と赤色ペンで手書き修正されている様を示している。なお、この場合にはユーザーに元の文字を修正しようとする意図が有るものとして、修正と表現するが、単なる署名(サイン)やマーキングかもしれない。この様に手書き画像が重畳される(書き込まれる)状況であれば、本実施形態で説明する意図から逸脱するものではない。
さて、この原稿を複合機100で読取り(R、G、B各8ビットの256階調とする)、圧縮符号化するわけであるが、文字か否かの判別は、公知の文字認識処理で利用されている手法を採用する。すなわち、文字画像のドットの水平及び垂直方向のドットのヒストグラムを作成し、文字の外接矩形を検出し、その検出された外接矩形の並び方向に文字が並んでいるものを互いに接続し、行間についても所定距離以内であればそれらを文字行として連結して矩形の文字領域として判定する手法である。
この場合、「新規開発技術」を活字並で記入できれば、その文字列は文字として認識されるが、ここでは、ここでは文字として認識されなかったとする(勿論、その一部の文字が文字として判断されても構わない)。また、文章中の「開発の新しい技術」という文字であるが、手書きの線分が記入されたことにより、そのそれらが文字として判断されず、且つ、引き出し線が通った文字についても文字として判断されなかったとする。
さて、上記状態で、文字領域と判断された領域を図3に示すようになる。文字領域は矩形として扱うので、図示のように6個の文字領域が判定される。なお。文字領域を矩形として扱うのは、その矩形領域を対角線上にある左上隅と右下隅の2つの座標で管理するのに都合が良いからであるが、矩形(=4角形)に限らず、それ以上の多角形で管理することを許容しても構わない。
さて、図3に示す文字領域を符号化する際には、一般に文字画像はエッジが明瞭になっていることが望まれる。そこで、実施形態では、文字領域についてはMMR等の可逆符号化を適用して符号化するものとした(JBIG等他の符号化技術を採用しても構わない)。MMRは2値画像の符号化であるので、図3に示した文字領域を濃度(もしくは輝度)の中間値(8ビットであれば128)を使って単純2値化し、それを符号化する。ただし、文字領域内にある個々の文字の色についても考慮する必要がある。そこで、MMR符号化を行う際には、2値化した際に“1”となる画素が、オリジナル画像データでは何色であったかのか示す色情報を別途保持する。色情報はR,G,Bの値で持つようにしても良いが、文字の色数は、自然画ほどの色数を有することはあり得ないので、パレットに割り当てて記憶する。すなわち、2値化して“1”となった位置のオリジナル画像(多値カラー画像)の色の分布を調べ、幾つの色が存在するかを判定し、それぞれにパレット番号を割り当てる。例えば文字の色が黒(R≒G≒B≒0)であればパレット番号「0」を割り当てる。また、文字の色が赤(例えばR≧200以上、G≒B≒0)の場合であればパレット番号「1」を割り当てる等である。隣接する文字は同じパレットになる確率が高いであろうから、パレット番号もランレングス符号化すると、高い圧縮率で色情報を保持した符号化が可能になる。勿論、復号する際には、文字色まで再現するために、パレット番号と実際のRGBの値との関係を示すテーブルを別途用意する。すなわち、2値画像を復号した際に得られる有意画素“1”の画素データを、パレット番号で示される多値画素データに復元する。なお、文字には、その背景色を伴うことも有り得る。この背景色については後述することとする。
次に、文字領域以外の符号化について説明する。ここで、色ペンによる修正(重畳または書き込み)を考慮しないのであれば、文字領域以外の領域とは自然画領域となる。自然画に優れた符号化技術としてはJPEGが知られている。
ここで仮に、文字領域外をJPEG符号化するものとしてしまうと、図2の手書き修正された部分までも含む図4の画像がJPEG符号化対象となってしまう。JPEGは非可逆符号化であり階調画像に優れているものの、文字画像をJPEG符号化してしまうと、そのエッジがボケてしまいうので、例え手書きであっても、その視認性が損なわれるであろう。さらにまた、このような手書きによる修正された活字文字、線分、手書き文字は高周波成分が多く含まれているので、高い圧縮率は得られない。
そこで、本実施形態では、文字領域以外から、図5に示すように、手書きによって文字とは判断されなかった領域(以下、手書き領域という)を抽出し、手書き領域については文字領域ほぼ同様の符号化処理を行うようにした。この手書き領域の符号化は次の通りである。
先ず、非文字領域と判断された領域内に存在する色数は、文字領域の色数と同じか、それより少なくなる傾向が高い。理由は、手書きによる修正対象は、せいぜい数箇所であろうし、修正する際に用いるペンのインク色も実際には1、2種類程度であるからである。そこで、先ず、手書き領域内の画像を減色する。実施形態ではR,G,Bそれぞれ8ビット(256階調)で表わされているので、R、G、Bを2ビットで表現(減色)する。単純には、各成分の最上位の2ビットのみを使うと考えると分かりやすい。
そして、減色後の画像の色分布を調べ、色数を算出する。R、G、Bはそれぞれ2ビットであるから、2+2+2=6ビットで色を表現するわけであるから、最大で26=64色で表わすことになる。これは、手書き修正された文字、使用したペンのインクの色を表わすのに十分な数である。
色分布によって仮にN色が存在すると判定した場合には、C0、C1、…CN-1の各色の2値プレーンを生成し、それぞれについてMMR符号化を行う。そして、各プレーンを色と対応づけるために、パレットを割り当てる。
次に、JPEG符号化について説明する。
実施形態におけるJPEG符号化対象は、図2に示す自然画領域だけでなく、1ページ(1画像)の全体をその符号化対象とする。すなわち、元に入力した画像と同じサイズの画像である。このようにしたのは、文字領域、手書き文字領域内に存在していた文字或いは手書き文字や手書き線分の背景色を考慮するためである。図2に示す原稿(手書き部分を除く)をコンピュータ上で動作するアプリケーションで作成し印刷する際、文字の背景色を設定することは、普通に行われているので、その背景色までも含めることで、原画像に忠実にさせるためである。また、既に説明した文字領域、非文字領域の符号化では、このような背景色は符号化対象ではないとも言える。
ここで問題となるのは、JPEGは文字等の高周波成分が含まれると、圧縮率が低くなる点である。そこで、図7に示す如く、文字領域及び手書き領域中の1つの文字に着目した際、その文字を構成する有意画素(その色は何色でも構わない)500をオリジナル画像から抜き出し、その内部を背景色(501)で塗りつぶすことで、下地色或いは背景色のみの状態にする。この処理を全ての文字領域、手書き領域内の有意画素について行う。この結果を示すのが図6である。図示の如く、自然画領域以外の文字領域、或いは手書き領域は、ほぼ一様な輝度分布にさせてから、ページ全体をJPEG符号化することとした。1ページ中に高周波成分が無くなった状態で符号化するので、自然画領域のみをJPEG符号化した場合と比較し、1ページの符号化データ量が極端に多くなることはない。
以上実施形態における符号化処理について説明したが、まとめると図8のようになる。同図は、実施形態における処理の概念図である。
読み取った画像500には、文字領域501、手書き領域502、及び、自然画領域503が含まれている。
このうち、文字領域501については、その文字領域に含まれる各文字の色を検出してパレットを生成する(処理504)。そして、文字画像領域を2値化し、MMR符号化を行い(処理505)、文字領域符号化データ506を生成する。この文字領域符号化データは、文字領域の座標データ、パレット、MMR符号化データで構成される。
また、手書き領域502については、減色処理を行い、パレットを生成する(処理507)。そして、各パレットで示される2値プレーン毎にMMR符号化を行い(処理508)、手書き領域符号化データ509を生成する。手書き領域符号化データ509は、各手書き領域の座標、パレット、各プレーン毎のMMR符号化データで構成される。
一方、自然画を含む1ページ全体については、文字領域、手書き領域における有意な画素(背景画素ではない画素)について、抜き出し、その内部を近傍の背景色で塗り潰し、文字領域に対応する文字領域の背景のみの画像501’、手書き領域の背景のみの画像502’及び自然画領域503で構成されるページ画像500’を生成する。
そして、このページ画像500’をJPEG符号化を行い、背景&自然画領域符号化データ511を生成する。JPEG符号化データの構造は、通常通りでよいので、説明するまでもないであろう。
こうして、文字領域符号化データ506、手書き領域符号化データ509、及び、背景&自然画領域符号化データ511を内包し、所定のフォーマットにした1つのファイル512を生成し、それをファイルサーバ200に転送することになる。
以上説明した処理を実現するための具体的な構成を図9に示し、以下に処理内容について説明する。
原画像101はイメージスキャナで読み取られた画像データであって、各画素はRGBそれぞれ8ビットで表現されるデータである。画像2値化部102は、原稿画像101から輝度成分のみを抽出し(例えば、RGB→Lab変換して得られたL成分を用いれば良いであろう)、輝度分布にしたがって得られた閾値に基づき2値化し、2値画像データ103を出力する。そして、領域識別部104は、得られた2値画像データ103から、通常の文字認識と同様に、文字外接矩形の分布の検出や外接矩形の結合等を行い文字領域と非文字領域を判定し、文字領域については文字領域座標データ117、非文字領域については非文字領域座標データ105を生成する。
ここで注意すべき点は、領域識別部104が生成する非文字領域座標データ105には、手書き領域、自然画領域の識別はないものの、それらの座標が混在した状態にある点である。
塗りつぶし部106は、文字領域座標データに基づいて、文字領域であると判断され、尚且つ、2値画像データ103の“1”画素(有意画素)を原画像101から抜き出し(除去し)、その抜き出した内部を、2値画像データの近傍の“0”の色で塗りつぶす処理を行う。また、後述する手書き領域座標データ119から、手書き領域と判断され、2値画像データ103の“1”画素(有意画素)となっている原画像の画素を抜き出し、その抜き出した内部を、2値画像データの近傍の“0”の色で塗りつぶす処理を行う。
この結果、塗りつぶし部106から出力されるデータは、ちょうど図6に示すような多値画像データとなる。
文字色抽出部113は、文字領域座標データ117で示される領域内にあって、2次画像データで“1”(有意画素)である画素が、文字を構成する画素と判断し、カラー画像データ中の該当する位置の画素の色情報を抽出することを繰り返す。この結果、文字領域内の全文字の色を検出することになるので、その結果をパレットして出力する。そして、各色毎の2値画像プレーンデータを生成し、それをMMR符号化部115で符号化させる。そして、パレット、MMR符号化データ、並びに、各プレーンとパレットとの関係を示す情報を符号化データ121として出力する。つまり、文字色抽出部113、MMR符号化部115は、図3に示す文字領域を符号化することになる。
また、画素判定部109は入力されるカラー画像データの輝度成分の変化が急峻(隣接する画素の輝度成分の差が所定閾値以上)となっている画素を検出し、その結果を手書き領域判定部110に出力する。この判定結果の信号は、文字線画領域の画素であるか否かの信号でもある。
手書き領域判定部110は、画素判定部109での判定結果に基づき、注目画素が文字/線画か、或いはそれ以外かを判別できる。したがって、2値画像データ103内の“1”の画素で、非文字領域座標データ105に合致する画素データのみを出力すれば、その出力画素データは手書き修正された文字や線分データを構成する画素データとなるので、その座標データを手書き領域の座標データ119として出力する。
減色&パレット生成部111は、上記のようにして手書き領域110からの手書き領域内の画素データを減色(実施形態ではR、G、Bそれぞれ2ビット化している)し、その減色後の色を計数し、その色毎の分布(ヒストグラム)を求める。そして、ヒストグラムの谷位置で区切り、各区切り間の中央位置の色情報について1つのパレット番号を割り当てる。この結果、例えばN個のパレットC0、C1、…CN-1(N<64)を生成する。そして、MMR符号化部112にて、パレットC0の色の画素を2値画像としてMMR符号化する。この処理をパレットC1、…CN-1についても同様に行う。この結果、各MMR符号化データをパレット番号と対応づけ、且つ、パレット番号と減色後の色情報とをパレット&MMR符号化データ120として出力する。
以上の結果、各処理部でデータ117乃至121が生成されるので、これらを所定形式のフォーマットに合成した1つのファイル130にして、出力することになる。
ここで、実施形態における減色&パレット生成部111及びMMR符号化部112の詳細を図10に示し、その処理内容を説明する。
減色部1003には、画素判定部109で判定された文字・線画属性情報1001、原画像データ1002、及び、非文字領域座標データ105が供給される。
減色部1003は、注目画素が文字・線画属性を有し、且つ、非文字領域座標内に存在する場合、入力した原画像中の注目画素位置のR、G、B(各8ビット)を、それぞれ2ビット(計6ビット)に減色し、その減色後のデータをカラー情報計数部1004に出力すると共に、2値化部1008に出力する。
カラー情報計数部1004は、R、G、B各2ビットの計6ビットで示される色をカウントするカウンタが内蔵されている。各カウンタをCT(R(2ビット)、G(2ビット)、B(2ビット))で表わし、減色後の注目画素の色(Rr、Gr、Br)であった場合には、
CT(Rr、Gr、Br)←CT(Rr、Gr、Br)+1
を演算することになる。
この処理を、1ページ分の画像入力が完了するまで行うと、カウンタCT()には、手書きによって文字と認定されなかった活字文字、手書き線分、手書き文字(正確には、文字として認定されなかった手書き文字)を構成する有意な画素の減色後の頻度が格納されることになる。
ソート部1005は、上記のようにして得られたR、G、Bの3次元色空間におけるカウンタ値を頻度の多いものからソートする。そして、パレットテーブル生成部1006は、各色毎に頻度の多い順にパレット番号として“0”、“1、”…を割り当て、パレット番号と色との関係を示すパレットテーブル1007を生成する。なお、実施形態の場合、減色は各RGBについて2ビットとしているので、パレット番号は最大で“63”になるが、頻度数が0の色についてはパレット番号を割り当てない。
2値化部1008は、減色部1003からの減色後の各画素の色情報と、パレットテーブル生成部1006からの情報に基づき2値化する。具体的には、パレット番号“0”の色(R、G、B)として(1、0、0)が設定された場合、減色部1003からの出力データが(1、0、0)の画素のみ、すなわち、パレット“0”に一致する色を有する画素のみを“1”(1ビット)とし、それ以外を“0”として出力する。
この処理を、生成されたパレット番号全てに行うことで、各パレット番号毎の2値画像データ群1009を生成する。
MMR符号化部112は、2値画像データ群1009の各2値画像をMMR符号化を行うことで符号化データ1010を生成することになる。
以上説明したように本実施形態によれば、コンピュータ上で作成され、プリンタで印刷された文書に対し、手書き修正(重畳或いは書き込み)を行い、その修正結果を電子化する場合に、もともとプリンタで印刷された活字文字やそれに匹敵する文字、更には、手書きにより修正されて文字とは認定されなかった部分及び手書き線分や手書き文字については、自然画用の符号化(実施形態ではJPEG)対象とはならず、可逆符号化(実施形態ではMMR)で符号化されるので手書き文字や線分、更には、手書きで文字とは認定されなかった活字文字のエッジが保持されることになり、良好な符号化画像データを得ることが可能になる。また、文字の色も、通常の利用する色をほぼ網羅する色数で再現することも可能になり、100%原画像に忠実な文字色ではなくとも、それに近い色で再現することが可能になる。
<第2の実施形態>
図11は上記第1の実施形態における図9に代わる構成を示している。図11が図9と異なる点は、JPEG符号化部108の直前に、縮小部107を配置した点である。
JPEG符号化する対象は、自然画領域と、文字を抜き出し背景色で塗りつぶした領域を含む情報であり、文字や線分は含まれない。つまり、解像度よりも階調性が優先される画像ということになる。したがって、イメージスキャナの読取り解像度が十分であれば、解像度を下げても、ページ全体の画質に与える影響は少ないと言える。そこで、JPEG符号化部108で符号化する直前に、塗りつぶし後の画像を縮小する縮小部を設けた。この結果、JPEG符号化データ量を格段に減らすことができるようになる。勿論、出力ファイル130のヘッダ(不図示)には、縮小率を示す情報を格納することで、復号処理に対処する必要はある。
<第3の実施形態>
複合機には、既に、原稿読取部内に既に第1の実施形態で説明した画素判定部109に相当する構成が備えている場合がある。その場合には、その判定結果を入力すれば良いので、図12に示す構成で実現出来よう。図12と図9との違いは、画素判定部109が無くなった代わりに、該当する判定結果である属性情報125を入力するようにした点にある。また、本第3の実施形態の構成に、第2の実施形態で示した構成を適用しても構わない。
以上本発明に係る実施形態では、複合機に適用する例を説明したが、イメージスキャナ等の画像入力装置を接続したコンピュータ上で、図8に示す処理とほぼ同等の処理を行うプログラムを実行しても実現できるのは明らかである。また、通常、コンピュータプログラムはCD−ROM等のコンピュータ可読記憶媒体に格納されていて、それをコンピュータにセットしてシステムにコピーもしくはインストールすることで実行可能になるわけであるから、当然、このようなコンピュータ可読記憶媒体も本発明の範疇に含まれる。
実施形態におけるシステム全体構成図である。 実施形態における読取り対象の原稿画像の例を示す図である。 原稿画像中の文字領域を示す図である。 原稿画像中の手書き領域と自然画領域を示す図である。 実施形態における手書き領域を示す図である。 JPEG符号化するページ全体のデータ形式を示す図である。 塗りつぶし部の処理内容を示す図である。 実施形態における画像データの処理の流れを示す図である。 第1の実施形態における画像データの電子化に関するブロック構成図である。 第1の実施形態における減色&パレット生成部、並びにMMR符号化部の詳細構成を示す図である。 第2の実施形態における画像データの電子化に関するブロック構成図である。 第3の実施形態における画像データの電子化に関するブロック構成図である。

Claims (8)

  1. 入力画像中の文字領域を判定し、文字領域座標情報並びに非文字領域座標情報を生成する文字領域判定手段と、
    注目画素が文字・線画にあるか否かを示す属性情報を入力し、当該属性情報と、前記非文字領域座標情報に基づいて手書き領域を判定し、手書き領域座標情報を生成する手書き領域判定手段と、
    前記文字領域座標情報及び前記手書き領域座標情報に基づき、前記入力画像中の文字及び手書きされた部位を、周辺の色で塗りつぶす塗り潰し手段と、
    該塗り潰し手段で塗り潰して得られた画像全体を階調画像用の符号化手段で符号化する第1の符号化手段と、
    前記文字及び手書きされた部位を、文字線画用の符号化手段で符号化する第2の符号化手段と、
    前記第1、第2の符号化手段で得られたそれぞれの符号化データを1つのデータファイルに含めて出力する出力手段と
    を備えることを特徴とする画像処理装置。
  2. 前記第2の符号化手段は、
    各色に対応する2値画像を生成し、当該2値画像の色を示すパレットを生成する手段と、
    生成された2値画像を可逆符号化する可逆符号化手段とを有し、
    生成されたパレットと色との関係を示すテーブルと、前記可逆符号化手段で得られた符号化データとを符号化結果として出力する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記第2の符号化手段は、減色手段を備え、当該減色手段で減色した後の画像データについて符号化することを特徴とする請求項1または2に記載の画像処理装置。
  4. 前記第1の符号化手段は、前記塗り潰し手段で塗り潰して得られた画像全体を所定サイズに縮小する縮小手段を含み、当該縮小手段で縮小した画像を符号化することを特徴とする請求項1に記載の画像処理装置。
  5. 前記属性判定手段は、入力画像の隣接する画素間の輝度差または濃度差が、所定の閾値よりも大きい場合に文字線画である属性情報を出力することを特徴とする請求項1に記載の画像処理装置。
  6. 入力画像中の文字領域を判定し、文字領域座標情報並びに非文字領域座標情報を生成する文字領域判定工程と、
    注目画素が文字・線画にあるか否かを示す属性情報を入力し、当該属性情報と、前記非文字領域座標情報に基づいて手書き領域を判定し、手書き領域座標情報を生成する手書き領域判定工程と、
    前記文字領域座標情報及び前記手書き領域座標情報に基づき、前記入力画像中の文字及び手書きされた部位を、周辺の色で塗りつぶす塗り潰し工程と、
    該塗り潰し工程で塗り潰して得られた画像全体を階調画像用の符号化手段で符号化する第1の符号化工程と、
    前記文字及び手書きされた部位を、文字線画用の符号化手段で符号化する第2の符号化工程と、
    前記第1、第2の符号化手段で得られたそれぞれの符号化データを1つのデータファイルに含めて出力する出力工程と
    を備えることを特徴とする画像処理方法。
  7. コンピュータが読み込み実行するコンピュータプログラムであって、
    入力画像中の文字領域を判定し、文字領域座標情報並びに非文字領域座標情報を生成する文字領域判定手段と、
    注目画素が文字・線画にあるか否かを示す属性情報を入力し、当該属性情報と、前記非文字領域座標情報に基づいて手書き領域を判定し、手書き領域座標情報を生成する手書き領域判定手段と、
    前記文字領域座標情報及び前記手書き領域座標情報に基づき、前記入力画像中の文字及び手書きされた部位を、周辺の色で塗りつぶす塗り潰し手段と、
    該塗り潰し工程で塗り潰して得られた画像全体を階調画像用の符号化手段で符号化する第1の符号化手段と、
    前記文字及び手書きされた部位を、文字線画用の符号化手段で符号化する第2の符号化手段と、
    前記第1、第2の符号化手段で得られたそれぞれの符号化データを1つのデータファイルに含めて出力する出力手段
    として機能することを特徴とするコンピュータプログラム。
  8. 請求項7に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
JP2004273971A 2004-09-21 2004-09-21 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 Pending JP2006093880A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004273971A JP2006093880A (ja) 2004-09-21 2004-09-21 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004273971A JP2006093880A (ja) 2004-09-21 2004-09-21 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Publications (2)

Publication Number Publication Date
JP2006093880A true JP2006093880A (ja) 2006-04-06
JP2006093880A5 JP2006093880A5 (ja) 2009-09-10

Family

ID=36234461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004273971A Pending JP2006093880A (ja) 2004-09-21 2004-09-21 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Country Status (1)

Country Link
JP (1) JP2006093880A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008054002A (ja) * 2006-08-24 2008-03-06 Fuji Xerox Co Ltd 画像処理システム、画像圧縮システム、画像編集システム、画像処理プログラムおよび画像処理装置
JP2010147935A (ja) * 2008-12-19 2010-07-01 Canon Inc 画像処理装置及び画像処理方法
US8582906B2 (en) 2010-03-03 2013-11-12 Aod Technology Marketing, Llc Image data compression and decompression
US9014468B2 (en) 2012-03-30 2015-04-21 Brother Kogyo Kabushiki Kaisha Image processing apparatus, computer-readable storage medium storing computer-readable instructions and associated method
US9300840B2 (en) 2012-12-27 2016-03-29 Brother Kogyo Kabushiki Kaisha Image processing device and computer-readable storage medium storing computer-readable instructions

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008054002A (ja) * 2006-08-24 2008-03-06 Fuji Xerox Co Ltd 画像処理システム、画像圧縮システム、画像編集システム、画像処理プログラムおよび画像処理装置
US8014620B2 (en) 2006-08-24 2011-09-06 Fuji Xerox Co., Ltd. Image processing system, image compression system, image editing system, computer readable medium, computer data signal and image processing apparatus
JP2010147935A (ja) * 2008-12-19 2010-07-01 Canon Inc 画像処理装置及び画像処理方法
US8320668B2 (en) 2008-12-19 2012-11-27 Canon Kabushiki Kaisha Image processing apparatus and image processing method
US8582906B2 (en) 2010-03-03 2013-11-12 Aod Technology Marketing, Llc Image data compression and decompression
US9014468B2 (en) 2012-03-30 2015-04-21 Brother Kogyo Kabushiki Kaisha Image processing apparatus, computer-readable storage medium storing computer-readable instructions and associated method
US9300840B2 (en) 2012-12-27 2016-03-29 Brother Kogyo Kabushiki Kaisha Image processing device and computer-readable storage medium storing computer-readable instructions

Similar Documents

Publication Publication Date Title
AU2008212078B2 (en) Image processing apparatus, image processing method, and image processing program
US8331671B2 (en) Image processing apparatus and image encoding method related to non-photo image regions
US8009908B2 (en) Area testing method for image processing
US7667711B2 (en) Image processing system, a method thereof, and a recording medium thereof
US7421124B2 (en) Image processing system and image processing method
US7542605B2 (en) Image processing apparatus, control method therefor, and program
US20090284801A1 (en) Image processing apparatus and image processing method
US7508547B2 (en) Image processing apparatus, control method therefor, and program
US7133559B2 (en) Image processing device, image processing method, image processing program, and computer readable recording medium on which image processing program is recorded
JP2009225422A (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
US8086040B2 (en) Text representation method and apparatus
AU2009200948A1 (en) Image processing apparatus, image processing method and image processing program
US7283674B2 (en) Using graphic objects in MFD scan-to-export function
US20030202696A1 (en) Activity detector
JP2004362541A (ja) 画像処理装置、プログラム及び記憶媒体
JP2008219928A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2004229261A (ja) 画像圧縮方法、画像圧縮装置及びプログラム並びに記録媒体
JP4442651B2 (ja) 画像処理装置およびプログラム
US10931852B2 (en) Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region
JP2006093880A (ja) 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US20210110586A1 (en) Mixed raster content (mrc) to control color changes
US10602019B2 (en) Methods and systems for enhancing image quality for documents with highlighted content
JP2003219187A (ja) 画像処理方法及び画像処理装置
JP5517028B2 (ja) 画像処理装置
JP2007249774A (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070906

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070906

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090729

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090928

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100205