[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2002077633A - Apparatus and method of image processing - Google Patents

Apparatus and method of image processing

Info

Publication number
JP2002077633A
JP2002077633A JP2000256131A JP2000256131A JP2002077633A JP 2002077633 A JP2002077633 A JP 2002077633A JP 2000256131 A JP2000256131 A JP 2000256131A JP 2000256131 A JP2000256131 A JP 2000256131A JP 2002077633 A JP2002077633 A JP 2002077633A
Authority
JP
Japan
Prior art keywords
image data
character
data
valued image
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000256131A
Other languages
Japanese (ja)
Other versions
JP4366003B2 (en
Inventor
Yukari Toda
ゆかり 戸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000256131A priority Critical patent/JP4366003B2/en
Priority to US09/931,890 priority patent/US7133565B2/en
Publication of JP2002077633A publication Critical patent/JP2002077633A/en
Application granted granted Critical
Publication of JP4366003B2 publication Critical patent/JP4366003B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an apparatus of image processing, a method of image processing capable of compressing images with efficiency along with keeping image quality, and its recording medium. SOLUTION: The apparatus comprises a character region detecting means 101 to produce character region coordinates 109 as positional data in the character region with extraction of the character region from multivalued image data, a binarizing part 102 to produce binary image data 108 by binarizing the multivalued image data in the character region, a color calculating part 103 to produce color data 110 of characters by calculating a typical color in the character region, a paint-out part 104 for character part to produce character-less multivalued image data A by converting the multivalued image data by using the multivalued image data in a region other than the character region, a reduction part 105 to produce a reduced character-less multivalued image data by reducing the resolution of the data A, a JPEG compression part 106 to perform JPEG compression for the reduced character-less multivalued image data and an MMR compression part to perform an MMR compression for binary image data in the character region.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は画像処理装置、及び
方法、並びにこの方法を実現する記憶媒体に関するもの
である。
[0001] 1. Field of the Invention [0002] The present invention relates to an image processing apparatus and method, and a storage medium for implementing the method.

【0002】[0002]

【従来の技術】近年、スキャナの普及により文書の電子
化が進んでいる。電子化された文書をフルカラービット
マップ形式で記憶しようとすると、例えば。A4サイズ
の場合では300dpiで約24Mバイトにもなり、必
要なメモリが膨大になる。このような大容量のデータ
は、メイルに添付して送信するのに適したサイズとはい
えない。そこで、フルカラー画像を圧縮することが通常
行われており、その圧縮方式としてJPEGが知られて
いる。JPEGは写真などの自然画像を圧縮するには非
常に効果も高く、画質も良い。しかし一方で、文字部な
どの高周波部分をJPEG圧縮すると、モスキートノイ
ズと呼ばれる画像劣化が発生し、圧縮率も悪い。そこ
で、領域分割を行い、文字領域を抜いた下地部分のJP
EG圧縮と、色情報付き文字領域部分のMMR圧縮を作
成し、解凍時は白部分はJPEG画像を透過し、黒部分
は代表文字色を載せて表現する方法があった。
2. Description of the Related Art In recent years, digitalization of documents has been advanced due to the spread of scanners. If you try to store a digitized document in full color bitmap format, for example. In the case of A4 size, it becomes about 24 Mbytes at 300 dpi, and the required memory becomes enormous. Such a large amount of data cannot be said to be a size suitable for being attached to a mail and transmitted. Therefore, full-color images are usually compressed, and JPEG is known as a compression method. JPEG is very effective for compressing natural images such as photographs, and has good image quality. On the other hand, when high-frequency portions such as character portions are JPEG-compressed, image degradation called mosquito noise occurs and the compression ratio is poor. Therefore, the area division is performed, and the JP of the background portion excluding the character area is performed.
There has been a method in which EG compression and MMR compression of a character area portion with color information are created, and at the time of decompression, a white portion is transmitted through a JPEG image and a black portion is represented with a representative character color.

【0003】[0003]

【発明が解決しようとする課題】しかし、上記方法で画
質を保ちながら実現できる圧縮率は十分とはいえなかっ
た。
However, the compression ratio that can be realized while maintaining the image quality by the above method is not sufficient.

【0004】本発明は上記従来技術の課題を解決するた
めに成されたものであり、画質を保ちながら効率良く画
像を圧縮する画像処理装置、画像処理方法並びにその記
憶媒体を提供することを目的とする。
[0004] The present invention has been made to solve the above-mentioned problems of the prior art, and has as its object to provide an image processing apparatus, an image processing method, and a storage medium for efficiently compressing an image while maintaining image quality. And

【0005】[0005]

【課題を解決するための手段】上記目的を達成するた
め、本発明に係る装置は、多値画像データから文字領域
を抽出し、該文字領域の位置データを生成する抽出手段
と、前記文字領域の多値画像データを2値化して、文字
領域2値画像データを生成する2値化手段と、前記文字
領域の代表色を算出し、文字の色データを生成する色算
出手段と、文字以外の領域の多値画像データを用いて、
前記文字領域の多値画像データを変換し、文字なし多値
画像データを生成する変換手段と、前記文字なし多値画
像データの解像度を落として縮小文字なし多値画像デー
タを生成する解像度変換手段と、前記縮小文字なし多値
画像データを圧縮する第1圧縮手段と、前記文字領域2
値画像データを圧縮する第2圧縮手段と、を有すること
を特徴とする。
In order to achieve the above object, an apparatus according to the present invention extracts character regions from multi-valued image data and generates position data of the character regions; Binarizing means for binarizing the multi-valued image data to generate character area binary image data; color calculating means for calculating the representative color of the character area to generate character color data; Using the multi-valued image data of the area
Conversion means for converting the multi-valued image data of the character area to generate multi-valued image data without characters, and resolution conversion means for reducing the resolution of the multi-valued image data without characters to generate reduced multi-valued image data without characters First compression means for compressing the multi-valued image data without reduced characters;
And second compression means for compressing the value image data.

【0006】更に、前記解像度変換手段での解像度変換
パラメータを制御する制御手段を有することを特徴とす
る。
[0006] Further, it is characterized in that it has a control means for controlling a resolution conversion parameter in the resolution conversion means.

【0007】前記制御手段は、前記文字なし多値画像デ
ータを直交変換した場合に、高周波成分が小さい前記文
字なし多値画像データに対しては、高周波成分が大きい
前記文字なし多値画像データに比して、より低解像度に
変換するように、前記解像度変換パラメータを制御する
ことを特徴とする。
When the non-character multi-valued image data is orthogonally transformed, the control means converts the non-character multi-valued image data having a small high frequency component into the character-less multi-valued image data having a large high frequency component. The resolution conversion parameter is controlled such that the resolution is converted to a lower resolution.

【0008】前記制御手段は、前記文字なし多値画像デ
ータに微分フィルタを施し、その絶対値の合計数の小さ
い前記文字なし多値画像データに対しては、絶対値の合
計数の大きい高周波成分が大きい前記文字なし多値画像
データに比して、より低解像度に変換するように、前記
解像度変換パラメータを制御することを特徴とする。
The control means applies a differentiation filter to the multi-valued image data without characters, and applies a high-frequency component having a large total number of absolute values to the multi-valued image data without characters having a small total number of absolute values. The resolution conversion parameter is controlled so that the resolution is converted to a lower resolution than the character-less multi-valued image data having a larger value.

【0009】前記第1圧縮手段はJPEG圧縮準拠であ
ることを特徴とする。
[0009] The first compression means is based on JPEG compression.

【0010】前記第2圧縮手段はMMR圧縮準拠である
ことを特徴とする。
[0010] The second compression means is based on MMR compression.

【0011】前記位置データ、前記色データ、及び前記
第1、第2圧縮手段の出力を結合後、さらに可逆の圧縮
法で圧縮する第3圧縮手段を、更に有することを特徴と
する。
After the position data, the color data, and the outputs of the first and second compression means are combined, a third compression means for further compressing the data by a reversible compression method is further provided.

【0012】前記画像処理装置によって、圧縮された画
像を伸長するための画像処理装置であって、前記第1圧
縮手段で圧縮された前記縮小文字なし多値画像データを
伸長する第1伸長手段と、前記第2圧縮手段で圧縮され
た前記文字領域2値画像データを伸長する第2伸長手段
と、前記縮小文字なし多値画像データの解像度を上げて
前記文字なし多値画像データを生成する解像度変換手段
と、前記位置データ及び色データを入力し、前記文字領
域2値画像データ及び前記文字なし多値画像データか
ら、前記多値画像データを生成する画像合体手段と、を
有することを特徴とする。
An image processing apparatus for expanding a compressed image by the image processing apparatus, wherein the first expansion means expands the multi-valued image data without reduced characters compressed by the first compression means; A second decompression means for decompressing the character area binary image data compressed by the second compression means, and a resolution for generating the character-less multivalued image data by increasing the resolution of the reduced character-less multivalued image data Conversion means, and image merging means for inputting the position data and the color data and generating the multi-valued image data from the character area binary image data and the character-less multi-valued image data, I do.

【0013】上記目的を達成するため、本発明に係る方
法は、多値画像データから文字領域を抽出し、該文字領
域の位置データを生成する抽出工程と、前記多値画像デ
ータの内、前記文字領域のデータを2値化して、文字領
域2値画像データを生成する2値化工程と、前記文字領
域の代表色を算出し、文字の色データを生成する色算出
工程と、前記多値画像データの内、文字以外の領域のデ
ータを用いて、前記文字領域のデータを変換し、前記多
値画像データから文字のみが削除された、文字なし多値
画像データを生成する変換工程と、前記文字なし多値画
像データの解像度を落として縮小文字なし多値画像デー
タを生成する解像度変換工程と、前記縮小文字なし多値
画像データを圧縮する第1圧縮工程と、前記文字領域2
値画像データを圧縮する第2圧縮工程と、を有すること
を特徴とする。
To achieve the above object, a method according to the present invention comprises the steps of: extracting a character region from multi-valued image data and generating position data of the character region; A binarizing step of binarizing character area data to generate character area binary image data; a color calculating step of calculating a representative color of the character area to generate character color data; Of the image data, using the data of the area other than the character, the data of the character area is converted, only the characters are deleted from the multi-valued image data, a conversion step of generating multi-valued image data without characters, A resolution converting step of reducing the resolution of the multi-valued image data without characters to generate reduced multi-valued image data without characters; a first compression step of compressing the multi-valued image data without reduced characters;
A second compression step of compressing the value image data.

【0014】上記目的を達成するため、本発明に係る記
憶媒体は、多値画像データを圧縮する圧縮プログラムを
格納したコンピュータ可読メモリであって、前記圧縮プ
ログラムは、多値画像データから文字領域を抽出し、該
文字領域の位置データを生成する抽出工程のコードと、
前記多値画像データの内、前記文字領域のデータを2値
化して、文字領域2値画像データを生成する2値化工程
のコードと、前記文字領域の代表色を算出し、文字の色
データを生成する色算出工程のコードと、前記多値画像
データの内、文字以外の領域のデータを用いて、前記文
字領域のデータを変換し、前記多値画像データから文字
のみが削除された、文字なし多値画像データを生成する
変換工程のコードと、前記文字なし多値画像データの解
像度を落として縮小文字なし多値画像データを生成する
解像度変換工程のコードと、前記縮小文字なし多値画像
データを圧縮する第1圧縮工程のコードと、前記文字領
域2値画像データを圧縮する第2圧縮工程のコードと、
を含むことを特徴とする。
In order to achieve the above object, a storage medium according to the present invention is a computer-readable memory storing a compression program for compressing multi-valued image data, wherein the compression program stores a character area from the multi-valued image data. A code of an extracting step of extracting and generating position data of the character area;
Codes of a binarization step of binarizing the data of the character area from the multi-valued image data to generate character area binary image data, and calculating a representative color of the character area, The code of the color calculation step of generating the, of the multi-valued image data, using the data of the area other than the character, the data of the character area is converted, only the character is deleted from the multi-valued image data, A code of a conversion step of generating multi-valued image data without characters, a code of a resolution conversion step of generating reduced multi-valued image data without characters by reducing the resolution of the multi-valued image data of non-characters, A code of a first compression step of compressing image data, a code of a second compression step of compressing the character area binary image data,
It is characterized by including.

【0015】[0015]

【発明の実施の形態】以下に、図面を参照して、この発
明の好適な実施の形態を例示的に詳しく説明する。ただ
し、この実施の形態に記載されている構成要素の相対配
置、数式、数値等は、特に特定的な記載がない限りは、
この発明の範囲をそれらのみに限定する趣旨のものでは
ない。
Preferred embodiments of the present invention will be described in detail below with reference to the accompanying drawings. However, the relative arrangement of components described in this embodiment, formulas, numerical values, etc., unless otherwise specified,
It is not intended to limit the scope of the present invention only to them.

【0016】(第1の実施の形態)図1に本実施の形態
の構成図を示す。
(First Embodiment) FIG. 1 shows a configuration diagram of the present embodiment.

【0017】101は入力した原画像から文字領域を検
出して複数の文字領域の座標109を作成する文字領域
検出部である。102は上記文字領域座標を入力し、原
画像の文字領域部分の2値画像108を作成する二値化
部である。103は上記二値画像の黒部分と原画像を参
照しながら黒部分の代表色110を算出する色算出部で
ある。104は上記二値画像(黒)の領域を原画像から
抜いて、その周りの色で塗りつぶし画像Aを作成する文
字部塗りつぶし部である。105は画像Aを入力し、縮
小して画像Bを作成する縮小部である。106は画像B
を入力し、JPEG圧縮して圧縮コードC(112)を
作成するJPEG圧縮部である。107は上記複数の二
値画像を入力しMMR圧縮して複数の圧縮コードD(1
12)を作成するMMR圧縮部である。最終的に破線で
囲まれた、109から112までのデータを結合してこ
れが圧縮データとなる。
Reference numeral 101 denotes a character area detecting unit which detects a character area from the input original image and creates coordinates 109 of a plurality of character areas. Reference numeral 102 denotes a binarizing unit which receives the character area coordinates and creates a binary image 108 of the character area portion of the original image. Reference numeral 103 denotes a color calculation unit that calculates the representative color 110 of the black portion while referring to the black portion of the binary image and the original image. Reference numeral 104 denotes a character portion filling portion for extracting a region of the binary image (black) from the original image and creating a filling image A with a surrounding color. Reference numeral 105 denotes a reduction unit that receives the image A and reduces the size of the image A to create the image B. 106 is image B
Is a JPEG compression unit for inputting and inputting JPEG and creating a compression code C (112). 107 inputs the plurality of binary images, performs MMR compression, and generates a plurality of compression codes D (1).
12) is an MMR compression unit that creates Finally, data 109 to 112 surrounded by a broken line are combined to form compressed data.

【0018】図3は、文字領域検出部での処理を説明す
るフローチャートである。
FIG. 3 is a flowchart for explaining the processing in the character area detecting section.

【0019】ステップS301にてカラー画像を入力
し、間引いて解像度を落しながら輝度変換を行い、輝度
画像Jを作成する。例えば原画像がRGB24ビット3
00dpiだとすると、縦方向、横方向とも4画素ごと
に Y=0.299R+0.587G+0.114B の演算を行い、新しい画像Jを作成すると画像JはY8
ビット75dpiの画像となる。ステップS302にて
輝度データのヒストグラムを取り、二値化閾値Tを算出
する。次にステップS303にて輝度画像JをTにて二
値化し、二値画像Kを作成する。更にステップS304
にて黒画素の輪郭線追跡を行いすべての黒領域をラベル
付けする。次に、ステップS305にて黒領域中の文字
らしい領域を判定する。ステップS306にて形や位置
から結合するものを結合する。
In step S301, a color image is input, luminance conversion is performed while reducing the resolution by thinning out, and a luminance image J is created. For example, if the original image is RGB 24-bit 3
If the resolution is 00 dpi, the calculation of Y = 0.299R + 0.587G + 0.114B is performed every four pixels in both the vertical and horizontal directions, and when a new image J is created, the image J becomes Y8
An image of bits 75 dpi is obtained. In step S302, a histogram of the luminance data is obtained, and a binarization threshold T is calculated. Next, in step S303, the luminance image J is binarized by T to generate a binary image K. Further, step S304
Traces the contours of black pixels and labels all black areas. Next, in step S305, a character-like area in the black area is determined. In step S306, objects to be combined from shapes and positions are combined.

【0020】一例を示す。例えば図4に示すカラー原稿
を入力し、間引いて輝度変換したもののヒストグラムを
取ると図5のようになる。このヒストグラムから平均、
分散、などのデータを利用して閾値T=150を算出
し、二値化した画像は図6のようになる。図6の黒画素
の輪郭線追跡を行い、すべてをラベリングして、例え
ば、横幅が閾値以下、または高さが閾値以下の黒画素の
集まりのみ文字として許すと図7に示す黒画素の集まり
が文字領域となる(実際にこのような画像が作成される
わけではなく、イメージである)。
An example will be described. For example, when the color original shown in FIG. 4 is input, the histogram of the thinned-out luminance data is obtained as shown in FIG. From this histogram the average,
The threshold value T = 150 is calculated using data such as variance, and the binarized image is as shown in FIG. When the contour tracing of the black pixels in FIG. 6 is performed and all are labeled, for example, if only a group of black pixels whose width is equal to or less than the threshold or whose height is equal to or less than the threshold is allowed as a character, the group of black pixels illustrated in FIG. It becomes a character area (an image is not actually created, but an image).

【0021】これらの黒画素の集まりを位置の近さや横
幅、高さの一致からグループ化していくと、図8に示す
ような17個の文字領域が検出できる。これらの座標デ
ータが図1の109に格納される。
When these groups of black pixels are grouped based on the closeness of position, width, and height, 17 character regions as shown in FIG. 8 can be detected. These coordinate data are stored in 109 in FIG.

【0022】カラー画像の2値化をおこなうのではな
く、微分フィルタをかけ、すべての画素の近隣の画素と
のエッジ量を算出し、そのエッジ量を二値化することに
より得られた二値画像を同様に輪郭線追跡をして文字領
域を検出してもよい。
Rather than binarizing a color image, a binary filter obtained by applying a differential filter, calculating the edge amounts of all pixels with neighboring pixels, and binarizing the edge amounts is calculated. Similarly, contour lines may be traced on an image to detect a character area.

【0023】2値化部102にて、上記の方法にて得ら
れた17個の文字領域の二値画像を作成する。この二値
画像は、例えば文字領域検出部にて算出したTにて二値
化しても良いし、その領域ごとにヒストグラムを取って
その文字領域により最適な二値化閾値を算出しても良
い。図5に示した全面のヒストグラムに比べて、文字領
域一部分の輝度ヒストグラムは、図9のようなシンプル
な形が期待できるので、閾値の決定は容易である。90
1は下地色の集合であり、902は文字色の集合であ
る。
In the binarizing section 102, binary images of 17 character areas obtained by the above method are created. This binary image may be binarized using, for example, T calculated by the character area detection unit, or a histogram may be taken for each area to calculate an optimal binarization threshold value for the character area. . Compared to the histogram of the entire surface shown in FIG. 5, the luminance histogram of a part of the character area can be expected to have a simple form as shown in FIG. 9, so that the threshold can be easily determined. 90
1 is a set of background colors, and 902 is a set of character colors.

【0024】上記二値化結果を利用した文字部塗りつぶ
し部104の処理の一例を図10と図11を用いて説明
する。
An example of the processing of the character part painting unit 104 using the above-described binarization result will be described with reference to FIGS.

【0025】グラデーション画像を背景とし、ABCと
いう青色の文字が中央付近に描かれた、図10(a)の
ような画像を原画像とする。この原画像から(b)のよ
うな1つの文字領域の2値画像を得たとする。本実施の
形態では、全画像を32×32の領域(以下、パーツ)
に分割し、パーツごとに処理をおこなう。図10(c)
にパーツごとに分けた様子を示す。この図では簡単に説
明するため、5×4のパーツに分割した状態を示してい
る。各領域の左上の数字はパーツ番号を示す。このよう
に分割した場合、パーツ00〜04,10,14,2
0,24,30〜35は、ステップS1103において
文字領域がないと判断されるため、処理は行われずに、
次のパーツに進む。パーツ11に対しては、ステップS
1104に進み、対応する二値画像を参照し、二値画像
の白部分に対応するカラー画像のRGB値(またはYU
V等でも良い)の平均値ave_colorを算出す
る。次にステップS1105において、対応する二値画
像を参照し、黒画素に対応する画素の濃度データを上記
ave_colorとする。以上の処理を文字領域の存
在するパーツ12,13,21,22,23に繰り返
す。
An image as shown in FIG. 10A in which a gradation image is a background and a blue character of ABC is drawn near the center is as an original image. It is assumed that a binary image of one character area as shown in (b) is obtained from the original image. In the present embodiment, all images are stored in a 32 × 32 area (hereinafter, parts).
And perform processing for each part. FIG. 10 (c)
Fig. 3 shows the state of each part. This figure shows a state of being divided into 5 × 4 parts for simple explanation. The numbers at the upper left of each area indicate part numbers. When divided in this way, parts 00 to 04, 10, 14, 2
In steps 0, 24, and 30 to 35, since it is determined that there is no character area in step S1103, the processing is not performed, and
Proceed to the next part. Step S for part 11
Proceeding to 1104, referring to the corresponding binary image, the RGB values (or YU) of the color image corresponding to the white portion of the binary image
V, etc.) may be calculated. Next, in step S1105, the density data of the pixel corresponding to the black pixel is referred to as ave_color with reference to the corresponding binary image. The above processing is repeated for the parts 12, 13, 21, 22, 23 in which the character area exists.

【0026】このようにして、文字の存在する部分の周
りの画素の平均値を埋めることができる。この画像を縮
小部105にて縮小する。本実施の形態では単純間引き
とする。ちなみに、この縮小と文字部塗りつぶし処理は
順番を逆にしても構わない。その場合、二値画像とカラ
ー画像の位置のずれに気を付ける必要がある。
In this way, it is possible to fill in the average value of the pixels around the portion where the character exists. This image is reduced by the reduction unit 105. In the present embodiment, simple thinning is performed. Incidentally, the order of the reduction and the character portion filling process may be reversed. In that case, it is necessary to pay attention to the displacement between the binary image and the color image.

【0027】一方、上記二値化結果を利用した文字色算
出部の一例を図12に示す。本実施の形態では部分二値
化結果108の結果を利用したがその限りでなく、例え
ば文字領域の座標とカラー画像のみ入力し、カラー画像
を改めて二値化した結果を利用して色算出処理を行って
も良い。抽出されたすべての文字領域ごとに処理を行う
ので、ステップS1201では未処理の文字座標がある
かどうかチェックし、あったらステップS1202にす
すみ、無かったらendにすすむ。ステップS1202
にてその文字座標が参照する二値画像の細線化処理を行
い、スキャナ読み込み時の下地から文字部への変化部に
あたる黒を減らしていき、新しい二値画像newbiを
作成する。次にステップS1203にてnewbiの黒
画素に対応する原画像のRGBのそれぞれの値のヒスト
グラムを取る(もちろん、YUV等の他の色空間でも構
わない)。ステップS1204にてRGBそれぞれの代
表値を算出する。例えば、一番大きな値でも良い。また
はヒストグラムのステップ数を少なくして大まかなヒス
トグラムで一番大きな値を得た後に、このヒストグラム
に存在する細かなヒストグラムで一番大きな値を得る方
法でもよい。
On the other hand, FIG. 12 shows an example of a character color calculating section utilizing the above-mentioned binarized result. In the present embodiment, the result of the partial binarization result 108 is used. However, the present invention is not limited to this. May be performed. Since the process is performed for each of the extracted character areas, it is checked in step S1201 whether there is any unprocessed character coordinate. If there is, the process proceeds to step S1202, and if not, the process proceeds to end. Step S1202
Performs thinning processing of the binary image referred to by the character coordinates, and reduces black corresponding to a change from the background to the character portion when reading the scanner, thereby creating a new binary image newbi. Next, in step S1203, a histogram of the RGB values of the original image corresponding to the black pixel of newbi is obtained (of course, another color space such as YUV may be used). In step S1204, a representative value of each of RGB is calculated. For example, the largest value may be used. Alternatively, a method may be used in which the number of steps in the histogram is reduced to obtain the largest value in a rough histogram, and then the largest value is obtained in a fine histogram existing in the histogram.

【0028】後者のような方法を取ることにより、図1
3に示したようなヒストグラムからノイズ1302に惑
わされること無く真の代表値1301を得ることができ
る。図を使用して詳細に説明をすると、細かなヒストグ
ラムとしては例えば8ビットのRデータから256段階
のヒストグラム(図13に示す)が得られるわけだが、
これの最大値は1302になり、これは真の代表値では
ない。そこで、ヒストグラムをオーバーラップする64
の幅にわけ、8段階のものを256段階のヒストグラム
から再計算する。それを0から8に示したが、0と8は
32幅しかない。この再計算により代表値はに存在す
ることがわかり、内の最大値を検索して1301を得
ることができる。以上の処理をすべての文字座標に繰り
返すことにより、すべての文字座標に1つずつ代表色が
算出される。
By taking the latter method, FIG.
A true representative value 1301 can be obtained from the histogram shown in FIG. To explain in detail using the figure, a 256-level histogram (shown in FIG. 13) can be obtained from 8-bit R data, for example, as a fine histogram.
Its maximum value is 1302, which is not a true representative value. Therefore, 64 overlapping histograms
, And recalculate the values of 8 levels from the histogram of 256 levels. It is shown from 0 to 8, where 0 and 8 are only 32 widths. By this recalculation, it is found that the representative value exists, and 1301 can be obtained by searching the maximum value. By repeating the above process for all character coordinates, a representative color is calculated for each character coordinate.

【0029】最後に部分二値画像108のそれぞれをM
MR圧縮し、圧縮コードDを作成し、また、縮小画像B
の適当な量子化テーブルを利用してJPEG圧縮を行い
圧縮コードCを作成する。文字領域座標(109)、文
字部代表色(110)、圧縮コードC(111)、圧縮
コードD(112)の4つをまとめたフォーマットを必
要ならば作成する。
Finally, each of the partial binary images 108 is represented by M
MR compression to create a compression code D, and a reduced image B
The compression code C is created by performing JPEG compression using an appropriate quantization table. If necessary, a format in which the character area coordinates (109), the character part representative color (110), the compression code C (111), and the compression code D (112) are combined is created.

【0030】このフォーマットは、PDFであってもよ
いし、XMLであてってもよい。
This format may be PDF or XML.

【0031】図2に伸長時の構成図を示す。FIG. 2 shows a configuration diagram at the time of extension.

【0032】201は圧縮コードCを入力し、JPEG
伸長処理を行い多値画像Eを作成するJPEG伸長部で
ある。202は圧縮コードを入力し二値画像Fを作成す
るMMR伸長部である。203は多値画像Eを入力し、
拡大して画像Gを作成する拡大部である。204は文字
領域の座標と代表色を入力し、上記二値画像Fを参照し
ながら白部分は画像Gを、黒部分は代表色を選択し、最
終的な画像である画像H207を作成する画像合体部で
ある。
Reference numeral 201 denotes the input of a compression code C,
A JPEG decompression unit that performs a decompression process to create a multi-valued image E. Reference numeral 202 denotes an MMR decompression unit that inputs a compression code and creates a binary image F. 203 inputs a multi-valued image E,
This is an enlargement unit that creates an image G by enlarging. An image 204 for inputting the coordinates of the character area and the representative color, selecting the image G for the white part and selecting the representative color for the black part with reference to the binary image F, and creating the final image H207 It is a united part.

【0033】図14に合体処理204の結果例を示す。
まず図14(a)に圧縮コードCのJPEG伸長結果を
示す。JPEG圧縮の量子化非可逆方式を利用すると図
10(c)とは微妙に画素値が異なるデータとなってい
る。しかし、文字部を抜く前の原画像をJPEG非可逆
圧縮方式で圧縮する場合と比較して、同じ量子化テーブ
ルを利用した場合において画素値の変化は少ない。二値
画像(b)を参照して黒画素の対応するところの画像
(a)上に代表色(20,30,255)データをの
せ、最終的に(c)のような画像ができ上がる。これが
伸長画像207となる。
FIG. 14 shows an example of the result of the merging process 204.
First, FIG. 14A shows the result of JPEG expansion of the compression code C. When the quantization irreversible method of JPEG compression is used, the pixel value is slightly different from that of FIG. 10C. However, compared to the case where the original image before the character portion is extracted is compressed by the JPEG lossy compression method, the change in the pixel value is small when the same quantization table is used. Referring to the binary image (b), the representative color (20, 30, 255) data is placed on the image (a) corresponding to the black pixels, and finally an image as shown in (c) is completed. This is the expanded image 207.

【0034】このように、本実施の形態によれば、低周
波部分(主に自然画領域)は解像度をそれほど必要とし
ないが階調が必要であり、高周波部分(主に文字領域)
は解像度が必要であるが階調をそれほど必要としないと
いう人間の目の特性を利用して、文字部以外の下地画像
は解像度を落すことにより、圧縮率を高めることができ
る。例えば、200分の1の圧縮率を実現することがで
き、Eメイル添付もネットワークの妨げにならず、画像
操作も軽やかであって、なおかつ高画質な画像が提供で
きる。
As described above, according to the present embodiment, the low-frequency portion (mainly a natural image region) does not require much resolution but needs gradation, and the high-frequency portion (mainly a character region)
Utilizing the characteristics of the human eye that requires a high resolution but does not require much gradation, the compression ratio can be increased by lowering the resolution of the background image other than the character portion. For example, a compression ratio of 1/200 can be realized, attachment of e-mail does not hinder the network, image manipulation is light, and a high-quality image can be provided.

【0035】なお、本実施の形態では二値化102にて
部分的な文字領域のみ二値化したがその限りでなく、例
えば、101文字領域検出にて使用した二値画像をその
まま利用してもよい。その場合、構成は図15のように
なる。
In this embodiment, only a partial character area is binarized by the binarization 102. However, the present invention is not limited to this. For example, the binary image used in the 101 character area detection may be used as it is. Is also good. In that case, the configuration is as shown in FIG.

【0036】また、文字部塗りつぶし部104、色算出
部103において使用する二値画像を108の結果を利
用したが、その限りでなく、それぞれ最適な二値化手段
を104,103内にて保持しても良い。その場合、構
成は図16に示すようになる。
The binary image used in the character part filling unit 104 and the color calculating unit 103 is based on the result of 108. However, the present invention is not limited to this. You may. In that case, the configuration is as shown in FIG.

【0037】また、本実施の形態では文字領域検出部に
おいて図3の306に示すように形や位置が似ているも
のを最後に結合したがその限りでなく、結合しなくても
良い。その場合、図4の画像の結果は文字領域が100
個以上抽出されるがその後の色算出処理が細やかに行え
るので、例えば1行中の20文字のうちほとんどが黒で
一部が赤かったりする場合も色の変化に細かく対応でき
る。
Further, in the present embodiment, in the character area detecting section, those having similar shapes and positions are finally combined as shown at 306 in FIG. 3, but the present invention is not limited to this and may not be combined. In that case, the result of the image in FIG.
Since more than one character is extracted, the subsequent color calculation process can be performed in detail, so that, for example, when most of the 20 characters in one line are black and some are red, it is possible to cope with a change in color in detail.

【0038】また、本実施の形態では輝度の低い下地上
の輝度の高い文字(反転文字)の処理が不可能である
が、例えば、図17に示す構成にすれば可能となる。1
701は微分処理部であり、図18に示しような微分フ
ィルタを注目画素を中心にかけ、その絶対値が閾値を超
えたら黒、超えなかったら白というように二値化してい
く。図18(a)は1次微分フィルタであり、上は横線
を検出することができ、下は縦線を検出することができ
る。2つのフィルタの絶対値の合計を利用すると斜め線
を検出することができる。また、斜め線用フィルタを利
用しても良い。図18(b)は二次微分フィルタで全方
向に対応した物である。二次微分フィルタも横方向、縦
方向、と作成することも可能である。このようなフィル
タを全画素にかけ、微分二値画像1702を作成する。
この時前画素でなく間引きながらフィルタをかけること
によって同時に解像度を落すことも可能である。以上の
ように作成された二値画像に図3の304からの処理を
行えば反転文字も含んだ文字領域座標を検出することが
できる。
Further, in the present embodiment, it is impossible to process a high-luminance character (inverted character) on a low-luminance base. However, for example, the configuration shown in FIG. 17 makes it possible. 1
Reference numeral 701 denotes a differentiation processing unit which applies a differentiation filter as shown in FIG. 18 to the center of the pixel of interest, and binarizes the image into black if the absolute value exceeds a threshold, and white if not. FIG. 18A shows a first-order differential filter. The upper part can detect a horizontal line, and the lower part can detect a vertical line. An oblique line can be detected by using the sum of the absolute values of the two filters. Further, an oblique line filter may be used. FIG. 18B shows a secondary differential filter corresponding to all directions. The second derivative filter can also be created in the horizontal direction and the vertical direction. Such a filter is applied to all pixels to create a differential binary image 1702.
At this time, it is also possible to reduce the resolution at the same time by applying a filter while thinning out the pixel instead of the previous pixel. If the processing from step 304 in FIG. 3 is performed on the binary image created as described above, the character area coordinates including the inverted character can be detected.

【0039】また、反転文字も対象にした場合には二値
化部1703も対応しなければならない。反転文字領域
も文字領域として抽出された場合、本実施の形態では図
9のパターンしか入ってこないと想定していたが、図1
9に示すような3パターンの多値データが主に入ってく
ることになる。(b)が反転文字であり、(c)が同一の
グレー下地上に黒文字と白文字の2色が存在するケース
である。これらの3パターンを考えて二値化部1703
ではA点とB点を検出し、AとBに挟まれた領域は白、
その他は黒の二値化処理を行うと良い。または、(c)
のケースは考えずに、下地と文字部を分ける1つの閾値
を検出し、反転パターンであれば反転する処理を行えば
良い。
If inverted characters are also targeted, the binarizing unit 1703 must be compatible. In the case where the inverted character area is also extracted as a character area, in the present embodiment, it is assumed that only the pattern of FIG. 9 is included.
The multi-value data of three patterns as shown in FIG. (B) is a reversed character, and (c) is a case where two colors of a black character and a white character exist on the same gray base. Considering these three patterns, the binarization unit 1703
Now, point A and point B are detected, the area between A and B is white,
In other cases, it is preferable to perform black binarization processing. Or (c)
Without considering the case, it is only necessary to detect one threshold value that separates the background and the character portion, and perform the inversion process if the pattern is an inversion pattern.

【0040】このように反転文字領域も対応すればJP
EG圧縮される画像上には実施の形態1では残ってしま
っていた反転文字領域も文字部塗りつぶしによりスムー
ジングされるので、圧縮効率も良く、またその反転文字
部も解像度やモスキートノイズの劣化なしに圧縮するこ
とが可能となる。
As described above, if the reversed character area is also supported, JP
The inverted character area remaining in the EG-compressed image in the first embodiment is also smoothed by filling the character portion, so that the compression efficiency is good, and the inverted character portion is also improved without deteriorating the resolution or mosquito noise. It becomes possible to compress.

【0041】(第2の実施の形態)上記第1の実施の形
態では縮小部105における縮小の程度はどの画像も一
定としたが、本実施の形態では、図20に示すように解
像度変換の縮小パラメータ(例えば、2分の1、4分の
1など)を決定する縮小パラメータ制御部2001を設
ける。
(Second Embodiment) In the first embodiment, the degree of reduction in the reduction unit 105 is fixed for all images. In this embodiment, however, the resolution conversion is performed as shown in FIG. A reduction parameter control unit 2001 for determining a reduction parameter (for example, a half, a quarter, etc.) is provided.

【0042】この縮小パラメータ制御部2001は、例
えば、画像Aの全面を8×8毎に直交変換を行い、直交
変換結果の高周波部の係数が大きい領域が閾値以上存在
したら、縮小は2分の1、閾値以下であったら縮小は4
分の1など調整する。
The reduction parameter control unit 2001 performs, for example, an orthogonal transformation on the entire surface of the image A every 8 × 8. 1, if it is less than the threshold, the reduction is 4
Adjust by a factor of one.

【0043】また、この縮小パラメータは2段階には限
らず、例えば3段階(縮小しない、2分の1、4分の
1)にすることも可能である。これにより、高周波部分
の極端な縮小が避けられ、画質劣化を防ぐ効果がある。
The reduction parameter is not limited to two levels, but may be, for example, three levels (half, quarter, not reduced). This has the effect of avoiding extreme reduction of the high frequency part and preventing image quality degradation.

【0044】また、この縮小パラメータ決定には、画像
に微分フィルタをかけ、その絶対値の総和から切り替え
る方法も考えられる。この方法の場合、隣り合った画素
値の差の総和が閾値m以上であれば、縮小しない、n以
上であれば、2分の1、n未満なら4分の1などにして
もよい。
In order to determine the reduction parameters, a method of applying a differential filter to the image and switching from the sum of the absolute values may be considered. In the case of this method, if the sum of the differences between adjacent pixel values is equal to or greater than the threshold value m, no reduction is performed, if n is equal to or more than n, 分 の, if less than n, 4.

【0045】本実施の形態により、解像度変換のより細
かい制御が可能となり、画質を一層向上させることがで
きる。
According to the present embodiment, finer control of the resolution conversion can be performed, and the image quality can be further improved.

【0046】(他の実施の形態)なお、本発明は、複数
の機器(例えばホストコンピュータ、インタフェース機
器、リーダ、プリンタ等)から構成されるシステムの1
部として適用しても、1つの機器(例えば複写機、ファ
クシミリ装置)からなる装置の1部に適用してもよい。
(Other Embodiments) The present invention relates to a system including a plurality of devices (for example, a host computer, an interface device, a reader, and a printer).
The present invention may be applied as a unit, or may be applied to a part of an apparatus including one device (for example, a copying machine or a facsimile machine).

【0047】また、本発明は上記実施の形態を実現する
ための装置及び方法のみに限定されるものではなく、上
記システム又は装置内のコンピュータ(CPU或いはM
PU)に、上記実施の形態を実現するためのソフトウェ
アのプログラムコードを供給し、このプログラムコード
に従って上記システム或いは装置のコンピュータが上記
各種デバイスを動作させることにより上記実施の形態を
実現する場合も本発明の範疇に含まれる。
Further, the present invention is not limited to only the apparatus and method for realizing the above-described embodiment, but includes a computer (CPU or M
PU) is supplied with software program code for implementing the above-described embodiment, and the computer of the system or apparatus operates the various devices according to the program code to realize the above-described embodiment. Included in the scope of the invention.

【0048】またこの場合、前記ソフトウェアのプログ
ラムコード自体が上記実施の形態の機能を実現すること
になり、そのプログラムコード自体、及びそのプログラ
ムコードをコンピュータに供給するための手段、具体的
には上記プログラムコードを格納した記憶媒体は本発明
の範疇に含まれる。
In this case, the program code itself of the software realizes the functions of the above-described embodiment, and the program code itself and means for supplying the program code to the computer, specifically, A storage medium storing the program code is included in the scope of the present invention.

【0049】この様なプログラムコードを格納する記憶
媒体としては、例えばフロッピー(登録商標)ディス
ク、ハードディスク、光ディスク、光磁気ディスク、C
D−ROM、DVD、磁気テープ、不揮発性のメモリカ
ード、ROM等を用いることができる。
As a storage medium for storing such a program code, for example, a floppy (registered trademark) disk, hard disk, optical disk, magneto-optical disk, C
D-ROM, DVD, magnetic tape, nonvolatile memory card, ROM, and the like can be used.

【0050】また、上記コンピュータが、供給されたプ
ログラムコードのみに従って各種デバイスを制御するこ
とにより、上記実施の形態の機能が実現される場合だけ
ではなく、上記プログラムコードがコンピュータ上で稼
働しているOS(オペレーティングシステム)、或いは
他のアプリケーションソフト等と共同して上記実施の形
態が実現される場合にもかかるプログラムコードは本発
明の範疇に含まれる。更に、この供給されたプログラム
コードが、コンピュータの機能拡張ボードやコンピュー
タに接続された梯能拡張ユニットに備わるメモリに格納
された後、そのプログラムコードの指示に基づいてその
機能拡張ボードや機能格納ユニットに備わるCPU等が
実際の処理の一部または全部を行い、その処理によって
上記実施の形態が実現される場合も本発明の範疇に含ま
れる。
In addition to the case where the computer controls various devices in accordance with only the supplied program code to realize the functions of the above-described embodiment, the program code operates on the computer. Such a program code is included in the scope of the present invention even when the above-described embodiment is realized in cooperation with an OS (Operating System) or other application software. Further, after the supplied program code is stored in the memory provided in the function expansion board of the computer or the ladder expansion unit connected to the computer, the function expansion board or the function storage unit is stored based on the instruction of the program code. The present invention includes a case where the CPU or the like provided in the first embodiment performs a part or all of the actual processing, and the processing realizes the above-described embodiment.

【0051】[0051]

【発明の効果】以上説明したように、本発明によれば、
画質を保ちながら効率良く画像を圧縮する画像処理装
置、画像処理方法並びにその記憶媒体を提供することが
できる。
As described above, according to the present invention,
An image processing apparatus, an image processing method, and a storage medium for efficiently compressing an image while maintaining image quality can be provided.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1の実施の形態に係る圧縮装置のブ
ロック図である。
FIG. 1 is a block diagram of a compression device according to a first embodiment of the present invention.

【図2】本発明の第1の実施の形態に係る伸長装置のブ
ロック図である。
FIG. 2 is a block diagram of a decompression device according to the first embodiment of the present invention.

【図3】本発明の第1の実施の形態の文字領域検出部の
処理を示すフローチャートである。
FIG. 3 is a flowchart illustrating a process performed by a character area detection unit according to the first embodiment of this invention.

【図4】本発明の第1の実施の形態の文字領域検出処理
を説明するための原画像の例を示す図である。
FIG. 4 is a diagram illustrating an example of an original image for explaining a character area detection process according to the first embodiment of this invention.

【図5】本発明の第1の実施の形態の文字領域検出処理
を説明するためのヒストグラムを示す図である。
FIG. 5 is a diagram illustrating a histogram for explaining a character area detection process according to the first embodiment of this invention.

【図6】本発明の第1の実施の形態の文字領域検出処理
を説明するための2値画像の例を示す図である。
FIG. 6 is a diagram illustrating an example of a binary image for explaining a character region detection process according to the first embodiment of this invention.

【図7】本発明の第1の実施の形態の文字領域検出処理
を説明するための文字領域画像の例を示す図である。
FIG. 7 is a diagram illustrating an example of a character area image for describing a character area detection process according to the first embodiment of this invention.

【図8】本発明の第1の実施の形態の文字領域検出処理
を説明するための文字領域部分の例を示す図である。
FIG. 8 is a diagram illustrating an example of a character area portion for describing a character area detection process according to the first embodiment of this invention.

【図9】本発明の第1の実施の形態の二値化部109に
入力される文字領域のヒストグラム結果の例を示す図で
ある。
FIG. 9 is a diagram illustrating an example of a histogram result of a character area input to the binarization unit 109 according to the first embodiment of this invention.

【図10】本発明の第1の実施の形態の文字部塗りつぶ
し処理を説明するための図である。
FIG. 10 is a diagram for explaining a character portion filling process according to the first embodiment of this invention.

【図11】本発明の第1の実施の形態の文字部塗りつぶ
し処理を説明するためのフローチャートである。
FIG. 11 is a flowchart illustrating a character portion filling process according to the first embodiment of this invention.

【図12】本発明の第1の実施の形態に係る色算出部の
処理を説明するためのフローチャートである。
FIG. 12 is a flowchart illustrating a process of a color calculation unit according to the first embodiment of the present invention.

【図13】本発明の第1の実施の形態に係る色算出部の
代表値算出処理の一例を説明するための図である。
FIG. 13 is a diagram illustrating an example of a representative value calculation process of the color calculation unit according to the first embodiment of the present invention.

【図14】本発明の第1の実施の形態に係る伸長装置の
合体部204の説明をするための図である。
FIG. 14 is a diagram for explaining a united portion 204 of the stretching device according to the first embodiment of the present invention.

【図15】本発明の第1の実施の形態の変形例を示すブ
ロック図である。
FIG. 15 is a block diagram showing a modification of the first embodiment of the present invention.

【図16】本発明の第1の実施の形態の変形例を示すブ
ロック図である。
FIG. 16 is a block diagram showing a modification of the first embodiment of the present invention.

【図17】反転文字にも対応した第1の実施の形態の変
形例を示すブロック図である。
FIG. 17 is a block diagram showing a modified example of the first embodiment, which also supports inverted characters.

【図18】第1の実施の形態の変形例における微分処理
のフィルタ例を示す図である。
FIG. 18 is a diagram illustrating an example of a filter of a differentiation process according to a modification of the first embodiment.

【図19】第1の実施の形態の変形例における二値化部
1703に入力される領域のヒストグラムパターンを示
す図である。
FIG. 19 is a diagram illustrating a histogram pattern of an area input to a binarizing unit 1703 according to a modification of the first embodiment.

【図20】本発明の第2の実施の形態に係る縮小装置を
示すブロック図である。
FIG. 20 is a block diagram showing a reduction device according to a second embodiment of the present invention.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/60 H04N 1/40 D 5C079 1/403 103A 5L096 1/46 1/46 Z 7/30 7/133 Z Fターム(参考) 5B057 CA01 CA08 CA12 CA16 CB01 CB06 CB08 CB12 CB17 CB18 CC02 CE08 CE12 CE16 CF04 CG05 CG07 DB02 DB06 DB09 DC16 5C059 KK04 MA21 MB03 MB11 MC11 PP01 PP02 PP15 PP24 SS28 TA36 TA46 TB10 TC24 TD10 TD12 UA02 UA05 5C076 AA01 AA13 AA21 AA22 AA26 AA40 BA06 BB01 5C077 MP05 MP06 MP08 PP20 PP21 PP23 PP27 PP28 PP31 PP32 PP47 PP48 PP49 PQ08 PQ12 PQ19 PQ20 PQ22 RR02 RR21 5C078 AA09 BA27 BA57 CA03 DB06 EA08 5C079 LA02 LA06 LA07 LA26 LA34 LA37 LA40 LB12 NA02 NA10 5L096 AA02 AA05 BA07 EA35 EA43 FA35 FA44 FA45 GA02 ──────────────────────────────────────────────────の Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) H04N 1/60 H04N 1/40 D 5C079 1/403 103A 5L096 1/46 1/46 Z 7/30 7 / 133 Z F term (reference) 5B057 CA01 CA08 CA12 CA16 CB01 CB06 CB08 CB12 CB17 CB18 CC02 CE08 CE12 CE16 CF04 CG05 CG07 DB02 DB06 DB09 DC16 5C059 KK04 MA21 MB03 MB11 MC11 PP01 PP02 PP15 PP24 SS28 TA36 TA46 TB10 TC24 TD TD AA13 AA21 AA22 AA26 AA40 BA06 BB01 5C077 MP05 MP06 MP08 PP20 PP21 PP23 PP27 PP28 PP31 PP32 PP47 PP48 PP49 PQ08 PQ12 PQ19 PQ20 PQ22 RR02 RR21 5C078 AA09 BA27 BA57 CA03 DB06 EA08 5C037 LA02 LA06 LA02A06 EA35 EA43 FA35 FA44 FA45 GA02

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】多値画像データから文字領域を抽出し、該
文字領域の位置データを生成する抽出手段と、 前記文字領域の多値画像データを2値化して、文字領域
2値画像データを生成する2値化手段と、 前記文字領域の代表色を算出し、文字の色データを生成
する色算出手段と、 文字以外の領域の多値画像データを用いて、前記文字領
域の多値画像データを変換し、文字なし多値画像データ
を生成する変換手段と、 前記文字なし多値画像データの解像度を落として縮小文
字なし多値画像データを生成する解像度変換手段と、 前記縮小文字なし多値画像データを圧縮する第1圧縮手
段と、 前記文字領域2値画像データを圧縮する第2圧縮手段
と、 を有することを特徴とする画像処理装置。
An extracting means for extracting a character region from the multi-valued image data and generating position data of the character region; binarizing the multi-valued image data of the character region to convert the character region binary image data into A binarizing means for generating, a color calculating means for calculating a representative color of the character area and generating color data of the character, and a multi-valued image of the character area using multi-valued image data of an area other than the character Conversion means for converting data to generate multi-valued image data without characters; resolution conversion means for reducing the resolution of the multi-valued image data without characters to generate multi-valued image data without reduced characters; An image processing apparatus comprising: first compression means for compressing value image data; and second compression means for compressing the character area binary image data.
【請求項2】更に、前記解像度変換手段での解像度変換
パラメータを制御する制御手段を有することを特徴とす
る請求項1に記載の画像処理装置。
2. The image processing apparatus according to claim 1, further comprising control means for controlling a resolution conversion parameter in said resolution conversion means.
【請求項3】前記制御手段は、前記文字なし多値画像デ
ータを直交変換した場合に、高周波成分が小さい前記文
字なし多値画像データに対しては、高周波成分が大きい
前記文字なし多値画像データに比して、より低解像度に
変換するように、前記解像度変換パラメータを制御する
ことを特徴とする請求項2に記載の画像処理装置。
3. The non-character multi-valued image data having a large high-frequency component for the character-less multi-valued image data having a small high-frequency component when the multi-valued image data without a character is subjected to an orthogonal transformation. The image processing apparatus according to claim 2, wherein the resolution conversion parameter is controlled so as to convert the data into lower resolution than data.
【請求項4】前記制御手段は、前記文字なし多値画像デ
ータに微分フィルタを施し、その絶対値の合計数の小さ
い前記文字なし多値画像データに対しては、絶対値の合
計数の大きい高周波成分が大きい前記文字なし多値画像
データに比して、より低解像度に変換するように、前記
解像度変換パラメータを制御することを特徴とする請求
項2に記載の画像処理装置。
4. The control means applies a differentiation filter to the multi-valued image data without characters, and increases the total number of absolute values for the multi-valued image data without characters having a small total number of absolute values. 3. The image processing apparatus according to claim 2, wherein the resolution conversion parameter is controlled so as to convert to a lower resolution than the multi-valued image data without characters having a large high-frequency component.
【請求項5】前記第1圧縮手段はJPEG圧縮準拠であ
ることを特徴とする請求項1に記載の画像処理装置。
5. The image processing apparatus according to claim 1, wherein said first compression means conforms to JPEG compression.
【請求項6】前記第2圧縮手段はMMR圧縮準拠である
ことを特徴とする請求項1に記載の画像処理装置。
6. An image processing apparatus according to claim 1, wherein said second compression means is based on MMR compression.
【請求項7】前記位置データ、前記色データ、及び前記
第1、第2圧縮手段の出力を結合後、さらに可逆の圧縮
法で圧縮する第3圧縮手段を、更に有することを特徴と
する請求項1に記載の画像処理装置。
7. The image processing apparatus according to claim 1, further comprising a third compression unit that combines the position data, the color data, and the outputs of the first and second compression units, and further compresses the data by a reversible compression method. Item 2. The image processing device according to Item 1.
【請求項8】前記請求項1乃至請求項7のいずれかに記
載の画像処理装置によって、圧縮された画像を伸長する
ための画像処理装置であって、 前記第1圧縮手段で圧縮された前記縮小文字なし多値画
像データを伸長する第1伸長手段と、 前記第2圧縮手段で圧縮された前記文字領域2値画像デ
ータを伸長する第2伸長手段と、 前記縮小文字なし多値画像データの解像度を上げて前記
文字なし多値画像データを生成する解像度変換手段と、 前記位置データ及び色データを入力し、前記文字領域2
値画像データ及び前記文字なし多値画像データから、前
記多値画像データを生成する画像合体手段と、 を有することを特徴とする画像処理装置。
8. An image processing apparatus for decompressing a compressed image by the image processing apparatus according to claim 1, wherein said image is compressed by said first compression means. First decompression means for decompressing multivalued image data without reduced characters; second decompression means for decompressing the character area binary image data compressed by the second compression means; Resolution conversion means for increasing the resolution to generate the character-less multi-valued image data; and inputting the position data and the color data,
Image merging means for generating the multi-valued image data from the value image data and the character-less multi-valued image data.
【請求項9】多値画像データから文字領域を抽出し、該
文字領域の位置データを生成する抽出工程と、 前記多値画像データの内、前記文字領域のデータを2値
化して、文字領域2値画像データを生成する2値化工程
と、 前記文字領域の代表色を算出し、文字の色データを生成
する色算出工程と、 前記多値画像データの内、文字以外の領域のデータを用
いて、前記文字領域のデータを変換し、前記多値画像デ
ータから文字のみが削除された、文字なし多値画像デー
タを生成する変換工程と、 前記文字なし多値画像データの解像度を落として縮小文
字なし多値画像データを生成する解像度変換工程と、 前記縮小文字なし多値画像データを圧縮する第1圧縮工
程と、 前記文字領域2値画像データを圧縮する第2圧縮工程
と、 を有することを特徴とする画像処理方法。
9. An extraction step of extracting a character region from multi-valued image data and generating position data of the character region, and binarizing the character region data of the multi-valued image data to form a character region A binarizing step of generating binary image data; a color calculating step of calculating a representative color of the character area to generate character color data; and a data of an area other than the character in the multi-valued image data. Using, converting the data of the character area, only the characters are deleted from the multi-valued image data, a conversion step of generating multi-valued image data without characters, lowering the resolution of the multi-valued image data without characters A resolution conversion step of generating reduced character-less multivalued image data; a first compression step of compressing the reduced character-less multivalued image data; and a second compression step of compressing the character area binary image data. Features Image processing method.
【請求項10】多値画像データを圧縮する圧縮プログラ
ムを格納したコンピュータ可読メモリであって、 前記圧縮プログラムは、 多値画像データから文字領域を抽出し、該文字領域の位
置データを生成する抽出工程のコードと、 前記多値画像データの内、前記文字領域のデータを2値
化して、文字領域2値画像データを生成する2値化工程
のコードと、 前記文字領域の代表色を算出し、文字の色データを生成
する色算出工程のコードと、 前記多値画像データの内、文字以外の領域のデータを用
いて、前記文字領域のデータを変換し、前記多値画像デ
ータから文字のみが削除された、文字なし多値画像デー
タを生成する変換工程のコードと、 前記文字なし多値画像データの解像度を落として縮小文
字なし多値画像データを生成する解像度変換工程のコー
ドと、 前記縮小文字なし多値画像データを圧縮する第1圧縮工
程のコードと、 前記文字領域2値画像データを圧縮する第2圧縮工程の
コードと、 を含むことを特徴とするコンピュータ可読メモリ。
10. A computer-readable memory storing a compression program for compressing multi-valued image data, wherein the compression program extracts a character area from the multi-valued image data and generates position data of the character area. A code of a process; a code of a binarization step of binarizing the data of the character area in the multi-valued image data to generate character area binary image data; and calculating a representative color of the character area. Using the code of the color calculation step of generating the color data of the character and the data of the area other than the character among the multi-valued image data, the data of the character area is converted, and only the character is converted from the multi-valued image data. A code for a conversion step of generating multi-valued image data without characters, and a resolution changer for reducing the resolution of the multi-valued image data without characters to generate reduced multi-valued image data without characters. And a code for a first compression step for compressing the multi-valued image data without reduced characters, and a code for a second compression step for compressing the character area binary image data. Readable memory.
JP2000256131A 2000-08-25 2000-08-25 Image processing apparatus and image processing method Expired - Fee Related JP4366003B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000256131A JP4366003B2 (en) 2000-08-25 2000-08-25 Image processing apparatus and image processing method
US09/931,890 US7133565B2 (en) 2000-08-25 2001-08-20 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000256131A JP4366003B2 (en) 2000-08-25 2000-08-25 Image processing apparatus and image processing method

Publications (2)

Publication Number Publication Date
JP2002077633A true JP2002077633A (en) 2002-03-15
JP4366003B2 JP4366003B2 (en) 2009-11-18

Family

ID=18744790

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000256131A Expired - Fee Related JP4366003B2 (en) 2000-08-25 2000-08-25 Image processing apparatus and image processing method

Country Status (1)

Country Link
JP (1) JP4366003B2 (en)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006222940A (en) * 2005-01-14 2006-08-24 Ricoh Co Ltd Image processing apparatus
US7386168B2 (en) 2003-02-24 2008-06-10 Canon Kabushiki Kaisha Image processing apparatus
US7420150B2 (en) 2005-07-12 2008-09-02 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer program
JP2009081791A (en) * 2007-09-27 2009-04-16 Fuji Xerox Co Ltd Image processing apparatus, and image processing program
EP2071493A2 (en) 2007-12-12 2009-06-17 Canon Kabushiki Kaisha Image processing device, image processing method, and program and recording medium thereof
JP2010147935A (en) * 2008-12-19 2010-07-01 Canon Inc Image processing apparatus and image processing method
JP2010527190A (en) * 2007-05-04 2010-08-05 イー・エル・イー・エス・ソシエテ・アノニム Compress digital images containing scanned documents
US7848572B2 (en) 2005-04-22 2010-12-07 Canon Kabushiki Kaisha Image processing apparatus, image processing method, computer program
US8014620B2 (en) 2006-08-24 2011-09-06 Fuji Xerox Co., Ltd. Image processing system, image compression system, image editing system, computer readable medium, computer data signal and image processing apparatus
US8031934B2 (en) 2007-03-19 2011-10-04 Kyocera Mita Corporation Image processing apparatus and computer-readable recording medium which records image processing program
US8045801B2 (en) 2005-09-02 2011-10-25 Canon Kabushiki Kaisha Image processing apparatus and method
US8077971B2 (en) 2007-06-29 2011-12-13 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer program
US8077986B2 (en) 2006-06-14 2011-12-13 Canon Kabushiki Kaisha Information processing apparatus, method of controlling same and computer program
US8229238B2 (en) 2008-02-19 2012-07-24 Canon Kabushiki Kaisha Image encoding apparatus, image processing apparatus and control method thereof
US8331671B2 (en) 2008-05-02 2012-12-11 Canon Kabushiki Kaisha Image processing apparatus and image encoding method related to non-photo image regions
US8452112B2 (en) 2008-02-19 2013-05-28 Canon Kabushiki Kaisha Image encoding apparatus and method of controlling the same
JP2013125994A (en) * 2011-12-13 2013-06-24 Canon Inc Image compression device, image compression method, and computer program
US8503773B2 (en) 2007-06-29 2013-08-06 Canon Kabushiki Kaisha Glyph selection and electronic document generation
US8532385B2 (en) 2009-06-24 2013-09-10 Canon Kabushiki Kaisha Image processing apparatus and image processing method
JP2015029242A (en) * 2013-06-28 2015-02-12 京セラドキュメントソリューションズ株式会社 Image processing system
US9807280B2 (en) 2013-12-19 2017-10-31 Canon Kabushiki Kaisha Image processing apparatus, method, and storage medium
US10931852B2 (en) 2018-09-26 2021-02-23 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7386168B2 (en) 2003-02-24 2008-06-10 Canon Kabushiki Kaisha Image processing apparatus
JP2006222940A (en) * 2005-01-14 2006-08-24 Ricoh Co Ltd Image processing apparatus
US7848572B2 (en) 2005-04-22 2010-12-07 Canon Kabushiki Kaisha Image processing apparatus, image processing method, computer program
US7420150B2 (en) 2005-07-12 2008-09-02 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer program
US8045801B2 (en) 2005-09-02 2011-10-25 Canon Kabushiki Kaisha Image processing apparatus and method
US8077986B2 (en) 2006-06-14 2011-12-13 Canon Kabushiki Kaisha Information processing apparatus, method of controlling same and computer program
US8014620B2 (en) 2006-08-24 2011-09-06 Fuji Xerox Co., Ltd. Image processing system, image compression system, image editing system, computer readable medium, computer data signal and image processing apparatus
US8031934B2 (en) 2007-03-19 2011-10-04 Kyocera Mita Corporation Image processing apparatus and computer-readable recording medium which records image processing program
US8995780B2 (en) 2007-05-04 2015-03-31 I.R.I.S. Compression of digital images of scanned documents
US8666185B2 (en) 2007-05-04 2014-03-04 I.R.I.S. Compression of digital images of scanned documents
JP2010527190A (en) * 2007-05-04 2010-08-05 イー・エル・イー・エス・ソシエテ・アノニム Compress digital images containing scanned documents
US8532388B2 (en) 2007-06-29 2013-09-10 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer program
US8503773B2 (en) 2007-06-29 2013-08-06 Canon Kabushiki Kaisha Glyph selection and electronic document generation
EP2400454A1 (en) 2007-06-29 2011-12-28 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer program
US8077971B2 (en) 2007-06-29 2011-12-13 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer program
JP2009081791A (en) * 2007-09-27 2009-04-16 Fuji Xerox Co Ltd Image processing apparatus, and image processing program
US8396294B2 (en) 2007-12-12 2013-03-12 Canon Kabushiki Kaisha Image processing device, image processing method, and program and recording medium thereof
EP2071493A2 (en) 2007-12-12 2009-06-17 Canon Kabushiki Kaisha Image processing device, image processing method, and program and recording medium thereof
US8229238B2 (en) 2008-02-19 2012-07-24 Canon Kabushiki Kaisha Image encoding apparatus, image processing apparatus and control method thereof
US8452112B2 (en) 2008-02-19 2013-05-28 Canon Kabushiki Kaisha Image encoding apparatus and method of controlling the same
US8331671B2 (en) 2008-05-02 2012-12-11 Canon Kabushiki Kaisha Image processing apparatus and image encoding method related to non-photo image regions
JP2010147935A (en) * 2008-12-19 2010-07-01 Canon Inc Image processing apparatus and image processing method
US8320668B2 (en) 2008-12-19 2012-11-27 Canon Kabushiki Kaisha Image processing apparatus and image processing method
US8532385B2 (en) 2009-06-24 2013-09-10 Canon Kabushiki Kaisha Image processing apparatus and image processing method
JP2013125994A (en) * 2011-12-13 2013-06-24 Canon Inc Image compression device, image compression method, and computer program
JP2015029242A (en) * 2013-06-28 2015-02-12 京セラドキュメントソリューションズ株式会社 Image processing system
US9807280B2 (en) 2013-12-19 2017-10-31 Canon Kabushiki Kaisha Image processing apparatus, method, and storage medium
US10455117B2 (en) 2013-12-19 2019-10-22 Canon Kabushiki Kaisha Image processing apparatus, method, and storage medium
US10931852B2 (en) 2018-09-26 2021-02-23 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region

Also Published As

Publication number Publication date
JP4366003B2 (en) 2009-11-18

Similar Documents

Publication Publication Date Title
JP2002077633A (en) Apparatus and method of image processing
US7133565B2 (en) Image processing apparatus and method
US7376267B2 (en) Image processing apparatus, image processing method, and program and storage medium therefor
JP4047192B2 (en) Image compression apparatus and method, image expansion apparatus and method, and program
JP2002084420A (en) Image processing unit, image processing method and recording medium with stored image processing program
JP2001169080A (en) Color picture processing method, color picture processor and recording medium for the same
JP2002165105A (en) Image processing device, its method, and recording medium
JP3715905B2 (en) Image processing apparatus, image processing method, program, and storage medium
JP2008099149A (en) Image processor, image processing method and image processing program
JP4582204B2 (en) Image processing apparatus, image conversion method, and computer program
JP2003018412A (en) Image compressor, and image compression method, program code and storage medium
JP2003244447A (en) Image processor and image processing method
JP4582200B2 (en) Image processing apparatus, image conversion method, and computer program
JP2003338935A (en) Image processing equipment and method therefor
JP4441300B2 (en) Image processing apparatus, image processing method, image processing program, and recording medium storing the program
JP2002369011A (en) Image processing apparatus, image processing method and image processing program
JP3108133B2 (en) Adaptive coding of color document images
US7508987B2 (en) Method, apparatus, system, and program for image processing capable of recognizing, reproducing, and enhancing an image, and a medium storing the program
JP2002077631A (en) Image compression apparatus, image expansion apparatus, its method and recording medium
JP2003338934A (en) Image processing equipment and method therefor
JP3870147B2 (en) Image compression apparatus, image expansion apparatus, method thereof, and program
JP3817506B2 (en) Image compression apparatus, image expansion apparatus, method thereof, and program
JP4228905B2 (en) Image processing apparatus and program
JP2007335983A (en) Image processor
JP2003189090A (en) Image processing apparatus and method, image processing program and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070717

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070717

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080820

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090817

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090824

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130828

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees