[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4383157B2 - Image processing apparatus, program, and storage medium - Google Patents

Image processing apparatus, program, and storage medium Download PDF

Info

Publication number
JP4383157B2
JP4383157B2 JP2003427017A JP2003427017A JP4383157B2 JP 4383157 B2 JP4383157 B2 JP 4383157B2 JP 2003427017 A JP2003427017 A JP 2003427017A JP 2003427017 A JP2003427017 A JP 2003427017A JP 4383157 B2 JP4383157 B2 JP 4383157B2
Authority
JP
Japan
Prior art keywords
image
character
resolution
color
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003427017A
Other languages
Japanese (ja)
Other versions
JP2004362541A (en
Inventor
利夫 宮澤
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003427017A priority Critical patent/JP4383157B2/en
Publication of JP2004362541A publication Critical patent/JP2004362541A/en
Application granted granted Critical
Publication of JP4383157B2 publication Critical patent/JP4383157B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)

Description

この発明は、画像処理装置、プログラム及び記憶媒体に関する。   The present invention relates to an image processing apparatus, a program, and a storage medium.

特許文献1には、画像の文字部分を除去し、周辺の色で埋めた背景画像を作成する技術が開示されている。   Patent Document 1 discloses a technique for removing a character portion of an image and creating a background image filled with surrounding colors.

特許文献2には、カラー画像から文字情報を抽出、符号化する第1の手段と、画像データの解像度を下げて符号化する第2の手段を備え、各々のデータを合成する符号化技術が提案されている。   Patent Document 2 includes an encoding technique that includes first means for extracting and encoding character information from a color image, and second means for encoding at a reduced resolution of image data, and synthesizes the respective data. Proposed.

特許文献3には、画像データから抽出したテキストデータを検索情報に登録でき、画像データは低解像度で保管する技術について提案されている。   Japanese Patent Application Laid-Open No. H10-228667 proposes a technique for registering text data extracted from image data as search information and storing the image data at a low resolution.

特許文献4には、自然画像と文字が混在するカラー文書画像を文字地肌ブロックと、画像データブロックに分け、各領域に適した符号化を行ない、絵柄領域の解像度は低く設定する技術が提案されている。   Patent Document 4 proposes a technique for dividing a color document image in which a natural image and characters are mixed into a character background block and an image data block, performing encoding suitable for each region, and setting the resolution of the pattern region low. ing.

特許第2611012号公報Japanese Patent No. 2611012 特開平8−186711号公報JP-A-8-186711 特開2001−297104公報JP 2001-297104 A 特許第3108133号公報Japanese Patent No. 3108133

文字画像を含む画像の画像データについては、文字画像を分離し、分離後の文字画像、背景画像のそれぞれに適した画像処理、圧縮処理方式で処理を行った後、文字画像を上から重ね合わせることが可能な、マルチレイア機能を有するファイル形式により保存することで、文字画像の視認性、背景画像の視認性を向上させることが可能となる。   For image data of an image including a character image, the character image is separated, processed by image processing and compression processing suitable for the separated character image and background image, and then the character image is superimposed from above. It is possible to improve the visibility of the character image and the visibility of the background image by saving in a file format having a multi-layer function.

これに対し、特許文献1に開示の技術では、画像の文字部分を除去し、周辺の色で埋めた背景画像を作成する技術が開示されている。   On the other hand, the technique disclosed in Patent Document 1 discloses a technique for removing a character portion of an image and creating a background image filled with surrounding colors.

しかしながら、特許文献1に開示の技術では、画像の文字部分を除去して周辺の色で埋める処理を行なうので、データ量を削減し、高速な処理を可能とすることができないという不具合がある。   However, the technique disclosed in Patent Document 1 has a problem in that it cannot reduce the amount of data and enable high-speed processing because the character portion of the image is removed and embedded with surrounding colors.

本発明の目的は、背景画像に文字画像を重ねて表示するのに際して、データ量を削減し、高速な処理を可能とすることである。   An object of the present invention is to reduce the amount of data and enable high-speed processing when displaying a character image superimposed on a background image.

請求項1に記載の発明は、画像データから画像の文字部分を抽出する抽出手段と、この抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に1又は複数のファイルとして保存するファイル作成手段と、を備えている画像処理装置である。   According to the first aspect of the present invention, an extracting means for extracting a character part of an image from image data, a character image that is the extracted image, and a region in which the character part of the extracted image is extracted are filled with a predetermined image. An image processing apparatus comprising: a file creation unit that separately saves a background image as it is as one or a plurality of files.

請求項2に記載の発明は、請求項1に記載の画像処理装置において、前記抽出手段は、前記画像データがカラー画像である場合に所定のサンプリング間隔で前記抽出を行う。   According to a second aspect of the present invention, in the image processing apparatus according to the first aspect, the extraction unit performs the extraction at a predetermined sampling interval when the image data is a color image.

請求項3に記載の発明は、請求項1又は2に記載の画像処理装置において、前記ファイル作成手段は、前記画像データがカラー画像である場合に前記文字画像を1又は複数枚の二値画像として前記ファイルに保存する。   According to a third aspect of the present invention, in the image processing apparatus according to the first or second aspect, the file creation unit is configured to convert the character image into one or a plurality of binary images when the image data is a color image. To the file.

請求項4に記載の発明は、請求項3に記載の画像処理装置において、前記抽出手段は、前記画像データを二値化処理してから文字部分を抽出し、該文字部分に対応するカラー画像の色を抽出して、文字色を特定する。   According to a fourth aspect of the present invention, in the image processing apparatus according to the third aspect, the extracting means extracts the character part after binarizing the image data, and a color image corresponding to the character part The character color is specified by extracting the color.

請求項5に記載の発明は、請求項1〜4のいずれかの一に記載の画像処理装置において、前記ファイル作成手段は、前記画像データがカラー画像である場合に前記文字画像を減色したカラー画像として前記文字画像を前記ファイルに保存する。   According to a fifth aspect of the present invention, in the image processing device according to any one of the first to fourth aspects, the file creation means is a color obtained by reducing the color of the character image when the image data is a color image. The character image is stored in the file as an image.

請求項6に記載の発明は、請求項1〜5のいずれかの一に記載の画像処理装置において、前記ファイル作成手段は、前記抽出した文字画像を可逆圧縮で、前記抽出後の背景画像は非可逆圧縮で、それぞれ圧縮符号化した上で前記1又は複数のファイルとして保存する。   According to a sixth aspect of the present invention, in the image processing apparatus according to any one of the first to fifth aspects, the file creation unit performs reversible compression on the extracted character image, and the background image after the extraction is In lossy compression, each is compressed and encoded and then stored as the one or more files.

請求項7に記載の発明は、請求項6に記載の画像処理装置において、前記ファイル作成手段は、前記非可逆圧縮の前に前記抽出後の背景画像を平滑化する。   According to a seventh aspect of the present invention, in the image processing apparatus according to the sixth aspect, the file creation means smoothes the extracted background image before the lossy compression.

請求項8に記載の発明は、請求項6又は7に記載の画像処理装置において、前記ファイル作成手段は、前記抽出した文字画像をOCR処理して、このOCRの結果を透明色のテキストのテキストデータとしたもの、前記抽出した文字画像、及び前記抽出後の背景画像をそれぞれレイヤとするレイヤ管理されたファイルとして前記ファイルの保存を行い、前記テキストデータのレイヤは前記文字画像のレイヤより上位のレイヤとする。   According to an eighth aspect of the present invention, in the image processing apparatus according to the sixth or seventh aspect, the file creation means performs an OCR process on the extracted character image, and the result of the OCR is converted into a text of transparent text. The file is saved as a layer-managed file with the data, the extracted character image, and the extracted background image as layers, and the text data layer is higher than the character image layer. A layer.

請求項9に記載の発明は、画像データから画像の文字部分を抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に保存している1又は複数のファイルを対象として、前記背景画像の前記文字部分を抽出した領域に前記文字画像を不透明色で重ねた画像を作成する画像作成手段を備えている、画像処理装置である。   According to a ninth aspect of the present invention, there is provided a character image that is an image obtained by extracting a character portion of an image from image data and a background image that is not filled with a predetermined image in a region where the character portion of the extracted image is extracted. Image processing means comprising image creating means for creating an image in which the character image is superimposed with an opaque color on an area where the character portion of the background image is extracted for one or a plurality of files stored separately Device.

請求項10に記載の発明は、画像データから画像の文字部分を抽出する抽出処理と、この抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に1又は複数のファイルとして保存するファイル作成処理と、をコンピュータに実行させるコンピュータに読み取り可能なプログラムである。   According to the tenth aspect of the present invention, an extraction process for extracting a character portion of an image from image data, and a character image that is the extracted image and a region in which the character portion of the extracted image is extracted are filled with a predetermined image. This is a computer-readable program that causes a computer to execute a file creation process for separately storing a background image as it is as one or more files.

請求項11に記載の発明は、画像データから画像の文字部分を抽出した画像である文字画像と前記抽出後の画像の文字部分を抽出した領域に所定の画像で穴埋めしないままの背景画像とを別個に保存している1又は複数のファイルを対象として、前記背景画像の前記文字部分を抽出した領域に前記文字画像を不透明色で重ねた画像を作成する画像作成処理を、コンピュータに実行させるコンピュータに読み取り可能なプログラムである。   According to the eleventh aspect of the present invention, there is provided a character image that is an image obtained by extracting a character portion of an image from image data, and a background image that is not filled with a predetermined image in a region where the character portion of the extracted image is extracted. A computer that causes a computer to execute an image creation process for creating an image in which the character image is superimposed with an opaque color on an area where the character portion of the background image is extracted for one or a plurality of files stored separately Is a readable program.

請求項12に記載の発明は、請求項10又は11に記載のプログラムを記憶している、記憶媒体である。   The invention described in claim 12 is a storage medium in which the program according to claim 10 or 11 is stored.

請求項1,10に記載の発明は、背景画像は文字画像を抽出した後の領域について、穴埋めを行わないので、背景画像の文字部分を抽出した領域に文字画像を不透明色で重ねた画像を作成するようにすれば、文字画像、背景画像からなる前述のファイルはデータ量を少なくすることができ、なおかつ、文字の可読性を損なわない画像を高速に作成することが可能となる。また、文字画像と背景画像とを別個に1又は複数のファイルで保存するので、背景画像は、たとえ文字画像も含めて画像全体を平滑化処理したとしても、最終的にユーザに提供される画像には平滑化処理の影響を何ら及ぼさないようにすることができる。   According to the first and tenth aspects of the present invention, since the background image does not fill the region after the character image is extracted, an image obtained by superimposing the character image on the region where the character portion of the background image is extracted with an opaque color is used. If created, the above-mentioned file consisting of a character image and a background image can reduce the amount of data, and at the same time, an image that does not impair the readability of characters can be created at high speed. In addition, since the character image and the background image are stored separately as one or a plurality of files, the background image is finally provided to the user even if the entire image including the character image is smoothed. Can be prevented from having any influence of the smoothing process.

請求項2に記載の発明は、請求項1に記載の発明において、処理に必要な記憶容量を節減し、高速な処理が可能となる。   The invention according to claim 2 is the invention according to claim 1, wherein the storage capacity required for processing is reduced, and high-speed processing is possible.

請求項3に記載の発明は、請求項1又は2に記載の発明において、文字部の色は、一般に1色又はそれほど数が多くない色数で書かれていることが普通であるので、文字部の色をクラスタリング処理などして特定し、クラスタリング結果に応じた色の1又は複数枚の二値画像で文字画像を作成することができる。   The invention according to claim 3 is that, in the invention according to claim 1 or 2, it is common that the color of the character portion is generally written in one color or the number of colors not so many. The color of the part is specified by a clustering process or the like, and a character image can be created with one or a plurality of binary images of colors according to the clustering result.

請求項4に記載の発明は、請求項3に記載の発明において、クラスタリング結果に応じた色の1又は複数枚の二値画像で文字画像を作成することができる。   According to a fourth aspect of the present invention, in the third aspect of the present invention, a character image can be created with one or a plurality of binary images of colors according to the clustering result.

請求項5に記載の発明は、請求項1〜4のいずれかの一に記載の発明において、文字部分に用いられている色数は、通常それほど多くないことから、1枚の4ビットや8ビットに減色した画像、又は複数枚減色した画像を保持するだけでも充分であり、ユーザにとってもコントラストが高く可視性が高くなる効果がある。   In the invention according to claim 5, in the invention according to any one of claims 1 to 4, since the number of colors used for the character portion is usually not so much, one 4-bit or 8 It is sufficient to hold only a bit-reduced image or a plurality of color-reduced images, and this has the effect of increasing contrast and visibility for the user.

請求項6に記載の発明は、請求項1〜5のいずれかの一に記載の発明において、文字の二値画像などは文字画像に適した圧縮形式で、背景画像は背景に適した圧縮形式で圧縮符号化することができ、ファイルサイズも小さくすることができる。また、文字画像を可逆圧縮方式で圧縮することで、将来OCRなどの処理で文字コード化したいときにも、認識率を低下させることなくOCR処理が可能となる。   The invention according to claim 6 is the invention according to any one of claims 1 to 5, wherein a binary image of characters is a compression format suitable for a character image, and a background image is a compression format suitable for a background. Can be compressed and encoded, and the file size can be reduced. In addition, by compressing a character image using a reversible compression method, it is possible to perform OCR processing without lowering the recognition rate when it is desired to perform character encoding in the future by processing such as OCR.

請求項7に記載の発明は、請求項6に記載の発明において、最終的にユーザに提供される画像には平滑化処理の影響を何ら及ぼさないようにすることができる。   According to the seventh aspect of the invention, in the sixth aspect of the invention, the image finally provided to the user can be prevented from having any influence of the smoothing process.

請求項8に記載の発明は、請求項6又は7に記載の発明において、テキスト検索が可能なマルチレイア機能をもつファイルを作成できる。   The invention according to claim 8 can create a file having a multi-layer function capable of text search in the invention according to claim 6 or 7.

請求項9,11に記載の発明は、背景画像は文字画像を抽出した後の領域について、穴埋めを行わずに、背景画像の文字部分を抽出した領域に文字画像を不透明色で重ねた画像を作成することができるので、文字画像、背景画像からなる前述のファイルはデータ量を少なくすることができ、なおかつ、文字の可読性を損なわない画像を高速に作成することが可能となる。   According to the ninth and eleventh aspects of the present invention, the background image is an image obtained by superimposing the character image on the region where the character portion of the background image is extracted without filling in the region after the character image is extracted. Since it can be created, the above-mentioned file consisting of a character image and a background image can reduce the amount of data, and an image that does not impair the readability of characters can be created at high speed.

本発明の一実施の形態について説明する。   An embodiment of the present invention will be described.

図1は、本実施の形態である画像処理装置1の電気的な接続を示すブロック図である。図1に示すように、画像処理装置1は、いずれもPCなどのコンピュータであり、各種演算を行ない、画像処理装置1の各部を集中的に制御するCPU11と、各種のROM、RAMからなるメモリ12とが、バス13で接続されている。   FIG. 1 is a block diagram showing an electrical connection of an image processing apparatus 1 according to the present embodiment. As shown in FIG. 1, the image processing apparatus 1 is a computer such as a PC, which performs various calculations and centrally controls each part of the image processing apparatus 1, and a memory composed of various ROMs and RAMs. 12 are connected by a bus 13.

バス13には、所定のインターフェイスを介して、ハードディスクなどの磁気記憶装置14と、キーボード、マウスなどの入力装置15と、表示装置16と、光ディスクなどの記憶媒体17を読み取る記憶媒体読取装置18と、画像を読み取る画像読取装置21とが接続され、また、ネットワーク4と通信を行なう所定の通信インターフェイス19が接続されている。なお、記憶媒体17としては、CD,DVDなどの光ディスク、光磁気ディスク、フレキシブルディスクなどの各種メディアを用いることができる。また、記憶媒体読取装置18は、具体的には記憶媒体17の種類に応じて光ディスク装置、光磁気ディスク装置、フレキシブルディスク装置などが用いられる。   The bus 13 is connected to a magnetic storage device 14 such as a hard disk, an input device 15 such as a keyboard and a mouse, a display device 16 and a storage medium reader 18 that reads a storage medium 17 such as an optical disk via a predetermined interface. An image reading device 21 that reads an image is connected, and a predetermined communication interface 19 that communicates with the network 4 is connected. As the storage medium 17, various media such as an optical disk such as a CD and a DVD, a magneto-optical disk, and a flexible disk can be used. As the storage medium reading device 18, specifically, an optical disk device, a magneto-optical disk device, a flexible disk device, or the like is used according to the type of the storage medium 17.

画像処理装置1は、この発明の記憶媒体を実施する記憶媒体17から、この発明のプログラムを実施する画像処理プログラム20を読み取って、磁気記憶装置14にインストールする。これらのプログラムはインターネットなどのネットワーク4等を介してダウンロードしてインストールするようにしてもよい。このインストールにより、画像処理装置1は、それぞれ後述する所定の処理の実行が可能な状態となる。なお、画像処理プログラム20は、所定のOS上で動作するものであってもよい。   The image processing apparatus 1 reads the image processing program 20 for executing the program of the present invention from the storage medium 17 for executing the storage medium of the present invention, and installs it in the magnetic storage device 14. These programs may be downloaded and installed via a network 4 such as the Internet. As a result of this installation, the image processing apparatus 1 is in a state in which predetermined processing described later can be executed. Note that the image processing program 20 may operate on a predetermined OS.

図2は、画像処理装置1が画像処理プログラム20に基づいて実現する機能の機能ブロック図であり、図3は、画像処理装置1が実行する処理のフローチャートである。図5は、画像処理装置1が実行する処理の説明図である。   FIG. 2 is a functional block diagram of functions realized by the image processing apparatus 1 based on the image processing program 20, and FIG. 3 is a flowchart of processing executed by the image processing apparatus 1. FIG. 5 is an explanatory diagram of processing executed by the image processing apparatus 1.

図2、図3、図5に示すように、まず、原稿の画像を例えば600dpiのカラー画像で画像読取装置21により読み取る(ステップS1)。そして、この読み取った画像データ(図5(a)のオリジナル画像41)について以下のような2系統の処理を行なう。   As shown in FIGS. 2, 3, and 5, first, the image of the original is read by the image reading device 21 as a color image of 600 dpi, for example (step S1). The read image data (original image 41 in FIG. 5A) is subjected to the following two systems of processing.

一つ目の処理は、ステップS1で読み取った画像データを対象に、解像度変換・圧縮部31で解像度変換を行なってデータ量を低減し(例えば300dpiのカラー画像に変換する)(ステップS2)、このカラー画像からそれぞれの文字色を減色部33で特定して、文字色ごとの二値化を二値化部34で行なって(ステップS3)、文字抽出部32により少なくとも文字領域(画素又はエリア)を抽出して(抽出手段、抽出処理)(ステップS4)、二値画像である文字画像42を作成し(図5(b))(ステップS5)、これを解像度変換・圧縮部31で、MMRなどの可逆圧縮方式で圧縮符号化して(ステップS6)、さらにデータ量を削減するものである。なお、ここでは、文字に特定しているが、文字以外に罫線などの情報を文字とともに抽出しても構わない。また、文字や罫線の特徴である、エッジなどに注目し、文字である可能性の高い領域を文字領域として抽出してもよい。必ずしも画像から文字領域を正確に抽出することが目的ではないからである。   In the first process, the image data read in step S1 is subjected to resolution conversion by the resolution conversion / compression unit 31 to reduce the data amount (for example, convert to a 300 dpi color image) (step S2). Each character color is specified from the color image by the color reduction unit 33, and binarization for each character color is performed by the binarization unit 34 (step S3), and the character extraction unit 32 performs at least a character region (pixel or area). ) (Extraction means, extraction process) (step S4), a character image 42 which is a binary image is created (FIG. 5B) (step S5), and this is converted by the resolution conversion / compression unit 31. Compression encoding is performed by a lossless compression method such as MMR (step S6), and the data amount is further reduced. Here, although the character is specified, information such as a ruled line may be extracted together with the character in addition to the character. Alternatively, an area that is highly likely to be a character may be extracted as a character area by paying attention to an edge or the like that is a feature of the character or ruled line. This is because the purpose is not necessarily to extract the character region accurately from the image.

二つ目の処理は、ステップS1で読み取った画像データを対象に(文字画像も含む)、解像度変換・圧縮部31でJPEGなどの非可逆圧縮方式で解像度変換を行なって、一つ目の処理よりさらにデータ量を低減する(例えば150dpiのカラー画像に変換する)(ステップS7)。この場合の処理対象となるオリジナル画像41は、ステップS3で文字画像42を抽出後に、その文字抽出後の領域に穴埋め(所定の画素値を与えるなど)は行わないままで用いる。これを背景画像43とし(図5(b))(ステップS8)、これを解像度変換・圧縮部31で圧縮符号化して(ステップS9)、さらにデータ量を削減するものである。   In the second process, the resolution conversion / compression unit 31 performs resolution conversion by an irreversible compression method such as JPEG for the image data read in step S1 (including a character image). The data amount is further reduced (for example, converted to a color image of 150 dpi) (step S7). The original image 41 to be processed in this case is used without extracting a character image 42 in step S3 and filling the region after the character extraction (giving a predetermined pixel value or the like). This is used as the background image 43 (FIG. 5B) (step S8), and this is compression-encoded by the resolution converting / compressing unit 31 (step S9) to further reduce the data amount.

このようにそれぞれ作成された文字画像42と背景画像43とは、別個に1つ又は複数のファイル(PDFファイル)として保存される(ファイル作成手段、ファイル作成処理)(ステップS10)。具体的には、例えば、マルチレイヤ機能を備えたPDFやJPEG2000などの単一のファイルとして保存することが考えられる。この場合、レイヤ管理されたファイルの第1層(下位層)には背景画像、第2層(上位層)には文字画像を配置する。   The character image 42 and the background image 43 created in this way are saved separately as one or a plurality of files (PDF files) (file creation means, file creation processing) (step S10). Specifically, for example, it is conceivable to save as a single file such as PDF or JPEG2000 having a multilayer function. In this case, a background image is arranged in the first layer (lower layer) of the layer-managed file, and a character image is arranged in the second layer (upper layer).

このようにして作成したファイルのデータを表示装置16に表示等する場合の処理について、図2の機能ブロック図、図4のフローチャート、及び、図5の説明図を参照して説明する。   Processing for displaying the file data thus created on the display device 16 will be described with reference to the functional block diagram of FIG. 2, the flowchart of FIG. 4, and the explanatory diagram of FIG.

すなわち、画像処理装置1で、ステップS10で作成したファイルを表示装置16に表示等する場合は(ステップS11のY)、文字画像42の解像度変換を解像度変換・圧縮部31で行って、文字画像42を解像度変換された文字画像44とし、文字画像44と背景画像43との解像度をそろえる(ステップS12)。そして、背景画像43の画像上の文字位置に対応する文字の文字画像44を不透明色として重ね合わせて上書きする(図5(d)の画像45)(ステップS13)。この重ね合わせた画像を表示装置16に表示(あるいは印刷、外部に送信など)すれば、文字画像44と背景画像43とが重なった画像を1枚の画像のごとく見ることができる。   That is, when the image processing device 1 displays the file created in step S10 on the display device 16 (Y in step S11), the resolution conversion of the character image 42 is performed by the resolution conversion / compression unit 31, and the character image is displayed. 42 is a resolution-converted character image 44, and the resolutions of the character image 44 and the background image 43 are made uniform (step S12). Then, the character image 44 of the character corresponding to the character position on the image of the background image 43 is overwritten by being overlaid with an opaque color (image 45 in FIG. 5D) (step S13). If this superimposed image is displayed on the display device 16 (or printed, transmitted to the outside, etc.), an image in which the character image 44 and the background image 43 are overlapped can be viewed as a single image.

前述のように、背景画像43は文字画像42を抽出した後の領域について、穴埋めを行わないので、文字画像42、背景画像43からなる前述のファイルはデータ量を少なくすることができ、なおかつ、文字の可読性を損なわない画像を高速に作成することが可能となる。   As described above, since the background image 43 does not perform hole filling in the area after the character image 42 is extracted, the amount of data of the file including the character image 42 and the background image 43 can be reduced, and An image that does not impair the readability of characters can be created at high speed.

なお、ステップS3においては、オリジナル画像41から所定のサンプリング間隔で画像を抽出することで、処理に必要な記憶容量を節減し、高速な処理が可能となる。すなわち、前述の特許文献1に開示の技術などでは、文字部を抽出し、その背景の色を求めるために、少なくとも文字の背景を計算するためのメモリが必要になるが、本実施の形態ではこれが不要となる。つまり、本実施の形態では、文字画像44は背景画像43に不透明色で重ねて表示されるので、オリジナル画像41の背景の色を特定し、オリジナル画像41から文字部分を消す必要はないので、所定の間隔で文字画像42の抽出処理を行い、背景の色の抽出処理が不要となり、そのための処理時間、それに要するメモリが不要となる。   In step S3, by extracting an image from the original image 41 at a predetermined sampling interval, it is possible to reduce the storage capacity necessary for processing and perform high-speed processing. That is, in the technique disclosed in Patent Document 1 described above, at least a memory for calculating the background of the character is required to extract the character portion and obtain the background color. This is unnecessary. In other words, in the present embodiment, the character image 44 is displayed so as to overlap with the background image 43 in an opaque color, so it is not necessary to specify the background color of the original image 41 and erase the character portion from the original image 41. The extraction process of the character image 42 is performed at a predetermined interval, the background color extraction process becomes unnecessary, and the processing time and the memory required for it are unnecessary.

前述のように、文字画像42として、1枚または複数枚の二値画像を作成する。これは、文字部の色は、一般に黒、赤、青など、1色又はそれほど数が多くない色数で書かれていることが普通であるので、文字部の色をクラスタリング処理などして特定し、クラスタリング結果に応じた色の複数枚の二値画像を作成するものである。   As described above, one or a plurality of binary images are created as the character image 42. This is because the color of the character part is usually written in one color such as black, red, blue, etc. or the number of colors that is not so many, so the color of the character part is specified by clustering processing etc. Then, a plurality of binary images having colors according to the clustering result are created.

このクラスタリングの手法の例を示す。すなわち、ステップS3,S4においては、文字画像を先に二値化処理し、その二値画像から文字部を抽出するようにしている。ここでは、抽出された文字部に対応するカラーオリジナル画像の画素値(RGB値)を参照し、RGBの3次元空間に度数ヒストグラムを作成する。次に、その度数ヒストグラムを幾つかのクラスに分割するためのクラスタリングを行う。このクラスタリングの方法は、特別な方法を用いることはなく、一般的に知られているK−ミーン法などを用いればよい。   An example of this clustering technique is shown. That is, in steps S3 and S4, the character image is binarized first, and the character portion is extracted from the binary image. Here, a frequency histogram is created in the RGB three-dimensional space with reference to the pixel value (RGB value) of the color original image corresponding to the extracted character portion. Next, clustering is performed to divide the frequency histogram into several classes. As the clustering method, a special method is not used, and a generally known K-Mean method or the like may be used.

また、文字画像42として、1枚または複数枚の文字画像42を作成するに際しては、二値画像ではなく、カラーの多値画像を用いるようにしてもよい。文字部分に用いられている色数は、通常それほど多くないことから、一般のカラー原稿のように、16万色などは不要である。すなわち、1枚の4ビットや8ビットに減色した画像、又は複数枚減色した画像を保持するだけで充分であり、ユーザにとってもコントラストが高く可視性が高くなる効果がある。   Further, when creating one or a plurality of character images 42 as the character image 42, a color multi-value image may be used instead of a binary image. Since the number of colors used for the character portion is usually not so large, 160,000 colors or the like are unnecessary as in a general color original. In other words, it is sufficient to hold an image that has been reduced to 4 bits or 8 bits, or an image that has been reduced by a plurality of sheets, and this has the effect of increasing contrast and visibility for the user.

なお、前述の例で、抽出した文字画像42(ステップS5)を対象に文字認識(OCR)処理を行い、その文字認識結果を透明テキストのテキストデータとして、レイヤ管理されたファイルの最上位のレイヤ(第3層)に配置し、第1層(下位層)には背景画像、第2層(上位層)には文字画像を配置するようにしてもよい。これにより、テキスト検索が可能なマルチレイア機能をもつ電子ファイルを作成できる。   In the above example, the character recognition (OCR) process is performed on the extracted character image 42 (step S5), and the character recognition result is used as the text data of the transparent text, so that the uppermost layer of the layer-managed file is used. It may be arranged in (third layer), a background image in the first layer (lower layer), and a character image in the second layer (upper layer). Thereby, an electronic file having a multi-layer function capable of text search can be created.

また、文字画像42は二値化処理されているので(ステップS3)、背景画像43とのコントラストも高く、視認性が高くなっているが、背景画像43については、スキャン画像を印刷すると、通常はこれらのスキャナ機器の特性からモアレなどを生じる。これを解決する手段として、スキャンした画像に対して、平滑化処理を行うとモアレの発生を抑えることが出来ることも一般に知られている。   Further, since the character image 42 has been binarized (step S3), the contrast with the background image 43 is high and the visibility is high. Causes moiré due to the characteristics of these scanner devices. As means for solving this, it is generally known that the occurrence of moire can be suppressed by performing a smoothing process on a scanned image.

しかし、スキャンした画像全体に平滑化処理を行うと、文字にもボケが生じ、視認性が悪化する不具合がある。   However, when smoothing processing is performed on the entire scanned image, there is a problem in that characters are blurred and visibility is deteriorated.

そこで、文字画像42を抽出した後(ステップS4)の背景画像43の全体、または、背景画像43の中で文字画像42として認識されなかった領域に対して選択的に、平滑化処理、γ補正処理などの画像処理を行なえば、文字画像42以外の視認性も高めることが可能となる。   Accordingly, after the character image 42 is extracted (step S4), the entire background image 43 or a region not recognized as the character image 42 in the background image 43 is selectively smoothed and γ corrected. If image processing such as processing is performed, the visibility other than the character image 42 can be enhanced.

さらに、背景画像43は、一般には、文字以外の写真などの画像から構成されるため、文字のような高い解像度を必要としないこともあるので、解像度変換処理により、画像サイズを小さくしてもよい。   Furthermore, since the background image 43 is generally composed of an image such as a photograph other than characters, it may not require a high resolution like characters, so even if the image size is reduced by resolution conversion processing. Good.

本発明の一実施の形態である画像処理装置の電気的な接続のブロック図である。1 is a block diagram of electrical connection of an image processing apparatus according to an embodiment of the present invention. 画像処理装置の機能ブロック図である。It is a functional block diagram of an image processing apparatus. 画像処理装置が実行する処理を説明するフローチャートである。It is a flowchart explaining the process which an image processing apparatus performs. 画像処理装置が実行する処理を説明するフローチャートである。It is a flowchart explaining the process which an image processing apparatus performs. 画像処理装置が実行する処理を説明する説明図である。It is explanatory drawing explaining the process which an image processing apparatus performs.

符号の説明Explanation of symbols

1 画像処理装置
17 記憶媒体
20 プログラム
1 Image processing device 17 Storage medium 20 Program

Claims (10)

オリジナルの画像データの解像度を変換する第一の解像度変換手段と、
前記第一の解像度変換手段により解像度が変換された画像データから画像の文字部分を抽出する抽出手段と、
前記オリジナルの画像データの解像度を、前記第一の手段より低い解像度に変換する第二の解像度変換手段と、
前記抽出手段により抽出された文字部分の画像データを文字画像として、前記第二の解像度変換手段により解像度が変換された画像データを背景画像として、別個に1又は複数のファイルとして保存するファイル作成手段とを備え、
前記ファイル作成手段は、前記文字画像を可逆圧縮で、前記背景画像は非可逆圧縮で、それぞれ圧縮符号化した上で前記1又は複数のファイルとして保存すること、
を特徴とする画像処理装置。
A first resolution conversion means for converting the resolution of the original image data;
Extraction means for extracting the character portion of the image from the image data whose resolution is converted by the first resolution conversion means ;
Second resolution conversion means for converting the resolution of the original image data to a lower resolution than the first means;
File creation means for separately saving the image data of the character portion extracted by the extraction means as a character image and the image data whose resolution is converted by the second resolution conversion means as a background image, separately as one or a plurality of files It equipped with a door,
The file creation means, the lossy compression of the character image, the lossy compression of the background image, respectively, and compression-encoded, and then stored as the one or more files,
An image processing apparatus.
前記抽出手段は、前記画像データがカラー画像である場合に所定のサンプリング間隔で前記抽出を行う、請求項1に記載の画像処理装置。   The image processing apparatus according to claim 1, wherein the extraction unit performs the extraction at a predetermined sampling interval when the image data is a color image. 前記ファイル作成手段は、前記画像データがカラー画像である場合に前記文字画像を1又は複数枚の二値画像として前記ファイルに保存する、請求項1又は2に記載の画像処理装置。   The image processing apparatus according to claim 1, wherein the file creation unit stores the character image as one or a plurality of binary images in the file when the image data is a color image. 前記抽出手段は、前記画像データを二値化処理してから文字部分を抽出し、該文字部分に対応するカラー画像の色を抽出して、文字色を特定する、請求項3に記載の画像処理装置。   4. The image according to claim 3, wherein the extraction unit binarizes the image data, extracts a character part, extracts a color of a color image corresponding to the character part, and specifies a character color. 5. Processing equipment. 前記ファイル作成手段は、前記画像データがカラー画像である場合に前記文字画像を減色したカラー画像として前記文字画像を前記ファイルに保存する、請求項1〜4のいずれかの一に記載の画像処理装置。   The image processing according to any one of claims 1 to 4, wherein when the image data is a color image, the file creation unit stores the character image in the file as a color image obtained by reducing the color of the character image. apparatus. 前記ファイル作成手段は、前記非可逆圧縮の前に前記背景画像を平滑化する、請求項1〜4のいずれかの一に記載の画像処理装置。 The file creating unit, wherein the smoothing the pre-xenon scene image in front of the non-reversible compression, the image processing apparatus according to one of claim 1. 前記ファイル作成手段は、前記文字画像をOCR処理して、このOCRの結果を透明色のテキストのテキストデータとしたもの、前記文字画像、及び前記背景画像をそれぞれレイヤとするレイヤ管理されたファイルとして前記ファイルの保存を行い、前記テキストデータのレイヤは前記文字画像のレイヤより上位のレイヤとする、請求項1〜4のいずれかの一に記載の画像処理装置。 The file creating unit, before Kibun letter image by OCR processing, those with text data of the text in transparent color The results of this OCR, and pre Kibun shaped images, and pre-xenon scene image, respectively Layer and save the file as layer management file, the layer of the text data and the character image of a layer above the layer, the image processing apparatus according to one of any claims 1 to 4. オリジナルの画像データの解像度を変換する第一の解像度変換手順と、A first resolution conversion procedure for converting the resolution of the original image data;
前記第一の解像度変換手段により解像度が変換された画像データから画像の文字部分を抽出する抽出手順と、An extraction procedure for extracting the character portion of the image from the image data whose resolution has been converted by the first resolution conversion means;
前記オリジナルの画像データの解像度を、前記第一の手段より低い解像度に変換する第二の解像度変換手順と、A second resolution conversion procedure for converting the resolution of the original image data to a lower resolution than the first means;
前記抽出手順により抽出された文字部分の画像データを文字画像として、前記第二の解像度変換手順により解像度が変換された画像データを背景画像として、別個に1又は複数のファイルとして保存するファイル作成手順とを備え、A file creation procedure for storing the image data of the character part extracted by the extraction procedure as a character image and the image data whose resolution is converted by the second resolution conversion procedure as a background image and separately storing them as one or a plurality of files And
前記ファイル作成手順は、前記文字画像を可逆圧縮で、前記背景画像は非可逆圧縮で、それぞれ圧縮符号化した上で前記1又は複数のファイルとして保存すること、In the file creation procedure, the character image is reversibly compressed, the background image is lossy compressed, and is compressed and encoded, and then stored as the one or more files.
を特徴とする画像処理方法。An image processing method characterized by the above.
請求項8に記載の画像処理方法をコンピュータに実行させるためのプログラム。 A program for causing a computer to execute the image processing method according to claim 8 . 請求項9に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。 A computer-readable recording medium on which the program according to claim 9 is recorded.
JP2003427017A 2003-05-15 2003-12-24 Image processing apparatus, program, and storage medium Expired - Fee Related JP4383157B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003427017A JP4383157B2 (en) 2003-05-15 2003-12-24 Image processing apparatus, program, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003137327 2003-05-15
JP2003427017A JP4383157B2 (en) 2003-05-15 2003-12-24 Image processing apparatus, program, and storage medium

Publications (2)

Publication Number Publication Date
JP2004362541A JP2004362541A (en) 2004-12-24
JP4383157B2 true JP4383157B2 (en) 2009-12-16

Family

ID=34067268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003427017A Expired - Fee Related JP4383157B2 (en) 2003-05-15 2003-12-24 Image processing apparatus, program, and storage medium

Country Status (1)

Country Link
JP (1) JP4383157B2 (en)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4618676B2 (en) * 2005-04-28 2011-01-26 株式会社リコー Structured document code transfer method, image processing system, server device, program, and information recording medium
JP4810262B2 (en) * 2006-03-17 2011-11-09 株式会社リコー Image processing system
US8306336B2 (en) * 2006-05-17 2012-11-06 Qualcomm Incorporated Line or text-based image processing tools
JP2009294788A (en) * 2008-06-03 2009-12-17 Ricoh Co Ltd Information processor, information processing method, control program, and recording medium
JP5306060B2 (en) * 2009-06-01 2013-10-02 キヤノン株式会社 Image processing apparatus and image processing method
JP5491458B2 (en) * 2010-06-30 2014-05-14 株式会社東芝 Image forming apparatus and control method thereof
JP5853470B2 (en) 2011-07-29 2016-02-09 ブラザー工業株式会社 Image processing device, image processing program
JP5776419B2 (en) 2011-07-29 2015-09-09 ブラザー工業株式会社 Image processing device, image processing program
JP5796392B2 (en) 2011-07-29 2015-10-21 ブラザー工業株式会社 Image processing apparatus and computer program
JP5842441B2 (en) 2011-07-29 2016-01-13 ブラザー工業株式会社 Image processing apparatus and program
JP5874497B2 (en) 2012-03-30 2016-03-02 ブラザー工業株式会社 Image processing apparatus and image processing program
JP5939154B2 (en) 2012-12-27 2016-06-22 ブラザー工業株式会社 Image processing apparatus and computer program
JP6191505B2 (en) 2014-02-28 2017-09-06 ブラザー工業株式会社 Image processing apparatus and image processing program
CN106874937B (en) * 2017-01-18 2023-06-09 腾讯科技(上海)有限公司 Text image generation method, text image generation device and terminal
JP2019101904A (en) * 2017-12-06 2019-06-24 コニカミノルタ株式会社 Image processing apparatus, image processing method, and program

Also Published As

Publication number Publication date
JP2004362541A (en) 2004-12-24

Similar Documents

Publication Publication Date Title
JP4383157B2 (en) Image processing apparatus, program, and storage medium
JP5302768B2 (en) Image processing apparatus and image processing method
US8218887B2 (en) Enhanced method of multilayer compression of PDF (image) files using OCR systems
US7106884B2 (en) Digital watermark embedding apparatus for document, digital watermark extraction apparatus for document, and their control method
JP5132530B2 (en) Image coding apparatus, image processing apparatus, and control method thereof
US8244035B2 (en) Image processing apparatus and control method thereof
US8837770B2 (en) Non-transitory computer readable storage medium, marker creating apparatus, and marker creating method
US8218911B2 (en) Image processing apparatus and image processing method
EP1278368A2 (en) Document filing apparatus for storing information added to a document file
JP2611012B2 (en) Character separation encoding method
US8810877B2 (en) Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image
JP4441300B2 (en) Image processing apparatus, image processing method, image processing program, and recording medium storing the program
US8577132B2 (en) Electronic document generation system, electronic document generation method, and program
JP4135656B2 (en) Image region determination method, image processing apparatus, and program
JP2006197178A (en) Image processor, image processing method, program, and storage medium
JP4710672B2 (en) Character color discrimination device, character color discrimination method, and computer program
JP2005204206A (en) Image processing apparatus, image processing program, and storage medium
JP3910120B2 (en) Image processing apparatus, method, program for executing the method, and recording medium
JP4936524B2 (en) Image processing system and image processing method
JP2007019673A (en) Image processing apparatus, image compression method, image compression program, and data structure of compressed image
JP4383187B2 (en) Image processing apparatus, image processing program, and storage medium
JP2006222940A (en) Image processing apparatus
JP2006093880A (en) Image processing apparatus and control method thereof, computer program, and computer-readable storage medium
JP4237642B2 (en) Image processing apparatus, image processing program, and storage medium
JP4742632B2 (en) Image processing apparatus, image processing method, and program

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041013

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060809

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090915

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090918

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4383157

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131002

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees