[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR100242298B1 - Image processing method for converting gray-scale image of text document into binary image - Google Patents

Image processing method for converting gray-scale image of text document into binary image Download PDF

Info

Publication number
KR100242298B1
KR100242298B1 KR1019970043740A KR19970043740A KR100242298B1 KR 100242298 B1 KR100242298 B1 KR 100242298B1 KR 1019970043740 A KR1019970043740 A KR 1019970043740A KR 19970043740 A KR19970043740 A KR 19970043740A KR 100242298 B1 KR100242298 B1 KR 100242298B1
Authority
KR
South Korea
Prior art keywords
pixel
interest
value
image
binarizing
Prior art date
Application number
KR1019970043740A
Other languages
Korean (ko)
Other versions
KR19990020280A (en
Inventor
김행환
Original Assignee
윤종용
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자주식회사 filed Critical 윤종용
Priority to KR1019970043740A priority Critical patent/KR100242298B1/en
Publication of KR19990020280A publication Critical patent/KR19990020280A/en
Application granted granted Critical
Publication of KR100242298B1 publication Critical patent/KR100242298B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

가. 청구범위에 기재된 발명이 속한 기술분야end. The technical field to which the invention described in the claims belongs

문자 문서를 스캔하여 얻어진 다치 계조의 화상데이터를 이치화하는 방법에 관한 것이다.A method of binarizing image data of multi-level gradations obtained by scanning a text document.

나. 발명이 해결하고자 하는 기술적 과제I. The technical problem to be solved by the invention

문자의 경계 부분에 대해 화질을 향상시킬 수 있는 문자 문서화상의 이치화방법을 제공한다.Provides a binarization method of a text document image that can improve image quality of a text boundary.

다. 발명의 해결방법의 요지All. Summary of Solution of the Invention

주목화소가 문자의 경계부분인 경우 주목화소를 중심으로 에지 방향에 있는 인접 화소들의 평균값과 주목화소값을 비교하고, 비교 결과에 따라 주목화소를 이치화한다.If the pixel of interest is the boundary portion of the character, the mean value of the pixels of interest is compared with the average value of adjacent pixels in the edge direction around the pixel of interest, and the pixel of interest is binarized according to the comparison result.

라. 발명의 중요한 용도la. Important uses of the invention

문자 문서화상을 이치화하는데 이용한다.Used to binarize text document images.

Description

문자 문서의 화상데이터 이치화방법Image data binarization method of text document

본 발명은 문서를 스캔(scan)하여 얻어진 화상데이터를 이치화하는 방법에 관한 것으로, 특히 문자 문서를 스캔하여 얻어진 다치 계조(gray-scale)를 가지는 화상데이터를 이치(binary) 화상데이터로 이치화하는 방법에 관한 것이다.The present invention relates to a method for binarizing image data obtained by scanning a document, and in particular, a method for binarizing image data having multi-value gray-scale obtained by scanning a text document into binary image data. It is about.

통상적으로 팩시밀리(facsimile), 스캐너(scanner), 디지털 복사기등에 채용되는 화상입력장치는 문서를 스캔하여 얻어진 아나로그 화상신호를 디지털 화상데이터로 변환한후 처리한다. 이때 아나로그 화상신호는 화소(pixel)마다 문서 화상에 대응하는 계조를 가지는 디지털 화상데이터로 변환되는데, 계조를 가지므로 데이터량이 아주 많다. 예를들어 256단계의 계조를 가지는 경우 각 화소는 8비트로 표현된다. 이에따라 통상적으로 스캔에 따른 화상데이터를 이치화하므로써 데이터량을 대폭적으로 줄인 다음에 저장 또는 송신하거나 인쇄 출력한다. 상기 이치화는 계조를 가지는 각 화소를 ″백(white)″화소 또는 ″흑(black)″화소로 결정하는 것으로, ″백″화소와 ″흑″화소는 상대적으로 ″1″ 또는 ″0″의 1비트 데이터로 표현된다.BACKGROUND ART Image input devices employed in facsimile, scanner, digital copier, and the like are typically processed after converting an analog image signal obtained by scanning a document into digital image data. At this time, the analog image signal is converted into digital image data having a gradation corresponding to a document image for each pixel. Since the gradation has a gradation, the amount of data is very large. For example, in the case of 256 gray levels, each pixel is represented by 8 bits. Accordingly, by binarizing the image data according to the scan, the amount of data is drastically reduced and then stored, transmitted or printed out. The binarization determines each pixel having a gradation as a ″ white ″ pixel or a ″ black ″ pixel, where ″ white ″ pixels and ″ black ″ pixels are relatively 1 of ″ 1 ″ or ″ 0 ″. It is represented by bit data.

이러한 이치화는 문서화상의 종류에 따라 각각 다른 방법을 채용한다. 상기 문서화상의 종류는 문자로 이루어진 문자 문서, 그림(또는 사진)으로 이루어진 그림 문서, 그리고 문자와 그림이 혼재된 문서로 구분되어 진다.This binarization adopts a different method depending on the type of document image. The document image is classified into a text document consisting of text, a picture document consisting of a picture (or a picture), and a document in which text and pictures are mixed.

이전부터 문자 문서를 이치화하는데 사용되어 왔었던 방법의 일예로서 LAT(Local Adaption Threshold) 알고리즘(algorithm)을 설명하면 다음과 같다. 먼저 계조 화상데이터중 현재 이치화 처리할 화소인 주목화소(target pixel)의 화소값을 최대 역치(maximum threshold) Tmax와 비교한다. 최대 역치 Tmax는 주목화소값이 최대 역치 Tmax보다 클 경우 주목화소를 ″백″으로 이치화하기 위해 미리 설정되는 역치이다. 이때 주목화소값이 최대 역치 Tmax보다 크면 주목화소를 ″백″으로 이치화한다. 이와 달리 주목화소값이 최대 역치 Tmax보다 크지 않으면 국부 밝기차 Wmax-Wmin를 밝기차 역치 Tdiff와 비교한다. 국부 밝기차 Wmax-Wmin는 주목화소에 대해 주변화소들을 포함하는 일정 크기의 윈도우(window)를 지정하고, 윈도우내의 화소들중에서 최대값 Wmax과 최소값 Wmin을 구하여 최대값 Wmax과 최소값 Wmin간의 차를 얻은 것이다. 상기 윈도우는 예를들어 3×3 윈도우, 즉 주목화소와 그를 기준으로 상,하,좌,우, 그리고 대각선방향의 화소들에 대해 지정하는 윈도우가 보편적으로 사용된다. 그리고 밝기차 역치 Tdiff는 문자의 경계 부분인 에지(edge) 부분을 확인하기 위해 미리 설정되는 역치로서, 에지 부분에서는 국부 밝기차 Wmax-Wmin가 밝기차 역치 Tdiff보다 크게 된다.As an example of a method that has been used to binarize a text document before, a description of a local allocation threshold algorithm (LAT) is as follows. First, a pixel value of a target pixel, which is a pixel to be binarized in grayscale image data, is compared with a maximum threshold Tmax. The maximum threshold Tmax is a preset threshold for binarizing the pixel of interest to ″ back ″ when the pixel value of interest is greater than the maximum threshold Tmax. At this time, if the pixel value of interest is larger than the maximum threshold value Tmax, the pixel of interest is binarized to ″ white ″. In contrast, if the pixel value of interest is not greater than the maximum threshold Tmax, the local brightness difference Wmax-Wmin is compared with the brightness difference threshold Tdiff. The local brightness difference Wmax-Wmin designates a window of constant size including the surrounding pixels for the pixel of interest, obtains the difference between the maximum value Wmax and the minimum value Wmin by obtaining the maximum value Wmax and the minimum value Wmin among the pixels in the window. will be. For example, the window is a 3x3 window, i.e., a window for designating pixels of interest and pixels in up, down, left, right, and diagonal directions with respect to the pixel of interest. The brightness difference threshold Tdiff is a threshold set in advance to identify an edge portion that is a boundary portion of the character, and the edge portion has a local brightness difference Wmax-Wmin larger than the brightness difference threshold Tdiff.

만일 국부밝기차 Wmax-Wmin가 밝기차 역치 Tdiff보다 크면, 즉, 주목화소가 문자의 경계 부분이면, 주목화소값을 국부 밝기값 (Wmax+Wmin)/2과 비교한다. 국부 밝기값 (Wmax+Wmin)/2은 윈도우내의 평균 밝기값에 대응된다. 이때 주목화소값이 국부 밝기값 (Wmax+Wmin)/2보다 크면 주목화소를 ″백″으로 이치화하고, 그렇지 않으면 ″흑″으로 이치화한다. 그리고 국부밝기차 Wmax-Wmin가 밝기차 역치 Tdiff보다 크지 않으면, 주목화소값을 최소 역치 Tmin와 비교한다. 최소 역치 Tmin는 주목화소값이 최소 역치 Tmin보다 작을 경우 주목화소를 ″흑″으로 이치화하기 위해 미리 설정되는 역치이다. 만일 주목화소값이 최소 역치 Tmin보다 크면 주목화소를 ″백″으로 이치화하고, 그렇지 않으면 주목화소를 ″흑″으로 이치화한다.If the local brightness difference Wmax-Wmin is greater than the brightness difference threshold Tdiff, that is, the pixel of interest is the boundary portion of the character, the pixel value of interest is compared with the local brightness value (Wmax + Wmin) / 2. The local brightness value (Wmax + Wmin) / 2 corresponds to the average brightness value in the window. At this time, if the pixel value of interest is larger than the local brightness value (Wmax + Wmin) / 2, the pixel of interest is binarized to ″ white ″, otherwise it is binarized to ″ black ″. If the local brightness difference Wmax-Wmin is not greater than the brightness difference threshold Tdiff, the pixel value of interest is compared with the minimum threshold Tmin. The minimum threshold Tmin is a preset threshold for binarizing the pixel of interest to ″ black ″ when the pixel value of interest is less than the minimum threshold Tmin. If the pixel value of interest is larger than the minimum threshold Tmin, the pixel of interest is binned to ″ white ″, otherwise the pixel of interest is binarized to ″ black ″.

상술한 방법에 의해 계조를 가지는 화상데이터를 이치화할 때 에지 부분에서 주목화소값을 단순히 국부 밝기값 (Wmax+Wmin)/2과 비교하여 이치화함에 따라 에지의 방향성 및 연속성이 고려되지 않음으로써 에지 부분이 뭉게지게 된다. 이에따라 이치화 화상의 화질이 저하되었었다.When binarizing image data with gray scale by the above-described method, edge direction is not taken into consideration as the pixel value of interest in the edge portion is simply compared with the local brightness value (Wmax + Wmin) / 2 so that the direction and continuity of the edge is not taken into account. This will be lumped. As a result, the image quality of the binarized image was deteriorated.

상술한 바와 같이 종래의 문자 문서화상의 이치화방법은 에지의 방향성 및 연속성을 고려하지 않고 이치화함에 따라 문자의 경계 부분이 뭉게짐으로써 이지화 화상의 화질이 저하되는 단점이 있었다.As described above, the conventional method for binarizing a character document image has a disadvantage in that the image quality of the digitized image is deteriorated due to agglomeration of the boundary portions of the character as it is binarized without considering the directionality and continuity of the edge.

따라서 본 발명의 목적은 문자의 경계 부분에 대해 화질을 향상시킬 수 있는 문자 문서화상의 이치화방법을 제공함에 있다.Accordingly, an object of the present invention is to provide a binarization method of a character document image capable of improving image quality of a boundary portion of a character.

도 1은 본 발명이 적용되는 통상적인 스캐너의 블록구성도,1 is a block diagram of a conventional scanner to which the present invention is applied;

도 2는 본 발명의 실시예에 따른 처리흐름도.2 is a process flow diagram according to an embodiment of the present invention.

상술한 목적을 달성하기 위한 본 발명은 주목화소가 문자의 경계부분인 경우 주목화소를 중심으로 에지 방향에 있는 인접 화소들의 평균값과 주목화소값을 비교하고, 비교 결과에 따라 주목화소를 이치화함을 특징으로 한다.According to the present invention for achieving the above object, when the pixel of interest is the boundary portion of the character, the average value of the adjacent pixels in the edge direction of the pixel of interest is compared with the pixel of interest, and the pixel of interest is binarized according to the comparison result. It features.

이하 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명 및 첨부 도면에서 구체적인 처리 흐름과 같은 많은 특정 상세들이 본 발명의 보다 전반적인 이해를 제공하기 위해 나타나 있다. 이들 특정 상세들없이 본 발명이 실시될 수 있다는 것은 이 기술분야에서 통상의 지식을 가진 자에게 자명할 것이다. 그리고 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. Many specific details are set forth in the following description and in the accompanying drawings to provide a more general understanding of the invention. It will be apparent to those skilled in the art that the present invention may be practiced without these specific details. And a detailed description of known functions and configurations that may unnecessarily obscure the subject matter of the present invention will be omitted.

도 1은 본 발명이 적용되는 장치의 예로서 통상적인 스캐너의 블록구성도를 보인 것이다. 중앙처리장치(100)는 원고감지센서(112)에 의해 원고 장착을 감지하고 조작 패널(operational panel)(110)로부터 스캔 시작명령이 입력될 때 이미지 프로세서(104)를 제어하여 원고를 스캔한다. 스캔 유니트(102)는 원고를 스캔하기 위한 광학계를 포함하며 원고를 스캔하여 아나로그 화상신호를 발생한다. 이미지 프로세서(image processor)(104)는 스캔 유니트(102)를 구동하며 스캔 유니트(102)로부터 출력되는 화상신호를 디지털 데이터로 변환하고 이미지 처리 및 이치화한다. 롬(ROM: Read Only Memory)(106)에는 중앙처리장치(100)의 동작 프로그램과 각종 참조데이터가 미리 저장된다. 램(RAM: Random Access Memory)(108)은 중앙처리장치(100)의 동작 수행에 따른 데이터가 일시 저장된다. 조작 패널(110)은 중앙처리장치(100)에 사용자에 의한 키입력을 제공한다. 원고감지센서(112)는 원고가 장착되는 것을 감지하여 중앙처리장치(100)에 알린다.1 shows a block diagram of a conventional scanner as an example of an apparatus to which the present invention is applied. The central processing unit 100 detects the document mounting by the document detection sensor 112 and controls the image processor 104 to scan the document when a scan start command is input from the operation panel 110. The scanning unit 102 includes an optical system for scanning an original and scans the original to generate an analog image signal. An image processor 104 drives the scan unit 102 to convert the image signal output from the scan unit 102 into digital data, and to process and binarize the image. The ROM (Read Only Memory) 106 stores the operation program of the CPU 100 and various reference data in advance. The random access memory (RAM) 108 temporarily stores data according to an operation of the CPU 100. The operation panel 110 provides a key input by the user to the CPU 100. The document detection sensor 112 detects that the document is mounted and notifies the central processing unit 100.

도 2는 본 발명의 실시예에 따른 처리 흐름도로서, 편의상 1화소를 이치화하는 예를 보인 것으로, 모든 화소들에 대해 동일하게 적용된다. 이러한 도 2의 흐름도에 따른 동작은 상기한 도 1의 이미지 프로세서(104)에 의해 수행되도록 프로그램한다.2 is a flowchart illustrating a process of binarizing one pixel for convenience, according to an exemplary embodiment of the present invention. The same applies to all pixels. The operation according to the flowchart of FIG. 2 is programmed to be performed by the image processor 104 of FIG.

상기한 도 1에서 원고감지센서(112)에 의해 원고 장착이 감지되고 조작 패널(110)로부터 스캔 시작명령이 입력됨에 따라 중앙처리장치(100)의 제어에 의해 이미지 프로세서(104)가 스캔 유니트(102)에 의해 원고를 스캔하기 시작하면, 스캔 유니트(102)로부터 원고 스캔에 따른 화상신호가 출력된다. 그러면 이미지 프로세서(104)는 스캔 유니트(102)로부터 출력되는 화상신호를 계조를 가지는 디지털 화상데이터로 변환한후, 스캔하는 라인단위로 화소값을 램(108)에 저장하고 도 2의 흐름도에 따른 이치화를 수행한다.In FIG. 1, as the document is detected by the document sensor 112 and a scan start command is input from the operation panel 110, the image processor 104 is controlled by the central processing unit 100. When the original is scanned by 102, an image signal corresponding to the original scan is output from the scanning unit 102. Then, the image processor 104 converts the image signal output from the scanning unit 102 into digital image data having a gray level, and stores the pixel value in the RAM 108 in units of lines to be scanned, and according to the flowchart of FIG. 2. Perform binarization.

먼저 이미지 프로세서(104)는 도 2의 (200)단계에서 화상데이터의 주목화소값을 전술한 바와 같은 최대 역치 Tmax와 비교한다. 이때 주목화소값이 최대 역치 Tmax보다 크면 이미지 프로세서(104)는 (202)단계에서 통상적인 경우와 마찬가지로 주목화소를 ″백″으로 이치화한다. 이와 달리 주목화소값이 최대 역치 Tmax보다 크지 않으면 이미지 프로세서(104)는 (204)단계에서 국부 밝기차 Wmax-Wmin를 밝기차 역치 Tdiff와 비교함으로써 주목화소가 에지, 즉 문자의 경계 부분인지 여부를 확인한다. 여기서 국부 밝기차 Wmax-Wmin와 밝기차 역치 Tdiff는 전술한 바와 같다.First, in step 200 of FIG. 2, the image processor 104 compares the pixel value of interest of the image data with the maximum threshold Tmax as described above. If the pixel value of interest is greater than the maximum threshold value Tmax, the image processor 104 binarizes the pixel of interest to " white " In contrast, if the pixel value of interest is not greater than the maximum threshold Tmax, the image processor 104 compares the local brightness difference Wmax-Wmin with the brightness difference threshold Tdiff in step 204 to determine whether the pixel of interest is an edge, that is, a boundary of a character. Check it. The local brightness difference Wmax-Wmin and the brightness difference threshold Tdiff are as described above.

만일 국부밝기차 Wmax-Wmin가 밝기차 역치 Tdiff보다 크면, 즉, 주목화소가 문자의 경계 부분인 경우 이미지 프로세서(104)는 (206)단계에서 주목화소를 중심으로 에지 방향에 있는 2개의 인접 화소의 평균값 (I1+I2)/2과 주목화소값을 비교한다. 여기서 에지 방향을 검출하는 것은 통상적인 방법이므로 상세한 설명은 생략한다. 그리고 상기 I1과 I2는 주목화소를 중심으로 인접한 2개의 화소값이다. 상기 (206)단계에서 주목화소값이 평균값 (I1+I2)/2보다 작지 않으면 이미지 프로세서(104)는 (208)단계에서 주목화소를 ″백″으로 이치화한다. 이와달리 주목화소값이 평균값 (I1+I2)/2보다 작으면 이미지 프로세서(104)는 (210)단계에서 주목화소를 ″흑″으로 이치화한다.If the local brightness difference Wmax-Wmin is greater than the brightness difference threshold Tdiff, i.e., if the pixel of interest is the boundary portion of the character, the image processor 104 performs two adjacent pixels in the edge direction around the pixel of interest in step 206. Compare the average value of (I1 + I2) / 2 with the pixel value of interest. Since detecting the edge direction is a conventional method, detailed description thereof will be omitted. I1 and I2 are two pixel values adjacent to the pixel of interest. If the pixel value of interest in step 206 is not smaller than the average value (I1 + I2) / 2, the image processor 104 binarizes the pixel of interest to ″ white ″ in step 208. In contrast, if the pixel value of interest is smaller than the average value (I1 + I2) / 2, the image processor 104 binarizes the pixel of interest to ″ black ″ in step 210.

따라서 주목화소가 문자의 경계 부분인 경우, 에지 방향에 있는 인접 화소들의 평균값을 적용하여 이치화함으로써 에지의 방향성 및 연속성에 따라 이치화가 이루어진다. 이에따라 문자의 경계 부분이 뭉게지게 되는 것이 방지된다.Therefore, when the pixel of interest is the boundary portion of the character, the pixel is binarized by applying the average value of adjacent pixels in the edge direction to binarize it according to the directionality and continuity of the edge. This prevents agglomeration of the boundary of characters.

한편 상기 (204)단계에서 국부밝기차 Wmax-Wmin가 밝기차 역치 Tdiff보다 크지 않으면, 즉 문자의 경계 부분이 아닌 경우 이미지 프로세서(104)는 (201)∼(216)단계에서 통상적인 경우와 마찬가지로 이치화한다. 즉 이미지 프로세서(104)는 (212)단계에서 주목화소값을 최소 역치 Tmin와 비교한다. 이때 주목화소값이 최소 역치 Tmin보다 크면 이미지 프로세서(104)는 (214)단계에서 주목화소를 ″백″으로 이치화한다. 이와달리 주목화소값이 최소 역치 Tmin보다 크지 않으면 이미지 프로세서(104)는 (216)단계에서 주목화소를 ″흑″으로 이치화한다.On the other hand, if the local brightness difference Wmax-Wmin in step 204 is not greater than the brightness difference threshold Tdiff, i.e., it is not the boundary portion of the character, the image processor 104 performs the same operation as in the normal operation in steps 201 to 216. It makes sense. That is, the image processor 104 compares the pixel value of interest with the minimum threshold value Tmin in step 212. If the pixel value of interest is greater than the minimum threshold value Tmin, the image processor 104 binarizes the pixel of interest to " back " On the other hand, if the pixel value of interest is not larger than the minimum threshold Tmin, the image processor 104 binarizes the pixel of interest to " black "

상술한 바와 같은 동작에 의해 하나의 화소에 대한 이치화가 이루어지며, 이를 종료하면 리턴(return)하여 전체 화상데이터에 대한 이치화를 완료할때까지 다음의 화소들에 대해 이치화하는 동일한 동작이 반복적으로 이루어진다.By the operation as described above, binarization is performed on one pixel, and when it is finished, the same operation is repeatedly performed on the next pixels until it is returned to complete the binarization of the entire image data. .

한편 상술한 본 발명의 설명에서는 구체적인 실시예에 관해 설명하였으나, 여러가지 변형이 본 발명의 범위에서 벗어나지 않고 실시할 수 있다. 특히 본 발명의 실시예에서는 본 발명을 스캐너에 적용하는 예를 보였으나, 문자 문서의 화상데이터를 이치화하는 경우에 모두 동일하게 적용된다. 또한 문자의 경계 부분인 경우 주목화소값을 에지 방향에 있는 2개의 인접 화소의 평균값과 비교하는 예를 들었으나, 평균값을 취하는 인접 화소들의 개수는 필요에 따라 달라질 수 있다. 따라서 발명의 범위는 설명된 실시예에 의하여 정할 것이 아니고 특허청구범위와 특허청구범위의 균등한 것에 의해 정하여져야 한다.Meanwhile, in the above description of the present invention, specific embodiments have been described, but various modifications can be made without departing from the scope of the present invention. In particular, the embodiment of the present invention shows an example of applying the present invention to a scanner, but the same applies to binarizing image data of a text document. In the case of the boundary portion of the character, an example in which the pixel value of interest is compared with an average value of two adjacent pixels in the edge direction is illustrated. However, the number of adjacent pixels that take an average value may vary as necessary. Therefore, the scope of the invention should not be defined by the described embodiments, but should be defined by the equivalent of claims and claims.

상술한 바와 같이 본 발명은 주목화소가 문자의 경계 부분인 경우 에지의 방향성 및 연속성에 따라 이치화를 함으로써 문자의 경계 부분이 뭉게지게 되는 것을 방지하여 화질을 향상시킬 수 있는 잇점이 있다.As described above, when the pixel of interest is the boundary portion of the character, the image quality is improved by preventing binarization of the boundary portion of the character by binarizing according to the direction and continuity of the edge.

Claims (3)

문자 문서를 스캔하여 얻어진 다치 계조를 가지는 화상데이터를 이치화하는 방법에 있어서,In the method for binarizing image data having multilevel gradations obtained by scanning a text document, 상기 화상데이터의 주목화소가 문자의 경계부분인 경우 상기 주목화소를 중심으로 에지 방향에 있는 인접 화소들의 평균값과 상기 주목화소값을 비교하는 과정과,If the pixel of interest of the image data is a boundary of a character, comparing the pixel value of the pixel with the mean value of adjacent pixels in the edge direction with respect to the pixel of interest; 상기 주목화소값과 상기 평균값의 비교 결과에 따라 상기 주목화소를 이치화하는 과정을 구비함을 특징으로 하는 이치화방법.And binarizing the pixel of interest according to a result of comparison between the pixel of interest value and the average value. 제1항에 있어서, 상기 이치화과정이,According to claim 1, wherein the binarization process, 상기 주목화소값이 상기 평균값보다 작으면 상기 주목화소를 ″흑″으로 이치화하는 과정과,If the pixel value of interest is smaller than the average value, binarizing the pixel of interest to ″ black ″; 상기 주목화소값이 상기 평균값보다 작지 않으면 상기 주목화소를 ″백″으로 이치화하는 과정을 구비함을 특징으로 하는 이치화방법.And binarizing the pixel of interest to ″ white ″ if the pixel of interest value is not less than the average value. 문자 문서를 스캔하여 얻어진 다치 계조를 가지는 화상데이터를 이치화하는 방법에 있어서,In the method for binarizing image data having multilevel gradations obtained by scanning a text document, 상기 화상데이터의 주목화소값을 미리 설정된 최대 역치와 비교하는 과정과,Comparing the pixel value of interest of the image data with a preset maximum threshold; 상기 주목화소값이 상기 최대 역치보다 크면 상기 주목화소를 ″백″으로 이치화하는 과정과,Binarizing the pixel of interest to ″ white ″ if the pixel value of interest is greater than the maximum threshold; 상기 주목화소값이 상기 최대 역치보다 크지 않으면 상기 주목화소가 문자의 경계 부분인지 여부를 확인하는 과정과,Checking whether the pixel of interest is a boundary portion of a character if the pixel of interest value is not greater than the maximum threshold value; 상기 주목화소가 문자의 경계 부분인 경우 상기 주목화소를 중심으로 에지 방향에 있는 인접 화소들의 평균값과 상기 주목화소값을 비교하는 과정과,If the pixel of interest is a boundary portion of a character, comparing the pixel value of the pixel with the mean value of adjacent pixels in an edge direction with respect to the pixel of interest; 상기 주목화소값이 상기 평균값보다 작으면 상기 주목화소를 ″흑″으로 이치화하는 과정과,If the pixel value of interest is smaller than the average value, binarizing the pixel of interest to ″ black ″; 상기 주목화소값이 상기 평균값보다 작지 않으면 상기 주목화소를 ″백″으로 이치화하는 과정과,Binarizing the pixel of interest to ″ white ″ if the pixel of interest value is not less than the average value; 상기 주목화소가 문자의 경계 부분이 아닌 경우 상기 주목화소값을 미리 설정된 최소 역치와 비교하는 과정과,Comparing the pixel value of interest with a preset minimum threshold value if the pixel of interest is not a boundary of a character; 상기 주목화소값이 상기 최소 역치보다 크면 상기 주목화소를 ″백″으로 이치화하는 과정과,Binarizing the pixel of interest to ″ white ″ if the pixel value of interest is greater than the minimum threshold value; 상기 주목화소값이 상기 최소 역치보다 크지 않으면 상기 주목화소를 ″흑″으로 이치화하는 과정을 구비함을 특징으로 하는 이치화방법.And binarizing the pixel of interest to " black " if the pixel of interest value is not greater than the minimum threshold.
KR1019970043740A 1997-08-30 1997-08-30 Image processing method for converting gray-scale image of text document into binary image KR100242298B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019970043740A KR100242298B1 (en) 1997-08-30 1997-08-30 Image processing method for converting gray-scale image of text document into binary image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019970043740A KR100242298B1 (en) 1997-08-30 1997-08-30 Image processing method for converting gray-scale image of text document into binary image

Publications (2)

Publication Number Publication Date
KR19990020280A KR19990020280A (en) 1999-03-25
KR100242298B1 true KR100242298B1 (en) 2000-02-01

Family

ID=19519858

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970043740A KR100242298B1 (en) 1997-08-30 1997-08-30 Image processing method for converting gray-scale image of text document into binary image

Country Status (1)

Country Link
KR (1) KR100242298B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7602967B2 (en) 2003-06-28 2009-10-13 Samsung Electronics Co., Ltd Method of improving image quality

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100453043B1 (en) * 2002-02-26 2004-10-15 삼성전자주식회사 Method and apparatus for converting level of image

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7602967B2 (en) 2003-06-28 2009-10-13 Samsung Electronics Co., Ltd Method of improving image quality

Also Published As

Publication number Publication date
KR19990020280A (en) 1999-03-25

Similar Documents

Publication Publication Date Title
US5583659A (en) Multi-windowing technique for thresholding an image using local image properties
EP0696129A2 (en) Method and system for image conversion utilizing dynamic error diffusion
US7636180B2 (en) Methods and apparatus for smoothing text outlines
US6044179A (en) Document image thresholding using foreground and background clustering
US4996602A (en) Image-processing apparatus
JP3083673B2 (en) Image area identification device
KR100242298B1 (en) Image processing method for converting gray-scale image of text document into binary image
KR0181129B1 (en) Image processing apparatus
EP0870276B1 (en) A method for transforming a gray-level image into a black-and-white image
EP0630149A1 (en) Method and apparatus for image processing
KR100206338B1 (en) Binary coding method of letter image having both character and picture
JPH06223177A (en) Improvement of image processing
US6411735B1 (en) Method and apparatus for distinguishing between noisy continuous tone document types and other document types to maintain reliable image segmentation
KR100205599B1 (en) Binary coding method of character image in letter
JP2541937B2 (en) Image processing device
KR100229028B1 (en) Binarization method based on continuity
KR19990011500A (en) Local binarization method of the imaging system
JPH0851537A (en) Image processor discriminating character/photograph/dot area
JP3291101B2 (en) Image processing device
KR100214337B1 (en) Bi-levelling method for image/letter mixing document
JPS6218171A (en) Method and circuit for processing picture
JPH05136999A (en) Edge emphasis processing device for picture information
KR920022813A (en) Halftone image representation
KR920022822A (en) Binarization Method Using Local Maximum and Minimum Brightness Values
JPS6395778A (en) Picture processing method

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20071030

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee