KR20010015025A - 문자인식장치의 문자추출방법 및 장치 - Google Patents
문자인식장치의 문자추출방법 및 장치 Download PDFInfo
- Publication number
- KR20010015025A KR20010015025A KR1020000032889A KR20000032889A KR20010015025A KR 20010015025 A KR20010015025 A KR 20010015025A KR 1020000032889 A KR1020000032889 A KR 1020000032889A KR 20000032889 A KR20000032889 A KR 20000032889A KR 20010015025 A KR20010015025 A KR 20010015025A
- Authority
- KR
- South Korea
- Prior art keywords
- character
- image
- area
- binary image
- cutting
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 25
- 230000015654 memory Effects 0.000 claims abstract description 42
- 238000005520 cutting process Methods 0.000 claims abstract description 38
- 238000000605 extraction Methods 0.000 claims description 20
- 238000010586 diagram Methods 0.000 description 3
- 230000002411 adverse Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
- G06V30/18095—Summing image-intensity values; Projection and histogram analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
본 발명은 문자추출방법에 관한 것으로, 입력 문자화상의 명암화상에 기초하여 문자인식을 하기 위한 문자인식장치에서, 입력 문자화상의 명암화상은 적어도 화소의 농도값을 이용하여 문자영역과 배경영역으로 절단되고, 상기 문자영역은 적어도 화소의 농도값을 이용하여 다시 2개 이상의 영역으로 절단되며, 이러한 재절단에 의해 얻어진 영역정보에 기초하여 문자들을 각각의 문자로 절단하는 것을 특징으로 한다.
Description
본 발명은 예를 들어 입력 명암 문자화상에 따라 문자를 인식하는 문자인식부에서 각 문자로부터 접촉 문자를 동시에 추출하는 문자추출방법에 관한 것이다.
일반적으로, 문자인식기술은 광범위하게 문자화상의 입력, 문자열의 추출, 문자 추출, 및 문자 인식으로 나누어진다.
일반적으로, 접촉 문자는 입력 문자화상을 2치화한 후 추출된다. 입력 문자화상은 문자영역 및 배경영역으로 나누어진다. 그때, 다수의 문자는 접촉상태에서 하나의 문자영역으로 추출된다. 종래 기술에서, 이들 접촉 문자는 접촉 문자의 형상에 따라 구조분석적으로 절단점을 구함으로써 서로 절단되었다. 즉, 접촉 문자의 형상이 계곡과 같이 움푹들어간 곳이 있는 경우, 움푹 패인 곳이 접촉점으로 판단되어 문자영역이 각각의 문자로 절단되었다.
그러나, 접촉 문자의 접촉점의 형상에 대해 다수의 패턴이 고려되고, 종래 기술에 따라 절단될 수 있는 패턴은 이들 패턴중 소수의 특수형상에만 제한된다.
일반적으로, 손으로 쓰여진 문자의 문서화상의 경우, 그들을 추출할 때 접촉 문자의 대부분은 문서가 입력될 때 처음부터 입력 문서화상상의 문자가 이미 접촉된 경우가 많다.
반대로, 인쇄활자의 문서화상의 경우, 문자들이 추출될 때 문제가 되는 문자 접촉 원인의 대부분은, 문자들이 실제로 접촉하는 것이 아니라 스캐너(문자화상 입력장치)의 저해상도 및 2치화 처리동안 2치화 실수에 기인한다.
따라서, 2치화된 입력 문자화상인 명암화상으로 되돌아가는 경우, 문자들간의 접촉점이 비교적 용이하게 검출가능해야 한다.
그러나, 단순하게 명암화상만이 이용되는 경우, 문자영역의 특징, 처리속도의 지연을 포함하여 문제가 더 복잡해지고, 또한 문자위치 추정에서의 오류등과 같은 좋지못한 효과가 발생되며, 성능이 더 저하된다.
따라서, 본 발명의 목적은 형상으로부터 발견하기 어려운 접촉 문자를 고정밀 고효율적으로 발견하고 그들을 절단할 수 있는 문자추출방법을 제공하는 것이다.
도 1은 스캐너에 의한 입력전의 입력 문서화상의 한 예를 나타내는 확대도,
도 2는 메쉬로 구획하여 문서화상의 입력 상태를 설명하기 위한 도면,
도 3은 스캐너에 의해 입력된 명암화상의 한 예를 나타내는 도면,
도 4는 도 3에 도시된 명암화상을 2치화하여 2치화된 화상의 한 예를 나타내는 도면,
도 5는 본 발명의 문자추출방법이 적용가능한 문자추출장치의 구성을 개략적으로 나타낸 블럭도,
도 6은 본 발명의 문자추출방법을 설명하는 플로우차트,
도 7은 제 1 2치화부에서 2치화된 제 1 2치화 화상의 한 예를 나타내는 도면,
도 8은 제 2 2치화부에서 2치화된 제 2 2치화 화상의 한 예를 나타내는 도면, 및
도 9는 문자절단부에서 접촉 문자 위치를 판정하는 방법을 설명하는 플로우차트이다.
* 도면의 주요부분에 대한 부호의 설명
1 : 스캐너 2 : 제 1 화상메모리
3 : 제 1 2치화부 4 : 제 2 화상메모리
5 : 접촉 문자 추정부 6 : 제 2 2치화부
7 : 제 3 화상메모리 8 : 문자절단부
9 : 선택부
본 발명에 따르면, 입력 문자화상에 따라 문자를 인식하는 문자인식부에서 문자추출방법을 제공하고, 상기 방법은 입력 문자화상을 문자영역과 배경영역으로 절단하는 제 1 단계; 문자영역내 문자화상의 화소의 농도값을 이용하여 제 1 단계에서 절단된 문자영역을 2개 이상의 영역으로 절단하는 제 2 단계; 및 제 2 단계에서 취득된 영역정보에 따라 문자영역을 한 문자씩 절단하는 제 3 단계로 이루어진다.
첨부된 도면을 참조하여 본 발명의 적절한 실시예를 후술한다.
또한, 다음의 설명에서, 화소의 농도값이 작아질수록 그들 화소가 더 검어지고, 농도값이 커질수록 화소가 더 희게 된다고 가정한다.
도 1은 스캐너에 의한 입력전의 확대된 입력 문서화상을 나타낸다. 도 "1"과 도 "2"는 서로 근접하게 도시되었지만, 그들 사이에 공백이 있기 때문에 서로 접촉하지 않는다. 이제, 스캐너를 이용하여 그러한 문서화상을 판독하는 경우를 생각해보자.
스캐너는 도 2에 도시된 바와 같은 메쉬에서 문서화상을 구획하고, 각각의 직사각형내 농도의 평균값을 취하며, 직사각형에 대응하여 화소의 대표 농도로서 평균 농도값을 입력한다. 도 3에 스캐너에 의해 입력된 명암화상의 한 예가 도시되어 있다. 이러한 예에서, 명암화상은 세로로 6도트, 가로로 12도트 화상이다.
도 3에서, 검게 색칠된 a부분은 최고 농도 화소를 나타내고, 교차 사선으로 도시된 b부분은 화소 a보다 농도가 작은 화소를 나타내며, 굵은 사선으로 도시된 c부분은 화소 b보다 농도가 작은 화소를 나타내고, 가는 사선으로 도시된 d부분은 화소 c보다 농도가 작은 화소를 각각 나타낸다.
문자들간의 공백의 폭이 스캐너에 의해 취해진 직사각형보다 얇은 경우, 그들이 도 3에 도시된 바와 같은 공백부에 있는 경우라도 저농도의 화소가 얻어진다. 따라서, 이 화상이 2치화될 때, 도 4에 도시된 바와 같이 2개의 접촉 문자 형상인 2치화상이 얻어진다.
종래의 문자추출방법에서, 도 4에 도시된 2치화상만을 이용하여 접촉 문자가 절단되었다.
그러나, 도 3에 도시된 명암화상을 보면, 문자의 윤곽이 문자의 중심부보다 더 고농도이다. 문자의 접촉부 또한 예외가 아니고, 공백에 대응하는 화소가 문자부보다 더 고농도이다.
따라서, 본 발명에서, 고농도인 부분이 효과적으로 발견되고, 접촉 문자부를 결정함으로써 문자영역이 각각의 문자로 절단된다. 이것이 상세하게 후술되어 있다.
도 5는 본 발명의 문자추출방법이 적용될 수 있는 문자추출장치의 구조를 나타내는 블럭도이다. 도 5에서, 문자화상 입력수단인 스캐너(1)는 광학적으로 입력 문서화상을 판독하고, 도 3에 도시된 바와 같은 명암화상을 입력한다. 스캐너(1)에 의해 입력된 명암화상은 제 1 화상메모리(2)에 임시 저장된다.
제 1 2치화부(3)는 예를 들어 공지된 오츠(Ohtsu)의 2치화법(노부유키 오츠(Nobuyuki Ohtsu)의 "Automatic Threshold Selection Method according to Discrimination and Minimum Square Standard"(Shingakuron(D), vol.J63-D, no.4, pp.349-356, 1980) 참조)에 따라 제 1 화상메모리(2)에 임시 저장된 명암화상을 2치화하고, 도 4에 도시된 바와 같은 제 1 2치화상을 출력한다.
또한, 명암화상을 위한 2치화방법이 미국특허 제5,784,500호(1988.7.21)에 개시되어 있다.
제 1 2치화부(3)로부터 출력된 제 1 2치화상은 제 2 화상메모리(4)에 임시 저장된다. 접촉 문자 추정부(5)는 제 2 화상메모리에 임시 저장된 제 1 2치화상에 기초하여 접촉 문자가 있는가를 추정(판단)한다. 추정 기준을 고려하면, 흑화소영역의 측면크기가 종방향 크기보다 큰 경우, 다수의 문자들이 접촉하고 있는 것으로 추정된다.
제 2 2치화부(6)는 다수의 문자가 접촉하는 것으로 접촉 문자 추정부(5)가 추정될 때 동작하고, 제 1 화상메모리(2)에 임시 저장된 명암화상 및 제 2 화상메모리(4)에 임시 저장된 제 1 2치화상이 입력될 때, 제 1 2치화상의 흑화소의 위치에 대응하는 명암화상 화소로부터만 농도값이 취해지고, 히스토그램에 등록된다.
그리고, 얻어진 히스토그램에 기초하여, 제 2 2치화부(6)는 상기한 공지된 오츠의 2치화법을 이용하여 히스토그램의 농도값을 이등분하는 임계값을 얻는다. 2치화상의 흑화소중 명암화상의 동일한 좌표의 농도값이 얻어진 임계값보다 큰 경우에만 흑화소가 백화소로 반전되고, 새로운 2치화상(제 2 2치화상)이 형성된다.
제 2 2치화부(6)로부터 출력된 제 2 2치화상은 제 3 화상메모리(7)에 임시 저장된다. 문자 절단부(8)는 제 1 화상메모리(2)에 임시 저장된 명암화상, 제 2 화상메모리(4)에 임시 저장된 제 1 2치화상, 및 제 3 화상메모리(7)에 임시 저장된 제 2 2치화상에 기초하여 접촉 문자 위치를 결정하고, 이렇게 결정된 문자 접촉위치상의 정보에 기초하여 문자화상을 각각의 문자로 절단한다. 이때 제 1 2치화부(3)에서 얻어진 문자화상(제 1 2치화상)이 절단된다.
선택부(9)는 접촉 문자 추정부(5)에 의한 추정 결과에 기초하여 문자 절단부(8)의 출력 또는 제 2 화상메모리(4)의 저장내용을 선택한다. 즉, 접촉된 문자가 없다고 접촉 문자 추정부(5)가 추정한 경우, 제 2 화상메모리(4)의 저장 내용이 선택되고, 접촉 문자가 있다고 추정한 경우, 문자 절단부(8)의 출력이 선택된다.
다음, 본 발명의 문자추출방법이 도 6에 도시된 플로우차트를 참조하여 상세하게 후술된다. 먼저, 스캐너(1)에 명암문자화상이 입력되고, 제 1 화상메모리(2)에 임시 저장된다(S1). 그리고, 제 1 화상메모리(2)내 명암화상은 오츠의 2치화법을 이용하여 제 1 2치화부(3)내 제 1 2치화상으로 변환되고, 제 2 화상메모리(4)에 임시 저장된다.
그리고, 접촉 문자 추정부(5)는 제 2 화상메모리(4)내 얻어진 제 1 2치화상에 기초하여 접촉 문자가 있는지를 판단한다(S3). 접촉 문자 판단을 위한 기준을 고려하면, 흑화소영역의 측면 크기가 종방향 크기보다 큰 경우, 다수의 문자가 접촉되는 것으로 판단한다. 접촉 문자가 없는 경우, 처리가 종료된다. 이러한 경우, 선택부(9)는 제 2 화상메모리(4)내 제 1 2치화상을 선택하고, 그것을 다음 인식처리로 전송한다.
접촉 문자가 있는 것으로 판단될 때, 제 2 2치화부(6)는 제 1 2치화부(3)내 얻어진 제 1 2치화상의 흑화소의 위치에 대응하는 명암화상 화소만으로부터 농도값을 취하고, 히스토그램에 등록한다(S4). 그리고, 얻어진 히스토그램에 기초하여, 오츠의 2치화법을 이용하여 히스토그램의 농도값을 이등분하는 임계값이 얻어진다. 2치화상의 흑화소중 명암화상의 동일 좌표의 농도값이 얻어진 임계값보다 큰 경우, 흑화소는 백화소로 반전되고, 제 2 2치화상이 형성되어 제 3 화상메모리(7)에 임시 저장된다(S5).
도 7은 제 1 2치화부(3)내 2치화된 제 1 2치화상의 한 예를 나타내고, 도 8은 제 2 2치화부(6)내 2치화된 제 2 2치화상의 한 예를 나타내며, 도 7-8에서, 흑직사각형은 2치화에서 흑화소가 될 것으로 생각되는 부분이고, 백직사각형은 2치화에서 백화소가 될 것으로 생각되는 부분이다.
농도 히스토그램이 문자영역에 대해서만 다시 기입되고 2치화되는 경우, 상기한 바와 같이 스캐너의 양자화 오차에 의해 흑화소가 된 부분, 즉 문자들간의 근접부 또는 문자들의 윤곽은 농도값때문에 백화소로 변한다. 따라서, 도 8에서 문자 "2"와 "5", 그리고 "5"와 "3" 사이에 새로운 공백이 생성되는 것을 볼 수 있다(도면의 화살표부).
그리고, 문자절단부(8)에서, 제 2 2치화부(6)에서 얻어진 제 2 2치화상, 제 1 2치화부(3)에서 얻어진 제 1 2치화상, 및 스캐너(1)에서 입력된 명암화상에 기초하여 접촉 문자 위치가 결정된다(S6). 접촉 문자 위치의 결정이 상세하게 후술된다. 그리고, 결정된 접촉 문자 위치에 대한 정보에 기초하여, 문자화상(제 1 2치화부(3)에서 얻어진 제 1 2치화상)은 각각의 문자(S7)로 절단된다. 이러한 경우, 선택부(9)는 문자절단부(8)의 출력을 선택하고, 그것을 다음 인식처리로 전달한다.
다음, 문자절단부(8)에서 접촉 문자 위치 결정방법이 도 9에 도시된 플로우차트를 참조하여 상세하게 설명될 것이다. 먼저, 제 1 2치화부(3)에서 얻어진 제 1 2치화상은 제 2 2치화부(6)에서 얻어진 제 2 2치화상과 비교되고, 백화소로 새롭게 반전된 다수의 화소를 포함하는 열이 검지된다(S11). 그리고, 단계(S11)에서 검지된 열은 제 2 2치화상의 종방향으로 단일 흑화소가 있는지가 점검된다(S12).
상기 점검 결과 종방향에서 단일 흑화소가 검지되지 않는 경우, 단계(S14)로 동작이 진행된다. 흑화소가 검출되는 경우, 스캐너(1)에 의해 입력된 명암화상이 점검된다(S13). 즉, 명암화상의 동일 열에서 상기 열의 제 1 2치화상내 흑화소의 위치에서의 평균 농도값이 얻어진다. 상기 열의 좌우에 있는 여러 열들에서 동일한 처리가 실행된다. 상기 열이 좌우 열에 대해 리지(ridge)인 경우; 즉, 좌우 열의 농도값의 평균값이 동일한 열의 농도값의 평균값보다 작은가를 판정한다. 판정 결과 평균값이 더 작은 경우 단계(S14)로 진행하고, 작지 않은 경우 화상이 절단후보에서 제외된다(문자가 절단되지 않는다).
그리고, 단계(S12) 또는 단계(S13)의 처리에서 얻어진 열의 좌우측(양측)에 문자가 있는가 점검된다(S14). 도 8에 도시된 바와 같이 제 2 2치화상으로부터 얻어진 백화소는 문자의 접촉점외에 문자 가장자리에 나타난다. 따라서, 상기 열의 양단부에 문자가 있는가를 점검할 필요가 있다. 예를 들어, 제 1 2치화상에 기초하여 상기 열의 양단부에서 여러 열에 걸쳐 흑화소의 수가 카운트되고, 일정값 이상의 흑화소가 있는 경우, 문자가 존재하는 것으로 간주된다.
단계(S14)의 점검 결과 문자가 발견되지 않는 경우, 절단후보에서 화상이 제외되고(문자가 절단되지 않고), 문자가 있는 경우, 문자절단부에 의해 문자 절단처리가 실행된다(S15).
또한, 도 9에 도시된 플로우차트의 단계(S12)에서 문자화상을 입력하는 스캐너(1)의 해상도가 낮은 경우, 일부 흑화소가 있는 경우라도 단계(S14)로 이동한다. 이러한 경우, 절단후보 판단기준으로, 제 1 2치화부(3)에서 얻어진 제 1 2치화상의 흑화소와 제 2 2치화부(6)에서 얻어진 제 2 2치화상의 흑화소와의 차이가 취해지고, 더 큰 차이를 갖는 열이 문자절단을 위한 후보열이 된다. 이러한 경우, 차이 크기를 나타내는 임계값이 낮아서, 스캐너(1)의 해상도가 낮아지도록 한다.
상기한 바와 같이, 상기 실시예에 따르면, 지금까지 2치화상에 의해서만 절단될 수 없었던 접촉 문자를 절단하는 것이 가능하다. 또한, 명암화상만 이용하는 모든 처리보다 상당히 적은 부하로 접촉 문자 절단이 처리될 수 있다. 따라서, 형상적으로는 발견하기 어려운 접촉 문자가 발견되고 고정밀 고효율적으로 절단될 수 있다.
상세하게 설명한 바와 같이, 본 발명에 따르면 형상적으로 접촉 문자를 발견하고 고정밀 고효율적으로 절단할 수 있는 문자추출방법이 제공될 수 있다.
Claims (13)
- 입력 문자화상에 따라 문자를 인식하는 문자인식장치의 문자추출방법에 있어서,입력 문자화상을 문자영역과 배경영역으로 절단하는 제 1 단계;문자영역내 문자화상의 화소의 농도값을 이용하여 제 1 단계에서 절단된 문자영역을 2개 이상의 영역으로 절단하는 제 2 단계; 및제 2 단계에서 얻어진 영역 정보에 따라 문자영역을 한 문자씩 절단하는 제 3 단계로 이루어지는 것을 특징으로 하는 문자추출방법.
- 제 1 항에 있어서,제 3 단계는 제 1 단계에서 얻어진 문자영역과 제 2 단계에서 얻어진 영역 사이에 큰 차이를 갖는 화소행 또는 화소열을 절단점으로 이용하여 문자들을 각각의 문자로 절단하는 단계를 포함하는 것을 특징으로 하는 문자추출방법.
- 제 1 항에 있어서,제 3 단계는 절단될 영역 자체의 농도값과 절단될 영역의 양단에서의 농도값을 비교하고, 양단에서의 농도값이 절단될 영역 자체의 농도값보다 작은 경우에만 문자들을 각각의 문자로 절단하는 단계를 포함하는 것을 특징으로 하는 문자추출방법.
- 제 1 항에 있어서,제 2 단계는 문자영역에 대해 적용가능한 위치에서의 화소의 농도값을 이용하여 형성되는 히스토그램에 기초하여 문자들을 각각의 문자로 절단하는 단계를 포함하는 것을 특징으로 하는 문자추출방법.
- 제 2 항에 있어서,제 1 단계에서 얻어진 문자영역의 농도값과 제 2 단계에서 얻어진 영역의 농도값과의 차이에 기초하여 절단점을 결정하는 경우, 절단점을 결정하는 임계값은 입력 문자화상의 해상도값에 기초하여 변하는 것을 특징으로 하는 문자추출방법.
- 입력 문자화상에 따라 문자를 인식하는 문자인식장치의 문자추출장치에 있어서,입력 문자화상을 문자영역과 배경영역으로 절단하는 제 1 수단;문자영역내 문자화상의 화소의 농도값을 이용하여 제 1 수단에 의해 절단된 문자영역을 2개 이상의 영역으로 절단하는 제 2 수단; 및제 2 수단에서 얻어진 영역 정보에 따라 문자영역을 한 문자씩 절단하는 제 3 수단으로 이루어지는 것을 특징으로 하는 문자추출장치.
- 제 6 항에 있어서,제 3 수단은 제 1 수단에 의해 얻어진 문자영역과 제 2 수단에 의해 얻어진 영역 사이에 큰 차이를 갖는 화소행 또는 화소열을 절단점으로 이용하여 문자들을 각각의 문자로 절단하는 수단을 포함하는 것을 특징으로 하는 문자추출장치.
- 제 6 항에 있어서,제 3 수단은 절단될 영역 자체의 농도값과 절단될 영역의 양단에서의 농도값을 비교하고, 양단에서의 농도값이 절단될 영역 자체의 농도값보다 작은 경우에만 문자들을 각각의 문자로 절단하는 수단을 포함하는 것을 특징으로 하는 문자추출장치.
- 제 6 항에 있어서,제 2 수단은 문자영역에 대해 적용가능한 위치에서의 화소의 농도값을 이용하여 형성되는 히스토그램에 기초하여 문자들을 각각의 문자로 절단하는 수단을 포함하는 것을 특징으로 하는 문자추출장치.
- 제 7 항에 있어서,제 1 수단에 의해 얻어진 문자영역의 농도값과 제 2 수단에 의해 얻어진 영역의 농도값과의 차이에 기초하여 절단점을 결정하는 경우, 절단점을 결정하는 임계값은 입력 문자화상의 해상도값에 기초하여 변하는 것을 특징으로 하는 문자추출장치.
- 제 1 메모리에 입력 문자화상을 저장하는 단계;제 1 메모리에 저장된 문자화상을 제 1 2치화상으로 변환하고, 제 1 2치화상을 제 2 메모리에 저장하는 단계;제 2 메모리에 저장된 제 1 2치화상에 기초하여 문자화상이 접촉하는가를 판정하는 단계;판정단계에서 문자들이 접촉하는 것으로 판정되는 경우, 제 2 메모리에 저장된 제 1 2치화상의 흑화소의 위치에 대응하는 문자화상의 화소로부터 농도값을 얻어 히스토그램을 제공하는 단계;제공된 히스토그램에 기초하여 히스토그램상의 농도값을 이등분하는 임계값을 얻는 단계;흑화소를 백화소로 반전하여 제 2 2치화상을 제공하고, 2치화상의 흑화소중 문자화상의 동일 좌표에서의 농도값이 얻어진 임계값보다 큰 경우에만 제 2 2치화상을 제 3 메모리에 저장하는 단계;제 1 메모리에 저장된 문자화상, 제 1 2치화상, 및 제 2 2치화상에 따라 접촉 문자의 위치를 판정하는 단계; 및판정된 접촉 문자 위치에 대한 정보에 따라 제 1 2치화상을 각각의 문자화상으로 절단하는 단계로 이루어지는 것을 특징으로 하는 문자절단방법.
- 제 11 항에 있어서,접촉 문자 위치판정단계는:다수의 새롭게 반전된 백화소를 포함하는 열을 검지하기 위해 제 1 2치화상과 제 2 2치화상을 비교하는 단계;제 2 2치화상의 종방향에 단일 흑화소가 있는가를 판정하기 위해 검지된 열을 점검하는 단계;점검 결과 흑화소가 검지되는 경우 좌우 열의 농도값의 평균값이 각각의 열의 농도의 평균값보다 작은가에 대해서 제 1 메모리에 저장된 문자화상을 판단하는 단계;제 1 2치화상에 기초하여 각각의 열의 양단에서의 여러 열에 걸친 흑화소의 수를 카운트하는 단계; 및흑화소의 수를 카운트하는 단계의 결과 일정값 이상의 흑화소가 있는 경우 열의 양단에 문자가 존재한다고 간주하는 단계를 포함하는 것을 특징으로 하는 문자절단방법.
- 입력 문서화상을 광학적으로 판독하여 문자화상을 얻기 위한 스캐너;스캐너에 의해 얻어진 문자화상을 저장하기 위한 제 1 화상메모리;제 1 화상메모리에 저장된 문자화상을 2치화하고 제 1 2치화상을 출력하는 제 1 2치화부;제 1 2치화부로부터 출력된 제 1 2치화상을 저장하기 위한 제 2 화상메모리;제 2 화상메모리에 저장된 제 1 2치화상에 따라 접촉 문자가 있는가를 추정하기 위한 접촉 문자 추정부;접촉 문자 추정부가 다수의 접촉문자를 추정했을 경우 흑화소를 백화소로 반전하여 제 2 2치화상을 제공하기 위한 제 2 2치화부;제 2 2치화부에 의해 제공된 제 2 2치화상을 저장하기 위한 제 3 화상메모리; 및제 1 화상메모리에 저장된 문자화상, 제 2 화상메모리에 저장된 제 1 2치화상, 및 제 3 화상메모리에 저장된 제 2 2치화상에 기초하여 접촉 문자위치를 판정하고, 판정된 문자위치 정보에 따라 접촉 문자화상을 각각의 문자로 절단하기 위한 문자절단부로 이루어지고,농도값은 제 1 화상메모리에 저장된 문자화상 및 제 2 화상메모리에 저장된 제 1 2치화상에 기초하여 제 1 2치화상의 흑화소의 위치와 대응하는 위치에 문자화상의 화소만으로부터 취해지며 히스토그램이 등록되고, 등록된 히스토그램에 기초하여 제 1 2치화상의 흑화소중 문자화상의 동일 좌표의 농도값은 얻어진 임계값보다 큰 것을 특징으로 하는 문자인식장치의 문자추출장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPP11-217151 | 1999-07-30 | ||
JP21715199A JP4392907B2 (ja) | 1999-07-30 | 1999-07-30 | 文字切出し方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010015025A true KR20010015025A (ko) | 2001-02-26 |
KR100383858B1 KR100383858B1 (ko) | 2003-05-14 |
Family
ID=16699666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2000-0032889A KR100383858B1 (ko) | 1999-07-30 | 2000-06-15 | 문자인식장치의 문자추출방법 및 장치 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP1073002B1 (ko) |
JP (1) | JP4392907B2 (ko) |
KR (1) | KR100383858B1 (ko) |
CN (1) | CN1192324C (ko) |
DE (1) | DE60024535T2 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100872983B1 (ko) * | 2001-12-22 | 2008-12-08 | 주식회사 포스코 | 슬래브의 문자인식 및 확인용 장치 |
KR100977713B1 (ko) * | 2003-03-15 | 2010-08-24 | 삼성전자주식회사 | 영상신호의 글자 인식을 위한 전처리 장치 및 방법 |
US9449418B2 (en) | 2010-01-22 | 2016-09-20 | Samsung Electronics Co., Ltd | Method and apparatus for creating animation message |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1398726B1 (en) * | 2002-09-11 | 2008-07-30 | Samsung Electronics Co., Ltd. | Apparatus and method for recognizing character image from image screen |
JP3950777B2 (ja) * | 2002-09-30 | 2007-08-01 | キヤノン株式会社 | 画像処理方法、画像処理装置および画像処理プログラム |
US8723964B2 (en) | 2003-09-12 | 2014-05-13 | Sony Corporation | Method and device for communication using an optical sensor |
CN1310182C (zh) * | 2003-11-28 | 2007-04-11 | 佳能株式会社 | 用于增强文档图像和字符识别的方法和装置 |
JP4423076B2 (ja) * | 2004-03-22 | 2010-03-03 | キヤノン株式会社 | 認識対象切出し装置および方法 |
CN100369049C (zh) * | 2005-02-18 | 2008-02-13 | 富士通株式会社 | 灰度字符的精确分割装置及方法 |
JP4658848B2 (ja) * | 2006-03-30 | 2011-03-23 | 日本電産サンキョー株式会社 | 文字列認識方法及び文字列認識装置 |
CN103034855A (zh) * | 2012-12-05 | 2013-04-10 | 曙光信息产业(北京)有限公司 | 在图像中识别字符区域的方法 |
CN106446896B (zh) * | 2015-08-04 | 2020-02-18 | 阿里巴巴集团控股有限公司 | 一种字符分割方法、装置及电子设备 |
JP7030462B2 (ja) * | 2017-09-21 | 2022-03-07 | キヤノン株式会社 | スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0634256B2 (ja) * | 1987-03-04 | 1994-05-02 | シャープ株式会社 | 接触文字切出し方法 |
JP2615153B2 (ja) * | 1988-08-24 | 1997-05-28 | 富士通株式会社 | 切断分離を伴う文字認識方法 |
JP2865697B2 (ja) * | 1989-03-20 | 1999-03-08 | 株式会社日立製作所 | エクスチャ分離方法 |
KR930014166A (ko) * | 1991-12-30 | 1993-07-22 | 이헌조 | 문서인식장치의 개별문자 절출방법 |
JPH07200739A (ja) * | 1994-01-07 | 1995-08-04 | Nippon Steel Corp | マーキング文字認識方法 |
JPH08129611A (ja) * | 1994-10-31 | 1996-05-21 | Sony Corp | 文字識別方法及び検査基準文字登録方法 |
JP3805005B2 (ja) * | 1994-11-09 | 2006-08-02 | キヤノン株式会社 | 画像処理装置及び光学的文字認識装置及びそれらの方法 |
KR0186172B1 (ko) * | 1995-12-06 | 1999-05-15 | 구자홍 | 문자 인식장치의 접촉문자 분리 및 특징 추출방법 |
KR19980068924A (ko) * | 1997-02-25 | 1998-10-26 | 구자홍 | 선과 겹친문자 영상복원을 이용한 필기체 인식 방법 |
KR19990056813A (ko) * | 1997-12-29 | 1999-07-15 | 구자홍 | 개별문자의 가로/세로비를 이용한 접촉문자 분리방법 |
-
1999
- 1999-07-30 JP JP21715199A patent/JP4392907B2/ja not_active Expired - Fee Related
-
2000
- 2000-06-06 EP EP00304765A patent/EP1073002B1/en not_active Expired - Lifetime
- 2000-06-06 DE DE60024535T patent/DE60024535T2/de not_active Expired - Lifetime
- 2000-06-15 KR KR10-2000-0032889A patent/KR100383858B1/ko not_active IP Right Cessation
- 2000-07-26 CN CNB001219472A patent/CN1192324C/zh not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100872983B1 (ko) * | 2001-12-22 | 2008-12-08 | 주식회사 포스코 | 슬래브의 문자인식 및 확인용 장치 |
KR100977713B1 (ko) * | 2003-03-15 | 2010-08-24 | 삼성전자주식회사 | 영상신호의 글자 인식을 위한 전처리 장치 및 방법 |
US9449418B2 (en) | 2010-01-22 | 2016-09-20 | Samsung Electronics Co., Ltd | Method and apparatus for creating animation message |
US9600920B2 (en) | 2010-01-22 | 2017-03-21 | Samsung Electronics Co., Ltd | Method and apparatus for creating animation message |
Also Published As
Publication number | Publication date |
---|---|
CN1192324C (zh) | 2005-03-09 |
JP2001043313A (ja) | 2001-02-16 |
EP1073002A3 (en) | 2003-10-29 |
JP4392907B2 (ja) | 2010-01-06 |
CN1291756A (zh) | 2001-04-18 |
EP1073002B1 (en) | 2005-12-07 |
KR100383858B1 (ko) | 2003-05-14 |
DE60024535D1 (de) | 2006-01-12 |
EP1073002A2 (en) | 2001-01-31 |
DE60024535T2 (de) | 2006-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US4757551A (en) | Character recognition method and system capable of recognizing slant characters | |
JP6268023B2 (ja) | 文字認識装置およびその文字切り出し方法 | |
JP4658848B2 (ja) | 文字列認識方法及び文字列認識装置 | |
KR100383858B1 (ko) | 문자인식장치의 문자추출방법 및 장치 | |
KR100315531B1 (ko) | 패턴추출장치 | |
CN107766854A (zh) | 一种基于模板匹配实现快速页码识别的方法 | |
JPH09311905A (ja) | 行検出方法および文字認識装置 | |
JP4244692B2 (ja) | 文字認識装置及び文字認識プログラム | |
KR0186172B1 (ko) | 문자 인식장치의 접촉문자 분리 및 특징 추출방법 | |
JP2001109887A (ja) | 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 | |
JP2827960B2 (ja) | 宛名行抽出装置 | |
JP2993533B2 (ja) | 情報処理装置及び文字認識装置 | |
JPH07160810A (ja) | 文字認識装置 | |
JPS5850078A (ja) | 文字認識装置 | |
JP2003317107A (ja) | 罫線抽出方法及び装置 | |
KR20220168787A (ko) | 만주어의 글자 추출 방법 및 이를 수행하는 시스템 | |
JPH04260980A (ja) | 図形認識装置 | |
KR970004539B1 (ko) | 문자인식장치의 접촉문자 분리방법 | |
KR100977252B1 (ko) | 슬래브 영상의 관리번호 자동 추출 방법 | |
JP2000113101A (ja) | 文字切り出し方法および装置 | |
JPH0877293A (ja) | 文字認識装置および文字認識用辞書作成方法 | |
JPH05135204A (ja) | 文字認識装置 | |
JPH0816720A (ja) | 文字認識装置 | |
JPH03122786A (ja) | 光学的文字読取装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment | ||
FPAY | Annual fee payment | ||
LAPS | Lapse due to unpaid annual fee |