[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

KR20060135487A - 문자 사전을 위한 학습 기능을 가진 정보 처리 장치 - Google Patents

문자 사전을 위한 학습 기능을 가진 정보 처리 장치 Download PDF

Info

Publication number
KR20060135487A
KR20060135487A KR1020060023136A KR20060023136A KR20060135487A KR 20060135487 A KR20060135487 A KR 20060135487A KR 1020060023136 A KR1020060023136 A KR 1020060023136A KR 20060023136 A KR20060023136 A KR 20060023136A KR 20060135487 A KR20060135487 A KR 20060135487A
Authority
KR
South Korea
Prior art keywords
character
information
processing unit
image
address
Prior art date
Application number
KR1020060023136A
Other languages
English (en)
Inventor
아끼히꼬 나까오
분뻬이 이리에
šœ지 아리요시
히데오 호리우찌
다꾸마 아까기
야스히로 아오끼
도모유끼 하마무라
마사야 마에다
Original Assignee
가부시끼가이샤 도시바
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시끼가이샤 도시바 filed Critical 가부시끼가이샤 도시바
Publication of KR20060135487A publication Critical patent/KR20060135487A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)
  • Sorting Of Articles (AREA)

Abstract

검색 처리부(102)는, 제 1 문자 열, 예를 들어, 입력 장치(13)를 통해 입력된 우편 번호를 검색 키로서 사용하여, 주소에 대응되는 제 2 문자 열을 위해 주소 데이터베이스에 저장된 정보를 검색한다. 문자 인식 처리부(104)는, 문자 사전 저장부(103)에 저장된 문자 사전을 사용해, 이미지의 소정 영역에 대한 문자 인식을 수행하고, 이름 또는 명칭, 우편 번호, 주소 등을 포함하는 문자 열을 위한 후보들을 발생시킨다. 문자 이미지 선택 처리부(105)는, 발생된 후보들로부터, 검색된 제 2 문자 열에 대응되는 문자 열을 선택한다. 문자 이미지 저장부(106)는 선택된 문자 열을 구성하는 문자들 각각과 그것에 관한 문자 이미지간의 상관 관계를 저장한다. 문자 사전 학습 처리부(107)는, 각각의 문자와 그것에 관한 문자 이미지간의 상관 관계에 기초하여, 문자 사전에 대한 학습 처리를 수행한다.
문자 사전, 문자 인식, 문자 이미지, 상관 관계, 우편 번호, 문자 열, 학습 처리, 검색 키

Description

문자 사전을 위한 학습 기능을 가진 정보 처리 장치 {INFORMATION PROCESSING APPARATUS HAVING LEARNING FUNCTION FOR CHARACTER DICTIONARY}
도 1은 본 발명의 모든 실시예들에 공통적으로 사용되는 분류 머신(sorting machine)의 외관을 나타내는 도면.
도 2는 도 1에 나타낸 분류 머신의 구성을 개략적으로 나타내는 도면.
도 3은 오퍼레이터에 의해 입력된 문자 열에 기초하여, 우편물에 기재된 수신자 정보를 인식하도록 문자 사전에 대한 자동적인 학습을 수행하는, 본 발명의 제 1 실시예에 따른 시스템 구성을 나타내는 블록도.
도 4는 주소 데이터베이스에 등록된 정보의 제 1 예를 나타내는 도면.
도 5는 주소 데이터베이스에 등록된 정보의 제 2 예를 나타내는 도면.
도 6은 서신 이미지의 일례를 나타내는 도면.
도 7은 문자들의 라인을 위해 복수개의 문자-분리 후보들(character-separation candidates)이 존재하는 것을 나타내는 도면.
도 8은, 문자 인식 처리부가 수신자 주소의 라인을 처리할 때 획득되는, 문자-분리 후보들 및 문자 인식 결과들의 일례를 나타내는 도면.
도 9는 하나의 문자 코드와 관련하여 상이한 카테고리들에 해당되는 복수개 문자 이미지들이 문자 사전에 등록되는 것을 나타내는 도면.
도 10은 본 발명의 제 1 실시예에 따른 시스템의 동작을 나타내는 흐름도이다.
도 11은 도 10의 단계 S18(문자 학습 처리)에 대한 세부 처리를 나타내는 흐름도이다.
도 12는, 오퍼레이터에 의한 교수(teaching)가 전혀 없이, 우편물에 기재된 수신자 정보를 인식하도록 문자 사전에 대한 자동적인 학습을 수행하는, 본 발명의 제 2 실시예에 따른 시스템 구성을 나타내는 블록도이다.
도 13은 수신자 이름을 검색 키로서 사용하는 주소 검색을 가능하게 하는 주소 데이터베이스를 나타내는 도면이다.
도 14는 전화 번호를 검색 키로서 사용하는 주소 검색을 가능하게 하는 주소 데이터베이스를 나타내는 도면이다.
도 15는 본 발명의 제 2 실시예에 따른 시스템의 동작을 나타내는 흐름도이다.
도 16은, 오퍼레이터에 의해 입력된 문자 열에 기초하여, 우편물의 수신자 정보 기재 사항 영역(destination information description area)의 표준 위치에 대한 자동적인 학습을 수행하는, 본 발명의 제 3 실시예에 따른 시스템 구성을 나타내는 블록도이다.
도 17은 수신자 기재 사항 범위를 추정하는 처리의 일례를 나타내는 도면이다.
도 18은 수신자 우편 번호 라인의 영역과 수신자 주소 라인의 영역을 조합하 는 것에 의해 수신자 정보 기재 사항 영역이 검출되는 것을 나타내는 도면이다.
도 19는 본 발명의 제 3 실시예에 따른 시스템 동작을 나타내는 흐름도이다.
도 20은, 오퍼레이터에 의해 입력된 문자 열에 기초하여, 각각의 발신자에 대하여, 우편물상의 발신자 주소 정보 기재 사항 영역 및 수신자 정보 기재 사항 영역의 표준 위치에 대한 자동적인 학습을 수행하는, 본 발명의 제 4 실시예에 따른 시스템 구성을 나타내는 블록도이다.
도 21은 특정된 집단들(companies)에 개별적으로 전용 우편 번호들이 할당되는 것을 나타내는 도면이다.
도 22는 발신자의 이름을 검색 키로서 사용하는 주소 검색을 가능하게 하는 주소 데이터베이스를 나타내는 도면이다.
도 23은, 오퍼레이터에 의해 입력된 발신자 및 수취인의 우편 번호 정보에 기초하여, 주소 정보를 위해 주소 데이터베이스를 검색하는 플로우(flow)를 나타내는 도면이다.
도 24는 발신자-특정의 서신 포맷 정보 저장부에 저장된 다양한 정보를 나타내는 도면이다.
도 25는 수신자 우편 번호 라인의 영역과 수신자 주소 라인의 영역을 조합하는 것에 의해 수신자 정보 기재 사항 영역이 검출되는 것을 나타내는 도면이다.
도 26은 본 발명의 제 4 실시예에 따른 시스템 동작을 나타내는 흐름도이다.
* 도면의 주요 부분에 대한 부호의 설명 *
P : 우편물
3 : 스캐너
12 : 디스플레이
13 : 입력 장치
100 : 학습 처리부
101 : 주소 데이터베이스
102 : 데이터베이스 검색 처리부
103 : 문자 사전
104 : 문자 인식 처리부
105 : 문자 이미지 선택 처리부
106 : 문자 이미지 저장부
107 : 문자 사전 학습 처리부
<특허 문헌 1> 일본 특개평 제 9-57203호
<특허 문헌 2> 일본 특개평 제 9-57204호
본 발명은 주소 정보가 기재되어 있는 서신의 이미지를 캡처하고 문자 인식 처리를 수행하는 정보 처리 장치에 관한 것으로서, 좀더 구체적으로는, 문자 인식 처리에 사용할 문자 사전(character dictionary) 등을 위한 학습 기능을 가진 정보 처리 장치에 관한 것이다.
서신과 같은, 우편물에 기재된 문자들을 인식하는 문자 인식 처리에서는, 일반적으로, 이미지로부터 분리된 문자 패턴이, 미리 생성된 문자 사전과 대조 확인된다. 그 다음, 문자 사전에 기록된 서신들(letters) 중 가장 그럴듯한 글자가 문자 인식의 결과로서 판정된다.
문자 사전을 생성하기 위해서는, 각각의 문자를 위해 하나 또는 복수개의 문자 이미지들이 준비되고, 문자 이미지들에 의하여 사전 학습(dictionary learning)이 수행된다. 각각의 문자를 위해 준비되는 문자 이미지들의 수가 많을수록, 좀더 향상된 문자 사전이 준비될 수 있다. 문자 사전이 개선되어야 할 경우에는, 새로운 문자 이미지가 추가되거나 문자 이미지들의 일부가 새로운 문자 이미지로 대체된 다음, 사전 학습이 다시 수행된다.
문자 이미지들을 생성하기 위해, 오퍼레이터에게는 문자 스트링을 포함하는 이미지로부터, 하나씩, 문자들을 지정하고, 지정된 문자에 대응되는 문자 이미지를 저장할 것이 요구된다. 이러한 처리들은 수동적으로 반복 수행된다. 문자 인식 처리 기술들이 어느 정도 향상되었으므로, 이제는, 문자들이 도구에 의해 이미지로부터 자동적으로 분리되고, 문자 이미지들이 모니터 스크린에 표시되며, 오퍼레이터가 문자 이미지들에 대응되는 문자 스트링을 지정하는 방법이 이용된다.
예를 들어, 특허 문헌 1에는, 문자 인식 장치가 서신을 거부할 때, 오퍼레이터가 거부된 서신에 기재된 문자 패턴의 문자들을 입력한 다음, 문자 패턴과 정확한 문자 코드간의 상관 관계에 기초하여, 문자 사전이 갱신되는 내용이 개시되어 있다. 또한, 특허 문헌 2에는, 문자 인식 장치가 서신을 거부할 때, 오퍼레이터가 거부된 서신에 기재된 수신자(destination)의 문자 패턴의 문자들을 입력한 다음, 수신자의 문자 패턴과 정확한 수신자 코드간의 상관 관계에 기초하여, 수신자 지식 데이터베이스(destination knowledge database)가 갱신되는 내용이 개시되어 있다.
종래 기술에 따르면, 문자 인식에 사용할 문자 사전을 생성하기 위해서는, 먼저 서신의 이미지로부터 복수개 문자 이미지들을 분리하는 것이 필요하다. 그 다음, 오퍼레이터는 문자 이미지들 각각에 대하여 일련의 정확한 문자들을 하나씩 입력해야 한다. 이 처리는 오퍼레이터에게 상당한 작업량을 부과하며, 조작을 위해 상당한 시간과 비용을 요한다. 또한, 오퍼레이터에 의해 입력되는 정보에 기초한 학습 처리에 의해서만 지식 데이터베이스의 용량을 향상시키기는 어렵다.
따라서, 오퍼레이터의 작업량을 감소시키면서, 고성능 인식 처리를 수행하는 정보 처리 장치를 제공하는 것이 바람직하다.
발명의 개요
본 발명의 일 태양에 따르면, 주소 정보를 포함하는 서신 이미지를 캡처하고 문자 인식 처리를 수행하는 정보 처리 장치가 제공된다. 본 장치는 서신의 기재 사항에 사용할 주소들에 관련된 정보를 저장하는 주소 정보 저장부, 제 1 문자 열(first character series)를 주소에 대응되는 제 2 문자 열을 위한 검색 키로서 사용하여, 주소 정보 저장부에 저장되어 있는 정보를 검색하는 검색 처리부, 서신에 사용된 문자들 각각과 그것에 관한 문자 이미지간의 상관 관계를 지시하는 문자 사전을 저장하는 문자 사전 저장부, 문자 사전 저장부에 저장된 문자 사전을 사용하여, 이미지의 소정 영역에 대한 문자 인식을 수행하고, 적어도 주소를 포함하는 문자 열을 위한 후보들을 발생시키는 문자 인식 처리부, 문자 인식 처리부에 의해 발생된 후보들로부터, 검색 처리부에 의해 검색된 제 2 문자 열에 대응되는 문자 열을 선택하는 문자 이미지 선택 처리부, 및 문자 이미지 선택 처리부에 의해 선택된 문자 열을 구성하는 문자들 각각과 그것에 관한 문자 이미지간의 상관 관계에 기초하여, 문자 사전 저장부에 저장된 문자 사전에 대한 학습 처리를 수행하는 문자 사전 학습 처리부를 구비한다.
발명의 상세한 설명
명세서에 포함되어 있으며 명세서의 일부를 구성하는 첨부 도면들은 본 발명의 실시예들을 도시하며, 선행하는 일반적인 설명 및 후술되는 실시예들에 대한 상세한 설명과 함께, 본 발명의 원리들을 설명하는데 도움이 된다.
도면들을 참조하여 본 발명의 실시예들을 후술할 것이다.
다음의 실시예들 각각은, 수신자 등이 일본의 우편 기재 사항 포맷에 따라 기재된 서신들을 처리하는 정보 처리 장치의 일례를 나타내지만, 이러한 장치는 수신자 등이, 예를 들어, 미국, 한국, 독일, 프랑스, 또는 이태리에서 사용되는 상이한 우편 기재 사항 포맷에 따라 기재된 서신들을 처리하는 정보 처리 장치로 변형될 수도 있다.
도 1은 본 발명의 모든 실시예들에 공통적으로 사용되는 분류 머신(1)의 외 관이다. 도 2는 분류 머신(1)의 구성을 개략적으로 나타내는 도면이다. 분류 머신(1)은 거대한 박스-형태의 분류 머신 본체(1a)를 가진다. 분류 머신(1)은 판독 내용에 기초하여 수신자 영역 또는 부착된 실 영역(affixed seal area)을 인식하기 위해 우편물(서신;P)에 기재된 정보를 판독한다. 다음으로, 분류 머신(1)은, 인식 결과에 기초하여, 우편물(P)을 대응되는 수신자로 분류한다.
분류 머신 본체(1a)는 공급부(2), 스캐너부(3), 전달부(4), 분류부(5), 및 하우징부(6)를 포함한다. 공급부(2)로부터의 우편물(P)은 전달 경로를 통해 전달되는데, 전달부(4) 및 분류부(5)를 순차적으로 통하여 하우징부(6)로 안내된다.
공급부(2)는 우편물 P가 배치되는 배치 테이블(7;placement table) 및 우편물(P)을 배치 테이블로부터 하나씩 픽업하여 전달 경로에 공급하는 픽업부(8)를 가진다. 스캐너부(3)는 전달 경로를 통해 전달되는 우편물(P) 각각의 전체 이미지를 광학적으로 판독하여 이미지 정보를 발생시킨다. 전달부(4)는 스캐너부(3)를 통과한 우편물(P)을 분류부(5)로 전달한다. 하우징부(6)는 분류된 우편물들(P)이 수용되는 대다수의 하우징 포켓들(6a)을 가진다. 분류부(5)는, 후술되는 바와 같이, 스캐너부(3)로부터의 이미지 정보에 대한 인식 결과에 기초하여 하우징 포켓들(6a) 중 하나로 전달부(4)에 의해 공급되는 각각의 우편물(P)을 분류한다.
스캐너부(3)는, 광전 변환(photoelectric conversion)을 수행하여 시트로부터의 정보를 패턴 신호로서 판독하기 위해, 우편물(P)을 광학적으로 스캐닝하는 판독 수단이다. 스캐너부(3)는, 예를 들어, 우편물에 광을 조사하는 광원 및 반사되는 광을 수신하여 전기 신호로 변환하는 셀프-스캐닝(self-scanning) CCD 이미지 센서를 포함한다. 스캐너부(3)로부터의 출력은 정보 처리부(10)의 인식부로 공급된다.
분류 머신(1)에서, 공급부(2), 스캐너부(3), 전달부(4), 분류부(5) 및 정보 처리부(10)는 제어부(11)에 접속된다. 제어부(11)는 전체 분류 머신(1)의 동작을 제어한다. 예를 들어, 제어부(11)는 (표시되지 않은) 메모리에 저장되어 있는 분류 명세 테이블(sort specification table)을 참조하여 정보 처리부(10)의 인식(또는 판정) 결과에 대응되는 분류 명세 데이터를 판독해 낸다. 그 다음, 제어부(11)는, 우편물(P)이 하우징 포켓들(6a) 중 판독된 분류 명세 데이터(하우징 포켓(6a)의 주소)에 대응되는 하우징 포켓(6a)으로 전달되게 한다.
또한, 제어부(11)는 (표시되지 않은) 드라이버를 사용해, 전달 경로와 같은, (표시되지 않은) 전달 메커니즘부를 구동하는 것에 의해 전체적인 전달 시스템을 제어한다.
다음은 정보 처리부(10)에서 제공되는 문자 사전 등을 위한 학습을 효율적으로 실현하기 위한 각 실시예의 구조 및 동작에 대한 상세한 설명이다.
<제 1 실시예>
이하에서는, 제 1 실시예가 설명될 것이다.
도 3은, 오퍼레이터에 의해 입력된 문자 열에 기초하여, 우편물에 기재된 수신자 정보를 인식하도록 문자 사전에 대한 자동적인 학습을 수행하는, 본 발명의 제 1 실시예에 따른 시스템 구성을 나타내는 블록도이다.
이 시스템은 우편물(P)의 서신 이미지를 캡처하기 위한 스캐너부(3), 캡처된 이미지를 표시하기 위한 디스플레이(12), 오퍼레이터가 데이터를 입력하는 입력 장치(13) 및 학습 처리부(100)를 포함한다.
학습 처리부(100)는 상술된 정보 처리 장치(10)를 구현한다. 그것은 주소 데이터베이스(101), 데이터베이스 검색 처리부(102), 문자 사전 저장부(103), 문자 인식 처리부(104), 문자 이미지 선택 처리부(105), 문자 이미지 저장부(106), 및 문자 사전 학습 처리부(107)를 포함한다.
주소 데이터베이스(101)는 우편물(P)의 기재 사항에 사용할 주소들에 대한 정보를 저장한다.
데이터베이스 검색 처리부(102)는 입력 장치(13)를 통해 입력된 제 1 문자 열(예를 들어, 이름 또는 명칭, 전화 번호, 우편 번호 등)을 검색 키로서 사용하여, 주소에 대응되는 제 2 문자 열을 위해 주소 데이터베이스(101)에 저장된 정보를 검색한다.
문자 사전 저장부(103)는 우편물(P)의 기재 사항에 사용하기 위한 문자들 각각과 문자에 대응되는 문자 이미지간의 상관 관계를 지시하는 문자 사전을 저장한다. 문자 사전에는, 하나의 문자와 관련하여 복수개의 상이한 종류들의 문자 이미지들이 등록될 수 있다.
문자 인식 처리부(104)는 문자 사전 저장부(103)에 저장된 문자 사전을 사용해 이미지의 특정 영역에 대한 문자 인식을 수행하고, 이름 또는 명칭, 전화 번호, 우편 번호, 주소 등에 개별적으로 대응되는 문자 열을 위한 후보들을 발생시킨다.
문자 이미지 선택 처리부(105)는, 문자 인식 처리부(104)에 의해 발생된 후 보들로부터, 데이터베이스 검색 처리부(102)에 의해 검색되는 제 2 문자 열에 대응되는 문자 열을 선택한다. 좀더 구체적으로, 문자 이미지 선택 처리부(105)는 먼저, 문자 인식 처리부(104)에 의해 발생된 후보들로부터, 입력 장치(13)를 통해 입력된 제 1 문자 열에 대응되는 문자 열을 선택한 다음, 이미지의 선택된 문자 열 라인에 인접한 라인을 위한 후보들로부터, 제 2 문자 열에 대응되는 문자 열을 선택한다.
문자 이미지 저장부(106)는 문자 이미지 선택 처리부(105)에 의해 선택된 문자 열을 구성하는 각각의 문자들과 관련하여 문자 이미지들을 저장한다.
문자 사전 학습 처리부(107)는, 문자 이미지 저장부(106)에 저장된 문자들과 관련된 문자 이미지들간의 상관 관계에 기초하여, 문자 사전 저장부(103)에 저장되는 문자 사전을 위한 학습을 수행한다.
이하에서는, 상기한 기능들을 가진 시스템에서의 세부 처리가 설명될 것이다.
스캐너부(3)에 의해 캡처된 서신 이미지는 필요한 데이터 처리가 수행된 다음, 디스플레이(12)의 스크린에 표시된다.
오퍼레이터는 입력 장치(13)를 통해, 서신 이미지의 수신자 정보 중 일부, 예를 들어, 우편 번호 정보를 입력한다. 입력 정보는 학습 처리부(100)의 데이터베이스 검색 처리부(102)로 송신된다. 데이터베이스 검색 처리부(102)는, 입력 정보를 검색 키로서 사용하여, 주소 데이터베이스(101)를 검색한다.
도 4 및 도 5는 주소 데이터베이스에 등록된 정보의 예들을 나타낸다. 도 4 에 나타낸 예에는, 각각의 우편 번호들에 대응되는 주소 정보가 등록되어 있다. 도명(prefecture name)에서 읍명(town name)에 이르는, 우편 번호에 대응되는 주소 정보는 데이터의 그룹으로서 핸들링된다. 수신자 주소가 도명을 포함하는 경우 및 수신자 주소가 도명은 포함하지 않고 시, 읍 또는 마을명으로 시작하는 경우도 존재할 수 있다. 양자의 경우들을 처리하기 위해, 도명 정보 및 시, 읍 또는 마을명 정보가, 도 5에 나타낸 바와 같이, 별개의 데이터로서 핸들링될 수도 있다. 이 경우, 우편 번호 정보로서 "2128501"이 입력되면, 데이터베이스 검색 처리부(102)는 "Kanagawa Prefecture, Kawasaki City, Saiwai Ward, Yanagi Town" 및 "Kawasaki City, Saiwai Ward, Yanagi Town"의 2가지 데이터를 데이터베이스 검색 결과로서 획득한다.
문자 인식 처리부(104)는 스캐너부(3)에 의해 캡처된 서신 이미지를 문자 라인들 및 문자 후보들로 분리하고, 문자 사전 저장부(103)에 미리 저장된 문자 사전을 참조하여, 개개의 문자 후보들을 인식한다. 도 6은 서신 이미지의 일례를 나타낸다.
도 6에 나타낸 예에 따르면, 수신자 정보 등이 일본의 우편 기재 사항 포맷에 따라 기재되어 있다. 우편물의 발신자 주소 정보 기재 사항 영역 및 수신자 정보 기재 사항 영역 각각에는,(i) 우편 번호,(ii) 주소(도로(thoroufare), 거리명 등),(ⅲ) 이름 또는 명칭이 기재 사항 영역의 상단에서부터 이 순서대로 기재되어 있다. 다른 방법으로, 미국, 유럽 등에서는 일반적으로, (ⅲ) 이름 또는 명칭,(ii) 주소(도로, 거리명 등),(i) 우편 번호가 (표시되지 않은) 기재 사항 영역의 상단에서부터 이 순서대로 기재된다. 어떤 경우에서든, 우편 번호 라인과 주소 라인이 서로 인접한 한편, 이름 또는 명칭 라인과 주소 라인이 서로 인접한다.
문자 인식 처리부(104)에는, 도 7에 나타낸 바와 같이, 라인으로부터 분리된 복수개의 문자 후보들이 존재한다. 그러나, 오퍼레이터가 입력 장치(13)를 통해 입력한 정보가 이미지에 존재해야 하므로, 입력 정보와 동일한 인식 결과를 가진 문자 후보가 존재하는 것이 자연스럽다. 예를 들어, 오퍼레이터는, 도 6에 나타낸 서신 이미지에 기초하여, 수신자 우편 번호 "212-8501"을 입력 장치(13)를 통해, 입력한다. 이때, 문자 인식 처리부(104)는 서신 이미지로부터 6개의 문자 라인들을 검출하고, 각각의 문자 라인에 대한 문자 분리 및 문자 인식을 수행한다. 문자-분리 후보들이 정확하게 분리된 문자 이미지를 포함한다는 것을 보장하기 위해서는, 분리 알고리즘 또는 파라미터들을 변경하는 것에 의해, 하나의 문자-분리 후보가 아니라 복수개의 문자-분리 후보들이 발생되는 것이 바람직하다. 이 실시예에서는, 도 7에 나타낸 바와 같이, 3개의 문자-분리 후보들이 수신자 우편 번호 라인 "212-8501"을 위해 발생되는 것으로 가정된다.
문자 이미지 선택 처리부(105)는 입력 장치(13)를 통해 입력된 정보와 매칭되는 문자-분리 후보를 위해 문자-분리 후보들을 검색한다. 그 다음, 문자 이미지 선택 처리부(105)는 매칭되는 문자-분리 후보의 문자들에 대한 각각의 이미지들 및 그것에 관한 문자 유형들(문자 코드들 등)을 문자 이미지 저장부(106)에 저장한다. 수신자 우편 번호 라인의 문자 분리 및 문자 인식의 결과로서 획득된, 도 7에 나타낸 3개의 후보들 중에서, 최상위 후보만이 입력 정보 "212-8501"과 매칭되는 인식 결과를 가진다. 따라서, 이 후보의 문자 이미지들 및 문자 인식 결과가 문자 이미지 저장부(106)에 저장된다.
"212-8501"이 수신자 주소의 우편 번호로서 기재되면, 수신자 우편 번호에 인접한 영역에 기재된 수신자 주소 정보는 주소 데이터베이스(101)를 검색하는 것에 의해 획득되는 주소 정보와 매칭되어야 한다. 따라서, 수신자 우편 번호 라인에 인접한 영역의 문자 분리 및 문자 인식 결과가 "Kanagawa Prefecture, Kawasaki City, Saiwai Ward, Yanagi Town" 또는 "Kawasaki City, Saiwai Ward, Yanagi Town"과 대조 확인된다. 도 8은, 문자 인식 처리부(104)가 수신자 주소 라인을 처리할 때 획득되는, 문자-분리 후보들 및 문자 인식의 결과들에 대한 일례를 나타낸다. 도 8에 나타낸 예에서는, 두번째 문자-분리 후보의 문자 인식 결과가 데이터베이스(101)로부터 우편 번호 "212-8501"에 대응되는 주소 정보로서 획득되는 "Kanagawa Prefecture, Kawasaki City, Saiwai Ward, Yanagi Town"의 검색 결과와 매칭된다. 따라서, 이러한 문자 이미지들 및 문자 인식 결과가 문자 이미지 저장부(106)에 저장된다.
상술된 바와 같이, 수신자 우편 번호 라인 및 수신자 주소 라인을 구성하는 문자 이미지들과 문자 유형들에 대한 정보가 단지, 오퍼레이터에 의해 수행되는 처리, 즉, 서신의 서신 이미지를 관찰하고 거기에 기재된 수신자 우편 번호를 입력하는 것에 의해 획득된다. 각각의 서신들에 대한 문자 유형들에 대한 정보와 수신자 우편 번호 라인 및 수신자 주소 라인을 구성하는 문자 이미지들이 문자 이미지 저장부(106)에 저장되도록, 이 처리는 복수개의 서신 이미지들에 대해 반복된다.
이와 같이 문자 이미지 저장부(106)에 누적된 문자 이미지 정보는, 오퍼레이터가 교수 동작을 수행하지 않는 시간 주기에, 문자 사전 학습 처리부(107)에 의해 처리된다. 문자 사전 학습 처리부(107)에서, 문자 이미지들은 문자 유형에 의해 분류되고 문자 사전 저장부(103)에서의 문자 사전을 위한 학습 처리에 사용된다. 학습 처리 이후에, 이전의 문자 사전은 갱신된 문자 사전으로 대체된다.
일본에서의 우편물은, Mincho 활자체와 같은, 다양한 활자체들의 인쇄 문자들 또는, 예를 들어, 필기체 스타일로 기재된 수기 문자들(handwritten characters)을 포함할 수 있다. 따라서, 문자 이미지 저장부(106)는 동일한 문자, 예를 들어, "아침"을 의미하는 한자를 표현하는 문자들의 다양한 카테고리들을 저장할 수 있다. 문자 이미지 저장부(106)가, 문자 사전에 기록되지 않은 문자 유형에 대응되는 문자 이미지를 저장하면, 그 문자 이미지는, 대응되는 문자와 관련하여 문자 사전에 추가적으로 저장된다. 예를 들어, 도 9를 참조하면, Mincho 스타일의 문자 이미지가 문자 코드 03611과 관련하여 등록되었을 경우, 필기체 스타일(cursive style)과 같은, Mincho 스타일과는 상이한 카테고리의 문자 이미지가 문자 이미지 저장부(106)에 저장되면, "아침"을 의미하는 한자를 표현하는 문자 코드 03611와 관련하여 상이한 카테고리의 문자 이미지가 추가적으로 등록된다.
도 10에 나타낸 흐름도를 참조하여, 이 실시예에 따른 시스템의 동작이 후술될 것이다.
문자 이미지가 스캐너부(3)를 통해 캡처되면, 이미지는 필요한 처리가 수행되어 디스플레이(12)의 스크린에 표시된다(단계 S11).
디스플레이에 표시된 서신 이미지를 관찰한 오퍼레이터가 제 1 문자 열(우편 번호 등)을 입력하면, 데이터베이스 검색 처리부(102)는 문자 열을 획득한다(단계 S12).
데이터베이스 검색 처리부(102)는, 제 1 문자 열을 검색 키로서 사용하여, 주소를 지시하는 제 2 문자 열을 위해 주소 데이터베이스(101)를 검색한다(단계 S13).
문자 인식 처리부(104)는 이미지로부터 문자들을 분리하고, 문자 사전을 참조하여 문자들을 인식하며, 문자 열을 위한 후보들을 발생시킨다(단계 S14).
문자 이미지 선택 처리부(105)는 문자 인식 처리부(104)에 의해 발생된 후보들로부터 제 1 문자 열에 대응되는 문자 열을 선택한 다음(단계 S15), 앞서 선택된 문자 열 라인에 인접한 라인을 위한 후보들로부터, 데이터베이스 검색 처리부(102)에 의해 획득되는, 제 2 문자 열에 대응되는 문자 열을 선택한다(단계 S16).
문자 이미지 저장부(106)는 문자 이미지 선택 처리부(105)에 의해 선택된 문자 열을 구성하는 각각의 문자들과 관련하여 문자 이미지들을 저장한다(단계 S17).
문자 사전 학습 처리부(107)는 문자 이미지 저장부(106)에 저장된 문자들과 관련된 문자 이미지들간의 상관 관계에 기초하여 문자 사전을 위한 학습을 수행한다(단계 S18).
도 11의 흐름도를 참조하여, 도 10의 단계 S18에서의 세부 처리(문자 학습 처리)가 설명될 것이다.
i-개의 문자들(i = 1 내지 n) 및 그것에 관한 문자 이미지들이 문자 이미지 저장부(106)로부터 순차적으로 판독되고(단계 S1), 한 문자씩 후속 처리가 수행된다.
인식될 문자들의 수를 표현하는 변수 i는, 소정의 메모리 영역을 사용하여, 1로 설정된다(단계 S2).
변수 i가 n을 초과하는지의 여부, 즉, 모든 문자들이 연구되었는지의 여부가 판정된다(단계 S3). 아니라면(단계 S3에서 아니오라면), 연구되는 i-번째 문자 및 그것에 관한 문자 이미지가 문자 사전을 참조하여 비교된다(단계 S4). 다음으로는, 문자 사전이 대응되는 문자를 포함하는지의 여부가 판정된다(단계 S5). 아니라면(단계 S5에서 아니오라면), 연구된 i-번째 문자와 그것에 관한 문자 이미지의 조합은 새로운 것으로 인식되어 문자 사전에 등록된다(단계 S6). 다음으로는, 소정 메모리 영역의 변수 i에 1이 가산되고, 처리는 단계 S3으로부터 반복된다.
대응되는 문자가 단계 S5에서 발견되면(단계 S5에서 예라면), 그 문자와 유사한 문자 이미지 또한 문자 사전에 존재하는지의 여부가 판정된다(단계 S7). 유사한 문자 이미지가 존재하면, 문자 이미지가 이미 등록되었으므로, 등록이 새롭게 수행되지 않는다. 다음으로는, 소정 메모리 영역의 변수 i에 1이 가산되고, 처리는 단계 S3으로부터 반복된다.
대응되는 문자가 단계 S5에서 발견되고(단계 S5에서 예이고) 그 문자와 유사한 문자 이미지가 단계 S7에서 발견되지 않으면(단계 S7에서 아니오라면), 그 문자 이미지는 등록된 문자 이미지들과 카테고리가 상이한 것으로 판정되고, 연구될 i-번째 문자와 그것에 관한 문자 이미지의 조합이 추가적으로 등록된다(단계 S8). 문자에 대응되는 사전-등록된 문자 이미지가 불필요하면, 등록된 문자 이미지에 새로운 문자 이미지를 겹쳐쓰기하기 위한 업데이트 처리가 수행될 수도 있다. 도 11에서는, 단계 S7에서, 유사한 문자 이미지가 존재한다고 판정되면, 등록이 새롭게 수행되지 않는 것을 나타내지만, 동일한 카테고리를 위해 복수개의 문자 이미지들이 등록될 수 있도록, 이와 같은 등록이 수행될 수도 있다. 이 경우, 그 후에는, 복수개 문자 이미지들의 평균적인 특징을 수반하는 하나의 문자 이미지가 새롭게 발생될 수도 있으며, 발생된 이미지가, 대응되는 카테고리를 위한 문자 사전으로서 주로 사용될 수도 있다. 이러한 단계들 후에는, 소정 메모리 영역의 변수 i에 1이 가산되고, 처리는 단계 S3으로부터 반복된다.
도 11을 참조하여 설명된 처리는, 다음에서 설명될, 다른 실시예들에도 적용될 수 있다.
상술된 바와 같이, 제 1 실시예에 따르면, 오퍼레이터에 의해 입력된 문자 열을 키워드로서 사용하여 주소 데이터베이스가 검색되고, 키워드에 대응되는 주소 정보가 검색되며, 주소 정보와 매칭되는 문자 인식 결과가 선택되고, 그 위치에 배치된 문자 라인을 위한 문자 후보들 각각으로부터 문자 패턴이 분리되며, 인식 결과가 문자 사전을 위한 학습에 사용된다. 문자 사전을 위한 학습은 오퍼레이터에 의해 입력되지 않은 문자에 대해서도 수행되며, 문자 분리 위치는 오퍼레이터에 의해 입력된 정보에 기초하여 특정된다. 따라서, 문자 사전을 위한 문자 분리 및 학습이 자동적으로 수행될 수 있다. 그 결과, 상당히 향상된 문자 사전이 용이하게 생성될 수 있다.
<제 2 실시예>
이하에서는, 본 발명의 제 2 실시예가 설명될 것이다.
도 12는, 오퍼레이터에 의한 교수가 전혀 없는 상태에서, 우편물에 기재된 수신자 정보를 인식하도록 문자 사전에 대한 자동적인 학습을 수행하는, 본 발명의 제 2 실시예에 따른 시스템 구성을 나타내는 블록도이다.
이 시스템은 우편물(P)의 서신 이미지를 캡처하기 위한 스캐너부(3) 및 학습 처리부(200)를 포함한다. 제 1 실시예 뿐만 아니라, 제 2 실시예도 도 6에 나타낸 서신 이미지가 입력된다는 가정에서 설명될 것이다.
학습 처리부(200)는 상술된 정보 처리 장치(10)를 구현한다. 학습 처리부(200)는 주소 데이터베이스(201), 문자 사전 저장부(202), 문자 인식 처리부(A)(203), 문자 인식 처리부(B)(204), 데이터베이스 검색 처리부(205), 문자 이미지 선택 처리부(206), 문자 이미지 저장부(207), 및 문자 사전 학습 처리부(208)를 포함한다.
주소 데이터베이스(201)는 우편물(P)상의 기재 사항에 사용할 주소들에 대한 정보를 저장한다.
문자 사전 저장부(202)는 우편물(P)상의 기재 사항에 사용할 문자들 각각과 문자에 대응되는 문자 이미지간의 상관 관계를 지시하는 문자 사전을 저장한다. 문자 사전에는, 하나의 문자와 관련하여 복수개의 상이한 종류들의 문자 이미지들이 등록될 수 있다.
문자 인식 처리부(A)(203)는 문자 사전 저장부(202)에 저장된 문자 사전을 사용해 이미지의 특정 영역에 대한 문자 인식을 수행하고, 제 1 문자 열(이름 또는 명칭, 전화 번호, 우편 번호 등)를 위한 후보들을 발생시킨다.
문자 인식 처리부(B)(204)는 이미지상의 제 1 문자 열 라인에 인접한 라인으로부터의 주소에 대응되는 제 2 문자 열을 위한 후보들을 발생시킨다.
데이터베이스 검색 처리부(205)는 문자 인식 처리부(A)(203)에 의해 발생된 제 1 문자 열(예를 들어, 이름 또는 명칭, 전화 번호, 우편 번호 등)를 검색 키로서 사용하여, 주소에 대응되는 제 2 문자 열을 위해 주소 데이터베이스(201)에 저장된 정보를 검색한다.
문자 이미지 선택 처리부(206)는 문자 인식 처리부(B)(204)에 의해 발생된 후보들로부터 데이터베이스 검색 처리부(205)에 의해 검색된 제 2 문자 열에 대응되는 문자 열을 선택한다.
문자 이미지 저장부(207)는 문자 이미지들을 문자 이미지 선택 처리부(206)에 의해 선택된 문자 열을 구성하는 각각의 문자들과 관련하여 저장한다.
문자 사전 학습 처리부(208)는 문자 이미지 저장부(207)에 저장된 문자들과 그 관련된 문자 이미지들간의 상관 관계에 기초하여 문자 사전 저장부(202)에 저장되는 문자 사전을 위한 학습을 수행한다.
이하에서는 상기 기능들을 가진 시스템에서의 세부 처리가 설명될 것이다.
문자 인식 처리부(A)(203)는 스캐너부(3)에 의해 캡처된 서신 이미지를 문자 라인들 및 문자 후보들로 분리하고, 문자 사전 저장부(202)에 미리 저장된 문자 사전을 참조하여 각각의 문자 후보들을 인식한다. 다음으로, 문자 인식 처리부 (A)(203)는 소정 특징을 가진 문자 열을 검출한다. 예를 들어, 우편 번호가 소정 특징을 가진 문자 열로서 사용될 수도 있다. 우편 번호가 문자 열로서 사용된다면, 이미지로부터 7개 숫자들로 이루어진 문자 라인이 검출된다. 도 6에 나타낸 서신 이미지의 경우, "001-0000" 및 "212-8501"이 검출된다.
문자 인식 처리부(A)(203)에 의해 검출된 문자 열은 데이터베이스 검색 처리부(205)로 송신된다. 데이터베이스 검색 처리부(205)는 문자 인식 처리부(A)(203)로부터 송신된 정보를 검색 키로서 사용하여 주소 데이터베이스(201)를 검색한다. 주소 데이터베이스(201)에 등록된 정보가 도 4에 나타낸 바와 같다고 가정하면, "212-8501"을 위한 검색 결과는 "Kanagawa Prefecture, Kawasaki City, Saiwai Ward, Yanagi Town"이고 "001-0000"을 위한 검색 결과는 "Hokkaido, Sapporo City, Kita Ward"이다.
우편 번호로서 인식될 수 없거나, 우편 번호로서 인식될 수는 있지만 주소 데이터베이스(201)에 등록되지 않은 라인이 존재한다면, 그 라인은 우편 번호 라인으로 인식되지 않는다.
우편 번호 라인이 검출되면, 우편 번호 라인에 인접한 라인이 문자 인식 처리부(B)(204)에 의해 처리된다. 문자 인식 처리부(B)(204)는 문자 후보들을 분리하고, 문자 사전 저장부(202)에 미리 저장된 문자 사전을 참조하여 문자 후보들을 인식한다.
문자 이미지 선택 처리부(206)는, 문자 인식 처리부(B)(204)에 의해 검출된 문자 분리 후보들 중 어떤 것이 주소 데이터베이스(201)를 검색하는 것에 의해 획 득되는 주소 정보와 매칭되는지의 여부를 점검한다. 예를 들어, 문자 인식 처리부(A)(203)가 "212-8501"을 우편 번호로서 검출하면, 주소 정보 "Kanagawa Prefecture, Kawasaki City, Saiwai Ward, Yanagi Town"이 도 4에 나타낸 데이터베이스로부터 획득된다. 다음으로, 문자 이미지 선택 처리부(206)는, 획득된 주소 정보가 문자 인식 처리부(B)(204)에 의해 획득된 문자 인식 결과들 또는 문자 분리 후보들중 어느 하나와 매칭되는지의 여부를 점검한다. 문자 인식 처리부(B)(204)에 의한 처리의 결과가 도 8에 나타낸 바와 같다면, 두번째 문자-분리 후보의 문자 인식 결과 및 대응되는 문자 인식 결과가 점검의 결과로서 선택된다. 다음으로는, 문자 이미지 및 문자 인식 결과가 문자 이미지 저장부(207)에 저장된다.
상술된 바와 같이, 수신자 우편 번호 라인 및 수신자 주소 라인을 구성하는 문자 이미지들과 문자 유형들에 관한 정보가 한 장의 서신 이미지상에 반드시 기재되는 정보, 예를 들어, 우편 번호를 검출하는 처리에 의해서만 획득된다. 각각의 서신 이미지 상의 문자 유형들에 대한 정보와 수신자 우편 번호 라인 및 수신자 주소 라인을 구성하는 문자 이미지들이 문자 이미지 저장부(207)에 저장되도록, 이 처리는 복수개 서신 이미지들에 대해 반복된다.
이와 같이 문자 이미지 저장부(207)에 누적된 문자 이미지 정보는, 서신 이미지 인식 처리가 수행되지 않는 시간 주기에, 문자 사전 학습 처리부(208)에 의해 처리된다. 문자 사전 학습 처리부(208)에서는, 문자 이미지들이 문자 유형에 의해 분류되어 문자 사전 저장부(202)의 문자 사전을 위한 학습 처리에 사용된다. 학습 처리 이후에, 선행 문자 사전은 갱신된 문자 사전으로 대체된다.
상기 설명에서는, 우편 번호를 검색 키로서 사용하는 것에 의한 주소 검색을 가능하게 하는 정보를 저장하는 주소 데이터베이스가 예시된다. 그러나, 도 13에 나타낸 바와 같이, 이름을 검색 키로서 사용하는 것에 의한 주소 검색을 가능하게 하는 정보를 저장하는 주소 데이터베이스를 사용할 수도 있다. 다른 방법으로는, 도 14에 나타낸 바와 같이, 전화 번호를 검색 키로서 사용하는 것에 의한 주소 검색을 가능하게 하는 정보를 저장하는 주소 데이터베이스를 사용할 수도 있다.
다음에서는, 도 15를 참조하여, 이 실시예에 따른 시스템의 동작이 설명될 것이다.
스캐너부(3)를 통해 서신 이미지가 캡처되면(단계 S21), 문자 인식 처리부(A)(203)는 이미지로부터 문자들을 분리하고, 문자 사전을 참조하여 문자들을 인식하며, 문자 열을 위한 후보들, 특히 제 1 문자 열(우편 번호 등)을 위한 후보들을 발생시킨다(단계 S22).
데이터베이스 검색 처리부(205)는, 문자 인식 처리부(A)에 의해 발생된 제 1 문자 열을 검색 키로서 사용하여, 주소를 지시하는 제 2 문자 열을 위해 주소 데이터베이스를 검색한다(단계 S23).
문자 인식 처리부(B)(204)는 문자 인식 처리부(A)(203)에 의해 발생된 제 1 문자 열의 이미지에서의 라인에 인접한 라인상의 문자 열을 인식하고, 그 문자 열을 위한 후보들을 발생시킨다. 다음으로, 문자 인식 처리부(B)(204)는 발생된 후보들로부터, 데이터베이스 검색 처리부(205)에 의해 획득되는, 제 2 문자 열에 대응되는 문자 열을 선택한다(단계 S24).
문자 이미지 저장부(207)는 문자 이미지 선택 처리부(206)에 의해 선택된 문자 열을 구성하는 각각의 문자들과 관련한 문자 이미지들을 저장한다(단계 S25).
문자 사전 학습 처리부(208)는, 문자 이미지 저장부(207)에 저장된 문자들과 그와 관련된 문자 이미지들간의 상관 관계에 기초하여, 문자 사전을 위한 학습을 수행한다(단계 S26).
상술된 제 2 실시예에 따르면, 문자 사전을 위한 학습은, 오퍼레이터가 입력 장치를 통해 우편 번호 정보 등을 입력하지 않는 경우라 하더라도, 우편물상의 기재 사항 등에 기초하여 자동적으로 수행될 수 있다. 따라서, 오퍼레이터에게 작업량을 부과하지 않으면서도, 상당히 향상된 문자 사전이 용이하게 생성될 수 있다.
상술된 제 1 및 제 2 실시예들에 따른 문자 사전을 위한 학습의 구성 및 동작은 후술될 제 3 및 제 4 실시예들에도 적용될 수 있다.
<제 3 실시예>
이하에서는 본 발명의 제 3 실시예가 설명될 것이다.
도 16은, 오퍼레이터에 의해 입력된 문자 열에 기초하여 우편물상의 수신자 정보 기재 사항의 표준 위치에 대한 자동적인 학습을 수행하는, 본 발명의 제 3 실시예에 따른 시스템 구성을 나타내는 블록도이다.
이 시스템은 우편물(P)의 서신 이미지를 캡처하기 위한 스캐너부(3), 캡처된 이미지를 표시하기 위한 디스플레이(12), 오퍼레이터가 데이터를 입력하는 입력 장치(13) 및 학습 처리부(300)를 포함한다.
학습 처리부(300)는 상술된 정보 처리 장치(10)를 구현한다. 학습 처리부 (300)는 주소 데이터베이스(301), 데이터베이스 검색 처리부(302), 문자 사전 저장부(303), 수신자 주소 영역 파라미터 저장부(304), 수신자 주소 영역 판정 처리부(305), 문자 인식 처리부(306), 문자 이미지 선택 처리부(307), 수신자 주소 영역 정보 저장부(308), 및 주신지 주소 영역 파라미터 학습 처리부(309)를 포함한다.
주소 데이터베이스(301)는 우편물(P)의 기재 사항에 사용할 주소들에 대한 정보를 저장한다.
데이터베이스 검색 처리부(302)는, 입력 장치(13)를 통해 입력된 제 1 문자 열(예를 들어, 이름 또는 명칭, 전화 번호, 우편 번호 등)를 검색 키로서 사용하여, 주소에 대응되는 제 2 문자 열을 위해 주소 데이터베이스(301)에 저장된 정보를 검색한다.
문자 사전 저장부(303)는 우편물(P)의 기재 사항에 사용할 문자들 각각과 문자에 대응되는 문자 이미지간의 상관 관계를 지시하는 문자 사전을 저장한다. 문자 사전에는, 하나의 문자와 관련하여 복수개의 상이한 종류들의 문자 이미지들이 등록될 수 있다.
수신자 주소 영역 파라미터 저장부(304)는 이미지의 수신자 주소 영역을 표현하는 수신자 주소 영역 정보(파라미터)를 저장한다.
수신자 주소 영역 판정 처리부(305)는, 수신자 주소 영역 파라미터 저장부(304)에 저장된 수신자 주소 영역 정보(파라미터)에 기초하여, 문자 인식 처리부(306)가 문자 인식을 수행해야 할 영역을 판정한다.
문자 인식 처리부(306)는 문자 사전 저장부(303)에 저장된 문자 사전을 사용 해 수신자 주소 영역 판정 처리부(305)에 의해 판정된 영역의 문자 인식을 수행하고, 이름 또는 명칭, 전화 번호, 우편 번호, 주소 등에 각각 대응되는 문자 열을 위한 후보들을 발생시킨다.
문자 이미지 선택 처리부(307)는 문자 인식 처리부(306)에 의해 발생된 후보들로부터 데이터베이스 검색 처리부(302)에 의해 검색되는 제 2 문자 열에 대응되는 문자 열을 선택한다. 좀더 구체적으로, 문자 이미지 선택 처리부(307)는 먼저 문자 인식 처리부(306)에 의해 발생된 후보들로부터 입력 장치(13)를 통해 입력된 제 1 문자 열에 대응되는 문자 열을 선택한 다음, 이미지의 선택된 문자 열 라인에 인접한 라인을 위한 후보들로부터 제 2 문자 열에 대응되는 문자 열을 선택한다.
수신자 주소 영역 정보 저장부(308)는 문자 이미지 선택 처리부(307)에 의해 선택된 제 1 문자 열 및 제 2 문자 열의 영역들 각각을 표현하는 정보(파라미터)를 저장한다.
수신자 주소 영역 파라미터 학습 처리부(309)는, 수신자 주소 영역 정보 저장부(308)에 저장된 각각의 영역들을 표현하는 정보(파라미터)에 기초하여, 수신자 주소 영역 파라미터 저장부(304)에 저장된 수신자 주소 영역 정보(파라미터)에 대한 학습을 수행한다.
이하에서는 상기 펑크션들을 가진 시스템에서의 세부 처리가 설명될 것이다.
스캐너부(3)에 의해 캡처된 서신 이미지는 필요한 데이터 처리가 수행된 다음, 디스플레이(12)의 스크린에 표시된다.
오퍼레이터는 입력 장치(13)를 통해 서신 이미지의 수신자 정보 중 일부, 예 를 들어, 우편 번호 정보를 입력한다. 입력 정보는 학습 처리부(300)의 데이터베이스 검색 처리부(302)로 송신된다. 데이터베이스 검색 처리부(302)는 입력 정보를 검색 키로서 사용하여 주소 데이터베이스(301)를 검색한다.
도 4 및 도 5는 주소 데이터베이스에 등록된 정보의 예들을 나타낸다. 도 4에 나타낸 예에는, 각각의 우편 번호들에 대응되는 주소 정보가 등록되어 있다. 도명에서 읍명에 이르는, 우편 번호에 대응되는 주소 정보는 데이터의 그룹으로서 핸들링된다. 수신자 주소가 도명을 포함하는 경우 및 수신자 주소가 도명을 포함하지 않으면서 시, 읍 또는 마을명으로 시작하는 경우도 존재할 수 있다. 양자의 경우들을 처리하기 위해, 도명 정보 및 시, 읍 또는 마을명 정보가, 도 5에 나타낸 바와 같이, 별개의 데이터로서 핸들링될 수도 있다. 이 경우, 우편 번호 정보로서 "2128501"이 입력되면, 데이터베이스 검색 처리부(302)는 "Kanagawa Prefecture, Kawasaki City, Saiwai Ward, Yanagi Town" 및 "Kawasaki City, Saiwai Ward, Yanagi Town"의 2가지 데이터를 데이터베이스 검색 결과로서 획득한다.
수신자 주소 영역 판정 처리부(305)는, 수신자 주소 영역 파라미터 저장부(304)에 저장된 수신자 주소 영역에 관련된 다양한 파라미터들에 기초하여, 서신 이미지의 수신자 기재 사항 범위를 추정한다. 도 17은 수신자 기재 사항 범위를 추정하는 처리의 일례를 나타낸다. 도 17에서, 참조 번호 17A는 서신 이미지를 지시한다. 서신 이미지(17B)의 점선으로 둘러싸인 영역은 수신자 주소 영역 파라미터 저장부(304)에 저장된 파라미터 정보에 기초하여 추정되는 주소 기재 사항 영역이다.
문자 인식 처리부(306)는 도 17의 서신 이미지(17B)에서 주소 기재 사항 영역으로 추정되는 범위를 문자 라인들 및 문자 후보들로 분리하고, 문자 사전 저장부(303)에 미리 저장된 문자 사전을 참조하여 각각의 문자 후보들을 인식한다. 도 17의 서신 이미지(17C)는 주소 기재 사항 영역으로부터 라인들이 분리되는 상태를 나타낸다. 문자 인식 처리부(306)는 입력 장치(13)를 통해 오퍼레이터에 의해 입력된 문자 열, 예를 들어, 수신자 주소의 우편 번호와 매칭되는 문자 열을 검출한다. 도 17의 서신 이미지(17C)의 경우, 라인 "212-8501"이 검출된다.
"212-8501"이 수신자 주소의 우편 번호로서 검출되면, 수신자 우편 번호에 인접한 영역에 기재된 수신자 주소 정보는 주소 데이터베이스(301)를 검색하는 것에 의해 획득되는 주소 정보와 매칭되어야 한다. 따라서, 문자 이미지 선택 처리부(307)는 수신자 우편 번호에 인접한 영역에 대한 문자 분리 및 문자 인식의 결과를 "Kanagawa Prefecture, Kawasaki City, Saiwai Ward, Yanagi Town" 또는 "Kawasaki City, Saiwai Ward, Yanagi Town"과 대조 확인한다. 도 8은, 문자 인식 처리부(306)가 수신자 주소 라인을 처리할 때 획득되는, 문자-분리 후보들 및 문자 인식의 결과들에 대한 일례를 나타낸다. 도 8에 나타낸 예에서는, 두번째 문자-분리 후보의 문자 인식 결과가 데이터베이스(301)로부터 우편 번호 "212-8501"에 대응되는 주소 정보로서 획득되는 "Kanagawa Prefecture, Kawasaki City, Saiwai Ward, Yanagi Town"의 검색 결과와 매칭된다. 따라서, 이 라인이 수신자 주소 라인이라고 판정된다.
수신자 우편 번호 라인 및 수신자 주소 라인의 위치들이 검출될 때, 수신자 주소 영역 정보 저장부(308)는 서신의 수신자 정보 기재 사항 영역에 대한 정보를 저장한다. 수신자 정보 기재 사항 영역은, 예를 들어, 도 18에 나타낸 방법에 의해 검출된다. 이 방법에서는, 도 18의 서신 이미지(18A)에서 검출된 수신자 우편 번호 라인 및 수신자 주소 라인의 영역들이 도 18의 서신 이미지(18B)에 나타낸 바와 같이 조합됨으로써, 수신자 정보 기재 사항 영역이 검출된다.
상술된 바와 같이, 수신자 주소 정보가 기재되는 영역에 대한 정보가 단지 오퍼레이터에 의해 수행되는 처리, 즉, 서신의 서신 이미지를 관찰하고 거기에 기재된 수신자 우편 번호를 입력하는 것에 의해 획득된다. 각각의 서신들의, 수신자 정보 기재 영역의 정보가 문자 이미지 저장부(308)에 저장되도록, 이 처리는 복수개의 서신 이미지들에 대해 반복된다.
이와 같이 문자 이미지 저장부(308)에 누적된 수신자 정보 기재 사항 영역에 대한 다양한 정보는, 오퍼레이터가 교수 동작을 수행하지 않는 시간 주기에, 수신자 주소 영역 파라미터 학습 처리부(309)에 의해 처리된다. 수신자 주소 영역 파라미터 학습 처리부(309)에서는, 수신자 주소 영역 정보 저장부(308)에 저장된 정보에 기초하여, 수신자 정보의 표준 기재 사항 위치 또는 사이즈에 대한 정보를 위한 학습이 수행된다. 학습 처리 이후에, 수신자 주소 영역 파라미터 저장부(304)에 저장되어 있는 선행 파라미터는 갱신된 파라미터로 대체된다.
이하에서는, 도 19에 나타낸 흐름도를 참조하여, 이 실시예에 따른 시스템 동작을 설명할 것이다.
서신 이미지가 스캐너부(3)를 통해 캡처되면(단계 S31), 수신자 주소 영역 판정 처리부(305)는 수신자 주소 영역 정보(파라미터)에 기초하여 수신자 주소 영역을 판정한다(단계 S32).
다음으로는, 문자 인식 처리부(306) 및 문자 이미지 선택 처리부(307) 등이, 수신자 주소 영역 판정 처리부(305)에 의해 판정되는 수신자 주소 영역과 관련하여, 도 10을 참조하여 상술된 단계들(S12 내지 S16)의 처리를 수행한다.
수신자 주소 영역 정보 저장부(308)에는, 문자 이미지 선택 처리부(307)에 의해 선택되는 문자 열의 영역들을 조합하는 것에 의해 형성되는, 수신자 주소 영역에 대한 정보(파라미터)가 저장된다(단계 S33).
수신자 주소 영역 파라미터 학습 처리부(309)는, 수신자 주소 영역 정보 저장부(308)에 저장된 수신자 주소 영역의 정보(파라미터)에 기초하여, 수신자 주소 영역의 표준 위치에 대한 학습을 수행한다.
상술된 바와 같이, 제 3 실시예에 따르면, 문자 사전에 대한 학습 뿐만 아니라 수신자 주소 영역의 표준 위치에 대한 학습도 자동적으로 수행될 수 있다. 따라서, 상당히 향상된 문자 사전이 용이하게 생성될 수 있다.
<제 4 실시예>
이하에서는 본 발명의 제 4 실시예가 설명될 것이다.
도 20은, 오퍼레이터에 의해 입력된 문자 열에 기초하여, 각각의 발신자에 대하여, 우편물상의 발신자 주소 정보 기재 사항 영역 및 수신자 정보 기재 사항 영역의 표준 위치에 대한 자동적인 학습을 수행하는, 본 발명의 제 4 실시예에 따른 시스템 구성을 나타내는 블록도이다.
이 시스템은 우편물(P)의 서신 이미지를 캡처하기 위한 스캐너부(3), 캡처된 이미지를 표시하기 위한 디스플레이(12), 오퍼레이터가 데이터를 입력하는 입력 장치(13) 및 학습 처리부(400)를 포함한다.
학습 처리부(400)는 상술된 정보 처리 장치(10)를 구현한다. 학습 처리부(400)는 주소 데이터베이스(401), 데이터베이스 검색 처리부(402), 문자 사전 저장부(403), 발신자-특정의 서신 포맷 정보 저장부(404), 수신자 주소 영역 판정 처리부(405), 문자 인식 처리부(A)(406), 문자 이미지 선택 처리부(A)(407), 수신자 주소 영역 정보 저장부(408), 발신자 주소 영역 판정 처리부(409), 문자 인식 처리부(B)(410), 문자 이미지 선택 처리부(B)(411), 발신자 주소 영역 정보 저장부(412), 및 발신자-특정의 서신 포맷 학습 처리부(413)를 포함한다.
주소 데이터베이스(401)는 우편물(P)상의 기재 사항에 사용할 주소들에 대한 정보를 저장한다.
데이터베이스 검색 처리부(402)는, 입력 장치(13)를 통해 입력되는 제 1 문자 열(예를 들어, 이름 또는 명칭, 전화 번호, 우편 번호 등)를 검색 키로서 사용하여, 주소에 대응되는 제 2 문자 열을 위해 주소 데이터베이스(401)에 저장된 정보를 검색한다.
문자 사전 저장부(403)는 우편물(P)의 기재 사항에 사용할 문자들 각각과 문자에 대응되는 문자 이미지간의 상관 관계를 지시하는 문자 사전을 저장한다. 문자 사전에는, 하나의 문자와 관련하여 복수개의 상이한 종류들의 문자 이미지들이 등록될 수 있다.
발신자-특정의 서신 포맷 정보 저장부(404)는, 각각의 발신자들에 대해 특정한 서신 포맷들을 정의하는, 발신자-특정의 서신 포맷 정보를 저장한다.
수신자 주소 영역 판정 처리부(405)는, 발신자-특정의 서신 포맷 정보 저장부(404)에 저장된 발신자-특정의 서신 포맷 정보에 기초하여, 문자 인식 처리부(A)(406)가 문자 인식을 수행해야 할 영역(수신자 주소 영역)을 판정한다.
문자 인식 처리부(A)(406)는 문자 사전 저장부(403)에 저장된 문자 사전을 사용해 수신자 주소 영역 판정 처리부(405)에 의해 판정되는 영역에 대한 문자 인식을 수행하고, 이름 또는 명칭, 전화 번호, 우편 번호, 주소 등에 각각 대응되는 문자 열에 대한 후보들을 발생시킨다.
문자 이미지 선택 처리부(A)(407)는 문자 인식 처리부(A)(406)에 의해 발생된 후보들로부터 데이터베이스 검색 처리부(402)에 의해 검색되는 제 2 문자 열에 대응되는 문자 열을 선택한다. 좀더 구체적으로, 문자 이미지 선택 처리부(A)(407)는 먼저 문자 인식 처리부(A)(406)에 의해 발생된 후보들로부터 입력 장치(13)를 통해 입력된 제 1 문자 열에 대응되는 문자 열을 선택한 다음, 이미지의 선택된 문자 열 라인에 인접한 라인을 위한 후보들로부터 제 2 문자 열에 대응되는 문자 열을 선택한다.
수신자 주소 영역 정보 저장부(408)는 문자 이미지 선택 처리부(A)(407)에 의해 선택된 제 1 문자 열 및 제 2 문자 열의 영역들 각각을 지시하는 정보를 저장한다.
발신자 주소 영역 판정 처리부(409)는, 발신자-특정의 서신 포맷 정보 저장 부(404)에 저장된 발신자-특정의 서신 포맷 정보에 기초하여, 문자 인식 처리부(B)(410)가 문자 인식을 수행해야 할 영역(발신자 주소 영역)을 판정한다.
문자 인식 처리부(B)(410)는 문자 사전 저장부(403)에 저장된 문자 사전을 사용해 발신자 주소 영역 판정 처리부(409)에 의해 판정된 영역(발신자 주소 영역)에 대한 문자 인식을 수행하고, 이름 또는 명칭, 전화 번호, 우편 번호, 주소 등에 각각 대응되는 문자 열을 위한 후보들을 발생시킨다.
문자 이미지 선택 처리부(B)(411)는 문자 인식 처리부(B)(410)에 의해 발생된 후보들로부터 데이터베이스 검색 처리부(402)에 의해 검색되는 제 2 문자 열에 대응되는 문자 열을 선택한다. 좀더 구체적으로, 문자 이미지 선택 처리부(B)(411)는 먼저 문자 인식 처리부(B)(410)에 의해 발생된 후보들로부터 입력 장치(13)를 통해 입력된 제 1 문자 열에 대응되는 문자 열을 선택한 다음, 이미지의 선택된 문자 열 라인에 인접한 라인을 위한 후보들로부터 제 2 문자 열에 대응되는 문자 열을 선택한다.
발신자 주소 영역 정보 저장부(412)는 문자 이미지 선택 처리부(B)(411)에 의해 선택된 제 1 문자 열 및 제 2 문자 열의 영역들 각각을 지시하는 정보를 저장한다.
발신자-특정의 서신 포맷 학습 처리부(413)는, 수신자 주소 영역 정보 저장부(408)에 저장된 제 1 문자 열 및 제 2 문자 열의 영역들 각각을 지시하는 정보 및 발신자 주소 영역 정보 저장부(412)에 저장된 제 1 문자 열 및 제 2 문자 열의 영역들 각각을 지시하는 정보에 기초하여, 발신자-특정의 서신 포맷 저장부(404)에 저장된 발신자-특정의 서신 포맷 정보를 위한 학습을 수행한다.
이하에서는 상기 기능들을 가진 시스템에서의 세부 처리가 설명될 것이다.
스캐너부(3)에 의해 캡처된 서신 이미지는 필요한 데이터 처리가 수행된 다음, 디스플레이(12)의 스크린에 표시된다.
오퍼레이터는 입력 장치(13)를 통해 서신 이미지의 발신자 정보 및 수신자 정보 중 일부, 예를 들어, 우편 번호 정보를 입력한다. 입력 정보는 학습 처리부(400)의 데이터베이스 검색 처리부(402)로 송신된다. 데이터베이스 검색 처리부(402)는 발신자에 관련된 입력 정보를 검색 키로서 사용하여 주소 데이터베이스(401)를 검색하고, 발신자에 대한 주소 정보를 획득한다. 마찬가지로, 데이터베이스 검색 처리부(402)는 수신자(수취인)에 관련된 입력 정보를 검색 키로서 사용하여 주소 데이터베이스(401)를 검색하고, 수취인에 대한 주소 정보를 획득한다.
우편 번호는, 상당량의 우편물을 발송하거나 수신하는 집단 또는 사람에게 독점적으로 할당될 수도 있다. 도 21은, 특정된 집단들에 개별적으로 전용 우편 번호들이 할당된 것을 나타내는 도면이다. 도 21에 나타낸 예에서는, 우편 번호 "1009999"가 "XX Trading"에 할당되어 있다.
도 20에 나타낸 시스템에서는, 하나의 주소 데이터베이스가 발신자 및 수취인의 주소 정보를 검색하는데 사용된다. 그러나, 이러한 목적을 위해, 별도의 데이터베이스들이 사용될 수도 있다. 예를 들어, 도 22에 나타낸 데이터베이스를 통해, 수취인의 주소 정보는 우편 번호를 검색 키로서 사용해 검색될 수 있는 한편, 발신자의 주소 정보는 발신자 이름을 검색 키로서 사용해 검색될 수도 있다.
다음 설명에서는, 발신자 및 수취인 모두의 주소 정보가 우편 번호들을 사용해 검색된다고 가정한다.
도 23은, 오퍼레이터에 의해 입력된 발신자 및 수취인의 우편 번호 정보에 기초하여, 주소 정보를 위해 주소 데이터베이스(401)를 검색하는 플로우를 나타낸다. 오퍼레이터는 입력 장치(13)를 통해 발신자 및 수취인의 우편 번호들을 입력한다. 그러나, 동일한 발신자로부터 상당량의 우편물이 처리되어야 한다면, 매번 발신자의 우편 번호 정보를 입력할 필요는 없다. 이 경우에는, 하나의 서신 이미지에 대한 처리가 완료되고 후속의 서신 이미지가 처리되기 전에, 앞서 입력된 발신자의 우편 번호 정보가 소거되지 않을 수도 있다. 발신자의 우편 번호 정보가 남겨지면, 오퍼레이터는 인식 처리를 시작하기 위해 수취인의 우편 번호만을 입력하는 것이 필요하다. 따라서, 처리 효율성이 향상된다.
발신자에 대한 입력 정보는 발신자-특정의 서신 포맷 정보 저장부(404)로 송신된다. 도 24에 나타낸 바와 같이, 발신자-특정의 서신 포맷 정보 저장부(404)는, 오퍼레이터에 의해 입력되는 각각의 발신자에 대한 정보 및 우편 번호를 검색 키로서 사용하는 것에 의해 획득되는, 발신자 및 수취인의 주소 기재 사항 영역들에 대한 서신 이미지의 표준 위치들을 저장한다. 스캐너부(3)에 의해 캡처된 서신 이미지는 수신자 주소 영역 판정 처리부(405)로 송신된다. 수신자 주소 영역 판정 처리부(405)는, 발신자-특정의 서신 포맷 정보 저장부(404)에 저장된 수신자 영역 정보의, 오퍼레이터에 의해 입력되는, 발신자의 우편 번호를 위해 준비된 다양한 파라미터들에 기초하여, 서신 이미지에서 수신자 기재 사항 범위를 추정한다.
문자 인식 처리부(A)(406)는 서신 이미지의 주소 기재 사항 영역으로 추정되는 범위를 문자 라인들 및 문자 후보들로 분리하고, 문자 사전 저장부(403)에 미리 저장된 문자 사전을 참조하여 각각의 문자 후보들을 인식한다. 도 17의 문자 이미지(17C)는, 주소 기재 사항 범위로부터 라인들이 분리되는 상태를 나타낸다. 문자 인식 처리부(A)(406)는 입력 장치(13)를 통해 오퍼레이터에 의해 입력된 문자 열, 예를 들어, 수신자 주소의 우편 번호와 매칭되는 문자 열을 검출한다. 도 17의 서신 이미지(17C)의 경우라면, 라인 "212-8501"이 검출된다.
"212-8501"이 수신자 주소의 우편 번호로서 검출되면, 수신자 우편 번호에 인접한 영역에 기재된 수신자 주소 정보는 주소 데이터베이스(401)를 검색하는 것에 의해 획득되는 주소 정보와 매칭되어야 한다. 따라서, 문자 이미지 선택 처리부(A)(407)는 수신자 우편 번호 라인에 인접한 영역에 대한 문자 분리 및 문자 인식의 결과를 "Kanagawa Prefecture, Kawasaki City, Saiwai Ward, Yanagi Town" 또는 "Kawasaki City, Saiwai Ward, Yanagi Town"과 대조 확인한다. 문자 인식 결과가 주소 정보로서 획득되는 검색 결과와 매칭되면, 이 라인이 수신자 주소 라인이라고 판정된다.
수신자 우편 번호 라인 및 수신자 주소 라인의 위치들이 검출되면, 수신자 주소 영역 정보 저장부(408)는 서신의 수신자 정보 기재 사항 영역에 대한 정보를 저장한다. 수신자 정보 기재 사항 영역은, 예를 들어, 도 25에 나타낸 방법에 의해 검출된다. 이 방법에서는, 도 25의 서신 이미지 25A의 검출된 수신자 우편 번호 라인 및 수신자 주소 라인 영역들이 도 25의 서신 이미지 25B에 나타낸 바와 같 이 조합됨으로써, 수신자 정보 기재 사항 영역이 검출된다.
유사한 절차들로, 발신자 주소 영역 판정 처리부(409)는 발신자 주소 정보 기재 사항 범위를 추정하고, 문자 인식 처리부(B)(410)는 각각의 문자 후보들을 인식하기 위해 그 범위를 문자 후보들로 분리하며, 문자 이미지 선택 처리부(B)(411)는 발신자 주소 라인을 검출한다. 발신자 주소 영역 정보 저장부(412)에서는, 도 25의 서신 이미지 25A의 검출된 수신자 우편 번호 라인 및 발신자 주소 라인의 영역들이 도 25의 서신 이미지 25B에 나타낸 바와 같이 조합됨으로써, 발신자 정보 기재 사항 영역이 검출된다.
상술된 바와 같이, 발신자 및 수취인의 주소 정보가 기재되는 영역에 대한 정보가 단지 오퍼레이터에 의해 수행되는 처리, 즉, 서신의 서신 이미지를 관찰하고 서신에 기재된 발신자 및 수취인의 우편 번호들을 입력하는 것에 의해 획득된다. 발신자에 의해 분류된, 각각의 서신들의, 발신자 및 수취인 정보 기재 사항 영역들에 대한 정보가 발신자-특정의 서신 포맷 학습 처리부(413)에 저장되도록, 이 처리는 복수개 서신들의 서신 이미지들에 대해 반복된다.
이와 같이 수신자 주소 영역 정보 저장부(408) 및 발신자 주소 영역 정보 저장부(412)에 누적된 다양한 정보는, 오퍼레이터가 교수 동작을 수행하지 않는 시간 주기에, 발신자-특정의 서신 포맷 학습 처리부(413)에 의해 처리된다. 학습 처리 이후에, 발신자-특정의 서신 포맷 정보 저장부(404)에 저장된 선행 정보는 갱신된 파라미터로 대체된다.
이하에서는, 도 26에 나타낸 흐름도를 참조하여, 이 실시예에 따른 시스템의 동작이 설명될 것이다.
서신 이미지가 스캐너부(3)를 통해 캡처되면(단계 S41), 다음의 처리가 수행된다.
수신자 주소 영역 판정 처리부(405)는 발신자-특정의 서신 포맷 정보에서의 수신자 주소 영역 정보(파라미터)에 기초하여 수신자 주소 영역을 판정한다(단계 S42A).
다음으로는, 문자 인식 처리부(A)(406) 및 문자 이미지 선택 처리부(A)(407) 등이, 수신자 주소 영역 판정 처리부(405)에 의해 판정된 수신자 주소 영역에 대하여, 도 10을 참조하여 상술된 단계들(S12 내지 S16)의 처리를 수행한다.
수신자 주소 영역 정보 저장부(408)에는, 문자 이미지 선택 처리부(A)(407)에 의해 선택된 문자 열의 영역들을 조합하는 것에 의해 형성되는 수신자 주소 영역에 대한 정보(파라미터)가 저장된다(단계 S43A).
발신자 주소 영역 판정 처리부(409)는 발신자-특정의 서신 포맷 정보에서의 발신자 주소 영역 정보(파라미터)에 기초하여 발신자 주소 영역을 판정한다(단계 S42B).
다음으로는, 문자 인식 처리부(B)(410) 및 문자 이미지 선택 처리부(B)(411) 등이, 발신자 주소 영역 판정 처리부(409)에 의해 판정된 발신자 주소 영역에 대하여, 도 10을 참조하여 상술된 단계들(S12 내지 S16)의 처리를 수행한다.
발신자 주소 영역 정보 저장부(412)에는, 문자 이미지 선택 처리부(B)(411)에 의해 선택된 문자 열의 영역들을 조합하는 것에 의해 형성되는 발신자 주소 영 역에 대한 정보(파라미터)가 저장된다(단계 S43B).
발신자-특정의 서신 포맷 학습 처리부(413)는, 수신자 주소 영역 정보 저장부(408)에 저장된 수신자 주소 영역의 정보(파라미터) 및 발신자 주소 영역 정보 저장부(412)에 저장된 발신자 주소 영역의 정보(파라미터)에 기초하여, 발신자-특정의 서신 포맷에서의 수신자 주소 영역 및 발신자 주소 영역의 표준 위치들에 대한 학습을 수행한다(단계 S44).
상술된 바와 같이, 제 4 실시예에 따르면, 문자 사전 및 수신자 주소 영역의 표준 위치에 대한 학습 뿐만 아니라 발신자 주소 영역의 표준 위치에 대한 학습도 자동적으로 수행될 수 있다. 따라서, 상당히 향상된 문자 사전이 용이하게 생성될 수 있다.
상술된 각 실시예의 절차들은 컴퓨터 프로그램으로서 컴퓨터-판독 가능 저장 매체(예를 들어, 자기 디스크, 광학 디스크, 및 반도체 메모리)에 미리 저장되어, 필요에 따라, 프로세서에 의해 판독 및 실행될 수도 있다. 컴퓨터 프로그램은 통신 매체를 통해 하나의 컴퓨터에서 다른 컴퓨터로 분산될 수 있다.
상술된 실시예들 각각은, 수신자 등이, 일본의 우편 기재 사항 포맷에 따라, 기재되어 있는 서신들을 처리하는 정보 처리 장치의 일례를 나타내지만, 본 발명은, 정보 처리 장치가, 예를 들어, USA, 한국, 독일, 프랑스, 또는 이태리에서 사용되는 상이한 우편 기재 사항 포맷에 따라 수신자 등이 기재되어 있는 서신들을 처리하는 경우에도 당연히 적용될 수 있다.
상술된 바와 같이, 본 발명에 따르면, 오퍼레이터의 작업량은 감소되면서, 고성능의 인식 처리가 실현될 수 있다.
당업자들이라면, 추가적인 이점들 및 변경들을 쉽게 이해할 수 있을 것이다. 따라서, 본 발명은, 그것의 광범위한 태양들에 있어, 여기에서 도시되고 설명된 구체적인 세부 사항들 및 대표적 실시예들로 한정되지 않는다. 따라서, 첨부된 청구항들 및 그것의 등가물들에 의해 정의되는 일반적인 발명 개념의 정신 또는 범위를 벗어나지 않으면서, 다양한 변경들이 이루어질 수 있다.
상술된 바와 같이, 본 발명에 따르면, 오퍼레이터의 작업량은 감소되면서, 고성능의 인식 처리가 실현될 수 있다.

Claims (10)

  1. 주소 정보를 포함하는 서신 이미지를 캡처하고 문자 인식 처리를 수행하는 정보 처리 장치로서,
    서신의 기재에 사용할 주소들에 관련된 정보를 저장하는 주소 정보 저장부;
    제 1 문자 열을 검색 키로서 사용하여, 주소에 대응되는 제 2 문자 열을 찾아, 상기 주소 정보 저장부에 저장된 정보를 검색하는 검색 처리부;
    상기 서신에 사용된 문자들 각각과 그것에 관한 문자 이미지간의 상관 관계를 지시하는 문자 사전을 저장하는 문자 사전 저장부;
    상기 문자 사전 저장부에 저장된 문자 사전을 사용해, 상기 이미지의 소정 영역에 대한 문자 인식을 수행하고, 적어도 주소를 포함하는 문자 열을 위한 후보들을 발생시키는 문자 인식 처리부;
    상기 문자 인식 처리부에 의해 발생된 후보들로부터, 상기 검색 처리부에 의해 검색된 제 2 문자 열에 대응되는 문자 열을 선택하는 문자 이미지 선택 처리부; 및
    상기 문자 이미지 선택 처리부에 의해 선택된 문자 열을 구성하는 문자들 각각과 그것에 관한 문자 이미지간의 상관 관계에 기초하여, 상기 문자 사전 저장부에 저장된 문자 사전에 대한 학습 처리를 수행하는 문자 사전 학습 처리부를 포함하는 정보 처리 장치.
  2. 제1항에 있어서,
    상기 문자 사전 저장부에 저장된 문자 사전은 하나의 문자와 관련하여 복수개의 상이한 종류들의 문자 이미지들을 등록하도록 구성되어 있는 정보 처리 장치.
  3. 제1항에 있어서,
    상기 제 1 문자 열은 우편 번호에 대응되는 정보 처리 장치.
  4. 제1항에 있어서,
    상기 제 1 문자 열은 이름 또는 명칭(designation)에 대응되는 정보 처리 장치.
  5. 제1항에 있어서,
    상기 제 1 문자 열은 전화 번호에 대응되는 정보 처리 장치.
  6. 제1항에 있어서,
    상기 제 1 문자 열은 입력 장치를 통해 입력되는 정보 처리 장치.
  7. 제6항에 있어서,
    상기 문자 이미지 선택 처리부는, 상기 문자 인식 처리부에 의해 발생된 후보들로부터, 상기 입력 장치를 통해 입력된 상기 제 1 문자 열에 대응되는 문자 열 을 선택하고, 상기 이미지의 선택된 문자 열의 라인에 인접한 라인의 문자 열의 후보들로부터, 상기 제 2 문자 열에 대응되는 문자 열을 선택하는 정보 처리 장치.
  8. 제1항에 있어서,
    상기 문자 인식 처리부는 상기 이미지의 소정 영역에 대한 문자 인식을 수행하고 상기 검색 키로서 사용되는 상기 제 1 문자 열을 위한 후보들을 발생시키는 제 1 인식 처리부, 및 상기 이미지의 상기 제 1 문자 열의 라인에 인접한 라인으로부터 상기 제 2 문자 열을 위한 후보들을 발생시키는 제 2 인식 처리부를 포함하는 정보 처리 장치.
  9. 제7항에 있어서,
    상기 이미지의 수신자 주소 영역을 지시하는 수신자 주소 영역 정보를 저장하는 수신자 주소 영역 정보 저장부;
    상기 수신자 주소 영역 정보 저장부에 저장된 상기 수신자 주소 영역 정보에 기초하여, 상기 문자 인식 처리부에 의해 처리될 영역을 판정하는 수신자 주소 영역 판정부; 및
    상기 문자 이미지 선택 처리부에 의해 선택된 상기 제 1 문자 열 및 상기 제 2 문자 열의 이미지상의 영역들에 기초하여, 상기 수신자 주소 영역 정보 저장부에 저장된 수신자 주소 영역 정보에 대한 학습 처리를 수행하는 수신자 주소 영역 정보 학습 처리부를 더 포함하는 정보 처리 장치.
  10. 제7항에 있어서,
    발신자 특정의 서신 포맷이 정의되는 발신자-특정의 서신 포맷 정보를 저장하는 발신자-특정의 서신 포맷 정보 저장부;
    상기 발신자-특정의 서신 포맷 정보 저장부에 저장된 발신자-특정의 서신 포맷 정보에 기초하여, 상기 문자 인식 처리부에 의해 처리될, 한 영역 내의 수신자 주소 영역을 판정하는 수신자 주소 영역 판정부;
    상기 발신자-특정의 서신 포맷 정보 저장부에 저장된 발신자-특정의 서신 포맷 정보에 기초하여, 상기 문자 인식 처리부에 의해 처리될, 한 영역 내의 발신자 주소 영역을 판정하는 발신자 주소 영역 판정부; 및
    상기 문자 이미지 선택 처리부에 의해 상기 수신자 주소 영역 및 발신자 주소 영역 각각에 대해 선택된 상기 제 1 문자 열 및 상기 제 2 문자 열의 이미지상의 영역들에 기초하여, 상기 발신자-특정의 서신 포맷 정보 저장부에 저장된 발신자-특정의 서신 포맷 정보에 대한 학습 처리를 수행하는 발신자-특정의 서신 포맷 학습 처리부를 더 포함하는 정보 처리 장치.
KR1020060023136A 2005-06-24 2006-03-13 문자 사전을 위한 학습 기능을 가진 정보 처리 장치 KR20060135487A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005185178A JP2007004584A (ja) 2005-06-24 2005-06-24 情報処理装置
JPJP-P-2005-00185178 2005-06-24

Publications (1)

Publication Number Publication Date
KR20060135487A true KR20060135487A (ko) 2006-12-29

Family

ID=37038343

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060023136A KR20060135487A (ko) 2005-06-24 2006-03-13 문자 사전을 위한 학습 기능을 가진 정보 처리 장치

Country Status (4)

Country Link
US (1) US20060291692A1 (ko)
EP (1) EP1736913A1 (ko)
JP (1) JP2007004584A (ko)
KR (1) KR20060135487A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100926565B1 (ko) * 2007-12-13 2009-11-12 한국전자통신연구원 주소 데이터베이스 구축 장치 및 그 방법

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070139703A1 (en) * 2005-12-19 2007-06-21 Glory Ltd. Print inspecting apparatus
JP2008243093A (ja) * 2007-03-29 2008-10-09 Toshiba Corp 辞書データの登録装置及び辞書データの登録方法
US8831381B2 (en) 2012-01-26 2014-09-09 Qualcomm Incorporated Detecting and correcting skew in regions of text in natural images
US9064191B2 (en) 2012-01-26 2015-06-23 Qualcomm Incorporated Lower modifier detection and extraction from devanagari text images to improve OCR performance
US9047540B2 (en) 2012-07-19 2015-06-02 Qualcomm Incorporated Trellis based word decoder with reverse pass
US9141874B2 (en) 2012-07-19 2015-09-22 Qualcomm Incorporated Feature extraction and use with a probability density function (PDF) divergence metric
US9014480B2 (en) 2012-07-19 2015-04-21 Qualcomm Incorporated Identifying a maximally stable extremal region (MSER) in an image by skipping comparison of pixels in the region
US9076242B2 (en) 2012-07-19 2015-07-07 Qualcomm Incorporated Automatic correction of skew in natural images and video
US9262699B2 (en) 2012-07-19 2016-02-16 Qualcomm Incorporated Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR
JP2014078168A (ja) * 2012-10-11 2014-05-01 Fuji Xerox Co Ltd 文字認識装置及びプログラム
JP6260350B2 (ja) * 2014-03-04 2018-01-17 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP6203084B2 (ja) * 2014-03-06 2017-09-27 株式会社東芝 配達物区分処理システム、および配達物区分処理方法
JP2018022932A (ja) * 2014-12-08 2018-02-08 株式会社ジャパンディスプレイ 表示システム及び表示装置
JP5990609B2 (ja) * 2015-02-25 2016-09-14 京セラドキュメントソリューションズ株式会社 画像形成装置
JP7435098B2 (ja) 2020-03-18 2024-02-21 Toppanホールディングス株式会社 くずし字認識システム、くずし字認識方法及びプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2738383B2 (ja) * 1996-02-29 1998-04-08 日本電気株式会社 宛名読み取り装置
DE19742771C1 (de) * 1997-09-27 1998-12-10 Siemens Ag Verfahren und Anordnung zum Erkennen von Verteilinformationen auf Sendungen
JP3639126B2 (ja) * 1998-01-22 2005-04-20 富士通株式会社 住所認識装置及び住所認識方法
DE10034629A1 (de) * 1999-08-11 2001-03-22 Ibm Verfahren und System zum Verzahnen von OCR und ABL zur automatischen Postsortierung
JP2001134716A (ja) * 1999-11-09 2001-05-18 Toshiba Corp 所在情報認識方法と認識アプリケーションと記録媒体と所在情報認識装置
DE10104587A1 (de) * 2001-02-02 2002-08-29 Siemens Production & Logistics Verfahren und Vorrichtung zum Lesen von Sendungsadressen mit Postkodes
DE10126835B4 (de) * 2001-06-01 2004-04-29 Siemens Dematic Ag Verfahren und Vorrichtung zum automatischen Lesen von Adressen in mehr als einer Sprache

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100926565B1 (ko) * 2007-12-13 2009-11-12 한국전자통신연구원 주소 데이터베이스 구축 장치 및 그 방법
US8099443B2 (en) 2007-12-13 2012-01-17 Electronics And Telecommunications Research Institute Apparatus for building address database and method thereof

Also Published As

Publication number Publication date
US20060291692A1 (en) 2006-12-28
EP1736913A1 (en) 2006-12-27
JP2007004584A (ja) 2007-01-11

Similar Documents

Publication Publication Date Title
KR20060135487A (ko) 문자 사전을 위한 학습 기능을 가진 정보 처리 장치
KR100323350B1 (ko) 우편물 수신처 판독장치 및 우편물 구분장치
KR19990072627A (ko) 수신처정보인식방법및메일처리장치
US20060045340A1 (en) Character recognition apparatus and character recognition method
JP3201207B2 (ja) 住所読取装置及び方法
JP2009163689A (ja) 住所認識方法及び装置、並びに郵便あて名区分機
JPH06111189A (ja) 地図端末および表示方法
EP1496460A1 (en) Sorting apparatus and address information determination method
JP3149859B2 (ja) ビデオコーディングシステム及び方法
JP2996823B2 (ja) 文字認識装置
JPH10198688A (ja) 定型文書読み取り装置
JP4785614B2 (ja) 漢字の読みを生成する情報処理装置、情報処理方法、これらの情報処理をコンピュータに実行させるためのプログラム、およびそのプログラムを記録した記録媒体
JP2991594B2 (ja) 郵便物の宛名読取装置
JPH09265509A (ja) 合わせ読み住所認識方式
JP3557048B2 (ja) ビデオコーディング装置
JPH07116606A (ja) 郵便物あて名認識装置及びあて名認識方法
JPH1034089A (ja) ビデオコーディング装置
JPH0747334A (ja) 住所認識装置および住所読取区分機
JP3673034B2 (ja) 郵便物の宛名領域検出装置
JPH08320866A (ja) 文書作成装置および文書作成方法
JP2004171122A (ja) 紙葉類処理装置及び紙葉類処理方法
JPH10174935A (ja) 宛名読取装置および文字情報読取装置
JP2000172706A (ja) 文字列分類装置
JPH09212589A (ja) 住所照合辞書作成支援装置
JPH05324899A (ja) 郵便物記載住所認識装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application