[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JPH07152862A - 文字認識用の文字切り出し装置 - Google Patents

文字認識用の文字切り出し装置

Info

Publication number
JPH07152862A
JPH07152862A JP5326335A JP32633593A JPH07152862A JP H07152862 A JPH07152862 A JP H07152862A JP 5326335 A JP5326335 A JP 5326335A JP 32633593 A JP32633593 A JP 32633593A JP H07152862 A JPH07152862 A JP H07152862A
Authority
JP
Japan
Prior art keywords
character
input
neural network
input data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP5326335A
Other languages
English (en)
Inventor
Hitoshi Kubota
整 久保田
Katsuichi Ono
勝一 小野
Hisashi Chiba
久 千葉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzuki Motor Corp
Original Assignee
Suzuki Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzuki Motor Corp filed Critical Suzuki Motor Corp
Priority to JP5326335A priority Critical patent/JPH07152862A/ja
Publication of JPH07152862A publication Critical patent/JPH07152862A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 ノイズの影響を受けずに正しく文字を切り出
す。 【構成】 文字切り出し装置は、文字a1を含むアナロ
グ画像bを入力する画像入力部10と、アナログ画像b
を画素ごとに二値化することにより二値化画像データc
を作成する二値化画像データ作成部12と、二値化画像
データcを横方向X及び縦方向Yに一列ごとの画素に分
割することにより入力データX1 〜Xn ,Y1 〜Ym
作成する入力データ作成部14と、入力データX1 〜X
n ,Y1 〜Ym の個々に対してニューラルネットワーク
処理を行うことにより文字の一部を含むか否かを認識す
るニューラルネットワーク処理部16と、認識結果x1
〜xn ,y1 〜ym に基づき文字a1の外接枠a2の位
置dを出力する外接枠出力部18とを備えたものであ
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字を光学的に読み取
る文字認識技術において用いられる文字切り出し装置に
関し、詳しくは、入力画像中の文字を認識する前処理と
して文字を一文字ごとに切り出すための文字切り出し装
置に関する。
【0002】
【従来の技術】文字認識技術では、例えば図7に示すよ
うに、入力画像80,82中から一つの文字801,8
21,822,823をそれぞれの外接枠802,82
4,825,826で切り出してから、それらの文字8
01,…を認識している。
【0003】従来の文字切り出し装置では、例えば図8
に示すように、入力画像80,82の各画素を垂直方向
及び水平方向に加算して黒部分の射影をとり、射影ヒス
トグラム803,804,827,828を作成する。
射影ヒストグラム803,…で、あるしきい値以上の部
分を文字801,…が存在している領域として切り出
す。このような文字切り出し装置は、例えば特開平1-11
4992号公報に記載されている。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
文字切り出し装置では、次のような問題があった。
【0005】文字801,…にカレやキレが生じてい
る場合や、ノイズが混入している場合には、文字80
1,…を正確に切り出すことが困難であった。これは、
カレ,キレ,ノイズ等が、そのまま射影ヒストグラム8
03,…に反映されるためである。
【0006】射影ヒストグラム803,…を用いて文
字801,…を含むか否かを判断するのに、射影ヒスト
グラム803,…でのしきい値を操作者が決める必要が
あった。したがって、たいへん操作が面倒であった。
【0007】
【発明の目的】そこで、本発明の目的は、カレ,キレ,
ノイズ等の影響を受けずに正確に文字を切り出すことが
できると共に、操作性を向上させた文字切り出し装置を
提供することにある。
【0008】
【課題を解決するための手段】そこで、本発明に係る文
字切り出し装置は、上記目的を達成するためになされた
ものであり、文字を含むアナログ画像を入力する画像入
力部と、この画像入力部で入力されたアナログ画像を画
素ごとに二値化することにより二値化画像データを作成
する二値化画像データ作成部と、この二値化画像データ
作成部で作成された二値化画像データを横方向及び縦方
向に一列ごとの画素に分割することにより入力データを
作成する入力データ作成部と、この入力データ作成部で
作成された入力データの個々に対してニューラルネット
ワーク処理を行うことにより文字の一部を含むか否かを
認識するニューラルネットワーク処理部と、このニュー
ラルネットワーク処理部での認識結果に基づき文字の外
接枠の位置を出力する外接枠出力部とを備えたものであ
る。
【0009】また、前記ニューラルネットワーク処理部
は、前記入力データ作成部で作成される入力データの画
素数に等しいユニット数から成る入力層と、任意のユニ
ット数から成る中間層と、文字の一部を含むか否かの情
報を出力する一個のユニット数から成る出力層とを備え
たものとしてもよい。さらに、前記ニューラルネットワ
ーク処理部は、リカレントニューラルネットワークから
成るものとしてもよい。
【0010】ここでいう「画素」とは、最小分解能とし
ての画素から、これらの画素を複数個集めて一単位とし
たものまでの広い概念である。
【0011】
【作用】文字を含むアナログ画像は、画像入力部から入
力され、二値化画像データ作成部で画素ごとに二値化さ
れて二値化画像データとなる。この二値化画像データ
は、横方向及び縦方向に一列ごとの画素に分割される。
この一列ごとの画素から入力データが構成される。
【0012】一方、ニューラルネットワーク処理部で
は、入力データに対応して的確に文字の一部を含むか否
かを認識できるように、ニューラルネットワークに予め
学習させておく。したがって、ニューラルネットワーク
処理部に入力データが入力されると、入力データが文字
の一部を含むか否かが認識され、この認識結果に基づき
外接枠出力部から文字の外接枠の位置が出力される。
【0013】
【発明の実施例】図1は、本発明に係る文字切り出し装
置の一実施例を示すブロック図である。図2は、本実施
例におけるニューラルネットワーク処理部の構成及び動
作を示す説明図である。以下、これらの図に基づき説明
する。なお、図2では、図示の都合上、入力データX1
〜Xn を処理する場合のみ記載し、入力データY1 〜Y
mについては省略している。
【0014】本発明に係る文字切り出し装置は、文字a
1を含むアナログ画像bを入力する画像入力部10と、
画像入力部10で入力されたアナログ画像bを画素ごと
に二値化することにより二値化画像データcを作成する
二値化画像データ作成部12と、二値化画像データ作成
部12で作成された二値化画像データcを横方向X及び
縦方向Yに一列ごとの画素に分割することにより入力デ
ータX1 〜Xn ,Y1〜Ym を作成する入力データ作成
部14と、入力データ作成部14で作成された入力デー
タX1 〜Xn ,Y1 〜Ym の個々に対してニューラルネ
ットワーク処理を行うことにより文字の一部を含むか否
かを認識するニューラルネットワーク処理部16と、ニ
ューラルネットワーク処理部16での認識結果x1 〜x
n ,y1〜ym に基づき文字a1の外接枠a2の位置d
を出力する外接枠出力部18とを備えたものである。
【0015】画像入力部10は、例えばイメージスキャ
ナ,CCDカメラ等から構成され、画像を光電変換しア
ナログ値として出力するものである。二値化画像データ
作成部12は、例えばA/D変換器等から構成され、画
像入力部10から入力したアナログ値をデジタル値に変
換するものである。
【0016】入力データ作成手段14,ニューラルネッ
トワーク処理部16及び外接枠出力部18は、例えばコ
ンピュータ及びこれを動作させるプログラムによって実
現できる。この場合、このコンピュータで、画像入力部
10,二値化画像データ作成部12等を制御するように
構成してもよい。また、ニューラルネットワーク処理部
16は、ニューロチップによっても実現できる。
【0017】また、ニューラルネットワーク処理部16
は、入力データ作成部14で作成される入力データX1
〜Xn ,Y1 〜Ym の画素数に等しいユニット数から成
る入力層20と、任意のユニット数から成る中間層22
と、文字a1の一部を含むか否かの情報(「1」,
「0」)を出力する一個のユニット数から成る出力層2
4とを備えている。さらに、ニューラルネットワーク処
理部16は、リカレントニューラルネットワークから成
るものである。
【0018】入力層20,中間層22,出力層24の各
ユニットは、対称結合又は一方向結合に拘束されない、
非対称でリカレントな結合をしている。このような特徴
を有するリカレントニューラルネットワークは、ノイズ
が混入した入力データに対しても、正確な認識が可能で
ある。なお、リカレントニューラルネットワーク自体
は、公知技術であり、例えば「計測と制御」Vol.30.No.
4(1991年4月)pp.296-301 等に詳述されている。また、
入力層20のユニット数は入力データX1 〜Xn,Y1
〜Ym の数に対応した個数であり、任意に設定可能であ
る。本実施例では図2に示されるようにn個のユニット
を具備している。
【0019】このような構成において、入力層20に入
力される入力データX1 〜Xn ,Y1 〜Ym と出力層2
4からの認識結果x1 〜xn ,y1 〜ym との関係を得
るために、各ユニット間の結合強度をあらかじめ学習に
よって求める。すなわち、ある入力データを入力層20
に入力したとき、その入力データが大きな固まり
(「1」の集合)であれば、出力層24から「1」を出
力させ、その入力データが小さな固まりであれば、出力
層24から「0」を出力させるように学習させる。
【0020】このような学習済みのニューラルネットワ
ーク処理部16を使用すれば、ある未知の入力データが
与えられたとき、出力層24から正確な「0」又は
「1」の判定を行うことができる。ニューラルネットワ
ーク処理部16は、パターンの形状を学習するものであ
るため、入力パターン(本実施例における「入力デー
タ」)に多少のノイズが混入した場合でも、正しいパタ
ーン認識が可能である。
【0021】次に、図3のフローチャート及び以下に指
示する図面に基づき、本実施例の動作を説明する。
【0022】二値化画像データ作成部12で作成された
二値化画像データcは、図4に示すように、横n個×縦
m個の画素から構成されている。入力データ作成部14
は、二値化画像データcを横方向Xに一列ごとの画素に
分割することにより入力データX1 〜Xn を作成する
(ステップ101)。
【0023】続いて、ニューラルネットワーク処理部1
6の入力層20に入力データX1 〜Xn を順次入力する
(ステップ102)。すると、入力データX1 〜Xn
対応した認識結果x1 〜xn が出力層24から順次出力
される(ステップ103)。例えば、図5(イ)に示す
ように入力データX1 に対して認識結果x1 、図5
(ロ)に示すように入力データX2 に対して認識結果x
2 、図5(ハ)に示すように入力データX3 に対して認
識結果x3 がそれぞれ出力される。
【0024】次に、同様に、縦方向Yの入力データY1
〜Ym を作成し(ステップ104)、入力層20に入力
データY1 〜Ym を順次入力すると(ステップ10
5)、入力データY1 〜Yn に対応した認識結果y1
m が出力層24から順次出力される(ステップ10
6)。
【0025】最後に、外接枠出力部18は、縦と横の認
識結果x1 〜xn ,y1 〜ym から文字a1の外接枠a
2の位置dを求め、外接枠a2で文字a1を切り出す
(ステップ107)。すなわち、図6に示すように、認
識結果x1 〜xn ,y1 〜ymのうち、出力が「1」の
部分(図中ではハッチングで表示)の始まりの位置をそ
れぞれSX,SYとし、「1」の続いている個数をL
X,LYとする。これにより、左端及び上端(SX,S
Y)、大きさ(LX,LY)の矩形が外接枠a2として
認識され、外接枠a2で文字a1を切り出す。切り出さ
れた文字a1は、図1に示すように、この文字切り出し
装置外の文字認識部30でパターン認識される。
【0026】なお、ニューラルネットワーク処理部16
は、本実施例のようにリカレントニューラルネットワー
クを用いることが最も望ましいが、これに限定するもの
ではなく、例えばフィードフォワードネットワーク等を
用いてもよい。
【0027】
【発明の効果】本発明によれば、二値化画像データを横
方向及び縦方向に一列ごとの画素に分割して入力データ
を作成することにより、これらの入力データをニューラ
ルネットワーク処理部で処理することができる。その結
果、入力データが文字の一部を含むか否かをノイズの影
響を除去して認識でき、この認識結果に基づき正確な外
接枠で文字を切り出すことができる。
【0028】また、従来は射影ヒストグラムでのしきい
値を操作者が決める必要があったが、本発明では文字を
切り出す際にそのような手間は不要であるので操作性を
向上できる。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】本発明の一実施例におけるニューラルネットワ
ーク処理部の構成及び動作を示す説明図である。
【図3】本発明の一実施例の動作を示すフローチャート
である。
【図4】文字を含む二値化画像データを示す平面図であ
る。
【図5】本発明の一実施例におけるニューラルネットワ
ーク処理部の動作を示す説明図であり、図5(イ)は入
力データX1 に対する認識結果x1 、図5(ロ)は入力
データX2 に対する認識結果x2 、図5(ハ)は入力デ
ータX3 に対する認識結果x3 をそれぞれ示す。
【図6】本発明の一実施例におけるニューラルネットワ
ーク処理部の認識結果を示す説明図である。
【図7】文字の切り出し例を示す説明図である。
【図8】従来例における文字の切り出し方法を示す説明
図である。
【符号の説明】
10 画像入力部 12 二値化画像データ作成部 14 入力データ作成部 16 ニューラルネットワーク処理部 18 外接枠出力部 20 入力層 22 中間層 24 出力層

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文字を含むアナログ画像を入力する画像
    入力部と、この画像入力部で入力されたアナログ画像を
    画素ごとに二値化することにより二値化画像データを作
    成する二値化画像データ作成部と、この二値化画像デー
    タ作成部で作成された二値化画像データを横方向及び縦
    方向に一列ごとの画素に分割することにより入力データ
    を作成する入力データ作成部と、この入力データ作成部
    で作成された入力データの個々に対してニューラルネッ
    トワーク処理を行うことにより文字の一部を含むか否か
    を認識するニューラルネットワーク処理部と、このニュ
    ーラルネットワーク処理部での認識結果に基づき文字の
    外接枠の位置を出力する外接枠出力部とを備えているこ
    とを特徴とする文字認識用の文字切り出し装置。
  2. 【請求項2】 前記ニューラルネットワーク処理部は、
    前記入力データ作成部で作成される入力データの画素数
    に等しいユニット数から成る入力層と、任意のユニット
    数から成る中間層と、文字の一部を含むか否かの情報を
    出力する一個のユニット数から成る出力層とを備えたこ
    とを特徴とする請求項1記載の文字認識用の文字切り出
    し装置。
  3. 【請求項3】 前記ニューラルネットワーク処理部は、
    リカレントニューラルネットワークから成ることを特徴
    とする請求項1又は2記載の文字認識用の文字切り出し
    装置。
JP5326335A 1993-11-30 1993-11-30 文字認識用の文字切り出し装置 Withdrawn JPH07152862A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5326335A JPH07152862A (ja) 1993-11-30 1993-11-30 文字認識用の文字切り出し装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5326335A JPH07152862A (ja) 1993-11-30 1993-11-30 文字認識用の文字切り出し装置

Publications (1)

Publication Number Publication Date
JPH07152862A true JPH07152862A (ja) 1995-06-16

Family

ID=18186630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5326335A Withdrawn JPH07152862A (ja) 1993-11-30 1993-11-30 文字認識用の文字切り出し装置

Country Status (1)

Country Link
JP (1) JPH07152862A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020080092A (ja) * 2018-11-14 2020-05-28 株式会社ハイシンク創研 機械学習を用いた画像検査方法および画像検査装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020080092A (ja) * 2018-11-14 2020-05-28 株式会社ハイシンク創研 機械学習を用いた画像検査方法および画像検査装置

Similar Documents

Publication Publication Date Title
JPH0721320A (ja) 自動スクリプト決定装置
JPH05225378A (ja) 文書画像の領域分割システム
JPH0436433B2 (ja)
JPH0256708B2 (ja)
JPH0715703B2 (ja) 文字読取方式
CN112419208A (zh) 一种基于施工图审查矢量图纸编译方法及系统
JPH07152862A (ja) 文字認識用の文字切り出し装置
JP2613959B2 (ja) 指紋紋様分類装置
JPH0581474A (ja) 文字列抽出方法および文字領域検出方法
JPH08235359A (ja) パターンマッチング方法およびパターンマッチング装置
JPH08272971A (ja) 対象物認識方法
JPH08272956A (ja) ノイズ除去方法およびノイズ除去装置
JP2590099B2 (ja) 文字読取方式
JPH07271907A (ja) アナログ画像の二値化装置
JP2797655B2 (ja) 画像処理方法およびその装置
JP2832019B2 (ja) 画像処理装置
JPH0562013A (ja) 文字読取装置
JPH0660220A (ja) 文書画像の領域抽出方法
JPH06251202A (ja) 文字認識装置
JPH0586585B2 (ja)
JPH02187883A (ja) 文書読取装置
JP2771045B2 (ja) 文書画像の領域分割方法
JP2000048123A (ja) 画像処理装置
JPH0676105A (ja) 文書認識システム
JPH02166583A (ja) 文字認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010130