[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP3064192B2 - Feature generator - Google Patents

Feature generator

Info

Publication number
JP3064192B2
JP3064192B2 JP6308882A JP30888294A JP3064192B2 JP 3064192 B2 JP3064192 B2 JP 3064192B2 JP 6308882 A JP6308882 A JP 6308882A JP 30888294 A JP30888294 A JP 30888294A JP 3064192 B2 JP3064192 B2 JP 3064192B2
Authority
JP
Japan
Prior art keywords
feature
image
identification
feature amount
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP6308882A
Other languages
Japanese (ja)
Other versions
JPH08167004A (en
Inventor
かよ子 川田
信太郎 熊野
直人 川瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP6308882A priority Critical patent/JP3064192B2/en
Publication of JPH08167004A publication Critical patent/JPH08167004A/en
Application granted granted Critical
Publication of JP3064192B2 publication Critical patent/JP3064192B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Sorting Of Articles (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、荷物仕分け装置の宛て
名認識装置に利用される特徴量生成装置に関する。本発
明は、郵便物宛て名仕分け装置、郵便物番号仕分け装
置、などの各種仕分け装置や、OCR(光学式文字読み
取り装置)や、FAなどにおける製品や資材の管理装置
(ID読み取り部)、などあらゆる文字または記号認識
装置にも利用可能である。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a feature value generating device used for a destination recognizing device of a package sorting device. The present invention relates to various sorting devices such as a mail address sorting device and a mail number sorting device, an OCR (optical character reading device), and a product and material management device (ID reading unit) in FA and the like. It can be used with any character or symbol recognition device.

【0002】[0002]

【従来の技術】従来の技術では、文字や記号の画像のパ
ターン認識のため特徴量として、様々な特徴量が用いら
れてきたが、それらは大別すると、(A)ピクセル値そ
のまま、(B)輪郭系特徴量、(C)スケルトン系特徴
量、(D)アドホックな特徴量、に分類できる。これら
の説明を表1に示す。
2. Description of the Related Art In the prior art, various feature values have been used as feature values for character and symbol image pattern recognition. However, these are roughly classified into (A) pixel values as they are and (B) ) Contour-based feature, (C) skeleton-based feature, and (D) ad-hoc feature. Table 1 shows these descriptions.

【0003】[0003]

【表1】 [Table 1]

【0004】また、これら以外の新しい特徴量として、
本発明と同じ分類の、周波数系の特徴量を用いたパター
ン認識の研究が発表された例はあるが、従来の例は、ウ
ェーブレット変換やガボール変換した結果の高次元の係
数をそのまま特徴量として用いるものであった。
[0004] In addition, other new features include:
There is an example in which a study of pattern recognition using a frequency-based feature of the same classification as the present invention has been published, but in the conventional example, a high-dimensional coefficient obtained as a result of wavelet transform or Gabor transform is directly used as a feature. It was used.

【0005】[0005]

【発明が解決しようとする課題】従来の特徴量によるパ
ターン認識にはそれぞれ表2に示すような問題点があ
り、複雑な文字(たとえば手書き漢字)や複雑な記号の
認識には十分ではない。
The conventional pattern recognition based on feature values has problems as shown in Table 2, and is not sufficient for the recognition of complex characters (for example, handwritten kanji) and complex symbols.

【0006】[0006]

【表2】 本発明はこれらの問題を解決することができる装置を提
供することを目的とする。
[Table 2] An object of the present invention is to provide a device that can solve these problems.

【0007】[0007]

【課題を解決するための手段】本発明に係る特徴量生成
装置は、文字や記号などの画像データから、その文字や
記号などの属するクラスを識別するための特徴量を生成
する特徴量生成装置において、多次元ウェーブレット変
換装置と、ウェーブレット変換係数次元低下装置と、学
習用教師画像のサイズを正規化すると共に文字線の外形
を整える教師画像前処理手段と、前記教師画像前処理手
段により処理された画像をそれぞれ前記多次元ウェーブ
レット変換装置によりウェーブレット変換して変換係数
を求め、該変換係数を前記ウェーブレット変換次元低下
装置により縦方向、横方向、スケール方向の3方向に部
分的重み平均をとり、次元低下した学習用画像の特徴量
ベクトルを得る学習用特徴量生成手段と、前記学習用特
徴量生成手段で求めた特徴量ベクトルを用いてクラス識
別のための識別条件となる辞書データを生成する辞書作
成手段と、識別対象の画像データのサイズを正規化する
と共に文字線の外形を整える識別画像前処理手段と、前
記識別画像前処理手段により処理された対象画像をそれ
ぞれ前記多次元ウェーブレット変換装置によりウェーブ
レット変換して変換係数を求め、該変換係数を前記ウェ
ーブレット変換次元低下装置により縦方向、横方向、ス
ケール方向の3方向に部分的重み平均をとり、次元低下
した識別用画像の特徴量ベクトルを得る識別用特徴量生
成手段とを具備し、前記識別用特徴量生成手段で求めた
特徴量ベクトルのクラスを前記辞書データを用いて識別
することを特徴とする。
SUMMARY OF THE INVENTION A feature amount generating apparatus according to the present invention generates a feature amount for identifying a class to which a character or a symbol belongs from image data such as a character or a symbol. At the multidimensional wavelet transformation
Conversion device, wavelet transform coefficient dimension reduction device,
Normalize the size of the training teacher image and outline the character line
Teacher image preprocessing means for preparing
Each of the images processed by the stages is referred to as the multidimensional wave.
Wavelet transform by a wavelet transform unit and transform coefficients
And the transform coefficient is reduced by the wavelet transform dimension.
Depending on the device, it can be divided into three directions: vertical, horizontal, and scale.
The feature amount of the learning image whose dimension is reduced by taking the average of the partial weights
A learning feature amount generating means for obtaining a vector;
Using the feature vector obtained by the collection generator,
A dictionary that generates dictionary data that serves as an identification condition for another
And normalizing the size of the image data to be identified
Identification image pre-processing means for shaping the outline of the character line together with
The target image processed by the identification image pre-processing means is
The wave is transformed by the multi-dimensional wavelet transform device.
A transform coefficient is obtained by performing a wavelet transform, and the transform coefficient is
The vertical, horizontal, and vertical
Calculates partial weight average in three directions of Kale direction, and reduces dimension
Feature generation for obtaining the feature vector of the identified identification image
Means for generating the characteristic amount for identification.
Classification of feature vector using the dictionary data
Characterized in that it.

【0008】[0008]

【作用】特徴量として、多次元ウェーブレット変換係数
を用いることにより、ピクセルそのままや輪郭系特徴量
よりも変形や線の太さの変化に強い特徴量を、 アドホ
ックな特徴量よりも汎用的かつ実用的に、 スケルトン
系特徴量のように失敗することなく求めることができ
る。
[Function] By using a multidimensional wavelet transform coefficient as a feature value, a feature value that is more resistant to deformation and line thickness change than a pixel itself or a contour-based feature value is more versatile and practical than an ad hoc feature value. It can be obtained without failure like the skeleton feature.

【0009】多次元ウェーブレット変換係数を低次元化
することにより、特徴量次元が高すぎることによる識別
手法の制約が減り、マハラノビス距離、ベイズ識別、ニ
ューラルネットワーク、など複雑な識別に有効な識別手
法を適用することができる。
[0009] By reducing the multidimensional wavelet transform coefficients, the restrictions on the identification method due to the feature dimension being too high are reduced, and an identification method effective for complicated identification such as Mahalanobis distance, Bayesian identification, and neural network is provided. Can be applied.

【0010】[0010]

【実施例】本装置の第1実施例を図1〜図3に示す。図
1は本発明の第1実施例を示す図、図2は本発明装置を
用いた手書き漢字認識装置を示す図、図3は図1の装置
のウェーブレット変換係数次元低下装置の次元低下手法
の例を示す図である。 I .学習による識別辞書データの作成 文字認識に先立ち、次の(A)〜(F)により、識別辞
書データを作成しておく。
1 to 3 show a first embodiment of the present apparatus. FIG. 1 is a diagram showing a first embodiment of the present invention, FIG. 2 is a diagram showing a handwritten kanji recognition device using the device of the present invention, and FIG. 3 is a diagram showing a dimension reduction method of a wavelet transform coefficient dimension reduction device of the device of FIG. It is a figure showing an example. I. Creation of Identification Dictionary Data by Learning Prior to character recognition, identification dictionary data is created according to the following (A) to (F).

【0011】この識別辞書データの生成は、初めに1度
行えばよく、作成した識別辞書データを用いて、難度で
もII.の認識を行うことができる。 (A)学習用教師画像として、十分な数の漢字画像を用
意する。十分な数とは、最低でも各クラス(文字の種
類)ごとに複数個の数をいい、その数が多いほどパター
ン認識能力は高くなる。 (B)前処理装置4の文字サイズ正規化装置5では、
(A)で用意した画像の外接長方形の縦・横サイズを、
あらかじめ決めておいた一定の大きさに正規化する(す
べての文字画像の外接長方形の大きさを揃える)。ここ
では、線型に画像を拡大・縮小することにより正規化を
行うが、正規化の方法はさまざまな非線形正規化でもよ
く、線型拡大・縮小に限らない。 (C)前処理装置4の平滑化装置6では、文字サイズ正
規化装置5での拡大操作などによりいびつになった文字
線の外形を、メディアフィルタなどの平滑化操作により
整える。 (D)特徴量生成装置1の多次元ウェーブレット変換装
置2では、前処理装置4により前処理ずみの画像それぞ
れを2次元ウェーブレット変換し、その変換結果(ウェ
ーブレット変換係数)を求める。 (E)特徴量生成装置1のウェーブレット変換係数次元
低下装置3では、多次元ウェーブレット変換装置2によ
り得た係数を、縦方向(y方向)、横方向(x方向)、
スケール方向の3方向にぼかす(部分的重み付き平均を
とる)ことにより、次元低下した特徴量ベクトルを得
る。ぼかしによる次元低下の例を図4に示す。図4の例
では、具体的数値(ぼかしフィルタの大きさや重みの
値、特徴量の添字の飛び幅など)はあくまでも例であっ
て、この数値に限定するものではない。 (F)辞書作成装置7では、特徴量生成装置1で求め
た、学習用画像の特徴量ベクトルを用いてクラス(種
類)識別のための識別条件となる辞書データを生成す
る。
The identification dictionary data need only be generated once at the beginning, and the created identification dictionary data is used to generate the identification dictionary data even if it is difficult. Can be recognized. (A) A sufficient number of kanji images are prepared as learning teacher images. The sufficient number means at least a plurality of numbers for each class (character type), and the greater the number, the higher the pattern recognition ability. (B) In the character size normalizing device 5 of the preprocessing device 4,
The vertical and horizontal sizes of the circumscribed rectangle of the image prepared in (A)
Normalize to a predetermined size that is determined in advance (make the size of the circumscribed rectangles of all character images uniform). Here, the normalization is performed by linearly enlarging / reducing the image. However, the normalization method may be various nonlinear normalizations, and is not limited to linear enlargement / reduction. (C) In the smoothing device 6 of the pre-processing device 4, the outer shape of the character line that has been distorted by the enlargement operation or the like in the character size normalizing device 5 is adjusted by a smoothing operation such as a media filter. (D) In the multidimensional wavelet transform device 2 of the feature amount generating device 1, the preprocessing device 4 performs a two-dimensional wavelet transform on each of the preprocessed images, and obtains the transform result (wavelet transform coefficient). (E) The wavelet transform coefficient dimension reduction device 3 of the feature amount generation device 1 converts the coefficients obtained by the multidimensional wavelet transform device 2 into a vertical direction (y direction), a horizontal direction (x direction),
By blurring in three directions (taking a partial weighted average) in the scale direction, a feature amount vector with reduced dimensions is obtained. FIG. 4 shows an example of a dimension reduction due to blurring. In the example of FIG. 4, specific numerical values (the size and weight of the blur filter, the jump width of the subscript of the feature amount, etc.) are merely examples, and are not limited to these numerical values. (F) The dictionary creation device 7 uses the feature amount vector of the learning image obtained by the feature amount generation device 1 to generate dictionary data serving as an identification condition for class (type) identification.

【0012】例えば、識別方法として擬似マハラノビス
距離を用いる場合、学習用画像の特徴量ベクトルの、
(a)文字クラス(種類)ごとの平均ベクトル、(b)
文字クラス(種類)ごとの、平均ベクトルに対する共分
散行列の固有値と固有ベクトルを、全てのクラス(種
類)について求めて、辞書データとする。
For example, when the pseudo Mahalanobis distance is used as an identification method, when the feature amount vector of the learning image is
(A) average vector for each character class (type), (b)
The eigenvalues and eigenvectors of the covariance matrix with respect to the average vector for each character class (type) are obtained for all classes (types) and used as dictionary data.

【0013】ただし、辞書データは識別手法によって異
なる。たとえばニューラルネットワークによるクラス
(種類)識別を行う場合は、ニューラルネットワークの
重み係数が辞書データになる。 II.文字の識別 I .により識別条件データを作成した後、次の(G)〜
(K)により文字の識別を行う。 (G)前処理装置4の文字サイズ正規化装置5により、
識別対象の文字画像を正規化する。正規化の方法および
正規化サイズは、I (B)と全く同じにする。 (H)前処理装置4の平滑化装置6により、正規化され
た画像の平滑化を行う。平滑化手法は、I (C)と全く
同じにする。 (I)特徴量生成装置1の多次元ウェーブレット変換装
置2により、前処理画像からウェーブレット変換係数を
生成する。ウェーブレット変換方法(基底、対象スケー
ルの範囲、量子化の仕方など)は、I (D)と全く同じ
にする。 (J)特徴量生成装置1のウェーブレット変換係数次元
低下装置3により、2次元ウェーブレット変換係数を低
次元化した特徴量を求める。低次元の方法は、I(E)
と全く同じとする。 (K)識別装置8では、I で求めた識別辞書データを用
いて、II(G)〜(J)により求めた特徴量ベクトル
が、どのクラス(種類)に属するかを識別する。
However, the dictionary data differs depending on the identification method. For example, when class (type) identification is performed by a neural network, the weighting factor of the neural network is dictionary data. II. Character identification I. After the identification condition data is created, the following (G) to
Characters are identified by (K). (G) The character size normalizing device 5 of the preprocessing device 4
Normalize the character image to be identified. The normalization method and the normalization size are exactly the same as I (B). (H) The smoothing device 6 of the preprocessing device 4 performs smoothing of the normalized image. The smoothing method is exactly the same as I (C). (I) The multi-dimensional wavelet transform device 2 of the feature amount generating device 1 generates wavelet transform coefficients from the pre-processed image. The wavelet transform method (base, range of target scale, quantization method, etc.) is exactly the same as I (D). (J) The feature amount in which the two-dimensional wavelet transform coefficient is reduced in dimension by the wavelet transform coefficient dimension reducing device 3 of the feature amount generating device 1 is obtained. The lower dimensional method is I (E)
And exactly the same. (K) The identification device 8 identifies to which class (kind) the feature vector determined by II (G) to (J) belongs using the identification dictionary data determined by I.

【0014】例えば、擬似マハラノビス距離により識別
を行う場合、 (a)識別辞書データとして求めてある文字クラス(種
類)ごとの平均ベクトル、及び、平均ベクトルに対する
共分散行列の固有値と固有ベクトルを用いて、そのクラ
スに対する、特徴量ベクトル(II(G)〜(J)で求め
た特徴量)の、擬似マハラノビス距離を求める。
For example, in the case of performing identification based on pseudo Mahalanobis distance, (a) using an average vector for each character class (type) obtained as identification dictionary data, and an eigenvalue and an eigenvector of a covariance matrix for the average vector, A pseudo Mahalanobis distance of a feature vector (features obtained by II (G) to (J)) for the class is obtained.

【0015】(b)全てのクラスに対する擬似マハラノ
ビス距離を比べ、もっとも値が小さくなるクラス(種
類)に属すると認識する。尚、例にあげた識別手法はあ
くまでも一例で、これに限るものではない。 III .ウェーブレット変換(Wavelet 変換) ウェーブレット変換の概要を図3および図4に示す。
(B) By comparing the pseudo Mahalanobis distances for all the classes, it is recognized that they belong to the class (kind) having the smallest value. Note that the identification method given in the example is merely an example, and the present invention is not limited to this. III. Wavelet Transform (Wavelet Transform) An outline of the wavelet transform is shown in FIGS.

【0016】図4(B)に示すように、a(このaをス
ケールという)の値の大小により、ウェーブレット変換
基底の形が変化する。図4(C)は3種類の周期のsi
n信号と2つのトリガが重なった場合の例を示す。
As shown in FIG. 4B, the shape of the wavelet transform base changes depending on the value of a (this a is called a scale). FIG. 4 (C) shows si of three types of cycles.
An example in which an n signal and two triggers overlap is shown.

【0017】ウェーブレット変換を用いることにより、
次のような特徴を発揮することができる。 (1)時間・周波数空間での周波数解析ができる。
By using the wavelet transform,
The following features can be exhibited. (1) Frequency analysis in the time / frequency space can be performed.

【0018】特異信号の位置(時間)検出が可能であ
る。周波数分布の時間変化が把握できる。 (2)多重解像度解析(MRA:Multi Resolution Ana
lysis )ができる。
The position (time) of a unique signal can be detected. Time change of the frequency distribution can be grasped. (2) Multi-resolution analysis (MRA)
lysis).

【0019】さまざまな信号成分をそれぞれの周波数に
応じた時間精度で抽出できる。(周波数が高い成分ほど
細かい時間精度で抽出できる。) 幅広い周波数範囲の情報を一度に扱うことが可能であ
る。 (3)さまざまな基底関数を使用できる。 (4)逆変換が可能である。
Various signal components can be extracted with a time accuracy corresponding to each frequency. (Higher frequency components can be extracted with finer time accuracy.) Information in a wide frequency range can be handled at once. (3) Various basis functions can be used. (4) Inverse transformation is possible.

【0020】直交ウェーブレットで簡易に高速化ができ
る。 IV.ぼかしによる低次元特徴量の生成例 図4に、第1実施例によるぼかしによる次元低下の例を
示す。
The speed can be easily increased by using the orthogonal wavelet. IV. Example of Generation of Low-Dimensional Feature Amount by Blur FIG. 4 shows an example of a reduction in dimension due to blur according to the first embodiment.

【0021】図4において、sはスケール、xは前処理
ずみの画像の横方向の長さ、yは前処理ずみの画像の縦
方向の長さ、f(s,x,y)は正規化されていないぼ
かしフィルタ関数、f(−1,x,y)はスケールが1
小さいウェーブレット変換係数にかける重み、f(0,
x,y)はそのスケールのウェーブレット変換係数にか
ける重み、f(1,x,y)は、スケールが1大きいウ
ェーブレット変換係数にかける重み、iはx方向(画像
横方向)のぼけフィルタ範囲、jはy方向(画像縦方
向)のぼけフィルタ範囲、kはスケール方向のぼけフィ
ルタ範囲、Sはスケールの種類数、を示す。
In FIG. 4, s is the scale, x is the horizontal length of the preprocessed image, y is the vertical length of the preprocessed image, and f (s, x, y) is the normalized value. Unfiltered blur filter function, f (-1, x, y) has a scale of 1
The weight applied to the small wavelet transform coefficients, f (0,
x, y) is the weight applied to the wavelet transform coefficient of the scale, f (1, x, y) is the weight applied to the wavelet transform coefficient having the larger scale by 1, i is the blur filter range in the x direction (horizontal direction of the image), j indicates the blur filter range in the y direction (vertical direction of the image), k indicates the blur filter range in the scale direction, and S indicates the number of types of scale.

【0022】1枚の画像の、あるスケールでのウェーブ
レット変換係数の数は、スケールの値により異なる。ス
ケールによってウェーブレット基底のシフト間隔が異な
るので、あるシフトSのときの x方向のシフト回数を X(S) y方向のシフト回数を Y(S) を表現している。
The number of wavelet transform coefficients of one image at a certain scale differs depending on the value of the scale. Since the shift interval of the wavelet basis differs depending on the scale, the number of shifts in the x direction at a certain shift S is represented by X (S) and the number of shifts in the y direction is represented by Y (S).

【0023】[0023]

【発明の効果】本発明装置は前述のように構成されてい
るので、以下に記載するような効果を奏する。 (1)特徴量として、多次元ウェーブレット変換係数を
用いることにより、変形や線の太さの変化に強い特徴量
を、汎用的かつ確実に求めることが出来るとともに、非
常に複雑な文字である漢字の認識もできる。 (2)多次元ウェーブレット変換係数を低次元化するこ
とにより、擬似マハラノビス距離などの高度な識別手法
の適用が可能になり、パターン認識能力を高めることが
できる。
Since the apparatus of the present invention is configured as described above, the following effects are obtained. (1) By using a multidimensional wavelet transform coefficient as a feature quantity, a feature quantity resistant to deformation and a change in line thickness can be universally and reliably obtained, and a kanji character which is a very complicated character Can also be recognized. (2) By reducing the dimensions of the multidimensional wavelet transform coefficients, it is possible to apply an advanced identification method such as a pseudo Mahalanobis distance, and to improve the pattern recognition ability.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1実施例を示す図。FIG. 1 is a diagram showing a first embodiment of the present invention.

【図2】第1実施例の全体構成図(図1の装置を用いた
手書き漢字認識装置を示す図)。
FIG. 2 is an overall configuration diagram of the first embodiment (a diagram showing a handwritten kanji recognition device using the device of FIG. 1).

【図3】ウェーブレット変換の概要を示す図。FIG. 3 is a diagram showing an outline of a wavelet transform.

【図4】図1の特徴量生成装置のウェーブレット変換係
数次元低下装置の次元低下手法の例を示す図(ぼかしに
よる低次元特徴量の生成例)。
4 is a diagram illustrating an example of a dimension reduction method of a wavelet transform coefficient dimension reduction device of the feature value generation device of FIG. 1 (an example of generation of a low-dimensional feature value by blurring).

【符号の説明】[Explanation of symbols]

1…特徴量生成装置、 2…多次元ウェーブレット変換装置、 3…ウェーブレット変換係数次元低下装置、 4…前処理装置、 5…文字サイズ正規化装置、 6…平滑化装置、 7…辞書作成装置、 8…識別装置、 9…パターン認識装置。 DESCRIPTION OF SYMBOLS 1 ... Feature generation apparatus, 2 ... Multidimensional wavelet transform apparatus, 3 ... Wavelet transform coefficient dimension reduction apparatus, 4 ... Preprocessing apparatus, 5 ... Character size normalization apparatus, 6 ... Smoothing apparatus, 7 ... Dictionary creation apparatus, 8 ... identification device 9 ... pattern recognition device

フロントページの続き (56)参考文献 特開 平6−251200(JP,A) 特開 平6−28523(JP,A) 特開 昭59−177684(JP,A) 「電子情報通信学会技術研究報告」V ol.93 No.228(PRU93−53) p.81−88 「Machine Vision a nd Applications」Vo l.6 No.2/3 p.110−123 (1993) (58)調査した分野(Int.Cl.7,DB名) G06K 9/46 G06K 9/62 JICSTファイル(JOIS)Continuation of the front page (56) References JP-A-6-251200 (JP, A) JP-A-6-28523 (JP, A) JP-A-59-177684 (JP, A) "Vol. 93 No. 228 (PRU93-53) p. 81-88 "Machine Vision and Applications", Vol. 6 No. 2/3 p. 110-123 (1993) (58) Field surveyed (Int. Cl. 7 , DB name) G06K 9/46 G06K 9/62 JICST file (JOIS)

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 文字や記号などの画像データから、その
文字や記号などの属するクラスを識別するための特徴量
を生成する特徴量生成装置において、多次元ウェーブレット変換装置と、 ウェーブレット変換係数次元低下装置と、 学習用教師画像のサイズを正規化すると共に文字線の外
形を整える教師画像前処理手段と、 前記教師画像前処理手段により処理された画像をそれぞ
れ前記多次元ウェーブレット変換装置によりウェーブレ
ット変換して変換係数を求め、該変換係数を前記ウェー
ブレット変換次元低下装置により縦方向、横方向、スケ
ール方向の3方向に部分的重み平均をとり、次元低下し
た学習用画像の特徴量ベクトルを得る学習用特徴量生成
手段と、 前記学習用特徴量生成手段で求めた特徴量ベクトルを用
いてクラス識別のための識別条件となる辞書データを生
成する辞書作成手段と、 識別対象の画像データのサイズを正規化すると共に文字
線の外形を整える識別画像前処理手段と、 前記識別画像前処理手段により処理された対象画像をそ
れぞれ前記多次元ウェーブレット変換装置によりウェー
ブレット変換して変換係数を求め、該変換係数を前記ウ
ェーブレット変換次元低下装置により縦方向、横方向、
スケール方向の3方向に部分的重み平均をとり、次元低
下した識別用画像の特徴量ベクトルを得る識別用特徴量
生成手段と を具備し、前記識別用特徴量生成手段で求め
た特徴量ベクトルのクラスを前記辞書データを用いて識
別する ことを特徴とする特徴量生成装置。
From the image data, such as 1. A character or symbol, the feature amount generating unit for generating a feature amount for identifying the class belongs, such as the character or symbol, and multi-dimensional wavelet transformation device, lowering the wavelet transform coefficients dimension outside the character line as well as normalization and apparatus, the size of the learning tutor image
A teacher image preprocessing means for shaping, and an image processed by the teacher image preprocessing means.
Wavelet by the multi-dimensional wavelet transformer.
To obtain a conversion coefficient, and the conversion coefficient is
Vertical, horizontal and scale
Average the partial weights in three directions,
Feature generation for obtaining feature vector of learned learning image
Means and a feature amount vector obtained by the learning feature amount generation means.
And generate dictionary data as identification conditions for class identification.
Dictionary creation means, which normalizes the size of the image data to be identified and
Identification image preprocessing means for adjusting the outline of the line; and a target image processed by the identification image preprocessing means.
Each of the multidimensional wavelet transformers has
The transform coefficient is obtained by bullet transform, and the transform coefficient
Vertical, horizontal,
Average partial weights in three directions of the scale direction
The discriminating feature that obtains the discriminating image feature vector
Generation means, and the identification feature quantity generation means
The class of the feature quantity vector is identified using the dictionary data.
A feature amount generation device characterized by differentiating .
JP6308882A 1994-12-13 1994-12-13 Feature generator Expired - Lifetime JP3064192B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6308882A JP3064192B2 (en) 1994-12-13 1994-12-13 Feature generator

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6308882A JP3064192B2 (en) 1994-12-13 1994-12-13 Feature generator

Publications (2)

Publication Number Publication Date
JPH08167004A JPH08167004A (en) 1996-06-25
JP3064192B2 true JP3064192B2 (en) 2000-07-12

Family

ID=17986403

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6308882A Expired - Lifetime JP3064192B2 (en) 1994-12-13 1994-12-13 Feature generator

Country Status (1)

Country Link
JP (1) JP3064192B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100588267C (en) * 2002-06-03 2010-02-03 精工爱普生株式会社 Image display device and image display method
KR200456867Y1 (en) * 2008-08-28 2011-11-24 최성률 Fishing weights with cab tip
KR20170079796A (en) * 2015-12-31 2017-07-10 단국대학교 산학협력단 Apparatus and method for generating image using bidirectional integral feature for face recognition

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000251013A (en) * 1999-02-26 2000-09-14 Sanyo Electric Co Ltd Method and device for character recognition and storage medium

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
「Machine Vision and Applications」Vol.6 No.2/3 p.110−123(1993)
「電子情報通信学会技術研究報告」Vol.93 No.228(PRU93−53)p.81−88

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100588267C (en) * 2002-06-03 2010-02-03 精工爱普生株式会社 Image display device and image display method
KR200456867Y1 (en) * 2008-08-28 2011-11-24 최성률 Fishing weights with cab tip
KR20170079796A (en) * 2015-12-31 2017-07-10 단국대학교 산학협력단 Apparatus and method for generating image using bidirectional integral feature for face recognition
KR101962880B1 (en) * 2015-12-31 2019-03-27 단국대학교 산학협력단 Apparatus and method for generating image using bidirectional integral feature for face recognition

Also Published As

Publication number Publication date
JPH08167004A (en) 1996-06-25

Similar Documents

Publication Publication Date Title
US20030161504A1 (en) Image recognition system and recognition method thereof, and program
Etemad et al. Face recognition using discriminant eigenvectors
US6671391B1 (en) Pose-adaptive face detection system and process
Jain et al. Bar code localization using texture analysis
Vijaya Lakshmi et al. Feature selection to recognize text from palm leaf manuscripts
JP3064192B2 (en) Feature generator
JP3252941B2 (en) Image segmentation recognition device
CN118430054B (en) Human face recognition method and system based on AI intelligence
CN108921006B (en) A method for establishing the authenticity identification model of a handwritten signature image and a method for authenticating it
Gatto et al. Subspace-based convolutional network for handwritten character recognition
Miciak Character recognition using Radon transformation and principal component analysis in postal applications
Miciak Radon Transformation and Principal Component Analysis Method Applied in Postal Address Recognition Task.
Birajdar et al. Subsampling-based blind image forgery detection using support vector machine and artificial neural network classifiers
Bhattacharya et al. Robust face recognition of inferior quality images using local gabor phase quantization
Chitaliya et al. Comparative analysis using fast discrete Curvelet transform via wrapping and discrete Contourlet transform for feature extraction and recognition
Chen et al. Edge detection and texture segmentation based on independent component analysis
Benjelil et al. Complex documents images segmentation based on steerable pyramid features
Rafi et al. Face Recognition Using Contour and Discrete Cosine Transform
Fauqueur et al. Semantic discriminant mapping for classification and browsing of remote sensing textures and objects
Tang Status of pattern recognition with wavelet analysis
Schindler et al. Combining densely sampled form and motion for human action recognition
Chitaliya et al. Automated vehicle identification system based on discrete curvelet transform for visual surveillance and traffic monitoring system
Foucher et al. Global semantic classification of scenes using ridgelet transform
Feldmann et al. Histogram of Oriented Gradients for Maya Glyph Retrieval.
Wakahara et al. Handwritten Japanese character recognition using adaptive normalization by global affine transformation

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000404

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090512

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090512

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100512

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110512

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120512

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130512

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140512

Year of fee payment: 14

EXPY Cancellation because of completion of term