[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN104408814A - 一种人民币冠字号识别方法 - Google Patents

一种人民币冠字号识别方法 Download PDF

Info

Publication number
CN104408814A
CN104408814A CN201410772905.0A CN201410772905A CN104408814A CN 104408814 A CN104408814 A CN 104408814A CN 201410772905 A CN201410772905 A CN 201410772905A CN 104408814 A CN104408814 A CN 104408814A
Authority
CN
China
Prior art keywords
character
image
word number
crown word
coarse positioning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410772905.0A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TIANJIN YUANMU TECHNOLOGY Co Ltd
Original Assignee
TIANJIN YUANMU TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TIANJIN YUANMU TECHNOLOGY Co Ltd filed Critical TIANJIN YUANMU TECHNOLOGY Co Ltd
Priority to CN201410772905.0A priority Critical patent/CN104408814A/zh
Publication of CN104408814A publication Critical patent/CN104408814A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明名称为:一种人民币冠字号识别的方法。该技术涉及图像识别技术等技术领域。该发明方法主要涉及预处理、定位、字符切分、字符识别等关键步骤。预处理完成对图像的去噪、二值化、膨胀等处理工作。预处理工作是为了更方便地对冠字号进行定位。经过预处理的冠字号已经在一个区域范围内,利用水平投影与垂直投影的方式对其进行粗定位,在此基础上对其进行倾斜校正处理。接着,对校正后的冠字号字符进行字符切分,得到独立的字符。在此基础上,将得到的划分后的字符进行位置归一化处理、大小归一化处理,以方便特征提取与字符识别。最后,提取字符图像的八方向梯度特征,使用欧氏距离对字符进行识别。

Description

一种人民币冠字号识别方法
技术领域
该技术涉及图像识别技术,具体涉及到数字图像处理、电子商务、电子政府、计算机应用、人工智能、模式识别等技术领域。
背景技术
每一张人民币均具有唯一的冠字号。冠字号对于人民币的合理、合法使用具有重大意义。掌握冠字号则能够在货币的流通过程中,准确无误地记载并掌握人民币的流通情况。在国内,曾发生过恶性抢夺人民币的事件。如果能够及时地检测人民币的冠字号,则能够有效地监控人民币的流通,为打击犯罪分子的非法活动提供有效帮助,并震慑非法分子的不良企图,能够在根源上遏制犯罪分子的不良企图。在银行的正常货币流通过程中,人们也会有对冠字号进行登记的需求。因此,能够有效识别冠字号是一项十分重要而又有意义的工作。目前,已经有厂家在ATM机上开发出了人民币冠字号打印功能。但是,该功能尽能够在ATM机上使用,尚未扩展到一般的生活之中。
发明内容
本发明实现了一种人民币冠字号识别的方法。该发明方法能够对人民币的冠字号进行有效识别,主要涉及预处理、定位、字符切分、字符识别等关键步骤。
预处理完成对图像的去噪、二值化、膨胀等处理工作。图像的去噪采用一个5*5的矩阵模板对其进行处理,将该模板内去除四个角点后,求取其平均值,该过程实现对图像的噪声进行过滤,确保一些独立的噪声点的去除。在上述处理基础上,对图像进行灰度处理、二值化处理,得到一个二值化图像矩阵。针对得到的二值化图像进一步进行膨胀处理以方便进行定位。经过预处理的冠字号已经在一个区域范围内,利用水平投影与垂直投影的方式对其进行粗定位。经过粗定位后,冠字号的位置基本确定,在此基础上对其进行倾斜校正处理。完成倾斜校正后,对得到的冠字号字符进行字符切分,将其划分为一个个独立的字符。在此基础上,将得到的划分后的字符进行位置归一化处理、大小归一化处理。此时,对上述字符进行特征提取。最后,使用欧式距离对字符进行识别。
具体实施方式
人民币冠字号识别是图像处理的应用,主要涉及去噪、定位、字符切分、字符识别等关键步骤。为了提高有效性,在关键步骤中需要对图像进行有效的预处理以满足关键步骤的处理需求。其具体的实施过程包含以下步骤:
1信息去噪处理
通过摄像头获取的纸币信息会有一定的噪声,为了避免其影响,可以对其去噪。这里,采用均值滤波法对其噪声去噪。对于图像f(x,y),遍历图像中每一个像素点,将该像素点使用模板T进行滤波,用滤波后的新值代替原来的像素值。模板T为,
T = 1 21 0 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 0
完成滤波后,对纸币上的信息进行了有效过滤。
2二值化处理
首先,将彩色图像转换为灰度图像,处理过程为,
Nvalue = R * r + G * g + B * b 3
式中,Nvalue为得到的灰度值,R、G、B为当前像素点的R、G、B分量值,r、g、b为R、G、B根据需要在此设定的所占百分比。
在上述处理的基础上,将得到的灰度图像进行二值化处理。二值化处理,采用最大方差法。具体过程为:
假定图像中灰度为i的像素数为ni,其灰度区间在[0,Max],当前图像内所包含的总像素数为,
N = Σ i = 0 Max n i
各个灰度值的概率为,
p i = n i N
设定一个阈值T,利用T值将图像划分为两大类,划分标准为
L = C 0 pv ∈ [ 0 , T - 1 ] C 1 else
式中,L表示划分结果,pv是当前像素值。
对利用阈值T划分的两个区域进行概率计算,将C0的概率记为P0,C1的概率记为P1,则有,
P 0 = Σ i = 0 T - 1 p i
P 1 = Σ i = T Max p i = 1 - P 0
对C0和C1的平均值进行计算,
μ 0 = 1 P 0 Σ i = 0 T - 1 i p i
μ i = 1 P 1 Σ i = T Max i p i
计算当前图像的灰度均值,
μ = Σ i = 0 T - 1 i p i + Σ i = T Max i p i = P 0 μ 0 + P 1 μ 1
计算两个区域的方差,
σ2=P00-μ)2+P11-μ)2=P0P101)2
将阈值T设置在第一个区间[0,T-1]内,以步长1调整其值,当σ2取得最大值时的T值最佳阈值。
3.图像膨胀处理
为了实现定位的准确性,对得到的二值化图像进行膨胀处理。
设M为目标图像,B为结构元素,则目标图像M被结构元素B膨胀的数学表达式为
M ⊕ B = { x | ( B V ) x ∩ X ≠ Φ }
式中,x表示集合平移的位移量,是膨胀运算的运算符。
此处,选择B为3*3的矩阵。
4.粗定位
对图像进行水平方向投影与垂直方向的投影,根据水平投影和垂直投影确定当前冠字号的x轴与y轴位置,对当前确定好的x轴、y轴位置进行交叉处理,得到冠字号的粗定位。
首先对当前图像进行水平投影定位,从第0列开始,依次遍历计算当前列的黑色像素点像素数,如果其值超过阈值T,则以当前值为起始点,依次寻找终止点。
按照与水平投影相同的方式对垂直方向进行投影。
5.冠字号倾斜校正处理
倾斜校正采用霍夫变换的方式实现,涉及主要技术有,
5.1计算重心
根据步骤4内确定的粗定位结果,针对粗定位区域的每一列计算重心。
5.2霍夫变换
直线方程公式为,
y=kx+b
式中,k为斜率,b为直线在y轴上的截距。将该方程式变换为极坐标表示可以表示为,
y=xcosθ+ysinθ
霍夫变换用来求取需要旋转的角度。
5.3倾斜校正
根据极坐标方程,假定当前的点为,
x 0 = r cos ( α ) y 0 =rsin ( α )
如果对其进行校正,旋转了角度θ,则将其方程式可以表示为,
x 1 = r cos ( α - θ ) y 1 =rsin ( α - θ )
对上述公式进行整理,可以得到转换方程式,
x 1 = x 0 cos ( θ ) + y 0 sin ( θ ) y 1 = - x 0 r sin ( θ ) + y 0 cos ( θ )
6.冠字号的切分
6.1腐蚀处理
对当前粗定位区域进行腐蚀操作,此操作用来消除噪声。
6.2扫描确定
从粗确定区域的左侧开始扫描图像。具体方式为,从第一列开始计算当前列的像素和。如果根据计算,当前列内存在字符显示像素点,则将其标记为一个字符的开始,一直当遇到某一列内不存在一个显示像素点则将其作为该字符的结束。将空白像素列作为字符间隙处理。按照该方式自左向右扫描整个粗定位区域,确定所有字母。
6.3断裂字符处理
当一个字符经过步骤6.1的腐蚀处理后,可能会造成字符割裂,即将一个字符在某个中间部位隔离开来,以致在步骤6.2内处理为两个字符。
设定一个区间[s,l],假设该区间是合理的字符间隔区间。如果在步骤6.2内分割的字符间隔小于s,则认为存在字符内部分割情况,将该间隔左右的两个字符作为一个处理。
6.4粘连字符处理
图像自身的扫描等问题可能造成字符粘连,步骤6.3处理不当也可能将分割的字符造成粘连情况,因此需要对粘连字符进行处理。
首先对步骤6.3的划分结果进行确认,如果上述步骤内划分的字符个数少于冠字号的实际个数,则对明显大于其他字符宽度的字符进行再分割。
选定再分割区域,将其中垂直投影方向上明显小于该区域内的平均像素数的列作为分割列处理,得到新的划分结果。
7.冠字号的归一化
冠字号的归一化涉及位置归一化和大小归一化。倾斜校正是位置归一化的一种用于实现倾斜处理,此处的位置归一化是在倾斜归一化的基础上进行再次处理。
7.1位置归一化
假设,某一个原始像素点,其位置为(Ox,Oy),其平移后的像素点位置为(Nx,Ny)。根据上述关系,调整确定好的每个字符的位置关系,如下,
xNew = xOriginal + ( Nx - Ox ) yNew = yOriginal + ( Ny - Oy )
式中,调整前的坐标为(xOriginal,yOriginal),调整后的坐标为(xNew,yNew)。
7.2大小归一化
(1)确定坐标
将调整位置后的字符左上角坐标定义为(Xlt,Ylt),右下角坐标定义为(Xrb,Yrb)。
(2)确定比例
令归一化后的字符大小为W*H,则调整比例为,
ρx = W Xrb - Xlt ρy = H Yrb - Ylt
(3)确定转换公式
假设原始点为(x,y),调整后的像素点为(xN,yN),则归一化公式为,
xN yN = ρx 0 0 ρy x y
8.特征提取
这里提取字符图像的八方向梯度特征,具体为,
(1)计算Sobel算子
采用sobel算子h1、h2进行边缘特征提取,
h 1 = 1 2 1 0 0 0 - 1 - 2 - 1
h 2 = - 1 0 1 - 2 0 2 - 1 0 1
(2)计算方向特征
计算字符在八个方向上的特征值,该特征方向为,
g = 3 2 1 4 x 0 5 6 7
式中,x是当前特征值,0~7共八个方向是要提取的特征值方向。
(3)提取特征值
为了减少运算量,将字符图像划分为w*h大小的子块,归一化后的字符大小为W*H,每块内具有8个特征值。此时共提取的特征值为,
N = W * H w * h * 8
9.识别
对模式的识别,采用欧氏距离判断处理。欧氏距离是闵式距离的一种特例情况,闵式距离(MinkowskiDistance)为,
D ( A , B ) = [ Σ i = 1 N | a i - b i | p ] 1 p
当p=2时,即为欧氏距离,
D ( A , B ) = [ Σ i = 1 N | a i - b i | p ] 1 2
根据欧式距离判定当前需要识别字符的分类,完成字符的识别。

Claims (2)

1.一种人民币冠字号识别方法,其特征在于其处理过程为: 
1.1信息去噪处理 
使用模板T, 
进行滤波工作; 
1.2二值化处理 
首先,将彩色图像处理为灰度图像,在此基础上设定一个阈值T,利用T值将图像划分为两大类,接着,对利用阈值T划分的两个区域进行概率计算,通过不断调整参数确定T值最佳阈值; 
1.3图像膨胀处理 
选择3*3的矩阵对得到的二值化图像进行膨胀处理; 
1.4粗定位 
对图像进行水平方向投影与垂直方向的投影,完成粗定位工作; 
1.5冠字号倾斜校正处理 
对粗定位后的区域进行中心计算后,采用霍夫变换的方式实现倾斜校正; 
1.6冠字号的切分 
首先,对粗定位区域进行腐蚀操作,然后,按照自左向右扫描整个粗定位区域,确定所有字母。接下来,对断裂字符、粘连字符进行处理,进一步明确划分结果; 
1.7冠字号的归一化 
对划分好的字符进行位置归一化、大小归一化处; 
1.8特征提取 
提取字符图像的八方向梯度特征; 
1.9识别 
采用欧氏距离进行字符识别处理。 
2.根据权利要求1所述的一种人民币冠字号识别方法,其特征在于信息去噪所采用模板T为, 
CN201410772905.0A 2014-12-13 2014-12-13 一种人民币冠字号识别方法 Pending CN104408814A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410772905.0A CN104408814A (zh) 2014-12-13 2014-12-13 一种人民币冠字号识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410772905.0A CN104408814A (zh) 2014-12-13 2014-12-13 一种人民币冠字号识别方法

Publications (1)

Publication Number Publication Date
CN104408814A true CN104408814A (zh) 2015-03-11

Family

ID=52646441

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410772905.0A Pending CN104408814A (zh) 2014-12-13 2014-12-13 一种人民币冠字号识别方法

Country Status (1)

Country Link
CN (1) CN104408814A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809801A (zh) * 2015-04-17 2015-07-29 深圳怡化电脑股份有限公司 一种纸币图像的处理方法
CN104866849A (zh) * 2015-04-30 2015-08-26 天津大学 一种基于移动终端的食品营养成分标签识别方法
CN105354566A (zh) * 2015-10-26 2016-02-24 江苏国光信息产业股份有限公司 用于冠字号识别的字符污染去除方法
CN105389883A (zh) * 2015-11-04 2016-03-09 东方通信股份有限公司 一种验钞机的纸币冠字号识别方法
CN105405204A (zh) * 2015-11-04 2016-03-16 东方通信股份有限公司 验钞机的纸币冠字号识别方法
CN105761351A (zh) * 2016-01-08 2016-07-13 东方通信股份有限公司 基于结构特征的字符识别方法
CN106022346A (zh) * 2016-05-24 2016-10-12 深圳怡化电脑股份有限公司 一种冠字号的切割方法和装置
CN106203417A (zh) * 2016-07-12 2016-12-07 北京科技大学 一种粘连字符可分割的人民币冠字号识别方法
CN106355743A (zh) * 2015-07-14 2017-01-25 深圳怡化电脑股份有限公司 纸币的版本识别方法及装置
CN106710063A (zh) * 2016-12-27 2017-05-24 陕西科技大学 一种基于计算机视觉的人民币冠字号码数字识别方法
CN107195069A (zh) * 2017-06-28 2017-09-22 浙江大学 一种人民币冠字号自动识别方法
CN107346428A (zh) * 2017-05-24 2017-11-14 上海视马艾智能科技有限公司 一种ic表面字符识别方法与装置
CN107464335A (zh) * 2017-08-03 2017-12-12 恒银金融科技股份有限公司 一种纸币冠字号定位方法
CN108197512A (zh) * 2018-01-25 2018-06-22 深圳怡化电脑股份有限公司 票据磁码的识别方法、装置、票据处理设备及存储介质
CN108734846A (zh) * 2017-04-25 2018-11-02 深圳怡化电脑股份有限公司 纸币图像的去噪方法及装置、终端及存储介质
CN111257346A (zh) * 2020-02-20 2020-06-09 清华大学 基于投影过滤的pcb定位装置及方法
CN111784717A (zh) * 2020-06-28 2020-10-16 中国计量大学 一种智慧台灯及基于该台灯的自动阅卷方法

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809801A (zh) * 2015-04-17 2015-07-29 深圳怡化电脑股份有限公司 一种纸币图像的处理方法
CN104866849A (zh) * 2015-04-30 2015-08-26 天津大学 一种基于移动终端的食品营养成分标签识别方法
CN106355743A (zh) * 2015-07-14 2017-01-25 深圳怡化电脑股份有限公司 纸币的版本识别方法及装置
CN105354566A (zh) * 2015-10-26 2016-02-24 江苏国光信息产业股份有限公司 用于冠字号识别的字符污染去除方法
CN105354566B (zh) * 2015-10-26 2019-01-22 江苏国光信息产业股份有限公司 用于冠字号识别的字符污染去除方法
CN105389883B (zh) * 2015-11-04 2018-01-12 东方通信股份有限公司 一种验钞机的纸币冠字号识别方法
CN105389883A (zh) * 2015-11-04 2016-03-09 东方通信股份有限公司 一种验钞机的纸币冠字号识别方法
CN105405204A (zh) * 2015-11-04 2016-03-16 东方通信股份有限公司 验钞机的纸币冠字号识别方法
CN105405204B (zh) * 2015-11-04 2018-02-02 东方通信股份有限公司 验钞机的纸币冠字号识别方法
CN105761351A (zh) * 2016-01-08 2016-07-13 东方通信股份有限公司 基于结构特征的字符识别方法
CN106022346B (zh) * 2016-05-24 2019-06-07 深圳怡化电脑股份有限公司 一种冠字号的切割方法和装置
CN106022346A (zh) * 2016-05-24 2016-10-12 深圳怡化电脑股份有限公司 一种冠字号的切割方法和装置
CN106203417A (zh) * 2016-07-12 2016-12-07 北京科技大学 一种粘连字符可分割的人民币冠字号识别方法
CN106710063A (zh) * 2016-12-27 2017-05-24 陕西科技大学 一种基于计算机视觉的人民币冠字号码数字识别方法
CN108734846A (zh) * 2017-04-25 2018-11-02 深圳怡化电脑股份有限公司 纸币图像的去噪方法及装置、终端及存储介质
CN107346428A (zh) * 2017-05-24 2017-11-14 上海视马艾智能科技有限公司 一种ic表面字符识别方法与装置
CN107195069A (zh) * 2017-06-28 2017-09-22 浙江大学 一种人民币冠字号自动识别方法
CN107464335A (zh) * 2017-08-03 2017-12-12 恒银金融科技股份有限公司 一种纸币冠字号定位方法
CN107464335B (zh) * 2017-08-03 2020-01-17 恒银金融科技股份有限公司 一种纸币冠字号定位方法
CN108197512A (zh) * 2018-01-25 2018-06-22 深圳怡化电脑股份有限公司 票据磁码的识别方法、装置、票据处理设备及存储介质
CN108197512B (zh) * 2018-01-25 2021-03-12 深圳怡化电脑股份有限公司 票据磁码的识别方法、装置、票据处理设备及存储介质
CN111257346A (zh) * 2020-02-20 2020-06-09 清华大学 基于投影过滤的pcb定位装置及方法
CN111257346B (zh) * 2020-02-20 2022-02-25 清华大学 基于投影过滤的pcb定位装置及方法
CN111784717A (zh) * 2020-06-28 2020-10-16 中国计量大学 一种智慧台灯及基于该台灯的自动阅卷方法
CN111784717B (zh) * 2020-06-28 2024-01-16 中国计量大学 一种智慧台灯及基于该台灯的自动阅卷方法

Similar Documents

Publication Publication Date Title
CN104408814A (zh) 一种人民币冠字号识别方法
CN109145915B (zh) 一种复杂场景下车牌快速畸变矫正方法
Farooq et al. Pre-processing methods for handwritten Arabic documents
CN104200210B (zh) 一种基于部件的车牌字符分割方法
CN101430763B (zh) 遥感图像中水上桥梁目标检测方法
CN103218605B (zh) 一种基于积分投影与边缘检测的快速人眼定位方法
CN109800752B (zh) 一种基于机器视觉的汽车车牌字符分割识别算法
CN108921813B (zh) 一种基于机器视觉的无人机检测桥梁结构裂缝识别方法
TW201039248A (en) Method and system for identifying image and outputting identification result
CN109657579B (zh) 一种指纹裂纹的检测与修复方法
CN102222226A (zh) 一种基于先验分析的迭代式车牌字符分割方法
CN106127193B (zh) 一种人脸图像识别方法
CN102254188A (zh) 掌纹识别方法及装置
CN106407980A (zh) 一种基于图像处理的银行卡号码识别方法
CN110427909B (zh) 一种移动端驾驶证检测方法、系统及电子设备和存储介质
CN109766850B (zh) 基于特征融合的指纹图像匹配方法
CN106503709A (zh) 一种渣土车车牌字符智能识别方法
Nag et al. New cold feature based handwriting analysis for enthnicity/nationality identification
CN111055021A (zh) 一种激光打标软件的视觉定位方法
JP7076772B2 (ja) 認証システムおよび認証方法
CN107463939B (zh) 一种图像关键直线检测方法
CN109741273A (zh) 一种手机拍照低质图像的自动处理与评分方法
CN106650719B (zh) 识别图片文字的方法及装置
CN116434071B (zh) 一种规整化建筑掩膜的确定方法、确定装置、设备及介质
Maqqor et al. Using HMM Toolkit (HTK) for recognition of arabic manuscripts characters

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150311