CN102779275B - 一种纸类字符识别方法及相关装置 - Google Patents
一种纸类字符识别方法及相关装置 Download PDFInfo
- Publication number
- CN102779275B CN102779275B CN201210230901.0A CN201210230901A CN102779275B CN 102779275 B CN102779275 B CN 102779275B CN 201210230901 A CN201210230901 A CN 201210230901A CN 102779275 B CN102779275 B CN 102779275B
- Authority
- CN
- China
- Prior art keywords
- character
- region
- target string
- view data
- monocase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012937 correction Methods 0.000 claims abstract description 14
- 238000013481 data capture Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000007373 indentation Methods 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000007667 floating Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005498 polishing Methods 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明实施例公开了一种纸类字符识别方法及相关装置,用于准确的进行输入纸类中字符串的识别。方法包括:获取输入纸类的图像数据;对所述图像数据进行倾斜校正;对所述图像数据的目标字符串进行初步定位,获取所述目标字符串的初步区域;定位所述初步区域内像素点的灰度值之和最小的区域;获得所述目标字符串的全区域;对所述全区域内的目标字符串进行字符识别。
Description
技术领域
本发明涉及图像处理领域,尤其涉及一种纸类字符识别方法及相关装置。
背景技术
随着经济和社会的发展,纸币越来越多,流通也越来越频繁。纸币是一种重要的票据,真钞的号码具有唯一性,是国家纸币印刷数量的标志,因此可以作为纸币的身份证明。目前市场上存在的具有纸币号码识别功能的机具,其识别的准确率都不能达到金融机构的要求,金融机构在处理业务时,最终需采用手工抄写纸币号码的方法来辅助识别假币。因此需在纸币处理机具上开发一种高效率、高准确率的纸币号码自动识别记录系统,一旦出现异常情况(如ATM机收取假币或从ATM中取出假币等),就可以通过自动记录的纸币号码进行跟踪定位。
纸币号码识别系统主要分两部分,字符定位和字符识别。而字符定位的准确度直接影响字符的识别结果。由于钞票本身新旧程度及图像采集设备打光值的影响,字符定位主要存在以下问题:字符在整幅图像中的相对位置有一定的浮动,一方面由于纸币印刷时字符的相对位置会有一定的浮动;另一方面图像采集时,倾斜角度的大小也后造成字符相对位置有一定的浮动;由于上述原因,使得字符定位容易出现偏差,从而导致识别设备无法精确的识别出纸币号码。
发明内容
本发明实施例提供了一种纸类字符识别方法及相关装置,用于准确的进行输入纸类中字符串的识别。
本发明提供的纸类字符识别方法,包括:获取输入纸类的图像数据;对所述图像数据进行倾斜校正;对所述图像数据的目标字符串进行初步定位,获取所述目标字符串的初步区域;定位所述初步区域内像素点的灰度值之和最小的区域;获得所述目标字符串的全区域;对所述全区域内的目标字符串进行字符识别。
可选的,所述对图像数据进行倾斜校正,包括:提取所述图像数据的边缘点;对所述边缘点进行直线拟合;获取所述直线拟合后的边缘点的倾斜角度;根据所述倾斜角度调整所述图像数据。
可选的,所述对图像数据的目标字符串进行初步定位之前,包括:对所述图像数据进行预处理,所述预处理包括为币种识别,面值识别及方向识别中任意一种或两种以上的组合。
可选的,所述对图像数据的目标字符串进行初步定位,具体为:根据所述预处理的结果获取所述目标字符串的目标区域;所述初步区域为所述目标字符串在所述目标区域内的最大范围信息,所述最大范围信息包括所述目标区域的最大高度H和最大宽度W。
可选的,所述根据初步区域进行所述目标字符串的顶点定位之前,包括:去除所述初步区域中的噪声数据。
可选的,所述对全区域内的目标字符串进行字符识别,包括:
确定所述目标字符串中各个字符的上下边界和左右边界,得到各个单字符区域;分别识别所述单字符区域内的字符。
可选的,所述确定所述目标字符串中各个字符的上下边界和左右边界,包括:
获取所述目标字符串中的字符像素点阈值;根据所述字符像素点阈值确定连续的字符像素点,将所述连续的字符像素点垂直方向上的起点坐标和终点坐标作为上下边界,将所述连续的字符像素点水平方向上的起点坐标和终点坐标作为左右边界。
可选的,所述得到各个单字符区域之后,包括:
根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符,若是,则对所述两个字符的单字符区域进行合并。
可选的,所述得到各个单字符区域之后,包括:
根据单个字符的字符宽度判断所述单个字符是否为粘连字符,若是,则对所述单个字符的单字符区域进行分离。
可选的,所述根据单个字符的字符宽度判断所述单个字符是否为粘连字符,包括:判断所述单个字符的字符宽度是否大于宽度阈值,若是,则所述单个字符为粘连字符;
所述对单个字符的单字符区域进行分离,包括:
重新对所述单个字符进行左右边界的确定,若所述单个字符在水平方向上连续的字符像素点满足预置字符宽度,则确认所述满足预置字符宽度内的区域为被分离的第一个单字符区域,并从所述第一个单字符区域的下一点开始作为被分离字符的左边界,原所述单个字符的右边界为所述被分离字符的右边界。
可选的,所述得到各个单字符区域之后,包括:
判断所述单字符区域是否满足边界阈值,若否,则根据所述边界阈值对所述单字符区域进行缩放。
可选的,所述确定目标字符串中各个字符的上下边界,包括:
从所述全区域的中间像素点开始,往上搜索,若连续两个像素点都不满足所述字符像素点阈值,则所述两个像素点之前的像素点作为作为上边界;往下搜索,若连续两个像素点都不满足所述字符像素点阈值,则所述两个像素点之前的像素点作为作为下边界。
本发明提供的纸类字符识别方法,包括:获取字符串的目标区域;确定所述目标区域中各个字符的上下边界和左右边界,得到各个单字符区域;根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符,若是,则对所述两个字符的单字符区域进行合并;分别识别所述单字符区域内的字符。
可选的,所述确定所述字符串中各个字符的上下边界和左右边界,包括:获取所述字符串中的字符像素点阈值;根据所述字符像素点阈值确定连续的字符像素点,将所述连续的字符像素点垂直方向上的起点坐标和终点坐标作为上下边界,将所述连续的字符像素点水平方向上的起点坐标和终点坐标作为左右边界。
可选的,所述得到各个单字符区域之后,包括:
根据单个字符的字符宽度判断所述单个字符是否为粘连字符,若是,则对所述单个字符的单字符区域进行分离。
可选的,所述根据单个字符的字符宽度判断所述单个字符是否为粘连字符,包括:判断所述单个字符的字符宽度是否大于宽度阈值,若是,则所述单个字符为粘连字符;
所述对单个字符的单字符区域进行分离,包括:重新对所述单个字符进行左右边界的确定,若所述单个字符在水平方向上连续的字符像素点满足预置字符宽度,则确认所述满足预置字符宽度内的区域为被分离的第一个单字符区域,并从所述第一个单字符区域的下一点开始作为被分离字符的左边界,原所述单个字符的右边界为所述被分离字符的右边界。
可选的,所述得到各个单字符区域之后,包括:
判断所述单字符区域是否满足边界阈值,若不,则根据所述边界阈值对所述单字符区域进行缩放。
可选的,所述确定字符串中各个字符的上下边界,包括:
从所述全区域的中间像素点开始,往上搜索,若连续两个像素点都不满足所述字符像素点阈值,则所述两个像素点之前的像素点作为作为上边界;从所述全区域的中间像素点开始,往下搜索,若连续两个像素点都不满足所述字符像素点阈值,则所述两个像素点之前的像素点作为作为下边界。
本发明提供的纸类字符识别装置,包括:数据获取单元,用于获取输入纸类的图像数据;倾斜校正单元,用于对所述图像数据进行倾斜校正;初步定位单元,用于对所述图像数据的目标字符串进行初步定位,获取所述目标字符串的初步区域;全区域定位单元,用于定位所述初步区域内像素点的灰度值之和最小的区域;获得所述目标字符串的全区域;字符识别单元,用于对所述全区域内的目标字符串进行字符识别。
可选的,所述倾斜校正单元包括:边缘提取模块,用于提取所述图像数据的边缘点;直线拟合模块,用于对所述边缘点进行直线拟合;倾斜角度获取模块,用于获取所述直线拟合后的边缘点的倾斜角度;调整模块,用于根据所述倾斜角度调整所述图像数据。
本发明提供的纸类字符识别装置,包括:目标获取单元,用于获取字符串的目标区域;边界定位单元,用于确定所述目标区域中各个字符的上下边界和左右边界,得到各个单字符区域;合并单元,用于根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符,若是,则对所述两个字符的单字符区域进行合并;识别单元,用于分别识别所述单字符区域内的字符。
可选的,所述装置还包括:
粘连判定单元,用于根据单个字符的字符宽度判断所述单个字符是否为粘连字符,若是,则对所述单个字符的单字符区域进行分离。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明在对输入纸类的图像数据进行字符定位时,对先对图像数据进行倾斜校正,使得字符的分割和定位更加准确;并且,根据目标字符串的全区域相对背景区域灰度值较小这个特点,可以对初步定位后的字符串区进行顶点定位,更加精确地确定目标字符串所在的位置,进一步的提高了字符串识别的精确度。
附图说明
图1是本发明实施例纸类字符识别方法的一个流程示意图;
图2是本发明实施例纸类字符识别方法的另一个流程示意图;
图3是本发明实施例纸类字符识别装置的一个逻辑结构示意图;
图4是本发明实施例纸类字符识别装置的另一个逻辑结构示意图。
具体实施方式
本发明实施例提供了一种纸类字符识别方法及相关装置,用于准确的进行输入纸类中字符串的识别。
请参阅图1,本发明实施例中输入纸类识别方法的一个实施例包括:
101、获取输入纸类的图像数据;
字符识别装置获取输入纸类的图像数据;具体的,具体的,所述输入纸类数据可以为纸币;所述图像数据包括像素点,以及像素点的灰度值数据。
优选的,字符识别装置可以获取白光灰度的图像数据,以减小数据处理的复杂度;可选的,字符识别装置也获取可以获取彩色的图像数据,以丰富输入纸类识别的特征(一些纸币有特定的颜色,彩色数据有助于直接识别币种);具体获取图像数据的类型可以根据实际需求而定,此处不作限定。
102、对所述图像数据进行倾斜校正;
字符识别装置对所述图像数据进行倾斜校正。由于通过图像采集设备获取到的采集图像不可避免的会发生倾斜,因此,在进行字符定位之前,需要先进行倾斜校正。
103、对所述图像数据的目标字符串进行初步定位;
字符识别装置对所述图像数据的目标字符串进行初步定位,获取所述目标字符串的初步区域。
具体的,目标字符串的类型可以根据实际的识别需求而定,如,需要对纸币的唯一性进行识别,则所述目标字符串可以为纸币的冠字号码。
具体的,所述初步区域可以包括该区域的宽带和高度信息。
可选的,初步定位可以通过输入纸类数据的经验值判定来完成,如,可以先对该输入纸类的类型进行识别,确定类型后,字符识别装置则可以大致知道所需要识别的目标字符串在该输入纸类的哪一个区域,该区域的面积大概有多少。具体的,若所述输入纸类为非对称图形(即左右或正反的图案或字符不一致),则在进行初步定位之前,还需要确定该输入纸类的方向(正反及图案的朝向)。
104、定位所述初步区域内像素点的灰度值之和最小的区域;
字符识别装置定位所述初步区域内像素点的灰度值之和最小的区域,获得所述目标字符串的全区域。
在实际应用中,由于纸币上的字符区域的灰度值一般会低于所在区域的其他位置的灰度值,且某一币种、某一面值的目标字符串所占大小固定,因此,字符识别装置可以定位所述初步区域内像素点的灰度值之和最小的区域,以进一步缩小初步区域的范围,排除噪声的干扰。
在步骤103中完成了对目标字符串的初步定位,为了排除噪声的干扰,提高字符识别的精确度,需要对目标字符串进行二次定位。
105、对所述全区域内的目标字符串进行字符识别。
字符识别装置对所述全区域内的目标字符串进行字符识别。
具体的,可以根据经验值先对所述全区域内的目标字符串进行单字符分割,再使用人工神经网络进行单个字符的识别。上述仅以一些例子对本发明实施例中字符识别的方法进行了说明,可以理解的是,在实际应用中,还可以有其它的字符识别方法,具体此处不作限定。
本发明在对输入纸类的图像数据进行字符定位时,对先对图像数据进行倾斜校正,使得字符的分割和定位更加准确;并且,根据目标字符串的全区域相对背景区域灰度值较小这个特点,可以对初步定位后的字符串区进行顶点定位,更加精确地确定目标字符串所在位置,进一步的提高了字符串识别的精确度。
下面对本发明输入纸类识别方法进行详细描述,请参阅图2,本发明实施例中输入纸类识别方法的另一个实施例包括:
201、获取输入纸类的图像数据;
字符识别装置获取输入纸类的图像数据;具体的,具体的,所述输入纸类数据可以为纸币;所述图像数据包括像素点,以及像素点的灰度值数据。
优选的,字符识别装置获取可以获取白光灰度的图像数据,以减小数据处理的复杂度;可选的,字符识别装置也获取可以获取彩色的图像数据,以丰富输入纸类识别的特征(一些纸币有特定的颜色,彩色数据有助于直接识别币种);具体获取图像数据的类型可以根据实际需求而定,此处不作限定。
202、提取所述图像数据的边缘点;
字符识别装置提取所述图像数据的边缘点。由于采集得到图像数据的背景单一,且输入纸类的边界有明显的灰度差,可以利用这点来搜索图像数据中的边缘点。
203、对所述边缘点进行直线拟合;
字符识别装置对所述边缘点进行直线拟合。
204、获取所述直线拟合后的边缘点的倾斜角度;
字符识别装置获取所述直线拟合后的边缘点的倾斜角度。可选的,上述边缘点进行直线拟合后,还可以获得所述图像数据的边界长度(即获知所述输入纸类的大小),有助于后续进行币种和面值的识别。
205、根据所述倾斜角度调整所述图像数据;
字符识别装置根据所述倾斜角度调整所述图像数据,使得所述图像数据的上下边界平行于水平面。如,若所述输入纸类的图像数据顺时针倾斜了30度,则字符识别装置将所述图像数据逆时针往回调整30度。
206、对所述图像数据进行预处理;
字符识别装置对所述图像数据进行预处理,所述预处理包括为币种识别,面值识别及方向识别中任意一种或两种以上的组合。
在实际应用中,币种识别和面值识别有助于字符识别装置大致确认所需要识别的目标字符串在该输入纸类的哪一个区域,该区域的面积大概有多少。而在实际的输入纸类的扫描过程中,输入纸类放置的正反和方向皆有不同,因此,还需要对输入纸类进行方向识别。
具体的,币种识别和面值识别可以通过模式识别方法,或图像处理方法实现;可选的,若经过面值识别之后确定所述输入纸类为面值100元人民币,则通过对特定位置的图像识别(如,识别头像的位置),可以判别出所述100元人民币的正反;进一步的,对数额所在的为位置进行识别,若识别出“001”,则可以确认所述100元人民币被倒置。可选的,也可以不基于币种识别和面值识别的结果进行方向识别,只要基于一些图像的正反及朝向的特征进行判别即可。
207、对图像数据的目标字符串进行初步定位;
字符识别装置根据所述预处理的结果获取所述目标字符串的目标区域,获取所述目标字符串在所述目标区域内的最大范围信息,所述最大范围信息包括所述目标区域的最大高度H和最大宽度W。
具体的,所述图像数据进行预处理之后,可以根据输入纸类的币种、面值及方向信息获知所述目标字符串的目标区域及所述目标字符串在所述目标区域内的最大范围信息(字符识别装置中预置的映射关系)。
208、去除所述初步区域中的噪声数据;
可选的,在完成对图像数据的目标字符串进行初步定位之后,字符识别装置去除所述初步区域中的噪声数据。具体的,字符识别装置可以预设噪声阈值,若所述图像数据中的像素点的灰度值满足噪声阈值,则被判定为噪声,去除所述噪声的数据。
209、定位所述初步区域内像素点的灰度值之和最小的区域;
字符识别装置定位所述初步区域内像素点的灰度值之和最小的区域,获得所述目标字符串的全区域。
在实际应用中,由于纸币上的字符区域的灰度值一般会低于所在区域的其他位置的灰度值,且某一币种、某一面值的目标字符串所占大小固定,因此,字符识别装置可以定位所述初步区域内像素点的灰度值之和最小的区域,以进一步缩小初步区域的范围,排除噪声的干扰。
具体的,可以通过对所述目标字符串进行顶点定位实现。所述顶点定位为确定所述目标字符串所在的最小区域中,确定四个顶点中任意一个顶点的坐标;在获知该顶点坐标之后,根据输入纸类类型的经验值,即可所述目标字符串的宽度和高度信息。以左上角顶点定位为例,cw和ch分别为目标字符串的宽度和高度,只要定位到以(cw,ch)为特征块的灰度和最小区域,既为目标字符串所在区域坐标,计算方法如下式所示:为字符区域的起始坐标。同理,横纵坐标从不同方向累加,分别可以得到其他三个顶点,计算方法如下所示:右上顶点,
字符识别装置确定所述目标字符串中各个字符的上下边界和左右边界,得到各个单字符区域。
具体的,字符识别装置可以先获取所述目标字符串中的字符像素点阈值;再根据所述字符像素点阈值确定连续的字符像素点,将所述连续的字符像素点垂直方向上的起点坐标和终点坐标作为上下边界,将所述连续的字符像素点水平方向上的起点坐标和终点坐标作为左右边界。
可选的,确定上下边界的方法可以为:从所述全区域的中间像素点开始,往上搜索,若连续两个像素点都不满足所述字符像素点阈值,则所述两个像素点之前的像素点作为作为上边界;往下搜索,若连续两个像素点都不满足所述字符像素点阈值,则所述两个像素点之前的像素点作为作为下边界。
211、根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符;
可选的,为了进一步提高字符识别的精确度,所述得到各个单字符区域之后,字符识别装置可以根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符(对于一已知的币种和面值来说,每个字符的宽度是预先知道的),若是,则执行步骤212对所述两个字符的单字符区域进行合并;若否,则执行步骤213。
212、对所述两个字符的单字符区域进行合并;
字符识别装置对所述两个字符的单字符区域进行合并。即将第一字符的左边界作为合并后字符的左边界,第二个字符的右边界作为合并后字符的右边界。
213、根据单个字符的字符宽度判断所述单个字符是否为粘连字符;
可选的,为了进一步提高字符识别的精确度,所述得到各个单字符区域之后,字符识别装置可以根据单个字符的字符宽度判断所述单个字符是否为粘连字符,若是,则执行步骤214对所述单个字符的单字符区域进行分离;若否,则执行步骤215。
具体的,字符识别装置可以判断所述单个字符的字符宽度是否大于宽度阈值,若是,则所述单个字符为粘连字符。
214、对单个字符的单字符区域进行分离;
字符识别装置对单个字符的单字符区域进行分离。
示例性的,字符识别装置重新对所述单个字符进行左右边界的确定,若所述单个字符在水平方向上连续的字符像素点满足预置字符宽度,则确认所述满足预置字符宽度内的区域为被分离的第一个单字符区域,并从所述满足预置字符宽度点的下一点开始作为第二个被分离字符的左边界,原所述单个字符的右边界为所述第二个被分离字符的右边界。
215、判断所述单字符区域是否满足边界阈值;
可选的,在得到各个单字符区域之后,字符识别装置可以判断所述单字符区域是否满足边界阈值,若不,则执行步骤216根据所述边界阈值对所述单字符区域进行缩放;若否,则执行步骤217。
216、根据所述边界阈值对所述单字符区域进行缩放;
字符识别装置根据所述边界阈值对所述单字符区域进行缩放,将单字符区域归一化到相同的大小,以便后续识别。
217、对所述全区域内的目标字符串进行字符识别。
字符识别装置对所述全区域内的目标字符串进行字符识别。
具体的,可以根据经验值先对所述全区域内的目标字符串进行单字符分割,再使用人工神经网络进行单个字符的识别。上述仅以一些例子对本发明实施例中字符识别的方法进行了说明,可以理解的是,在实际应用中,还可以有其它的字符识别方法,具体此处不作限定。
为了便于理解,下面以一具体应用场景对上述的实施例中描述的纸类字符识别方法再进行详细描述,具体为:
在准确地获得目标字符串的全区域后,需要进一步进行单字符分割,即找到每一个字符的准确位置。为了保证算法准确性和快速性,本实例采用分别对水平和垂直方向做二值投影法确定每个单字符的左右和上下边界。由于受到噪声,倾斜,打光等原因的影响,二值化阈值过高容易出现字符粘连,阈值低又会出现字符断裂。基于以上问题,这里采用对字符区域求最大方差阈值作为二值化投影的阈值,并且尽量选择一个相对较低的阈值,这样可以去除更多的噪声点,减少字符发生粘连的概率。而过低阈值易造成字符的断裂,所以定位每个字符时,还要把断裂的字符进行合并。同时对于一些无损的情况,会出现字符粘连现在,字符定位时要将其分割成两个字符。
a)单字符左右边界定位;
(xStart,yStart)为字符区域的起始坐标,首先做垂直方向投影,垂直方向投影值为:错误!未找到引用源。,其中cw是字符实际宽度,n是将左右边界各向两侧扩的值,本实例n=3,这可以避免左右点解定位一些小的偏差带来的影响;
其中threshold是字符区域的最大方差阈值。然后从左到右扫描找到每个字符的疑似边界,具体算法实现:是从起始位置xStart开始对投影图像进行扫描,当遇到第一个非零点,记录为第一个字符的左边界lx[0],接着找下一个零点,记录为第一个字符的右边界rx[0],字符数number加1,按上述方法一直扫描到xStart+cw。
如果rx[i]-lx[i-1]<wth,(wth是钞票属性:单字符的最大宽度距离,该实例wth=10),即当相邻字符远边界距离小于单字符最大宽度时,则认为这两个界的距离为9,小于单字符的最大宽度,即rx[2]-lx[1]=9<10,证明这两个字符属于同一个字符,则将rx[1]=rx[2],number减1,即将两部分合并成一个字符;
如果rx[i]-lx[i]>wth,(wth是钞票属性:单字符的最大宽度距离,该实例wth=10),即右边界的搜索值达到了单字符最大宽度时,则该字符的右边界无需再向下搜索,停止对该字符右边界的搜索,将当前点设为该字符的右边界,在二值化处理后“0”和“6”字符发生粘连,在定位时需要将其分割成两个字符。首先定位字符“0”的左边界,lx[2]=35,如不加任何限定条件搜索下一个零值点,则将rx[2]=55,那么该字符的宽度为20,等于单字符最大宽度的2倍,即rx[2]-lx[2]=20=2wth,显然定位到的字符应该包含两个字符。由于对于某一币种,其单字符最大宽度是固定的,因此在搜索范围达到时就认为已经找到了字符的左边界,这里当搜索到i=45是,vpro[45]=5!=0,则认为已经找到了右边界,另rx[2]=45,number加1;从上一个字符的左边界开始继续搜索下一个字符,lx[3]=46,当i=55时,vpro[55]=0,则rx[3]=55,样就成功的将粘连的两个字符分隔开。
每个字符左右边界定位完毕后,按照左右投影值的大小缩放左右边界,具体方法是:
首先判断字符宽度与实际字符宽度差值。如果字符宽度小于实际字符宽度,则需要对其左右边界向两侧扩充,如果左边界左边的投影值大于右边界右边的投影值,即:vpro[lx[i]-1]>vpro[rx[i]+1],则左边界先左扩充一位,lx[i]=lx[i]-1;如果左边界左边的投影值小于右边界右边的投影值,即:vpro[lx[i]-1]<vpro[rx[i]+1],则右边界向右扩充一位,rx[i]=rx[i]+1;如果左边界左边的投影值等于右边界右边的投影值,即:vpro[lx[i]-1]=vpro[rx[i]+1],则左右边界各扩充一位,lx[i]=lx[i]-1,rx[i]=rx[i]+1,依此类推,直至字符宽度等于字符实际宽度为止。
如果字符宽度大于实际字符宽度,则需要对其左右边界向内缩进,如果左边界右边的投影值大于右边界左边的投影值,即:vpro[lx[i]+1]>vpro[rx[i]-1],则右边界先左缩进一位,rx[i]=rx[i]-1;如果左边界右边的投影值小于右边界左边的投影值,即:vpro[lx[i]+1]<vpro[rx[i]-1],则左边界向右缩进一位,lx[i]=lx[i]+1;如果左边界右边的投影值等于右边界右左边的投影值,即:vpro[lx[i]+1]=vpro[rx[i]-1],则左右边界各缩进一位,lx[i]=lx[i]+1,rx[i]=rx[i]-1,依此类推,直至字符宽度等于字符实际宽度为止。
b)单字符上下边界定位;
在上一步基础上对每个字符区域做水平投影,j∈(yStart,yStart+ch),本实例中字符上下边界定位,搜索方式不是从上往下或是从下往上搜索,而是采用从字符中部开始向两端搜索的方式,这样可以避免上下边界的噪声干扰和中间字符出现断裂的情况。具体实现方法是:首先从字符区域的中间点middle开始向上搜索连续两个投影值为零的点,即为该字符的上边界htop[i],然后从中间点开始向下搜索连续两个为零的投影点,即为该字符的下边界hdown[i],然后根据上下投影值的大小缩放上下边界,将字符定位区域调整到字符实际大小。
为解决字符上下有噪声干扰的情况,在确定完所有字符的位置后分别求所有单字符的上边界的平均值(为避免噪声干扰,去除一个最大值和一个最小值后求平均值)。然后依次求每个字符上边界与上边界平均值的绝对差值,如果绝对差值大于NP个像素,本实例中NP=3,则将其调整为均值,同理重复上步操作,对下边界进行调整。下边界以此类推。
上面仅以一些例子对本发明实施例中的应用场景进行了说明,可以理解的是,在实际应用中,还可以有更多的应用场景,具体此处不作限定。
下面对用于执行上述纸类字符识别方法的本发明纸类字符识别装置的实施例进行说明,其逻辑结构请参考图3,本发明实施例中的纸类字符识别装置一个实施例包括:
数据获取单元301,用于获取输入纸类的图像数据;
倾斜校正单元302,用于对所述图像数据进行倾斜校正;
初步定位单元303,用于对所述图像数据的目标字符串进行初步定位,获取所述目标字符串的初步区域;
全区域定位单元304,用于定位所述初步区域内像素点的灰度值之和最小的区域;获得所述目标字符串的全区域;
字符识别单元305,用于对所述全区域内的目标字符串进行字符识别。
具体的,所述倾斜校正单元302包括:
边缘提取模块3021,用于提取所述图像数据的边缘点;
直线拟合模块3022,用于对所述边缘点进行直线拟合;
倾斜角度获取模块3023,用于获取所述直线拟合后的边缘点的倾斜角度;
调整模块3024,用于根据所述倾斜角度调整所述图像数据。
本发明实施例中,各个单元的具体操作包括:
数据获取单元301获取输入纸类的图像数据;具体的,具体的,所述输入纸类数据可以为纸币;所述图像数据包括像素点,以及像素点的灰度值数据。优选的,可以获取白光灰度的图像数据,以减小数据处理的复杂度;可选的,字符识别装置也获取可以获取彩色的图像数据,以丰富输入纸类识别的特征(一些纸币有特定的颜色,彩色数据有助于直接识别币种);具体获取图像数据的类型可以根据实际需求而定,此处不作限定。
倾斜校正单元302对所述图像数据进行倾斜校正,具体的,边缘提取模块3021提取所述图像数据的边缘点。由于采集得到图像数据的背景单一,且输入纸类的边界有明显的灰度差,可以利用这点来搜索图像数据中的边缘点;直线拟合模块3022对所述边缘点进行直线拟合;倾斜角度获取模块3023获取所述直线拟合后的边缘点的倾斜角度。可选的,上述边缘点进行直线拟合后,还可以获得所述图像数据的边界长度(即获知所述输入纸类的大小),有助于后续进行币种和面值的识别;调整模块3024根据所述倾斜角度调整所述图像数据,使得所述图像数据的上下边界平行于水平面。如,若所述输入纸类的图像数据顺时针倾斜了30度,则字符识别装置将所述图像数据逆时针往回调整30度。
初步定位单元303对所述图像数据进行预处理,所述预处理包括为币种识别,面值识别及方向识别中任意一种或两种以上的组合。
在实际应用中,币种识别和面值识别有助于字符识别装置大致确认所需要识别的目标字符串在该输入纸类的哪一个区域,该区域的面积大概有多少。而在实际的输入纸类的扫描过程中,输入纸类放置的正反和方向皆有不同,因此,还需要对输入纸类进行方向识别。
具体的,币种识别和面值识别可以通过模式识别方法,或图像处理方法实现;可选的,若经过面值识别之后确定所述输入纸类为面值100元人民币,则通过对特定位置的图像识别(如,识别头像的位置),可以判别出所述100元人民币的正反;进一步的,对数额所在的为位置进行识别,若识别出“001”,则可以确认所述100元人民币被倒置。可选的,也可以不基于币种识别和面值识别的结果进行方向识别,只要基于一些图像的正反及朝向的特征进行判别即可。再根据所述预处理的结果获取所述目标字符串的目标区域,获取所述目标字符串在所述目标区域内的最大范围信息,所述最大范围信息包括所述目标区域的最大高度H和最大宽度W。具体的,所述图像数据进行预处理之后,可以根据输入纸类的币种、面值及方向信息获知所述目标字符串的目标区域及所述目标字符串在所述目标区域内的最大范围信息(字符识别装置中预置的映射关系)。
可选的,在完成对图像数据的目标字符串进行初步定位之后,字符识别装置去除所述初步区域中的噪声数据。具体的,字符识别装置可以预设噪声阈值,若所述图像数据中的像素点的灰度值满足噪声阈值,则被判定为噪声,去除所述噪声的数据。
全区域定位单元304定位所述初步区域内像素点的灰度值之和最小的区域,获得所述目标字符串的全区域。
在实际应用中,由于纸币上的字符区域的灰度值一般会低于所在区域的其他位置的灰度值,且某一币种、某一面值的目标字符串所占大小固定,因此,字符识别装置可以定位所述初步区域内像素点的灰度值之和最小的区域,以进一步缩小初步区域的范围,排除噪声的干扰。
具体的,可以通过对所述目标字符串进行顶点定位实现。所述顶点定位为确定所述目标字符串所在的最小区域中,确定四个顶点中任意一个顶点的坐标;在获知该顶点坐标之后,根据输入纸类类型的经验值,即可所述目标字符串的宽度和高度信息。以左上角顶点定位为例,cw和ch分别为目标字符串的宽度和高度,只要定位到以(cw,ch)为特征块的灰度和最小区域,既为目标字符串所在区域坐标,计算方法如下式所示:为字符区域的起始坐标。同理,横纵坐标从不同方向累加,分别可以得到其他三个顶点,计算方法如下所示:右上顶点,
具体的,可以根据经验值先对所述全区域内的目标字符串进行单字符分割,再使用人工神经网络进行单个字符的识别。上述仅以一些例子对本发明实施例中字符识别的方法进行了说明,可以理解的是,在实际应用中,还可以有其它的字符识别方法,具体此处不作限定。
下面对用于执行上述纸类字符识别方法的本发明纸类字符识别装置的实施例进行说明,其逻辑结构请参考图4,本发明实施例中纸类字符识别装置的另一个实施例包括:
目标获取单元401,用于获取字符串的目标区域;
边界定位单元402,用于确定所述目标区域中各个字符的上下边界和左右边界,得到各个单字符区域;
合并单元403,用于根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符,若是,则对所述两个字符的单字符区域进行合并;
识别单元404,用于分别识别所述单字符区域内的字符。
可选的,所述装置还包括:
粘连判定单元405,用于根据单个字符的字符宽度判断所述单个字符是否为粘连字符,若是,则对所述单个字符的单字符区域进行分离。
本发明实施例中,各个单元的具体操作包括:
目标获取单元401获取字符串的目标区域。
在获得字符串的目标区域之后,边界定位单元402确定所述目标字符串中各个字符的上下边界和左右边界,得到各个单字符区域。
具体的,字符识别装置可以先获取所述目标字符串中的字符像素点阈值;再根据所述字符像素点阈值确定连续的字符像素点,将所述连续的字符像素点垂直方向上的起点坐标和终点坐标作为上下边界,将所述连续的字符像素点水平方向上的起点坐标和终点坐标作为左右边界。
可选的,确定上下边界的方法可以为:从所述全区域的中间像素点开始,往上搜索,若连续两个像素点都不满足所述字符像素点阈值,则所述两个像素点之前的像素点作为作为上边界;往下搜索,若连续两个像素点都不满足所述字符像素点阈值,则所述两个像素点之前的像素点作为作为下边界。
为了进一步提高字符识别的精确度,所述得到各个单字符区域之后,合并单元403可以根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符(对于一已知的币种和面值来说,每个字符的宽度是预先知道的),若是,则对所述两个字符的单字符区域进行合并。即将第一字符的左边界作为合并后字符的左边界,第二个字符的右边界作为合并后字符的右边界。
可选的,为了进一步提高字符识别的精确度,得到各个单字符区域之后,粘连判定单元405可以根据单个字符的字符宽度判断所述单个字符是否为粘连字符,若是,则对所述单个字符的单字符区域进行分离;示例性的,字符识别装置重新对所述单个字符进行左右边界的确定,若所述单个字符在水平方向上连续的字符像素点满足预置字符宽度,则确认所述满足预置字符宽度内的区域为被分离的第一个单字符区域,并从所述满足预置字符宽度点的下一点开始作为第二个被分离字符的左边界,原所述单个字符的右边界为所述第二个被分离字符的右边界。
完成上述的调整操作后,识别单元404对所述全区域内的目标字符串进行字符识别。具体的,可以根据经验值先对所述全区域内的目标字符串进行单字符分割,再使用人工神经网络进行单个字符的识别。上述仅以一些例子对本发明实施例中字符识别的方法进行了说明,可以理解的是,在实际应用中,还可以有其它的字符识别方法,具体此处不作限定。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种纸类字符识别方法,其特征在于,包括:
获取输入纸类的图像数据;
对所述图像数据进行倾斜校正;
对所述图像数据的目标字符串进行初步定位,获取所述目标字符串的初步区域;所述对图像数据的目标字符串进行初步定位之前,包括:对所述图像数据进行预处理,所述预处理包括为币种识别,面值识别及方向识别中任意一种或两种以上的组合;
定位所述初步区域内像素点的灰度值之和最小的区域;获得所述目标字符串的全区域;
对所述全区域内的目标字符串进行字符识别,所述对全区域内的目标字符串进行字符识别,包括:确定所述目标字符串中各个字符的上下边界和左右边界,得到各个单字符区域;分别识别所述单字符区域内的字符;
根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符,若是,则对所述两个字符的单字符区域进行合并;或,根据单个字符的字符宽度判断所述单个字符是否为粘连字符,若是,则对所述单个字符的单字符区域进行分离。
2.根据权利要求1的方法,其特征在于,所述对图像数据进行倾斜校正,包括:
提取所述图像数据的边缘点;
对所述边缘点进行直线拟合;
获取所述直线拟合后的边缘点的倾斜角度;
根据所述倾斜角度调整所述图像数据。
3.根据权利要求1的方法,其特征在于,所述对图像数据的目标字符串进行初步定位,具体为:
根据所述预处理的结果获取所述目标字符串的目标区域;
所述初步区域为所述目标字符串在所述目标区域内的最大范围信息,所述最大范围信息包括所述目标区域的最大高度H和最大宽度W。
4.根据权利要求1的方法,其特征在于,所述根据初步区域进行所述目标字符串的顶点定位之前,包括:
去除所述初步区域中的噪声数据。
5.根据权利要求1的方法,其特征在于,所述确定所述目标字符串中各个字符的上下边界和左右边界,包括:
获取所述目标字符串中的字符像素点阈值;
根据所述字符像素点阈值确定连续的字符像素点,将所述连续的字符像素点垂直方向上的起点坐标和终点坐标作为上下边界,将所述连续的字符像素点水平方向上的起点坐标和终点坐标作为左右边界。
6.根据权利要求5的方法,其特征在于,所述根据单个字符的字符宽度判断所述单个字符是否为粘连字符,包括:
判断所述单个字符的字符宽度是否大于宽度阈值,若是,则所述单个字符为粘连字符;
所述对单个字符的单字符区域进行分离,包括:
重新对所述单个字符进行左右边界的确定,若所述单个字符在水平方向上连续的字符像素点满足预置字符宽度,则确认所述满足预置字符宽度内的区域为被分离的第一个单字符区域,并从所述第一个单字符区域的下一点开始作为被分离字符的左边界,原所述单个字符的右边界为所述被分离字符的右边界。
7.根据权利要求1的方法,其特征在于,所述得到各个单字符区域之后,包括:
判断所述单字符区域是否满足边界阈值,若否,则根据所述边界阈值对所述单字符区域进行缩放。
8.根据权利要求1的方法,其特征在于,所述确定目标字符串中各个字符的上下边界,包括:
从所述全区域的中间像素点开始,往上搜索,若连续两个像素点都不满足所述字符像素点阈值,则所述两个像素点之前的像素点作为作为上边界;往下搜索,若连续两个像素点都不满足所述字符像素点阈值,则所述两个像素点之前的像素点作为作为下边界。
9.一种纸类字符识别装置,其特征在于,包括:
数据获取单元,用于获取输入纸类的图像数据;
倾斜校正单元,用于对所述图像数据进行倾斜校正;
初步定位单元,用于对所述图像数据的目标字符串进行初步定位,获取所述目标字符串的初步区域;所述对图像数据的目标字符串进行初步定位之前,包括:对所述图像数据进行预处理,所述预处理包括为币种识别,面值识别及方向识别中任意一种或两种以上的组合;
全区域定位单元,用于定位所述初步区域内像素点的灰度值之和最小的区域;获得所述目标字符串的全区域;
字符识别单元,用于对所述全区域内的目标字符串进行字符识别,所述字符识别单元具体用于确定所述目标字符串中各个字符的上下边界和左右边界,得到各个单字符区域;分别识别所述单字符区域内的字符;根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符,若是,则对所述两个字符的单字符区域进行合并;或,根据单个字符的字符宽度判断所述单个字符是否为粘连字符,若是,则对所述单个字符的单字符区域进行分离。
10.根据权利要求9的装置,其特征在于,所述倾斜校正单元包括:
边缘提取模块,用于提取所述图像数据的边缘点;
直线拟合模块,用于对所述边缘点进行直线拟合;
倾斜角度获取模块,用于获取所述直线拟合后的边缘点的倾斜角度;
调整模块,用于根据所述倾斜角度调整所述图像数据。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210230901.0A CN102779275B (zh) | 2012-07-04 | 2012-07-04 | 一种纸类字符识别方法及相关装置 |
PCT/CN2013/074130 WO2014005456A1 (zh) | 2012-07-04 | 2013-04-12 | 一种纸类字符识别方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210230901.0A CN102779275B (zh) | 2012-07-04 | 2012-07-04 | 一种纸类字符识别方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102779275A CN102779275A (zh) | 2012-11-14 |
CN102779275B true CN102779275B (zh) | 2015-06-17 |
Family
ID=47124185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210230901.0A Active CN102779275B (zh) | 2012-07-04 | 2012-07-04 | 一种纸类字符识别方法及相关装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN102779275B (zh) |
WO (1) | WO2014005456A1 (zh) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779275B (zh) * | 2012-07-04 | 2015-06-17 | 广州广电运通金融电子股份有限公司 | 一种纸类字符识别方法及相关装置 |
CN103136845B (zh) * | 2013-01-23 | 2015-09-16 | 浙江大学 | 一种基于冠字号图像特征的人民币鉴伪方法 |
CN103544491A (zh) | 2013-11-08 | 2014-01-29 | 广州广电运通金融电子股份有限公司 | 一种面向复杂背景的光学字符识别方法及装置 |
WO2015172304A1 (zh) * | 2014-05-12 | 2015-11-19 | 深圳博众智能科技有限公司 | 一种自动选择纸币不同特征点判断的方法 |
CN104200566B (zh) * | 2014-09-11 | 2018-04-20 | 广州广电运通金融电子股份有限公司 | 一种基于清分机积灰条件下的钞票识别方法及清分机 |
CN104751559B (zh) * | 2015-03-25 | 2017-07-28 | 深圳怡化电脑股份有限公司 | 验钞装置及验钞方法 |
CN106709489B (zh) * | 2015-07-13 | 2020-03-03 | 腾讯科技(深圳)有限公司 | 一种字符识别的处理方法和装置 |
CN105261110B (zh) * | 2015-10-26 | 2018-04-06 | 江苏国光信息产业股份有限公司 | 一种高效dsp纸币冠字号识别方法 |
CN105243730B (zh) * | 2015-10-28 | 2018-02-09 | 深圳怡化电脑股份有限公司 | 纸币识别方法及系统 |
CN105761351A (zh) * | 2016-01-08 | 2016-07-13 | 东方通信股份有限公司 | 基于结构特征的字符识别方法 |
CN106096601B (zh) * | 2016-06-06 | 2019-06-18 | 深圳辰通智能股份有限公司 | 一种自动检测票据中字符类型的方法和系统 |
CN106204616B (zh) * | 2016-07-21 | 2020-07-24 | 深圳怡化电脑股份有限公司 | 一种伊朗纸币币值的识别方法及装置 |
CN106251341B (zh) * | 2016-07-22 | 2019-12-24 | 凌云光技术集团有限责任公司 | 一种印刷品质量检测方法 |
CN111274841B (zh) * | 2016-10-24 | 2023-05-12 | 创新先进技术有限公司 | 一种条形码的识别方法和装置 |
CN106504407B (zh) * | 2016-11-01 | 2019-06-07 | 深圳怡化电脑股份有限公司 | 一种处理纸币图像的方法及装置 |
CN106874909B (zh) * | 2017-01-18 | 2019-10-11 | 深圳怡化电脑股份有限公司 | 一种图像字符的识别方法及其装置 |
CN107742357A (zh) * | 2017-10-10 | 2018-02-27 | 深圳怡化电脑股份有限公司 | 一种纸币冠字号的识别方法及装置 |
CN107798327A (zh) * | 2017-10-31 | 2018-03-13 | 北京小米移动软件有限公司 | 字符识别方法及装置 |
CN108537237A (zh) * | 2018-04-04 | 2018-09-14 | 深圳怡化电脑股份有限公司 | 票据的特征区域提取方法、装置、设备和存储介质 |
CN109087368B (zh) * | 2018-06-14 | 2023-04-07 | 创新先进技术有限公司 | 一种字符串图形化方法和装置 |
CN111079735B (zh) * | 2018-10-22 | 2023-12-22 | 莱芜钢铁集团电子有限公司 | 一种铸坯端面字符识别方法及装置 |
KR102169626B1 (ko) | 2018-11-21 | 2020-10-23 | (주)이즈커뮤니케이션즈 | 입력 장치의 판별 기능을 갖춘 컴퓨터 입력 시스템 |
KR102172564B1 (ko) | 2018-11-21 | 2020-11-02 | (주)이즈커뮤니케이션즈 | 영상 처리 모듈의 소형화가 가능한 컴퓨터에의 입력 정보의 추출 방법 및 이 추출 방법이 구현되는 컴퓨터 입력 시스템 |
KR20200134660A (ko) | 2019-05-23 | 2020-12-02 | (주) 이즈커뮤니케이션즈 | 가시광 발광 소자를 입력 장치로서 이용하는 정보 입력 시스템 |
CN110378337B (zh) * | 2019-07-05 | 2023-03-31 | 上海交通大学 | 金属切削刀具图纸标识信息视觉输入方法及系统 |
CN110516672A (zh) * | 2019-08-29 | 2019-11-29 | 腾讯科技(深圳)有限公司 | 卡证信息识别方法、装置及终端 |
CN111783781B (zh) * | 2020-05-22 | 2024-04-05 | 深圳赛安特技术服务有限公司 | 基于产品协议字符识别的恶意条款识别方法、装置、设备 |
CN112990150A (zh) * | 2021-05-10 | 2021-06-18 | 恒银金融科技股份有限公司 | 一种基于投影双向累和测定冠字号上下边界的方法 |
CN115050015B (zh) * | 2022-08-15 | 2023-09-12 | 恒银金融科技股份有限公司 | 金融票据账号字符区的精确分割方法 |
CN117710985B (zh) * | 2023-12-18 | 2024-08-06 | 珠海凌烟阁芯片科技有限公司 | 光学字符识别方法、装置及智能终端 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408937A (zh) * | 2008-11-07 | 2009-04-15 | 东莞市微模式软件有限公司 | 一种字符行定位的方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101021903B (zh) * | 2006-10-10 | 2010-05-12 | 北京新岸线网络技术有限公司 | 视频字幕内容分析系统 |
CN102509383B (zh) * | 2011-11-28 | 2013-08-21 | 哈尔滨工业大学深圳研究生院 | 一种基于特征检测及模板匹配的混合号码识别方法 |
CN102779275B (zh) * | 2012-07-04 | 2015-06-17 | 广州广电运通金融电子股份有限公司 | 一种纸类字符识别方法及相关装置 |
-
2012
- 2012-07-04 CN CN201210230901.0A patent/CN102779275B/zh active Active
-
2013
- 2013-04-12 WO PCT/CN2013/074130 patent/WO2014005456A1/zh active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408937A (zh) * | 2008-11-07 | 2009-04-15 | 东莞市微模式软件有限公司 | 一种字符行定位的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2014005456A1 (zh) | 2014-01-09 |
CN102779275A (zh) | 2012-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102779275B (zh) | 一种纸类字符识别方法及相关装置 | |
Greenhalgh et al. | Recognizing text-based traffic signs | |
CN106156761A (zh) | 面向移动终端拍摄的图像表格检测与识别方法 | |
JP5500480B2 (ja) | 帳票認識装置及び帳票認識方法 | |
CN102354363B (zh) | 高反光柱面金属上的二维条码图像识别方法 | |
US7697734B2 (en) | Method and apparatus of detecting eye using symmetry and moment characteristics of object | |
JP5229050B2 (ja) | 画像からの文書領域抽出装置、方法、及びプログラム | |
WO2016127545A1 (zh) | 一种字符切割识别方法 | |
CN104217203B (zh) | 复杂背景卡面信息识别方法及系统 | |
CN104751187A (zh) | 抄表图像自动识别方法 | |
Chen et al. | Page segmentation for historical handwritten document images using color and texture features | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
CN109389121A (zh) | 一种基于深度学习的铭牌识别方法及系统 | |
US11836969B2 (en) | Preprocessing images for OCR using character pixel height estimation and cycle generative adversarial networks for better character recognition | |
JP4901676B2 (ja) | ナンバープレート情報処理装置及びナンバープレート情報処理方法 | |
CN106251341A (zh) | 一种印刷品质量检测方法 | |
CN105868759A (zh) | 分割图像字符的方法及装置 | |
JP2014153820A (ja) | 文字切り出し装置及び文字切り出し方法 | |
JPH08305796A (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
CN102750530B (zh) | 一种字符识别方法及装置 | |
CN103186790A (zh) | 对象检测系统和方法 | |
Xie et al. | Crater detection using the morphological characteristics of Chang'E-1 digital elevation models | |
Bogoslavskyi et al. | Analyzing the quality of matched 3D point clouds of objects | |
KR20140093407A (ko) | 인식기, 차량모델인식장치 및 방법 | |
CN104766043A (zh) | 一种选票图像快速识别的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |