CN102779275B

CN102779275B - 一种纸类字符识别方法及相关装置

Info

Publication number: CN102779275B
Application number: CN201210230901.0A
Authority: CN
Inventors: 向拓闻; 关玉萍; 徐朝阳
Original assignee: Guangdian Yuntong Financial Electronic Co Ltd
Current assignee: GRG Banking Equipment Co Ltd; Guangdian Yuntong Financial Electronic Co Ltd
Priority date: 2012-07-04
Filing date: 2012-07-04
Publication date: 2015-06-17
Anticipated expiration: 2032-07-04
Also published as: WO2014005456A1; CN102779275A

Abstract

本发明实施例公开了一种纸类字符识别方法及相关装置，用于准确的进行输入纸类中字符串的识别。方法包括：获取输入纸类的图像数据；对所述图像数据进行倾斜校正；对所述图像数据的目标字符串进行初步定位，获取所述目标字符串的初步区域；定位所述初步区域内像素点的灰度值之和最小的区域；获得所述目标字符串的全区域；对所述全区域内的目标字符串进行字符识别。

Description

一种纸类字符识别方法及相关装置

技术领域

本发明涉及图像处理领域，尤其涉及一种纸类字符识别方法及相关装置。

背景技术

随着经济和社会的发展，纸币越来越多，流通也越来越频繁。纸币是一种重要的票据，真钞的号码具有唯一性，是国家纸币印刷数量的标志，因此可以作为纸币的身份证明。目前市场上存在的具有纸币号码识别功能的机具，其识别的准确率都不能达到金融机构的要求，金融机构在处理业务时，最终需采用手工抄写纸币号码的方法来辅助识别假币。因此需在纸币处理机具上开发一种高效率、高准确率的纸币号码自动识别记录系统，一旦出现异常情况（如ATM机收取假币或从ATM中取出假币等），就可以通过自动记录的纸币号码进行跟踪定位。

纸币号码识别系统主要分两部分，字符定位和字符识别。而字符定位的准确度直接影响字符的识别结果。由于钞票本身新旧程度及图像采集设备打光值的影响，字符定位主要存在以下问题：字符在整幅图像中的相对位置有一定的浮动，一方面由于纸币印刷时字符的相对位置会有一定的浮动；另一方面图像采集时，倾斜角度的大小也后造成字符相对位置有一定的浮动；由于上述原因，使得字符定位容易出现偏差，从而导致识别设备无法精确的识别出纸币号码。

发明内容

本发明实施例提供了一种纸类字符识别方法及相关装置，用于准确的进行输入纸类中字符串的识别。

本发明提供的纸类字符识别方法，包括：获取输入纸类的图像数据；对所述图像数据进行倾斜校正；对所述图像数据的目标字符串进行初步定位，获取所述目标字符串的初步区域；定位所述初步区域内像素点的灰度值之和最小的区域；获得所述目标字符串的全区域；对所述全区域内的目标字符串进行字符识别。

可选的，所述对图像数据进行倾斜校正，包括：提取所述图像数据的边缘点；对所述边缘点进行直线拟合；获取所述直线拟合后的边缘点的倾斜角度；根据所述倾斜角度调整所述图像数据。

可选的，所述对图像数据的目标字符串进行初步定位之前，包括：对所述图像数据进行预处理，所述预处理包括为币种识别，面值识别及方向识别中任意一种或两种以上的组合。

可选的，所述对图像数据的目标字符串进行初步定位，具体为：根据所述预处理的结果获取所述目标字符串的目标区域；所述初步区域为所述目标字符串在所述目标区域内的最大范围信息，所述最大范围信息包括所述目标区域的最大高度H和最大宽度W。

可选的，所述根据初步区域进行所述目标字符串的顶点定位之前，包括：去除所述初步区域中的噪声数据。

可选的，所述对全区域内的目标字符串进行字符识别，包括：

确定所述目标字符串中各个字符的上下边界和左右边界，得到各个单字符区域；分别识别所述单字符区域内的字符。

可选的，所述确定所述目标字符串中各个字符的上下边界和左右边界，包括：

获取所述目标字符串中的字符像素点阈值；根据所述字符像素点阈值确定连续的字符像素点，将所述连续的字符像素点垂直方向上的起点坐标和终点坐标作为上下边界，将所述连续的字符像素点水平方向上的起点坐标和终点坐标作为左右边界。

可选的，所述得到各个单字符区域之后，包括：

根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符，若是，则对所述两个字符的单字符区域进行合并。

可选的，所述得到各个单字符区域之后，包括：

根据单个字符的字符宽度判断所述单个字符是否为粘连字符，若是，则对所述单个字符的单字符区域进行分离。

可选的，所述根据单个字符的字符宽度判断所述单个字符是否为粘连字符，包括：判断所述单个字符的字符宽度是否大于宽度阈值，若是，则所述单个字符为粘连字符；

所述对单个字符的单字符区域进行分离，包括：

重新对所述单个字符进行左右边界的确定，若所述单个字符在水平方向上连续的字符像素点满足预置字符宽度，则确认所述满足预置字符宽度内的区域为被分离的第一个单字符区域，并从所述第一个单字符区域的下一点开始作为被分离字符的左边界，原所述单个字符的右边界为所述被分离字符的右边界。

可选的，所述得到各个单字符区域之后，包括：

判断所述单字符区域是否满足边界阈值，若否，则根据所述边界阈值对所述单字符区域进行缩放。

可选的，所述确定目标字符串中各个字符的上下边界，包括：

从所述全区域的中间像素点开始，往上搜索，若连续两个像素点都不满足所述字符像素点阈值，则所述两个像素点之前的像素点作为作为上边界；往下搜索，若连续两个像素点都不满足所述字符像素点阈值，则所述两个像素点之前的像素点作为作为下边界。

本发明提供的纸类字符识别方法，包括：获取字符串的目标区域；确定所述目标区域中各个字符的上下边界和左右边界，得到各个单字符区域；根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符，若是，则对所述两个字符的单字符区域进行合并；分别识别所述单字符区域内的字符。

可选的，所述确定所述字符串中各个字符的上下边界和左右边界，包括：获取所述字符串中的字符像素点阈值；根据所述字符像素点阈值确定连续的字符像素点，将所述连续的字符像素点垂直方向上的起点坐标和终点坐标作为上下边界，将所述连续的字符像素点水平方向上的起点坐标和终点坐标作为左右边界。

可选的，所述得到各个单字符区域之后，包括：

所述对单个字符的单字符区域进行分离，包括：重新对所述单个字符进行左右边界的确定，若所述单个字符在水平方向上连续的字符像素点满足预置字符宽度，则确认所述满足预置字符宽度内的区域为被分离的第一个单字符区域，并从所述第一个单字符区域的下一点开始作为被分离字符的左边界，原所述单个字符的右边界为所述被分离字符的右边界。

可选的，所述得到各个单字符区域之后，包括：

判断所述单字符区域是否满足边界阈值，若不，则根据所述边界阈值对所述单字符区域进行缩放。

可选的，所述确定字符串中各个字符的上下边界，包括：

从所述全区域的中间像素点开始，往上搜索，若连续两个像素点都不满足所述字符像素点阈值，则所述两个像素点之前的像素点作为作为上边界；从所述全区域的中间像素点开始，往下搜索，若连续两个像素点都不满足所述字符像素点阈值，则所述两个像素点之前的像素点作为作为下边界。

本发明提供的纸类字符识别装置，包括：数据获取单元，用于获取输入纸类的图像数据；倾斜校正单元，用于对所述图像数据进行倾斜校正；初步定位单元，用于对所述图像数据的目标字符串进行初步定位，获取所述目标字符串的初步区域；全区域定位单元，用于定位所述初步区域内像素点的灰度值之和最小的区域；获得所述目标字符串的全区域；字符识别单元，用于对所述全区域内的目标字符串进行字符识别。

可选的，所述倾斜校正单元包括：边缘提取模块，用于提取所述图像数据的边缘点；直线拟合模块，用于对所述边缘点进行直线拟合；倾斜角度获取模块，用于获取所述直线拟合后的边缘点的倾斜角度；调整模块，用于根据所述倾斜角度调整所述图像数据。

本发明提供的纸类字符识别装置，包括：目标获取单元，用于获取字符串的目标区域；边界定位单元，用于确定所述目标区域中各个字符的上下边界和左右边界，得到各个单字符区域；合并单元，用于根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符，若是，则对所述两个字符的单字符区域进行合并；识别单元，用于分别识别所述单字符区域内的字符。

可选的，所述装置还包括：

粘连判定单元，用于根据单个字符的字符宽度判断所述单个字符是否为粘连字符，若是，则对所述单个字符的单字符区域进行分离。

从以上技术方案可以看出，本发明实施例具有以下优点：

本发明在对输入纸类的图像数据进行字符定位时，对先对图像数据进行倾斜校正，使得字符的分割和定位更加准确；并且，根据目标字符串的全区域相对背景区域灰度值较小这个特点，可以对初步定位后的字符串区进行顶点定位，更加精确地确定目标字符串所在的位置，进一步的提高了字符串识别的精确度。

附图说明

图1是本发明实施例纸类字符识别方法的一个流程示意图；

图2是本发明实施例纸类字符识别方法的另一个流程示意图；

图3是本发明实施例纸类字符识别装置的一个逻辑结构示意图；

图4是本发明实施例纸类字符识别装置的另一个逻辑结构示意图。

具体实施方式

请参阅图1，本发明实施例中输入纸类识别方法的一个实施例包括：

101、获取输入纸类的图像数据；

字符识别装置获取输入纸类的图像数据；具体的，具体的，所述输入纸类数据可以为纸币；所述图像数据包括像素点，以及像素点的灰度值数据。

优选的，字符识别装置可以获取白光灰度的图像数据，以减小数据处理的复杂度；可选的，字符识别装置也获取可以获取彩色的图像数据，以丰富输入纸类识别的特征（一些纸币有特定的颜色，彩色数据有助于直接识别币种）；具体获取图像数据的类型可以根据实际需求而定，此处不作限定。

102、对所述图像数据进行倾斜校正；

字符识别装置对所述图像数据进行倾斜校正。由于通过图像采集设备获取到的采集图像不可避免的会发生倾斜，因此，在进行字符定位之前，需要先进行倾斜校正。

103、对所述图像数据的目标字符串进行初步定位；

字符识别装置对所述图像数据的目标字符串进行初步定位，获取所述目标字符串的初步区域。

具体的，目标字符串的类型可以根据实际的识别需求而定，如，需要对纸币的唯一性进行识别，则所述目标字符串可以为纸币的冠字号码。

具体的，所述初步区域可以包括该区域的宽带和高度信息。

可选的，初步定位可以通过输入纸类数据的经验值判定来完成，如，可以先对该输入纸类的类型进行识别，确定类型后，字符识别装置则可以大致知道所需要识别的目标字符串在该输入纸类的哪一个区域，该区域的面积大概有多少。具体的，若所述输入纸类为非对称图形（即左右或正反的图案或字符不一致），则在进行初步定位之前，还需要确定该输入纸类的方向（正反及图案的朝向）。

104、定位所述初步区域内像素点的灰度值之和最小的区域；

字符识别装置定位所述初步区域内像素点的灰度值之和最小的区域，获得所述目标字符串的全区域。

在实际应用中，由于纸币上的字符区域的灰度值一般会低于所在区域的其他位置的灰度值，且某一币种、某一面值的目标字符串所占大小固定，因此，字符识别装置可以定位所述初步区域内像素点的灰度值之和最小的区域，以进一步缩小初步区域的范围，排除噪声的干扰。

在步骤103中完成了对目标字符串的初步定位，为了排除噪声的干扰，提高字符识别的精确度，需要对目标字符串进行二次定位。

105、对所述全区域内的目标字符串进行字符识别。

字符识别装置对所述全区域内的目标字符串进行字符识别。

具体的，可以根据经验值先对所述全区域内的目标字符串进行单字符分割，再使用人工神经网络进行单个字符的识别。上述仅以一些例子对本发明实施例中字符识别的方法进行了说明，可以理解的是，在实际应用中，还可以有其它的字符识别方法，具体此处不作限定。

本发明在对输入纸类的图像数据进行字符定位时，对先对图像数据进行倾斜校正，使得字符的分割和定位更加准确；并且，根据目标字符串的全区域相对背景区域灰度值较小这个特点，可以对初步定位后的字符串区进行顶点定位，更加精确地确定目标字符串所在位置，进一步的提高了字符串识别的精确度。

下面对本发明输入纸类识别方法进行详细描述，请参阅图2，本发明实施例中输入纸类识别方法的另一个实施例包括：

201、获取输入纸类的图像数据；

优选的，字符识别装置获取可以获取白光灰度的图像数据，以减小数据处理的复杂度；可选的，字符识别装置也获取可以获取彩色的图像数据，以丰富输入纸类识别的特征（一些纸币有特定的颜色，彩色数据有助于直接识别币种）；具体获取图像数据的类型可以根据实际需求而定，此处不作限定。

202、提取所述图像数据的边缘点；

字符识别装置提取所述图像数据的边缘点。由于采集得到图像数据的背景单一，且输入纸类的边界有明显的灰度差，可以利用这点来搜索图像数据中的边缘点。

203、对所述边缘点进行直线拟合；

字符识别装置对所述边缘点进行直线拟合。

204、获取所述直线拟合后的边缘点的倾斜角度；

字符识别装置获取所述直线拟合后的边缘点的倾斜角度。可选的，上述边缘点进行直线拟合后，还可以获得所述图像数据的边界长度（即获知所述输入纸类的大小），有助于后续进行币种和面值的识别。

205、根据所述倾斜角度调整所述图像数据；

字符识别装置根据所述倾斜角度调整所述图像数据，使得所述图像数据的上下边界平行于水平面。如，若所述输入纸类的图像数据顺时针倾斜了30度，则字符识别装置将所述图像数据逆时针往回调整30度。

206、对所述图像数据进行预处理；

字符识别装置对所述图像数据进行预处理，所述预处理包括为币种识别，面值识别及方向识别中任意一种或两种以上的组合。

在实际应用中，币种识别和面值识别有助于字符识别装置大致确认所需要识别的目标字符串在该输入纸类的哪一个区域，该区域的面积大概有多少。而在实际的输入纸类的扫描过程中，输入纸类放置的正反和方向皆有不同，因此，还需要对输入纸类进行方向识别。

具体的，币种识别和面值识别可以通过模式识别方法，或图像处理方法实现；可选的，若经过面值识别之后确定所述输入纸类为面值100元人民币，则通过对特定位置的图像识别（如，识别头像的位置），可以判别出所述100元人民币的正反；进一步的，对数额所在的为位置进行识别，若识别出“001”，则可以确认所述100元人民币被倒置。可选的，也可以不基于币种识别和面值识别的结果进行方向识别，只要基于一些图像的正反及朝向的特征进行判别即可。

207、对图像数据的目标字符串进行初步定位；

字符识别装置根据所述预处理的结果获取所述目标字符串的目标区域，获取所述目标字符串在所述目标区域内的最大范围信息，所述最大范围信息包括所述目标区域的最大高度H和最大宽度W。

具体的，所述图像数据进行预处理之后，可以根据输入纸类的币种、面值及方向信息获知所述目标字符串的目标区域及所述目标字符串在所述目标区域内的最大范围信息（字符识别装置中预置的映射关系）。

208、去除所述初步区域中的噪声数据；

可选的，在完成对图像数据的目标字符串进行初步定位之后，字符识别装置去除所述初步区域中的噪声数据。具体的，字符识别装置可以预设噪声阈值，若所述图像数据中的像素点的灰度值满足噪声阈值，则被判定为噪声，去除所述噪声的数据。

209、定位所述初步区域内像素点的灰度值之和最小的区域；

具体的，可以通过对所述目标字符串进行顶点定位实现。所述顶点定位为确定所述目标字符串所在的最小区域中，确定四个顶点中任意一个顶点的坐标；在获知该顶点坐标之后，根据输入纸类类型的经验值，即可所述目标字符串的宽度和高度信息。以左上角顶点定位为例，cw和ch分别为目标字符串的宽度和高度，只要定位到以（cw，ch）为特征块的灰度和最小区域，既为目标字符串所在区域坐标，计算方法如下式所示：为字符区域的起始坐标。同理，横纵坐标从不同方向累加，分别可以得到其他三个顶点，计算方法如下所示：右上顶点，

字符识别装置确定所述目标字符串中各个字符的上下边界和左右边界，得到各个单字符区域。

具体的，字符识别装置可以先获取所述目标字符串中的字符像素点阈值；再根据所述字符像素点阈值确定连续的字符像素点，将所述连续的字符像素点垂直方向上的起点坐标和终点坐标作为上下边界，将所述连续的字符像素点水平方向上的起点坐标和终点坐标作为左右边界。

可选的，确定上下边界的方法可以为：从所述全区域的中间像素点开始，往上搜索，若连续两个像素点都不满足所述字符像素点阈值，则所述两个像素点之前的像素点作为作为上边界；往下搜索，若连续两个像素点都不满足所述字符像素点阈值，则所述两个像素点之前的像素点作为作为下边界。

211、根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符；

可选的，为了进一步提高字符识别的精确度，所述得到各个单字符区域之后，字符识别装置可以根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符（对于一已知的币种和面值来说，每个字符的宽度是预先知道的），若是，则执行步骤212对所述两个字符的单字符区域进行合并；若否，则执行步骤213。

212、对所述两个字符的单字符区域进行合并；

字符识别装置对所述两个字符的单字符区域进行合并。即将第一字符的左边界作为合并后字符的左边界，第二个字符的右边界作为合并后字符的右边界。

213、根据单个字符的字符宽度判断所述单个字符是否为粘连字符；

可选的，为了进一步提高字符识别的精确度，所述得到各个单字符区域之后，字符识别装置可以根据单个字符的字符宽度判断所述单个字符是否为粘连字符，若是，则执行步骤214对所述单个字符的单字符区域进行分离；若否，则执行步骤215。

具体的，字符识别装置可以判断所述单个字符的字符宽度是否大于宽度阈值，若是，则所述单个字符为粘连字符。

214、对单个字符的单字符区域进行分离；

字符识别装置对单个字符的单字符区域进行分离。

示例性的，字符识别装置重新对所述单个字符进行左右边界的确定，若所述单个字符在水平方向上连续的字符像素点满足预置字符宽度，则确认所述满足预置字符宽度内的区域为被分离的第一个单字符区域，并从所述满足预置字符宽度点的下一点开始作为第二个被分离字符的左边界，原所述单个字符的右边界为所述第二个被分离字符的右边界。

215、判断所述单字符区域是否满足边界阈值；

可选的，在得到各个单字符区域之后，字符识别装置可以判断所述单字符区域是否满足边界阈值，若不，则执行步骤216根据所述边界阈值对所述单字符区域进行缩放；若否，则执行步骤217。

216、根据所述边界阈值对所述单字符区域进行缩放；

字符识别装置根据所述边界阈值对所述单字符区域进行缩放，将单字符区域归一化到相同的大小，以便后续识别。

217、对所述全区域内的目标字符串进行字符识别。

字符识别装置对所述全区域内的目标字符串进行字符识别。

为了便于理解，下面以一具体应用场景对上述的实施例中描述的纸类字符识别方法再进行详细描述，具体为：

在准确地获得目标字符串的全区域后，需要进一步进行单字符分割，即找到每一个字符的准确位置。为了保证算法准确性和快速性，本实例采用分别对水平和垂直方向做二值投影法确定每个单字符的左右和上下边界。由于受到噪声，倾斜，打光等原因的影响，二值化阈值过高容易出现字符粘连，阈值低又会出现字符断裂。基于以上问题，这里采用对字符区域求最大方差阈值作为二值化投影的阈值，并且尽量选择一个相对较低的阈值，这样可以去除更多的噪声点，减少字符发生粘连的概率。而过低阈值易造成字符的断裂，所以定位每个字符时，还要把断裂的字符进行合并。同时对于一些无损的情况，会出现字符粘连现在，字符定位时要将其分割成两个字符。

a)单字符左右边界定位；

(xStart,yStart)为字符区域的起始坐标，首先做垂直方向投影，垂直方向投影值为：错误！未找到引用源。，其中cw是字符实际宽度，n是将左右边界各向两侧扩的值，本实例n=3，这可以避免左右点解定位一些小的偏差带来的影响；

M (i, j) = \{\begin{matrix} 0, if (I (i, j) < threshold) \\ 1, if (I (i, j) > = threshlod) \end{matrix};

其中threshold是字符区域的最大方差阈值。然后从左到右扫描找到每个字符的疑似边界，具体算法实现：是从起始位置xStart开始对投影图像进行扫描，当遇到第一个非零点，记录为第一个字符的左边界lx[0]，接着找下一个零点，记录为第一个字符的右边界rx[0]，字符数number加1，按上述方法一直扫描到xStart+cw。

如果rx[i]-lx[i-1]<wth，（wth是钞票属性：单字符的最大宽度距离，该实例wth＝10），即当相邻字符远边界距离小于单字符最大宽度时，则认为这两个界的距离为9，小于单字符的最大宽度，即rx[2]-lx[1]＝9<10，证明这两个字符属于同一个字符，则将rx[1]＝rx[2]，number减1，即将两部分合并成一个字符；

如果rx[i]-lx[i]>wth，（wth是钞票属性：单字符的最大宽度距离，该实例wth＝10），即右边界的搜索值达到了单字符最大宽度时，则该字符的右边界无需再向下搜索，停止对该字符右边界的搜索，将当前点设为该字符的右边界，在二值化处理后“0”和“6”字符发生粘连，在定位时需要将其分割成两个字符。首先定位字符“0”的左边界，lx[2]＝35，如不加任何限定条件搜索下一个零值点，则将rx[2]＝55，那么该字符的宽度为20，等于单字符最大宽度的2倍，即rx[2]-lx[2]＝20＝2wth，显然定位到的字符应该包含两个字符。由于对于某一币种，其单字符最大宽度是固定的，因此在搜索范围达到时就认为已经找到了字符的左边界，这里当搜索到i＝45是，vpro[45]＝5!＝0，则认为已经找到了右边界，另rx[2]＝45，number加1；从上一个字符的左边界开始继续搜索下一个字符，lx[3]=46，当i＝55时，vpro[55]=0，则rx[3]=55，样就成功的将粘连的两个字符分隔开。

每个字符左右边界定位完毕后，按照左右投影值的大小缩放左右边界，具体方法是：

首先判断字符宽度与实际字符宽度差值。如果字符宽度小于实际字符宽度，则需要对其左右边界向两侧扩充，如果左边界左边的投影值大于右边界右边的投影值，即：vpro[lx[i]-1]>vpro[rx[i]+1]，则左边界先左扩充一位，lx[i]=lx[i]-1；如果左边界左边的投影值小于右边界右边的投影值，即：vpro[lx[i]-1]<vpro[rx[i]+1]，则右边界向右扩充一位，rx[i]=rx[i]+1；如果左边界左边的投影值等于右边界右边的投影值，即：vpro[lx[i]-1]=vpro[rx[i]+1]，则左右边界各扩充一位，lx[i]=lx[i]-1，rx[i]=rx[i]+1，依此类推，直至字符宽度等于字符实际宽度为止。

如果字符宽度大于实际字符宽度，则需要对其左右边界向内缩进，如果左边界右边的投影值大于右边界左边的投影值，即：vpro[lx[i]+1]>vpro[rx[i]-1]，则右边界先左缩进一位，rx[i]=rx[i]-1；如果左边界右边的投影值小于右边界左边的投影值，即：vpro[lx[i]+1]<vpro[rx[i]-1]，则左边界向右缩进一位，lx[i]＝lx[i]+1；如果左边界右边的投影值等于右边界右左边的投影值，即：vpro[lx[i]+1]=vpro[rx[i]-1]，则左右边界各缩进一位，lx[i]=lx[i]+1，rx[i]=rx[i]-1，依此类推，直至字符宽度等于字符实际宽度为止。

b）单字符上下边界定位；

在上一步基础上对每个字符区域做水平投影，j∈(yStart,yStart+ch)，本实例中字符上下边界定位，搜索方式不是从上往下或是从下往上搜索，而是采用从字符中部开始向两端搜索的方式，这样可以避免上下边界的噪声干扰和中间字符出现断裂的情况。具体实现方法是：首先从字符区域的中间点middle开始向上搜索连续两个投影值为零的点，即为该字符的上边界htop[i]，然后从中间点开始向下搜索连续两个为零的投影点，即为该字符的下边界hdown[i]，然后根据上下投影值的大小缩放上下边界，将字符定位区域调整到字符实际大小。

为解决字符上下有噪声干扰的情况，在确定完所有字符的位置后分别求所有单字符的上边界的平均值（为避免噪声干扰，去除一个最大值和一个最小值后求平均值）。然后依次求每个字符上边界与上边界平均值的绝对差值，如果绝对差值大于NP个像素，本实例中NP=3，则将其调整为均值，同理重复上步操作，对下边界进行调整。下边界以此类推。

上面仅以一些例子对本发明实施例中的应用场景进行了说明，可以理解的是，在实际应用中，还可以有更多的应用场景，具体此处不作限定。

下面对用于执行上述纸类字符识别方法的本发明纸类字符识别装置的实施例进行说明，其逻辑结构请参考图3，本发明实施例中的纸类字符识别装置一个实施例包括：

数据获取单元301，用于获取输入纸类的图像数据；

倾斜校正单元302，用于对所述图像数据进行倾斜校正；

初步定位单元303，用于对所述图像数据的目标字符串进行初步定位，获取所述目标字符串的初步区域；

全区域定位单元304，用于定位所述初步区域内像素点的灰度值之和最小的区域；获得所述目标字符串的全区域；

字符识别单元305，用于对所述全区域内的目标字符串进行字符识别。

具体的，所述倾斜校正单元302包括：

边缘提取模块3021，用于提取所述图像数据的边缘点；

直线拟合模块3022，用于对所述边缘点进行直线拟合；

倾斜角度获取模块3023，用于获取所述直线拟合后的边缘点的倾斜角度；

调整模块3024，用于根据所述倾斜角度调整所述图像数据。

本发明实施例中，各个单元的具体操作包括：

数据获取单元301获取输入纸类的图像数据；具体的，具体的，所述输入纸类数据可以为纸币；所述图像数据包括像素点，以及像素点的灰度值数据。优选的，可以获取白光灰度的图像数据，以减小数据处理的复杂度；可选的，字符识别装置也获取可以获取彩色的图像数据，以丰富输入纸类识别的特征（一些纸币有特定的颜色，彩色数据有助于直接识别币种）；具体获取图像数据的类型可以根据实际需求而定，此处不作限定。

倾斜校正单元302对所述图像数据进行倾斜校正，具体的，边缘提取模块3021提取所述图像数据的边缘点。由于采集得到图像数据的背景单一，且输入纸类的边界有明显的灰度差，可以利用这点来搜索图像数据中的边缘点；直线拟合模块3022对所述边缘点进行直线拟合；倾斜角度获取模块3023获取所述直线拟合后的边缘点的倾斜角度。可选的，上述边缘点进行直线拟合后，还可以获得所述图像数据的边界长度（即获知所述输入纸类的大小），有助于后续进行币种和面值的识别；调整模块3024根据所述倾斜角度调整所述图像数据，使得所述图像数据的上下边界平行于水平面。如，若所述输入纸类的图像数据顺时针倾斜了30度，则字符识别装置将所述图像数据逆时针往回调整30度。

初步定位单元303对所述图像数据进行预处理，所述预处理包括为币种识别，面值识别及方向识别中任意一种或两种以上的组合。

具体的，币种识别和面值识别可以通过模式识别方法，或图像处理方法实现；可选的，若经过面值识别之后确定所述输入纸类为面值100元人民币，则通过对特定位置的图像识别（如，识别头像的位置），可以判别出所述100元人民币的正反；进一步的，对数额所在的为位置进行识别，若识别出“001”，则可以确认所述100元人民币被倒置。可选的，也可以不基于币种识别和面值识别的结果进行方向识别，只要基于一些图像的正反及朝向的特征进行判别即可。再根据所述预处理的结果获取所述目标字符串的目标区域，获取所述目标字符串在所述目标区域内的最大范围信息，所述最大范围信息包括所述目标区域的最大高度H和最大宽度W。具体的，所述图像数据进行预处理之后，可以根据输入纸类的币种、面值及方向信息获知所述目标字符串的目标区域及所述目标字符串在所述目标区域内的最大范围信息（字符识别装置中预置的映射关系）。

全区域定位单元304定位所述初步区域内像素点的灰度值之和最小的区域，获得所述目标字符串的全区域。

下面对用于执行上述纸类字符识别方法的本发明纸类字符识别装置的实施例进行说明，其逻辑结构请参考图4，本发明实施例中纸类字符识别装置的另一个实施例包括：

目标获取单元401，用于获取字符串的目标区域；

边界定位单元402，用于确定所述目标区域中各个字符的上下边界和左右边界，得到各个单字符区域；

合并单元403，用于根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符，若是，则对所述两个字符的单字符区域进行合并；

识别单元404，用于分别识别所述单字符区域内的字符。

可选的，所述装置还包括：

粘连判定单元405，用于根据单个字符的字符宽度判断所述单个字符是否为粘连字符，若是，则对所述单个字符的单字符区域进行分离。

本发明实施例中，各个单元的具体操作包括：

目标获取单元401获取字符串的目标区域。

在获得字符串的目标区域之后，边界定位单元402确定所述目标字符串中各个字符的上下边界和左右边界，得到各个单字符区域。

为了进一步提高字符识别的精确度，所述得到各个单字符区域之后，合并单元403可以根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符（对于一已知的币种和面值来说，每个字符的宽度是预先知道的），若是，则对所述两个字符的单字符区域进行合并。即将第一字符的左边界作为合并后字符的左边界，第二个字符的右边界作为合并后字符的右边界。

可选的，为了进一步提高字符识别的精确度，得到各个单字符区域之后，粘连判定单元405可以根据单个字符的字符宽度判断所述单个字符是否为粘连字符，若是，则对所述单个字符的单字符区域进行分离；示例性的，字符识别装置重新对所述单个字符进行左右边界的确定，若所述单个字符在水平方向上连续的字符像素点满足预置字符宽度，则确认所述满足预置字符宽度内的区域为被分离的第一个单字符区域，并从所述满足预置字符宽度点的下一点开始作为第二个被分离字符的左边界，原所述单个字符的右边界为所述第二个被分离字符的右边界。

完成上述的调整操作后，识别单元404对所述全区域内的目标字符串进行字符识别。具体的，可以根据经验值先对所述全区域内的目标字符串进行单字符分割，再使用人工神经网络进行单个字符的识别。上述仅以一些例子对本发明实施例中字符识别的方法进行了说明，可以理解的是，在实际应用中，还可以有其它的字符识别方法，具体此处不作限定。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-OnlyMemory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种纸类字符识别方法，其特征在于，包括：

获取输入纸类的图像数据；

对所述图像数据进行倾斜校正；

对所述图像数据的目标字符串进行初步定位，获取所述目标字符串的初步区域；所述对图像数据的目标字符串进行初步定位之前，包括：对所述图像数据进行预处理，所述预处理包括为币种识别，面值识别及方向识别中任意一种或两种以上的组合；

定位所述初步区域内像素点的灰度值之和最小的区域；获得所述目标字符串的全区域；

对所述全区域内的目标字符串进行字符识别，所述对全区域内的目标字符串进行字符识别，包括：确定所述目标字符串中各个字符的上下边界和左右边界，得到各个单字符区域；分别识别所述单字符区域内的字符；

根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符，若是，则对所述两个字符的单字符区域进行合并；或，根据单个字符的字符宽度判断所述单个字符是否为粘连字符，若是，则对所述单个字符的单字符区域进行分离。

2.根据权利要求1的方法，其特征在于，所述对图像数据进行倾斜校正，包括：

提取所述图像数据的边缘点；

对所述边缘点进行直线拟合；

获取所述直线拟合后的边缘点的倾斜角度；

根据所述倾斜角度调整所述图像数据。

3.根据权利要求1的方法，其特征在于，所述对图像数据的目标字符串进行初步定位，具体为：

根据所述预处理的结果获取所述目标字符串的目标区域；

所述初步区域为所述目标字符串在所述目标区域内的最大范围信息，所述最大范围信息包括所述目标区域的最大高度H和最大宽度W。

4.根据权利要求1的方法，其特征在于，所述根据初步区域进行所述目标字符串的顶点定位之前，包括：

去除所述初步区域中的噪声数据。

5.根据权利要求1的方法，其特征在于，所述确定所述目标字符串中各个字符的上下边界和左右边界，包括：

获取所述目标字符串中的字符像素点阈值；

根据所述字符像素点阈值确定连续的字符像素点，将所述连续的字符像素点垂直方向上的起点坐标和终点坐标作为上下边界，将所述连续的字符像素点水平方向上的起点坐标和终点坐标作为左右边界。

6.根据权利要求5的方法，其特征在于，所述根据单个字符的字符宽度判断所述单个字符是否为粘连字符，包括：

判断所述单个字符的字符宽度是否大于宽度阈值，若是，则所述单个字符为粘连字符；

所述对单个字符的单字符区域进行分离，包括：

7.根据权利要求1的方法，其特征在于，所述得到各个单字符区域之后，包括：

8.根据权利要求1的方法，其特征在于，所述确定目标字符串中各个字符的上下边界，包括：

9.一种纸类字符识别装置，其特征在于，包括：

数据获取单元，用于获取输入纸类的图像数据；

倾斜校正单元，用于对所述图像数据进行倾斜校正；

初步定位单元，用于对所述图像数据的目标字符串进行初步定位，获取所述目标字符串的初步区域；所述对图像数据的目标字符串进行初步定位之前，包括：对所述图像数据进行预处理，所述预处理包括为币种识别，面值识别及方向识别中任意一种或两种以上的组合；

全区域定位单元，用于定位所述初步区域内像素点的灰度值之和最小的区域；获得所述目标字符串的全区域；

字符识别单元，用于对所述全区域内的目标字符串进行字符识别，所述字符识别单元具体用于确定所述目标字符串中各个字符的上下边界和左右边界，得到各个单字符区域；分别识别所述单字符区域内的字符；根据相邻两个字符之间的间距判断所述两个字符是否为断裂字符，若是，则对所述两个字符的单字符区域进行合并；或，根据单个字符的字符宽度判断所述单个字符是否为粘连字符，若是，则对所述单个字符的单字符区域进行分离。

10.根据权利要求9的装置，其特征在于，所述倾斜校正单元包括：

边缘提取模块，用于提取所述图像数据的边缘点；

直线拟合模块，用于对所述边缘点进行直线拟合；

倾斜角度获取模块，用于获取所述直线拟合后的边缘点的倾斜角度；

调整模块，用于根据所述倾斜角度调整所述图像数据。