CN108846379A

CN108846379A - 面单识别方法、系统、终端设备及存储介质

Info

Publication number: CN108846379A
Application number: CN201810722796.XA
Authority: CN
Inventors: 胡磊; 俞苏杭; 俞扬; 朱安; 高耸屹; 徐克�
Original assignee: Nanjing Flute Mdt Infotech Ltd
Current assignee: Nanjing Flute Mdt Infotech Ltd
Priority date: 2018-07-03
Filing date: 2018-07-03
Publication date: 2018-11-20

Abstract

本发明公开了一种面单识别方法、系统、终端设备及存储介质，通过对待识别面单进行光学字符识别，获得待识别面单图片；通过全卷积网络对所述待识别面单图片进行特征提取，获得目标特征图；利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口；根据目标定位窗口从所述目标特征图中获取当前文字图像；将所述当前文字图像代入预设特征提取模型中，获得文字特征序列，将所述文字特征序列输入至循环神经网络，获得文字识别结果，可以精准定位待识别面单中的文本信息，滤除无效信息，对面单图片的质量要求低，并且抗干扰能力强，减少了面单识别的工作量，节省了大量面单识别时间，提高了面单识别速度，提升了用户体验。

Description

面单识别方法、系统、终端设备及存储介质

技术领域

本发明涉及光学识别领域，尤其涉及一种面单识别方法、系统、终端设备及存储介质。

背景技术

在各行各业中，存在大量的单据，如银行票据，快递单等。使用纯手工录入计算机系统需要大量的人力和时间成本，还存在时效性低，错误率高等缺点；相对于传统的手工单据录入方法，光学字符识别(Optical Character Recognition，OCR)的识别速度和精度都有很大优势，可以节省大量的人力成本，同时可以提高业务的处理时效。

现有的OCR技术存在着使用麻烦，抗干扰能力小，对单据图片质量要求高，需要对单据上的全部文本信息进行识别，不能做到精准识别等缺点。现在市场上的商用OCR技术大多采用模式匹配的方法，通常整个OCR系统可以分为扫描图片，图片预处理，对图片进行模式识别，返回文本信息几个步骤。大部分单据OC技术需要专门的工具进行软件部署，比如手持单据扫描机，而且使用模式匹配技术的OCR存在的很大一个问题是要求录入的图片质量比较高，文本行尽量保持水平或竖直，不能对文本有遮挡，保持文本信息清晰可识，但是现实世界中很大一部分单据是不满足条件的，比如，快递单在快递运输过程会有折痕，墨迹覆盖等问题，很多单据图片录入时可能会存在图片是倾斜的问题，现有的OCR技术对这些问题没有很好的解决方案，对录入的图片质量要求很高；现有的OCR系统一般是针对整版图片进行文字识别，计算量很大，而且提取了很多无用信息。

发明内容

本发明的主要目的在于提供一种面单识别方法、系统、终端设备及存储介质，旨在解决现有技术中模式匹配OCR技术使用麻烦、抗干扰能力小、对单据图片质量要求高及无法精准识别单据的技术问题。

为实现上述目的，本发明提供一种面单识别方法，所述面单识别方法包括以下步骤：

对待识别面单进行光学字符识别，获得待识别面单图片；

通过全卷积网络对所述待识别面单图片进行特征提取，获得目标特征图；

利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口；

根据目标定位窗口从所述目标特征图中获取当前文字图像；

将所述当前文字图像代入预设特征提取模型中，获得文字特征序列，所述预设特征提取模型反映当前文字图像与文字特征序列的对应关系；

将所述文字特征序列输入至循环神经网络，获得文字识别结果。

优选地，所述利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口，具体包括：

获取预设候选定位窗口集中的各候选定位窗口分别与所述目标特征图的匹配度；

利用非极大值抑制算法从预设候选定位窗口集中选取匹配度最高值对应的候选定位窗口作为目标定位窗口。

优选地，所述根据目标定位窗口从所述目标特征图中获取当前文字图像，具体包括：

从所述目标特征图中找到所述目标定位窗口对应的多个目标位置；

对多个目标位置进行图像截取，将截取的图像作为当前文字图像。

优选地，所述将所述文字特征序列输入至循环神经网络，获得文字识别结果，具体包括：

将所述文字特征序列输入至循环神经网络，以使所述循环神经网络对所述文字特征序列对应的卷积特征向量进行分类识别，获得分类识别的文字识别结果。

优选地，所述利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口之前，所述面单识别方法还包括：

从预设样本特征图集中选取预设数量的样本特征图，所述样本特征图为与所述目标特征图尺寸相差在预设尺寸阈值范围内的特征图；

对各样本特征图进行回归分析，获得多个定位四角坐标值；

根据各定位四角坐标值确定预设候选窗口集。

优选地，所述将所述当前文字图像代入预设特征提取模型中，获得文字特征序列之前，所述面单识别方法还包括：

从预设文字图像集中选取预设数量的样本文字图像，并获取各样本文字图像对应的样本文字特征序列；

将各样本文字图像代入至预设训练模型，获得训练结果，所述训练模型为基于深度卷积神经网络建立的模型；

获取各样本文字特征序列与所述训练结果的匹配结果，根据所述匹配结果对所述预设训练模型进行优化；

将优化后的预设训练模型作为预设特征提取模型。

优选地，所述将各样本文字图像代入至预设训练模型，获得训练结果之前，所述面单识别方法还包括：

从预设模型库中选取与所述当前文字图像匹配的训练模型作为预设训练模型。

此外，为实现上述目的，本发明还提出一种终端设备，所述终端设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的面单识别程序，所述面单识别程序配置为实现如上文所述的面单识别方法的步骤。

此外，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有面单识别程序，所述面单识别程序被处理器执行时实现如上文所述的面单识别方法的步骤。

此外，为实现上述目的，本发明还提供一种面单识别系统，所述面单识别系统包括：

图片获取模块，用于对待识别面单进行光学字符识别，获得待识别面单图片；

特征提取模块，用于通过全卷积网络对所述待识别面单图片进行特征提取，获得目标特征图；

窗口选取模块，用于利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口；

图像获取模块，用于根据目标定位窗口从所述目标特征图中获取当前文字图像；

特征序列获取模块，用于将所述当前文字图像代入预设特征提取模型中，获得文字特征序列，所述预设特征提取模型反映当前文字图像与文字特征序列的对应关系；

结果获取模块，用于将所述文字特征序列输入至循环神经网络，获得文字识别结果。

本发明提出的面单识别方法，通过对待识别面单进行光学字符识别，获得待识别面单图片；通过全卷积网络对所述待识别面单图片进行特征提取，获得目标特征图；利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口；根据目标定位窗口从所述目标特征图中获取当前文字图像；将所述当前文字图像代入预设特征提取模型中，获得文字特征序列，所述预设特征提取模型反映当前文字图像与文字特征序列的对应关系；将所述文字特征序列输入至循环神经网络，获得文字识别结果，可以精准定位待识别面单中的文本信息，滤除无效信息，不仅支持印刷体，对手写体识别也支持，对面单图片的质量要求低，并且抗倾斜，旋转，反光及遮挡等多种干扰，减少了面单识别的工作量，节省了大量面单识别时间，提高了面单识别速度，提升了用户体验。

附图说明

图1为本发明实施例方案涉及的硬件运行环境的终端设备结构示意图；

图2为本发明面单识别方法第一实施例的流程示意图；

图3为本发明面单识别方法第二实施例的流程示意图；

图4为本发明面单识别方法第三实施例的流程示意图；

图5为本发明面单识别系统第一实施例的功能模块图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例的解决方案主要是：本发明通过对待识别面单进行光学字符识别，获得待识别面单图片；通过全卷积网络对所述待识别面单图片进行特征提取，获得目标特征图；利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口；根据目标定位窗口从所述目标特征图中获取当前文字图像；将所述当前文字图像代入预设特征提取模型中，获得文字特征序列，所述预设特征提取模型反映当前文字图像与文字特征序列的对应关系；将所述文字特征序列输入至循环神经网络，获得文字识别结果，可以精准定位待识别面单中的文本信息，滤除无效信息，不仅支持印刷体，对手写体识别也支持，对面单图片的质量要求低，并且抗倾斜，旋转，反光及遮挡等多种干扰，减少了面单识别的工作量，节省了大量面单识别时间，提高了面单识别速度，提升了用户体验，解决了现有技术中模式匹配OCR技术使用麻烦、抗干扰能力小、对单据图片质量要求高及无法精准识别单据的技术问题。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的终端设备结构示意图。

如图1所示，该终端设备可以包括：处理器1001，例如CPU，通信总线1002、用户端接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户端接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户端接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的终端设备结构并不构成对该终端设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户端接口模块以及面单识别程序。

本发明终端设备通过处理器1001调用存储器1005中存储的面单识别程序，并执行以下操作：

对待识别面单进行光学字符识别，获得待识别面单图片；

根据目标定位窗口从所述目标特征图中获取当前文字图像；

进一步地，处理器1001可以调用存储器1005中存储的面单识别程序，还执行以下操作：

对各样本特征图进行回归分析，获得多个定位四角坐标值；

根据各定位四角坐标值确定预设候选窗口集。

将优化后的预设训练模型作为预设特征提取模型。

本实施例通过上述方案，通过对待识别面单进行光学字符识别，获得待识别面单图片；通过全卷积网络对所述待识别面单图片进行特征提取，获得目标特征图；利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口；根据目标定位窗口从所述目标特征图中获取当前文字图像；将所述当前文字图像代入预设特征提取模型中，获得文字特征序列，所述预设特征提取模型反映当前文字图像与文字特征序列的对应关系；将所述文字特征序列输入至循环神经网络，获得文字识别结果，可以精准定位待识别面单中的文本信息，滤除无效信息，不仅支持印刷体，对手写体识别也支持，对面单图片的质量要求低，并且抗倾斜，旋转，反光及遮挡等多种干扰，减少了面单识别的工作量，节省了大量面单识别时间，提高了面单识别速度，提升了用户体验。

基于上述硬件结构，提出本发明面单识别方法实施例。

参照图2，图2为本发明面单识别方法第一实施例的流程示意图。

在第一实施例中，所述面单识别方法包括以下步骤：

步骤S10、对待识别面单进行光学字符识别，获得待识别面单图片。

需要说明的是，所述待识别面单为需要进行识别的面单，本实施例中的面单是指各行各业中使用的各类纸质单据，一般可以是银行票据，还可以是快递单据，当然也可以是其他类型的单据，本实施例对此不加以限制；光学字符识别(Optical CharacterRecognition，OCR)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。可以理解的是，通过对待识别面单进行光学字符识别，能够获得初步的地待识别面单图片，为接下来的面单识别做准备。

步骤S20、通过全卷积网络对所述待识别面单图片进行特征提取，获得目标特征图。

需要说明的是，所述全卷积网络(Fully Convolutional Networks，FCN)为将网络的全连接层变成卷积层之后，整个网络变成了只有卷积层和池化层的网络；通过全卷积网络对所述待识别面单图片进行特征提取，即对原始输入的图片进行特征提取，可以获得对应的特征图，即所述目标特征图。

步骤S30、利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口。

可以理解的是，所述非极大值抑制算法(Non Maximum Suppression，NMS)是一种获取局部最大值的有效算法，能够消除多余的框，找到最佳的物体检测的位置，利用所述非极大值抑制算法可以从预设候选定位窗口集中选取目标定位窗口，从而提高文字识别的精度。

步骤S40、根据目标定位窗口从所述目标特征图中获取当前文字图像。

应当理解的是，根据目标定位窗口可以从所述目标特征图中获取对应的文字图像，从而保证了文字图像识别的精度，有效减少了不相干的图像引起的计算消耗。

进一步地，所述步骤S40具体包括以下步骤：

可以理解的是，通过从所述目标特征图中找到所述目标定位窗口对应的多个目标位置，即通过对应的目标定位窗口，可以在所述目标特征图中选定一些与所述目标定位窗口对应的位置，作为所述目标位置，再对多个目标位置进行图像截取，能够获得截取的图像，所述截取的图像即作为当前文字图像。

步骤S50、将所述当前文字图像代入预设特征提取模型中，获得文字特征序列，所述预设特征提取模型反映当前文字图像与文字特征序列的对应关系。

需要说明的是，所述预设特征提取模型为预先设置的用于反映当前文字图像与文字特征序列的对应关系的模型，所述预设特征提取模型为基于深度卷积神经网络建立的模型，通过将所述当前文字图像代入至预设特征提取模型中，可以获得文字特征序列。

步骤S60、将所述文字特征序列输入至循环神经网络，获得文字识别结果。

需要说明的是，所述循环神经网络RNN是两种人工神经网络的总称。一种是时间递归神经网络(recurrent neural network)，另一种是结构递归神经网络(recursiveneural network)。时间递归神经网络的神经元间连接构成有向图，而结构递归神经网络利用相似的神经网络结构递归构造更为复杂的深度网络。两者训练的算法不同，但属于同一算法变体；通过将所述文字特征徐来输入至循环神经网络，能够获得与所述文字特征序列的向量对应的文字识别结果。

进一步地，所述步骤S60具体包括以下步骤：

可以理解的是，将所述文字特征序列输入至循环神经网络后，可以通过所述循环神经网络对所述文字特征序列对应的卷积特征向量进行分类识别，一般的，可以通过在同一时间点，根据预设的两个方向的权重参数对所述卷积特征向量进行运算，输出分类识别后的文字识别结果，从而在保障文字识别精度的情况下提升了识别速度。

本实施例通过上述方案，通过对待识别面单进行光学字符识别，获得待识别面单图片；通过全卷积网络对所述待识别面单图片进行特征提取，获得目标特征图；利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口；根据目标定位窗口从所述目标特征图中获取当前文字图像；将所述当前文字图像代入预设特征提取模型中，获得文字特征序列，所述预设特征提取模型反映当前文字图像与文字特征序列的对应关系；将所述文字特征序列输入至循环神经网络，获得文字识别结果，可以精准定位待识别面单中的文本信息，滤除无效信息，不仅支持印刷体，对手写体识别也支持，对面单图片的质量要求低，并且抗倾斜，旋转，反光及遮挡等多种干扰，减少了面单识别的工作量，节省了大量面单识别时间，提高了面单识别速度，并且更加智能化，提升了用户体验。

进一步地，图3为本发明面单识别方法第二实施例的流程示意图，如图3所示，基于第一实施例提出本发明面单识别方法第二实施例，在本实施例中，所述步骤S30具体包括以下步骤：

步骤S31、获取预设候选定位窗口集中的各候选定位窗口分别与所述目标特征图的匹配度。

需要说明的是，所述预设候选定位窗口集中的各候选定位窗口分别与所述目标特征图的匹配度是指各候选定位窗口与所述目标特征图的类型以及尺寸大小的匹配度，一般的，不同的定位窗口与不同类型的特征图或不同尺寸大小的特征图之间有对应的匹配关系，相应的，不同的定位窗口与所述目标特征图的匹配度是指不同定位窗口与不同类型或尺寸大小的特征图直接的匹配程度，匹配程度高则说明该定位窗口能够准确的抓取特征图中的文字图像，匹配程度低则说明该定位窗口获取特征图中文字图像的作用较差，当然各候选定位窗口分别与所述目标特征图的匹配度，除了可以是与所述目标特征图的类型或尺寸大小的匹配度之外，还可以是其他特征图参数的匹配度，本实施例对此不加以限制。

步骤S32、利用非极大值抑制算法从预设候选定位窗口集中选取匹配度最高值对应的候选定位窗口作为目标定位窗口。

可以理解的是，通过利用非极大值抑制算法可以从预设候选定位窗口集中选取匹配度最高值对应的候选定位窗口，从而将该候选定位窗口作为目标定位窗口，可以进一步的减少计算消耗，节省文字识别的时间，提高了文字识别的精度和速度。

进一步地，所述步骤S30之前，所述面单识别方法还包括以下步骤：

步骤S301、从预设样本特征图集中选取预设数量的样本特征图，所述样本特征图为与所述目标特征图尺寸相差在预设尺寸阈值范围内的特征图。

需要说明的是，所述预设样本特征图集为预先设置的用于存储各种特征图的集合，通过从所述预设样本特征图集中可以选取与所述目标特征图尺寸相差在预设尺寸阈值范围内的特征图，将该特征图作为所述样本特征图。

步骤S302、对各样本特征图进行回归分析，获得多个定位四角坐标值。

可以理解的是，将各样本特征图进行回归分析，可以获得各样本特征图对应的定位四角坐标值，在具体实现中，可以通过5个不同尺寸的样本特征图进行回归分析，获得用于定位文本信息的定位四角坐标值，从而有效减少了计算消耗，提高了文字识别的速度，节省了文字识别的时间。

步骤S303、根据各定位四角坐标值确定预设候选窗口集。

应当理解的是，当获得各样本特征图对应的定位四角坐标值后，可以根据各定位四角坐标值确定对应的预设候选窗口，将多个预设候选窗口进行集合，可以确定预设候选窗口集。

本实施例通过上述方案，通过从预设样本特征图集中选取预设数量的样本特征图，所述样本特征图为与所述目标特征图尺寸相差在预设尺寸阈值范围内的特征图；对各样本特征图进行回归分析，获得多个定位四角坐标值；根据各定位四角坐标值确定预设候选窗口集；获取预设候选定位窗口集中的各候选定位窗口分别与所述目标特征图的匹配度；利用非极大值抑制算法从预设候选定位窗口集中选取匹配度最高值对应的候选定位窗口作为目标定位窗口，进一步减少了面单识别的工作量，节省了大量面单识别时间，提高了面单识别速度，提升了用户体验。

进一步地，图4为本发明面单识别方法第三实施例的流程示意图，如图4所示，基于第二实施例提出本发明面单识别方法第三实施例，在本实施例中，所述步骤S50之前，所述面单识别方法还包括以下步骤：

步骤S501、从预设文字图像集中选取预设数量的样本文字图像，并获取各样本文字图像对应的样本文字特征序列。

需要说明的是，所述预设文字图像集为预先设置的用于训练模型的文字图像的集合，可以包含大量的各种类别的文字图像，从所述预设文字图像集中选取预设数量的样本文字图像，获取样本文字图像的方式可以是特殊指定，也可以是随机选取，当然也可以是其他方式，本实施例对此不加以限制；相应地，所述预设文字图像集还包括与各样本文字图像对应的样本文字特征序列。

步骤S502、将各样本文字图像代入至预设训练模型，获得训练结果，所述训练模型为基于深度卷积神经网络建立的模型。

可以理解的是，所述预设训练模型为基于深度卷积神经网络建立的模型，用于反映文字图像与文字特征序列之间的关系，通过将各样本文字图像代入至预设训练模型可以获得与各样本文字图像对应的训练结果。

进一步地，所述步骤S502之前还包括以下步骤：

需要说明的是，所述预设模型库为用于存储各类训练模型的数据库，通过选取与当前文字图像匹配的训练模型作为预设训练模型，可以极大提高文字识别的精确度，减少了计算量，加快了文字识别的速度。

步骤S503、获取各样本文字特征序列与所述训练结果的匹配结果，根据所述匹配结果对所述预设训练模型进行优化。

应当理解的是，将各样本文字特征序列与所述训练结果进行匹配，可以获得各样本文字特征序列与所述训练结果的匹配结果，即各样本文字特征序列是否与训练结果一致，若不一致则寻找其差异处，生成相应的匹配结果，根据所述匹配结果可以对预设训练模型进行优化，即对预设的权重进行调整以及调整其他运算参数，直至所述匹配结果为匹配一致。

步骤S504、将优化后的预设训练模型作为预设特征提取模型。

可以理解的是，优化后的预设训练模型能够更加准确的获得所述文字图像对应的文字特征序列，将优化后的预设训练模型作为预设特征提取模型可以提高面单识别速度和效率，并且保证了文字识别的准确度。

本实施例通过上述方案，通过从预设文字图像集中选取预设数量的样本文字图像，并获取各样本文字图像对应的样本文字特征序列；从预设模型库中选取与所述当前文字图像匹配的训练模型作为预设训练模型，将各样本文字图像代入至预设训练模型，获得训练结果，所述训练模型为基于深度卷积神经网络建立的模型；获取各样本文字特征序列与所述训练结果的匹配结果，根据所述匹配结果对所述预设训练模型进行优化；将优化后的预设训练模型作为预设特征提取模型，进一步减少了面单识别的工作量，节省了大量面单识别时间，提高了面单识别速度和效率，并且保证了文字识别的准确度。

本发明进一步提供一种面单识别系统。

参照图5，图5为本发明面单识别系统第一实施例的功能模块图。

本发明面单识别系统第一实施例中，该面单识别系统包括：

图片获取模块10，用于对待识别面单进行光学字符识别，获得待识别面单图片。

需要说明的是，所述待识别面单为需要进行识别的面单，本实施例中的面单是指各行各业中使用的各类纸质单据，一般可以是银行票据，还可以是快递单据，当然也可以是其他类型的单据，本实施例对此不加以限制；光学字符识别(Optical CharacterRecognition，OCR)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。

可以理解的是，通过对待识别面单进行光学字符识别，能够获得初步的地待识别面单图片，为接下来的面单识别做准备。

特征提取模块20，用于通过全卷积网络对所述待识别面单图片进行特征提取，获得目标特征图。

窗口选取模块30，用于利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口。

图像获取模块40，用于根据目标定位窗口从所述目标特征图中获取当前文字图像。

特征序列获取模块50，用于将所述当前文字图像代入预设特征提取模型中，获得文字特征序列，所述预设特征提取模型反映当前文字图像与文字特征序列的对应关系。

结果获取模块60，用于将所述文字特征序列输入至循环神经网络，获得文字识别结果。

在具体实现中，基于上述面单识别方法的实施例，可以把所述面单识别系统总体结构区分为调度模块、训练模块、识别模块、图片数据库和模型库，调度模块负责控制整体系统运行和数据流在系统中所有组件中流动，并在相应动作发生时触发事件。训练模块负责深度学习的模型训练，模型优化，需要调用图片数据库中的图片作为训练数据，并把训练优化后的模型存入模型库。识别模块提供识别服务，可以提供基于API的识别调用服务，适配模型库中最优模型，提供实时识别服务，可选的把识别服务中遇到的新的图片数据添加到图片数据库。图片数据库负责存放图片文件和标记文件，包含两类数据：手工标记的数据和识别模块返回的数据。模型库负责存放训练模块生成的模型，并为识别模块提供模型服务，并且在实际操作中，可以使用MongoDB分布式文件存储的数据库，提供大规模数据存储服务，用于存储图片和对应的标记信息；使用Tensorflow等深度学习库,构建面单识别的训练模块，获得在识别精确度和识别效率上满足要求模型；在模型库中使用持久化技术和分布式调度技术，可快速调用模型文件为训练模块和识别模块提供服务。通过封装API，包装识别服务为一个便捷调用的服务，可以非常轻松的对外提供服务。提供便捷的控制方法，可以通过web端控制训练，识别服务，模型调用选择并提供对整个系统的监控。详细的功能模块设计包括的数据集管理服务、模型训练的功能、提供封装的识别服务功能、模型文件自动调度功能和系统管理功能；其中，数据集管理服务主要完成系统正常运行的各种必要数据的维护和管理功能。主要包括标记数据集管理、识别服务返回的数据管理、与标记系统结合的数据存储服务等。模型训练服务主要是利用分布式深度学习系统和不断丰富的数据集进行自动化的模型训练，优化模型性能，为识别服务提供更好的支持。识别服务功能模块主要包括基于深度学习的识别系统、封装好的应用程序编程接口(Application ProgrammingInterface，API)服务、高并发的访问处理服务。模型库服务是用来管理面单识别系统所用的深度学习模型，主要包括模型持久化存储和支持模型分布式调度的功能。系统管理服务是用来管理整个面单识别系统，提供对整个系统资源的监控(包括内存，图形处理器(Graphics Processing Unit，GPU))，同时可以进行模型训练，识别服务的管理，也提供对数据集和模型文件的管理。

本实施例通过上述方案，通过图片获取模块对待识别面单进行光学字符识别，获得待识别面单图片；特征提取模块通过全卷积网络对所述待识别面单图片进行特征提取，获得目标特征图；窗口选取模块利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口；图像获取模块根据目标定位窗口从所述目标特征图中获取当前文字图像；特征序列获取模块将所述当前文字图像代入预设特征提取模型中，获得文字特征序列，所述预设特征提取模型反映当前文字图像与文字特征序列的对应关系；结果获取模块将所述文字特征序列输入至循环神经网络，获得文字识别结果，可以精准定位待识别面单中的文本信息，滤除无效信息，不仅支持印刷体，对手写体识别也支持，对面单图片的质量要求低，并且抗倾斜，旋转，反光及遮挡等多种干扰，减少了面单识别的工作量，节省了大量面单识别时间，提高了面单识别速度，并且更加智能化，提升了用户体验。

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有面单识别程序，所述面单识别程序被处理器执行时实现如下操作：

对待识别面单进行光学字符识别，获得待识别面单图片；

根据目标定位窗口从所述目标特征图中获取当前文字图像；

进一步地，所述面单识别程序被处理器执行时还实现如下操作：

对各样本特征图进行回归分析，获得多个定位四角坐标值；

根据各定位四角坐标值确定预设候选窗口集。

将优化后的预设训练模型作为预设特征提取模型。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种面单识别方法，其特征在于，所述面单识别方法包括：

对待识别面单进行光学字符识别，获得待识别面单图片；

根据目标定位窗口从所述目标特征图中获取当前文字图像；

2.如权利要求1所述的面单识别方法，其特征在于，所述利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口，具体包括：

3.如权利要求2所述的面单识别方法，其特征在于，所述根据目标定位窗口从所述目标特征图中获取当前文字图像，具体包括：

4.如权利要求3所述的面单识别方法，其特征在于，所述将所述文字特征序列输入至循环神经网络，获得文字识别结果，具体包括：

5.如权利要求1-4中任一项所述的面单识别方法，其特征在于，所述利用非极大值抑制算法从预设候选定位窗口集中选取目标定位窗口之前，所述面单识别方法还包括：

对各样本特征图进行回归分析，获得多个定位四角坐标值；

根据各定位四角坐标值确定预设候选窗口集。

6.如权利要求1-4中任一项所述的面单识别方法，其特征在于，所述将所述当前文字图像代入预设特征提取模型中，获得文字特征序列之前，所述面单识别方法还包括：

将优化后的预设训练模型作为预设特征提取模型。

7.如权利要求6所述的面单识别方法，其特征在于，所述将各样本文字图像代入至预设训练模型，获得训练结果之前，所述面单识别方法还包括：

8.一种面单识别系统，其特征在于，所述面单识别系统包括：

9.一种终端设备，其特征在于，所述终端设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的面单识别程序，所述面单识别程序配置为实现如权利要求1至7中任一项所述的面单识别方法的步骤。

10.一种存储介质，其特征在于，所述存储介质上存储有面单识别程序，所述面单识别程序被处理器执行时实现如权利要求1至7中任一项所述的面单识别方法的步骤。