CN113642352B - 快递面单的文本信息的获取方法、装置和终端设备 - Google Patents
快递面单的文本信息的获取方法、装置和终端设备 Download PDFInfo
- Publication number
- CN113642352B CN113642352B CN202010342791.1A CN202010342791A CN113642352B CN 113642352 B CN113642352 B CN 113642352B CN 202010342791 A CN202010342791 A CN 202010342791A CN 113642352 B CN113642352 B CN 113642352B
- Authority
- CN
- China
- Prior art keywords
- target
- express delivery
- target image
- area
- positioning mark
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 110
- 238000012545 processing Methods 0.000 claims abstract description 191
- 238000012015 optical character recognition Methods 0.000 claims description 91
- 230000009466 transformation Effects 0.000 claims description 73
- 239000011159 matrix material Substances 0.000 claims description 66
- 238000010586 diagram Methods 0.000 claims description 41
- 230000008569 process Effects 0.000 claims description 15
- 238000007619 statistical method Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 239000003550 marker Substances 0.000 claims description 5
- 230000003287 optical effect Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 239000003999 initiator Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
本说明书提供了快递面单的文本信息的获取方法、装置和终端设备。在一个实施例中,快递面单的文本信息的获取方法通过先获取并根据包含有快递面单的目标图像,找到目标图像中的定位标志区域;再以该定位标志区域作为定位参照,在目标图像中快速地确定出包含有目标文本信息的目标识别区域;进而可以只对目标图像中的该目标识别区域进行针对性识别处理,提取得到快递面单中的目标文本信息,从而可以在终端设备本地以较低成本,快速、准确地识别提取出快递面单中的目标文本信息。
Description
技术领域
本说明书属于互联网技术领域,尤其涉及快递面单的文本信息的获取方法、装置和终端设备。
背景技术
在物流场景中,常常需要获取快递面单上的某些文本信息。
目前,亟需一种能够快速、准确地从快递面单上获取所需要的目标文本信息的方法。
发明内容
本说明书提供了一种快递面单的文本信息的获取方法、装置和终端设备,以便能够以较低成本,快速、准确地识别提取出快递面单中的目标文本信息。
本说明书提供的一种快递面单的文本信息的获取方法、装置和终端设备是这样实现的:
一种快递面单的文本信息的获取方法,包括:获取包含有快递面单的目标图像;从所述目标图像中,确定出定位标志区域;根据所述定位标志区域,在所述目标图像中确定出目标识别区域;对所述目标识别区域进行光学字符识别,得到所述快递面单中的目标文本信息。
一种快递面单的文本信息的获取方法,包括:获取包含有快递面单的目标图像;从所述目标图像中,确定出定位标志区域;根据所述定位标志区域,确定所述目标图像中的快递面单是否满足预设的处理要求;在确定所述目标图像中的快递面单满足预设的处理要求的情况下,根据所述定位标志区域,在所述目标图像中确定出目标识别区域;对所述目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息。
一种目标文件的目标文本信息的获取方法,包括:获取包含有目标文件的目标图像,其中,所述目标文件按照预设格式排版;从所述目标图像中,确定出定位标志区域;根据所述定位标志区域,在所述目标图像中确定出目标识别区域;对所述目标识别区域进行光学字符识别,得到所述目标文件中的目标文本信息。
一种快递面单的文本信息的获取装置,包括:获取模块,用于获取包含有快递面单的目标图像;第一确定模块,用于从所述目标图像中,确定出定位标志区域;第二确定模块,用于根据所述定位标志区域,在所述目标图像中确定出目标识别区域;识别模块,用于对所述目标识别区域进行光学字符识别,得到所述快递面单中的目标文本信息。
一种终端设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现获取包含有快递面单的目标图像;从所述目标图像中,确定出定位标志区域;根据所述定位标志区域,在所述目标图像中确定出目标识别区域;对所述目标识别区域进行光学字符识别,得到所述快递面单中的目标文本信息。
一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现获取包含有快递面单的目标图像;从所述目标图像中,确定出定位标志区域;根据所述定位标志区域,在所述目标图像中确定出目标识别区域;对所述目标识别区域进行光学字符识别,得到所述快递面单中的目标文本信息。
本说明书提供的一种快递面单的文本信息的获取方法、装置和终端设备,通过先获取并根据包含有快递面单的目标图像,找到目标图像中的定位标志区域;再以该定位标志区域作为参照,在目标图像中确定出具有较大概率包含有目标文本信息的目标识别区域;进而可以在终端设备本地只对目标图像中的该目标识别区域进行针对性识别处理,提取得到快递面单中的目标文本信息,从而可以在终端设备本地上,以较低的成本,快速、准确地识别提取出快递面单中的目标文本信息。
附图说明
为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是应用本说明书实施例提供的快递面单的文本信息的获取方法的系统结构组成的一个实施例的示意图;
图2是在一个场景示例中,应用本说明书实施例提供的快递面单的文本信息的获取方法的一种实施例的示意图;
图3是在一个场景示例中,应用本说明书实施例提供的快递面单的文本信息的获取方法的一种实施例的示意图;
图4是在一个场景示例中,应用本说明书实施例提供的快递面单的文本信息的获取方法的一种实施例的示意图;
图5是在一个场景示例中,应用本说明书实施例提供的快递面单的文本信息的获取方法的一种实施例的示意图;
图6是在一个场景示例中,应用本说明书实施例提供的快递面单的文本信息的获取方法的一种实施例的示意图;
图7是本说明书的一个实施例提供的快递面单的文本信息的获取方法的流程示意图;
图8是应用本说明书实施例提供的快递面单的文本信息的获取方法的一种实施例的示意图;
图9是本说明书的一个实施例提供的终端设备的结构组成示意图;
图10是本说明书的一个实施例提供的快递面单的文本信息的获取装置的结构组成示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
本说明书实施例提供一种快递面单的文本信息的获取方法。参阅图1所示,该方法具体可以应用于包含有服务器和终端设备的系统架构中。其中,终端设备和服务器可以通过有线或无线的方式相连,终端设备本地配置有预设的光学字符识别模型,服务器配置有预设的图像处理模型。
具体实施时,上述终端设备可以用于获取包含有快递面单的目标图像;从所述目标图像中,确定出定位标志区域;根据所述定位标志区域,确定所述目标图像中的快递面单是否满足预设的处理要求。终端设备在确定所述目标图像中的快递面单满足预设的处理要求的情况下,可以在本地对目标图像进行识别处理,以提取得到目标文本信息。具体的,终端设备可以根据所述定位标志区域,在所述目标图像中确定出目标识别区域;并利用配置于终端设备本地的预设的光学字符识别模型对目标图像中的目标识别区域单独进行针对性的光学字符识别,得到所述快递面单上的目标文本信息。终端设备在确定所述目标图像中的快递面单不满足预设的处理要求的情况下,可以向服务器发送目标图像处理请求,其中,所述目标图像处理请求携带有所述目标图像。服务器接收并响应上述目标图像处理请求,调用所述预设的图像处理模型对所述目标图像进行识别处理,以准确地获取所述快递面单的目标文本信息,并将所得到的目标文本信息反馈给终端设备。终端设备接收服务器所反馈的目标文本信息。
在本实施例中,所述服务器具体可以包括一种应用于网络平台一侧,能够实现数据传输、数据处理等功能的负责具体数据处理的服务器。具体的,所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
在本实施例中,所述终端设备具体可以包括一种应用于用户(例如,快递员、物流公司分拣操作员等)一侧,能够实现数据采集、数据传输等功能的前端设备。具体的,所述终端设备例如可以为平板电脑、智能手机、快递柜、智能可穿戴设备、快递扫描枪等。或者,所述终端设备也可以为能够运行于上述电子设备中的软件应用。例如,可以是在用户的智能手机上安装运行的用于获取快递面单上的目标文本信息的某APP等。
在一个具体的场景示例中,可以参阅图2所示,快递员在派送包裹时可以应用本说明书实施例提供的快递面单的文本信息的获取方法高效、便捷地获取快递面单中收件人的电话号码,以便联系收件人接收包裹。
在本场景实施例中,快递员可以使用物流公司配发的工作手机作为派送包裹时使用的终端设备。该工作手机可以通过手机网络,与物流平台的数据处理系统的服务器相连。
具体的,该工作手机包括有摄像头,可以用于拍摄包裹上的快递面单的照片,作为待处理的目标图像。该工作手机还包括有用于存储数据的存储器和用于数据处理的处理器。并且,该工作手机本地还预先配置有预设的光学字符识别模型,以及预设的变换位置矩阵。
其中,上述预设的光学字符识别模型具体可以包括一种适用于终端设备的处理器,且较为轻量,能够在终端设备本地对图像数据进行OCR(Optical CharacterRecognition,光学字符识别)识别处理,提取图像中的文本信息的处理模型。
上述预设的变换位置矩阵具体可以包括一种通过对大量样本快递面单进行统计学习得到的,能表征快递面单中大概率包含有收件人的电话号码的目标识别区域,与快递面单中的定位标志区域的相对位置关系的参数数据。
具体实施前,平台服务器可以先获取大量样本快递面单,确定并标注出各个样本快递面单中的定位标志区域,以及包含有收件人电话号码的目标识别区域。再通过对上述大量标注后的样本快递面单中定位标志区域,和目标识别区域的位置分布情况、区域大小等属性进行统计分析,确定出样本快递面单中目标识别区域相对于定位标志区域的热力分布图。其中,上述热力分布图可以表征出快递面单中包含有目标文本信息的目标识别区域的所在位置与定位标志区域的所在位置之间的对应关系。例如,通过热力分布图可以反映出快递面单中相对于定位标志区域所在的位置,具有较大概率分布有目标识别区域的位置。此外,上述热力分布图还可以进一步反映出快递面单中目标识别区域的尺寸大小相对于定位标志区域的尺寸大小的对应关系。进一步,服务器可以根据上述热力分布图确定出对应的预设的变换位置矩阵,再将预设的变换位置矩阵发送给终端设备,保存在终端设备本地。
其中,上述定位标志区域具体可以包括目标图像中用于定位确定目标识别区域的图像区域。其中,上述定位标志区域具体可以包含有快递面单中形状、布局较为固定,且较容易辨识的图定位志的区域。具体的,上述定位标志可以包括快递面单中的条形码。相应的,定位标志区域可以包括条形码区域。可以参阅图3所示。
需要说明的是,在本场景示例中,考虑到条形码在快递面单上的图形轮廓较为固定,并且图形特征与快递面单上的其他图形也具有较明显的差异,具有较好的辨识度。又由于在物流场景中,大多是以条形码作为物流操作时的主要凭证,本身对条形码的关注度比较高。在快递面单上,条形码也往往被设置在较为显著的位置处,且条形码在快递面单上所占的区域也被设置得相对较大。基于上述情况,在快递面单上区别于其他的图形结构,条形码相对会更容易被识别出。因此,选用了使用包含有条形码的条形码区域作为定位标志区域。
当然,上述所列举的条形码区域只是一种示意性说明。具体实施时,根据具体的应用场景,也可以选用包含有快递面单上其他的图形结构的区域作为定位标志区域。例如,也可以选择包含有二维码的区域作为定位标志区域等。对此,本说明书不作限定。
在本场景示例中,参阅图2所示,快递员在派送包裹A,在根据收件人地址将该包裹A放入收件人家附近的快递柜后,准备电话联系包裹A的收件人时,可以先使用终端设备对着贴在包裹A上的快递面单进行拍照,得到包含有包裹A的快递面单的照片作为目标图像。
终端设备在得到该目标图像后,可以先对该目标图像进行前景提取处理,以去除目标图像中的无效像素。
例如,具体实施时,终端设备可以通过对该目标图像进行诸如二值化处理、连通域处理等前景提取处理,去除目标图像中除快递面单以外的,例如包裹图像像素、背景图像像素等无效像素,得到相对较为纯净,只包含有快递面单的目标图像。这样后续处理时,可以减少其他无效像素产生的干扰,能够更加准确地从目标图像中识别获取快递面单上的文本信息。
进一步,终端设备可以从上述目标图像中确定出包含有条形码的条形码区域作为定位标志区域。
具体的,例如,终端设备可以先获取上述目标图像中各个像素点的像素特征,再分析各个像素点的像素特征,从中找到与条形码的像素点的像素特征匹配的像素点所在的区域,作为定位标志区域。
在本场景示例中,考虑到配置于终端设备本地的预设的光学字符识别模型本身针对包含有比较常见的状态(例如,快递面单本身没有出现较为严重的扭曲、翻折等倾斜状况,快递面单上的文字符号较为清楚,且尺寸较正常)的快递面单的图像进行光学字符识别所设计的,相对较轻量的处理模型,在运行时具有对处理器的性能要求较低,所占用的处理资源相对较少,处理效率也相对较高的优势。
因此,在具体对目标图像进行识别处理获取收件人的电话号码之前,终端设备可以先对当前目标图像中的快递面单的状态进行判断,已确定该目标图像中的快递面单的状态是否满足预设的处理要求。如果确定该快递面单满足预设的处理要求,则可以直接调用终端设备本地的预设的光学字符识别模型来对目标图像进行识别处理。相对的,如果确定该快递面单不满足预设的处理要求,则可以向物流平台的服务器发送目标图像处理请求,以请求服务器调用配置于服务器一侧的预设的图像处理模型来对目标图像进行具体的识别处理,从而可以更加准确地提取到快递面单上收件人的电话号码。
其中,上述预设的图像处理模型是针对多种状态下的快递面单的图像识别处理所设计的,适用于平台服务器运行的一种涉及更多维度数据处理的云端处理模型,在运行时对处理器的性能、所需要的运算资源的要求会相对较高,但识别处理结果的准确度也相对较高。
在本场景示例中,具体实施时,终端设备可以先获取条形码区域4个端点在目标图像中的位置坐标,可以参阅图4所示。进而可以根据上述4个端点的位置坐标,确定出条形码区域的区域边界,进而可以计算相邻的两个区域边界之间的区域边界夹角。再根据区域边界夹角来判断该目标图像中的快递面单的倾斜程度。再将所确定的倾斜程度与预设的倾斜程度阈值进行比较,以确定出该目标图像中快递面单的倾斜程度是否小于预设的倾斜程度阈值。其中,上述预设的倾斜程度阈值的具体数值可以根据具体情况,以及本地预设的光学字符识别模型的精度要求灵活设置。
同时,终端设备,还可以根据条形码区域的端点的位置坐标,通过计算条形码区域的区域边界的长度,来计算出条形码区域的长度、宽度等尺寸参数。进一步,又由于快递面单大多是按照统一的排版规则打印得到的,通常同一个快递面单中的条形码区域的尺寸参数与快递面单中的文本字符的尺寸参数的比值是一个固定的数值。因此,具体实施时,可以根据预设的快递面单的排版规则,确定出条形区域的尺寸参数与文本字符的尺寸参数的比值。进一步,可以利用所确定出的条形码区域的尺寸参数除以上述比值,估算得到的该目标图像中的快递面单上文本字符的尺寸参数(例如,文本字符的长度、宽度等)。再将估算得到的文本字符的尺寸参数与预设的尺寸阈值进行比较,以确定出快递面单中的文本字符的尺寸参数是否大于所述预设的尺寸阈值。其中,上述预设的尺寸阈值的具体数值可以根据具体情况,以及本地预设的光学字符识别模型的精度要求灵活设置。
在确定目标图像中的快递面单的条形码区域的倾斜程度小于预设的倾斜程度阈值,且快递面单中的文本字符的尺寸参数大于预设的尺寸阈值的情况下,可以确定当前目标图像中的快递面单满足预设的处理要求。即,确定该目标图像中的快递面单的状态是终端设备可以在本地直接进行较为准确的识别处理的。
在本场景示例中,可以参阅图4所示,终端设备在按照上述方式确定该目标图像中的快递面单满足预设的处理要求后,进一步,可以先确定出所述条形区域中的关键点的位置坐标。其中,上述关键点可以是条形码区域的4个端点。当然,也可以是条形码区域的中心点,与4个端点中的一个端点或多个端点的组合。具体实施时,可以根据条形码区域的轮廓图像特点灵活设置能够反映出条形码区域的轮廓图形特点的点作为上述关键点。
接着,终端设备可以根据所述条形码区域中的关键点的位置坐标,和预设的变换位置矩阵,在所述目标图像中确定出目标识别区域的位置坐标。
具体的,例如,终端设备可以将之前确定出的条形码区域的4个端点的位置坐标,代入预设的变换位置矩阵,从而计算得到相对于条形码区域的目标识别区域的4个端点的位置坐标,作为目标识别区域的在目标图像中的位置坐标。
进而,可以参阅图5所示,根据目标识别区域的位置坐标在目标图像中定位确定出目标识别区域,并将目标识别区域单独从目标图像中抠取出来。
再调用终端设备本地的预设的光学字符识别模型,只针对抠取出来的目标识别区域单独进行光学字符识别处理,来获取该目标识别区域中的文本信息,即收件人的电话号码。这样可以避免对目标图像中的所有图像区域都进行光学字符识别,从而有效地降低识别处理过程所涉及到的数据处理量,减少识别处理时间,更加快速地完成识别处理,得到目标识别区域中的收件人的电话号码。同时,又由于避免了对目标图像中除目标识别区域以外的其他图像区域进行识别处理,减少了其他图像区域中的文本字符产生的干扰,从而可以更加准确地从快递面单中识别得到收件人的电话号码。
在本场景示例中,终端设备在按照上述方式识别提取出包裹A的快递面单上的收件人的电话号码后,可以通过内置的程序自动向该号码发送提示短信,以提示包裹A的收件人:您的包裹已经送达快递柜,请及时领取。这样可以使得快递员派送包裹时更加的便捷、高效。
在本场景示例中,通过利用终端设备先获取并根据包含有快递面单的目标图像,找到目标图像中的定位标志区域;再以该定位标志区域作为参照,在目标图像中确定出具有较大概率包含有目标文本信息的目标识别区域;进而可以只对目标图像中的该目标识别区域利用终端设备在本地直接进行针对性的光学字符识别来获取快递面单中的收件人的电话号码。从而可以通过终端设备本以较低成本,在终端设备本地快速、准确地从快递面单中识别提取出例如收件人的电话号码等所关注的目标文本信息。
在另一个场景示例中,可以参阅图6所示,在确定目标图像中的快递面单的条形码区域的倾斜程度大于等于预设的倾斜程度阈值,和/或,快递面单中的文本字符的尺寸参数小于等于预设的尺寸阈值的情况下,可以确定当前目标图像中的快递面单不满足预设的处理要求。即,确定该目标图像中的快递面单的状态是终端设备无法在本地进行较为准确的识别处理的。
在这种情况下,终端设备可以生成针对目标图像的目标图像处理请求,并将该目标图像处理请求,连同该目标图像一同发送至服务器。
服务器在收到上述目标图像处理请求后,可以调用预设的图像处理模型,在服务器一侧,对目标图像进行具体的图像识别处理。例如,服务器可以利用配置于服务器一侧的更加复杂的识别模型使用服务器所拥有的更多的处理资源来的对目标图像进行更多维度的光学字符识别处理,从而可以从目标图像中较为准确地识别提取到收件人的电话号码。
进一步,服务器可以将所识别得到的收件人的电话号码通过手机网络反馈给终端设备,以便终端设备可以根据该电话号码及时地向收件人发送关于包裹A派送的提示信息。
在本场景示例中,通过将配置于服务器一侧的预设的图像处理模型,和配置于终端设备本地的预设的光学字符识别模型进行组合,可以针对包含有不同情况的快递面单的目标图像,利用对应合适的模型进行识别处理来获取目标文本信息,从而可以在目标图像中的快递面单满足终端设备的预设的处理要求的情况下,直接通过终端设备在本地对目标图像进行具体的识别处理,从而能够高效地从目标图像中识别提取出例如收件人的电话号码等所关注的目标文本信息;而在目标图像中的快递面单不满足终端设备的预设的处理要求的情况下,则可以通过请求服务器在云端对目标图像进行具体的识别处理,从而能够准确地从目标图像中提取得到目标文本信息。
参阅图7所示,本说明书实施例提供了一种快递面单的文本信息的获取方法,其中,该方法具体实施时,可以包括以下内容。
S701:获取包含有快递面单的目标图像。
在一些实施例中,需要说明的是,以下所描述的快递面单的文本信息的获取方法根据具体情况和处理需要,可以应用于数据处理能力相对较弱的终端设备一侧。例如,可以应用于用户使用的智能手机、快递员使用快递扫描枪、物流公司配置在小区的智能快递柜等等。此外,上述快递面单的文本信息的获取方法也可以应用于数据处理能力相对较强的云端服务器等一侧。下面主要以应用于终端设备一侧的快递面单的文本信息的获取方法为例,进行具体说明。对于应用于云端服务器等的快递面单的文本信息的获取方法,可以参照应用于终端设备的实施例。
在一些实施例中,上述快递面单具体可以包括一种物流场景中在运送物品的过程中用以记录寄件人、收件人以及物品对象等相关信息的单据。通常快递面单是按照相对固定的排版规则生成的。具体的,可以参阅图3所示。一个快递面单中通常包括:条形码、收件人信息栏、寄件人信息栏等多个内容部分。通常在快递面单中,上述不同内容部分所在的位置之间的相对关系也往往是较为固定的。
其中,上述条形码可以用于表征例如快递的物流编号,或者快递的运单号等快递的身份信息。在快递面单中条形码的布设位置往往会相对固定,并且条形码本身也具有图形轮廓较为简单、固定,在快递面单上较容易辨识的特点。因此,在许多物流场景中,常常会以条形码作为具体物流操作(例如,出库操作、入库操作等)中的主要凭证。上述收件人信息栏具体可以填写有与收件人相关的文本信息,例如,收件人的地址、收件人的电话号码、收件人的姓名等等。上述寄件人信息栏具体可以填写有与寄件人相关的文本信息,例如,寄件人的地址、寄件人的电话号码、寄件人的姓名等等。
此外,快递面单上还可以包含有例如二维码、快递公司的logo等图像数据,以及快递面单的打印时间、运单号等文本信息。
在一些实施例中,上述目标图像具体可以包括一种包含有快递面单的图像数据。
在一些实施例中,具体实施时,可以通过终端设备的摄像头针对快递面单拍摄照片,来获取上述包含有快递面单的目标图像。当然,具体实施时,终端设备也可以先获取包含有快递面单的视频,再从该视频中截取一帧包含有快递面单的图像作为上述目标图像等。当然,上述所列举的获取目标图像的方式只是一种示意性说明。具体实施时,根据具体情况,还可以采用其他合适的方式来获取上述目标对象。
S702:从所述目标图像中,确定出定位标志区域。
在一些实施例中,上述定位标志区域具体可以包括目标图像中用于定位确定目标识别区域的图像区域。其中,上述定位标志区域具体可以包含有快递面单中形状、布局等较为固定,且较容易辨识的定位标志的区域。
在一些实施例中,上述定位标志具体可以包括快递面单中的条形码。相应的,定位标志局域可以是目标图像中的包含有条形码的条形码区域。当然,上述所列举的定位标志区域只是一种示意性说明。具体实施时,根据具体情况,还可以选择使用快递面单中的其他合适的图形特征作为定位标志。例如,还可以使用快递面单中的二维码作为定位标志,相应的,上述定位标志区域还可以包括二维码区域等等。
在一些实施例中,上述目标识别区域具体可以包括目标图像中包含有快递面单上的目标文本信息的图像区域。具体的,上述目标文本信息可以包括快递面单中所关注的、待识别提取的文本信息。具体的,上述目标文本信息可以包括:收件人的电话号码、收件人的地址、寄件人的电话号码、寄件人的地址等等。当然,上述所列举的目标文本信息只是一种示意性说明。具体实施时,根据具体的应用场景,上述目标文本信息还可以包括其他类型的文本信息。例如,快递的运单号等等。对此,本说明书不作限定。
在一些实施例中,终端设备可以先通过对目标图像进行较为简单的图像数据处理,从目标图像中识别并确定出上述定位标志区域。
在一些实施例中,具体实施时,可以通过对目标图像中的图像特征进行检索匹配,找到图像特征与定位标志区域中的定位标志(例如,条形码等)匹配的图像区域,作为定位标志区域,并确定出定位标志区域在目标图像中的位置坐标。例如,确定出在目标图像中定位标志区域的多个端点的位置坐标。从而确定出了定位标志区域。当然,上述所列举的确定定位标志区域的方式只是一种示意性说明。具体实施时,根据具体情况,还可以采用其他合适的方式来确定定位标志区域。对此,本说明书不作限定。
在一些实施例中,为了减少误差、干扰,以便能够更加准确地对目标图像进行具体处理,具体实施时,在从所述目标图像中,确定出定位标志区域之前,还可以先对目标图像进行预处理,以消除目标图像中的干扰因素。具体的,可以对目标图像进行前景提取处理,以去除目标图像中的无效像素。
其中,上述无效像素具体可以包括目标图像中除快递面单以外的图像像素。例如,在获取目标图像时,连同快递面单一同拍摄到的部分快递包裹的图像像素,和/或,快递面单的背景图像像素等。这类无效像素会对后续处理造成干扰和影响。
在本实施例中,具体实施时,可以通过对目标图像进行诸如二值化处理、连通域处理等前景提取处理,来去除上述无效像素。
在本实施例中,通过先对目标图像进行前景提取处理去除掉无效像素,可以得到较为纯净的目标图像。这样后续再对该目标图像进行具体处理时,可以有效地减少无效像素引入的误差干扰,从而能够更加准确地从目标图像中确定出定位标志区域。
S703:根据所述定位标志区域,在所述目标图像中确定出目标识别区域。
在一些实施例中,可以根据定位标志区域,利用预先确定出的快递面单中目标识别区域与定位标志区域的位置相对关系,在目标图像中快速地确定出大概率可能包含有目标文本信息的目标识别区域。
在一些实施例中,上述根据所述定位标志区域,在所述目标图像中确定出目标识别区域,具体实施时,可以包括:根据所述定位标志区域的位置坐标(例如,定位标志区域的端点的位置坐标),和预设的变换位置矩阵,在所述目标图像中确定出目标识别区域的位置坐标。
其中,上述预设的变换位置矩阵具体可以包括一种通过对大量样本快递面单进行学习得到的,能表征快递面单中目标识别区域与定位标志区域的相对位置关系的参数数据。
在一些实施例中,具体实施前,可以先获取大量样本快递面单,确定并标注出各个样本快递面单中的定位标志区域,以及包含有目标文本信息的目标识别区域。再通过对上述大量标注后的样本快递面单中定位标志区域,和目标识别区域的位置分布特征进行统计分析,确定出样本快递面单中目标识别区域相对于定位标志区域的热力分布图。其中,上述热力分布图可以表征出快递面单中包含有目标文本信息的目标识别区域的所在位置与定位标志区域的所在位置之间的对应关系。例如,通过热力分布图可以反映出快递面单中相对于定位标志区域所在的位置,具有较大概率分布有目标识别区域的位置。此外,上述热力分布图还可以进一步反映出快递面单中目标识别区域的尺寸大小相对于定位标志区域的尺寸大小的对应关系。进一步,可以根据上述热力分布图确定出对应的预设的变换位置矩阵。并将上述预设的变换位置矩阵保存在终端设备本地。
在一些实施例中,具体实施时,可以将定位标志区域的位置坐标,代入上述预设的变换位置矩阵中;再通过计算,确定出目标识别区域的位置坐标,从而在目标图像中确定出目标识别区域。
S704:对所述目标识别区域进行光学字符识别,得到所述快递面单中的目标文本信息。
在一些实施例中,具体实施时,可以根据目标识别区域的位置坐标,从目标图像中抠取只包含有目标识别区域的图像;进而可以只针对该部分图像,在本地进行光学字符识别(例如OCR识别),提取得到目标识别区域中的目标文本信息。这样可以避免对目标图像整体进行光学字符识别,只需要针对目标图像中的目标识别区域单独进行光学字符识别,降低了所涉及到的数据处理量,缩短了识别处理时间,提高了处理效率。
在一些实施例中,具体实施时,可以调用预设的光学字符识别模型针对目标图像中的目标识别区域进行光学字符识别,以快速、准确地提取得到目标文本信息。其中,上述预设的光学字符识别模型具体可以是预先配置安装于终端设备本地的处理模型。
在一些实施例中,上述预设的光学字符别模型具体可以包括一种适用于终端设备的处理器,且较为轻量,能够在终端设备本地快速地对图像数据进行光学字符识别识别处理,提取图像中的文本信息的处理模型。
在一些实施例中,具体实施时,在对所述目标识别区域进行光学字符识别获取目标文本信息的同时;还可以结合相关的先验信息,通过模糊匹配等方式,来更加准确、高效地获得所述快递面单中的完整的目标文本信息。
在一些实施例中,上述相关的先验信息具体可以包括通过除光学字符识别以外其他的方式所获取得到的,与快递面单所指向的包裹相关的信息。
具体的,例如,当包裹已经到达浙江省杭州市,并准备进入物流配送阶段时。这时已经可以确定出该包裹的收件人的地址是浙江省杭州市的某个具体位置,即收件人的地址中的省市部分的信息是已经可以确定的了,可以作为一种先验信息。
在这种情况下,如果在进行光学字符识别时,由于受环境光线的影响,或者由于快递面单本身不完整,导致通过光学字符识别只能识别出了以下所示的不完整的目标文本信息:“浙X省XX市西溪园小区105号”。这时,可以结合上述先验信息,通过模糊匹配的方式,对上述通过光学字符识别所识别出的不完整的目标文本信息进行信息补全,得到以下所示的完整的目标文本信息:“浙江省杭州市西溪园小区105号”,作为最终得到的收件人的地址。从而可以高效地获取得到完整的目标文本信息。
在本实施例中,通过先获取并根据包含有快递面单的目标图像,找到目标图像中的定位标志区域;再以该定位标志区域作为定位参照,在目标图像中快速地确定出包含有目标文本信息的目标识别区域;进而可以在本地只针对目标图像中的该目标识别区域单独进行针对性的识别处理,快速地提取得到快递面单中的目标文本信息,从而可以在离线情况下,在终端设备本地以较低成本,快速、准确地识别提取出快递面单中的目标文本信息,减少了用户的等待时间,提高了用户的使用体验。
在一些实施例中,所述定位标志区域具体可以包括:条形码区域,和/或,二维码区域等。当然,上述所列举的定位标志区域只是一种示意性说明。具体实施时,根据具体情况,还可以包括其他类型的定位标志区域。例如,在一些场景中,上述定位标志区域也可以包括快递公司的logo标志区域等。
在一些实施例中,应用了上述快递面单的文本信息的获取方法的终端设备还可以通过有线或无线的方式与服务器相连。其中,上述服务器具体可以包括平台数据处理系统的云端服务器。
具体的,上述服务器还配置安装有预设的图像处理模型。其中,上述预设的图像处理模型可以包括一种适用于服务器,能够在服务器一侧较为精准地对图像数据进行图像识别处理,提取图像中的文本信息的处理模型。
相对于配置安装于终端设备本地的预设的光学字符识别模型,会涉及到更多维度的数据处理,能够对目标图像中的多种不同情况状态下的快递面单进行较为精准地识别处理,得到所需要的目标文本信息。相应的,上述预设的图像处理模型具体运行时会涉及到相对更多的数据处理量,占用更多的数据处理资源,同时对服务器的性能也会有相对较高的要求。
而预设的光学字符识别模型,相对于上述预设的图像处理模型,是一种较轻量的处理模型,具体运行时涉及到的数据处理量相对较少,所耗费的处理时间也相对较短,同时对终端设备的处理器的性能要求相对较低。相应的,通过上述预设的光学字符识别模型往往只对目标图像中满足预设的处理要求的快递面单具有较好的识别处理效果。
其中,上述满足预设的处理要求的快递面单具体可以包括在目标图像中的快递面单所呈现的倾斜程度(例如,扭曲、翻折的程度)相对较小,例如小于预设的倾斜程度阈值;且快递面单中的文本字符的尺寸参数相对较大,例如大于预设的尺寸阈值。其中,上述预设的倾斜程度阈值的具体数值,以及预设的尺寸阈值的具体数值可以根据具体情况,以及精度要求,灵活设置。
在一些实施例中,为了能够对目标图像进行较为准确的识别处理,以提取得到准确的目标文本信息,具体实施时,可以先对目标图像中的快递面单是否满足预设的处理要求进行判断。在确定目标图像中的快递面单满足预设的处理要求的情况下,可以确定后续利用预设的光学字符识别模型在本地处理该目标图像可以获得较好的识别处理效果。进而确定后续可以直接在终端设备本地,利用预设的光学字符识别模型对目标图像进行识别处理,以便能够较快速地从快递面单中提取得到目标文本信息。相对的,在确定目标图像中的快递面单不满足预设的处理要求的情况下,可以确定后续利用本地的预设的光学字符识别模型来处理该目标图像得到的识别处理效果往往不够理想。进而确定后续可以请求服务器,并通过服务器在服务器一侧利用预设的图像处理模型来对目标图像进行识别处理,以便能够较准确地从快递面单中提取得到目标文本信息。
在一些实施例中,具体实施时,可以结合快递面单中的排版布局的具体特点,利用定位标志区域来确定目标图像中的快递面单是否满足预设的处理要求。
在一些实施例中,在从所述目标图像中,确定出定位标志区域后,所述方法具体实施时,还可以包括以下内容:根据所述定位标志区域,确定所述目标图像所包含的快递面单是否满足预设的处理要求;其中,所述预设的处理要求包括:快递面单的倾斜程度小于预设的倾斜程度阈值,且快递面单中的文本字符的尺寸参数大于预设的尺寸阈值。
在一些实施例中,结合快递面单中的排版布局的具体特点,定位标志区域的轮廓图形往往是较为固定的。例如,正常状态的快递面单中的条形码区域的轮廓图形呈现为规则的矩形。但是,当快递面单发生褶皱等导致倾斜程度较大时,目标图像中快递面单上的条形码区域的轮廓图形也会随着发生改变,例如,会变形成一种类似菱形的形状。因此,可以通过判断定位标志区域的轮廓图形的形状是否发生改变,以及改变的程度是否较大,来判断目标图像中的快递面单的倾斜程度。
在一些实施例中,上述确定所述目标图像所包含的快递面单是否满足预设的处理要求,具体实施时,可以包括以下内容:获取定位标志区域的端点的位置坐标;根据所述端点的位置坐标,计算所述定位标志区域的区域边界的夹角;根据所述定位标志区域的区域边界的夹角,确定所述快递面单的倾斜程度是否小于预设的倾斜程度阈值。
在本实施例中,上述定位标志区域的端点具体可以包括定位标志区域的区域边界之间的交点。例如,以条形码区域作为定位标志区域为例,端点可以是矩形的4个顶点等。
在本实施例中,可以根据端点的位置坐标,将相邻的两个端点分别相连,得到围绕定位标志区域的多个区域边界。再计算相邻的区域边界之间的夹角,通过区域边界之间的夹角确定定位标志区域的轮廓图像的变形情况,进而确定出目标图像中快递面单的倾斜程度。
例如,以条形码区域作为定位标志区域为例,按照上述方式,可以得到4条区域边界,再根据端点的位置坐标,计算相邻的区域边界之间的夹角。在快递面单没有发生倾斜的情况下,相邻的区域边界是互相垂直的,夹角为90度。如果计算出的相邻的区域边界之间的夹角与90度相近,例如,为88度,则可以判断目标图像中的快递面单的倾斜程度较小,小于预设的倾斜程度阈值。相反,如果计算出的相邻的区域边界之间的夹角与90度差距较大,例如,为60度,则可以判断目标图像中的快递面单的倾斜程度较大,大于预设的倾斜程度阈值。当然,上述所列举的判断倾斜程度的方式只是一种示意性说明。具体实施时,根据定位标志区域的具体情况,还可以采用其他合适的方式来判断快递面单的倾斜程度。对此,本说明书不作限定。
在一些实施例中,结合快递面单中的排版布局的具体特点,通常在快递面单中,定位标志,例如,条形码的尺寸参数,与快递面单中的文本字符的尺寸参数之间的比值是一个固定值。因此,可以先在目标图像中确定出定位标志区域的尺寸参数,进而可以根据定位标志区域的尺寸参数来估算目标图像中快速面单中的文本字符的尺寸参数,再来判断快递面单中的文本字符的尺寸参数是否满足预设的处理要求。
在一些实施例中,上述确定所述目标图像所包含的快递面单是否满足预设的处理要求,具体实施时,还可以包括以下内容:获取定位标志区域的端点的位置坐标;根据所述定位标志区域的端点的位置坐标,计算所述定位标志区域的尺寸参数;根据所述定位标志区域的尺寸参数,以及预设的快递面单的排版规则,确定快递面单中的文本字符的尺寸参数;比较所述快递面单中的文本字符的尺寸参数,和预设的尺寸阈值,以确定所述快递面单中的文本字符是否大于所述预设的尺寸阈值。
在一些实施例中,上述预设的快递面单的排版规则中具体可以记载有快递面单中不同的定位标志区域尺寸参数与文本字符的尺寸参数之间的比值关系。
在一些实施例中,在确定所述目标图像所包含的快递面单不满足预设的处理要求的情况下,所述方法具体实施时,还可以包括以下内容:向服务器发送目标图像处理请求,其中,所述目标图像处理请求携带有所述目标图像,所述服务器配置有预设的图像处理模型;接收服务器反馈的目标文本信息,其中,所述服务器用于响应目标图像处理请求调用所述预设的图像处理模型对所述目标图像进行处理,以得到所述快递面单的目标文本信息。
在本实施例中,在确定目标图像中的快递面单不满足预设的处理要求的情况下,终端设备可以请求服务器,在服务器一侧利用预设的图像处理模型对目标图像进行具体的识别处理,从而能够较为准确地识别得到所需要的目标文本信息。
在一些实施例中,在确定所述目标图像所包含的快递面单满足预设的处理要求的情况下,终端设备可以在本地,直接利用本地的数据处理资源,对目标图像进行识别处理,以便能快速地从目标图像中提取出快递面单的目标文本信息,减少用户的等待时间。
在一些实施例中,终端设备具体实施时,可以先根据定位标志区域在目标图像中确定出大概率包含有目标文本信息的目标识别区域;进一步,可以只对目标图像中的目标识别进行识别处理,例如,光学字符识别处理,以获取目标文本信息。从而可以避免对目标图像中的所有图像区域都进行识别处理,有效地降低了数据处理量,提高了处理效率。
在一些实施例中,上述根据所述定位标志区域,在所述目标图像中确定出目标识别区域,具体实施时,可以包括以下内容:确定所述定位标志区域中的关键点的位置坐标;根据所述定位标志区域中的关键点的位置坐标,和预设的变换位置矩阵,在所述目标图像中确定出目标识别区域的位置坐标。
在本实施例中,上述关键点具体可以包括定位标志区域的端点,也可以包括定位标志区域的中心点等。具体实施时,根据具体情况,上述关键点还可以包括其他用于指示定位标志区域的点。
在一些实施例中,上述预设的变换位置矩阵具体可以是预先对大量的样本快递面单中的定位标志区域与目标识别区域之间的相互关系进行学习得到的。
在一些实施例中,具体的,所述预设的变换位置矩阵可以按照以下方式获取:获取多个样本快递面单;确定出所述多个样本快递面单中的各个样本快递面单的定位标志区域,以及包含有目标文本信息的目标识别区域;根据样本快递面单的定位标志区域,以及目标识别区域,得到样本快递面单中目标识别区域相对于定位标志区域的热力分布图;根据所述样本快递面单中目标识别区域相对于定位标志区域的热力分布图,确定所述预设的变换位置矩阵。
在本实施例中,上述热力分布图具体可以表征出快递面单中包含有目标文本信息的目标识别区域的所在位置与定位标志区域的所在位置之间的对应关系。例如,通过热力分布图可以反映出快递面单中相对于定位标志区域所在的位置,具有较大概率分布有目标识别区域的位置。此外,上述热力分布图还可以进一步反映出快递面单中目标识别区域的尺寸大小相对于定位标志区域的尺寸大小的对应关系。
在一些实施例中,上述预设的变换位置矩阵具体可以是由服务器预先按照上述方式对大量样本快递面单进行学习后所生成,再发送并保存于终端设备的。这样具体实施时,终端设备可以在本地直接使用上述变换位置矩阵来确定目标识别区域。
在一些实施例中,上述对所述目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息,具体实施时,可以包括以下内容:调用预设的光学字符识别模型,对目标图像中的目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息,其中,所述预设的光学字符识别模型包括配置于本地的光学字符识别模型。从而终端设备可以再与服务器进行交互,直接在终端设备本地针对目标图像中的目标识别区域进行光学字符识别,快速地提取得到快递面单中的目标文本信息。
在一些实施例中,根据具体情况,上述从所述目标图像中,确定出定位标志区域,具体实施时可以包括:从所述目标图像中,确定出多个定位标志区域。
在一些实施例中,在有些快递面单上会同时存在有多个相同的定位标志,进而在一个目标图像中,可能会同时确定出多个对应同一定位标志的定位标志区域。
具体的,例如,在一个快递面单中可以同时存在两个条形码,即主码(例如,快递面单中尺寸相对较大的条形码)和副码(例如,快递面单中尺寸相对较小的条形码)。相应的,在确定定位标志区域时,也会识别确定出两个不同类型的定位标志区域,包括:主码区域和副码区域。
在上述情况下,考虑到主码区域通常相对副码区域所占的图像更大,更容易辨识,因此,可以优先以主码区域这一类型的定位标志区域作为定位标志区域,再根据与主码区域对应的预设的变换位置矩阵来确定出目标识别区域。
在本实施例中,具体实施前,可以预先通过对大量样本快递面单的统计学习,建立多个预设的变换位置矩阵,其中,上述多个预设的变换位置矩阵可以分别对应一种定位标志区域。
在一些实施例中,在按照上述方式,在目标图像中确定出多个不同定位标志区域后,也可以先对多个定位标志区域的状态进行分析,从多个定位标志区域中筛选出状态相对较好,或较易于处理的定位标志区域作为用于确定目标识别区域的定位标志区域。例如,可以选择能够使得目标图像中的快递面单满足预设的处理要求的定位标志区域作为用于确定目标识别区域的定位标志区域。
在一些实施例中,在从所述目标图像中,确定出多个定位标志区域后,所述方法具体实施时,还可以包括以下内容:从所述多个定位标志区域中确定出使快递面单满足预设的处理要求的定位标志区域,作为目标定位标志区域;相应的,根据所述目标定位标志区域,在所述目标图像中确定出目标识别区域。从而可以根据具体情况,从多个定位标志区域中筛选出效果相对较好的定位标志区域作为定位参照,来较为准确地确定目标识别区域。
在一些实施例中,在从所述目标图像中,确定出多个定位标志区域后,所述方法具体实施时,还可以包括以下内容:确定所述多个定位标志区域中各个定位标志区域的类型;根据所述定位标志区域的类型,从所述多个定位标志区域中确定出一个类型符合要求的定位标志区域,作为目标定位标志区域。
在本实施例中,上述定位标志区域的类型具体可以包括基于所包含的定位标志进行分类所得到的定位标志区域的类型。具体的,例如,可以包括:包含有条形码的条形码区域、包含有二维码的二维码区域等等。进一步,针对包含有同一种定位标志的定位标志区域还可以根据该定位标志的位置、大小等因素进行进一步细分。例如,以条形码区域为例,条形码区域还可以包括:包含有相对较大的条形码的主码区域、包含有相对较小的条形码的副码区域等。当然,上述所列举的定位标志区域只是一种示意性说明。具体实施时,根据具体情况,定位标志区域还可以包括其他的类型。对此,本说明书不作限定。
在本实施例中,考虑到目标识别区域相对不同类型的定位标志区域的位置对应关系往往是不同的。因此,具体实施之前,可以根据大量样本快递面单,对目标识别区域相对多种不同类型的定位标识的位置对应关系进行统计分析,得到目标识别区域相对于多种不同定位标志区域的热力分布图。进而可以根据上述目标识别区域相对于多种不同定位标志区域的热力分布图,确定出分别对应多种不同类型的定位标志区域的多个预设的变换位置矩阵。
在本实施例中,具体实施时,可以根据所述定位标志区域的类型,从所述多个定位标志区域中确定出一个类型符合要求的定位标志区域,进而可以根据该定位标志区域的类型从多个预设的变换位置矩阵中找到与该定位标志区域的类型对应的预设的变换位置矩阵来确定目标识别区域。其中,上述类型符合要求的定位标志区域具体可以理解为应用时效果相对较好、准确率相对较高的类型的定位标志区域。例如,相对于二维码区域,条形码区域更符合要求,更适合作为定位标志区域。又例如,相对于条形码区域中的副码区域,主码区域更符合要求,更适合作为定位标志区域。这样后续可以更加准确地从目标图像中确定出目标识别区域。
在一些实施例中,所述目标文本信息具体可以包括以下至少之一:收件人的地址、收件人的电话号码、寄件人的电话号码、寄件人的地址等等。当然,需要说明的是,上述所列举的目标文本信息只是一种示意性说明。具体实施时,根据具体的场景需求,上述目标文本信息还可以包括其他类型的文本信息。例如,在需要对物流过程中的时间因素进行统计的场景中,上述目标文本信息还可以包括快递面单的打印时间等。
在一些实施例中,在对所述目标识别区域进行光学字符识别,得到所述快递面单中的目标文本信息后,还可以根据所得到的目标文本信息进行具体的数据处理。
例如,在目标文本信息包括收件人的电话号码的情况下,可以根据所识别得到的收件人的电话号码,生成并向收件人发送收件提示信息。
又例如,在目标文本信息包括收件人的地址的情况下,可以对所获取的历史上某一个时间段内打印的大量快递面单上的收件人的地址进行统计分析,确定出该时间段内发往不同城市的快递数量。进而可以根据上述数据预测该时间段不同城市的消费购物水平,为未来针对不同城市的购物促销活动提供参考。
在一些实施例中,考虑还可能出现部分样本快递面单的布局、排版与其他的样本快递面单会存在差异。例如,大量样本快递面单中有一部分的样本快递面单中的目标识别区域位于定位识别区域的左侧,而另一部分样本快递面单中的目标识别区域则位于定位识别区域的右侧。针对上述情况,在对大量样本快递面单进行学习后,可能确定出一个同时包含有多个可能成为目标识别区域的热力分布图。根据上述热力分布图,相应的地可以确定出分别对应多个可能为目标识别区域的预设的变换位置矩阵。进一步,可以根据热力分布图中不同目标识别区域的分布热度(其中,上述分布热度可以是包含有不同目标识别区域的样本快递面单的数量分别与样本快递面单总数的比值),将上述多个预设的变换位置矩阵按照所对应的目标识别区域的分布热度由高往低进行排序。
在根据定位标志区域确定目标识别区域时,可以先根据多个预设的变换位置矩阵在目标图像中确定出对应的多个目标识别区域。在对目标识别区域进行具体的识别处理时,可以根据预设的变换位置矩阵的排序,对基于排序第一的预设的变换位置矩阵得到的目标识别区域先进行光学字符识别。如果在该目标识别区域没有成功识别提取到目标文本信息,可以再对基于排序第二的预设的变换位置矩阵得到的目标识别区域再次进行光绪字符识别。以此类推,直到成功识别提取到了目标文本信息。
具体的,例如,可以参阅图8所示,根据定位标志区域,在目标图像中确定出了三个目标识别区域,记为:目标识别区域1,目标识别区域2和,目标识别区域3。其中,目标识别区域1是基于排序第一的预设的变换位置矩阵M所得到的,目标识别区域3是基于排序第二的预设的变换位置矩阵N所得到的,目标识别区域2则是基于排序第三的预设的变换位置矩阵P所得到的。进而,可以先通过本地预设的光学字符识别模型针对目标识别区域1进行光学字符识别,发现从该目标识别区域1中无法成功地提取到符合要求的目标文本信息。这时,可以接着通过本地预设的光学字符识别模型针对目标识别区域3进行光学字符识别,成功提取到了符合要求的目标文本信息。这时可以不再对目标识别区域2再浪费处理资源和处理时间进行光学字符识别。当然,具体实施时,也可以对上述目标识别区域1、目标识别区域2和目标识别区域3都进行光学字符识别,再从识别得到的多个文本信息中筛选出所需要的目标文本信息。
在一些实施例中,还考虑到不同快递公司的快递面单的排版、布局可能会存在差异。例如,A物流公司设计打印的快递面单中目标识别区域多位于定位标志区域的上方位置处,而B物流公司设计打印的快递面单中目标识别区域又多位于定位标志区域的下方位置处。针对上述情况,在获取了多个样本快递面单后,具体实施时,可以先确定出各个样本快递面单所属的快递公司,再根据快递公司,对多个样本快递面单进行分类,得到多个样本快递面单的类型组。其中,上述多个样本快递面单的类型组分别对应一个物流公司。进而可以分别对各个类型组进行学习,统计得到对应各个类型组中的样本快递面单中目标识别区域相对于定位标志区域的热力分布图。再根据上述热力分布图,确定出对应的多个预设的变换位置矩阵。其中,每一个预设的变换位置矩阵与一个快递公司对应。
在根据定位标志区域确定目标识别区域时,可以先确定出目标图像中的快递面单所属的快递公司。例如,可以从目标图像中提取出快递公司的logo图像;并根据该logo图像进行匹配,以确定出快递面单所属的快递公司。接着可以根据所述的快递公司,找到对应的预设的变换位置矩阵。再根据该预设的变换位置矩阵准确地从目标图像中确定出目标识别区域。
在一些实施例中,又考虑到有时目标图像中的快递面单实际上是发生了旋转的。例如,所拍摄的照片中,快递面单是颠倒的,即旋转了180度的。而条形码本身具有方向性,例如,条形码中所包括的起始符和终止符在没有发生旋转时是沿水平方向从左往右排列的。因此,可以利用条形码区域作为定标志区域,来确定目标图像中的快递面单是否发生旋转,以及具体的旋转角度。
具体实施时,在从目标图像中确定出条形码区域后,可以从条形码区域中检索获取到条形码的起始符和终止符,并确定出起始符和终止符在目标图像中的相对位置关系。根据起始符合终止符在目标图像中的相对位置关系,来判断条形码区域是否发生了旋转。在确定条形码区域发生旋转的情况下,进一步还可以根据上述起始符合终止符在目标图像中的相对位置关系确定出条形码区域的旋转角度。
在确定条形码区域发生旋转的情况下,可以确定出目标图像中的快递面单也发生了相同的旋转。为了后续能够更加精准地识别提取出快递面单中的目标文本信息,可以根据条形码区域的旋转角度,反向旋转目标图像,使得目标图像中的快递面单回复到正常的角度位置。进而后续可以根据旋转后的目标图像进行具体的识别处理,更加精准地从目标图像中识别提取到快递面单的目标文本信息。
在一些实施例中,所述方法具体实施时,还可以包括以下内容:保存目标文本信息获取失败的目标图像,作为更新图像;将所述更新图像发送至服务器,其中,所述服务器还用于根据所述更新图像对预设的变换位置矩阵进行更新,得到更新后的预设的变换位置矩阵;接收服务器反馈的更新后的预设的变换位置矩阵,作为预设的变换位置矩阵。
在本实施例中,终端设备在确定目标信息获取失败时,可能是由于基于当前保存在本地的预设的变换位置矩阵所确定出的目标识别区域不准确,不包含有要识别提取的目标文本信息。这时终端设备可以先向服务器发送目标图像数据处理请求,请求服务器调用预设的图像处理模型来对该目标图像进行具体的识别处理,以便成功地获取目标文本信息。
在本实施例中,终端设备还会将上述目标文本信息获取失败的目标图像保存在本地,并标注为更新图像。终端设备可以实时或定期向服务器反馈所保存的更新图像。服务器可以通过对上述更新图像的学习,对原有的预设的变换位置矩阵进行修改、补充等更新操作,得到更新后的预设的变换位置矩阵。并将上述更新后的预设的变换位置矩阵发送给终端设备。终端设备可以根据所接收到的更新后的预设的变换位置矩阵,更新本地使用的预设的变换位置矩阵,进而可以利用更新后的预设的变换位置矩阵,在本地更加精准地对目标图像进行识别处理。
在一些实施例中,在获取包含有快递面单的目标图像后,具体实施时,终端设备还可以先检测与服务器的连接状态,在确定与服务器连接中断,无法连接服务器时,可以按照本说明书提供的快递面单的文本信息的获取方法,在终端设备本地对目标图像进行具体的识别处理,以从目标图像中提取得到目标文本信息。
由上可见,本说明书实施例提供的快递面单的文本信息的获取方法,通过先获取并根据包含有快递面单的目标图像,找到目标图像中的定位标志区域;再以该定位标志区域作为定位参照,在目标图像中快速地确定出包含有目标文本信息的目标识别区域;进而可以在终端设备本地只对目标图像中的该目标识别区域单独进行针对性识别,提取得到快递面单中的目标文本信息,从而可以在终端设备本以较低成本,快速、准确地识别提取出快递面单中的目标文本信息。还通过充分利用快递面单中条形码区域的图形特点,以快递面单中的条形码区域作为定位标志区域,并利用上述条形码区域来判断目标图像中的快递面单是否满足预设的处理要求,在确定目标图像中的快递面单满足预设的处理要求时,再确定可以在终端设备本地对目标图像进行识别处理来获取快递面单中的目标文本信息,从而提高了获取目标文本信息的准确度。还通过预先对大量样本快递面单进行统计学习,确定出目标识别区域相对于定位标志区域的热力分布图,再根据上述热力分布图确定出对应的预设的变换位置矩阵,进而在具体实施时,可以利用上述预设的变换位置矩阵,以较容易识别确定出的定位标志区域作为定位参照,在目标图像中准确、快速地确定出大概率包含有目标文本信息的目标识别区域,提高了整体的处理效率。还通过将配置于服务器一侧的预设的图像处理模型,和配置于终端设备本地的预设的光学字符识别模型组合,针对包含不同情况的快递面单的目标图像利用对应合适的模型来进行识别处理,获取目标文本信息,从而能够兼顾不同情况,高效、准确地从目标图像中识别提取到快递面单的目标文本信息。
本说明书实施例还提供了另一种快递面单的文本信息的获取方法。其中,该方法具体应用于终端设备一侧。该方法具体实施时,可以包括以下内容。
S1:获取包含有快递面单的目标图像。
S2:从所述目标图像中,确定出定位标志区域。
S3:根据所述定位标志区域,确定所述目标图像中的快递面单是否满足预设的处理要求。
S4:在确定所述目标图像中的快递面单满足预设的处理要求的情况下,根据所述定位标志区域,在所述目标图像中确定出目标识别区域。
S5:对所述目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息。
在一些实施例中,上述定位标志区域具体可以包括包含有条形码的条形区域,也可以包括包含有二维码的二维码区域等等。
在一些实施例中,考虑到终端设备本地处理资源、处理器性能等相对有限,往往针对包含有符合预设要求的快递面单的目标图像具有较好的识别处理效果。为了能够较为准确地对目标图像进行识别处理,以提取到目标文本信息,具体实施时,可以先对目标图像中的快递面单是否满足预设的处理要求进行检测判断,在确定目标图像中的快递面单满足预设的处理要求的情况下,再通过终端设备在本地直接对目标图像进行具体的识别处理,以快速地提取得到目标文本信息。
在一些实施例中,在确定所述目标图像中的快递面单不满足预设的处理要求的情况下,所述方法具体实施时,还可以包括以下内容:向服务器发送目标图像处理请求,其中,所述目标图像处理请求携带有所述目标图像,所述服务器配置有预设的图像处理模型;接收服务器反馈的目标文本信息,其中,所述服务器用于响应目标图像处理请求调用所述预设的图像处理模型对所述目标图像进行光学字符识别,以得到所述快递面单的目标文本信息。
在一些实施例中,上述对所述目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息,具体实施时,可以包括以下内容:调用预设的光学字符识别模型,在本地对目标图像中的目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息。
在本实施例中,上述预设的光学字符识别模型具体可以预先配置安装于终端设备本地。通过上述预设的光学字符识别模型可以对包含有满足预设的处理要求的快递面单进行较为准确的识别处理,以从快递面单中提取到目标文本信息。当然,上述所列举的利用预设的光学字符识别模型在终端设备本地获取目标文本信息的方式只是一种示意性说明。具体实施时,根据具体情况,也可以采用其他合适的方式在终端设备本地对目标图像进行目标文本信息的获取。
在一些实施例中,上述根据所述定位标志区域,在所述目标图像中确定出目标识别区域,具体实施时,可以包括以下内容:确定出所述定位标志区域中的关键点的位置坐标;根据所述定位标志区域中的关键点的位置坐标,和预设的变换位置矩阵,在所述目标图像中确定出目标识别区域的位置坐标。从而可以以定位标志区域作为定位参照,利用预设的变换位置矩阵快速地在目标图像中确定出可能包含有目标文本信息的目标识别区域。
在一些实施例中,在获取包含有快递面单的目标图像后,所述方法具体实施时,还可以包括:对所述目标图像进行前景提取处理。从而可以消除目标图像中的无效像素,减少无效像素在后续识别处理过程中引入的干扰。
在一些实施例中,所述目标文本信息具体可以包括收件人的电话号码等。当然,上述所列举的目标文本信息只是一种示意性说明。具体实施时,根据具体情况,上述目标文本信息还可以包括收件人的地址、寄件人的姓名等多种其他类型的文本信息。
在一些实施例中,在对所述目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息后,所述方法具体实施时,还可以包括以下内容:根据所述收件人的电话号码,向收件人发送收件提示信息。从而可以帮助快递员在派送包裹时,及时提醒收件人取件。
本说明书实施例还提供了另一种目标文件的目标文本信息的获取方法。该方法具体实施时,可以包括以下内容。
S1:获取包含有目标文件的目标图像,其中,所述目标文件按照预设格式排版。
S2:从所述目标图像中,确定出定位标志区域。
S3:根据所述定位标志区域,在所述目标图像中确定出目标识别区域。
S4:对所述目标识别区域进行光学字符识别,得到所述目标文件中的目标文本信息。
在一些实施例中,上述目标文件具体可以包括按照预设格式排版的文件。通常在同一种目标文件中包含不同文本信息的区域的分布位置、区域大小等属性是根据预设格式固定的。
在一些实施例中,上述目标文件具体可以包括:账单、报表、发票等等。当然,上述所列举的目标文件只是一种示意性说明。具体实施时,根据具体情况,上述目标文件还可以包括其他按照预设格式排版的文件。例如,快递面单、身份证、商品标签等等。相应的,所要识别获取的目标文本信息具体还可以是身份证上的身份证编号,也可以是账单上的支付总额,还可以是商品标签上的品牌标识等等。对此,本说明书不作限定。
在一些实施例中,具体实施时,可以根据定位标志区域,结合预设的布局模板(或者能够反映预设的布局模板中目标识别区域和定位标志区域的相对关系的参数数据,例如,预设的变换位置矩阵),在目标图像中确定出包含有待提取的目标文本信息的目标识别区域。
在一些实施例中,上述预设的布局模板具体可以是预先对大量样本目标文件中目标识别区域和定位标志区域相互之间的对应关系进行学习、统计后得到的。
具体的,可以获取多个样本目标文件;确定出所述多个样本目标文件中的各个样本目标文件的定位标志区域,以及包含有目标文本信息的目标识别区域;统计样本目标文件的定位标志区域,以及目标识别区域在目标文件中的分布情况,得到样本目标文件中目标识别区域相对于定位标志区域的热力分布图;再根据所述样本目标文件中目标识别区域相对于定位标志区域的热力分布图,确定针对这类目标文件的预设的布局模板。
在一些实施例中,具体实施时,可以从目标图像中抠取出目标识别区域,进而只针对目标图像中的目标识别区域进行光学字符识别,从而能快速、准确地获取到目标文本信息。
本说明书实施例还提供一种终端设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取包含有快递面单的目标图像;从所述目标图像中,确定出定位标志区域;根据所述定位标志区域,在所述目标图像中确定出目标识别区域;对所述目标识别区域进行光学字符识别,得到所述快递面单中的目标文本信息。
为了能够更加准确地完成上述指令,参阅图9所示,本说明书实施例还提供了另一种具体的终端设备,其中,所述终端设备包括网络通信端口、处理器以及存储器,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口,具体可以用于获取包含有快递面单的目标图像。
所述处理器,具体可以用于从所述目标图像中,确定出定位标志区域;根据所述定位标志区域,在所述目标图像中确定出目标识别区域;对所述目标识别区域进行光学字符识别,得到所述快递面单中的目标文本信息。
所述存储器,具体可以用于存储相应的指令程序。
在本实施例中,所述网络通信端口可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的80号端口,也可以是负责进行FTP数据通信的21号端口,还可以是负责进行邮件数据通信的25号端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
在一些实施例中,上述终端设备具体还可以包括摄像头等设备,用于通过以拍照的方式获取包含有快递面单的照片作为目标图像。
在一些实施例中,上述终端设备具体可以包括快递柜、快递扫描枪、手机等等。当然,上述所列举的终端设备只是一种示意性说明。具体实施时,根据具体的应用场景,上述终端设备还可以包括其他类型的电子设备。对此,本说明书不作限定。
本说明书实施例还提供了一种基于上述快递面单的文本信息的获取方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取包含有快递面单的目标图像;从所述目标图像中,确定出定位标志区域;根据所述定位标志区域,在所述目标图像中确定出目标识别区域;对所述目标识别区域进行光学字符识别,得到所述快递面单中的目标文本信息。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
参阅图10所示,在软件层面上,本说明书实施例还提供了一种快递面单的文本信息的获取装置,该装置具体可以包括以下的结构模块。
获取模块1001,具体可以用于获取包含有快递面单的目标图像;
第一确定模块1002,具体可以用于从所述目标图像中,确定出定位标志区域;
第二确定模块1003,具体可以用于根据所述定位标志区域,在所述目标图像中确定出目标识别区域;
识别模块1004,具体可以用于对所述目标识别区域进行光学字符识别,得到所述快递面单中的目标文本信息。
在一些实施例中,所述定位标志区域具体可以包括:条形码区域,和/或,二维码区域等。
在一些实施例中,所述装置具体还可以包括检测模块,具体实施时,可以用于根据所述定位标志区域,确定所述目标图像所包含的快递面单是否满足预设的处理要求;其中,所述预设的处理要求包括:快递面单的倾斜程度小于预设的倾斜程度阈值,且快递面单中的文本字符的尺寸参数大于预设的尺寸阈值。
在一些实施例中,所述检测模块具体实施时,可以用于获取定位标志区域的端点的位置坐标;根据所述端点的位置坐标,计算所述定位标志区域的区域边界的夹角;根据所述定位标志区域的区域边界的夹角,确定所述快递面单的倾斜程度是否小于预设的倾斜程度阈值。
在一些实施例中,所述检测模块具体实施时,可以用于获取定位标志区域的端点的位置坐标;根据所述定位标志区域的端点的位置坐标,计算所述定位标志区域的尺寸参数;根据所述定位标志区域的尺寸参数,以及预设的快递面单的排版规则,确定快递面单中的文本字符的尺寸参数;比较所述快递面单中的文本字符的尺寸参数,和预设的尺寸阈值,以确定所述快递面单中的文本字符是否大于所述预设的尺寸阈值。
在一些实施例中,所述装置具体还可以包括收发模块,具体实施时,可以用于在确定所述目标图像所包含的快递面单不满足预设的处理要求的情况下,向服务器发送目标图像处理请求,其中,所述目标图像处理请求携带有所述目标图像,所述服务器配置有预设的图像处理模型;接收服务器反馈的目标文本信息,其中,所述服务器用于响应目标图像处理请求调用所述预设的图像处理模型对所述目标图像进行处理,以得到所述快递面单的目标文本信息。
在一些实施例中,上述第二确定模块1003具体实施时,可以用于确定所述定位标志区域中的关键点的位置坐标;根据所述定位标志区域中的关键点的位置坐标,和预设的变换位置矩阵,在所述目标图像中确定出目标识别区域的位置坐标。
在一些实施例中,所述装置具体还可以包括学习模块,具体可以用于预先获取多个样本快递面单;确定出所述多个样本快递面单中的各个样本快递面单的定位标志区域,以及包含有目标文本信息的目标识别区域;根据样本快递面单的定位标志区域,以及目标识别区域,得到样本快递面单中目标识别区域相对于定位标志区域的热力分布图;根据所述样本快递面单中目标识别区域相对于定位标志区域的热力分布图,确定所述预设的变换位置矩阵。
在一些实施例中,上述识别模块1004具体实施时,可以用于调用预设的光学字符识别模型,对目标图像中的目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息,其中,所述预设的光学字符识别模型包括配置于本地的光学字符识别模型。
在一些实施例中,所述目标文本信息具体可以包括以下至少之一:收件人的地址、收件人的电话号码、寄件人的电话号码、寄件人的地址等。
在一些实施例中,上述装置具体还可以包括更新模块,具体可以用于保存目标文本信息获取失败的目标图像,作为更新图像;将所述更新图像发送至服务器,其中,所述服务器还用于根据所述更新图像对预设的变换位置矩阵进行更新,得到更新后的预设的变换位置矩阵;接收服务器反馈的更新后的预设的变换位置矩阵,作为预设的变换位置矩阵。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
由上可见,本说明书实施例提供的快递面单的文本信息的获取装置,可以在终端设备本以较低成本,快速、准确地识别提取出快递面单中的目标文本信息。
本说明书实施例还提供了另一种快递面单的文本信息的获取装置,具体可以包括以下结构模块:获取模块,具体可以用于获取包含有快递面单的目标图像;第一确定模块,具体可以用于从所述目标图像中,确定出定位标志区域;检测模块,具体可以用于根据所述定位标志区域,确定所述目标图像中的快递面单是否满足预设的处理要求;第二确定模块,具体可以用于在确定所述目标图像中的快递面单满足预设的处理要求的情况下,根据所述定位标志区域,在所述目标图像中确定出目标识别区域;识别模块,具体可以用于对所述目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息。
本说明书实施例还提供了一种目标文件的目标文本信息的获取装置,具体可以包括以下结构模块:获取模块,具体可以用于获取包含有目标文件的目标图像,其中,所述目标文件按照预设格式排版;第一确定模块,具体可以用于从所述目标图像中,确定出定位标志区域;第二确定模块,具体可以用于根据所述定位标志区域,在所述目标图像中确定出目标识别区域;识别模块,具体可以用于对所述目标识别区域进行光学字符识别,得到所述目标文件中的目标文本信息。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域技术人员知道,本说明书有许多变形而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
Claims (27)
1.一种快递面单的文本信息的获取方法,包括:
获取包含有快递面单的目标图像;
从所述目标图像中,确定出定位标志区域;
根据所述定位标志区域,在所述目标图像中确定出目标识别区域;包括:根据所述定位标志区域的位置坐标和预设的变换位置矩阵,在所述目标图像中确定出目标识别区域的位置坐标;其中,所述预设的变换位置矩阵为预先根据通过对大量样本快递面单中的定位标志区域和目标识别区域的位置分布特征进行统计分析所得到的热力分布图所确定得到的;
对所述目标识别区域进行光学字符识别,得到所述快递面单中的目标文本信息。
2.根据权利要求1所述的方法,所述定位标志区域包括:条形码区域,和/或,二维码区域。
3.根据权利要求2所述的方法,在从所述目标图像中,确定出定位标志区域后,所述方法还包括:
根据所述定位标志区域,确定所述目标图像所包含的快递面单是否满足预设的处理要求;其中,所述预设的处理要求包括:快递面单的倾斜程度小于预设的倾斜程度阈值,且快递面单中的文本字符的尺寸参数大于预设的尺寸阈值。
4.根据权利要求3所述的方法,确定所述目标图像所包含的快递面单是否满足预设的处理要求,包括:
获取定位标志区域的端点的位置坐标;
根据所述端点的位置坐标,计算所述定位标志区域的区域边界的夹角;
根据所述定位标志区域的区域边界的夹角,确定所述快递面单的倾斜程度是否小于预设的倾斜程度阈值。
5.根据权利要求4所述的方法,确定所述目标图像所包含的快递面单是否满足预设的处理要求,还包括:
根据所述定位标志区域的端点的位置坐标,计算所述定位标志区域的尺寸参数;
根据所述定位标志区域的尺寸参数,以及预设的快递面单的排版规则,确定快递面单中的文本字符的尺寸参数;
比较所述快递面单中的文本字符的尺寸参数,和预设的尺寸阈值,以确定所述快递面单中的文本字符是否大于所述预设的尺寸阈值。
6.根据权利要求3所述的方法,在确定所述目标图像所包含的快递面单不满足预设的处理要求的情况下,所述方法还包括:
向服务器发送目标图像处理请求,其中,所述目标图像处理请求携带有所述目标图像,所述服务器配置有预设的图像处理模型;
接收服务器反馈的目标文本信息,其中,所述服务器用于响应目标图像处理请求调用所述预设的图像处理模型对所述目标图像进行处理,以获取所述快递面单的目标文本信息。
7.根据权利要求1所述的方法,根据所述定位标志区域,在所述目标图像中确定出目标识别区域,包括:
确定所述定位标志区域中的关键点的位置坐标;
根据所述定位标志区域中的关键点的位置坐标,和预设的变换位置矩阵,在所述目标图像中确定出目标识别区域的位置坐标。
8.根据权利要求7所述的方法,所述预设的变换位置矩阵按照以下方式获取:
获取多个样本快递面单;
确定出所述多个样本快递面单中的各个样本快递面单的定位标志区域,以及包含有目标文本信息的目标识别区域;
根据样本快递面单的定位标志区域,以及目标识别区域,得到样本快递面单中目标识别区域相对于定位标志区域的热力分布图;
根据所述样本快递面单中目标识别区域相对于定位标志区域的热力分布图,确定所述预设的变换位置矩阵。
9.根据权利要求1所述的方法,对所述目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息,包括:
调用预设的光学字符识别模型,对目标图像中的目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息,其中,所述预设的光学字符识别模型包括配置于本地的光学字符识别模型。
10.根据权利要求1所述的方法,从所述目标图像中,确定出定位标志区域,包括:
从所述目标图像中,确定出多个定位标志区域。
11.根据权利要求10所述的方法,在从所述目标图像中,确定出多个定位标志区域后,所述方法还包括:
从所述多个定位标志区域中确定出使快递面单满足预设的处理要求的定位标志区域,作为目标定位标志区域;
相应的,根据所述目标定位标志区域,在所述目标图像中确定出目标识别区域。
12.根据权利要求10所述的方法,在从所述目标图像中,确定出多个定位标志区域后,所述方法还包括:
确定所述多个定位标志区域中各个定位标志区域的类型;
根据所述定位标志区域的类型,从所述多个定位标志区域中确定出一个类型符合要求的定位标志区域,作为目标定位标志区域。
13.根据权利要求1所述的方法,所述目标文本信息包括以下至少之一:收件人的地址、收件人的电话号码、寄件人的电话号码、寄件人的地址。
14.根据权利要求1所述的方法,所述方法还包括:
保存目标文本信息获取失败的目标图像,作为更新图像;
将所述更新图像发送至服务器,其中,所述服务器还用于根据所述更新图像对预设的变换位置矩阵进行更新,得到更新后的预设的变换位置矩阵;
接收服务器反馈的更新后的预设的变换位置矩阵。
15.一种快递面单的文本信息的获取方法,包括:
获取包含有快递面单的目标图像;
从所述目标图像中,确定出定位标志区域;
根据所述定位标志区域,确定所述目标图像中的快递面单是否满足预设的处理要求;
在确定所述目标图像中的快递面单满足预设的处理要求的情况下,根据所述定位标志区域,在所述目标图像中确定出目标识别区域;包括:根据所述定位标志区域的位置坐标和预设的变换位置矩阵,在所述目标图像中确定出目标识别区域的位置坐标;其中,所述预设的变换位置矩阵为预先根据通过对大量样本快递面单中的定位标志区域和目标识别区域的位置分布特征进行统计分析所得到的热力分布图所确定得到的;
对所述目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息。
16.根据权利要求15所述的方法,在确定所述目标图像中的快递面单不满足预设的处理要求的情况下,所述方法还包括:
向服务器发送目标图像处理请求,其中,所述目标图像处理请求携带有所述目标图像,所述服务器配置有预设的图像处理模型;
接收服务器反馈的目标文本信息,其中,所述服务器用于响应所述目标图像处理请求,调用所述预设的图像处理模型对所述目标图像进行处理,得到所述快递面单的目标文本信息。
17.根据权利要求15所述的方法,对所述目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息,包括:
调用预设的光学字符识别模型,在本地对目标图像中的目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息。
18.根据权利要求15所述的方法,根据所述定位标志区域,在所述目标图像中确定出目标识别区域,包括:
确定出所述定位标志区域中的关键点的位置坐标;
根据所述定位标志区域中的关键点的位置坐标,和预设的变换位置矩阵,在所述目标图像中确定出目标识别区域的位置坐标。
19.根据权利要求15所述的方法,在获取包含有快递面单的目标图像后,所述方法还包括:
对所述目标图像进行前景提取处理。
20.根据权利要求15所述的方法,所述目标文本信息包括收件人的电话号码。
21.根据权利要求20所述的方法,在对所述目标识别区域进行光学字符识别,得到所述快递面单上的目标文本信息后,所述方法还包括:
根据所述收件人的电话号码,向收件人发送收件提示信息。
22.一种目标文件的目标文本信息的获取方法,包括:
获取包含有目标文件的目标图像,其中,所述目标文件按照预设格式排版;
从所述目标图像中,确定出定位标志区域;
根据所述定位标志区域,在所述目标图像中确定出目标识别区域;包括:根据所述定位标志区域的位置坐标和预设的变换位置矩阵,在所述目标图像中确定出目标识别区域的位置坐标;其中,所述预设的变换位置矩阵为预先根据通过对大量样本文件中的定位标志区域和目标识别区域的位置分布特征进行统计分析所得到的热力分布图所确定得到的;
对所述目标识别区域进行光学字符识别,得到所述目标文件中的目标文本信息。
23.根据权利要求22所述的方法,所述目标文件包括以下至少之一:身份证、商品标签、账单。
24.一种快递面单的文本信息的获取装置,包括:
获取模块,用于获取包含有快递面单的目标图像;
第一确定模块,用于从所述目标图像中,确定出定位标志区域;
第二确定模块,用于根据所述定位标志区域,在所述目标图像中确定出目标识别区域;其中,第二确定模块具体用于根据所述定位标志区域的位置坐标和预设的变换位置矩阵,在所述目标图像中确定出目标识别区域的位置坐标;其中,所述预设的变换位置矩阵为预先根据通过对大量样本快递面单中的定位标志区域和目标识别区域的位置分布特征进行统计分析所得到的热力分布图所确定得到的;
识别模块,用于对所述目标识别区域进行光学字符识别,得到所述快递面单中的目标文本信息。
25.一种终端设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至14中任一项所述方法的步骤。
26.根据权利要求25所述的终端设备,所述终端设备包括以下至少之一:快递柜、快递扫描枪、手机。
27.一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现权利要求1至14中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010342791.1A CN113642352B (zh) | 2020-04-27 | 2020-04-27 | 快递面单的文本信息的获取方法、装置和终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010342791.1A CN113642352B (zh) | 2020-04-27 | 2020-04-27 | 快递面单的文本信息的获取方法、装置和终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113642352A CN113642352A (zh) | 2021-11-12 |
CN113642352B true CN113642352B (zh) | 2023-12-19 |
Family
ID=78414921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010342791.1A Active CN113642352B (zh) | 2020-04-27 | 2020-04-27 | 快递面单的文本信息的获取方法、装置和终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113642352B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443538A (zh) * | 2019-06-20 | 2019-11-12 | 苏州视印智能系统有限公司 | 一种收件自动信息识别系统及方法 |
CN114627459A (zh) * | 2020-12-14 | 2022-06-14 | 菜鸟智能物流控股有限公司 | Ocr识别方法、识别装置和识别系统 |
CN114898386A (zh) * | 2022-05-09 | 2022-08-12 | 深圳前海百递网络有限公司 | 电子面单内号码提取及类别判断方法及相关组件 |
CN117373053A (zh) * | 2022-06-27 | 2024-01-09 | 北京京东振世信息技术有限公司 | 面单识别方法、装置和系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567983A (zh) * | 2010-12-26 | 2012-07-11 | 浙江大立科技股份有限公司 | 即时红外热图中被监测目标位置的确定方法及应用 |
CN105809158A (zh) * | 2014-12-29 | 2016-07-27 | 张继锋 | 包裹单、包裹单的信息识别方法及其识别系统 |
CN107341523A (zh) * | 2017-07-13 | 2017-11-10 | 浙江捷尚视觉科技股份有限公司 | 基于深度学习的快递单信息识别方法和系统 |
WO2017193839A1 (zh) * | 2016-05-11 | 2017-11-16 | 山东新北洋信息技术股份有限公司 | 快递面单打印方法、装置及系统 |
CN109308476A (zh) * | 2018-09-06 | 2019-02-05 | 邬国锐 | 票据信息处理方法、系统及计算机可读存储介质 |
CN109459032A (zh) * | 2018-12-04 | 2019-03-12 | 北京艾瑞思机器人技术有限公司 | 移动机器人定位方法、导航方法和网格地图建立方法 |
CN110017841A (zh) * | 2019-05-13 | 2019-07-16 | 大有智能科技(嘉兴)有限公司 | 视觉定位方法及其导航方法 |
WO2019161615A1 (zh) * | 2018-02-23 | 2019-08-29 | 平安科技(深圳)有限公司 | 账单录入方法、系统、光学字符识别服务器和存储介质 |
CN110673886A (zh) * | 2018-07-03 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 用于生成热力图的方法和装置 |
CN110727754A (zh) * | 2019-10-11 | 2020-01-24 | 北京旷视机器人技术有限公司 | 货架热力图的生成方法、装置及电子设备 |
JP2020016946A (ja) * | 2018-07-23 | 2020-01-30 | 日本生命保険相互会社 | 情報処理装置、情報処理方法、プログラム及び帳票読取システム |
-
2020
- 2020-04-27 CN CN202010342791.1A patent/CN113642352B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567983A (zh) * | 2010-12-26 | 2012-07-11 | 浙江大立科技股份有限公司 | 即时红外热图中被监测目标位置的确定方法及应用 |
CN105809158A (zh) * | 2014-12-29 | 2016-07-27 | 张继锋 | 包裹单、包裹单的信息识别方法及其识别系统 |
WO2017193839A1 (zh) * | 2016-05-11 | 2017-11-16 | 山东新北洋信息技术股份有限公司 | 快递面单打印方法、装置及系统 |
CN107341523A (zh) * | 2017-07-13 | 2017-11-10 | 浙江捷尚视觉科技股份有限公司 | 基于深度学习的快递单信息识别方法和系统 |
WO2019161615A1 (zh) * | 2018-02-23 | 2019-08-29 | 平安科技(深圳)有限公司 | 账单录入方法、系统、光学字符识别服务器和存储介质 |
CN110673886A (zh) * | 2018-07-03 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 用于生成热力图的方法和装置 |
JP2020016946A (ja) * | 2018-07-23 | 2020-01-30 | 日本生命保険相互会社 | 情報処理装置、情報処理方法、プログラム及び帳票読取システム |
CN109308476A (zh) * | 2018-09-06 | 2019-02-05 | 邬国锐 | 票据信息处理方法、系统及计算机可读存储介质 |
CN109459032A (zh) * | 2018-12-04 | 2019-03-12 | 北京艾瑞思机器人技术有限公司 | 移动机器人定位方法、导航方法和网格地图建立方法 |
CN110017841A (zh) * | 2019-05-13 | 2019-07-16 | 大有智能科技(嘉兴)有限公司 | 视觉定位方法及其导航方法 |
CN110727754A (zh) * | 2019-10-11 | 2020-01-24 | 北京旷视机器人技术有限公司 | 货架热力图的生成方法、装置及电子设备 |
Non-Patent Citations (4)
Title |
---|
Location correction technique based on mobile communication base station for earthquake population heat map;Xiaoli Liu 等;《Geodesy and Geodynamics》;第9卷(第5期);388-397 * |
快递单扫描图像中的用户手写信息区域的定位与处理;刘鸣 等;《电脑知识与技术》;第8卷(第32期);7819-7821第2-3节 * |
自适应最小误差阈值分割算法;龙建武;《自动化学报》;第38卷(第7期);1134-1144 * |
面向视频监控场景的目标空间结构语义感知;张亚庆;《中国博士学位论文全文数据库 信息科技辑》(第6期);I136-24 * |
Also Published As
Publication number | Publication date |
---|---|
CN113642352A (zh) | 2021-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113642352B (zh) | 快递面单的文本信息的获取方法、装置和终端设备 | |
US11055524B2 (en) | Data extraction pipeline | |
CN112699775B (zh) | 基于深度学习的证件识别方法、装置、设备及存储介质 | |
CN103927387A (zh) | 图像检索系统及其相关方法和装置 | |
CN102375969A (zh) | 用于文档处理的系统和方法 | |
CN111310706B (zh) | 一种商品价签识别方法及装置、电子设备、存储介质 | |
WO2015062275A1 (en) | Method, apparatus and system for information identification | |
US20230123879A1 (en) | Method and apparatus for positioning express parcel | |
CN116052202A (zh) | 物流单据图像提取方法及其装置、设备、介质、产品 | |
CN110782204B (zh) | 一种订单快速出库的方法 | |
CN115731554A (zh) | 快件面单识别方法、装置、计算机设备及存储介质 | |
US10552491B2 (en) | Systems, devices, and methods for computing geographical relationships between objects | |
CN114494751A (zh) | 证照信息识别方法、装置、设备及介质 | |
CN115830604A (zh) | 面单图像矫正方法、装置、电子设备及可读存储介质 | |
CN113538291A (zh) | 卡证图像倾斜校正方法、装置、计算机设备和存储介质 | |
CN112183679A (zh) | 定位电子价签的方法、客户端、服务器及系统 | |
CN115512453A (zh) | 一种货物验收方法、系统、电子设备及介质 | |
CN111814876A (zh) | 一种票据识别方法、装置、设备及存储介质 | |
CN113902398A (zh) | 资产盘点系统、方法、计算机装置和存储介质 | |
CN114359918A (zh) | 提货单信息提取方法、装置及计算机设备 | |
WO2021159313A1 (zh) | 电子标签、物品绑定方法、装置、设备及存储介质 | |
CN112749591B (zh) | 仓储物流机器人及其物品识别方法和芯片 | |
CN105051723A (zh) | 包装件的识别 | |
CN116931848B (zh) | 一种基于标签识别的打印机管理方法以及服务器 | |
CN114240525A (zh) | 报文生成方法、装置和服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |