CN110489747A

CN110489747A - 一种图像处理方法、装置、存储介质及电子设备

Info

Publication number: CN110489747A
Application number: CN201910704473.2A
Authority: CN
Inventors: 赵明明; 刘立真; 谢文珍
Original assignee: Beijing Dami Technology Co Ltd
Current assignee: Beijing Dami Technology Co Ltd
Priority date: 2019-07-31
Filing date: 2019-07-31
Publication date: 2019-11-22

Abstract

本申请实施例公开了一种图像处理方法、装置、存储介质及服务器，其中，方法包括获取包含有文本内容的图像，所述图像基于业务请求产生，对所述图像进行识别，得到所述图像中的所述文本内容，提取所述文本内容的第一语义特征信息，基于所述第一语义特征信息与所述业务请求对应的标准文本的第二语义特征信息进行分析处理，基于分析处理结果，确定所述业务申请是否通过。采用本申请实施例，可以保证业务审核的准确率，提高业务审核的处理效率。

Description

一种图像处理方法、装置、存储介质及电子设备

技术领域

本申请涉及计算机技术领域，尤其涉及一种图像处理方法、装置、存储介质及电子设备。

背景技术

在应用中，会存在对图像中所包含的内容进行审核的情况，基于对图像中所含内容的审核，决定相应的操作，例如：在业务审批过程中，业务请求方可以上传有关图像，基于对图像的识别，决定是否批准其请求。又如，在在线教学的过程中，学生和老师可以通过在线教育系统完成远程教学的内容，例如：老师可以通过在线教育系统向学生布置教学的作业，学生在完成作业后，可以将包含本次作业的图像(例如作业照片、作业截图等)上传到在线教育系统并发起业务审核(作业批改)，以请求确认作业完成、获得相应的成绩和/或获得奖励(如积分、评语等)；等等。目前，面对业务审核请求时，采用人工审核的方式，会存在效率低、识别准确率低等问题；而采用图像对比(即将截图与已有的图片的比较)的方式处理业务请求，也会存在处理结果不准确的问题。

发明内容

本申请实施例提供了一种图像处理方法、装置、存储介质及服务器，可以保证业务审核的准确率，提高业务审核的处理效率。所述技术方案如下：

第一方面，本申请实施例提供了一种图像处理方法，所述方法包括：

获取包含有文本内容的图像，所述图像基于业务请求产生；

对所述图像进行识别，得到所述图像中的所述文本内容；

提取所述文本内容的第一语义特征信息；

基于所述第一语义特征信息与所述业务请求对应的标准文本的第二语义特征信息进行分析处理；

基于分析处理结果，确定所述业务申请是否通过。

第二方面，本申请实施例提供了一种图像处理装置，所述装置包括：

图像获取模块，用于获取包含有文本内容的图像，所述图像基于业务请求产生；

图像识别模块，用于对所述图像进行识别，得到所述图像中的所述文本内容；

特征提取模块，用于提取所述文本内容的第一语义特征信息；

分析处理模块，用于基于所述第一语义特征信息与所述业务请求对应的标准文本的第二语义特征信息进行分析处理；

申请确定模块，用于基于分析处理结果，确定所述业务申请是否通过。

第三方面，本申请实施例提供一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行上述的方法步骤。

第四方面，本申请实施例提供一种服务器，可包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行上述的方法步骤。

本申请一些实施例提供的技术方案带来的有益效果至少包括：

在本申请一个或多个实施例中，业务服务器获取包含有文本内容的图像，所述图像基于业务请求产生，对所述图像进行识别，得到所述图像中的所述文本内容，提取所述文本内容的第一语义特征信息，基于所述第一语义特征信息与所述业务请求对应的标准文本的第二语义特征信息进行分析处理，基于分析处理结果，确定所述业务申请是否通过。通过对业务请求时的图像识别级提取得到相应的第一语义特征信息，基于第一语义特征信息和第二语义特征信息的处理结果以确定所述业务申请是否通过，可以保证业务审核的准确率。同时采用业务服务器对所述图像进行审核，提高业务审核的处理效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种图像处理的场景架构示意图；

图2是本申请实施例提供的一种图像处理方法涉及的提示距离调整的界面示意图；

图3是本申请实施例提供的一种图像处理方法的流程示意图；

图4是本申请实施例提供的一种图像处理方法涉及的作业上传场景图；

图5是本申请实施例提供的一种图像处理方法涉及的图像上传的界面示意图；

图6是本申请实施例提供的一种图像处理方法涉及的采集图像的场景图；

图7是本申请实施例提供的另一种图像处理方法的流程示意图；

图8是本申请实施例提供的一种图像处理装置的结构示意图；

图9是本申请实施例提供的一种图像识别模块的结构示意图；

图10是本申请实施例提供的另一种图像处理装置的结构示意图；

图11是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本申请的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。在本申请的描述中，需要说明的是，除非另有明确的规定和限定，“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本申请中的具体含义。此外，在本申请的描述中，除非另有说明，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

下面结合具体的实施例对本申请进行详细说明。

请参见图1，为本申请实施例提供的一种图像处理系统的架构示意图。如图1所示，所述图像处理系统可以包括业务服务器a和用户终端集群。所述用户终端集群可以包括多个用户终端，如图1所示，具体包括用户终端1、用户终端2、…、用户终端n，n为大于0的整数；为便于理解，本发明实施例以图1中的用户终端1为例进行描述。

所述用户终端可以是具有上传图像功能的终端设备，包括但不限于：可穿戴设备、手持设备、个人电脑、平板电脑、车载设备、计算设备或连接到无线调制解调器的其它处理设备等。

所述业务服务器100可以是单独的服务器设备，例如：机架式、刀片、塔式、或者机柜式的服务器设备，或采用工作站、大型计算机等具备较强计算能力硬件设备；也可以是采用多个服务器组成的服务器集群，所述服务集群中的各服务器可以是以对称方式组成的，其中每台服务器在业务链路中功能等价、地位等价，各服务器均可单独对外提供服务，所述单独提供服务可以理解为无需另外的服务器的辅助。

所述用户终端通过网络与业务服务器进行通信，网络可以是无线网络，也可以是有线网络，无线网络包括但不限于蜂窝网络、无线局域网、红外网络或蓝牙网络，有线网络包括但不限于以太网、通用串行总线(universal serial bus，USB)或控制器局域网络。

用户终端1将用户在申请业务时的包含有文本内容的图像图像上传至业务服务器a。

所述图像是指对业务对象的一种相似性、生动性的描述或写真，通过图像的方式来客观表示所述业务请求产生时的相关信息。通常所述图像就是具有视觉效果的画面，在本实施例中可以理解为与所述业务相关的照片、截图、手绘图等。

具体的，用户终端1通过向业务服务器a发送业务请求的方式，请求业务服务器对所述用户在申请业务时的包含有文本内容的图像进行业审核。用户终端1具有拍照功能，当用户上传申请业务时的包含有文本内容的图像时，用户终端1开启拍照功能，通过内置的图像采集装置或外置的图像采集装置采集用户的包含有文本内容的图像，所述图像采集装置可以是一个或多个摄像头。在摄像头的数量为多个的情况下，多个摄像头可以分布在不同的位置组成摄像头阵列，用户终端1通过摄像头阵列获取每个摄像头采集到的包含有文本内容的图像，将多个通道采集到的包含有文本内容的图像进行合并得到高保真的包含有文本内容的图像。

可选的，用户终端1在采集用户在申请业务时的包含有文本内容的图像时，可以分多次采集或采集多组用户在申请业务时的包含有文本内容的图像，然后根据用户的选择指令从多组包含有文本内容的图像中将用户选择的一个最终的包含有文本内容的图像上传至业务服务器a。

可选的，用户终端1在采集用户申请业务时的包含有文本内容的图像过程中，对于用户终端1来说，用户终端1开启拍照功能之后，通过图像采集装置采集图像会有一个有效图像采集距离范围，所述有效图像采集距离范围是指用户终端在该范围内对被采集对象所采集到的图像可以被识别。

在一种可能的实施方式中，用户终端1对用户申请业务时的图像实时监测，判断被采集对象(例如用户需要提交的试卷、作业等)是否处于有效图像采集距离范围之内，当被采集对象在有效图像采集距离范围之外时，用户终端1则展示提示信息，所述提示信息用于指示用户调整被采集对象与用户终端1的相对距离。

例如，用户终端1的有效图像采集距离范围是0-30cm，被采集对象(例如用户需要提交的试卷、作业等)与用户终端1的图像采集装置的距离为35cm，用户终端1实时监测到图像采集距离过远，不在有效图像采集距离范围之内，用户终端1在显示屏上展示如图2所示“距离过远，请调整与摄像头的距离”的文本提示信息，提示用户调整被采集对象(例如用户需要提交的试卷、作业等)与摄像头的距离，用户此时可以通过拉近被采集对象与摄像头的距离，以使用户终端1采集到更优质的图像。

业务服务器a接收用户终端1上传的包含有文本内容的图像，并对所述图像进行识别，得到所述图像中的文本内容。

所述对所述图像进行识别的过程，包括但不限于对所述图像进行分析、加工和处理，在对所述图像进行识别的过程中涉及的所述图像处理技术可以是文本检测识别技术、基于机器学习方法的图像识别技术、可以基于文本识别分类器的图像识别技术等等。

具体的，业务服务器a对所述图像进行区域划分，得到多个区域图像，对所述多个区域图像分别进行识别，得到各区域图像对应的区域文本内容，将所述区域文本内容进行组合，得到所述图像中的所述文本内容。

当所述图像的数量为多个时，业务服务器a获取所述多个图像所对应的辅助信息(所述图像的上传时间、所述图像的生成时间、所述图像所对应用户的用户等级、所述图像所对应业务的业务优先级)，然后对所述各图像进行识别，得到所述各图像中的文本内容。最后基于所述辅助信息将所述各图像中的文本内容进行整合

业务服务器a基于所述文本内容中的关键词和/或关键句提取第一语义特征信息，基于所述第一语义特征信息与所述业务请求对应的标准文本的第二语义特征信息进行分析处理。

所述语义特征是指以文字表达的非结构化数据特有的语义属性，以一篇论文为例，语义特征包括作者创作意图、数据主题说明、底层特征含义等语义要素。所述语义特征信息是能够表达对象本身的语义以及在环境中语义的多种特征，以文本内容为例，所述语义特征信息可以是组成字母、词的顺序、词的情感信息、互信息等。所述第一语义特征信息在本实施例中，可以理解为所述文本内容的语义特征信息，所述第一语义特征信息对于所述文本内容来说，它可以包含但不限于文本的关键词信息、词频分布信息、语法级的实体信息、语义级的主题等。所述标准文本的第二语义特征信息在本实施例中可以理解为所述标准文本的语义特征信息，所述第二语义特征信息对于所述标准文本来说，它可以包含但不限于标准文本的关键词信息、词频分布信息、语法级的实体信息、语义级的主题等。

业务服务器a具体基于所述第一语义特征信息与所述第二语义特征信息，计算所述文本内容与所述标准文本的语义相似度。

当所述语义相似度满足设定阈值，则确定所述业务申请通过，业务服务器a向用户终端1输出业务申请成功的提示信息。

当所述语义相似度不满足设定阈值时，则确定所述业务申请未通过，业务服务器a向用户终端1输出业务申请失败的提示信息。

在本申请实施例中，业务服务器获取包含有文本内容的图像，所述图像基于业务请求产生，对所述图像进行识别，得到所述图像中的所述文本内容，提取所述文本内容的第一语义特征信息，基于所述第一语义特征信息与所述业务请求对应的标准文本的第二语义特征信息进行分析处理，基于分析处理结果，确定所述业务申请是否通过。通过对业务请求时的图像识别级提取得到相应的第一语义特征信息，基于第一语义特征信息和第二语义特征信息的处理结果以确定所述业务申请是否通过，可以保证业务审核的准确率。同时采用业务服务器对所述图像进行审核，可以提高业务审核的处理效率。

在一个实施例中，如图3所示，特提出了一种图像处理方法，该方法可依赖于计算机程序实现，可运行于基于冯诺依曼体系的图像处理装置上。该计算机程序可集成在应用中，也可作为独立的工具类应用运行。该图像处理装置可以是服务器、工作站、大型计算机等电子设备。

具体的，该图像处理方法包括：

步骤101：获取包含有文本内容的图像，所述图像基于业务请求产生。

所述业务请求可以理解为用户通过用户终端向业务服务器申请业务时发送的，业务服务器基于所述业务请求对所述业务进行审核或审批处理。通常当用户终端在向业务服务器发送业务请求时，会将与所述申请业务相关的包含有文本内容的图像一并随业务请求发送至业务服务器。

具体的，当用户上传申请业务时的图像时，用户终端1可以开启拍照功能，通过内置的图像采集装置或外置的图像采集装置采集用户的图像，用户终端将采集的图像发送至业务服务器，业务服务器接收用户在申请业务时通过用户终端所上传的图像。

例如，在一个具体的申请“批改作业”的业务场景中，所述用户终端可以是电脑、手机、平板等智能设备，为了描述的方便，以用户终端为智能手机举例，所述电脑可以搭载有远程教学的应用程序，所述远程教学的应用程序具备申请“批改作业”的功能，用户打开手机的应用程序显示界面，如图4所示，若用户需要上传本次申请“批改作业”的业务的图像时，可以通过手指触控图4显示界面中的“相机”按钮，手机开启拍照功能采集用户需要上传的作业，在采集图像-作业完成之后，手机可以弹出如图5所示的提示框，图5所示的提示框中提示有“当前图像已采集，是否上传”，用户可以点击确认按钮，上述申请“批改作业”的业务被触发，手机监测到选中“确认”按钮上传图像的操作，并执行所述申请“批改作业”的业务被触发的控制逻辑对应的机器可执行指令，手机通过执行所述指令，将所述申请“批改作业”的业务对应的图像发送至业务服务器，业务服务器接收所述在申请“批改作业”的业务时所上传的图像，保存至本地缓存中等待下一步处理。

可选的，业务服务器获取用户终端上传的图像，所述图像可以是用户终端采集当前显示界面的所述申请业务过程中对应的图像，可以理解为所述用户终端具有触摸书写功能，用户终端在用户申请业务的过程中，在当前显示界面显示本次申请业务对应的需要填写的提示信息，用户根据所述提示信息可以直接在用户终端的显示界面上填写本次申请业务的内容，所述填写可以是通过触控笔或直接手指触控屏幕的方式，在完成填写之后，用户终端将填写完成的包含文本内容的图像上传至业务服务器。

例如，如图6所示，用户终端-智能平板具有触摸书写功能，智能平板的显示界面显示有用户本次需要完成的在线作业，用户根据显示界面上的提示信息-题目信息，对该题目进行作答，可以是通过触控笔或直接手指触控屏幕的方式，在完成作答之后，用户可以点击提交按钮，申请“批改作业”的业务，用户终端将当前如图6所示的显示界面的图像(例如当前界面的截图)上传至业务服务器以申请“批改作业”的业务。

在一种可行的实施方式中，用户终端预先储存有包含文本内容的图像，当用户向服务器上传申请业务时的包含文本内容的图像时，可以通过直接访问用户终端的存储空间，找到与所述业务相关的至少一个包含文本内容的图像，而勿需在申请业务时调用用户终端的采集图像的功能(如拍照功能)采集包含文本内容的图像，所述图像可以是与所述申请业务相关的截图、预先拍摄的照片等包含文本内容的图像。

例如，在一个业务审批场景中，用户向业务服务器提交关于“申请某个项目资金”审批，用户通过用户终端向业务服务器发起业务审批请求之前，会预先储存好与所述“申请某个项目资金”业务相关的包含文本内容的图像，所述图像可以是涉及到该项目具体事项的相关截图，用户可以通过触控用户终端业务审批的选项向业务服务器发起业务审批的请求，并通过用户终端的存储空间，找到与所述业务相关的至少一个包含该项目具体事项的相关截图，并将所述相关截图随业务请求一并发送至业务服务器。业务服务器接收到所述业务请求并获取包含该项目具体事项的相关截图，进行下一步对所述图像进行识别，得到所述图像中的文本内容的步骤。

步骤102：对所述图像进行识别，得到所述图像中的文本内容。

所述文本内容指的是语言的书面表示形式，通常是具有完整、系统含义的一个句子或多个句子的组合。所述文本内容以英语语言为例，可以是一个词、一个句子、一个段落，所述文本内容可以是语言的实际运用形态，通常在具体实施中指一些语言文字，在本实施例中所述文本内容可以理解为所述图像中包含所有语言文字对应的文本内容。

具体的，业务服务器获取在申请业务时所上传的图像之后，对所述图像进行预处理，所述预处理包含数字化、几何变换、归一化、平滑、复原增强等处理过程，消除图像中无关的信息，对包含文本信息的图像部分进行图像恢复及增强，然后采用预设的文本识别算法对预处理后的图像进行识别，将所述图像中的图像信息转化为文本内容。

可选的，所述预设的文本识别算法可以是基于光学字符识别的分割算法、可以是基于文本区域定位的提取算法、可以是基于场景文本识别的检测算法、基于视觉对象的序列识别算法等等。

需要说明的是，所述文本识别算法有多种，可以是上述的一种或多种，此处不作具体限定。

可选的，业务服务器在对所述图像进行预处理之后，将所述预处理之后的图像输入到文本识别模型中，输出图像对应的文本内容。

通过预先获取大量样本数据，提取特征信息，并对所述样本信息进行标注，所述特征信息包含图像的特征信息及所述文本内容的特征信息，创建文本识别模型。所述文本识别模型可以是基于卷积神经网络(Convolutional Neural Network，CNN)模型，深度神经网络(Deep Neural Network，DNN)模型、循环神经网络(Recurrent Neural Networks，RNN)模型、嵌入(embedding)模型、梯度提升决策树(Gradient Boosting Decision Tree，GBDT)模型、逻辑回归(Logistic Regression，LR)模型中的至少一种实现的，基于已经标注的样本数据对文本识别模型进行训练，可以得到训练好的文本识别模型。

在一种可行的实施方式中，业务服务器对所述图像进行区域划分，可以得到多个区域图像，然后对所述多个区域图像分别进行识别，得到各区域图像对应的区域文本内容，将所述区域文本内容进行组合，得到所述图像中的文本内容。

步骤103：提取所述文本内容的第一语义特征信息。

所述语义特征是指以文字表达的非结构化数据特有的语义属性，以一篇论文为例，语义特征包括作者创作意图、数据主题说明、底层特征含义等语义要素。所述语义特征信息是能够表达对象本身的语义以及在环境中语义的多种特征，以文本内容为例，所述语义特征信息可以是组成字母、词的顺序、词的情感信息、互信息等。

其中，组成字母即为一个单词由哪些字母组成，这些字母的先后顺序关系。

词顺序为表达一句话(一个意思)组成的各个单词的先后顺序。

词的情感信息为该词语在这个句子中所表达的情感含义，所述情感含义可以理解为词在句子是褒义还是贬义、是高昂还是低沉、是欣喜还是悲伤等。

互信息是指某个词或字和类别之间的统计独立关系，互信息常应用于度量两个对象之间的相互性。

所述第一语义特征信息在本实施例中，可以理解为所述文本内容的语义特征信息，所述第一语义特征信息对于所述文本内容来说，它可以包含但不限于文本的关键词信息、词频分布信息、语法级的实体信息、语义级的主题等。

具体的，服务器对所述图像进行识别，得到识别的文本内容之后，利用语义提取模型提取所述文本内容的第一语义特征信息。

可选的，所述语义提取模型可以是基于语境框架的文本特征信息提取方法，即先确定文本内容的提取元素(句、词、字、符号等)，然后将语义分析融入统计算法对所述文本内容进行抽取处理，得到所述文本内容的第一语义特征信息；可以是基于本体论的文本特征提取方法，即利用本体论(On-tology)模型将所述文本内容作为输入，输出所述文本内容的第一语义特征信息；可以是基于知网的概念特征提取方法，即基于概念特征的特征提取方法，在向量空间模型(Vector Space Model，VSM)的基础上，对所述文本内容进行语义分析，利用知网的数据库获取词汇的语义信息，将语义相同的词汇映射到同一概念，然后聚类得到聚类后的词，并作为VSM模型的文本向量的特征项，然后进行模型运算等，等等。需要说明的是所述提取所述文本内容的第一语义特征信息的方式有很多，可以是上述的一种或多种的拟合，此处不作限定。

步骤104：基于所述第一语义特征信息与所述业务请求对应的标准文本的第二语义特征信息进行分析处理。

所述标准文本指的是预先设置好的语言文字，所述标准文本的第二语义特征信息在本实施例中可以理解为所述标准文本的语义特征信息，所述第二语义特征信息对于所述标准文本来说，它可以包含但不限于标准文本的关键词信息、词频分布信息、语法级的实体信息、语义级的主题等。

这些标准文本的第二语义特征信息与所述业务请求的对应关系存储在标准文本库中，在本实施例中可以理解为业务服务器可以在所述标准文本库中获取所述业务请求对应的标准文本的第二语义特征信息。

具体的，业务服务器根据所述业务请求的业务标识从所述标准文本信息库获取所述业务标识对应的标准文本的第二语义特征信息，所述业务标识可以理解为所述用户发起业务审核或审批的所述业务的类型、分配的ID、业务级别等标识信息，根据所述业务标识可以识别所述业务请求指示的业务，将所述第一语义特征信息与第二语义特征信息进行匹配处理，得到匹配处理的匹配结果。

可选的，所述匹配处理方式可以是对所述第一语义特征信息与第二语义特征信息计算相似度，可以是对所述第一语义特征信息与第二语义特征信息计算相似度计算相似距离，可以是对所述第一语义特征信息与第二语义特征信息的计算差异特征信息，然后基于差异特征信息进行评级或评分，等等。

步骤105：基于分析处理结果，确定所述业务申请是否通过。

具体的，业务服务器在得到所述分析处理结果之后，根据预设评判规则对所述分析处理结果进行评判，当所述分析处理结果达到申请通过的评判要求时，确定所述业务申请通过；当所述分析处理结果未达到申请通过的评判要求时，确定所述业务申请未通过。

可选的，当所述分析处理结果是基于所述第一语义特征信息与第二语义特征信息的语义相似度时，所述评判规则可以是设置相似度阈值，当所述分析处理结果的语义相似度达到相似度阈值时，确定所述业务申请通过；当所述分析处理结果的语义相似度未达到相似度阈值时，确定所述业务申请未通过。

可选的，当所述分析处理结果是基于第一语义特征信息与第二语义特征信息的相似距离时，所述评判规则可以是设置相似距离阈值，当所述分析处理结果的相似度达到相似距离阈值时，确定所述业务申请通过；当所述分析处理结果的相似度未达到相似距离阈值时，确定所述业务申请未通过。

可选的，当所述分析处理结果是基于第一语义特征信息与第二语义特征信息的差异特征信息的评级或评分时，所述评判规则可以是设置相似级阈值或相似分阈值，当所述分析处理结果的相似度达到相似级阈值或相似分阈值时，确定所述业务申请通过；当所述分析处理结果的相似度未达到相似级阈值或相似分阈值时，确定所述业务申请未通过。

在一种具体的实施场景中，服务器可以将第一语义特征信息与第二语义特征信息进行匹配，得到所述第一语义特征信息与第二语义特征信息的差异文本信息，所述差异文本信息包含差异文本数量(例如差异词的数量)、差异文本内容、差异文本内容的词性等等。然后服务器基于预设差异评分规则，所述预设差异评分规则可以是，设置总分100分，设置扣分基数，及差异类型扣分系数和差异文本词性扣分系数，对所述差异文本信息进行评分，当评分结果达到所述业务申请通过的评分分数时(例如80分)，确定所述业务申请通过；当评分结果未达到所述业务申请通过的评分分数时(例如79分)，确定所述业务申请未通过。

请参见图7，图7是本申请提出的一种图像处理方法的另一种实施例的流程示意图。具体的：

步骤201：获取包含有文本内容的图像，所述图像基于业务请求产生。

具体可参见步骤101，此处不再赘述。

步骤202：当所述图像的数量为多个时，获取所述多个图像所对应的辅助信息。

其中，所述辅助信息包括如下至少之一：所述图像的上传时间、所述图像的生成时间、所述图像所对应用户的用户等级、所述图像所对应业务的业务优先级。

所述上传时间戳表示一份数据在某个特定时间上传之前已经存在的、完整的、可验证的数据，通常是一个字符序列，用于为用户提供一份电子证据，以证明某些数据的上传时间点。在本实施例中可以理解为所述用户终端上传包含有文本内容图像的时间点。

所述用户等级可以理解为将用户根据实际情况分为不同等级，如将消费水平高、在网时间较长或实名认证的用户划分为VIP用户，将消费水平低、在网时间较短的用户划分为普通用户等。用户等级划分的标准可以根据实际情况定置，且在后续可以调整。在本实施例中可以理解为，业务服务器建立用户标识与用户等级的映射关系，并将所述映射关系保存至用户标识集合中。所述用户标识是指标识用户身份的名称，例如用户昵称、用户名、用户账号等等都属于用户标识。在实际应用中，用户标识可以是由一系列计算机系统可识别的字符组成，例如字母、汉字、阿拉伯数字、特殊符号等等。

所述业务优先级是指业务服务器在处理各业务的图像时，决定各业务的包含有文本内容图像接收计算资源的优先等级的参数，所述业务优先级可以理解为预先对不同类型的业务进行配置的。例如，可以将作业批改类型的业务优先级设置为1，课堂答疑类型的业务优先级设置为2，远程考试类型的业务优先级设置为3，随堂检测类型的业务优先级设置为4，则所述4个业务类型的业务处理顺序依次为：作业批改类型的图像>课堂答疑类型的图像>远程考试类型的图像>随堂检测类型的图像。

具体的，业务服务器和用户终端集群组成业务链路，所述业务链路上的各服务节点(业务服务器、用户终端等)是不断工作的，当多个用户终端同时或连续向下一服务节点业务服务器发送图像时，或者当一个用户终端持续将所述图像经业务链路传输至下一服务节点业务服务器时，此时服务器会同时接收到多个图像。

可选的，当所述图像包括多个时，业务服务器对获取的多个图像的数据进行解析，获取所述多个图像中各图像的时间戳，然后对所述戳进行转换，得到所述多个图像的上传时间，根据所述上传时间，对当前上传时间最早的所述图像进行识别。

可选的，用户终端在向服务器发送业务请求时，用户终端将用户申请业务时的所述图像及所述用户标识进行封装，以数据包的形式上传至业务服务器，业务服务器在接收到多个数据包时，对所述多个数据包进行解析，获取所述多个数据包中各数据包的图像及所述用户标识，根据所述用户标识在用户标识集合中，获取所述用户标识对应的用户等级，业务服务器在对所述各图像进行识别时，可以根据用户等级的高低，对当前用户等级最高的用户上传的所述图像进行识别。

可选的，用户终端将用户申请业务时的所述图像及所述业务类型进行封装，以数据包的形式上传至业务服务器，业务服务器在接收到多个数据包时，对所述多个数据包进行解析，获取所述多个数据包中各数据包的图像及所述业务类型，获取所述业务类型对应的优先级。业务服务器在对所述各图像进行识别时，可以根据所述所述业务类型的业务的优先级，对当前业务的优先级最高的进行识别。

步骤203：对所述各图像进行识别，得到所述各图像中的文本内容，基于所述辅助信息将所述各图像中的文本内容进行整合。

具体的，当所述多个图像为同一用户在申请某个业务(例如某资金审批业务)上传时，用户可以是在申请该业务时分多次上传的所述图像，此时服务器可以基于所述图像的上传时间，按照上传时间的先后对所述多个图像中的各图像设置优先级参数，所述优先级参数是指计算机分时操作系统在处理多个作业程序时，决定各个作业程序接受系统资源的优先等级的参数。给各个图像匹配一个优先级参数，用于表示这些图像的优先等级。此时，服务器对当前优先级最高的图像进行处理，依次将当前优先级最高的图像作为目标图像，将所述目标图像输入到预先训练的文本识别模型中，从而得到所述目标图像的文本内容。然后基于所述优先级顺序获取下一优先级最高的图像作为目标图像，执行将所述目标图像输入到预先训练的文本识别模型中，从而得到所述目标图像的文本内容的步骤。直至得到所有图像中的各图像对应的文本内容。然后将所有图像中的各图像对应的文本内容进行整合，所述整合可以理解为将各图像对应的文本内容整合为一个文本内容。

在一种具体的实施场景中，所述多个图像可以是不同用户在申请同一个业务上传的，例如以某项目资金审批业务为例，该项目资金申批需要用户1(普通职员)、用户2(部门经理)、用户3(总经理)对该项目申请书进行填写上传，所3个用户的用户等级为：用户3>用户2>用户1。用户终端在向服务器发送业务请求时，用户终端将用户申请业务时的所述图像及所述用户标识进行封装，以数据包的形式上传至业务服务器，业务服务器在接收到多个数据包时，对所述多个数据包进行解析，获取所述多个数据包中各数据包的图像及所述用户标识，根据所述用户标识在用户标识集合中，获取所述用户标识对应的用户等级，业务服务器在对所述各图像进行识别时，可以根据用户等级的高低，依次对用户3、用户2、用户1上传的所述图像进行识别。然后分别得到所述3个用户的所述图像的对应文本内容，并将文本内容进行整合，所述整合可以将各图像对应的文本内容整合为一个文本内容。

步骤204：基于所述文本内容中的关键词和/或关键句提取所述第一语义特征信息。

所述语义特征是指以文字表达的非结构化数据特有的语义属性，以一篇论文为例，语义特征包括作者创作意图、数据主题说明、底层特征含义等语义要素。所述语义特征信息是能够表达对象本身的语义以及在环境中语义的多种特征，以文本内容为例，所述语义特征信息可以是组成词的顺序、词的情感信息、词/句互信息等

所述第一语义特征信息在本实施例中，可以理解为所述文本内容的语义特征信息，所述第一语义特征信息对于所述文本内容来说，它可以包含但不限于文本的关键词/句信息、词/句频分布信息、语法级的实体信息、语义级的主题等。

具体的，服务器对所述图像进行识别，得到识别的文本内容之后，利用语义提取模型基于所述文本内容中的关键词和/或关键句提取所述第一语义特征信息。

可选的，所述语义提取模型可以是基于语境框架的文本特征信息提取方法，即先确定文本内容的提取元素(关键句、关键词、关键字、关键符号等)，然后将语义分析融入统计算法对所述文本内容进行抽取处理，得到所述文本内容的第一语义特征信息；可以是基于本体论的文本特征提取方法，即利用本体论(On-tology)模型将所述文本内容作为输入，输出所述文本内容的第一语义特征信息；可以是基于知网的概念特征提取方法，即基于概念特征的特征提取方法，在向量空间模型(Vector Space Model，VSM)的基础上，对所述文本内容进行语义分析，利用知网的数据库获取词汇的语义信息，将语义相同的词汇映射到同一概念，然后聚类得到聚类后的词，并作为VSM模型的文本向量的特征项，然后进行模型运算等，等等。需要说明的是所述提取所述文本内容的第一语义特征信息的方式有很多，可以是上述的一种或多种的拟合，此处不作限定。

步骤205：基于所述第一语义特征信息与所述第二语义特征信息，计算所述文本内容与所述标准文本的语义相似度。

具体的，所述标准文本指的是预先设置好的语言文字，所述标准文本的第二语义特征信息在本实施例中可以理解为所述标准文本的语义特征信息，所述第二语义特征信息对于所述标准文本来说，它可以包含但不限于标准文本的关键词信息、词频分布信息、语法级的实体信息、语义级的主题等。

具体的，业务服务器根据所述业务请求的业务标识从所述标准文本信息库获取所述业务标识对应的标准文本的第二语义特征信息，所述业务标识可以理解为所述用户发起业务审核或审批的所述业务的类型、分配的ID、业务级别等标识信息，根据所述业务标识可以识别所述业务请求指示的业务，将所述第一语义特征信息与第二语义特征信息进行匹配处理，从而计算所述文本内容与所述标准文本的语义相似度。

可选，所述语义相似度计算方法可以是基于二部图的最大权匹配算法、可以是基于求向量间的距离的匹配算法、可以是k最近另计算法、可以是贝页斯算法等。

在一种可行的实施方式中，所述语义相似度计算方法可以是基于语义提取模型的向量夹角余弦匹配，即用夹角余弦来表示所述文本内容与所述标准文本的语义相似度。

在通过语义提取模型第一语义特征信息与第二语义特征信息向量化处理之后，采用下述公式计算相似度S：

其中，COS()为余弦函数，V为第一语义特征信息，U为第二语义特征信息，Vi表示第一语义特征信息中的第i个向量，Ui表示第一语义特征信息中的第i个向量。

通过上述公式就可以计算出文本内容与所述标准文本的语义相似度。

步骤206：当所述语义相似度满足设定阈值，则确定所述业务申请通过，输出业务申请成功的提示信息。

具体的，服务器在得到所述所述文本内容与所述标准文本的语义相似度之后，根据预设评判规则对所述语义相似度进行评判，当所述语义相似度达到设定阈值时，确定所述业务申请通过。

例如，所述设定阈值为0.85，通过计算得到的语义相似度为0.89，语义相似度大于设定阈值，则确定所述业务申请通过。

具体的，当所述业务申请通过之后，可以向所述用户终端推送业务申请通过的提示信息，所述提示信息可以是以推送消息、播放视频或动画等形式。

步骤207：当所述语义相似度不满足设定阈值时，则确定所述业务申请未通过，输出业务申请失败的提示信息。

具体的，服务器在得到所述所述文本内容与所述标准文本的语义相似度之后，根据预设评判规则对所述语义相似度进行评判，当所述语义相似度未达到设定阈值时，确定所述业务申请未通过。

例如，所述设定阈值为0.85，通过计算得到的语义相似度为0.8，语义相似度小于设定阈值，则确定所述业务申请未通过。

具体的，当所述业务申请未通过时，可以向所述用户终端推送业务申请未通过的提示信息，所述提示信息可以是以推送消息、播放视频或动画等形式。

可选的，用户终端在推送业务申请未通过的提示信息时，还可以向用户提供重新上传的选项，用户可以点击所述选项，重新上传所述包含文本内容的图像。

下述为本申请装置实施例，可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节，请参照本申请方法实施例。

请参见图8，其示出了本申请一个示例性实施例提供的图像处理装置的结构示意图。该图像处理装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该装置1包括图像获取模块模块11、图像识别模块12、特征提取模块13、分析处理模块14和申请确定模块15。

图像获取模块11，用于获取包含有文本内容的图像，所述图像基于业务请求产生；

图像识别模块12，用于对所述图像进行识别，得到所述图像中的所述文本内容；

特征提取模块13，用于提取所述文本内容的第一语义特征信息；

分析处理模块14，用于基于所述第一语义特征信息与所述业务请求对应的标准文本的第二语义特征信息进行分析处理；

申请确定模块15，用于基于分析处理结果，确定所述业务申请是否通过。

可选的，所述分析处理模块14，具体用于：

基于所述第一语义特征信息与所述第二语义特征信息，计算所述文本内容与所述标准文本的语义相似度。

可选的，所述申请确定模块15，具体用于：

当所述语义相似度满足设定阈值，则确定所述业务申请通过，否则，确定为未通过。

可选的，所述特征提取模块13，具体用于：

基于所述文本内容中的关键词和/或关键句提取所述第一语义特征信息。

可选的，如图9所示，所述图像识别模块12，还包括：

信息获取单元121，用于当所述图像的数量为多个时，获取所述多个图像所对应的辅助信息；

图像识别单元122，用于对所述各图像进行识别，得到所述各图像中的文本内容；

内容整合单元123，用于基于所述辅助信息将所述各图像中的文本内容进行整合。

可选的，所述图像识别模块12，具体用于：

对所述图像进行区域划分，得到多个区域图像，对所述多个区域图像分别进行识别，得到各区域图像对应的区域文本内容，将所述区域文本内容进行组合，得到所述图像中的所述文本内容。

可选的，如图10所示，所述装置1，还包括：

提示信息模块16，用于当确定所述业务申请通过时，输出业务申请成功的提示信息；和/或，当确定所述业务申请未通过时，输出业务申请失败的提示信息。

需要说明的是，上述实施例提供的图像处理装置在执行图像处理方法时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的图像处理装置与图像处理方法实施例属于同一构思，其体现实现过程详见方法实施例，这里不再赘述。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本申请实施例还提供了一种计算机存储介质，所述计算机存储介质可以存储有多条指令，所述指令适于由处理器加载并执行如上述图1-图7所示实施例的所述图像处理方法，具体执行过程可以参见图1-图7所示实施例的具体说明，在此不进行赘述。

本申请还提供了一种计算机程序产品，该计算机程序产品存储有至少一条指令，所述至少一条指令由所述处理器加载并执行如上述图1-图6所示实施例的所述图像处理方法，具体执行过程可以参见图1-图6所示实施例的具体说明，在此不进行赘述。

请参见图11，为本申请实施例提供了一种服务器的结构示意图。如图11所示，所述服务器1000可以包括：至少一个处理器1001，至少一个网络接口1004，用户接口1003，存储器1005，至少一个通信总线1002。

其中，通信总线1002用于实现这些组件之间的连接通信。

其中，用户接口1003可以包括显示屏(Display)、摄像头(Camera)，可选用户接口1003还可以包括标准的有线接口、无线接口。

其中，网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。

其中，处理器1001可以包括一个或者多个处理核心。处理器1001利用各种借口和线路连接整个服务器1000内的各个部分，通过运行或执行存储在存储器1005内的指令、程序、代码集或指令集，以及调用存储在存储器1005内的数据，执行服务器1000的各种功能和处理数据。可选的，处理器1001可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable Logic Array，PLA)中的至少一种硬件形式来实现。处理器1001可集成中央处理器(Central Processing Unit，CPU)、图像处理器(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示屏所需要显示的内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器1001中，单独通过一块芯片进行实现。

其中，存储器1005可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory)。可选的，该存储器1005包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1005可用于存储指令、程序、代码、代码集或指令集。存储器1005可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等；存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图11所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及图像处理应用程序。

在图11所示的服务器1000中，用户接口1003主要用于为用户提供输入的接口，获取用户输入的数据；而处理器1001可以用于调用存储器1005中存储的图像处理应用程序，并具体执行以下操作：

获取包含有文本内容的图像，所述图像基于业务请求产生；

对所述图像进行识别，得到所述图像中的所述文本内容；

提取所述文本内容的第一语义特征信息；

基于分析处理结果，确定所述业务申请是否通过。

在一个实施例中，所述处理器1001在执行所述基于所述第一语义特征信息与所述业务请求对应的标准文本的第二语义特征信息进行分析处理，具体执行以下操作：

在一个实施例中，所述处理器1001在执行所述基于分析处理结果，确定所述业务申请是否通过，具体执行以下操作：

在一个实施例中，所述处理器1001在执行所述提取所述文本内容的第一语义特征信息，具体执行以下操作：

在一个实施例中，所述处理器1001在执行所述对所述图像进行识别，得到所述图像中的所述文本内容，具体执行以下操作：

当所述图像的数量为多个时，获取所述多个图像所对应的辅助信息；

对所述各图像进行识别，得到所述各图像中的文本内容；

基于所述辅助信息将所述各图像中的文本内容进行整合；

所述辅助信息包括如下至少之一：所述图像的上传时间、所述图像的生成时间、所述图像所对应用户的用户等级、所述图像所对应业务的业务优先级。

对所述图像进行区域划分，得到多个区域图像；

对所述多个区域图像分别进行识别，得到各区域图像对应的区域文本内容；

将所述区域文本内容进行组合，得到所述图像中的所述文本内容。

在一个实施例中，所述处理器1001在执行所述图像处理方法，还执行以下操作：

当确定所述业务申请通过时，输出业务申请成功的提示信息；和/或，当确定所述业务申请未通过时，输出业务申请失败的提示信息。

在本实施例中，业务服务器获取包含有文本内容的图像，所述图像基于业务请求产生，对所述图像进行识别，得到所述图像中的所述文本内容，提取所述文本内容的第一语义特征信息，基于所述第一语义特征信息与所述业务请求对应的标准文本的第二语义特征信息进行分析处理，基于分析处理结果，确定所述业务申请是否通过。通过对业务请求时的图像识别级提取得到相应的第一语义特征信息，基于第一语义特征信息和第二语义特征信息的处理结果以确定所述业务申请是否通过，可以保证业务审核的准确率。同时采用业务服务器对所述图像进行审核，可以提高业务审核的处理效率。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。

以上所揭露的仅为本申请较佳实施例而已，当然不能以此来限定本申请之权利范围，因此依本申请权利要求所作的等同变化，仍属本申请所涵盖的范围。

Claims

1.一种图像处理方法，其特征在于，所述方法包括：

获取包含有文本内容的图像，所述图像基于业务请求产生；

对所述图像进行识别，得到所述图像中的所述文本内容；

提取所述文本内容的第一语义特征信息；

基于分析处理结果，确定所述业务申请是否通过。

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一语义特征信息与所述业务请求对应的标准文本的第二语义特征信息进行分析处理，包括：基于所述第一语义特征信息与所述第二语义特征信息，计算所述文本内容与所述标准文本的语义相似度。

3.根据权利要求2所述的方法，其特征在于，所述基于分析处理结果，确定所述业务申请是否通过，包括：当所述语义相似度满足设定阈值，则确定所述业务申请通过，否则，确定为未通过。

4.根据权利要求1-3任一所述的方法，其特征在于，所述提取所述文本内容的第一语义特征信息，包括：基于所述文本内容中的关键词和/或关键句提取所述第一语义特征信息。

5.根据权利要求1-3任一所述的方法，其特征在于，所述对所述图像进行识别，得到所述图像中的所述文本内容，包括：

对所述各图像进行识别，得到所述各图像中的文本内容；

基于所述辅助信息将所述各图像中的文本内容进行整合；

6.根据权利要求1-3任一所述的方法，其特征在于，所述对所述图像进行识别，得到所述图像中的所述文本内容，包括：

对所述图像进行区域划分，得到多个区域图像；

7.根据权利要求1所述的方法，其特征在于，还包括：

8.一种图像处理装置，其特征在于，所述方法包括：

9.一种计算机存储介质，其特征在于，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行如权利要求1～7任意一项的方法步骤。

10.一种服务器，其特征在于，包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行如权利要求1～7任意一项的方法步骤。