[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN111062377B - 一种题号检测方法、系统、存储介质及电子设备 - Google Patents

一种题号检测方法、系统、存储介质及电子设备 Download PDF

Info

Publication number
CN111062377B
CN111062377B CN201911312475.3A CN201911312475A CN111062377B CN 111062377 B CN111062377 B CN 111062377B CN 201911312475 A CN201911312475 A CN 201911312475A CN 111062377 B CN111062377 B CN 111062377B
Authority
CN
China
Prior art keywords
question
question number
ocr
model
text information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911312475.3A
Other languages
English (en)
Other versions
CN111062377A (zh
Inventor
许多
韦文杰
邓小兵
张春雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201911312475.3A priority Critical patent/CN111062377B/zh
Publication of CN111062377A publication Critical patent/CN111062377A/zh
Application granted granted Critical
Publication of CN111062377B publication Critical patent/CN111062377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供了一种题号检测方法、系统、存储介质及电子设备,其方法包括:获取通过OCR文字识别得到的OCR题号,将所述OCR题号判定为题号区域;获取通过目标检测模型得到的模型题号;以所述OCR题号为基准,遍历所述模型题号,获取所述模型题号中的非OCR题号;选取所述非OCR题号中任意一个作为目标题号,将所述目标题号变形为预设大小的矩形框;根据所述矩形框和OCR文字识别结果检测所述目标题号。本发明基于深度学习和OCR题号检测算法,自主识别试卷排版,提高检测成功率。

Description

一种题号检测方法、系统、存储介质及电子设备
技术领域
本发明涉及文本信息处理技术领域,尤指一种题号检测方法、系统、存储介质及电子设备。
背景技术
目前针对试卷、习题等文本信息的分析方案有很多,例如识别题目信息搜索对应的参考答案,然后对学生的答案进行评判分析等。但是专门对题号的检测方案却很少,然而题号检测的意义巨大,精准的题号检测可以用来进行后续的试卷排版分析,题目区域提取等。只有准确判定题号区域才能够精准识别各个题目其余。
现存的方案检测题号位置使用传统方法,使用边缘检测、连通域检测等手段,通过空间位置关系寻找题号,这样检测到的题号可靠性较差,往往只对固定版式的试卷文本有效,当试卷排版变化时,算法检测成功率会大幅下降。
发明内容
本发明的目的是提供一种题号检测方法、系统、存储介质及电子设备,实现基于深度学习和OCR题号检测算法,自主识别试卷排版,提高检测成功率。
本发明提供的技术方案如下:
本发明提供一种题号检测方法,包括:
获取通过OCR文字识别得到的OCR题号,将所述OCR题号判定为题号区域;
获取通过目标检测模型得到的模型题号;
以所述OCR题号为基准,遍历所述模型题号,获取所述模型题号中的非OCR题号;
选取所述非OCR题号中任意一个作为目标题号,将所述目标题号变形为预设大小的矩形框;
根据所述矩形框和OCR文字识别结果检测所述目标题号。
进一步的,获取通过OCR文字识别得到的OCR题号具体包括:
获取题号筛选规则;
通过OCR文字识别技术识别待检测题号的文本信息;
通过所述题号筛选规则筛选所述文本信息得到所述OCR题号。
进一步的,获取通过目标检测模型得到的模型题号具体包括:
获取题号训练数据,通过所述题号训练数据进行训练得到所述目标检测模型;
获取待检测题号的文本信息的图片;
将所述文本信息的图片切分为若干个所述目标检测模型对应的预设尺寸的标准图片;
通过所述目标检测模型识别所述标准图片,得到所述模型题号。
进一步的,根据所述矩形框和OCR文字识别结果检测所述目标题号具体包括:
将所述矩形框和所述OCR文字识别结果进行匹配;
当所述矩形框内不存在文本信息时,所述矩形框对应的目标题号非题号区域;
当所述矩形框内存在文本信息时,识别所述文本信息;
若所述文本信息满足非题号属性,则所述矩形框对应的目标题号为题号区域。
本发明还提供一种题号检测系统,包括:
OCR题号获取模块,获取通过OCR文字识别得到的OCR题号,将所述OCR题号判定为题号区域;
模型题号获取模块,获取通过目标检测模型得到的模型题号;
遍历模块,以所述OCR题号获取模块获取的所述OCR题号为基准,遍历所述模型题号获取模块获取的所述模型题号,获取所述模型题号中的非OCR题号;
变形模块,选取所述遍历模块得到的所述非OCR题号中任意一个作为目标题号,将所述目标题号变形为预设大小的矩形框;
检测模块,根据所述变形模块得到的所述矩形框和OCR文字识别结果检测所述目标题号。
进一步的,所述OCR题号获取模块具体包括:
规则获取单元,获取题号筛选规则;
OCR识别单元,通过OCR文字识别技术识别待检测题号的文本信息;
OCR题号获取单元,通过所述规则获取单元获取的所述题号筛选规则筛选所述OCR识别单元得到的所述文本信息得到所述OCR题号。
进一步的,所述模型题号获取模块具体包括:
模型训练单元,获取题号训练数据,通过所述题号训练数据进行训练得到所述目标检测模型;
图片获取单元,获取待检测题号的文本信息的图片;
图片处理单元,将所述图片获取单元获取的所述文本信息的图片切分为若干个所述目标检测模型对应的预设尺寸的标准图片;
模型题号获取单元,通过所述模型训练单元得到的所述目标检测模型识别所述图片处理单元得到的所述标准图片,得到所述模型题号。
进一步的,所述检测模块具体包括:
匹配单元,将所述矩形框和所述OCR文字识别结果进行匹配;
检测单元,当所述匹配单元得到所述矩形框内不存在文本信息时,所述矩形框对应的目标题号非题号区域;
所述检测单元,当所述匹配单元得到所述矩形框内存在文本信息时,识别所述文本信息;
所述检测单元,若所述文本信息满足非题号属性,则所述矩形框对应的目标题号为题号区域。
本发明还提供一种存储介质,该存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的任一项方法。
本发明还提供一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的任一项方法。
通过本发明提供的一种题号检测方法、系统、存储介质及电子设备,能够带来以下至少一种有益效果:
1、本发明中,结合深度学习和OCR题号检测算法,自主识别试卷排版,通过两种方法的融合进一步解决传统算法的一系列适应性问题,提高题号检测成功率。
2、本发明中,通过OCR文字识别技术识别待检测题号的文本信息,得到相应的OCR题号,并且在其中设置严格的题号筛选规则,确保得到的OCR题号都为实际的题号区域,降低出现误检的概率。
3、本发明中,通过对题号训练数据进行训练得到目标检测模型,便于后续通过目标检测模型训练得到待检测题号的文本信息的模型题号,方便快捷。另一方面,结合模型题号和实际的题号区域对目标检测模型进行训练,对目标检测模型的参数进行调整。
4、本发明中,通过OCR文字识别结果进一步识别模型题号中的非OCR题号,防止检测遗漏,提高检测成功率。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种题号检测方法、系统、存储介质及电子设备的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种题号检测方法的一个实施例的流程图;
图2是本发明一种题号检测方法的另一个实施例的流程图;
图3是本发明一种题号检测方法的另一个实施例的流程图;
图4是本发明一种题号检测方法的另一个实施例的流程图;
图5是本发明一种题号检测系统的一个实施例的结构示意图。
附图标号说明:
100题号检测系统
110OCR题号获取模块 111规则获取单元 112OCR识别单元 113OCR题号获取单元
120模型题号获取模块 121模型训练单元 122图片获取单元 123图片处理单元
130遍历模块
140变形模块
150检测模块 151匹配单元 152检测单元
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本申请。在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘出了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
具体实现中,本申请实施例中描述的终端设备包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机、家教机或平板计算机之类的其他便携式设备。还应当理解的是,在某些实施例中,所述终端设备并非便携式通信设备,而是具有触摸敏感表面(例如:触摸屏显示器和/或触摸板)的台式计算机。
在接下来的讨论中,描述了包括显示器和触摸敏感表面的终端设备。然而,应当理解的是,终端设备可以包括诸如物理键盘、鼠标和/或控制杆的一个或多个其他物理用户接口设备。
终端设备支持各种应用程序,例如以下中的一个或多个:绘图应用程序、演示应用程序、网络创建应用程序、文字处理应用程序、盘刻录应用程序、电子表格应用程序、游戏应用程序、电话应用程序、视频会议应用程序、电子邮件应用程序、即时消息收发应用程序、锻炼支持应用程序、照片管理应用程序、数码相机应用程序、数字摄像机应用程序、Web浏览应用程序、数字音乐播放器应用程序和/或数字视频播放器应用程序。
可以在终端设备上执行的各种应用程序可以使用诸如触摸敏感表面的至少一个公共物理用户接口设备。可以在应用程序之间和/或相应应用程序内调整和/或改变触摸敏感表面的一个或多个功能以及终端上显示的相应信息。这样,终端的公共物理架构(例如,触摸敏感表面)可以支持具有对用户而言直观且透明的用户界面的各种应用程序。
另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
本发明的一个实施例,如图1所示,一种题号检测方法,包括:
S100获取通过OCR文字识别得到的OCR题号,将所述OCR题号判定为题号区域。
具体的,OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
对用户输入的待检测题号的文本信息的图片进行OCR文字识别,得到文本信息用于提取题号。其中,根据题号筛选规则对文本信息进行处理从而得到OCR题号。
由于可以设置多方面进行限制的题号筛选规则,出现误检的概率较小,因此,将得到的所有的OCR题号直接判定为题号区域。同时由于题号筛选规则较为严格,可能导致原本是题号区域但被筛除,因此,结合目标检测模型得到的模型题号,提高检测成功率。
S200获取通过目标检测模型得到的模型题号。
具体的,获取通过目标检测模型得到的模型题号,首先使用部分数据训练好一个目标检测模型,专门用于检测题号,然后待检测题号的文本信息的图片输入到目标检测模型中得到模型题号。
由于目标检测模型中用于深度学习的数据有限,因此目标检测模型准确度可能不高,因此,后续需要对根据目标检测模型得到的模型题号作进一步的筛选。
S300以所述OCR题号为基准,遍历所述模型题号,获取所述模型题号中的非OCR题号。
具体的,由于OCR题号的准确率较高,可以直接判定为题号区域,因此以OCR题号为基准,依次遍历模型题号,将模型题号与OCR题号一一进行匹配,如果模型题号中有与OCR题号中相同的题号,则该题号同样为题号区域,如果模型题号中有与OCR题号中不同的题号,则将该题号定义为非OCR题号,获取模型题号中的非OCR题号。
S400选取所述非OCR题号中任意一个作为目标题号,将所述目标题号变形为预设大小的矩形框。
具体的,选取非OCR题号中任意一个作为目标题号作为解释说明,之后所有的非OCR题号都可以按照相同的方法流程进行识别,判定其是否为题号区域。
将目标题号对应的区域变形为预设大小的矩形框,例如变形为长宽比为4:1的矩形框,其中的长宽比的数值可以根据由系统默认或者用户自主设置,其数值大小可以分别设置,并不为某一固定数值。
同时由于需要将矩形框与OCR文字识别结果进行匹配,因此矩形框与待检测题号的文本信息的状态相关。当待检测题号的文本信息为横版时,矩形框则为横版,矩形框的长边为待检测题号的文本信息的延伸方向即水平方向。当待检测题号的文本信息为竖版时,矩形框则为竖版,矩形框的长边为待检测题号的文本信息的延伸方向即竖直方向。
另外,矩形框的尺寸大小还与待检测题号的文本信息的字体大小以及行间距相关,根据待检测题号的文本信息的字体大小以及行间距计算矩形框的尺寸,矩形框的尺寸要确保矩形框不会与其余行的待检测题号的文本信息产生交集。
S500根据所述矩形框和OCR文字识别结果检测所述目标题号。
具体的,将矩形框和OCR文字识别结果进行匹配,如果矩形框对应的题号为题号区域,则同一行包含其他的伴随题号出现的文本信息,例如顿号和点等。如果矩形框对应的题号不是题号区域,则同一行包含的其他的文本信息为题目题干信息。因此,需要确保矩形框不会与其余行的文本信息产生交集,而仅仅只对同一行的文本信息进行识别判断。
本实施例中,结合深度学习和OCR题号检测算法,自主识别试卷排版,通过两种方法的融合进一步解决传统算法的一系列适应性问题,提高题号检测成功率。
本发明的另一个实施例,是上述的实施例的优化实施例,如图2所示,本实施例与上述的实施例相比,主要改进在于,包括:
S100获取通过OCR文字识别得到的OCR题号,将所述OCR题号判定为题号区域具体包括:
S110获取题号筛选规则。
具体的,获取题号筛选规则,题号筛选规则可以是用户根据题号特点提炼之后输入,也可以是系统分析统计题号的共同特征得到的,例如,“中文数字加、”或者“阿拉伯数字加.”,又或者“中文数字或者阿拉伯数字加()”等形式的一级或二级题号。
S120通过OCR文字识别技术识别待检测题号的文本信息。
具体的,通过OCR文字识别技术识别待检测题号的文本信息,OCR(opticalcharacter recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
S130通过所述题号筛选规则筛选所述文本信息得到所述OCR题号。
具体的,通过题号筛选规则筛选OCR文字识别技术得到的文本信息得到OCR题号,由于可以设置多方面进行限制的题号筛选规则,出现误检的概率较小,因此,将得到的所有的OCR题号直接判定为题号区域。
S200获取通过目标检测模型得到的模型题号。
S300以所述OCR题号为基准,遍历所述模型题号,获取所述模型题号中的非OCR题号。
S400选取所述非OCR题号中任意一个作为目标题号,将所述目标题号变形为预设大小的矩形框。
S500根据所述矩形框和OCR文字识别结果检测所述目标题号。
本实施例中,通过OCR文字识别技术识别待检测题号的文本信息,得到相应的OCR题号,并且在其中设置严格的题号筛选规则,确保得到的OCR题号都为实际的题号区域,降低出现误检的概率。
本发明的另一个实施例,是上述的实施例的优化实施例,如图3所示,本实施例与上述的实施例相比,主要改进在于,包括:
S100获取通过OCR文字识别得到的OCR题号,将所述OCR题号判定为题号区域。
S200获取通过目标检测模型得到的模型题号具体包括:
S210获取题号训练数据,通过所述题号训练数据进行训练得到所述目标检测模型。
具体的,获取大量的题号训练数据,其中,题号训练数据中包括试卷、习题等包含题号的文本资料的图片,以及每个文本资料中的题号区域,根据题号训练数据即上述的图片以及对应的题号区域进行训练,得到相应的目标检测模型。
S220获取待检测题号的文本信息的图片。
具体的,获取待检测题号的文本信息的图片,待检测题号的文本信息可以是试卷、习题册等各式包含题目的资料。其中,可以直接获取待检测题号的文本信息的图片,也可以是通过摄像头拍摄待检测题号的文本信息,得到相应的图片。
S230将所述文本信息的图片切分为若干个所述目标检测模型对应的预设尺寸的标准图片。
具体的,获取的待检测题号的文本信息的图片的分辨率不同、大小不同,但是目标检测模型对于输入的图片的大小具有相应的规定,如果直接将获取的待检测题号的文本信息的图片压缩调整至目标检测模型规定的大小,会导致图像部分区域失真,丢失细节。
因此,为了更好地适应目标检测模型的输入,需要将获取的待检测题号的文本信息的图片压缩裁剪,将其切分目标检测模型对应的预设尺寸的标准图片,该标准图片为目标检测模型对于输入的图片要求的大小,切分之后的图片能够最大限度的保留细节,从而加强网络的识别能力。
S240通过所述目标检测模型识别所述标准图片,得到所述模型题号。
具体的,将切分得到的若干个标准图片输入到目标检测模型中进行训练,得到相应的模型题号。由于用于训练目标检测模型的题号训练数据有限,因此目标检测模型的准确率可能较低,因此后续需要结合OCR题号对模型题号作进一步的分析验证。
另外,为了提升目标检测模型的准确率,对于每次应用目标检测模型得到的模型题号,对于其对应的待检测题号的文本信息,完全确定其题号区域之后,根据模型题号和实际的题号区域对目标检测模型进行训练,更新调整目标检测模型的参数,以便使得目标检测模型的训练结果与实际结果更加接近,提升检测准确率。
S300以所述OCR题号为基准,遍历所述模型题号,获取所述模型题号中的非OCR题号。
S400选取所述非OCR题号中任意一个作为目标题号,将所述目标题号变形为预设大小的矩形框。
S500根据所述矩形框和OCR文字识别结果检测所述目标题号。
本实施例中,通过对题号训练数据进行训练得到目标检测模型,便于后续通过目标检测模型训练得到待检测题号的文本信息的模型题号,方便快捷。另一方面,结合模型题号和实际的题号区域对目标检测模型进行训练,对目标检测模型的参数进行调整。
本发明的另一个实施例,是上述的实施例的优化实施例,如图4所示,本实施例与上述的实施例相比,主要改进在于,包括:
S100获取通过OCR文字识别得到的OCR题号,将所述OCR题号判定为题号区域。
S200获取通过目标检测模型得到的模型题号。
S300以所述OCR题号为基准,遍历所述模型题号,获取所述模型题号中的非OCR题号。
S400选取所述非OCR题号中任意一个作为目标题号,将所述目标题号变形为预设大小的矩形框。
S500根据所述矩形框和OCR文字识别结果检测所述目标题号具体包括:
S510将所述矩形框和所述OCR文字识别结果进行匹配;
具体的,将矩形框和OCR文字识别结果进行匹配,矩形框并不会与其余行的文本信息发生交集,因此,其目的是为了识别矩形框与同行的文本信息的匹配情形。
S520当所述矩形框内不存在文本信息时,所述矩形框对应的目标题号非题号区域;
具体的,当矩形框内不存在文本信息时,也就是说矩形框对应的模型题号周围没有任何文本信息,即不存在题干信息等,因此矩形框对应的目标题号不是题号区域。
S530当所述矩形框内存在文本信息时,识别所述文本信息;
具体的,当矩形框内存在文本信息时,也就是说矩形框对应的模型题号周围有任何文本信息,但是该模型题号可能为题干中的数字,因此,需要进一步分析识别矩形框内的文本信息。
S540若所述文本信息满足非题号属性,则所述矩形框对应的目标题号为题号区域。
具体的,如果该文本信息满足非题号属性,则矩形框对应的目标题号为题号区域。其中,上述非题号属性为伴随题号出现的文本,例如文本内容是英文选项、括号等。
本实施例中,通过OCR文字识别结果进一步识别模型题号中的非OCR题号,防止检测遗漏,提高检测成功率。
本发明的一个实施例,如图5所示,一种题号检测系统100,包括:
OCR题号获取模块110,获取通过OCR文字识别得到的OCR题号,将所述OCR题号判定为题号区域;
具体的,OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
对用户输入的待检测题号的文本信息的图片进行OCR文字识别,得到文本信息用于提取题号。其中,根据题号筛选规则对文本信息进行处理从而得到OCR题号。
由于可以设置多方面进行限制的题号筛选规则,出现误检的概率较小,因此,将得到的所有的OCR题号直接判定为题号区域。同时由于题号筛选规则较为严格,可能导致原本是题号区域但被筛除,因此,结合目标检测模型得到的模型题号,提高检测成功率。
所述OCR题号获取模块110具体包括:
规则获取单元111,获取题号筛选规则;
具体的,获取题号筛选规则,题号筛选规则可以是用户根据题号特点提炼之后输入,也可以是系统分析统计题号的共同特征得到的,例如,“中文数字加、”或者“阿拉伯数字加.”,又或者“中文数字或者阿拉伯数字加()”等形式的一级或二级题号。
OCR识别单元112,通过OCR文字识别技术识别待检测题号的文本信息;
具体的,通过OCR文字识别技术识别待检测题号的文本信息,OCR(opticalcharacter recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
OCR题号获取单元113,通过所述规则获取单元111获取的所述题号筛选规则筛选所述OCR识别单元112得到的所述文本信息得到所述OCR题号。
具体的,通过题号筛选规则筛选OCR文字识别技术得到的文本信息得到OCR题号,由于可以设置多方面进行限制的题号筛选规则,出现误检的概率较小,因此,将得到的所有的OCR题号直接判定为题号区域。
本实施例中,通过OCR文字识别技术识别待检测题号的文本信息,得到相应的OCR题号,并且在其中设置严格的题号筛选规则,确保得到的OCR题号都为实际的题号区域,降低出现误检的概率。
模型题号获取模块120,获取通过目标检测模块150目标检测模型得到的模型题号;
具体的,获取通过目标检测模型得到的模型题号,首先使用部分数据训练好一个目标检测模型,专门用于检测题号,然后待检测题号的文本信息的图片输入到目标检测模型中得到模型题号。
由于目标检测模型中用于深度学习的数据有限,因此目标检测模型准确度可能不高,因此,后续需要对根据目标检测模型得到的模型题号作进一步的筛选。
所述模型题号获取模块120具体包括:
模型训练单元121,获取题号训练数据,通过所述题号训练数据进行训练得到所述目标检测模型;
具体的,获取大量的题号训练数据,其中,题号训练数据中包括试卷、习题等包含题号的文本资料的图片,以及每个文本资料中的题号区域,根据题号训练数据即上述的图片以及对应的题号区域进行训练,得到相应的目标检测模型。
图片获取单元122,获取待检测题号的文本信息的图片;
具体的,获取待检测题号的文本信息的图片,待检测题号的文本信息可以是试卷、习题册等各式包含题目的资料。其中,可以直接获取待检测题号的文本信息的图片,也可以是通过摄像头拍摄待检测题号的文本信息,得到相应的图片。
图片处理单元123,将所述图片获取单元122获取的所述文本信息的图片切分为若干个所述目标检测模型对应的预设尺寸的标准图片;
具体的,获取的待检测题号的文本信息的图片的分辨率不同、大小不同,但是目标检测模型对于输入的图片的大小具有相应的规定,如果直接将获取的待检测题号的文本信息的图片压缩调整至目标检测模型规定的大小,会导致图像部分区域失真,丢失细节。
因此,为了更好地适应目标检测模型的输入,需要将获取的待检测题号的文本信息的图片压缩裁剪,将其切分目标检测模型对应的预设尺寸的标准图片,该标准图片为目标检测模型对于输入的图片要求的大小,切分之后的图片能够最大限度的保留细节,从而加强网络的识别能力。
模型题号获取单元,通过所述模型训练单元121得到的所述目标检测模型识别所述图片处理单元123得到的所述标准图片,得到所述模型题号。
具体的,将切分得到的若干个标准图片输入到目标检测模型中进行训练,得到相应的模型题号。由于用于训练目标检测模型的题号训练数据有限,因此目标检测模型的准确率可能较低,因此后续需要结合OCR题号对模型题号作进一步的分析验证。
另外,为了提升目标检测模型的准确率,对于每次应用目标检测模型得到的模型题号,对于其对应的待检测题号的文本信息,完全确定其题号区域之后,根据模型题号和实际的题号区域对目标检测模型进行训练,更新调整目标检测模型的参数,以便使得目标检测模型的训练结果与实际结果更加接近,提升检测准确率。
本实施例中,通过对题号训练数据进行训练得到目标检测模型,便于后续通过目标检测模型训练得到待检测题号的文本信息的模型题号,方便快捷。另一方面,结合模型题号和实际的题号区域对目标检测模型进行训练,对目标检测模型的参数进行调整。
遍历模块130,以所述OCR题号获取模块110获取的所述OCR题号为基准,遍历所述模型题号获取模块120获取的所述模型题号,获取所述模型题号中的非OCR题号;
具体的,由于OCR题号的准确率较高,可以直接判定为题号区域,因此以OCR题号为基准,依次遍历模型题号,将模型题号与OCR题号一一进行匹配,如果模型题号中有与OCR题号中相同的题号,则该题号同样为题号区域,如果模型题号中有与OCR题号中不同的题号,则将该题号定义为非OCR题号,获取模型题号中的非OCR题号。
变形模块140,选取所述遍历模块130得到的所述非OCR题号中任意一个作为目标题号,将所述目标题号变形为预设大小的矩形框;
具体的,选取非OCR题号中任意一个作为目标题号作为解释说明,之后所有的非OCR题号都可以按照相同的方法流程进行识别,判定其是否为题号区域。
将目标题号对应的区域变形为预设大小的矩形框,例如变形为长宽比为4:1的矩形框,其中的长宽比的数值可以根据由系统默认或者用户自主设置,其数值大小可以分别设置,并不为某一固定数值。
同时由于需要将矩形框与OCR文字识别结果进行匹配,因此矩形框与待检测题号的文本信息的状态相关。当待检测题号的文本信息为横版时,矩形框则为横版,矩形框的长边为待检测题号的文本信息的延伸方向即水平方向。当待检测题号的文本信息为竖版时,矩形框则为竖版,矩形框的长边为待检测题号的文本信息的延伸方向即竖直方向。
另外,矩形框的尺寸大小还与待检测题号的文本信息的字体大小以及行间距相关,根据待检测题号的文本信息的字体大小以及行间距计算矩形框的尺寸,矩形框的尺寸要确保矩形框不会与其余行的待检测题号的文本信息产生交集。
检测模块150,根据所述变形模块140得到的所述矩形框和OCR文字识别结果检测所述目标题号。
具体的,将矩形框和OCR文字识别结果进行匹配,如果矩形框对应的题号为题号区域,则同一行包含其他的伴随题号出现的文本信息,例如顿号和点等。如果矩形框对应的题号不是题号区域,则同一行包含的其他的文本信息为题目题干信息。因此,需要确保矩形框不会与其余行的文本信息产生交集,而仅仅只对同一行的文本信息进行识别判断。
本实施例中,结合深度学习和OCR题号检测算法,自主识别试卷排版,通过两种方法的融合进一步解决传统算法的一系列适应性问题,提高题号检测成功率。
所述检测模块150具体包括:
匹配单元151,将所述矩形框和所述OCR文字识别结果进行匹配;
具体的,将矩形框和OCR文字识别结果进行匹配,矩形框并不会与其余行的文本信息发生交集,因此,其目的是为了识别矩形框与同行的文本信息的匹配情形。
检测单元152,当所述匹配单元151得到所述矩形框内不存在文本信息时,所述矩形框对应的目标题号非题号区域;
具体的,当矩形框内不存在文本信息时,也就是说矩形框对应的模型题号周围没有任何文本信息,即不存在题干信息等,因此矩形框对应的目标题号不是题号区域。
所述检测单元152,当所述匹配单元151得到所述矩形框内存在文本信息时,识别所述文本信息;
具体的,当矩形框内存在文本信息时,也就是说矩形框对应的模型题号周围有任何文本信息,但是该模型题号可能为题干中的数字,因此,需要进一步分析识别矩形框内的文本信息。
所述检测单元152,若所述文本信息满足非题号属性,则所述矩形框对应的目标题号为题号区域。
具体的,如果该文本信息满足非题号属性,则矩形框对应的目标题号为题号区域。其中,上述非题号属性为伴随题号出现的文本,例如文本内容是英文选项、括号等。
本实施例中,通过OCR文字识别结果进一步识别模型题号中的非OCR题号,防止检测遗漏,提高检测成功率。
本发明的一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一实施例中的所有方法步骤或部分方法步骤。
本发明实现上述的实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本发明的一个实施例还提供一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一实施例中的所有方法步骤或部分方法步骤。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种题号检测方法,其特征在于,包括:
获取通过OCR文字识别得到的OCR题号,将所述OCR题号判定为题号区域;
获取通过目标检测模型得到的模型题号;
以所述OCR题号为基准,遍历所述模型题号,获取所述模型题号中的非OCR题号;
选取所述非OCR题号中任意一个作为目标题号,将所述目标题号变形为预设大小的矩形框;
根据所述矩形框和OCR文字识别结果检测所述目标题号:具体包括:将所述矩形框和所述OCR文字识别结果进行匹配;当所述矩形框内不存在文本信息时,所述矩形框对应的目标题号非题号区域;当所述矩形框内存在文本信息时,识别所述文本信息;若所述文本信息满足非题号属性,则所述矩形框对应的目标题号为题号区域。
2.根据权利要求1所述的题号检测方法,其特征在于,获取通过OCR文字识别得到的OCR题号具体包括:
获取题号筛选规则;
通过OCR文字识别技术识别待检测题号的文本信息;
通过所述题号筛选规则筛选所述文本信息得到所述OCR题号。
3.根据权利要求1所述的题号检测方法,其特征在于,获取通过目标检测模型得到的模型题号具体包括:
获取题号训练数据,通过所述题号训练数据进行训练得到所述目标检测模型;
获取待检测题号的文本信息的图片;
将所述文本信息的图片切分为若干个所述目标检测模型对应的预设尺寸的标准图片;
通过所述目标检测模型识别所述标准图片,得到所述模型题号。
4.一种题号检测系统,其特征在于,包括:
OCR题号获取模块,获取通过OCR文字识别得到的OCR题号,将所述OCR题号判定为题号区域;
模型题号获取模块,获取通过目标检测模型得到的模型题号;
遍历模块,以所述OCR题号获取模块获取的所述OCR题号为基准,遍历所述模型题号获取模块获取的所述模型题号,获取所述模型题号中的非OCR题号;
变形模块,选取所述遍历模块得到的所述非OCR题号中任意一个作为目标题号,将所述目标题号变形为预设大小的矩形框;
检测模块,根据所述变形模块得到的所述矩形框和OCR文字识别结果检测所述目标题号:具体包括:匹配单元,将所述矩形框和所述OCR文字识别结果进行匹配;检测单元,当所述匹配单元得到所述矩形框内不存在文本信息时,所述矩形框对应的目标题号非题号区域;所述检测单元,当所述匹配单元得到所述矩形框内存在文本信息时,识别所述文本信息;所述检测单元,若所述文本信息满足非题号属性,则所述矩形框对应的目标题号为题号区域。
5.根据权利要求4所述的题号检测系统,其特征在于,所述OCR题号获取模块具体包括:
规则获取单元,获取题号筛选规则;
OCR识别单元,通过OCR文字识别技术识别待检测题号的文本信息;
OCR题号获取单元,通过所述规则获取单元获取的所述题号筛选规则筛选所述OCR识别单元得到的所述文本信息得到所述OCR题号。
6.根据权利要求4所述的题号检测系统,其特征在于,所述模型题号获取模块具体包括:
模型训练单元,获取题号训练数据,通过所述题号训练数据进行训练得到所述目标检测模型;
图片获取单元,获取待检测题号的文本信息的图片;
图片处理单元,将所述图片获取单元获取的所述文本信息的图片切分为若干个所述目标检测模型对应的预设尺寸的标准图片;
模型题号获取单元,通过所述模型训练单元得到的所述目标检测模型识别所述图片处理单元得到的所述标准图片,得到所述模型题号。
7.一种存储介质,该存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至3任一项所述的方法。
8.一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1至3任一项所述的方法。
CN201911312475.3A 2019-12-18 2019-12-18 一种题号检测方法、系统、存储介质及电子设备 Active CN111062377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911312475.3A CN111062377B (zh) 2019-12-18 2019-12-18 一种题号检测方法、系统、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911312475.3A CN111062377B (zh) 2019-12-18 2019-12-18 一种题号检测方法、系统、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN111062377A CN111062377A (zh) 2020-04-24
CN111062377B true CN111062377B (zh) 2024-02-23

Family

ID=70301042

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911312475.3A Active CN111062377B (zh) 2019-12-18 2019-12-18 一种题号检测方法、系统、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111062377B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111680635B (zh) * 2020-06-10 2024-01-19 广东小天才科技有限公司 一种文本识别的方法、装置、电子设备和存储介质
CN115661826A (zh) * 2020-12-25 2023-01-31 陈颖 用于纸质书写作业或试卷的页面题号识别与分割算法
CN115620330A (zh) * 2020-12-25 2023-01-17 陈颖 一种用于纸质书写作业或试卷的页面识别方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08329113A (ja) * 1995-05-26 1996-12-13 Canon Inc 画像情報処理装置
JP2006134104A (ja) * 2004-11-05 2006-05-25 Toshiba Corp 帳票読取装置
JP2007011528A (ja) * 2005-06-29 2007-01-18 Njk:Kk Ocr処理における認識対象項目の位置探索方法
JP2009147532A (ja) * 2007-12-12 2009-07-02 Canon Inc 情報処理装置及び情報処理方法
CN106294717A (zh) * 2016-08-08 2017-01-04 广东小天才科技有限公司 基于智能终端的搜题方法及装置
CN107798321A (zh) * 2017-12-04 2018-03-13 海南云江科技有限公司 一种试卷分析方法和计算设备
CN108388892A (zh) * 2018-05-04 2018-08-10 苏州大学 基于OpenCV的试卷自动处理系统及方法
CN109635729A (zh) * 2018-12-12 2019-04-16 厦门商集网络科技有限责任公司 一种表格识别方法及终端
CN110008933A (zh) * 2019-04-18 2019-07-12 江苏曲速教育科技有限公司 一种通用智能阅卷系统和方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08329113A (ja) * 1995-05-26 1996-12-13 Canon Inc 画像情報処理装置
JP2006134104A (ja) * 2004-11-05 2006-05-25 Toshiba Corp 帳票読取装置
JP2007011528A (ja) * 2005-06-29 2007-01-18 Njk:Kk Ocr処理における認識対象項目の位置探索方法
JP2009147532A (ja) * 2007-12-12 2009-07-02 Canon Inc 情報処理装置及び情報処理方法
CN106294717A (zh) * 2016-08-08 2017-01-04 广东小天才科技有限公司 基于智能终端的搜题方法及装置
CN107798321A (zh) * 2017-12-04 2018-03-13 海南云江科技有限公司 一种试卷分析方法和计算设备
CN108388892A (zh) * 2018-05-04 2018-08-10 苏州大学 基于OpenCV的试卷自动处理系统及方法
CN109635729A (zh) * 2018-12-12 2019-04-16 厦门商集网络科技有限责任公司 一种表格识别方法及终端
CN110008933A (zh) * 2019-04-18 2019-07-12 江苏曲速教育科技有限公司 一种通用智能阅卷系统和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
段露等.一种面向问卷图像的版面分析算法.《软件学报》.2017,第28卷(第2期),第234-245页. *

Also Published As

Publication number Publication date
CN111062377A (zh) 2020-04-24

Similar Documents

Publication Publication Date Title
US11790641B2 (en) Answer evaluation method, answer evaluation system, electronic device, and medium
CN111507330B (zh) 习题识别方法、装置、电子设备及存储介质
WO2022089170A1 (zh) 字幕区域识别方法、装置、设备及存储介质
CN111062377B (zh) 一种题号检测方法、系统、存储介质及电子设备
CN111291661B (zh) 一种屏幕中图标的文本内容的识别方法及设备
CN113537801B (zh) 板书处理方法、装置、终端和存储介质
CN112528799B (zh) 一种教学直播方法、装置、计算机设备和存储介质
CN111932418B (zh) 一种学生学习情况识别方法、系统、教学终端及存储介质
CN114821620A (zh) 基于行文本框纵向合并的文本内容提取识别方法
CN110852131B (zh) 一种考试卡的信息采集方法、系统及终端
CN112149680A (zh) 错字检测识别方法、装置、电子设备及存储介质
CN108509960B (zh) 一种文本朝向检测方法及装置
CN114419636A (zh) 文本识别方法、装置、设备以及存储介质
CN111027533B (zh) 一种点读坐标的变换方法、系统、终端设备及存储介质
CN110489933B (zh) 一种平面设计框架的生成方法及系统
CN110909723B (zh) 信息处理装置及计算机可读存储介质
CN115294573A (zh) 作业批改方法、装置、设备及介质
CN115546811A (zh) 一种识别印章的方法、装置、设备及存储介质
CN112686253A (zh) 一种用于电子白板的屏幕文字提取系统及方法
CN112818984A (zh) 标题生成方法、装置、电子设备和存储介质
CN111611986A (zh) 一种基于手指交互的焦点文本提取和识别方法及系统
CN111582281A (zh) 一种图片显示优化的方法、装置、电子设备和存储介质
CN114138214B (zh) 一种自动生成打印文件的方法、装置和电子设备
WO2023029116A1 (zh) 文本图像的排版方法、装置、电子设备及存储介质
US12051228B2 (en) Method and device for table extraction, and touch control display device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant