CN113723323A - 试卷信息获取方法及装置 - Google Patents
试卷信息获取方法及装置 Download PDFInfo
- Publication number
- CN113723323A CN113723323A CN202111026966.9A CN202111026966A CN113723323A CN 113723323 A CN113723323 A CN 113723323A CN 202111026966 A CN202111026966 A CN 202111026966A CN 113723323 A CN113723323 A CN 113723323A
- Authority
- CN
- China
- Prior art keywords
- test
- question
- test paper
- questions
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 165
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012545 processing Methods 0.000 claims description 40
- 230000011218 segmentation Effects 0.000 claims description 10
- 241000590419 Polygonia interrogationis Species 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 239000003973 paint Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明提供了一种试卷信息获取方法及装置,所述方法包括:对试卷结构进行切分,确定试题和答案;确定所述试题中每个小题的题型信息和知识点信息;建立所述试题和答案的关联关系。由此,通过应用本发明实施例提供的试卷信息获取方法,易于对试卷的试题和答案作出区分,且根据知识点对试题信息进行处理,便于后续对试题按照知识点进行归类和分析。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种试卷信息获取方法及装置。
背景技术
随着计算机以及移动终端技术的不断发展,越来越多的基于电子技术的应用正极大的丰富着人们的生活。
目前的试卷自动识别技术主要针对答题卡进行自动识别,这种方式虽然节省了阅卷时间,提高了阅卷准确率,但是也存在一定的问题:浪费纸张,同时由于考生需要在答题卡上进行涂卡,因此需要额外花费时间,且容易出现考生将答案涂在错误位置上的情况。
电子化考试系统正逐步被很多高校接受与使用,电子化考试使学生的考试试卷数字化,变成无形的东西,目前的电子考试系统需要将各种格式的电子试卷进行导入,在对试卷的结构化分析过程当中对各种题型和答案无法作出区分,容易出现各种错误导致读取和存储时数据出现错误。
发明内容
本发明实施例的目的是提供一种试卷信息获取方法及装置,以解决试卷的结构化分析过程当中对各种题型和答案无法作出区分,导致读取和存储时数据出现错误的问题。
为解决上述问题,第一方面,本发明提供了一种试卷信息获取方法,所述方法包括:
对试卷结构进行切分,确定试题和答案;
确定所述试题中每个小题的题型信息和知识点信息;
建立所述试题和答案的关联关系。
优选的,所述对试卷结构进行切分,确定试题和答案,包括:
在所述试题的每个小题前面设置有第一标识;
在所述小题的答案前设置有第二标识;
根据所述第一标识和第二标识,确定试题和答案。
优选的,所述第一标识为第一颜色,所述第二标识为第二颜色。
优选的,所述确定所述试题中每个小题的题型信息和知识点信息,包括:
通过数字题号、标点符号、字母字符和空行信息,将试题切分为多个小题;
通过识别试题文本的关键字段,识别试题中每个小题的题型信息和知识点信息。
优选的,所述对试卷结构进行切分之前,还包括:
获取试卷图片;
对所述试卷图片进行二值化处理;
对所述二值化处理后的试卷图片进行噪声去除处理;
对噪声去除处理后的试卷图片进行字符切割处理,生成试卷。
第二方面,本发明提供了一种试卷信息获取装置,所述装置包括:
切分单元,所述切分单元用于对试卷结构进行切分,确定试题和答案;
确定单元,所述确定单元用于确定所述试题中每个小题的题型信息和知识点信息;
建立单元,所述建立单元用于建立所述试题和答案的关联关系。
优选的,所述切分单元具体用于:
在所述试题的每个小题前面设置有第一标识;
在所述小题的答案前设置有第二标识;
根据所述第一标识和第二标识,确定试题和答案。
优选的,所述第一标识为第一颜色,所述第二标识为第二颜色。
优选的,所述确定单元具体用于:
通过数字题号、标点符号、字母字符和空行信息,将试题切分为多个小题;
通过识别试题文本的关键字段,识别试题中每个小题的题型信息和知识点信息。
优选的,所述装置还包括:
获取单元,所述获取单元用于获取试卷图片;
处理单元,所述处理单元用于对所述试卷图片进行二值化处理;
所述处理单元还用于,对所述二值化处理后的试卷图片进行噪声去除处理;
所述切分单元还用于,对噪声去除处理后的试卷图片进行字符切割处理,生成试卷。
由此,通过应用本发明实施例提供的试卷信息获取方法,易于对试卷的试题和答案作出区分,且根据知识点对试题信息进行处理,便于后续对试题按照知识点进行归类和分析。
附图说明
图1为本发明实施例提供的试卷信息获取方法流程图;
图2为本发明实施例提供的试卷信息获取方法的另一个流程示意图;
图3为本发明实施例提供的试卷信息获取装置结构示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
图1为本发明实施例提供的试卷信息获取方法流程图。如图1所示,该方法的执行主体可以是终端、试卷信息获取装置等。所述方法包括以下步骤:
步骤110,对试卷结构进行切分,确定试题和答案。
具体的,所述对试卷结构进行切分,确定试题和答案,包括:在所述试题的每个小题前面设置有第一标识;在所述小题的答案前设置有第二标识;根据所述第一标识和第二标识,确定试题和答案。
在一个实施例中,可以根据背景颜色,对第一标识和第二标识进行区分。比如,可以将第一标识设置为第一颜色,比如,灰色。可以将第二标识设置为第二颜色,比如,茶色。示例而非限定,本申请中,第一颜色和第二颜色也可以是其他不同的两种颜色,本申请对此并不限定。
在另一个实施例中,第一标识和第二标识可以是不同的符号,示例而非限定,第一标识可以是“●”号,第二标识可以是“■”,第一标识和第二标识也可以是其他不同的两种符号,本申请对此并不限定。
步骤120,确定所述试题中每个小题的题型信息和知识点信息。
具体的,所述确定所述试题中每个小题的题型信息和知识点信息,包括:
通过识别试题文本的关键字段,识别试题中每个小题的题型信息和知识点信息。
所述通过识别试题文本的关键字段,识别试题中每个小题的题型信息和知识点信息之前,还包括:通过数字题号、标点符号、字母字符和空行信息,将试题切分为多个小题。
在一个实施例中,可以通过数字题号,将试题拆分为多个小题,比如“一、选择题”下面有有“1、”、“2、”等,识别出试题,并将试题拆分为多个小题,小题可以是“一、选择题”下所包含的所有小的选择题,小题也可以是每一个独立的选择题。本申请对此并不限定。
在另一个实施例中,可以通过标点符号,识别出试题,比如,当试题题干中存在下划线时,则可以判定属于客观填空题。
可以理解的是,本申请仅以选择题为例进行说明,同样的也可以通过数字题号、标点符号、字母字符或空行信息中的任意一个或其任意组合,确定小题,其方式与上述类似,此处不再赘述。
在一个示例中,可以根据关键字段确定知识点信息,比如,小题为“等腰三角形中两条边的长度分别是7cm、3cm,第三条边长多少?”识别出关键字段“等腰三角形”、“边的长度”等,由此,可以将该小题的知识点信息确定为“三角形边长计算”。然后,将该小题添加进题库中的“三角形边长计算”的知识点下面。
同样的,对于其他小题,可以采用上述方法确定其知识点信息,由此,对一份试卷,可以汇总出其每个知识点的考察次数、考察方式等,以便于后续对该知识点的归类和分析。
可以理解的是,在另一个示例中,也可以采用其他的方式确定知识点信息,比如,对于计算题,可以根据图形信息,确定知识点信息,比如小题中出现的为圆柱的图形,则可以确定知识点信息为“圆柱”,小题中出现圆锥的图形,则可以确定知识点信息为“圆锥”。
在再一个示例中,也可以根据关键字段+图形信息的方式,确定知识点信息,其方法和上述两种方法类似,此处不再赘述。
识别出试题后,对答案进行识别,其中,对答案进行识别,可以采取图像识别技术。
步骤130,建立所述试题和答案的关联关系。
在识别出答案后,可以通过添加标识符的方式,建立试题中的每个小题和答案之间的关联关系。
示例而非限定,添加的标识符可以是数字、英文或其任意组合,本申请对此并不限定。
由此,通过应用本发明实施例提供的试卷信息获取方法,易于对试卷的试题和答案作出区分,且根据知识点对试题信息进行处理,便于后续对试题按照知识点进行归类和分析。
进一步地,图2为本发明实施例提供的试卷信息获取方法的另一个流程示意图。如图2所示,所述对试卷结构进行切分之前,还可以包括以下步骤:
步骤140,获取试卷图片。
其中,可以通过终端拍摄试卷图片,终端包括但不限于手机、摄像机等具有拍照功能的设备。也可以直接读取存储设备中预存的试卷图片。
步骤150,对所述试卷图片进行二值化处理。
以终端是手机为例,手机摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,为了让计算机更快的,更好的识别文字,需要先对彩色图进行处理,使图片只前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图了,由此,实现了对试卷图片的二值化处理。
步骤160,对所述二值化处理后的试卷图片进行噪声去除处理。
由于待识别的试卷图片的品质受限于输入设备、环境、以及文档的印刷质量,在对图片中印刷体字符进行识别处理前,需要根据噪声的特征对试卷图片进行去噪处理,提升识别处理的精确度。
噪声去除的方法,包括但不限于均值滤波法、自适应滤波法、中值滤波法、小波去噪法等。
步骤170,对噪声去除处理后的试卷图片进行字符切割处理,生成试卷。
其中,由于拍照条件的限制,经常造成字符粘连,断笔,因此极大影响了后续图片的识别,因此,通过字符切割处理,便于后续的图片识别。
由此,通过预先对试卷图片进行处理,便于后续获取试题和答案,提高了后续试卷信息获取的效率。
图3为本发明实施例提供的试卷信息获取装置结构示意图。如图3所示,该试卷信息获取装置包括:切分单元310、确定单元320和建立单元330。
切分单元310用于对试卷结构进行切分,确定试题和答案。
确定单元320用于确定所述试题中每个小题的题型信息和知识点信息。
建立单元330用于建立所述试题和答案的关联关系。
进一步地,切分单元310具体用于:
在所述试题的每个小题前面设置有第一标识;
在所述小题的答案前设置有第二标识;
根据所述第一标识和第二标识,确定试题和答案。
进一步地,所述第一标识为第一颜色,所述第二标识为第二颜色。
进一步地,所述确定单元320具体用于:
通过数字题号、标点符号、字母字符和空行信息,将试题切分为多个小题;
通过识别试题文本的关键字段,识别试题中每个小题的题型信息和知识点信息。
进一步地,该试卷信息获取装置300还包括:
获取单元340,用于获取试卷图片;
处理单元350,用于对所述试卷图片进行二值化处理;
所述处理单元350还用于,对所述二值化处理后的试卷图片进行噪声去除处理;
所述切分单元310还用于,对噪声去除处理后的试卷图片进行字符切割处理,生成试卷。
由此,通过应用本发明实施例提供的试卷信息获取装置,便于对试卷的试题和答案作出区分,且根据知识点对试题信息进行处理,便于后续对试题按照知识点进行归类和分析。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种试卷信息获取方法,其特征在于,所述方法包括:
对试卷结构进行切分,确定试题和答案;
确定所述试题中每个小题的题型信息和知识点信息;
建立所述试题和答案的关联关系。
2.根据权利要求1所述的试卷信息获取方法,其特征在于,所述对试卷结构进行切分,确定试题和答案,包括:
在所述试题的每个小题前面设置有第一标识;
在所述小题的答案前设置有第二标识;
根据所述第一标识和第二标识,确定试题和答案。
3.根据权利要求2所述的试卷信息获取方法,其特征在于,所述第一标识为第一颜色,所述第二标识为第二颜色。
4.根据权利要求1所述的试卷信息获取方法,其特征在于,所述确定所述试题中每个小题的题型信息和知识点信息,包括:
通过数字题号、标点符号、字母字符和空行信息,将试题切分为多个小题;
通过识别试题文本的关键字段,识别试题中每个小题的题型信息和知识点信息。
5.根据权利要求1所述的试卷信息获取方法,其特征在于,所述对试卷结构进行切分之前,还包括:
获取试卷图片;
对所述试卷图片进行二值化处理;
对所述二值化处理后的试卷图片进行噪声去除处理;
对噪声去除处理后的试卷图片进行字符切割处理,生成试卷。
6.一种试卷信息获取装置,其特征在于,所述装置包括:
切分单元,所述切分单元用于对试卷结构进行切分,确定试题和答案;
确定单元,所述确定单元用于确定所述试题中每个小题的题型信息和知识点信息;
建立单元,所述建立单元用于建立所述试题和答案的关联关系。
7.根据权利要求6所述的试卷信息获取装置,其特征在于,所述切分单元具体用于:
在所述试题的每个小题前面设置有第一标识;
在所述小题的答案前设置有第二标识;
根据所述第一标识和第二标识,确定试题和答案。
8.根据权利要求7所述的试卷信息获取装置,其特征在于,所述第一标识为第一颜色,所述第二标识为第二颜色。
9.根据权利要求6所述的试卷信息获取装置,其特征在于,所述确定单元具体用于:
通过数字题号、标点符号、字母字符和空行信息,将试题切分为多个小题;
通过识别试题文本的关键字段,识别试题中每个小题的题型信息和知识点信息。
10.根据权利要求6所述的试卷信息获取装置,其特征在于,所述装置还包括:
获取单元,所述获取单元用于获取试卷图片;
处理单元,所述处理单元用于对所述试卷图片进行二值化处理;
所述处理单元还用于,对所述二值化处理后的试卷图片进行噪声去除处理;
所述切分单元还用于,对噪声去除处理后的试卷图片进行字符切割处理,生成试卷。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111026966.9A CN113723323A (zh) | 2021-09-02 | 2021-09-02 | 试卷信息获取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111026966.9A CN113723323A (zh) | 2021-09-02 | 2021-09-02 | 试卷信息获取方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113723323A true CN113723323A (zh) | 2021-11-30 |
Family
ID=78681005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111026966.9A Pending CN113723323A (zh) | 2021-09-02 | 2021-09-02 | 试卷信息获取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113723323A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103853852A (zh) * | 2014-03-31 | 2014-06-11 | 广州视源电子科技股份有限公司 | 电子试卷的导入方法 |
CN106354740A (zh) * | 2016-05-04 | 2017-01-25 | 上海秦镜网络科技有限公司 | 一种电子试卷的导入方法 |
CN107784264A (zh) * | 2017-05-05 | 2018-03-09 | 合肥林翔智能科技有限公司 | 基于图像处理的答卷分析方法及系统 |
CN108764201A (zh) * | 2018-06-06 | 2018-11-06 | 宁波宁大教育设备有限公司 | 一种智能批改方法 |
CN109389061A (zh) * | 2018-09-26 | 2019-02-26 | 苏州友教习亦教育科技有限公司 | 试卷识别方法和系统 |
WO2019075820A1 (zh) * | 2017-10-20 | 2019-04-25 | 深圳市鹰硕技术有限公司 | 一种试卷批阅系统 |
CN109947836A (zh) * | 2019-03-21 | 2019-06-28 | 江西风向标教育科技有限公司 | 英语试卷结构化方法和装置 |
CN110110581A (zh) * | 2019-03-14 | 2019-08-09 | 杭州笔声智能科技有限公司 | 一种基于人工智能的试卷批改方法和系统 |
WO2020259060A1 (zh) * | 2019-06-26 | 2020-12-30 | 深圳中兴网信科技有限公司 | 试卷信息提取方法、系统及计算机可读存储介质 |
CN112506360A (zh) * | 2020-11-21 | 2021-03-16 | 陈颖 | 一种常规纸质书写作业或试卷的智能识别及批改方法 |
CN112560849A (zh) * | 2021-01-24 | 2021-03-26 | 中天恒星(上海)科技有限公司 | 基于神经网络算法的文理分割方法及系统 |
-
2021
- 2021-09-02 CN CN202111026966.9A patent/CN113723323A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103853852A (zh) * | 2014-03-31 | 2014-06-11 | 广州视源电子科技股份有限公司 | 电子试卷的导入方法 |
CN106354740A (zh) * | 2016-05-04 | 2017-01-25 | 上海秦镜网络科技有限公司 | 一种电子试卷的导入方法 |
CN107784264A (zh) * | 2017-05-05 | 2018-03-09 | 合肥林翔智能科技有限公司 | 基于图像处理的答卷分析方法及系统 |
WO2019075820A1 (zh) * | 2017-10-20 | 2019-04-25 | 深圳市鹰硕技术有限公司 | 一种试卷批阅系统 |
CN108764201A (zh) * | 2018-06-06 | 2018-11-06 | 宁波宁大教育设备有限公司 | 一种智能批改方法 |
CN109389061A (zh) * | 2018-09-26 | 2019-02-26 | 苏州友教习亦教育科技有限公司 | 试卷识别方法和系统 |
CN110110581A (zh) * | 2019-03-14 | 2019-08-09 | 杭州笔声智能科技有限公司 | 一种基于人工智能的试卷批改方法和系统 |
CN109947836A (zh) * | 2019-03-21 | 2019-06-28 | 江西风向标教育科技有限公司 | 英语试卷结构化方法和装置 |
WO2020259060A1 (zh) * | 2019-06-26 | 2020-12-30 | 深圳中兴网信科技有限公司 | 试卷信息提取方法、系统及计算机可读存储介质 |
CN112506360A (zh) * | 2020-11-21 | 2021-03-16 | 陈颖 | 一种常规纸质书写作业或试卷的智能识别及批改方法 |
CN112560849A (zh) * | 2021-01-24 | 2021-03-26 | 中天恒星(上海)科技有限公司 | 基于神经网络算法的文理分割方法及系统 |
Non-Patent Citations (1)
Title |
---|
路平;肖安;: "课程试卷分析与通用试题库结构设计", 江汉大学学报(自然科学版), no. 01, pages 52 - 55 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110348400B (zh) | 一种评分获取方法、装置及电子设备 | |
US10817741B2 (en) | Word segmentation system, method and device | |
CN106033544B (zh) | 基于模板匹配的试卷内容区域提取方法 | |
CN114549993B (zh) | 实验中线段图像的评分方法、系统、设备及可读存储介质 | |
CN108509988B (zh) | 一种试卷分数自动统计方法、装置、电子设备及存储介质 | |
CN110135225B (zh) | 样本标注方法及计算机存储介质 | |
CN112580503A (zh) | 一种作业批改方法、装置、设备及存储介质 | |
CN111062377B (zh) | 一种题号检测方法、系统、存储介质及电子设备 | |
CN112668580A (zh) | 一种文本识别方法、文本识别装置及终端设备 | |
CN108509960B (zh) | 一种文本朝向检测方法及装置 | |
CN114419636A (zh) | 文本识别方法、装置、设备以及存储介质 | |
CN114267046A (zh) | 一种文档图像的方向校正方法与装置 | |
CN113723323A (zh) | 试卷信息获取方法及装置 | |
CN110728193B (zh) | 一种脸部图像丰富度特征的检测方法及设备 | |
CN112991410A (zh) | 一种文本图像配准方法、电子设备及其存储介质 | |
CN112036343B (zh) | 答案提取方法、装置、计算机可读介质及电子设备 | |
CN111931759A (zh) | 一种试卷智能计分方法和移动端系统 | |
CN115083024A (zh) | 基于区域划分的签名识别方法、装置、介质及设备 | |
CN111611986B (zh) | 一种基于手指交互的焦点文本提取和识别方法及系统 | |
CN114299523A (zh) | 一种教辅作业识别批改分析方法和分析系统 | |
JP2006107534A (ja) | 文字認識方法および文字認識装置 | |
CN115546811A (zh) | 一种识别印章的方法、装置、设备及存储介质 | |
CN112906499A (zh) | 文本信息识别方法及装置 | |
CN115471846A (zh) | 一种图像矫正方法、装置、电子设备及可读存储介质 | |
CN114550181B (zh) | 一种小题识别方法、装置及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Room 1002, floor 10, block B, No. 18, Zhongguancun Street, Haidian District, Beijing 100044 Applicant after: Beijing Biyun shuchuang Technology Co.,Ltd. Address before: Room 1002, floor 10, block B, No. 18, Zhongguancun Street, Haidian District, Beijing 100044 Applicant before: Beijing yundie Zhixue Technology Co.,Ltd. |