CN108062333B - 劣质题目数据的处理方法和装置 - Google Patents
劣质题目数据的处理方法和装置 Download PDFInfo
- Publication number
- CN108062333B CN108062333B CN201610983452.5A CN201610983452A CN108062333B CN 108062333 B CN108062333 B CN 108062333B CN 201610983452 A CN201610983452 A CN 201610983452A CN 108062333 B CN108062333 B CN 108062333B
- Authority
- CN
- China
- Prior art keywords
- question
- questions
- standard
- inferior
- topic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 122
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000003252 repetitive effect Effects 0.000 claims 2
- 230000008569 process Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000003672 processing method Methods 0.000 description 5
- 238000012550 audit Methods 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B7/00—Electrically-operated teaching apparatus or devices working with questions and answers
- G09B7/02—Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种劣质题目数据的处理方法和装置,该方法包括:针对每条劣质题目数据,判断劣质题目数据中是否包含多道题目;若否,则根据题目作业标准对劣质题目数据中的题目进行标准化处理,以获取题目的规范题目;根据解答作业标准解答规范题目,以获取规范题干的解答数据。该方法实现了对劣质题目数据的处理,合理利用了数据资源,为后续满足用户检索的需求提供了基础。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种劣质题目数据的处理方法和装置。
背景技术
随着网络技术的发展,在线教育模式也不断普及,在线教育对于填补学校教育的课下空白非常必要,在线教育包括题目搜索,题目搜索需要有庞大的题库数据支持,因此,如何大规模、高速度、低成本地建设包含大量优质题目的题库以满足用户获取高质量解答内容的需求显得尤为重要。
在加工成优质题目的过程中,通常仅对比较规范的题干进行处理,如练习册上面的题目截图、用户拍照搜题的图片等,由于有些数据来源于网络资源提供的题目,提供的题目具有量大但质量不高的特点,经常会有一些劣质题目数据例如残缺题、排版杂乱无章的错题、一条数据内存在多个题目的多题等情况。目前,行业内一般不处理此类数据,容易造成数据资源浪费,并且这部分数据实际是具有用户检索的需求,因此,如何将劣质题目数据进行处理是目前亟需要解决的技术问题。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种劣质题目数据的处理方法,该方法实现了对劣质题目数据的处理,合理利用了数据资源,为后续满足用户检索的需求提供了基础。
本发明的第二个目的在于提出一种劣质题目数据的处理装置。
为了实现上述目的,本发明第一方面实施例的劣质题目数据的处理方法,包括:针对每条劣质题目数据,判断所述劣质题目数据中是否包含多道题目;若否,则根据题目作业标准对所述劣质题目数据中的题目进行标准化处理,以获取所述题目的规范题目;根据解答作业标准解答所述规范题目,以获取所述规范题干的解答数据。
根据本发明实施例的劣质题目数据的处理方法,针对每条劣质题目数据,判断劣质题目数据中是否包含多道题目,并在劣质题目数据中包括一道题目时,根据题目作业标准对劣质题目数据中的题目进行标准化处理,以获取题目的规范题目,以及根据解答作业标准解答规范题目,以获取规范题干的解答数据。由此,实现了对劣质题目数据的处理,合理利用了数据资源,为后续满足用户检索的需求提供了基础。
根据本发明的一个实施例,还包括:
若判断出所述劣质题目数据中包含多道题目,则根据题目拆分标准拆分出所述劣质题目数据中的多道题目;
根据所述解答作业标准分别解答拆分出的每道题目,以获取每道题目的解答数据。
根据本发明的一个实施例,在所述根据解答作业标准解答所述规范题目之前,还包括:
判断题目库中是否存在与所述规范题目相同的题目;
若否,则执行所述根据解答作业标准解答所述规范题目步骤。
根据本发明的一个实施例,所述根据题目作业标准对所述劣质题目数据中的题目进行标准化处理,以获取所述劣质题目的规范题目,包括:
获取与所述劣质题目匹配的参考题目;
将所述劣质题目、参考题目和题目作业标准发送至作业用户,以使所述作业用户根据所述参考题目和题目作业标准对所述劣质题目编辑;
将所述作业用户上传的编辑后的劣质题目作为所述劣质题目的规范题目。
根据本发明的一个实施例,还包括:
将拆分出的多道题目中的重复的题目删除,以生成第一题目集合;
将所述第一题目集合中与题目库中相同的题目删除,以生成第二题目集合;
所述根据所述解答作业标准分别解答拆分出的每道题目,包括:
根据所述解答作业标准分别解答所述第二题目集合中的题目。
为了实现上述目的,本发明第二方面实施例的劣质题目数据的处理装置,包括:第一判断模块,用于针对每条劣质题目数据,判断所述劣质题目数据中是否包含多道题目;第一处理模块,用于在所述劣质题目数据中包含一道题目时,根据题目作业标准对所述劣质题目数据中的题目进行标准化处理,以获取所述题目的规范题目;第一解答模块,用于根据解答作业标准解答所述规范题目,以获取所述规范题干的解答数据。
根据本发明实施例的劣质题目数据的处理装置,针对每条劣质题目数据,判断劣质题目数据中是否包含多道题目,并在劣质题目数据中包括一道题目时,根据题目作业标准对劣质题目数据中的题目进行标准化处理,以获取题目的规范题目,以及根据解答作业标准解答规范题目,以获取规范题干的解答数据。由此,实现了对劣质题目数据的处理,合理利用了数据资源,为后续满足用户检索的需求提供了基础。
根据本发明的一个实施例,还包括:
拆分模块,用于在判断出所述劣质题目数据中包含多道题目时,根据题目拆分标准拆分出所述劣质题目数据中的多道题目;
第二解答模块,用于根据所述解答作业标准分别解答拆分出的每道题目,以获取每道题目的解答数据。
根据本发明的一个实施例,还包括:
第二判断模块,用于判断题目库中是否存在与所述规范题目相同的题目;
其中,所述第一解答模块,具体用于:
在判断出所述题目库中不存在与所述规范题目相同的题目时,根据解答作业标准解答所述规范题目。
根据本发明的一个实施例,所述第一处理模块,包括:
获取单元,用于获取与所述劣质题目匹配的参考题目;
发送单元,用于将所述劣质题目、参考题目和题目作业标准发送至作业用户,以使所述作业用户根据所述参考题目和题目作业标准对所述劣质题目编辑;
处理单元,用于将所述作业用户上传的编辑后的劣质题目作为所述劣质题目的规范题目。
根据本发明的一个实施例,还包括:
去重模块,用于将拆分出的多道题目中的重复的题目删除,以生成第一题目集合;
删除模块,用于将所述第一题目集合中与题目库中相同的题目删除,以生成第二题目集合;
所述第二解答模块,具体用于:
根据所述解答作业标准分别解答所述第二题目集合中的题目。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,
图1是根据本发明一个实施例的劣质题目数据的处理方法的流程图;
图2是根据本发明另一个实施例的劣质题目数据的处理方法的流程图;
图3是本发明一个实施例解答新题目的流程图;
图4是根据本发明一个实施例的劣质题目数据的处理装置的结构示意图;
图5是根据本发明另一个实施例的劣质题目数据的处理装置的结构示意图;
图6是根据本发明再一个实施例的劣质题目数据的处理装置的结构示意图;
图7是根据本发明又一个实施例的劣质题目数据的处理装置的结构示意图;
图8是根据本发明另一个实施例的劣质题目数据的处理装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的劣质题目数据的处理方法和装置。
通常,在对题目进行解答的过程中,不满足规范题目要求的题目将被保存至脏数据库,通过该实施例的劣质题目数据的处理方法可将脏数据库中的每条劣质题目数据加工成优质题目。
其中,规范题目要求可以包括但不限于题目的格式要求和内容要求。
其中,需要理解的是,脏数据库中保存有在题目数据正常处理的过程的各个环节中,因为不满足规范题目要求被举报出来的劣质题目数据。
图1是根据本发明一个实施例的劣质题目数据的处理方法的流程图。
如图1所示,该劣质题目数据的处理方法包括以下步骤:
S11,针对每条劣质题目数据,判断劣质题目数据中是否包含多道题目,若否,则执行步骤S12和S13,若是,则执行步骤S14和S15。
具体地,针对脏数据库中的每条题目数据,可判断劣质题目数据中是否包含多道题目。
S12,根据题目作业标准对劣质题目数据中的题目进行标准化处理,以获取题目的规范题目。
在本发明的一个实施例中,在判断出劣质题目数据中包含一道题目后,获取与劣质题目匹配的参考题目,并将劣质题目、参考题目和题目作业标准发送至作业用户,以使作业用户根据参考题目和题目作业标准对劣质题目编辑,然后,将作业用户上传的编辑后的劣质题目作为劣质题目的规范题目。
具体而言,在判断出劣质题目数据中包含一道题目后,可从题目库中查询是否存在与规范题目相似的题目,如果存在,则将劣质题目、参考题目和题目作业标准发送至作业用户。对应地,用户可根据参考题目和题目作业标准对劣质题目数据中的题目进行编辑。
其中,需要理解的是,题目库中保存的是规范题干和对应的解答数据。
其中,需要理解的是,如果根据参考题目和题目作业标准无法将劣质题目数据中的题目编辑成规范题目,则将该劣质题目数据中的题目删除,不再对该劣质题目数据中的题目进行处理。
S13,根据解答作业标准解答规范题目,以获取规范题干的解答数据。
在本发明的一个实施例中,为了避免对重复的题目再次进行处理,在获取规范题目之后,可判断题目库中是否存在与规范题目相同的题目,若判断出题目库中不存在与规范题目相同的题目,则根据解答作业标准解答规范题目。
其中,需要理解的是,若判断出题目库中存在与规范题目相同的题目,则不再对规范题目进行解答。
S14,根据题目拆分标准拆分出劣质题目数据中的多道题目。
其中,题目拆分标准是预设设置的。
其中,题目拆分标准是根据各道题之间是否是同一个考点来区分的。
作为一种示例性性的实施方式,如果多道题目是同一个考点的内容,或者是同一个问题的多个小问,则不算多题,不予拆分。如果是多道题目是针对不同的知识点,则根据知识点对题目进行拆分。
作为一种示例性的实施方式,可将劣质题目数据和拆题目的作业标准发送至对应的作业人员,以使作业人员根据拆题目的作业标准对劣质题目数据进行题目拆分。对应地,接收作业人员上传的拆分结果,根据拆分结果即可获取劣质题目数据中的多道题目。
S15,根据解答作业标准分别解答拆分出的每道题目,以获取每道题目的解答数据。
根据本发明实施例的劣质题目数据的处理方法,针对每条劣质题目数据,判断劣质题目数据中是否包含多道题目,并在劣质题目数据中包括一道题目时,根据题目作业标准对劣质题目数据中的题目进行标准化处理,以获取题目的规范题目,以及根据解答作业标准解答规范题目,以获取规范题干的解答数据。由此,实现了对劣质题目数据的处理,合理利用了数据资源,为后续满足用户检索的需求提供了基础。
图2是根据本发明另一个实施例的劣质题目数据的处理方法的流程图。
如图2所示,该劣质题目数据的处理方法包括以下步骤:
S21,针对每条劣质题目数据,判断劣质题目数据中是否包含多道题目,若否,则执行步骤S22和S23,若是,则执行步骤S24至S27。
具体地,针对脏数据库中的每条题目数据,可判断劣质题目数据中是否包含多道题目。
S22,根据题目作业标准对劣质题目数据中的题目进行标准化处理,以获取题目的规范题目。
在本发明的一个实施例中,在判断出劣质题目数据中包含一道题目后,获取与劣质题目匹配的参考题目,并将劣质题目、参考题目和题目作业标准发送至作业用户,以使作业用户根据参考题目和题目作业标准对劣质题目编辑,然后,将作业用户上传的编辑后的劣质题目作为劣质题目的规范题目。
具体而言,在判断出劣质题目数据中包含一道题目后,可从题目库中查询是否存在与规范题目相似的题目,如果存在,则将劣质题目、参考题目和题目作业标准发送至作业用户。对应地,用户可根据参考题目和题目作业标准对劣质题目数据中的题目进行编辑。
其中,需要理解的是,题目库中保存的是规范题干和对应的解答数据。
其中,需要理解的是,如果根据参考题目和题目作业标准无法将劣质题目数据中的题目编辑成规范题目,则将该劣质题目数据中的题目删除,不再对该劣质题目数据中的题目进行处理。
S23,根据解答作业标准解答规范题目,以获取规范题干的解答数据。
在本发明的一个实施例中,为了避免对重复的题目再次进行处理,在获取规范题目之后,可判断题目库中是否存在与规范题目相同的题目,若判断出题目库中不存在与规范题目相同的题目,则根据解答作业标准解答规范题目。
其中,需要理解的是,若判断出题目库中存在与规范题目相同的题目,则不再对规范题目进行解答。
S24,根据题目拆分标准拆分出劣质题目数据中的多道题目。
其中,题目拆分标准例如可以是题号。
作为一种示例性性的实施方式,如果多道题目是同一个考点的内容,或者是同一个问题的多个小问,则不算多题,不予拆分。如果是多道题目是针对不同的知识点,则根据知识点对题目进行拆分。
作为一种示例性的实施方式,可将劣质题目数据和拆题目的作业标准发送至对应的作业人员,以使作业人员根据拆题目的作业标准对劣质题目数据进行题目拆分。对应地,接收作业人员上传的拆分结果,根据拆分结果即可获取劣质题目数据中的多道题目。
S25,将拆分出的多道题目中的重复的题目删除,以生成第一题目集合。
S26,将第一题目集合中与题目库中相同的题目删除,以生成第二题目集合。
举例而言,如果第一题目集合中包括题目1、题目2和题目3,可查询题目库中是否存在题目1、题目2和题目3,若判断出题目库中存在题目3,则将第一题目集合中的题目3删除,以形成包含题目1和题目2的第二题目集合。
S27,根据解答作业标准分别解答第二题目集合中的题目。
在本发明的一个实施例中,在获取第二题目集合后,针对第二题目集合中的每道题目,可控制对应的作业人员对对应的题目是否为规范题干进行判断,如果不是,则将对应的题目保存至脏数据库中,或者,将对应的题目删除。如果是,则根据解答作业标准对对应的题目进行解答,以生成对应题目的解答数据。
根据本发明实施例的劣质题目数据的处理方法,针对每条劣质题目数据,判断劣质题目数据中是否包含多道题目,并在劣质题目数据中包含多道题目时,将拆分出的多道题目中的重复的题目删除,以生成第一题目集合,并将第一题目集合中与题目库中相同的题目删除,以生成第二题目集合,以及根据解答作业标准分别解答第二题目集合中的题目。由此,对拆分出的多道题目进行去重,并对去重后的题目进行解答,避免了对已存在的题目再次处理,实现了对劣质题目数据的处理,合理利用了数据资源,为后续满足用户检索的需求提供了基础。
其中,需要理解的是,在对劣质题目数据进行处理,获取规范题目,或者拆分出的不重复的题目后,可将规范题目和拆分出的不重复的题目作为新题目进行解答,解答新题目的示例的过程,如图3所示。
图3是本发明一个实施例解答新题目的流程图。
S31,获取待处理的新题目。
其中,待处理的新题目的格式可以为文本格式,也可以图片格式,该实施例对待处理的新题目的格式不作限定。
S32,对新题目进行识别,以确定新题目的属性信息。
其中,属性信息包括学科信息。
作为一种示例性的实施方式,在获取待处理的新题目后,可通过机器识别的方式对新题目进行学科识别,并根据识别结果确定新题目的学科信息。
其中,学科信息可以包括但不限于语文、数学、地理、历史、物理等。
S33,根据学科信息确定新题目的处理环节信息。
其中,处理环节信息包括多个处理环节和多个处理环节的处理顺序。
其中,需要理解的是,新题目的学科不同,所对应的处理环节信息是不同的。
举例而言,在新题目的学科信息为数学时,该新题目依次所经过的处理环节为分学段、新题目优化、新题目优化的审核、解答、解答审核、标注知识点、排版、排版审核过程。
又例如,在新题目的学科信息为语文时,该新题目依次所经过的处理环节为分知识点、知识点审核、解答、解答审核。
又例如,在新题目的学科信息为政治时,该新题目依次所经过的处理环节为分题型、题型审核、分学段、学段审核、解答、解答审核。
又例如,在新题目的学科信息英文时,该新题目依次所经过的处理环节为分题型、题型审核、解答、解答审核。
S34,在按照处理顺序调用处理环节对新题目进行处理的过程中,如果当前处理环节需要处理人员,则根据学科信息和当前处理环节确定对新题目进行处理的处理人员。
也就是说,在对新题目经过当前处理环节时,如果当前处理环节需要处理人员对新题目进行处理,根据学科信息和当前处理环节确定对应的处理人员。
在本发明的一个实施例中,在确定新题目的学科信息后,如果该新题目的处理环节中还包括分学段处理环节,在并在确定处理人员时,可根据学科信息、学段信息和当前处理环节确定对新题目进行处理的处理人员,由此,更加准确地调用对应的处理人员对不同学科的不同学段的新题目进行处理。
S35,控制处理人员按照处理标准对当前处理环节进行处理。
其中,处理标准与当前处理环节对应。
需要理解的是,对于同一个学科而言,不同学段所对应的处理标准也是不同的。
举例而言,在确定新题目为小学数学三年级题目的计算题时,在对应的处理人员对该新题目进行解答的过程中,将解答处理环节对应的处理标准提供给对应的处理人员,假设处理标准为写详细的计算过程,不可以列连等式,直至写出答案,在对应的处理人员对该新题目进行解答时,对应的处理人员可根据处理标准进行新题目的解答。
又例如,在确定新题目的为判断题,在对对应的处理人员对该新题目进行解答的过程中,将解答处理环节对应的处理标准提供给对应的处理人员,假设处理标准为写详细的判断过程,以及判断结果,在对应的处理人员对该新题目进行判断时,对应的处理人员可根据处理标准写明判断过程以及判断结果。
综合可以看出,在对待处理的新题目进行处理的过程中,确定新题目的学科信息,并根据学科信息确定新题目的处理环节信息,并按照处理顺序调用对应的处理环节对新题目处理,并在每个处理环节,根据学科信息和当前处理环节确定对新题目进行处理的处理人员,以及控制处理人员按照处理标准对当前处理环节进行处理,由此,使得用户无需同时掌握新题目、解答等各个环节的生产方法且具备这种专业能力才可以进行作业,降低了对用户的专业化程度要求较高,不同用户通过分工合作,准确对新题目进行快速处理。
为了实现上述实施例,本发明还提出了一种本发明实施例的劣质题目数据的处理装置。
图4是根据本发明一个实施例的劣质题目数据的处理装置的结构示意图。
如图4所示,该本发明实施例的劣质题目数据的处理装置可以包括第一判断模块110、第一处理模块120和第一解答模块130,其中:
第一判断模块110用于针对每条劣质题目数据,判断劣质题目数据中是否包含多道题目。
第一处理模块120用于在劣质题目数据中包含一道题目时,根据题目作业标准对劣质题目数据中的题目进行标准化处理,以获取题目的规范题目。
第一解答模块130用于根据解答作业标准解答规范题目,以获取规范题干的解答数据。
在本发明的一个实施例中,在图4所示的基础上,如图5所示,该装置还可以包括拆分模块140和第二解答模块150,其中:
拆分模块140用于在判断出劣质题目数据中包含多道题目时,根据题目拆分标准拆分出劣质题目数据中的多道题目。
第二解答模块150用于根据解答作业标准分别解答拆分出的每道题目,以获取每道题目的解答数据。
在本发明的一个实施例中,在图4所示的基础上,如图6所示,该装置还可以包括第二判断模块160,其中,
第二判断模块160用于判断题目库中是否存在与规范题目相同的题目。
其中,第一解答模块130具体用于:
在判断出题目库中不存在与规范题目相同的题目时,根据解答作业标准解答规范题目。
其中,需要说明的是,图6所示的装置实施例中的第二判断模块160也可以包含在图5所示的装置实施例中,本发明对此不作限定。
在本发明的一个实施例中,在图5所示的基础上,如图7所示,该装置还可以包括去重模块170和删除模块180,其中:
去重模块170用于将拆分出的多道题目中的重复的题目删除,以生成第一题目集合。
删除模块180用于将第一题目集合中与题目库中相同的题目删除,以生成第二题目集合。
其中,第二解答模块150具体用于:
根据解答作业标准分别解答第二题目集合中的题目。
在本发明的一个实施例中,如图8所示,第一处理模块120可以包括获取单元121、发送单元122和处理单元123,其中:
获取单元121用于获取与劣质题目匹配的参考题目。
发送单元122用于将劣质题目、参考题目和题目作业标准发送至作业用户,以使作业用户根据参考题目和题目作业标准对劣质题目编辑。
处理单元123用于将作业用户上传的编辑后的劣质题目作为劣质题目的规范题目。
其中,需要说明的是,前述对劣质题目数据的处理方法实施例的解释说明也适用于该实施例的劣质题目数据的处理装置,其实现原理类似,此处不再赘述。
根据本发明实施例的劣质题目数据的处理装置,针对每条劣质题目数据,判断劣质题目数据中是否包含多道题目,并在劣质题目数据中包括一道题目时,根据题目作业标准对劣质题目数据中的题目进行标准化处理,以获取题目的规范题目,以及根据解答作业标准解答规范题目,以获取规范题干的解答数据。由此,实现了对劣质题目数据的处理,合理利用了数据资源,为后续满足用户检索的需求提供了基础。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (8)
1.一种劣质题目数据的处理方法,其特征在于,包括以下步骤:
针对每条劣质题目数据,依据考点判断所述劣质题目数据中是否包含多道题目,其中,所述劣质题目数据包括行业内不处理的由网络资源提供的残缺题和排版杂乱无章的错题;
若否,则获取与所述劣质题目匹配的参考题目,并根据题目作业标准和所述参考题目对所述劣质题目数据中的题目进行标准化处理,以获取所述题目的规范题目;
根据解答作业标准解答所述规范题目,以获取所述规范题目的解答数据;
若判断出所述劣质题目数据中包含多道题目,则根据题目拆分标准拆分出所述劣质题目数据中的多道题目;
根据所述解答作业标准分别解答拆分出的每道题目,以获取每道题目的解答数据;
在获取所述规范题目,或者拆分出不重复的题目之后,还包括:将规范题目和拆分出不重复的题目作为新题目进行解答,其中,对所述新题目的解答步骤包括:确定所述新题目的属性信息,根据所述属性信息确定所述规范题目的处理环节信息,并根据所述处理环节信息解答所述新题目,其中,所述属性信息包括学科信息。
2.如权利要求1所述的方法,其特征在于,在所述根据解答作业标准解答所述规范题目之前,还包括:
判断题目库中是否存在与所述规范题目相同的题目;
若否,则执行所述根据解答作业标准解答所述规范题目步骤。
3.如权利要求1所述的方法,其特征在于,所述根据题目作业标准和所述参考题目对所述劣质题目数据中的题目进行标准化处理,以获取所述题目的规范题目,包括:
将所述劣质题目、参考题目和题目作业标准发送至作业用户,以使所述作业用户根据所述参考题目和题目作业标准对所述劣质题目编辑;
将所述作业用户上传的编辑后的劣质题目作为所述劣质题目的规范题目。
4.如权利要求1所述的方法,其特征在于,还包括:
将拆分出的多道题目中的重复的题目删除,以生成第一题目集合;
将所述第一题目集合中与题目库中相同的题目删除,以生成第二题目集合;
所述根据所述解答作业标准分别解答拆分出的每道题目,包括:
根据所述解答作业标准分别解答所述第二题目集合中的题目。
5.一种劣质题目数据的处理装置,其特征在于,包括:
第一判断模块,用于针对每条劣质题目数据,依据考点判断所述劣质题目数据中是否包含多道题目,其中,所述劣质题目数据包括行业内不处理的由网络资源提供的残缺题和排版杂乱无章的错题;
第一处理模块,用于在所述劣质题目数据中包含一道题目时,获取与所述劣质题目匹配的参考题目,并根据题目作业标准和所述参考题目对所述劣质题目数据中的题目进行标准化处理,以获取所述题目的规范题目;
第一解答模块,用于根据解答作业标准解答所述规范题目,以获取所述规范题目的解答数据;
拆分模块,用于若判断出所述劣质题目数据中包含多道题目,则根据题目拆分标准拆分出所述劣质题目数据中的多道题目;
第二解答模块,用于根据所述解答作业标准分别解答拆分出的每道题目,以获取每道题目的解答数据;
在获取所述规范题目,或者拆分出不重复的题目之后,还包括:将规范题目和拆分出不重复的题目作为新题目进行解答,其中,对所述新题目的解答步骤包括:确定所述新题目的属性信息,根据所述属性信息确定所述规范题目的处理环节信息,并根据所述处理环节信息解答所述新题目,其中,所述属性信息包括学科信息。
6.如权利要求5所述的装置,其特征在于,还包括:
第二判断模块,用于判断题目库中是否存在与所述规范题目相同的题目;
其中,所述第一解答模块,具体用于:
在判断出所述题目库中不存在与所述规范题目相同的题目时,根据解答作业标准解答所述规范题目。
7.如权利要求5所述的装置,其特征在于,所述第一处理模块,包括:
发送单元,用于将所述劣质题目、参考题目和题目作业标准发送至作业用户,以使所述作业用户根据所述参考题目和题目作业标准对所述劣质题目编辑;
处理单元,用于将所述作业用户上传的编辑后的劣质题目作为所述劣质题目的规范题目。
8.如权利要求5所述的装置,其特征在于,还包括:
去重模块,用于将拆分出的多道题目中的重复的题目删除,以生成第一题目集合;
删除模块,用于将所述第一题目集合中与题目库中相同的题目删除,以生成第二题目集合;
所述第二解答模块,具体用于:
根据所述解答作业标准分别解答所述第二题目集合中的题目。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610983452.5A CN108062333B (zh) | 2016-11-08 | 2016-11-08 | 劣质题目数据的处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610983452.5A CN108062333B (zh) | 2016-11-08 | 2016-11-08 | 劣质题目数据的处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108062333A CN108062333A (zh) | 2018-05-22 |
CN108062333B true CN108062333B (zh) | 2022-03-01 |
Family
ID=62137297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610983452.5A Active CN108062333B (zh) | 2016-11-08 | 2016-11-08 | 劣质题目数据的处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108062333B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109359122B (zh) * | 2018-12-07 | 2020-12-11 | 国家电网有限公司 | 一种题库试题在线更新系统及方法 |
CN111723231B (zh) * | 2019-03-20 | 2023-10-17 | 北京百舸飞驰科技有限公司 | 一种题目预测方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1641624A (zh) * | 2004-01-14 | 2005-07-20 | 英业达股份有限公司 | 历史电子试卷生成方法以及系统 |
CN1641625A (zh) * | 2004-01-14 | 2005-07-20 | 英业达股份有限公司 | 数学电子试卷生成方法以及系统 |
CN102436547A (zh) * | 2011-10-24 | 2012-05-02 | 北京商纳科技有限公司 | 一种教学用错题统计方法及系统 |
CN105069721A (zh) * | 2015-08-04 | 2015-11-18 | 广东小天才科技有限公司 | 一种自动检查题目错误的方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150122689A (ko) * | 2013-02-27 | 2015-11-02 | 자누아 에듀케이셔널 서비시즈, 엘엘씨 | 근원적인 학생 시험 오류 검출 시스템 및 방법 |
JP2015049578A (ja) * | 2013-08-30 | 2015-03-16 | アクセンチュア グローバル サービシズ リミテッド | ユーザとの自然会話能力を備えたエージェントシステム、エージェント制御方法、エージェント制御プログラム、及び記録媒体 |
CN103853852B (zh) * | 2014-03-31 | 2018-05-22 | 广州视源电子科技股份有限公司 | 电子试卷的导入方法 |
US20160180216A1 (en) * | 2014-12-17 | 2016-06-23 | International Business Machines Corporation | Techniques for answering user questions based on user expertise level |
CN105373594B (zh) * | 2015-10-23 | 2019-05-21 | 广东小天才科技有限公司 | 一种筛查题库中重复试题的方法及装置 |
CN105810036A (zh) * | 2016-04-08 | 2016-07-27 | 尚学博志(上海)教育科技有限公司 | 用于网络习题训练的题目呈现与答题结果统计方法及系统 |
-
2016
- 2016-11-08 CN CN201610983452.5A patent/CN108062333B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1641624A (zh) * | 2004-01-14 | 2005-07-20 | 英业达股份有限公司 | 历史电子试卷生成方法以及系统 |
CN1641625A (zh) * | 2004-01-14 | 2005-07-20 | 英业达股份有限公司 | 数学电子试卷生成方法以及系统 |
CN102436547A (zh) * | 2011-10-24 | 2012-05-02 | 北京商纳科技有限公司 | 一种教学用错题统计方法及系统 |
CN105069721A (zh) * | 2015-08-04 | 2015-11-18 | 广东小天才科技有限公司 | 一种自动检查题目错误的方法及装置 |
Non-Patent Citations (2)
Title |
---|
Are extended-matching multiple-choice items appropriate for a final test in medical education?;Beullens,J等;《MEDICAL TEACHER》;20020731;第390-395页 * |
小学语文完形测试的设计与效度研究;曲春蕊;《中国优秀硕士学位论文全文数据库(电子期刊)》;20131215;第H129-66页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108062333A (zh) | 2018-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107957957B (zh) | 测试用例的获取方法和装置 | |
US10860948B2 (en) | Extending question training data using word replacement | |
US10853570B2 (en) | Redaction engine for electronic documents with multiple types, formats and/or categories | |
US8316022B2 (en) | Information processing apparatus and information processing method | |
US11176317B2 (en) | Automated file merging through content classification | |
US20150187353A1 (en) | Audio tagging | |
US8886660B2 (en) | Method and apparatus for tracking a change in a collection of web documents | |
US10229098B2 (en) | Automated processing of transcripts, transcript designations, and/or video clip load files | |
CN106681299A (zh) | 事件解析装置、事件解析系统、事件解析方法及事件解析程序 | |
CN109472017B (zh) | 获得待生成裁判文书本院认为段相关信息的方法及装置 | |
CN113342942B (zh) | 语料自动化获取方法、装置、计算机设备及存储介质 | |
CN110019067A (zh) | 一种日志分析方法及系统 | |
CN109284492B (zh) | 一种生成通知文书的方法和装置 | |
CN108062333B (zh) | 劣质题目数据的处理方法和装置 | |
CN110851630A (zh) | 一种深度学习标注样本的管理系统及方法 | |
CN106202050B (zh) | 主题信息获取方法、装置和电子设备 | |
CN113641838A (zh) | 用于数据标注的装置及方法、电子设备、可读存储介质 | |
US10902187B2 (en) | Automated processing of transcripts, transcript designations, and/or video clip load files | |
US11416685B2 (en) | System and method for artificial intelligence driven document analysis, including automated reuse of predictive coding rules based on management and curation of datasets or models | |
US20020129350A1 (en) | Method of automatic software installation in hand personal computer production line | |
CN111126052B (zh) | 功能点生成方法、装置、电子设备及计算机可读存储介质 | |
CN109739817A (zh) | 一种在大数据存储系统中存储数据文件的方法及系统 | |
JP6085574B2 (ja) | 作業記録内容解析装置及び方法及びプログラム | |
US20230326225A1 (en) | System and method for machine learning document partitioning | |
US20240321129A1 (en) | Task Completion Path Generator for Instructional Content |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230607 Address after: 6001, 6th Floor, No.1 Kaifeng Road, Shangdi Information Industry Base, Haidian District, Beijing, 100085 Patentee after: Beijing Baige Feichi Technology Co.,Ltd. Address before: 100085 no.3189, 3rd floor, building 1, yard 2, Cuiwei Road, Haidian District, Beijing Patentee before: XIAOCHUANCHUHAI EDUCATION TECHNOLOGY (BEIJING) CO.,LTD. |