CN106021432B

CN106021432B - 基于颜色识别的互动内容转化方法

Info

Publication number: CN106021432B
Application number: CN201610321313.6A
Authority: CN
Inventors: 杨玉林
Original assignee: Hangzhou Constitutive Science And Technology Co Ltd
Current assignee: Hangzhou Constitutive Science And Technology Co Ltd
Priority date: 2016-05-16
Filing date: 2016-05-16
Publication date: 2019-01-25
Anticipated expiration: 2036-05-16
Also published as: CN106021432A

Abstract

本发明公开了一种基于颜色识别的互动内容转化方法：技术方案1：为待转化HTML内容设置不同互动区域；并为不同区域设置并涂刷不同的背景色；通过HTML语法进行全文解析，根据背景色以及出现位置判断内容所属互动区域。技术方案2：为待转化HTML内容设置不同互动区域，并为不同区域设置并涂刷不同背景色；根据待转化内容中的文字特征为不同互动区域设置识别条件；顺序查询，当待转化内容符合某个互动区域识别条件时，对相应内容自动涂上对应背景色，直到查询至HTML文件结束；当查询到标题时，自动在标题前增加分割线，将待转化内容根据分割线分割成若干互动内容；对相邻分割线间的互动内容进行HTML语法全文解析，根据背景色以及出现位置判断内容所属互动区域。

Description

基于颜色识别的互动内容转化方法

技术领域

本发明涉及互联网教育领域，更具体地说，本发明涉及一种将电子资料通过HTML超文本语言转化为互动内容的方法。

背景技术

随着移动互联网在教育领域的发展，无纸化互动答题模式正成为一种趋势：教师在移动互联网上出题，学生通过移动终端参与答题。在这种大背景下，产生了一个新的需求，即将大量传统的电子资料输入到网络中，按照各类移动互联网平台的格式转化为题库。如将一个WORD文档形式的题库拆分成适用于移动互联网进行互动的HTML文件格式，且要求将题库转化为单个题目，每个题目的标题、问项与答题各部分相对独立。

传统的纯手工录入方式，效率低下，人力成本高。如何将互动内容准确、高效、直观、方便地批量导入互动教育平台，供用户答题，已经成为各类教育互动平台亟需解决的问题。

发明内容

本发明的目的在于针对现有技术的不足，提供一种将电子资料通过HTML超文本标记语言转化为互动内容的方法。该方法基于HTML超文本标记语言及其背景色处理技术，可实现向教育互动平台批量导入题库，提高了互动内容转化效率，降低人员输入的劳力成本。该发法既利用了HTML文件颜色表达丰富，易于人工识别，又利用了HTML文件采用文本流，易于数据处理的优点。

为实现上述目的，本发明采用的技术方案1包括以下步骤：

步骤1、为待转化HTML内容中的不同互动区域分别设置不同的背景色，所述的互动区域包括标题、问项和答项。

步骤2、根据上一步的设置用背景刷将待转化HTML内容中不同互动区域刷涂相应的背景色，根据背景色的不同判断该内容所属互动区域,具有背景色的文本在HTML节点中会用backgroundColor属性进行标识。

步骤3、对上一步的结果根据HTML语法进行全文解析，根据节点的backgroundColor属性值是否满足某一背景色设置以及出现位置判断该部分内容所属互动区域，背景色相同且相邻的部分属于同一个互动区域，最终形成由标题、问项和答项组成的互动内容。

技术方案1中的互动区域还包括标题标签、标题内容、问项标签、问项内容、答项标签、答项内容，根据不同互动内容的复杂性要求进行配置。

采用的技术方案2包括以下步骤：

步骤1、如果待转化内容不是HTML文件，将待转化内容转化为HTML文件。

步骤2、对上一步生成的HTML文件进行预处理，删除隐藏的内容，去除背景色以及分割线。

步骤3、为待转化HTML内容中的不同互动区域分别设置不同的背景色，所述的互动区域包括标题、问项和答项。

步骤4、根据待转化HTML内容中的文字特征为互动区域设置各自的识别条件。

步骤5、顺序查询，当查询到待转化HTML内容符合某一识别条件时，将对应内容自动涂上该识别条件对应的背景色，相应文本节点backgroundColor属性设置为该属性值，直到查询至整个HTML文件结束。当查询到标题时，自动在标题前增加分割线,即<hr>节点。

步骤6、通过背景色查看识别出的互动区域是否满足要求，如果不满足，则用背景刷刷出相应的背景色或清除背景色。

步骤7、将待转化HTML内容根据分割线分割成若干互动内容，对相邻分割线之间的互动内容进行背景色识别，最终形成由标题、问项和答项组成的互动内容。

技术方案2中的互动区域还包括标题标签、标题内容、问项标签、问项内容、答项标签、答项内容，根据不同互动内容的复杂性要求进行配置。

技术方案2中的文字特征采用正则表达式进行描述,待转化HTML内容符合某一识别条件即匹配该正则表达式。

采用本发明，与传统处理电子资料的识别方法相比，具有如下优点：

(1)实现将电子资料批量转化为互动内容，可操作性强，提高了转化效率，降低了人力成本；

(2)将待转化内容转化为HTML文件，可利用HTML文件丰富的背景色表现手段，对不同互动区域如题目，问项与答项进行标记，界面直观，不同互动区域之间分界清楚，易于识别；

(3)基于HTML超文本标记语言的待转化内容属于文本流，且HTML语言本身具有强大解析工具：与基于二进制流文件颜色解析难度相比，HTML文本只需要判断节点backgroundColor值即可知其背景色，进一步获知该节点所属互动区域，解析难度大幅降低；同理，只需判断<hr>节点即可知上部分内容与下部分内容分属不同的单题，算法简单明了；

(4)支持对自动涂背景色后的HTML文件进行涂色修正，即采用背景刷刷涂相应的背景色或清除背景色，其结果相当于将对应内容放入某互动区域或者从互动区域移除，实现对自动识别结果进行修正，操作方便，提高准确率；

(5)可根据HTML内容中的文字特征自定义识别条件，利用正则表达式丰富的匹配算法实现自动识别，将待转化HTML内容分解为若干个题，将每个题中分解为题目、问项与答项等互动区域，具有实施方便，效率高等优点。

附图说明

图1：互动内容转化流程图；

图2：待转化HTML文件；

图3：互动区域背景色设置；

图4：互动区域自动识别条件；

图5：互动区域自动识别结果；

图6：互动区域自动识别调整结果/刷涂结果；

图7：互动转化结果。

具体实施方式

下面结合附图和具体实施例对本发明作进一步详细说明。

本实施例实现将图2的待转化HTML内容转化为图7的互动内容，本实施例分别通过下面的技术方案实现。

技术方案1：

步骤1、为待转化HTML内容中的不同互动区域分别设置不同的背景色如图3所示，将标题标签互动区域的背景色设置为红色，标题内容互动区域的背景色设置为橙色，问项标签互动区域的背景色设置为黄色，问项内容互动区域的背景色设置为绿色，答项标签互动区域的背景色设置为蓝色，答项内容互动区域的背景色设置为紫色。

步骤2、根据上一步的设置用背景刷在待转化HTML内容中不同互动区域刷出相应的背景色，可以为不同互动区域的背景色设置工具刷，例如将标题标签刷为红色背景色，标题内容刷为橙色背景色，问项标签刷为黄色背景色，问项内容刷为绿色背景色，答项标签刷为蓝色背景色，答项内容刷为紫色背景色，如图6所示，具有背景色的文本节点backgroundColor属性值为相应颜色。

步骤3、根据HTML语法解析标有背景色的全文内容，根据背景色识别出该部分内容所属互动区域，最终形成由标题标签、标题内容、问项标签、问项内容、答项标签和答项内容组成的互动内容，最终的互动转化结果如图7所示。

技术方案2，互动内容转化流程图如图1所示：

步骤1、将待转化内容转化为HTML文件如图2所示。

步骤2、对上一步生成的HTML文件进行预处理，删除隐藏的内容，去除背景色,即去掉backgroundColor属性值，以及分割线，即去掉<hr>节点。

步骤3、为待转化HTML内容中的不同互动区域分别设置不同的背景色，如图3所示，将标题标签互动区域的背景色设置为红色，标题内容互动区域的背景色设置为橙色，问项标签互动区域的背景色设置为黄色，问项内容互动区域的背景色设置为绿色，答项标签互动区域的背景色设置为蓝色，答项内容互动区域的背景色设置为紫色。

步骤4、根据待转化HTML内容中的文字特征为互动区域设置各自的识别条件，如在本实施例中如图4所示，标题标签的识别条件为：“将由0～9数字组成的2位数加.的识别为标题标签，如正则表达式表示为“[0-9]{2}\.”；标题内容的识别条件为：“将标题标签和第一个问项标签之间的文本、图片等自动识别为标题内容”；问项标签的识别条件为：“将()内包括A，B，C，D，E和若干空格的识别为问项标签，如正则表达式表示为“\(\s*[A-D]\ s*\)”；问项内容的识别条件为：“将问项标签与其它标签之间的文本、图片等自动识别为问项内容”；答项标签的识别条件为：将【】内包括A，B，C，D，E和若干空格的识别为答案标签，如正则表达式表示为“【\s*[A-D]\s*】；答项内容的识别条件为：将答项标签和下一个标签之间的文本、图片等自动识别为答项内容并涂上答项内容背景色。

步骤5、顺序查询，当查询到待转化HTML内容符合某个识别条件时，将对应内容自动涂上该识别条件对应的背景色，相应文本节点backgroundColor属性设置为该属性值，直到查询至整个HTML文件结束。其中，查询到标题时，自动在标题前增加分割线。如在本实施例中，“01.”“02.”“03.”符合标题标签识别条件，即正则表达式“[0-9]{2}\.”，自动涂上标题标签背景色红色，并在标题前增加分割线；“(A)”“(B)”“(C)”“(D)”符合问项标签识别条件，自动涂上问项标签背景色黄色；“【D】”“【AB】”符合答项标签识别条件，自动涂上答项标签背景色蓝色；将标题标签和第一个问项标签之间的文本、图片等自动识别为标题内容，如将“不是压强的单位的是？”“请问不是水果的是？”“一辆作匀速直线运动的汽车，在6S内通过相隔远60m的两点,则汽车为速率？答：V＝s/t＝60/6＝10m/s,汽车的速率为10m/s”识别为标题内容；将问项标签与其它标签之间的文本、图片等自动识别为问项内容，如“Pa”“Bar”“汞柱”“N”“面包”“玉米”“香蕉”“苹果”符合问项内容识别条件，自动涂上问项内容背景色。如图5所示为互动区域自动识别结果。

步骤6、通过背景色查看识别出的互动区域是否满足要求，在本实施例中“一辆作匀速直线运动的汽车，在6S内通过相隔远60m的两点,则汽车为速率？答：V＝s/t＝60/6＝ 10m/s,汽车的速率为10m/s”自动识别为标题内容不合适，采用背景刷将互动区域“则汽车为速率？”刷为问项内容背景色绿色；将互动区域“答V＝s/t＝60/6＝10m/s,汽车的速率为10m/s。”刷为答项内容背景色紫色。刷涂结果如图6所示。

步骤7、将待转化HTML内容根据分割线分割成若干互动内容，对相邻分割线之间的互动内容进行背景色识别，最终形成由标题标签、标题内容、问项标签、问项内容、答项标签和答项内容组成的互动内容，最终的互动转化结果如图7所示。

虽然本发明披露如上，但本发明并非限定于此。任何不脱离本发明精神范围内的各种修改，如将本发明的背景色替换为前景色，或者通过HTML语言将颜色识别技术用在其它领域，均在本发明的保护范围内。

Claims

1.一种基于颜色识别的互动内容转化方法，其特征在于，该方法包括以下步骤：

步骤1、将待转化内容转化为HTML文件；

步骤2、对上一步生成的HTML文件进行预处理，删除隐藏的内容，去除背景色以及分割线；

步骤3、为待转化HTML内容中的不同互动区域分别设置相应的背景色，所述的互动区域包括标题、问项和答项；

步骤4、根据待转化HTML内容中的文字特征为互动区域设置各自的识别条件；

步骤5、顺序查询，当查询到待转化HTML内容符合某一识别条件时，将对应内容自动涂上该识别条件对应的背景色，相应文本节点backgroundColor属性设置为该属性值，直到查询至整个HTML文件结束；当查询到标题时，自动在标题前增加分割线，即<hr>节点；

步骤6、通过背景色查看识别出的互动区域是否满足要求，如果不满足，则用背景刷刷出相应的背景色或清除背景色；

2.如权利要求1所述的一种基于颜色识别的互动内容转化方法，其特征在于：所述的互动区域还包括标题标签、标题内容、问项标签、问项内容、答项标签、答项内容，根据不同互动内容的复杂性要求进行配置。

3.如权利要求1所述的一种基于颜色识别的互动内容转化方法，其特征在于：所述的文字特征采用正则表达式进行描述，待转化HTML内容符合某一识别条件即匹配该正则表达式。