CN108492224A - 基于深度学习在线教育学生综合画像标签管理系统 - Google Patents
基于深度学习在线教育学生综合画像标签管理系统 Download PDFInfo
- Publication number
- CN108492224A CN108492224A CN201810196188.XA CN201810196188A CN108492224A CN 108492224 A CN108492224 A CN 108492224A CN 201810196188 A CN201810196188 A CN 201810196188A CN 108492224 A CN108492224 A CN 108492224A
- Authority
- CN
- China
- Prior art keywords
- student
- data
- portrait
- content
- acquisition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013135 deep learning Methods 0.000 title claims abstract description 29
- 238000005516 engineering process Methods 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 39
- 230000006399 behavior Effects 0.000 claims abstract description 26
- 238000005065 mining Methods 0.000 claims abstract description 14
- 238000012550 audit Methods 0.000 claims abstract description 9
- 230000000007 visual effect Effects 0.000 claims abstract description 8
- 230000010354 integration Effects 0.000 claims abstract description 6
- 239000000700 radioactive tracer Substances 0.000 claims abstract description 6
- 238000005457 optimization Methods 0.000 claims abstract description 5
- 238000004140 cleaning Methods 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims description 21
- 230000004927 fusion Effects 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 10
- 230000009471 action Effects 0.000 claims description 7
- 230000006698 induction Effects 0.000 claims description 6
- 230000007786 learning performance Effects 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 210000004556 brain Anatomy 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 5
- 238000007418 data mining Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 230000007177 brain activity Effects 0.000 claims description 4
- 210000005252 bulbus oculi Anatomy 0.000 claims description 4
- 238000013079 data visualisation Methods 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 claims description 3
- 210000001508 eye Anatomy 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000005422 blasting Methods 0.000 claims description 2
- 210000003710 cerebral cortex Anatomy 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 230000019771 cognition Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 claims description 2
- 238000011161 development Methods 0.000 claims description 2
- 230000018109 developmental process Effects 0.000 claims description 2
- 238000009826 distribution Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 claims description 2
- 230000014759 maintenance of location Effects 0.000 claims description 2
- 238000000513 principal component analysis Methods 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims description 2
- 238000012800 visualization Methods 0.000 claims description 2
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 238000007670 refining Methods 0.000 claims 1
- 238000007781 pre-processing Methods 0.000 abstract description 3
- 230000008901 benefit Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000009412 basement excavation Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 241000270322 Lepidosauria Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
基于深度学习在线教育学生综合画像标签管理系统,包括数据采集单元、数据预处理单元、画像标签提炼单元,以及成果输出与展现单元;对学生学习内容、行为、态度、体征和成果数据,采用埋点技术,脑波采集技术,视点追踪技术,图像识别技术,文本挖掘技术和深度学习算法,将从多个数据源采集获取到的数据进行数据整合、数据审核与清洗;从基础数据中筛选重要维度信息,提炼代表性画像标签,并形成自上而下的完整标签体系;将画像标签成果,以恰当的逻辑和可视化方式进行展现和场景应用。对学生群体与个体层级能力的科学评定,以系统的方式实现对学生群体与个体层级能力的科学评定与展现,有效地指导学生培养方案与教学内容计划的优化与提升。
Description
技术领域
本发明属于IPC分类中G06F电数字数据处理或G06Q专门适用于教育预测目的的数据处理系统或方法中的画像标签技术,涉及网络埋点、图像识别、文本挖掘、深度学习等领域,尤其是基于深度学习在线教育学生综合画像标签管理系统。
背景技术
在线教育即e-Learning,或称远程教育、在线学习,现行概念中一般指的是指一种基于网络的学习行为,与网络培训概念相似。
埋点技术是网站分析的一种常用的数据采集方法,它通过在网站页面关键位置植入多段代码,追踪用户在平台每个界面上的系列行为,事件之间相互独立。可以用于建立用户画像,还原用户行为模型。文本挖掘技术是指对文本的表示及其特征项的选取,是文本挖掘、信息检索中的基本问题。它将无结构的原始文本转化为结构化的计算机可以识别和处理的信息,从而建立数学模型来描述和代替文本,最终实现从大量文本中挖掘有效信息的目的。文本语义分析是识别文本主题、类别与意义等语义信息的过程,在自然语言处理、信息过滤、信息分类、信息检索、语义挖掘等领域都普遍应用。图像识别技术,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。它将无结构的图像识别成具体结构化的计算机可以识别和处理的信息。图像识别用视觉传感器或摄像头和计算机来模拟人眼和大脑,进行物体识别、跟踪和测量,进而做图形处理让计算机理解真实世界。图像识别技术有很多应用场景,如:人脸识别、拍照识别、物体识别等各种图像场景的识别。深度学习技术具有分布式特征表达、自动特征提取、端到端机器学习和良好的泛化能力等优势,在语音识别、图像识别和自然语言处理等很多领域得到令人瞩目的成功应用。同时其强大的归纳能力也使得其在标签提炼等问题上有着非常优异的效果。例如,训练分类判别模型,需大量的样本数据多次迭代训练,数据须具有判别对象的基本特征,有不同的背景角度区分,数据样本越丰富,模型的识别精度越高。
相关专利文献公开较少。例如:
中国专利申请201510944668.6提出一种基于大数据的用户画像建立方法和用户画像管理系统,其利用有效时间期限内的用户行为和/或内容建立一个临时用户画像,并且使该临时用户画像从用户画像当中继承与有效时间期限内的用户行为和/或内容相匹配的描述性标签属性,而当有效时间期限内的用户行为和/或内容与用户画像的描述性标签属性不匹配时,则在临时用户画像中新建描述性标签属性。本发明能够实现根据用户行为和/或内容数据对用户画像的有效维护,特别是在用户行为和/或内容发生阶越式突变的情况下,能够快速淘汰分布统计规律上占有优势但已经不符合用户当前内容和行为的累积数据的影响。
中国专利申请201510965619.0提出一种用户画像构建方法,首先通过分布式爬虫爬取互联网各类数据并融合打通形成海量知识库;然后获取的上网日志并将上网日志与知识库进行匹配生成用户基础标签;结合电信运营商特有的客户关系管理(CRM)数据及地理位置数据构建用户属性标签;对标签数据进行权重及衰减因子处理生成用户基础画像,并且可以结合行业用户的特征及行业客户数据做个性化的数据挖掘,生成符合行业应用的用户画像并对外提供服务。本发明的优点在于能够为客户提供精确的全网用户画像,充分利用互联网数据,为用户分析、产品推荐、精准营销等应用服务提供方便。
中国专利申请201510564860.2公开了一种构建用户画像的方法。其中,构建用户画像的方法包括:获取用户互联网上网日志数据并进行预处理,对预处理后的互联网上网日志数据进行特征提取,得到用户的属性特征,然后基于已建立的多维特征库训练的标签分类,根据用户的属性特征在多维特征库中进行匹配,得到用户的多维度属性标签,根据多维度属性标签构建用户画像。通过上述方式,本发明能够构建出全息的多维度用户画像,从而能够满足运营商/企业/公司快速精准广告投放和用户群体的消费行为的推荐。
中国专利申请201611162106.7提供了一种用于在线教育及合成教学多媒体对象的方法和系统。该用于合成教学多媒体对象的方法包括:根据教学对象的个性化需求信息从多媒体资源库中选择多个多媒体资源;利用所述多个多媒体资源合成教学多媒体对象。根据教学对象的个性化需求信息从多媒体资源库中选择多个多媒体资源并合成教学多媒体对象,可以针对教学对象的实际需求灵活合成及提供个性化的教学多媒体,从而使教学对象能够更方便地进行针对性学习,为用户带来了更好的体验。
中国专利申请201510054208.6提供了一种在线教育测评系统,包括:知识图谱单元,包含一个或多个知识点,及所述一个或多个知识点间的关联关系;试题单元,包括一个或多个待测试题,每一所述待测试题与所述知识点中的一个或多个绑定,并根据每一所述待测试题与所述知识点的联系确定每一所述待测试题的权重值;测评单元,根据所述权重值从所述待测试题中选择部分或全部待测试题作为测评试题,并交由被测评者测评;结果生成单元,根据所述被测评者的测评结果生成一测评结果报告。采用上述技术方案后,可将测试的知识点间的关系图谱化,并在最终的测评报告中显示出被测评者在哪些知识点掌握不够。
当前教育领域的数据虽然繁多,但孤岛效益明显,缺乏对学生系统的刻画与评估。
发明内容
本发明的目的是提供基于深度学习在线教育学生综合画像标签管理系统,以解决上述不足,能够支撑面向学生群体与个体层级能力的科学评定与展现,进而有效地指导学生培养方案与教学内容计划的优化与提升。
本发明的目的将通过以下技术措施来实现:基于深度学习在线教育学生综合画像标签管理系统,包括依次连接的数据采集单元、数据预处理单元、画像标签提炼单元,以及成果输出与展现单元;其中:
1)所述数据采集单元用于从多个数据源进行数据的采集获取与存储,具体包括:
a.数据采集单元利用埋点技术采集学生线上平台行为路径与行为内容等信息并存储;
b.数据采集单元利用脑波采集技术采集学生在线下学习过程中的大脑活动状态等信息并存储;
c.数据采集单元利用视点追踪技术采集学生在线下学习过程中的目光焦点位置等信息并存储。
2)所述数据预处理单元将采集获取到的数据进行数据整合,数据审核与清洗,具体包括:
a.数据整合,基于身份证号或学籍号统一标识,将以上采集多源异构数据进行横向融合;
b.数据清洗,针对以上采集数据进行完整性和有效性审核,剔除或调整其中的无效值与异常值;
3)所述画像标签提炼单元用于从基础数据中筛选重要维度信息,提炼代表性画像标签,并形成自上而下的完整标签体系,具体包括:
a.利用深度学习技术,从学生线上行为内容与行为轨迹等信息中提炼包括学生的内容偏好,行为模式,学习风格,学习态度,学习表现在内的线上学习模式标签并存储;
b.利用图像识别技术将学生在线下学习过程中的目光焦点位置与浏览内容进行匹配,锁定学生学习的重点关注内容与浏览行为模式,结合对脑波状态的解读,提炼包括学生注意力水平,学生视点稳定性在内的线下学习状态标签并存储;
c.利用文本挖掘技术针对学生线上线下评论进行中文分词、互信息计算、主题内容提炼,提炼学生评论的目标对象、情感倾向与内容要点,形成学生主观态度标签并存储;
d.利用数据挖掘技术对各类标签进行分类与上层归纳提炼,形成自上而下的完整标签体系;
4)所述成果输出与展现单元用于将画像标签成果,以恰当的逻辑和可视化方式进行展现和场景应用,具体包括:
a.利用数据可视化技术选择体系中的代表性画像标签,以折线图,柱状图,散点图,饼图,地图,热力图,关系图,漏斗图,仪表盘等在内的各种形式,结合表与文字,进行综合化、立体化呈现;
b.将标签开放为可选项,支持用户通过对标签的筛选与组合,锁定特定学生群体,进行定向的辅导优化与策略制定。
尤其是,基于深度学习在线教育学生综合画像标签管理系统的使用方法,包括九个步骤,步骤1至步骤4对应数据采集单元,步骤5至步骤7对应数据预处理单元,步骤8对应画像标签提炼单元,步骤9对应成果输出与展现单元,其中:
步骤1:对线上行为进行埋点采集;
利用埋点技术采集学生线上平台行为路径与行为内容等信息;
步骤2:对脑波状态尽心该脑波采集;
利用脑波采集技术采集学生在线下学习过程中的大脑活动状态等信息;
步骤3:对视点轨迹进行视点轨迹采集;
利用视点追踪技术采集学生在线下学习过程中的目光焦点位置等信息;
步骤4:对原始数据进行数据预处理;
基于身份证号或学籍号类统一标识,将采集到的多源异构数据进行横向融合;同时进行完整性和有效性审核,剔除或调整其中的无效值与异常值;
步骤5:基于基础数据集市中的线上学习模式进行深度学习处理;
利用深度学习技术,从学生线上行为内容与行为轨迹等信息中提炼包括学生的内容偏好,行为模式,学习风格,学习态度,学习表现在内的线上学习模式标签;
步骤6:基于基础数据集市中的线下学习状态进行图像识别处理;
利用图像识别技术将学生在线下学习过程中的目光焦点位置与浏览内容进行匹配,锁定学生学习的重点关注内容与浏览行为模式,结合对脑波状态的解读,提炼包括学生注意力水平,学生视点稳定性在内的线下学习状态标签;
步骤7:基于基础数据集市中的主观学习评论进行文本挖掘处理;
利用文本挖掘技术针对学生线上线下评论进行中文分词、互信息计算、主题内容提炼,提炼学生评论的目标对象、情感倾向与内容要点,形成学生主观态度标签;
步骤8:画像标签体系构建;
利用数据挖掘技术对各类标签进行分类与上层归纳提炼,形成自上而下的完整标签体系;
步骤9:画像系统输出与展现;
以系统的方式,将画像标签的成果,以恰当的逻辑和可视化方式进行展现和场景应用。
本发明的优点和效果:利用埋点技术、脑波采集技术、视点追踪技术等前沿技术实现对学生线上线下全面资料的采集,采用文本挖掘技术、图像识别技术和深度学习技术,完成对代表性画像标签的高效归纳与高效提炼,最终建立具有行业普适性的画像标签体系,弥补行业领域的空白。
附图说明
图1为本发明工作流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
实施例,如附图1所示,基于深度学习在线教育学生综合画像标签管理系统的使用方法,其中:
步骤1埋点采集将利用网页埋点技术预先对网页进行植入JS SDK代码等处理,从而使得学生针对每一个网页的浏览行为和点击行为都得以被记录,记录的内容可以完整反应学生在线上平台的完整浏览路径,锁定其查看的网页内容;
步骤2脑波采集将利用头戴式脑波采集仪器,通过对大脑皮层电压变化的探测,并进行差分、数模转换等处理,实现对学生在整个学习过程中的脑电波的变化情况的留存记录,进而实现对大脑即时活动状态的勘测与记录;
步骤3视点轨迹采集将利用眼动仪等头戴设备,通过对眼球浏览过程中眼球焦点的位置与状态,采集学生在整个学习过程中的对于浏览内容的目光焦点位置变化等信息,进而实现对学生即时关注位置的勘测与记录;
步骤4数据预处理将基于学生身份证号或学籍号类统一标识,将以上步骤中采集到的多源异构数据进行横向融合,即进行字段级的融合,而非记录级的融合。在融合之后,进一步对新数据集进行完整性和有效性审核,识别出其中的无效值,如并表后的Null值,字符型空白等,以及包括不符合常理,如日均学习时长超过24小时,以及不符合领域内业务认知,如单次文档浏览时长超过5小时异常值,针对这部分数据进行剔除或调整,如针对空值的填充操作,以及针对离群值的阈值限定操作;
步骤5深度学习处理将利用深度学习技术,在步骤4预处理后的数据基础之上,从学生线上行为内容与行为轨迹等信息中提炼包括学生的内容偏好,行为模式,学习风格,学习态度,学习表现在内的线上学习模式标签,如学习活跃度、学习投入度、自我效能感、交互参与度、快速学习能力等;
前述中,步骤6图像识别处理将利用图像识别技术,对步骤3中学生在学习过程中的目光焦点位置与对应的具体浏览内容进行匹配,识别获得学生在每个时刻的浏览内容和完整的浏览内容链条,并基于对页面浏览内容的划分与判定,锁定学生学习过程中的重点关注内容,以及其特有的浏览行为模式,提炼包括学生内容形式偏好、学生视觉色彩偏好、视点稳定性在内的学习状态标签;
前述中,步骤7文本挖掘处理将利用文本挖掘技术针对学生线上线下评论进行一系列的处理,包括基于隐马尔科夫链进行中文文本分词、针对分词结果进行互信息计算、基于狄利克雷分布进行内容的主题分类判定,进而提炼获得学生评论内容的实体对,拆解获得学生评论的目标对象、针对对象的情感倾向与内容要点,形成学生的主观态度标签;
前述中,步骤8画像标签体系构建将利用层次聚类、主成分分析等降维挖掘技术对各类标签进行分类,并基于领域内业务认知在建模结果的基础上进行上层的归纳提炼,形成一个自上而下的完整标签体系;
前述中,步骤9系统输出与展现将利用数据可视化技术,结合折线图、饼图、条形图、地理热图、仪表盘等各种图形、以及文字、表格等形式,以系统的方式,将画像标签的成果进行输出,一方面通过群体级分析报告、可视化大屏对学生综合画像进行宏观层面的描绘刻画,另一方面通过详细的个人级报告,对学生微观特征进行解读与展现。
通过本发明,在线教育的学生可以实现其线上线下全面资料的采集,并形成具有代表性的完整画像标签,从宏观和微观两个层面实现对学生特征的全面细致刻画,弥补行业领域的空白,有效支撑对于学生的定向引导和对于教学的定向优化。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及实施例内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (7)
1.基于深度学习在线教育学生综合画像标签管理系统,包括数据采集单元、数据预处理单元、画像标签提炼单元,以及成果输出与展现单元;其特征在于,
a.从多个数据源进行数据的采集获取与存储;
b.将采集获取到的数据进行数据整合、数据审核与清洗;
c.从基础数据中筛选重要维度信息,提炼代表性画像标签,并形成自上而下的完整标签体系;
d.将画像标签成果,以恰当的逻辑和可视化方式进行展现和场景应用。
2.如权利要求1所述的基于深度学习在线教育学生综合画像标签管理系统,其特征在于,从多个数据源进行数据的采集获取与存储,包括:
a.利用埋点技术采集学生线上平台行为路径与行为内容等信息并存储;
b.利用脑波采集技术采集学生在线下学习过程中的大脑活动状态等信息并存储;
c.利用视点追踪技术采集学生在线下学习过程中的目光焦点位置等信息并存储。
3.如权利要求1所述的基于深度学习在线教育学生综合画像标签管理系统其特征在于,将采集获取到的数据进行数据整合、数据审核与清洗,包括:
a.数据整合,基于身份证号或学籍号统一标识,将以上采集多源异构数据进行横向融合;
b.数据清洗,针对以上采集数据进行完整性和有效性审核,剔除或调整其中的无效值与异常值。
4.如权利要求1所述的基于深度学习在线教育学生综合画像标签管理系统,其特征在于,从基础数据中筛选重要维度信息,提炼代表性画像标签,并形成自上而下的完整标签体系,包括:
a.利用深度学习技术,从学生线上行为内容与行为轨迹等信息中提炼包括学生的内容偏好,行为模式,学习风格,学习态度,学习表现在内的线上学习模式标签并存储;
b.利用图像识别技术将学生在线下学习过程中的目光焦点位置与浏览内容进行匹配,锁定学生学习的重点关注内容与浏览行为模式,结合对脑波状态的解读,提炼包括学生注意力水平,学生视点稳定性在内的线下学习状态标签并存储;
c.利用文本挖掘技术针对学生线上线下评论进行中文分词、互信息计算、主题内容提炼,提炼学生评论的目标对象、情感倾向与内容要点,形成学生主观态度标签并存储;
d.利用数据挖掘技术对各类标签进行分类与上层归纳提炼,形成自上而下的完整标签体系。
5.如权利要求1所述的基于深度学习在线教育学生综合画像标签管理系统,其特征在于:将画像标签成果,以恰当的逻辑和可视化方式进行展现和场景应用,包括:
a.利用数据可视化技术选择体系中的代表性画像标签,以折线图,柱状图,散点图,饼图,地图,热力图,关系图,漏斗图,仪表盘等在内的各种形式,结合表与文字,进行综合化、立体化呈现;
b.将标签开放为可选项,支持用户通过对标签的筛选与组合,锁定特定学生群体,进行定向的辅导优化与策略制定。
6.如权利要求1所述的基于深度学习在线教育学生综合画像标签管理系统,其特征在于:使用方法包括九个步骤,步骤1至步骤4对应数据采集单元,步骤5至步骤7对应数据预处理单元,步骤8对应画像标签提炼单元,步骤9对应成果输出与展现单元,其中:
步骤1:对线上行为进行埋点采集;利用埋点技术采集学生线上平台行为路径与行为内容等信息;
步骤2:对脑波状态尽心该脑波采集;利用脑波采集技术采集学生在线下学习过程中的大脑活动状态等信息;
步骤3:对视点轨迹进行视点轨迹采集;利用视点追踪技术采集学生在线下学习过程中的目光焦点位置等信息;
步骤4:对原始数据进行数据预处理;基于身份证号或学籍号类统一标识,将采集到的多源异构数据进行横向融合;同时进行完整性和有效性审核,剔除或调整其中的无效值与异常值;
步骤5:基于基础数据集市中的线上学习模式进行深度学习处理;利用深度学习技术,从学生线上行为内容与行为轨迹等信息中提炼包括学生的内容偏好,行为模式,学习风格,学习态度,学习表现在内的线上学习模式标签;
步骤6:基于基础数据集市中的线下学习状态进行图像识别处理;利用图像识别技术将学生在线下学习过程中的目光焦点位置与浏览内容进行匹配,锁定学生学习的重点关注内容与浏览行为模式,结合对脑波状态的解读,提炼包括学生注意力水平,学生视点稳定性在内的线下学习状态标签;
步骤7:基于基础数据集市中的主观学习评论进行文本挖掘处理;利用文本挖掘技术针对学生线上线下评论进行中文分词、互信息计算、主题内容提炼,提炼学生评论的目标对象、情感倾向与内容要点,形成学生主观态度标签;
步骤8:画像标签体系构建;利用数据挖掘技术对各类标签进行分类与上层归纳提炼,形成自上而下的完整标签体系;
步骤9:画像系统输出与展现;以系统的方式,将画像标签的成果,以恰当的逻辑和可视化方式进行展现和场景应用。
7.如权利要求6所述的基于深度学习在线教育学生综合画像标签管理系统,其特征在于:在使用方法中,
步骤1埋点采集将利用网页埋点技术预先对网页进行植入JS SDK代码等处理,从而使得学生针对每一个网页的浏览行为和点击行为都得以被记录,记录的内容可以完整反应学生在线上平台的完整浏览路径,锁定其查看的网页内容;
步骤2脑波采集将利用头戴式脑波采集仪器,通过对大脑皮层电压变化的探测,并进行差分、数模转换等处理,实现对学生在整个学习过程中的脑电波的变化情况的留存记录,进而实现对大脑即时活动状态的勘测与记录;
步骤3视点轨迹采集将利用眼动仪等头戴设备,通过对眼球浏览过程中眼球焦点的位置与状态,采集学生在整个学习过程中的对于浏览内容的目光焦点位置变化等信息,进而实现对学生即时关注位置的勘测与记录;
步骤4数据预处理将基于学生身份证号或学籍号类统一标识,将以上步骤中采集到的多源异构数据进行横向融合,即进行字段级的融合,而非记录级的融合;在融合之后,进一步对新数据集进行完整性和有效性审核,识别出其中的无效值,包括并表后的Null值和字符型空白,还包括不符合常理日均学习时长超过24小时的情况,以及单次文档浏览时长超过5小时异常值的不符合领域内业务认知,针对这部分数据进行剔除或调整,包括针对空值的填充操作,以及针对离群值的阈值限定操作;
步骤5深度学习处理将利用深度学习技术,在步骤4预处理后的数据基础之上,从学生线上行为内容与行为轨迹等信息中提炼包括学生的内容偏好,行为模式,学习风格,学习态度,学习表现在内的线上学习模式标签,包括学习活跃度、学习投入度、自我效能感、交互参与度、快速学习能力;
步骤6图像识别处理将利用图像识别技术,对步骤3中学生在学习过程中的目光焦点位置与对应的具体浏览内容进行匹配,识别获得学生在每个时刻的浏览内容和完整的浏览内容链条,并基于对页面浏览内容的划分与判定,锁定学生学习过程中的重点关注内容,以及其特有的浏览行为模式,提炼包括学生内容形式偏好、学生视觉色彩偏好、视点稳定性在内的学习状态标签;
步骤7文本挖掘处理将利用文本挖掘技术针对学生线上线下评论进行一系列的处理,包括基于隐马尔科夫链进行中文文本分词、针对分词结果进行互信息计算、基于狄利克雷分布进行内容的主题分类判定,进而提炼获得学生评论内容的实体对,拆解获得学生评论的目标对象、针对对象的情感倾向与内容要点,形成学生的主观态度标签;
步骤8画像标签体系构建将利用层次聚类、主成分分析降维挖掘技术对各类标签进行分类,并基于领域内业务认知在建模结果的基础上进行上层的归纳提炼,形成一个自上而下的完整标签体系;
步骤9系统输出与展现将利用数据可视化技术,结合包括折线图、饼图、条形图、地理热图和仪表盘各种图形,以及文字或表格形式,以系统的方式,将画像标签的成果进行输出,一方面通过群体级分析报告、可视化大屏对学生综合画像进行宏观层面的描绘刻画,另一方面通过详细的个人级报告,对学生微观特征进行解读与展现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810196188.XA CN108492224A (zh) | 2018-03-09 | 2018-03-09 | 基于深度学习在线教育学生综合画像标签管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810196188.XA CN108492224A (zh) | 2018-03-09 | 2018-03-09 | 基于深度学习在线教育学生综合画像标签管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108492224A true CN108492224A (zh) | 2018-09-04 |
Family
ID=63338128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810196188.XA Pending CN108492224A (zh) | 2018-03-09 | 2018-03-09 | 基于深度学习在线教育学生综合画像标签管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108492224A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109521919A (zh) * | 2018-10-17 | 2019-03-26 | 深圳壹账通智能科技有限公司 | 基于浮层界面的埋点方法、装置、设备及存储介质 |
CN109584976A (zh) * | 2018-10-30 | 2019-04-05 | 嘉兴太美医疗科技有限公司 | 包含用户画像等级评价和等级培训的药物警戒系统及方法 |
CN109783615A (zh) * | 2019-01-25 | 2019-05-21 | 王小军 | 基于词语对狄利克雷过程的用户画像方法和系统 |
CN109816178A (zh) * | 2019-02-21 | 2019-05-28 | 四川大学 | 心理状态预测方法、装置及电子设备 |
CN110008874A (zh) * | 2019-03-25 | 2019-07-12 | 联想(北京)有限公司 | 数据处理方法及其装置、计算机系统及可读介质 |
CN110991941A (zh) * | 2019-12-24 | 2020-04-10 | 成都中医药大学 | 基于网络课程的学生画像模型的构建方法 |
CN111008658A (zh) * | 2019-11-30 | 2020-04-14 | 南京森林警察学院 | 一种基于监督式学习的警务人员学习分析系统 |
CN111046263A (zh) * | 2019-11-22 | 2020-04-21 | 广东机电职业技术学院 | 一种学生学习兴趣画像生成系统、方法、装置及存储介质 |
CN111221866A (zh) * | 2018-11-23 | 2020-06-02 | 北大方正集团有限公司 | 获取学生特征的方法、装置、设备及计算机可读存储介质 |
CN111241384A (zh) * | 2018-11-28 | 2020-06-05 | 上海花事电子商务有限公司 | 一种智能推荐图文方法及推荐图文系统 |
CN111950932A (zh) * | 2020-08-26 | 2020-11-17 | 北京信息科技大学 | 基于多源信息融合的中小微企业综合质量画像方法 |
CN112001739A (zh) * | 2019-05-27 | 2020-11-27 | 广东小天才科技有限公司 | 一种生成用户学习画像的方法和系统 |
WO2021036117A1 (zh) * | 2019-08-30 | 2021-03-04 | 华中师范大学 | 一种多空间融合学习环境构建方法和装置 |
CN112633160A (zh) * | 2020-12-23 | 2021-04-09 | 常州机电职业技术学院 | 一种高职学生素质能力特征智能提取的方法 |
CN112948226A (zh) * | 2021-02-05 | 2021-06-11 | 中国建设银行股份有限公司 | 一种用户画像绘制方法和装置 |
CN113220773A (zh) * | 2021-05-28 | 2021-08-06 | 华中师范大学 | 一种学生评测数据画像的地图可视化方法及系统 |
CN113537116A (zh) * | 2021-07-27 | 2021-10-22 | 重庆国翔创新教学设备有限公司 | 配合读物的辅助学习系统、方法、设备及存储介质 |
CN113626499A (zh) * | 2021-08-09 | 2021-11-09 | 青软创新科技集团股份有限公司 | 一种基于大数据数仓技术的学生画像挖掘实现方法 |
CN116663664A (zh) * | 2023-05-25 | 2023-08-29 | 沈阳林科信息技术有限公司 | 一种基于nlp算法的客户营销场景数据分析系统及方法 |
CN117235586A (zh) * | 2023-11-16 | 2023-12-15 | 青岛小帅智能科技股份有限公司 | 酒店客户画像构建方法、系统、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1805707A (zh) * | 2004-07-02 | 2006-07-19 | 松下电器产业株式会社 | 生体信号利用机器及其控制方法 |
US20070118509A1 (en) * | 2005-11-18 | 2007-05-24 | Flashpoint Technology, Inc. | Collaborative service for suggesting media keywords based on location data |
CN101916264A (zh) * | 2010-07-30 | 2010-12-15 | 浙江大学 | 基于用户面部表情与目光分布检测的个性化网页推荐方法 |
CN106339891A (zh) * | 2015-07-13 | 2017-01-18 | 上海银橙文化传媒股份有限公司 | 一种基于大数据采集的智能分析方法及系统 |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
CN106980663A (zh) * | 2017-03-21 | 2017-07-25 | 上海星红桉数据科技有限公司 | 基于海量跨屏行为数据的用户画像方法 |
CN107767168A (zh) * | 2017-09-19 | 2018-03-06 | 神策网络科技(北京)有限公司 | 用户行为数据处理方法及装置、电子设备和存储介质 |
-
2018
- 2018-03-09 CN CN201810196188.XA patent/CN108492224A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1805707A (zh) * | 2004-07-02 | 2006-07-19 | 松下电器产业株式会社 | 生体信号利用机器及其控制方法 |
US20070118509A1 (en) * | 2005-11-18 | 2007-05-24 | Flashpoint Technology, Inc. | Collaborative service for suggesting media keywords based on location data |
CN101916264A (zh) * | 2010-07-30 | 2010-12-15 | 浙江大学 | 基于用户面部表情与目光分布检测的个性化网页推荐方法 |
CN106339891A (zh) * | 2015-07-13 | 2017-01-18 | 上海银橙文化传媒股份有限公司 | 一种基于大数据采集的智能分析方法及系统 |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
CN106980663A (zh) * | 2017-03-21 | 2017-07-25 | 上海星红桉数据科技有限公司 | 基于海量跨屏行为数据的用户画像方法 |
CN107767168A (zh) * | 2017-09-19 | 2018-03-06 | 神策网络科技(北京)有限公司 | 用户行为数据处理方法及装置、电子设备和存储介质 |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109521919B (zh) * | 2018-10-17 | 2022-03-01 | 深圳壹账通智能科技有限公司 | 基于浮层界面的埋点方法、装置、设备及存储介质 |
CN109521919A (zh) * | 2018-10-17 | 2019-03-26 | 深圳壹账通智能科技有限公司 | 基于浮层界面的埋点方法、装置、设备及存储介质 |
CN109584976A (zh) * | 2018-10-30 | 2019-04-05 | 嘉兴太美医疗科技有限公司 | 包含用户画像等级评价和等级培训的药物警戒系统及方法 |
CN111221866A (zh) * | 2018-11-23 | 2020-06-02 | 北大方正集团有限公司 | 获取学生特征的方法、装置、设备及计算机可读存储介质 |
CN111241384A (zh) * | 2018-11-28 | 2020-06-05 | 上海花事电子商务有限公司 | 一种智能推荐图文方法及推荐图文系统 |
CN109783615A (zh) * | 2019-01-25 | 2019-05-21 | 王小军 | 基于词语对狄利克雷过程的用户画像方法和系统 |
CN109783615B (zh) * | 2019-01-25 | 2023-08-11 | 宋来伟 | 基于词语对狄利克雷过程的用户画像方法和系统 |
CN109816178A (zh) * | 2019-02-21 | 2019-05-28 | 四川大学 | 心理状态预测方法、装置及电子设备 |
CN110008874B (zh) * | 2019-03-25 | 2021-05-18 | 联想(北京)有限公司 | 数据处理方法及其装置、计算机系统及可读介质 |
CN110008874A (zh) * | 2019-03-25 | 2019-07-12 | 联想(北京)有限公司 | 数据处理方法及其装置、计算机系统及可读介质 |
CN112001739A (zh) * | 2019-05-27 | 2020-11-27 | 广东小天才科技有限公司 | 一种生成用户学习画像的方法和系统 |
WO2021036117A1 (zh) * | 2019-08-30 | 2021-03-04 | 华中师范大学 | 一种多空间融合学习环境构建方法和装置 |
CN111046263A (zh) * | 2019-11-22 | 2020-04-21 | 广东机电职业技术学院 | 一种学生学习兴趣画像生成系统、方法、装置及存储介质 |
CN111008658A (zh) * | 2019-11-30 | 2020-04-14 | 南京森林警察学院 | 一种基于监督式学习的警务人员学习分析系统 |
CN110991941A (zh) * | 2019-12-24 | 2020-04-10 | 成都中医药大学 | 基于网络课程的学生画像模型的构建方法 |
CN111950932A (zh) * | 2020-08-26 | 2020-11-17 | 北京信息科技大学 | 基于多源信息融合的中小微企业综合质量画像方法 |
CN111950932B (zh) * | 2020-08-26 | 2023-04-25 | 北京信息科技大学 | 基于多源信息融合的中小微企业综合质量画像方法 |
CN112633160A (zh) * | 2020-12-23 | 2021-04-09 | 常州机电职业技术学院 | 一种高职学生素质能力特征智能提取的方法 |
CN112948226A (zh) * | 2021-02-05 | 2021-06-11 | 中国建设银行股份有限公司 | 一种用户画像绘制方法和装置 |
CN112948226B (zh) * | 2021-02-05 | 2024-04-02 | 中国建设银行股份有限公司 | 一种用户画像绘制方法和装置 |
CN113220773A (zh) * | 2021-05-28 | 2021-08-06 | 华中师范大学 | 一种学生评测数据画像的地图可视化方法及系统 |
CN113220773B (zh) * | 2021-05-28 | 2023-09-01 | 华中师范大学 | 一种学生评测数据画像的地图可视化方法及系统 |
CN113537116A (zh) * | 2021-07-27 | 2021-10-22 | 重庆国翔创新教学设备有限公司 | 配合读物的辅助学习系统、方法、设备及存储介质 |
CN113626499A (zh) * | 2021-08-09 | 2021-11-09 | 青软创新科技集团股份有限公司 | 一种基于大数据数仓技术的学生画像挖掘实现方法 |
CN113626499B (zh) * | 2021-08-09 | 2024-05-10 | 青软创新科技集团股份有限公司 | 一种基于大数据数仓技术的学生画像挖掘实现方法 |
CN116663664A (zh) * | 2023-05-25 | 2023-08-29 | 沈阳林科信息技术有限公司 | 一种基于nlp算法的客户营销场景数据分析系统及方法 |
CN117235586A (zh) * | 2023-11-16 | 2023-12-15 | 青岛小帅智能科技股份有限公司 | 酒店客户画像构建方法、系统、电子设备及存储介质 |
CN117235586B (zh) * | 2023-11-16 | 2024-02-09 | 青岛小帅智能科技股份有限公司 | 酒店客户画像构建方法、系统、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108492224A (zh) | 基于深度学习在线教育学生综合画像标签管理系统 | |
MacEachren et al. | Visualizing geospatial information uncertainty: What we know and what we need to know | |
Gero | Honoring ambiguity/problematizing certitude | |
Sinar | Data visualization | |
Eerola et al. | Methods and tools contributing to FTA: A knowledge-based perspective | |
CN106663230A (zh) | 职业分析平台 | |
CN110489565B (zh) | 基于领域知识图谱本体中的对象根类型设计方法及系统 | |
Pavlidis | AI trends in digital humanities research | |
Lauro et al. | Data science and social research: Epistemology, methods, technology and applications | |
Paramasivan et al. | Cross-Industry AI Applications | |
Dransch et al. | Assessing the quality of geoscientific simulation models with visual analytics methods–a design study | |
Cantu et al. | A Knowledge Based Information System for Managing Research Programs and Value Creation in a University Environment | |
Schöps et al. | Semantic network analysis in consumer and marketing research: application areas in phygital contexts | |
Selvarathi et al. | A visualisation technique of extracting hidden patterns for maintaining road safety | |
Bin | Cognitive web service-based learning analytics in education systems using big data analytics | |
Taslimi et al. | el. Factors, Shaping Fields and Typology of Organizational Culture of School on Tehran City | |
Ngo et al. | Exploration and integration of job portals in Vietnam | |
Alikhani et al. | Clustering organizational learning capability indices for knowledge sharing in different segments of the firm | |
Laurini et al. | Computer-Assisted Visual Reasoning for Territorial Intelligence. | |
Carlsson | The UK landscape evaluation movement (1965–85) | |
Ovbagbedia | Framework for knowledge management implementation in oil and gas projects: case Nigeria and UK | |
Tan et al. | Design of Cultural and Creative Product Images Based on Color Feature Analysis | |
Marsillo et al. | Context Decoder | |
Wiseman | The institutionalization of organizational knowledge: Learning to walk the talk | |
Fuhler | Perceiving Umeå: Instagram's Lens on Neighborhoods in the City |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |