CN109783775B - 一种标记用户语料的内容的方法及系统 - Google Patents
一种标记用户语料的内容的方法及系统 Download PDFInfo
- Publication number
- CN109783775B CN109783775B CN201910047104.0A CN201910047104A CN109783775B CN 109783775 B CN109783775 B CN 109783775B CN 201910047104 A CN201910047104 A CN 201910047104A CN 109783775 B CN109783775 B CN 109783775B
- Authority
- CN
- China
- Prior art keywords
- knowledge point
- corpus
- knowledge
- entity
- word segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 239000002131 composite material Substances 0.000 claims abstract description 105
- 238000013507 mapping Methods 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 19
- 230000011218 segmentation Effects 0.000 claims description 114
- 230000014509 gene expression Effects 0.000 claims description 39
- 238000004458 analytical method Methods 0.000 claims description 26
- 238000005516 engineering process Methods 0.000 claims description 17
- 239000012634 fragment Substances 0.000 claims description 2
- 150000001875 compounds Chemical class 0.000 abstract description 9
- 238000002372 labelling Methods 0.000 abstract 1
- 241000282693 Cercopithecidae Species 0.000 description 24
- 241000282575 Gorilla Species 0.000 description 22
- 230000009194 climbing Effects 0.000 description 16
- 241000283153 Cetacea Species 0.000 description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 10
- 239000007921 spray Substances 0.000 description 7
- 238000005507 spraying Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种标记用户语料的内容的方法及系统,其方法包括:建立单一知识点体系;获取单一知识点体系之间的映射关系;根据知识点体系和映射关系生成复合型知识点体系;获取知识点对应的知识点实体;根据知识点实体和复合型知识点体系训练生成复合型NLP模型;获取用户语料;解析用户语料得到对应的语料语义;将语料语义和复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,语料知识点层级为语料知识点在对应的单一知识点体系中的层级;根据语料知识点、语料知识点实体以及语料知识点层级生成知识标记。本发明通过建立复合型NLP模型从而快速准确地对用户语料的内容实现多个体系的知识点标注。
Description
技术领域
本发明涉及信息处理技术领域,尤指一种标记用户语料的内容的方法及系统。
背景技术
随着网络的高速发展,智能终端也逐渐变得越来越普及,日常生活中方方面面都有可能涉及到。例如通过智能终端搜索资源,一般为了搜索到需要的资源,都是需要对资源进行内容标记。
在内容标记过程中,如果用户需要从多个体系角度对用户语料的内容进行标记,例如,用户语料为“李白和杜甫的五言绝句和七言绝句分别有哪些”,分别从作者和诗词的体系对用户语料的内容进行标记,那么一般需要先建立目录体系“作者”和“诗词”,再针对目录体系对用户语料的内容进行人工标注的方法,但是对于不同体系的知识点的内容的标注,需要对用户语料的内容进行多次拆分,例如,首先根据体系“作者”对用户语料的内容进行拆分,然后再次根据体系“诗词”对用户语料的内容进行拆分,比较主观而且任务量大,需要很长的耗时和人力成本投入。
因此,需要一种标记用户语料的内容的方法及系统。
发明内容
本发明的目的是提供一种标记用户语料的内容的方法及系统,实现通过建立复合型NLP模型从而快速准确地对用户语料的内容实现多个体系的知识点标注。
本发明提供的技术方案如下:
本发明提供一种标记用户语料的内容的方法,包括:
建立单一知识点体系;
获取所述单一知识点体系之间的映射关系;
根据所述单一知识点体系和所述映射关系生成复合型知识点体系;
获取所述单一知识点体系中的知识点实体;
根据所述知识点实体和所述复合型知识点体系训练生成复合型NLP模型;
获取用户语料;
解析所述用户语料得到对应的语料语义;
将所述语料语义和所述复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,所述语料知识点层级为所述语料知识点在对应的所述单一知识点体系中的层级;
根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记。
进一步的,所述的建立单一知识点体系具体包括:
获取知识点以及所述知识点之间的连接关系;
根据所述知识点和所述连接关系建立所述单一知识点体系。
进一步的,所述的根据所述知识点实体和所述复合型知识点体系训练生成复合型NLP模型具体包括:
根据所述知识点实体生成对应的正则表达式和实体语义槽;
根据所述正则表达式和所述实体语义槽解析所述知识点实体得到对应的知识点语义;
根据所述知识点语义和所述复合型知识点体系训练生成复合型NLP模型。
进一步的,所述的根据所述知识点实体生成对应的正则表达式和实体语义槽具体包括:
通过分词技术对所述知识点实体进行分词,得到对应的实体分词和所述实体分词对应的分词词性;
分析所述知识点实体的句式结构得到所述实体分词之间的关联关系;
根据所述实体分词和所述分词词性建立所述实体语义槽;
根据所述实体分词、所述分词词性和所述关联关系生成所述正则表达式。
进一步的,所述的根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记具体包括:
根据所述语料知识点层级判断所述语料知识点是否属于同一个单一知识点体系;
若是,则根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成所述知识标记;
若否,则根据所述语料知识点和所述语料知识点实体生成所述知识标记。
本发明还提供一种标记用户语料的内容的系统,包括:
单一体系建立模块,建立单一知识点体系;
体系关系获取模块,获取所述单一体系建立模块建立的所述单一知识点体系之间的映射关系;
复合体系建立模块,根据所述单一体系建立模块建立的所述单一知识点体系和所述体系关系获取模块获取的所述映射关系生成复合型知识点体系;
实体获取模块,获取所述单一体系建立模块建立的所述单一知识点体系中的知识点实体;
模型生成模块,根据所述实体获取模块获取的所述知识点实体和所述复合体系建立模块建立的所述复合型知识点体系训练生成复合型NLP模型;
语料获取模块,获取用户语料;
解析模块,解析所述语料获取模块获取的所述用户语料得到对应的语料语义;
对比模块,将所述解析模块得到的所述语料语义和所述模型生成模块生成的所述复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,所述语料知识点层级为所述语料知识点在对应的所述单一知识点体系中的层级;
标记生成模块,根据所述对比模块得到的所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记。
进一步的,所述单一体系建立模块具体包括:
获取单元,获取知识点以及所述知识点之间的连接关系;
单一体系建立单元,根据所述获取单元获取的所述知识点和所述连接关系建立所述单一知识点体系。
进一步的,所述模型生成模块具体包括:
数据库生成单元,根据所述实体获取模块获取的所述知识点实体生成对应的正则表达式和实体语义槽;
解析单元,根据所述数据库生成单元生成的所述正则表达式和所述实体语义槽解析所述知识点实体得到对应的知识点语义;
模型生成单元,根据所述解析单元得到的所述知识点语义和所述复合体系建立模块建立的所述复合型知识点体系训练生成复合型NLP模型。
进一步的,所述数据库生成单元具体包括:
分词子单元,通过分词技术对所述实体获取模块获取的所述知识点实体进行分词,得到对应的实体分词和所述实体分词对应的分词词性;
分析子单元,分析所述实体获取模块获取的所述知识点实体的句式结构得到所述分词子单元得到的所述实体分词之间的关联关系;
语义槽建立子单元,根据所述分词子单元得到的所述实体分词和所述分词词性建立所述实体语义槽;
表达式建立子单元,根据所述分词子单元得到的所述实体分词、所述分词词性和所述分析子单元得到的所述关联关系生成所述正则表达式。
进一步的,所述标记生成模块具体包括:
判断单元,根据所述对比模块得到的所述语料知识点层级判断所述语料知识点是否属于同一个单一知识点体系;
标记生成单元,若所述判断单元判断属于同一个单一知识点体系,则根据所述对比模块得到的所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成所述知识标记;
所述标记生成单元,若所述判断单元判断不属于同一个单一知识点体系,则根据所述对比模块得到的所述语料知识点和所述语料知识点实体生成所述知识标记。
通过本发明提供的一种标记用户语料的内容的方法及系统,能够带来以下至少一种有益效果:
1、本发明中,通过单一知识点体系以及相互之间的映射关系建立复合型知识点体系,从而生成复合型NLP模型,使得能够一次性解析出用户语料中所包含的知识点。
2、本发明中,复合型NLP模型仍然保留每个知识点来源的的单一知识点体系,以及在相应的单一知识点体系中的层级,便于快速准确地确定用户语料中包含的知识点对应的单一知识点体系。
3、本发明中,复合型NLP模型中通过分析知识点实体得到相应的正则表达式和实体语义槽,从而对知识点实体进行语义解析,便于识别用户语料中包含的知识点。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种标记用户语料的内容的方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种标记用户语料的内容的方法的一个实施例的流程图;
图2是本发明一种标记用户语料的内容的方法的另一个实施例的流程图;
图3是本发明一种标记用户语料的内容的方法的另一个实施例的流程图;
图4是本发明一种标记用户语料的内容的方法的另一个实施例的流程图;
图5是本发明一种标记用户语料的内容的方法的另一个实施例的流程图;
图6是本发明一种标记用户语料的内容的系统的一个实施例的结构示意图;
图7是本发明一种标记用户语料的内容的系统的另一个实施例的结构示意图。
附图标号说明:
1000标记用户语料的内容的系统
1100单一体系建立模块 1110获取单元 1120单一体系建立单元
1200体系关系获取模块
1300复合体系建立模块
1400实体获取模块
1500模型生成模块 1510数据库生成单元 1511分词子单元1512分析子单元 1513语义槽建立子单元 1514表达式建立子单元
1520解析单元 1530模型生成单元
1600语料获取模块
1700解析模块
1800对比模块
1900标记生成模块 1910判断单元 1920标记生成单元
具体实施方式
为了能够更加清楚地说明本发明实施例或现有技术中的技术方案,下面将对照说明书附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并且获得其他的实施方式。
为了使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
本发明的一个实施例,如图1所示,一种标记用户语料的内容的方法,包括:
S100建立单一知识点体系。
具体的,建立单一知识点体系,知识点体系的维度划分取决于用户的需求,例如,如果语文整体的复合的知识点体系,那么单一的知识点体系就是语文的细分,可以按照年级划分,也可以按照知识点的类别划分。如果要做学习类的复合的知识点体系,那么语文、数学、英语等学科就是细分的单一的知识点体系。因此,本发明中单一知识点体系和复合型知识点体系的概念是相对的,取决于用户的需求进行划分。
S200获取所述单一知识点体系之间的映射关系。
具体的,获取单一知识点体系之间的映射关系,该映射关系主要包含同级并列以及上下级包含的关系。例如,五言绝句知识点体系和七言绝句知识点体系属于同级并列的关系,但是两者和诗词知识点体系就属于上下级包含的关系。
S300根据所述单一知识点体系和所述映射关系生成复合型知识点体系。
具体的,根据单一知识点体系和映射关系生成复合型知识点体系,根据映射关系将多个单一知识点体系相互之间进行关联,从而生成复合型知识点体系。
S400获取所述单一知识点体系中的知识点实体。
具体的,获取单一知识点体系中每个知识点对应的知识点实体,该知识点实体为对应的知识点包含的具体内容。例如唐诗知识点体系中包含有知识点唐诗,子知识点唐诗作者、唐诗内容等,其中子知识点唐诗作者对应的知识点实体为李白、杜甫等,子知识点唐诗内容对应的知识点实体为每首唐诗的具体内容,如谁知盘中餐,粒粒皆辛苦等。单一知识点体系中每个知识点都包含相应的知识点实体。
S500根据所述知识点实体和所述复合型知识点体系训练生成复合型NLP模型。
具体的,对获取的每一个知识点对应的知识点实体中的内容进行语义解析,然后根据得到的语义解析结果和复合型知识点体系训练生成复合型NLP模型。
S600获取用户语料。
具体的,获取用户语料,所获取的用户语料为用户需要从多个单一知识点体系角度对用户语料的内容进行标记,例如,用户语料为“李白和杜甫的五言绝句和七言绝句分别有哪些”,分别从作者和诗词的单一知识点体系对用户语料的内容进行标记。
S700解析所述用户语料得到对应的语料语义。
具体的,解析用户语料得到对应的语料语义,该语料语义为用户语料中的主体关键词,分析用户语料的句式结构,然后确定主体关键词,如将主语或者宾语设置为主体关键词。例如,用户语料为“李白和杜甫的五言绝句和七言绝句分别有哪些”,对应的语料语义为“李白”、“杜甫”、“五言绝句”以及“七言绝句”。语料语义以及主体关键词的获取规则用户可以根据大数据统计分析进行设定。
S800将所述语料语义和所述复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,所述语料知识点层级为所述语料知识点在对应的所述单一知识点体系中的层级。
具体的,将得到的用户语料对应的语料语义和复合型NLP模型中的知识点实体的语义解析进行对比,若对比符合则得到用户语料对应的语料知识点,然后根据复合型NLP模型中知识点对应的单一知识点体系来源获取语料知识点对应的语料知识点实体以及语料知识点层级。
由于用户需要从多个单一知识点体系角度对用户语料的内容进行标记,因此当确定用户语料对应的语料知识点之后,获取该语料知识点在相应的单一知识点体系中的语料知识点实体以及语料知识点层级。
S900根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记。
具体的,通过确定的语料知识点层级判断语料知识点相互之间的关系,并根据语料知识点以及语料知识点实体生成树形知识点标签,并作为知识标记对用户语料进行标记。
本实施例中,通过单一知识点体系以及相互之间的映射关系建立复合型知识点体系,从而生成复合型NLP模型,使得能够一次性解析出用户语料中所包含的知识点。并且复合型NLP模型仍然保留每个知识点来源的的单一知识点体系,以及在相应的单一知识点体系中的层级,便于快速准确地确定用户语料中包含的知识点对应的单一知识点体系。
本发明的另一个实施例,是上述的实施例的优化实施例,如图2所示,包括:
S100建立单一知识点体系。
所述的S100建立单一知识点体系具体包括:
S110获取知识点以及所述知识点之间的连接关系。
具体的,获取知识点以及知识点之间的连接关系,该连接关系包括同级并列关系以及上下级包含关系,以建立单一知识点体系语文知识点体系为例,语文包含诗、词、曲、古诗、现代诗等等一系列知识点,其中诗、词和曲为同级并列关系,古诗和现代诗为同级并列关系,诗、古诗、现代诗为上下级包含关系,诗包含古诗和现代诗。
S120根据所述知识点和所述连接关系建立所述单一知识点体系。
具体的,根据上述获取的知识点之间的连接关系将知识点进行关联,从而建立单一知识点体系。
S200获取所述单一知识点体系之间的映射关系。
S300根据所述单一知识点体系和所述映射关系生成复合型知识点体系。
S400获取所述单一知识点体系中的知识点实体。
S500根据所述知识点实体和所述复合型知识点体系训练生成复合型NLP模型。
S600获取用户语料。
S700解析所述用户语料得到对应的语料语义。
S800将所述语料语义和所述复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,所述语料知识点层级为所述语料知识点在对应的所述单一知识点体系中的层级。
S900根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记。
本实施例中,通过获取知识点以及知识点相互之间的连接关系,快速建立单一知识点体系,从而便于用户对知识点进行梳理,理清思路,有助于进行理解。并且用户可以根据自身需要灵活调整单一知识点体系的划分维度,从而对用户语料进行理解。
本发明的另一个实施例,是上述的实施例的优化实施例,如图3所示,包括:
S100建立单一知识点体系。
S200获取所述单一知识点体系之间的映射关系。
S300根据所述单一知识点体系和所述映射关系生成复合型知识点体系。
S400获取所述单一知识点体系中的知识点实体。
S500根据所述知识点实体和所述复合型知识点体系训练生成复合型NLP模型。
所述的S500根据所述知识点实体和所述复合型知识点体系训练生成复合型NLP模型具体包括:
S510根据所述知识点实体生成对应的正则表达式和实体语义槽。
S520根据所述正则表达式和所述实体语义槽解析所述知识点实体得到对应的知识点语义。
具体的,分析知识点实体的词语词性以及句式结构,从而生成对应的正则表达式和实体语义槽,然后根据正则表达式和实体语义槽得到知识点实体对应的知识点语义。
S530根据所述知识点语义和所述复合型知识点体系训练生成复合型NLP模型。
具体的,根据解析得到的知识点语义和复合型知识点体系训练生成复合型NLP模型,在复合型NLP模型建立知识点、知识点实体以及知识点实体语义解析的映射关系,并且建立知识点与对应的单一知识点体系来源的联系。
S600获取用户语料。
S700解析所述用户语料得到对应的语料语义。
S800将所述语料语义和所述复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,所述语料知识点层级为所述语料知识点在对应的所述单一知识点体系中的层级。
S900根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记。
本实施例中,复合型NLP模型中通过分析知识点实体得到相应的正则表达式和实体语义槽,从而对知识点实体进行语义解析,便于识别用户语料中包含的知识点。
本发明的另一个实施例,是上述的实施例的优化实施例,如图4所示,包括:
S100建立单一知识点体系。
S200获取所述单一知识点体系之间的映射关系。
S300根据所述单一知识点体系和所述映射关系生成复合型知识点体系。
S400获取所述单一知识点体系中的知识点实体。
S500根据所述知识点实体和所述复合型知识点体系训练生成复合型NLP模型。
所述的S500根据所述知识点实体和所述复合型知识点体系训练生成复合型NLP模型具体包括:
S510根据所述知识点实体生成对应的正则表达式和实体语义槽。
所述的S510根据所述知识点实体生成对应的正则表达式和实体语义槽具体包括:
S511通过分词技术对所述知识点实体进行分词,得到对应的实体分词和所述实体分词对应的分词词性。
具体的,通过分词技术对知识点实体进行分词,识别知识点实体中的每一句话中词语的词性,然后将知识点实体中的每一句话中根据词语的词性将整个句子划分为字、词以及短语等分词构成。因此得到了知识点实体中包含的实体分词以及对应的分词词性。
例如,某一知识点实体为“猴子和猩猩会爬树”,通过分词技术进行分词得到的实体分词为,“猴子”、“和”、“猩猩”、“会”、“爬树”,“猴子”和“猩猩”对应的分词词性为名词,“和”和“会”对应的分词词性为代词,“爬树”对应的分词词性为名词。
S512分析所述知识点实体的句式结构得到所述实体分词之间的关联关系。
具体的,上述根据分词技术得到了知识点实体中包含的实体分词以及分词词性,然后根据知识点实体的句式结构分析知识点实体中包含的实体分词之间的关联关系。
例如,某一知识点实体为“猴子和猩猩会爬树”,通过分词技术进行分词得到的实体分词为,“猴子”、“和”、“猩猩”、“会”、“爬树”,“猴子”和“猩猩”对应的分词词性为名词,“和”和“会”对应的分词词性为代词,“爬树”对应的分词词性为名词。分析知识点实体的句式结构得出名词“猴子”和“猩猩”和动词“爬树”是主谓关系。
S513根据所述实体分词和所述分词词性建立所述实体语义槽。
具体的,根据实体分词和分词词性建立实体语义槽,譬如根据同一词性的实体分词建立该该知识点实体相应词性的语义槽。例如,某一知识点实体为“猴子和猩猩会爬树”,通过分词技术进行分词得到的实体分词为,“猴子”、“和”、“猩猩”、“会”、“爬树”,“猴子”和“猩猩”对应的分词词性为名词,“和”和“会”对应的分词词性为代词,“爬树”对应的分词词性为名词。建立名词实体语义槽包括“猴子”和“猩猩”,代词实体语义槽包括“和”和“会”,动词实体语义槽包括“猴子”和“爬树”。
S514根据所述实体分词、所述分词词性和所述关联关系生成所述正则表达式。
具体的,根据实体分词、分词词性以及关联关系生成对应的正则表达式,例如,某一语料样本为“鲸鱼会喷水”,进行分词得到的内容分词为,“鲸鱼”、“会”、“喷水”,“鲸鱼”对应的分词词性为名词,“会”对应的分词词性为代词,“喷水”对应的分词词性为名词,分析实体内容的句子结构得出名词“鲸鱼”和动词“喷水”是主谓关系,得到的正则表达式为:名词(鲸鱼)#代词(会)#动词(喷水)。
S520根据所述正则表达式和所述实体语义槽解析所述知识点实体得到对应的知识点语义。
S530根据所述知识点语义和所述复合型知识点体系训练生成复合型NLP模型。
S600获取用户语料。
S700解析所述用户语料得到对应的语料语义。
S800将所述语料语义和所述复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,所述语料知识点层级为所述语料知识点在对应的所述单一知识点体系中的层级。
S900根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记。
本实施例中,通过分词技术对知识点实体进行分词,并分析知识点实体的句式结构,生成对应的正则表达式以及实体语义槽,从而对知识点实体进行语义解析。
本发明的另一个实施例,是上述的实施例的优化实施例,如图5所示,包括:
S100建立单一知识点体系。
S200获取所述单一知识点体系之间的映射关系。
S300根据所述单一知识点体系和所述映射关系生成复合型知识点体系。
S400获取所述单一知识点体系中的知识点实体。
S500根据所述知识点实体和所述复合型知识点体系训练生成复合型NLP模型。
S600获取用户语料。
S700解析所述用户语料得到对应的语料语义。
S800将所述语料语义和所述复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,所述语料知识点层级为所述语料知识点在对应的所述单一知识点体系中的层级。
S900根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记。
所述的S900根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记具体包括:
S910根据所述语料知识点层级判断所述语料知识点是否属于同一个单一知识点体系。
具体的,由于获取的用户语料是用户需要从多个单一知识点体系角度对用户语料的内容进行标记,说明能够从该用户语料中获取多个语料知识点。因此,识别获取的多个语料知识点对应的语料知识点层级,判断是否存在属于同一个单一知识点体系的语料知识点。
S920若是,则根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成所述知识标记。
具体的,如果存在至少两个语料知识点属于同一个单一知识点体系,则根据语料知识点层级将语料知识点进行关联生成知识点标签,填充语料知识点实体之后生成知识标记对用户语料进行标记。
S930若否,则根据所述语料知识点和所述语料知识点实体生成所述知识标记。
具体的,如果所有的语料知识点都属于不同的单一知识点体系,则将语料知识点填充语料知识点实体之后生成知识标记对用户语料进行标记。
本实施例中,当用户语料中存在属于同一个单一知识点体系的语料知识点时,将语料知识点进行关联再生成知识标记。如果所有的语料知识点都属于不同的单一知识点体系,则直接将语料知识点作为知识标记。
本发明的一个实施例,如图6所示,一种标记用户语料的内容的系统1000,包括:
单一体系建立模块1100,建立单一知识点体系。
具体的,单一体系建立模块1100建立单一知识点体系,知识点体系的维度划分取决于用户的需求,例如,如果语文整体的复合的知识点体系,那么单一的知识点体系就是语文的细分,可以按照年级划分,也可以按照知识点的类别划分。如果要做学习类的复合的知识点体系,那么语文、数学、英语等学科就是细分的单一的知识点体系。因此,本发明中单一知识点体系和复合型知识点体系的概念是相对的,取决于用户的需求进行划分。
体系关系获取模块1200,获取所述单一体系建立模块1100建立的所述单一知识点体系之间的映射关系。
具体的,体系关系获取模块1200获取单一知识点体系之间的映射关系,该映射关系主要包含同级并列以及上下级包含的关系。例如,五言绝句知识点体系和七言绝句知识点体系属于同级并列的关系,但是两者和诗词知识点体系就属于上下级包含的关系。
复合体系建立模块1300,根据所述单一体系建立模块1100建立的所述单一知识点体系和所述体系关系获取模块1200获取的所述映射关系生成复合型知识点体系。
具体的,复合体系建立模块1300根据单一知识点体系和映射关系生成复合型知识点体系,根据映射关系将多个单一知识点体系相互之间进行关联,从而生成复合型知识点体系。
实体获取模块1400,获取所述单一体系建立模块1100建立的所述单一知识点体系中的知识点实体。
具体的,实体获取模块1400获取单一知识点体系中每个知识点对应的知识点实体,该知识点实体为对应的知识点包含的具体内容。例如唐诗知识点体系中包含有知识点唐诗,子知识点唐诗作者、唐诗内容等,其中子知识点唐诗作者对应的知识点实体为李白、杜甫等,子知识点唐诗内容对应的知识点实体为每首唐诗的具体内容,如谁知盘中餐,粒粒皆辛苦等。单一知识点体系中每个知识点都包含相应的知识点实体。
模型生成模块1500,根据所述实体获取模块1400获取的所述知识点实体和所述复合体系建立模块1300建立的所述复合型知识点体系训练生成复合型NLP模型。
具体的,模型生成模块1500对获取的每一个知识点对应的知识点实体中的内容进行语义解析,然后根据得到的语义解析结果和复合型知识点体系训练生成复合型NLP模型。
语料获取模块1600,获取用户语料。
具体的,语料获取模块1600获取用户语料,所获取的用户语料为用户需要从多个单一知识点体系角度对用户语料的内容进行标记,例如,用户语料为“李白和杜甫的五言绝句和七言绝句分别有哪些”,分别从作者和诗词的单一知识点体系对用户语料的内容进行标记。
解析模块1700,解析所述语料获取模块1600获取的所述用户语料得到对应的语料语义。
具体的,解析模块1700解析用户语料得到对应的语料语义,该语料语义为用户语料中的主体关键词,分析用户语料的句式结构,然后确定主体关键词,如将主语或者宾语设置为主体关键词。例如,用户语料为“李白和杜甫的五言绝句和七言绝句分别有哪些”,对应的语料语义为“李白”、“杜甫”、“五言绝句”以及“七言绝句”。语料语义以及主体关键词的获取规则用户可以根据大数据统计分析进行设定。
对比模块1800,将所述解析模块1700得到的所述语料语义和所述模型生成模块1500生成的所述复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,所述语料知识点层级为所述语料知识点在对应的所述单一知识点体系中的层级。
具体的,对比模块1800将得到的用户语料对应的语料语义和复合型NLP模型中的知识点实体的语义解析进行对比,若对比符合则得到用户语料对应的语料知识点,然后根据复合型NLP模型中知识点对应的单一知识点体系来源获取语料知识点对应的语料知识点实体以及语料知识点层级。
由于用户需要从多个单一知识点体系角度对用户语料的内容进行标记,因此当确定用户语料对应的语料知识点之后,获取该语料知识点在相应的单一知识点体系中的语料知识点实体以及语料知识点层级。
标记生成模块1900,根据所述对比模块1800得到的所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记。
具体的,标记生成模块1900通过确定的语料知识点层级判断语料知识点相互之间的关系,并根据语料知识点以及语料知识点实体生成树形知识点标签,并作为知识标记对用户语料进行标记。
本实施例中,通过单一知识点体系以及相互之间的映射关系建立复合型知识点体系,从而生成复合型NLP模型,使得能够一次性解析出用户语料中所包含的知识点。并且复合型NLP模型仍然保留每个知识点来源的的单一知识点体系,以及在相应的单一知识点体系中的层级,便于快速准确地确定用户语料中包含的知识点对应的单一知识点体系。
本发明的另一个实施例,是上述的实施例的优化实施例,如图7所示,包括:
单一体系建立模块1100,建立单一知识点体系。
所述单一体系建立模块1100具体包括:
获取单元1110,获取知识点以及所述知识点之间的连接关系。
具体的,获取单元1110获取知识点以及知识点之间的连接关系,该连接关系包括同级并列关系以及上下级包含关系,以建立单一知识点体系语文知识点体系为例,语文包含诗、词、曲、古诗、现代诗等等一系列知识点,其中诗、词和曲为同级并列关系,古诗和现代诗为同级并列关系,诗、古诗、现代诗为上下级包含关系,诗包含古诗和现代诗。
单一体系建立单元1120,根据所述获取单元1110获取的所述知识点和所述连接关系建立所述单一知识点体系。
具体的,单一体系建立单元1120根据上述获取的知识点之间的连接关系将知识点进行关联,从而建立单一知识点体系。
体系关系获取模块1200,获取所述单一体系建立模块1100建立的所述单一知识点体系之间的映射关系。
复合体系建立模块1300,根据所述单一体系建立模块1100建立的所述单一知识点体系和所述体系关系获取模块1200获取的所述映射关系生成复合型知识点体系。
实体获取模块1400,获取所述单一体系建立模块1100建立的所述单一知识点体系中的知识点实体。
模型生成模块1500,根据所述实体获取模块1400获取的所述知识点实体和所述复合体系建立模块1300建立的所述复合型知识点体系训练生成复合型NLP模型。
所述模型生成模块1500具体包括:
数据库生成单元1510,根据所述实体获取模块1400获取的所述知识点实体生成对应的正则表达式和实体语义槽。
所述数据库生成单元1510具体包括:
分词子单元1511,通过分词技术对所述实体获取模块1400获取的所述知识点实体进行分词,得到对应的实体分词和所述实体分词对应的分词词性。
具体的,分词子单元1511通过分词技术对知识点实体进行分词,识别知识点实体中的每一句话中词语的词性,然后将知识点实体中的每一句话中根据词语的词性将整个句子划分为字、词以及短语等分词构成。因此得到了知识点实体中包含的实体分词以及对应的分词词性。
例如,某一知识点实体为“猴子和猩猩会爬树”,通过分词技术进行分词得到的实体分词为,“猴子”、“和”、“猩猩”、“会”、“爬树”,“猴子”和“猩猩”对应的分词词性为名词,“和”和“会”对应的分词词性为代词,“爬树”对应的分词词性为名词。
分析子单元1512,分析所述实体获取模块1400获取的所述知识点实体的句式结构得到所述分词子单元1511得到的所述实体分词之间的关联关系。
具体的,上述根据分词技术得到了知识点实体中包含的实体分词以及分词词性,然后分析子单元1512根据知识点实体的句式结构分析知识点实体中包含的实体分词之间的关联关系。
例如,某一知识点实体为“猴子和猩猩会爬树”,通过分词技术进行分词得到的实体分词为,“猴子”、“和”、“猩猩”、“会”、“爬树”,“猴子”和“猩猩”对应的分词词性为名词,“和”和“会”对应的分词词性为代词,“爬树”对应的分词词性为名词。分析知识点实体的句式结构得出名词“猴子”和“猩猩”和动词“爬树”是主谓关系。
语义槽建立子单元1513,根据所述分词子单元1511得到的所述实体分词和所述分词词性建立所述实体语义槽。
具体的,语义槽建立子单元1513根据实体分词和分词词性建立实体语义槽,譬如根据同一词性的实体分词建立该该知识点实体相应词性的语义槽。例如,某一知识点实体为“猴子和猩猩会爬树”,通过分词技术进行分词得到的实体分词为,“猴子”、“和”、“猩猩”、“会”、“爬树”,“猴子”和“猩猩”对应的分词词性为名词,“和”和“会”对应的分词词性为代词,“爬树”对应的分词词性为名词。建立名词实体语义槽包括“猴子”和“猩猩”,代词实体语义槽包括“和”和“会”,动词实体语义槽包括“猴子”和“爬树”。
表达式建立子单元1514,根据所述分词子单元1511得到的所述实体分词、所述分词词性和所述分析子单元1512得到的所述关联关系生成所述正则表达式。
具体的,表达式建立子单元1514根据实体分词、分词词性以及关联关系生成对应的正则表达式,例如,某一语料样本为“鲸鱼会喷水”,进行分词得到的内容分词为,“鲸鱼”、“会”、“喷水”,“鲸鱼”对应的分词词性为名词,“会”对应的分词词性为代词,“喷水”对应的分词词性为名词,分析实体内容的句子结构得出名词“鲸鱼”和动词“喷水”是主谓关系,得到的正则表达式为:名词(鲸鱼)#代词(会)#动词(喷水)。
解析单元1520,根据所述数据库生成单元1510生成的所述正则表达式和所述实体语义槽解析所述知识点实体得到对应的知识点语义。
具体的,数据库生成单元1510分析知识点实体的词语词性以及句式结构,从而生成对应的正则表达式和实体语义槽,然后解析单元1520根据正则表达式和实体语义槽得到知识点实体对应的知识点语义。
模型生成单元1530,根据所述解析单元1520得到的所述知识点语义和所述复合体系建立模块1300建立的所述复合型知识点体系训练生成复合型NLP模型。
具体的,模型生成单元1530根据解析得到的知识点语义和复合型知识点体系训练生成复合型NLP模型,在复合型NLP模型建立知识点、知识点实体以及知识点实体语义解析的映射关系,并且建立知识点与对应的单一知识点体系来源的联系。
语料获取模块1600,获取用户语料。
解析模块1700,解析所述语料获取模块1600获取的所述用户语料得到对应的语料语义。
对比模块1800,将所述解析模块1700得到的所述语料语义和所述模型生成模块1500生成的所述复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,所述语料知识点层级为所述语料知识点在对应的所述单一知识点体系中的层级。
标记生成模块1900,根据所述对比模块1800得到的所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记。
所述标记生成模块1900具体包括:
判断单元1910,根据所述对比模块1800得到的所述语料知识点层级判断所述语料知识点是否属于同一个单一知识点体系。
具体的,由于获取的用户语料是用户需要从多个单一知识点体系角度对用户语料的内容进行标记,说明能够从该用户语料中获取多个语料知识点。因此,判断单元1910识别获取的多个语料知识点对应的语料知识点层级,判断是否存在属于同一个单一知识点体系的语料知识点。
标记生成单元1920,若所述判断单元1910判断属于同一个单一知识点体系,则根据所述对比模块1800得到的所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成所述知识标记。
具体的,如果存在至少两个语料知识点属于同一个单一知识点体系,则标记生成单元1920根据语料知识点层级将语料知识点进行关联生成知识点标签,填充语料知识点实体之后生成知识标记对用户语料进行标记。
所述标记生成单元1920,若所述判断单元1910判断不属于同一个单一知识点体系,则根据所述对比模块1800得到的所述语料知识点和所述语料知识点实体生成所述知识标记。
具体的,如果所有的语料知识点都属于不同的单一知识点体系,则标记生成单元1920将语料知识点填充语料知识点实体之后生成知识标记对用户语料进行标记。
本实施例中,通过获取知识点以及知识点相互之间的连接关系,快速建立单一知识点体系,从而便于用户对知识点进行梳理,理清思路,有助于进行理解。并且用户可以根据自身需要灵活调整单一知识点体系的划分维度,从而对用户语料进行理解。
复合型NLP模型中通过分词技术对知识点实体进行分词,并分析知识点实体的句式结构,生成对应的正则表达式以及实体语义槽,从而对知识点实体进行语义解析,便于识别用户语料中包含的知识点。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (4)
1.一种标记用户语料的内容的方法,其特征在于,包括:
建立单一知识点体系,具体包括:获取知识点以及所述知识点之间的连接关系;根据所述知识点和所述连接关系建立所述单一知识点体系;
获取所述单一知识点体系之间的映射关系;
根据所述单一知识点体系和所述映射关系生成复合型知识点体系;
获取所述单一知识点体系中的知识点实体;
根据所述知识点实体生成对应的正则表达式和实体语义槽;包括:
通过分词技术对所述知识点实体进行分词,得到对应的实体分词和所述实体分词对应的分词词性;分析所述知识点实体的句式结构得到所述实体分词之间的关联关系;根据所述实体分词和所述分词词性建立所述实体语义槽;
根据所述实体分词、所述分词词性和所述关联关系生成所述正则表达式;
根据所述正则表达式和所述实体语义槽解析所述知识点实体得到对应的知识点语义;
根据所述知识点语义和所述复合型知识点体系训练生成复合型NLP模型;
获取用户语料;
解析所述用户语料得到对应的语料语义;
将所述语料语义和所述复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,所述语料知识点层级为所述语料知识点在对应的所述单一知识点体系中的层级;
根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记。
2.根据权利要求1所述的标记用户语料的内容的方法,其特征在于,所述的根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记具体包括:
根据所述语料知识点层级判断所述语料知识点是否属于同一个单一知识点体系;
若是,则根据所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成所述知识标记;
若否,则根据所述语料知识点和所述语料知识点实体生成所述知识标记。
3.一种标记用户语料的内容的系统,其特征在于,包括:
单一体系建立模块,建立单一知识点体系;具体包括:获取单元,获取知识点以及所述知识点之间的连接关系;单一体系建立单元,根据所述获取单元获取的所述知识点和所述连接关系建立所述单一知识点体系;
体系关系获取模块,获取所述单一体系建立模块建立的所述单一知识点体系之间的映射关系;
复合体系建立模块,根据所述单一体系建立模块建立的所述单一知识点体系和所述体系关系获取模块获取的所述映射关系生成复合型知识点体系;
实体获取模块,获取所述单一体系建立模块建立的所述单一知识点体系中的知识点实体;
模型生成模块具体包括:数据库生成单元,根据所述实体获取模块获取的所述知识点实体生成对应的正则表达式和实体语义槽;数据库生成单元具体包括:分词子单元,通过分词技术对所述实体获取模块获取的所述知识点实体进行分词,得到对应的实体分词和所述实体分词对应的分词词性;分析子单元,分析所述实体获取模块获取的所述知识点实体的句式结构得到所述分词子单元得到的所述实体分词之间的关联关系;语义槽建立子单元,根据所述分词子单元得到的所述实体分词和所述分词词性建立所述实体语义槽;表达式建立子单元,根据所述分词子单元得到的所述实体分词、所述分词词性和所述分析子单元得到的所述关联关系生成所述正则表达式;解析单元,根据所述数据库生成单元生成的所述正则表达式和所述实体语义槽解析所述知识点实体得到对应的知识点语义;模型生成单元,根据所述解析单元得到的所述知识点语义和所述复合体系建立模块建立的所述复合型知识点体系训练生成复合型NLP模型;
语料获取模块,获取用户语料;
解析模块,解析所述语料获取模块获取的所述用户语料得到对应的语料语义;
对比模块,将所述解析模块得到的所述语料语义和所述模型生成模块生成的所述复合型NLP模型进行对比,得到对应的语料知识点、语料知识点实体以及语料知识点层级,所述语料知识点层级为所述语料知识点在对应的所述单一知识点体系中的层级;
标记生成模块,根据所述对比模块得到的所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成知识标记。
4.根据权利要求3所述的标记用户语料的内容的系统,其特征在于,所述标记生成模块具体包括:
判断单元,根据所述对比模块得到的所述语料知识点层级判断所述语料知识点是否属于同一个单一知识点体系;
标记生成单元,若所述判断单元判断属于同一个单一知识点体系,则根据所述对比模块得到的所述语料知识点、所述语料知识点实体以及所述语料知识点层级生成所述知识标记;
所述标记生成单元,若所述判断单元判断不属于同一个单一知识点体系,则根据所述对比模块得到的所述语料知识点和所述语料知识点实体生成所述知识标记。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910047104.0A CN109783775B (zh) | 2019-01-18 | 2019-01-18 | 一种标记用户语料的内容的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910047104.0A CN109783775B (zh) | 2019-01-18 | 2019-01-18 | 一种标记用户语料的内容的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109783775A CN109783775A (zh) | 2019-05-21 |
CN109783775B true CN109783775B (zh) | 2023-07-28 |
Family
ID=66501640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910047104.0A Active CN109783775B (zh) | 2019-01-18 | 2019-01-18 | 一种标记用户语料的内容的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109783775B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110852109A (zh) * | 2019-11-11 | 2020-02-28 | 腾讯科技(深圳)有限公司 | 语料生成方法、语料生成装置、和存储介质 |
US11537660B2 (en) | 2020-06-18 | 2022-12-27 | International Business Machines Corporation | Targeted partial re-enrichment of a corpus based on NLP model enhancements |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102122286A (zh) * | 2010-04-01 | 2011-07-13 | 武汉福来尔科技有限公司 | 在手持学习终端上实现的聚合式搜索的方法 |
CN104794169A (zh) * | 2015-03-30 | 2015-07-22 | 明博教育科技有限公司 | 一种基于序列标注模型的学科术语抽取方法及系统 |
CN106777275A (zh) * | 2016-12-29 | 2017-05-31 | 北京理工大学 | 基于多粒度语义块的实体属性和属性值提取方法 |
CN106980960A (zh) * | 2017-02-13 | 2017-07-25 | 广东小天才科技有限公司 | 一种知识点体系的制作方法及装置 |
CN107766483A (zh) * | 2017-10-13 | 2018-03-06 | 华中科技大学 | 一种基于知识图谱的交互式问答方法及系统 |
CN108804521A (zh) * | 2018-04-27 | 2018-11-13 | 南京柯基数据科技有限公司 | 一种基于知识图谱的问答方法及农业百科问答系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7475010B2 (en) * | 2003-09-03 | 2009-01-06 | Lingospot, Inc. | Adaptive and scalable method for resolving natural language ambiguities |
CN104657750B (zh) * | 2015-03-23 | 2018-04-27 | 苏州大学张家港工业技术研究院 | 一种用于人物关系抽取的方法和装置 |
US9779085B2 (en) * | 2015-05-29 | 2017-10-03 | Oracle International Corporation | Multilingual embeddings for natural language processing |
CN106469180A (zh) * | 2015-08-21 | 2017-03-01 | 马正方 | 基于知识点的多条件搜索装置 |
CN107169043A (zh) * | 2017-04-24 | 2017-09-15 | 成都准星云学科技有限公司 | 一种基于标准答案的知识点自动提取方法及系统 |
US10769138B2 (en) * | 2017-06-13 | 2020-09-08 | International Business Machines Corporation | Processing context-based inquiries for knowledge retrieval |
-
2019
- 2019-01-18 CN CN201910047104.0A patent/CN109783775B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102122286A (zh) * | 2010-04-01 | 2011-07-13 | 武汉福来尔科技有限公司 | 在手持学习终端上实现的聚合式搜索的方法 |
CN104794169A (zh) * | 2015-03-30 | 2015-07-22 | 明博教育科技有限公司 | 一种基于序列标注模型的学科术语抽取方法及系统 |
CN106777275A (zh) * | 2016-12-29 | 2017-05-31 | 北京理工大学 | 基于多粒度语义块的实体属性和属性值提取方法 |
CN106980960A (zh) * | 2017-02-13 | 2017-07-25 | 广东小天才科技有限公司 | 一种知识点体系的制作方法及装置 |
CN107766483A (zh) * | 2017-10-13 | 2018-03-06 | 华中科技大学 | 一种基于知识图谱的交互式问答方法及系统 |
CN108804521A (zh) * | 2018-04-27 | 2018-11-13 | 南京柯基数据科技有限公司 | 一种基于知识图谱的问答方法及农业百科问答系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109783775A (zh) | 2019-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107315737B (zh) | 一种语义逻辑处理方法及系统 | |
CN109241538B (zh) | 基于关键词和动词依存的中文实体关系抽取方法 | |
CN107451153B (zh) | 输出结构化查询语句的方法和装置 | |
CN110502642B (zh) | 一种基于依存句法分析与规则的实体关系抽取方法 | |
CN113312922B (zh) | 一种改进的篇章级三元组信息抽取方法 | |
CN107688630B (zh) | 一种基于语义的弱监督微博多情感词典扩充方法 | |
CN109766453A (zh) | 一种用户语料语义理解的方法及系统 | |
CN114372153A (zh) | 基于知识图谱的法律文书结构化入库方法及系统 | |
CN110321434A (zh) | 一种基于词义消歧卷积神经网络的文本分类方法 | |
CN109783775B (zh) | 一种标记用户语料的内容的方法及系统 | |
CN108959630A (zh) | 一种面向英文无结构文本的人物属性抽取方法 | |
CN111737424A (zh) | 一种问题的匹配方法、装置、设备及存储介质 | |
CN114997288A (zh) | 一种设计资源关联方法 | |
CN107451116B (zh) | 一种移动应用内生大数据统计分析方法 | |
CN113157887B (zh) | 知识问答意图识别方法、装置、及计算机设备 | |
RU2546064C1 (ru) | Распределенная система и способ языкового перевода | |
CN111680493B (zh) | 英语文本分析方法、装置、可读存储介质及计算机设备 | |
CN109783821B (zh) | 一种特定内容的视频的搜索方法及系统 | |
CN109800430B (zh) | 一种语义理解方法及系统 | |
JP2019148933A (ja) | 要約評価装置、方法、プログラム、及び記憶媒体 | |
JP2015225415A (ja) | 結束性判定装置、モデル学習装置、方法、及びプログラム | |
CN103593427A (zh) | 新词搜索方法及系统 | |
CN109766551B (zh) | 一种多义词语义的确定方法和系统 | |
CN111949781B (zh) | 一种基于自然语句句法分析的智能交互方法及装置 | |
CN109783820B (zh) | 一种语义解析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |