CN108052547A - 基于问句和知识图结构分析的自然语言问答方法及系统 - Google Patents
基于问句和知识图结构分析的自然语言问答方法及系统 Download PDFInfo
- Publication number
- CN108052547A CN108052547A CN201711204633.4A CN201711204633A CN108052547A CN 108052547 A CN108052547 A CN 108052547A CN 201711204633 A CN201711204633 A CN 201711204633A CN 108052547 A CN108052547 A CN 108052547A
- Authority
- CN
- China
- Prior art keywords
- relation
- vector
- entity
- node
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012916 structural analysis Methods 0.000 title claims abstract description 10
- 230000008569 process Effects 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 17
- 238000003780 insertion Methods 0.000 claims description 13
- 230000037431 insertion Effects 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 9
- 230000003247 decreasing effect Effects 0.000 claims description 5
- 239000012141 concentrate Substances 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 4
- 238000013461 design Methods 0.000 abstract description 4
- 238000001914 filtration Methods 0.000 abstract description 3
- 238000012216 screening Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于问句和知识图结构分析的自然语言问答方法及系统,属于图计算和自然语言问答领域。本发明方法针对现有的各种问答系统所存在的问题,提出了基于问句和知识图的结构构建、分析及匹配的自然语言问答方法,从而拓展可回答自然语言问题的种类,同时提升答案的准确率。本发明方法通过以实体节点为中心的遍历,以及设计抽取规则来采用图的结构来表示查询问句;基于查询图在知识图中映射查找覆盖所有答案的子图。通过构建路径和短语的语义向量,在实现对答案子图过滤筛选的同时,计算匹配的相似度,从而得出候选答案。本发明方法方案简洁,效果明显。
Description
技术领域
本发明属于图计算和自然语言问答领域,更具体地,涉及一种基于问句和知识图结构分析的自然语言问答方法及系统。
背景技术
随着互联网的飞速发展,越来越多的大规模结构化的知识图被构建。知识图在整合信息,加强智能搜索方面发挥着越来越重要的作用。但是这种知识图中存储的都是结构化的信息,这使得它很难被一般用户所直接使用。
基于查询语言和数据获取协议(SPARQL Protocol and RDF Query Language,SPARQL)的查询,是一种针对资源描述框架(Resource Description Framework,RDF)数据的结构化的查询,虽然可以直接检索知识图,但是它需要用户自己根据需求来编写相应的查询语句,这就要求用户有一定的计算机基础,同时对知识图中信息的存储方式有一定的了解。基于关键字的查询,可以方便用户使用,但是由于查询信息的不完整使得答案的正确率太低。
自然语言是一种非结构化的语句,而知识图中存储的是结构化的信息,所以现有的方法中首先考虑将自然语言查询转换成SPARQL结构化查询,但是需要首先构建结构化的查询模式,然后将自然语言的问句转换为特定的模式;由于存在歧义,近似匹配等问题,导致转换效果并不理想;另外,SPARQL查询只能处理边属性严格匹配的查询,所以就可能造成部分查询结果的缺失。
知识图是基于图结构来构建的,所以可以采用图匹配的方式来实现问答,这就需要将自然语言问句转换成查询图,然后实现查询图的模式匹配。但是在构建查询图中会存在信息抽取不准确等问题;另外,在实现查询图的模式匹配中,特别是边的语义模式匹配中,存在匹配不准确的问题;针对这些问题现有的方法都不能很好的解决。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于问句和知识图结构分析的自然语言问答方法及系统,由此解决现有知识图查询方法存在的查询准确率较低的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于问句和知识图结构分析的自然语言问答方法,包括:
(1)识别自然语言问句中的命名实体,并对所述自然语言问句进行解析以构建解析树;
(2)在所述解析树中采用以所述命名实体中的元素为中心的方式进行遍历,在遍历过程中依据预设关系抽取规则从所述解析树中抽取目标信息,构建所述自然语言问句的查询图;
(3)对于所述查询图中的每个节点,构建在预设知识图中与所述查询图中各节点相匹配的节点候选集;
(4)在所述预设知识图中以所述节点候选集中的每一个节点为中心进行遍历,得到以所述节点候选集中的每一个节点为中心的覆盖所有答案的子图;
(5)针对所述预设知识图中的路径构建路径语义向量,针对所述查询图中的边属性构建边属性语义向量;
(6)根据所述边属性语义向量与所述路径语义向量来计算所述查询图中的边与该边在所述知识图中相匹配的路径之间的相似度,过滤掉不满足预设相似度要求的子图得到候选答案子图;
(7)根据所述查询图中的边与该边在所述知识图中相匹配的路径之间的相似度得到各候选答案子图的整体相似度,确定出整体相似度较高的前k个答案。
优选地,步骤(2)具体包括:
(2.1)根据所述命名实体设置实体集合;
(2.2)设置遍历过程关系提取集合,其中,所述遍历过程关系提取集合中的关系属性按照权重递减的顺序排列为:subj,obj,nsubj,iobj,dobj,pobj,nsubjpass,csubjpass,nmod:*,xsubj,prep:*,amod;
(2.3)判断所述实体集合中是否存在未被访问过的元素,若存在未被访问过的元素,则执行步骤(2.4),否则结束;
(2.4)以所述未被访问的元素为根节点,在所述解析树中进行遍历搜索;
(2.5)在遍历过程中,判断所述解析树中表示关系的边的属性是否存在于所述遍历过程关系提取集合的关系属性中,若不存在,则执行步骤(2.4),若存在多个关系属性,则选择权重最高的关系属性所关联的边,然后执行步骤(2.6);
(2.6)判断权重最高的关系属性所关联的边所连接的节点是表示关系,还是表示实体,若表示关系,则在所述查询图中相应节点插入一条边,若表示实体,则执行步骤(2.7);
(2.7)将所述解析树中表示关系的边所连接的节点表示的实体插入到所述查询图中,并判断该插入的实体是否存在于所述实体集合中,若存在,则执行步骤(2.3),若不存在,则执行步骤(2.8);
(2.8)将该插入的实体插入到所述实体集合中,返回执行步骤(2.3)。
优选地,步骤(5)具体包括:
(5.1)采用词向量技术训练得到预设词汇库中词汇的词向量;
(5.2)若获取所述预设知识图中路径的向量表示,则执行步骤(5.3),若获取所述查询图中表示关系的短语的向量表示,则执行步骤(5.4);
(5.3)求取所述知识图的路径中各个边的属性的向量表示,然后将所有边的向量叠加来获取所述知识图的路径的向量表示;
(5.4)区分所述查询图中表示关系的短语的核心词和修饰词,将所述修饰词的词向量映射到所述核心词的词向量中,以得到所述查询图中表示关系的短语的向量表示。
按照本发明的另一方面,提供了一种基于问句和知识图结构分析的自然语言问答系统,包括:
解析树构建模块,用于识别自然语言问句中的命名实体,并对所述自然语言问句进行解析以构建解析树;
查询图构建模块,用于在所述解析树中采用以所述命名实体中的元素为中心的方式进行遍历,在遍历过程中依据预设关系抽取规则从所述解析树中抽取目标信息,构建所述自然语言问句的查询图;
节点候选集获取模块,用于对于所述查询图中的每个节点,构建在预设知识图中与所述查询图中各节点相匹配的节点候选集;
子图获取模块,用于在所述预设知识图中以所述节点候选集中的每一个节点为中心进行遍历,得到以所述节点候选集中的每一个节点为中心的覆盖所有答案的子图;
语义向量构建模块,用于针对所述预设知识图中的路径构建路径语义向量,针对所述查询图中的边属性构建边属性语义向量;
候选答案子图获取模块,用于根据所述边属性语义向量与所述路径语义向量来计算所述查询图中的边与该边在所述知识图中相匹配的路径之间的相似度,过滤掉不满足预设相似度要求的子图得到候选答案子图;
目标答案获取模块,用于根据所述查询图中的边与该边在所述知识图中相匹配的路径之间的相似度得到各候选答案子图的整体相似度,确定出整体相似度较高的前k个答案。
优选地,所述查询图构建模块包括:
实体集合构建模块,用于根据所述命名实体设置实体集合;
关系提取集合构建模块,用于设置遍历过程关系提取集合,其中,所述遍历过程关系提取集合中的关系属性按照权重递减的顺序排列为:subj,obj,nsubj,iobj,dobj,pobj,nsubjpass,csubjpass,nmod:*,xsubj,prep:*,amod;
第一判断模块,用于判断所述实体集合中是否存在未被访问过的元素,若不存在,则结束;
遍历搜索模块,用于在所述实体集合中存在未被访问过的元素时,以所述未被访问的元素为根节点,在所述解析树中进行遍历搜索;
第二判断模块,用于在遍历过程中,判断所述解析树中表示关系的边的属性是否存在于所述遍历过程关系提取集合的关系属性中,若不存在,则返回执行所述遍历搜索模块;
第三判断模块,用于在所述解析树中表示关系的边的属性存在于所述遍历过程关系提取集合的关系属性中时,选择权重最高的关系属性所关联的边,并判断权重最高的关系属性所关联的边所连接的节点是表示关系,还是表示实体,若表示关系,则在所述查询图中相应节点插入一条边;
第一插入模块,用于在所述解析树中表示关系的边所连接的节点是表示实体时,将所述解析树中表示关系的边所连接的节点表示的实体插入到所述查询图中,并判断该插入的实体是否存在于所述实体集合中,若存在,则返回执行所述第一判断模块;
第二插入模块,用于在该插入的实体不存在于所述实体集合中时,将该插入的实体插入到所述实体集合中,返回执行所述第一判断模块。
优选地,所述语义向量构建模块包括:
词向量训练模块,用于采用词向量技术训练得到预设词汇库中词汇的词向量;
路径语义向量构建模块,用于在获取所述预设知识图中路径的向量表示时,求取所述知识图的路径中各个边的属性的向量表示,然后将所有边的向量叠加来获取所述知识图的路径的向量表示;
边属性语义向量构建模块,用于在获取所述查询图中表示关系的短语的向量表示时,区分所述查询图中表示关系的短语的核心词和修饰词,将所述修饰词的词向量映射到所述核心词的词向量中,以得到所述查询图中表示关系的短语的向量表示。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
(1)通过以实体为中心的方式遍历自然语言问句的解析树,依据设计的规则使得查询图的构建更加简单准确。
(2)通过构建覆盖所有答案的子图,在简化查询操作的同时,提高了问题答案的覆盖率和准确度。
(3)通过设计构建语义向量的方式衡量路径相似度,同时筛选过滤答案子图,方便了路径映射相似度计算,同时提高了匹配的准确率。
附图说明
图1为本发明实施公开的一种基于问句和知识图结构分析的自然语言问答方法的流程示意图;
图2为本发明实施例公开的一种查询图构建方法的流程示意图;
图3为本发明实施例公开的一种语义向量构建方法的流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明提出了一种基于问句和知识图结构分析的自然语言问答方法及系统,该方法通过实现以节点为中心的策略来遍历自然语言问句的解析树,同时根据定制的规则来抽取关键信息,从而构建出完整表达问句意思的查询图;另外,根据查询图在知识图中求取可以覆盖所有答案的子图;设计构建路径向量和关系向量的方法,筛选过滤答案子图,在解决路径映射问题的同时,实现相似匹配计算,该策略在简化查询匹配的同时,提高了答案的准确率。
如图1所示为本发明实施公开的一种基于问句和知识图结构分析的自然语言问答方法的流程示意图,在图1所示的方法中包括以下步骤:
(1)识别自然语言问句中的命名实体;
其中,可以通过使用命名实体识别的技术来实现自然语言问句中命名实体的识别。
(2)对自然语言问句进行解析以构建解析树;
其中,可以采用自然语言处理的技术来实现对自然语言问句的解析并构建解析树。
(3)在解析树中采用以命名实体中的元素为中心的方式进行遍历,在遍历过程中依据预设关系抽取规则从解析树中抽取目标信息,构建自然语言问句的查询图;如图2所示,具体包括以下步骤:
(3.1)设置实体集合,初始化为步骤(1)中得到的全部命名实体;
(3.2)设置遍历过程关系提取集合,其中,遍历过程关系提取集合中的关系属性按照权重递减的顺序排列为:subj,obj,nsubj,iobj,dobj,pobj,nsubjpass,csubjpass,nmod:*,xsubj,prep:*,amod等;
(3.3)判断(3.1)中的实体集合中是否存在未被访问过的元素,若存在未被访问过的元素,则执行步骤(3.4),否则结束;
(3.4)以该未被访问过的元素为根节点,在步骤(2)中得到的解析树中进行遍历搜索;
其中,可以采用以深度优先规则进行遍历搜索。
(3.5)在遍历过程中,判断解析树中表示关系的边的属性是否存在(3.1)所示的关系集合中,若不存在,则执行步骤(3.4),若存在多个关系属性,则选取权重最高的关系属性所关联的边,然后执行步骤(3.6);
(3.6)判断权重最高的关系属性所关联的边所连接的节点是表示关系,还是表示实体,若表示关系,直接在查询图中相应节点插入一条边,若表示实体,则执行步骤(3.7);
(3.7)将步骤(3.6)中得到的实体插入到查询图中;同时,判断该实体是否存在于实体集合中,若存在,则执行步骤(3.3),若不存在,则执行步骤(3.8);
(3.8)将获取的实体插入到实体集合中,返回执行步骤(3.3)。
(4)对于步骤(3)中的查询图的每个节点,构建在预设知识图中与查询图中各节点相匹配的节点候选集。
(5)根据步骤(4)中获取的节点候选集,在预设知识图中以节点候选集中的每一个节点为中心进行遍历,得到的以节点候选集中的每一个节点为中心的子图即是覆盖所有答案的子图;
其中,在该步骤中可以采用广度优先遍历的方式。
(6)分别针对预设知识图中的路径构建路径语义向量,针对查询图中的边属性构建边属性语义向量;
如图3所示,具体包括以下步骤:
(6.1)采用词向量的技术来训练得到预设词汇库中词汇的词向量;
(6.2)若是获取知识图中路径的向量表示,则执行(6.3),若是获取查询图中表示关系的短语的向量表示,则执行(6.4);
(6.3)求取知识图的路径中各个边的属性的向量表示,然后将所有边的向量叠加来获取知识图的路径的向量表示;
(6.4)区分查询图中表示关系的短语的核心词和修饰词,将修饰词的词向量映射到核心词的词向量中,以得到查询图中表示关系的短语的向量表示;
(6.5)在求取路径和短语之间的相似度时,采用余弦距离或欧式距离来衡量相似度大小。
(7)根据步骤(6)的知识图的路径的向量和查询图中短语的向量来计算查询图中的边与其在知识图中相匹配的路径之间的相似度,并过滤掉不满足预设相似度要求的子图得到候选答案子图;
其中,预设相似度要求可以根据实际情况进行确定。
(8)根据查询图中的边与该边在知识图中相匹配的路径之间的相似度得到各候选答案子图的整体相似度,确定出整体相似度较高的前k个答案。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于问句和知识图结构分析的自然语言问答方法,其特征在于,包括:
(1)识别自然语言问句中的命名实体,并对所述自然语言问句进行解析以构建解析树;
(2)在所述解析树中采用以所述命名实体中的元素为中心的方式进行遍历,在遍历过程中依据预设关系抽取规则从所述解析树中抽取目标信息,构建所述自然语言问句的查询图;
(3)对于所述查询图中的每个节点,构建在预设知识图中与所述查询图中各节点相匹配的节点候选集;
(4)在所述预设知识图中以所述节点候选集中的每一个节点为中心进行遍历,得到以所述节点候选集中的每一个节点为中心的覆盖所有答案的子图;
(5)针对所述预设知识图中的路径构建路径语义向量,针对所述查询图中的边属性构建边属性语义向量;
(6)根据所述边属性语义向量与所述路径语义向量来计算所述查询图中的边与该边在所述知识图中相匹配的路径之间的相似度,过滤掉不满足预设相似度要求的子图得到候选答案子图;
(7)根据所述查询图中的边与该边在所述知识图中相匹配的路径之间的相似度得到各候选答案子图的整体相似度,确定出整体相似度较高的前k个答案。
2.根据权利要求1所述的方法,其特征在于,步骤(2)具体包括:
(2.1)根据所述命名实体设置实体集合;
(2.2)设置遍历过程关系提取集合,其中,所述遍历过程关系提取集合中的关系属性按照权重递减的顺序排列为:subj,obj,nsubj,iobj,dobj,pobj,nsubjpass,csubjpass,nmod:*,xsubj,prep:*,amod;
(2.3)判断所述实体集合中是否存在未被访问过的元素,若存在未被访问过的元素,则执行步骤(2.4),否则结束;
(2.4)以所述未被访问过的元素为根节点,在所述解析树中进行遍历搜索;
(2.5)在遍历过程中,判断所述解析树中表示关系的边的属性是否存在于所述遍历过程关系提取集合的关系属性中,若不存在,则执行步骤(2.4),若存在多个关系属性,则选择权重最高的关系属性所关联的边,然后执行步骤(2.6);
(2.6)判断权重最高的关系属性所关联的边所连接的节点是表示关系,还是表示实体:若表示关系,则在所述查询图中相应节点插入一条边;若表示实体,则执行步骤(2.7);
(2.7)将所述解析树中表示关系的边所连接的节点表示的实体插入到所述查询图中,并判断该插入的实体是否存在于所述实体集合中,若存在,则执行步骤(2.3),若不存在,则执行步骤(2.8);
(2.8)将该插入的实体插入到所述实体集合中,返回执行步骤(2.3)。
3.根据权利要求1或2所述的方法,其特征在于,步骤(5)具体包括:
(5.1)采用词向量技术训练得到预设词汇库中词汇的词向量;
(5.2)若获取所述预设知识图中路径的向量表示,则执行步骤(5.3),若获取所述查询图中表示关系的短语的向量表示,则执行步骤(5.4);
(5.3)求取所述知识图的路径中各个边的属性的向量表示,然后将所有边的向量叠加来获取所述知识图的路径的向量表示;
(5.4)区分所述查询图中表示关系的短语的核心词和修饰词,将所述修饰词的词向量映射到所述核心词的词向量中,以得到所述查询图中表示关系的短语的向量表示。
4.一种基于问句和知识图结构分析的自然语言问答系统,其特征在于,包括:
解析树构建模块,用于识别自然语言问句中的命名实体,并对所述自然语言问句进行解析以构建解析树;
查询图构建模块,用于在所述解析树中采用以所述命名实体中的元素为中心的方式进行遍历,在遍历过程中依据预设关系抽取规则从所述解析树中抽取目标信息,构建所述自然语言问句的查询图;
节点候选集获取模块,用于对于所述查询图中的每个节点,构建在预设知识图中与所述查询图中各节点相匹配的节点候选集;
子图获取模块,用于在所述预设知识图中以所述节点候选集中的每一个节点为中心进行遍历,得到以所述节点候选集中的每一个节点为中心的覆盖所有答案的子图;
语义向量构建模块,用于针对所述预设知识图中的路径构建路径语义向量,针对所述查询图中的边属性构建边属性语义向量;
候选答案子图获取模块,用于根据所述边属性语义向量与所述路径语义向量来计算所述查询图中的边与该边在所述知识图中相匹配的路径之间的相似度,过滤掉不满足预设相似度要求的子图得到候选答案子图;
目标答案获取模块,用于根据所述查询图中的边与该边在所述知识图中相匹配的路径之间的相似度得到各候选答案子图的整体相似度,确定出整体相似度较高的前k个答案。
5.根据权利要求4所述的系统,其特征在于,所述查询图构建模块包括:
实体集合构建模块,用于根据所述命名实体设置实体集合;
关系提取集合构建模块,用于设置遍历过程关系提取集合,其中,所述遍历过程关系提取集合中的关系属性按照权重递减的顺序排列为:subj,obj,nsubj,iobj,dobj,pobj,nsubjpass,csubjpass,nmod:*,xsubj,prep:*,amod;
第一判断模块,用于判断所述实体集合中是否存在未被访问过的元素,若不存在,则结束;
遍历搜索模块,用于在所述实体集合中存在未被访问过的元素时,以所述未被访问的元素为根节点,在所述解析树中进行遍历搜索;
第二判断模块,用于在遍历过程中,判断所述解析树中表示关系的边的属性是否存在于所述遍历过程关系提取集合的关系属性中,若不存在,则返回执行所述遍历搜索模块;
第三判断模块,用于在所述解析树中表示关系的边的属性存在于所述遍历过程关系提取集合的关系属性中时,选择权重最高的关系属性所关联的边,并判断权重最高的关系属性所关联的边所连接的节点是表示关系,还是表示实体,若表示关系,则在所述查询图中相应节点插入一条边;
第一插入模块,用于在所述解析树中表示关系的边所连接的节点是表示实体时,将所述解析树中表示关系的边所连接的节点表示的实体插入到所述查询图中,并判断该插入的实体是否存在于所述实体集合中,若存在,则返回执行所述第一判断模块;
第二插入模块,用于在该插入的实体不存在于所述实体集合中时,将该插入的实体插入到所述实体集合中,返回执行所述第一判断模块。
6.根据权利要求4或5所述的系统,其特征在于,所述语义向量构建模块包括:
词向量训练模块,用于采用词向量技术训练得到预设词汇库中词汇的词向量;
路径语义向量构建模块,用于在获取所述预设知识图中路径的向量表示时,求取所述知识图的路径中各个边的属性的向量表示,然后将所有边的向量叠加来获取所述知识图的路径的向量表示;
边属性语义向量构建模块,用于在获取所述查询图中表示关系的短语的向量表示时,区分所述查询图中表示关系的短语的核心词和修饰词,将所述修饰词的词向量映射到所述核心词的词向量中,以得到所述查询图中表示关系的短语的向量表示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711204633.4A CN108052547B (zh) | 2017-11-27 | 2017-11-27 | 基于问句和知识图结构分析的自然语言问答方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711204633.4A CN108052547B (zh) | 2017-11-27 | 2017-11-27 | 基于问句和知识图结构分析的自然语言问答方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108052547A true CN108052547A (zh) | 2018-05-18 |
CN108052547B CN108052547B (zh) | 2019-09-27 |
Family
ID=62120619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711204633.4A Active CN108052547B (zh) | 2017-11-27 | 2017-11-27 | 基于问句和知识图结构分析的自然语言问答方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108052547B (zh) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108804599A (zh) * | 2018-05-29 | 2018-11-13 | 浙江大学 | 一种相似子图的快速查找方法 |
CN108921213A (zh) * | 2018-06-28 | 2018-11-30 | 国信优易数据有限公司 | 一种实体分类模型训练方法及装置 |
CN109271502A (zh) * | 2018-09-25 | 2019-01-25 | 武汉大学 | 一种基于自然语言处理的空间查询主题的归类方法及装置 |
CN109299289A (zh) * | 2018-11-30 | 2019-02-01 | 国信优易数据有限公司 | 一种查询图构建方法、装置、电子设备及计算机存储介质 |
CN109299090A (zh) * | 2018-09-03 | 2019-02-01 | 平安科技(深圳)有限公司 | 基金知识推理方法、系统、计算机设备和存储介质 |
CN109408527A (zh) * | 2018-10-15 | 2019-03-01 | 广东顺德西安交通大学研究院 | 一种基于向量空间的rdf结构化查询自动构建方法 |
CN109635281A (zh) * | 2018-11-22 | 2019-04-16 | 阿里巴巴集团控股有限公司 | 业务导图中更新节点的方法和装置 |
CN109815326A (zh) * | 2019-01-24 | 2019-05-28 | 网易(杭州)网络有限公司 | 对话控制方法及装置 |
CN109857846A (zh) * | 2019-01-07 | 2019-06-07 | 阿里巴巴集团控股有限公司 | 用户问句与知识点的匹配方法和装置 |
CN109992786A (zh) * | 2019-04-09 | 2019-07-09 | 杭州电子科技大学 | 一种语义敏感的rdf知识图谱近似查询方法 |
CN110245238A (zh) * | 2019-04-18 | 2019-09-17 | 上海交通大学 | 基于规则推理和句法图式的图嵌入方法及系统 |
CN110427471A (zh) * | 2019-07-26 | 2019-11-08 | 四川长虹电器股份有限公司 | 一种基于知识图谱的自然语言问答方法及系统 |
CN110837550A (zh) * | 2019-11-11 | 2020-02-25 | 中山大学 | 基于知识图谱的问答方法、装置、电子设备及存储介质 |
CN110929519A (zh) * | 2018-09-20 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 实体属性抽取方法及装置 |
CN111159376A (zh) * | 2019-12-30 | 2020-05-15 | 深圳追一科技有限公司 | 会话处理方法、装置、电子设备以及存储介质 |
CN112100358A (zh) * | 2020-09-27 | 2020-12-18 | 四川长虹电器股份有限公司 | 一种基于匹配算法的视觉问答方法及系统 |
CN112214584A (zh) * | 2019-07-10 | 2021-01-12 | 国际商业机器公司 | 使用知识图利用实体关系来发现答案 |
US20210012218A1 (en) * | 2019-07-10 | 2021-01-14 | International Business Machines Corporation | Expanding knowledge graphs using external data source |
CN112417170A (zh) * | 2020-11-23 | 2021-02-26 | 南京大学 | 面向不完备知识图谱的关系链接方法 |
CN112437917A (zh) * | 2018-07-25 | 2021-03-02 | 甲骨文国际公司 | 使用自主代理和词库的数据库的自然语言接口 |
CN112567394A (zh) * | 2018-08-16 | 2021-03-26 | 甲骨文国际公司 | 用于在有限的知识领域中构建知识图的技术 |
CN112632263A (zh) * | 2020-12-30 | 2021-04-09 | 西安交通大学 | 一种基于gcn与指针网络的自然语言到sparql语句的生成系统及方法 |
CN112818092A (zh) * | 2020-04-20 | 2021-05-18 | 腾讯科技(深圳)有限公司 | 知识图谱查询语句生成方法、装置、设备及存储介质 |
CN113449117A (zh) * | 2021-06-24 | 2021-09-28 | 武汉工程大学 | 一种基于Bi-LSTM和中文知识图谱的复合问答方法 |
CN113742443A (zh) * | 2020-05-29 | 2021-12-03 | 京东方科技集团股份有限公司 | 多药共用查询方法、移动终端及存储介质 |
CN114090782A (zh) * | 2020-08-24 | 2022-02-25 | 南京大学 | 一种结构优先的知识库问答实现方法及其系统 |
CN117743506A (zh) * | 2023-09-04 | 2024-03-22 | 应急管理部大数据中心 | 一种基于自然语言的数据关联查询方法及系统 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11868716B2 (en) | 2021-08-31 | 2024-01-09 | International Business Machines Corporation | Knowledge base question answering |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1928864A (zh) * | 2006-09-22 | 2007-03-14 | 浙江大学 | 一种基于问答库的中文自然语言问答方法 |
US20140280307A1 (en) * | 2013-03-15 | 2014-09-18 | Google Inc. | Question answering to populate knowledge base |
US20160203412A1 (en) * | 2014-12-12 | 2016-07-14 | International Business Machines Corporation | Inferred Facts Discovered through Knowledge Graph Derived Contextual Overlays |
CN106682194A (zh) * | 2016-12-29 | 2017-05-17 | 北京百度网讯科技有限公司 | 基于深度问答的答案定位方法及装置 |
CN106934012A (zh) * | 2017-03-10 | 2017-07-07 | 上海数眼科技发展有限公司 | 一种基于知识图谱的自然语言问答实现方法和系统 |
-
2017
- 2017-11-27 CN CN201711204633.4A patent/CN108052547B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1928864A (zh) * | 2006-09-22 | 2007-03-14 | 浙江大学 | 一种基于问答库的中文自然语言问答方法 |
US20140280307A1 (en) * | 2013-03-15 | 2014-09-18 | Google Inc. | Question answering to populate knowledge base |
US20160203412A1 (en) * | 2014-12-12 | 2016-07-14 | International Business Machines Corporation | Inferred Facts Discovered through Knowledge Graph Derived Contextual Overlays |
CN106682194A (zh) * | 2016-12-29 | 2017-05-17 | 北京百度网讯科技有限公司 | 基于深度问答的答案定位方法及装置 |
CN106934012A (zh) * | 2017-03-10 | 2017-07-07 | 上海数眼科技发展有限公司 | 一种基于知识图谱的自然语言问答实现方法和系统 |
Non-Patent Citations (1)
Title |
---|
阮彤等: "中医药知识图谱构建与应用", 《医学信息学杂志》 * |
Cited By (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108804599A (zh) * | 2018-05-29 | 2018-11-13 | 浙江大学 | 一种相似子图的快速查找方法 |
CN108804599B (zh) * | 2018-05-29 | 2022-01-04 | 浙江大学 | 一种相似交易模式的快速查找方法 |
CN108921213A (zh) * | 2018-06-28 | 2018-11-30 | 国信优易数据有限公司 | 一种实体分类模型训练方法及装置 |
CN112437917A (zh) * | 2018-07-25 | 2021-03-02 | 甲骨文国际公司 | 使用自主代理和词库的数据库的自然语言接口 |
CN112567394A (zh) * | 2018-08-16 | 2021-03-26 | 甲骨文国际公司 | 用于在有限的知识领域中构建知识图的技术 |
CN109299090A (zh) * | 2018-09-03 | 2019-02-01 | 平安科技(深圳)有限公司 | 基金知识推理方法、系统、计算机设备和存储介质 |
CN109299090B (zh) * | 2018-09-03 | 2023-05-30 | 平安科技(深圳)有限公司 | 基金中心度计算方法、系统、计算机设备和存储介质 |
CN110929519B (zh) * | 2018-09-20 | 2023-05-02 | 阿里巴巴集团控股有限公司 | 实体属性抽取方法及装置 |
CN110929519A (zh) * | 2018-09-20 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 实体属性抽取方法及装置 |
CN109271502A (zh) * | 2018-09-25 | 2019-01-25 | 武汉大学 | 一种基于自然语言处理的空间查询主题的归类方法及装置 |
CN109408527B (zh) * | 2018-10-15 | 2020-12-01 | 广东顺德西安交通大学研究院 | 一种基于向量空间的rdf结构化查询自动构建方法 |
CN109408527A (zh) * | 2018-10-15 | 2019-03-01 | 广东顺德西安交通大学研究院 | 一种基于向量空间的rdf结构化查询自动构建方法 |
CN109635281B (zh) * | 2018-11-22 | 2023-01-31 | 创新先进技术有限公司 | 业务导图中更新节点的方法和装置 |
CN109635281A (zh) * | 2018-11-22 | 2019-04-16 | 阿里巴巴集团控股有限公司 | 业务导图中更新节点的方法和装置 |
CN109299289A (zh) * | 2018-11-30 | 2019-02-01 | 国信优易数据有限公司 | 一种查询图构建方法、装置、电子设备及计算机存储介质 |
CN109299289B (zh) * | 2018-11-30 | 2021-04-06 | 国信优易数据股份有限公司 | 一种查询图构建方法、装置、电子设备及计算机存储介质 |
CN109857846A (zh) * | 2019-01-07 | 2019-06-07 | 阿里巴巴集团控股有限公司 | 用户问句与知识点的匹配方法和装置 |
CN109857846B (zh) * | 2019-01-07 | 2023-06-20 | 创新先进技术有限公司 | 用户问句与知识点的匹配方法和装置 |
CN109815326A (zh) * | 2019-01-24 | 2019-05-28 | 网易(杭州)网络有限公司 | 对话控制方法及装置 |
CN109992786A (zh) * | 2019-04-09 | 2019-07-09 | 杭州电子科技大学 | 一种语义敏感的rdf知识图谱近似查询方法 |
CN109992786B (zh) * | 2019-04-09 | 2022-11-25 | 杭州电子科技大学 | 一种语义敏感的rdf知识图谱近似查询方法 |
CN110245238A (zh) * | 2019-04-18 | 2019-09-17 | 上海交通大学 | 基于规则推理和句法图式的图嵌入方法及系统 |
CN110245238B (zh) * | 2019-04-18 | 2021-08-17 | 上海交通大学 | 基于规则推理和句法模式的图嵌入方法及系统 |
CN112214584B (zh) * | 2019-07-10 | 2024-06-07 | 国际商业机器公司 | 使用知识图利用实体关系来发现答案 |
US11521078B2 (en) * | 2019-07-10 | 2022-12-06 | International Business Machines Corporation | Leveraging entity relations to discover answers using a knowledge graph |
US20210012218A1 (en) * | 2019-07-10 | 2021-01-14 | International Business Machines Corporation | Expanding knowledge graphs using external data source |
CN112214584A (zh) * | 2019-07-10 | 2021-01-12 | 国际商业机器公司 | 使用知识图利用实体关系来发现答案 |
CN110427471A (zh) * | 2019-07-26 | 2019-11-08 | 四川长虹电器股份有限公司 | 一种基于知识图谱的自然语言问答方法及系统 |
CN110427471B (zh) * | 2019-07-26 | 2022-10-18 | 四川长虹电器股份有限公司 | 一种基于知识图谱的自然语言问答方法及系统 |
CN110837550A (zh) * | 2019-11-11 | 2020-02-25 | 中山大学 | 基于知识图谱的问答方法、装置、电子设备及存储介质 |
CN111159376A (zh) * | 2019-12-30 | 2020-05-15 | 深圳追一科技有限公司 | 会话处理方法、装置、电子设备以及存储介质 |
CN112818092A (zh) * | 2020-04-20 | 2021-05-18 | 腾讯科技(深圳)有限公司 | 知识图谱查询语句生成方法、装置、设备及存储介质 |
CN112818092B (zh) * | 2020-04-20 | 2023-08-11 | 腾讯科技(深圳)有限公司 | 知识图谱查询语句生成方法、装置、设备及存储介质 |
CN113742443A (zh) * | 2020-05-29 | 2021-12-03 | 京东方科技集团股份有限公司 | 多药共用查询方法、移动终端及存储介质 |
CN114090782A (zh) * | 2020-08-24 | 2022-02-25 | 南京大学 | 一种结构优先的知识库问答实现方法及其系统 |
CN112100358A (zh) * | 2020-09-27 | 2020-12-18 | 四川长虹电器股份有限公司 | 一种基于匹配算法的视觉问答方法及系统 |
CN112417170A (zh) * | 2020-11-23 | 2021-02-26 | 南京大学 | 面向不完备知识图谱的关系链接方法 |
CN112417170B (zh) * | 2020-11-23 | 2023-11-14 | 南京大学 | 面向不完备知识图谱的关系链接方法 |
CN112632263A (zh) * | 2020-12-30 | 2021-04-09 | 西安交通大学 | 一种基于gcn与指针网络的自然语言到sparql语句的生成系统及方法 |
CN112632263B (zh) * | 2020-12-30 | 2023-01-03 | 西安交通大学 | 一种基于gcn与指针网络的自然语言到sparql语句的生成系统及方法 |
CN113449117B (zh) * | 2021-06-24 | 2023-09-26 | 武汉工程大学 | 一种基于Bi-LSTM和中文知识图谱的复合问答方法 |
CN113449117A (zh) * | 2021-06-24 | 2021-09-28 | 武汉工程大学 | 一种基于Bi-LSTM和中文知识图谱的复合问答方法 |
CN117743506A (zh) * | 2023-09-04 | 2024-03-22 | 应急管理部大数据中心 | 一种基于自然语言的数据关联查询方法及系统 |
CN117743506B (zh) * | 2023-09-04 | 2024-05-28 | 应急管理部大数据中心 | 一种基于自然语言的数据关联查询方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108052547B (zh) | 2019-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108052547B (zh) | 基于问句和知识图结构分析的自然语言问答方法及系统 | |
CN104915340B (zh) | 自然语言问答方法及装置 | |
CN108804521B (zh) | 一种基于知识图谱的问答方法及农业百科问答系统 | |
TWI746690B (zh) | 自然語言問句答案的產生方法、裝置及伺服器 | |
KR100533810B1 (ko) | 백과사전 질의응답 시스템의 지식베이스 반자동 구축 방법 | |
CN110222045B (zh) | 一种数据报表获取方法、装置及计算机设备、存储介质 | |
CN110377715A (zh) | 基于法律知识图谱的推理式精准智能问答方法 | |
CN110413732A (zh) | 面向软件缺陷知识的知识搜索方法 | |
CN103914548B (zh) | 信息搜索方法和装置 | |
WO2018153266A1 (zh) | 知识图谱构建方法、装置以及存储介质 | |
CN111597308A (zh) | 一种基于知识图谱的语音问答系统及其应用方法 | |
CN109739964A (zh) | 知识数据提供方法、装置、电子设备和存储介质 | |
CN112650840A (zh) | 一种基于知识图谱推理的医疗智能问答处理方法及系统 | |
CN105701253A (zh) | 中文自然语言问句语义化的知识库自动问答方法 | |
US20160124936A1 (en) | Grammar compiling methods, semantic parsing methods, devices, computer storage media, and apparatuses | |
US20090112903A1 (en) | Ontology data import/export method and apparatus | |
CN103593412B (zh) | 一种基于树形结构问题的应答方法及系统 | |
JP2017511922A (ja) | スマート質問回答の実現方法、システム、および記憶媒体 | |
CN109582799A (zh) | 知识样本数据集的确定方法、装置及电子设备 | |
CN106446162A (zh) | 一种面向领域的本体知识库文本检索方法 | |
CN112818092B (zh) | 知识图谱查询语句生成方法、装置、设备及存储介质 | |
CN111339269A (zh) | 模板自动生成的知识图谱问答训练及应用服务系统 | |
CN107885786A (zh) | 面向大数据的自然语言查询接口实现方法 | |
CN109871543A (zh) | 一种意图获取方法及系统 | |
CN110457689A (zh) | 语义处理方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |