CN110597969B - 一种农业知识智能问答方法、系统以及电子设备 - Google Patents
一种农业知识智能问答方法、系统以及电子设备 Download PDFInfo
- Publication number
- CN110597969B CN110597969B CN201910739508.6A CN201910739508A CN110597969B CN 110597969 B CN110597969 B CN 110597969B CN 201910739508 A CN201910739508 A CN 201910739508A CN 110597969 B CN110597969 B CN 110597969B
- Authority
- CN
- China
- Prior art keywords
- question
- entity
- agricultural
- answer
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种农业知识智能问答方法、系统以及电子设备,该方法包括:获取用户问题,并提取用户问题中的至少一个关键字;将关键字输入至农技知识图谱模型中,获取由农技知识图谱模型输出的与用户问题对应的输出结果,输出结果至少包括问题答案;农技知识图谱模型是基于农技知识图谱训练获取得到。该系统包括数据接收单元和数据处理单元,用于执行上述方法。本发明实施例,通过对海量问答数据的深度学习和分析建立农技知识图谱,并基于该图谱建立农技知识图谱模型,对用户输入的问题描述进行关键字提取,实现智能识别问题并生成解决方案的功能,为农业生产提供了一种便捷、科学、高效的指导方式。
Description
技术领域
本发明涉及农业信息推荐技术领域,尤其涉及一种农业知识智能问答方 法、系统以及电子设备。
背景技术
随着科技的发展,越来越多的服务行业利用计算机网络系统对用户提供 的常见问题进行智能回答。其中,智能问答系统一般采用一问一答的形式, 精确的定位用户所需要的提问知识,通过与站用户进行交互,为其提供个性 化的信息服务。
现有技术中,常见的智能问答系统,一般是将所有问题整理成若干流程 诊断型的知识,通过引导交互式地服务,尽量从Web端解决客户常见问题。 但采用上述交互方式所生成的问题答案往往会有答非所问的情况出现,其准 确性、针对性、实时性以及实用性均不能满足实际需要。
在实际运行过程中,尤其是在农业领域,用户的问题所包含的知识范畴 往往较为集中,主要集中在作物、病虫害以及农事操作等几个农机内容。但 目前关于农业知识智能问答方面的研究,均未考虑到这一方面的特性,更没 有研制出将农业知识智能问答与知识图谱进行结合的方法以及系统。
发明内容
本发明实施例提供一种农业知识智能问答方法、系统以及电子设备,用 以解决或部分解决现有技术中存在的不足。
第一方面,本发明实施例提供一种农业知识智能问答方法,包括但不 限于:获取用户问题,并提取用户问题中的至少一个关键字;将关键字输 入至农技知识图谱模型中,获取由农技知识图谱模型输出的与用户问题对 应的输出结果,输出结果至少包括问题答案;其中,农技知识图谱模型是 基于农技知识图谱训练获取得到的。
第二方面,本发明实施例提供一种农业知识智能问答系统,包括但不限 于:数据接收单元和数据处理单元;数据接收单元用于获取用户问题,并提 取用户问题中的至少一个关键字;数据处理单元用于将关键字输入至农技知 识图谱模型中,获取由农技知识图谱模型输出的与所述用户问题对应地问题 答案;农技知识图谱模型是基于农技知识图谱训练获取得到的。
第三方面,本发明实施例提供一种电子设备,包括但不限于存储器、 处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行 程序时实现上述农业知识智能问答方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上 存储有计算机程序,该计算机程序被处理器执行时实现上述农业知识智能 问答方法的步骤。
本发明实施例提供的农业知识智能问答方法、系统以及电子设备,通过 对海量问答数据的深度学习和分析,建立农技知识图谱,并基于该图谱建立 农技知识图谱模型,对用户输入的问题描述进行关键字提取,实现智能识别 问题并生成解决方案的功能,为农业生产提供了一种便捷、科学、高效的指 导方式。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下 面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在 不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种农业知识智能回答方法的流程图;
图2为本发明实施例提供的一种基于农技知识图谱训练获取的农技知识 图谱模型示意图;
图3为本发明实施例提供的一种农技知识图谱获取方法的流程示意图;
图4为本发明实施例提供的一种农业知识问答系统的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发 明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述, 显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获 得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供一种农业知识智能回答方法,包括但 不限于以下步骤:
步骤S1,获取用户问题,并提取用户问题中的至少一个关键字;
步骤S2,将关键字输入至农技知识图谱模型中,获取由农技知识图谱模 型输出的与用户问题对应的输出结果,输出结果至少包括问题答案;其中, 农技知识图谱模型是基于农技知识图谱训练获取得到的。
具体地,在步骤S1中,获取用户问题的方式可以是采用输入输出系统 来实现。例如,用户可以通过外置输入装置,包括键盘、鼠标、手写笔或 者语音输入装置等,将提问内容输入至本发明实施例提供的农业知识智能 问答系统中,该系统获取到该提问内容后,对提问内容进行信息处理,并 提取用户问题中的至少一个关键字。本发明实施例对用户如何将提问内容 输入至该问答系统中不作具体地限定。
进一步地,农业知识智能问答系统根据接收到的用户问题信息,可以 基于自然语言处理工具包NLPIR汉语分词系统,对用户问题信息进行格 式整理及自动分词,并对分词获取的语料进行标注,并从所有语料中挑选 出关键词,挑选出的关键词能够最大限度的代表用户的真实提问意图。本 发明示例提供的农业知识智能回答方法,其中提取用户问题关键字的方法 也可以是基于字符串匹配的分词方法、基于理解的分词方法或者基于统计 的分词方法中的任意一种,对此本发明实施例不作具体限定。例如:当获 取到用户所提出的一个问题:“请问:水稻的顶叶枯黄的原因是什么,该 如何解决”后,利用NLPIR汉语分词系统,对该问题进行关键字提取,获 取到关键字“水稻”、“顶叶”以及“枯黄”,进一步地为了更准确的重现用户 的语义,可以进一步提取到关键字“原因”和“解决”。
进一步地,知识图谱本质上是语义网络,是一种基于图的数据结构,主 要由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世 界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的 最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息 (Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱 提供了从“关系”的角度去分析问题的能力。
鉴于知识图谱在处理、分析问题上的优势,本发明实施例在步骤S2中, 首先基于知识图谱,具体地结合农技知识图谱训练,建立农技知识图谱模型。 其中,农技知识图谱模型可以是复杂网络的一种,其中,复杂网络是指具有 自组织、自相似、吸引子、小世界、无标度中部分或全部性质的网络模型。 该模型的特征主要表现在:小世界、集群即集聚程度的概念、幂律的度分布 概念。
在本发明实施例中,所有用于训练的农技知识图谱以及农技知识图谱模 型可以被存储于云端,当通过步骤S1获取到用户问题的关键字后,将该关键 字输入至农技知识图谱模型,经过模型的关键词节点定位、匹配,知识链条 的建立以及答案拼接,推导出针对该关键字的结果,并进行输出。其中,该 输出结果至少包括针对用户问题的答案。
图2中示出了一种基于农技知识图谱训练获取的农技知识图谱模型示意 图,如图2所示,例如,在步骤S1中提取到的关键字为:苹果、卷叶蛾幼虫 和氯氟氰菊酯水乳剂。在步骤S2中,首先在农技知识图谱模型中对步骤S1 中获取的上述关键字进行定位,然后建立上述关键字之间连接关系的知识链 条,并将模型中的相关的关键字进行连词成句,并以问题答案的形式进行输 出。进一步地,也可以针对例如:“芹菜”、“小麦”等等关键词进行上述操作, 本实施例不一一赘述。
本发明实施例提供的农业知识智能问答方法、系统以及电子设备,通过 对海量问答数据的深度学习和分析,建立农技知识图谱,并基于该图谱建立 农技知识图谱模型,对用户输入的问题描述进行关键字提取,实现智能识别 问题并生成解决方案的功能,为农业生产提供了一种便捷、科学、高效的指 导方式。
基于上述实施例的内容,作为一种可选实施例,如图3所示,其中农技 知识图谱的获取方法包括但不限于包括以下步骤:
步骤S21,获取问答数据集合;其中,问答数据集合包括:问题数据集 合、回答数据集合以及所述问题数据集合与回答数据集合之间的问答关联关 系;
步骤S22,将问答数据集合输入至条件随机场CRF模型,获取实体用词; 其中,上述实体用词与农作物、病虫害及农事操作相关;
步骤S23,通过问题数据集合与回答数据集合之间的问答关联关系,根 据所有实体用词,构建关联实体用词集合;
步骤S24,基于聚类算法和Neo4j图数据库,根据关联实体用词集合, 构建完成农技知识图谱。
具体地,步骤S21又可以称作问答数据抓取阶段,其获取问答数据集合 的方法可以是:编写相应地农技知识爬虫程序,利用该爬虫程序抓取互联网 问答平台上的问答数据。也可以根据现有的可获知的途径,获取现有的网络 资源、论文库资源、专利库资源等,并将所有的资源数据进行整合构成问答 数据集合。
其中,需要说明的是:问答数据集合按照其获取的途径以及性质的不同, 可以被简单的划分为举个例子:问题数据集合为:“玉米生育吸收磷素较少, 如果缺磷会对玉米生长发育产生哪些不良影响”,回答数据集合为:“如果玉 米缺磷,玉米幼苗根系发育不良,植株生长缓慢,叶色紫红,雌穗受精不良, 籽粒发育不好,成熟期推迟”,而上述问题数据集合和回答数据集合之间的问 答关系则为:“玉米”、“缺磷”以及“不良影响”等关联关系。
进一步地,命名实体识别网络(Named entity recognition,简称NER), 是自然语言处理(Nature Language Processing,简称NLP)领域中比较重要的 一个任务,几乎50%以上和文本处理有关的项目中都会涉及到实体用词的识 别。例如:如果把一句话比作一串珍珠的话,实体用词就是这串珍珠项链中 的珍珠,句子的其他部分是把珍珠串起来的线。因此,NER的作用就是要对 这些包含信息的或者专业领域的实体用词进行识别。整个识别的过程就类似 于在一串珍珠项链里面识别出珍珠的过程。
具体到本发明实施例中,步骤S22也可以称作命名实体识别阶段,在本 阶段,采用基于统计的NER方法即条件随机场模型(Conditional Random Fields,简称CRF),将步骤S21中获取的问题数据集合输入至CRF模型中, 利用该问题数据集合中每个数据的特征,对CRF模型进行训练,从而获取命 名实体,即本实施例中提及的与农作物、病虫害及农事操作等相关的实体用 词。
进一步地,由于每个问题数据集合与回答数据集合之间必然存在一定的 问答关联关系,比如在上述实施例中列举的关于玉米缺磷的问题以及与其相 对应的回答之间,必然存在着问答关联关系。步骤S23也可以称作知识库建 立阶段,在本阶段通过上述问答关联关系,利用所有实体用词,构建关联实 体用词集合。并进一步将问题数据集合、回答数据集合以及问答关联关系共 同构建相应的知识库。
例如通过问题数据集合中的“辣椒”,回答数据库中的“甲霜灵锰锌”、“烯 酰吗啉”,并通过两者之间的问答关联关系词:“疫病”,构建出“辣椒-疫病- 甲霜灵锰锌、烯酰吗啉”的农作物-病虫害-农事操作三元化关系。基于上述方 法,对所有问题数据集合、回答数据集合以及问答关联关系进行整合,从而 可以完成构建农技知识库的步骤。
本发明实施例所提供的农技知识图谱模型是基于复杂模型的原理构 建,其中步骤S24也可以称作复杂网络构建阶段,本阶段主要完成基于聚 类算法和Neo4j图数据库,根据关联实体用词集合,构建完成农技知识图谱。
由于基本上每一个实体用词在不同的问答数据中可能具有不同的描述, 为了减少数据冗余性,我们利用聚类算法将相似的实体用词聚类为一类。例 如:“青苹果”和“红苹果”作为两个实体用词,在如何进行施肥、灌溉以 及施药的过程中,由于只关注其“苹果”这一共性,而不关注“青”、“红”之 类的限定词,因此,在上述情形下两个实体用词的性质实质上是相同的,可 以利用聚类算法将这两个不同的实体用词聚类为一个相同的实体用词“苹果”,以减小数据冗余。
进一步地,在完成对关联实体用词集合的聚合后,将聚合的结果导入 Neo4j图数据库,生成对应的农技知识图谱。其中,Neo4j图数据库是一个高 性能的NOSQL图形数据库,具体为一种嵌入式的、基于磁盘的、具备完全 的事务特性的Java持久化引擎,该引擎具有成熟数据库的所有特性。
本发明实施例提供的农业知识智能问答方法,提供了一种通过对海量问 答数据的深度学习和分析,建立农技知识图谱方法,并在该农技知识图谱的 基础上建立农技知识图谱模型,为农业生产提供了一种便捷、科学、高效的 指导方式。
基于上述实施例的内容,作为一种可选实施例,其中在步骤S21中, 获取问答数据集合的方法包括但不限于:利用爬虫程序获取互联网问答平台 上的问答数据,构建问答数据集合;其中,问题数据集合包括问题ID、提问 用户名、提问信息网址、提问用户类别、提问用户地址、提问时间、提问内 容以及症状图片URL;回答数据集合包括:回答内容以及问题ID。
进一步地,在步骤S22中,可以通过问题数据集合与回答数据集合中均 包含的问题ID信息建立问题与回答之间的问答关联关系,并进一步地构建关 联实体用词集合。
需要说明的是,爬虫程序是一种按照一定的规则,自动地抓取万维网信 息的程序或者脚本,其从一个或若干初始网页的URL开始,获得初始网页上 的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列, 直到满足系统的一定停止条件。其根据预定的网页分析算法过滤与主题无关 的链接,保留有用的链接并将其放入等待抓取的URL队列。然后,根据一定 的搜索策略从队列中选择下一步要抓取的网页URL,并重复上述过程,直到 达到系统的预设条件时停止。另外,所有被爬虫抓取的网页将会被系统存贮, 进行一定的分析、过滤,并建立索引,以便于之后的查询和检索。本发明实 施例对应使用何种类型的爬虫程序不作具体地限定,可以是通用网络爬虫、 聚焦网络爬虫或者增量式网络爬虫等。
本发明实施例提供的问答数据集合的建立方法,利用爬虫程序获取问答 数据集合,相较于传统的建立数据集合的方式,涉及的内容更为全面,为提 供真正的问题答案提供了基础。
基于上述实施例的内容,作为一种可选实施例,在步骤S22中将问答 数据集合输入至CRF模型,获取与农作物、病虫害及农事操作相关的所有实 体用词之后,还包括但不限于以下操作:获取实体用词的特征,其中实体用 词的特征包括词性、偏旁部首、左右指界词以及附近数量词;进一步地,利 用所实体用词的特征对CRF模型进行训练。
其中,一方面,关于实体用词偏旁部首特征的选用,是由于农作物、病 虫害、农药的名称常包含有特定偏傍部首的字,可以作为识别命名实体的特 征。农作物方面,农业问答数据集,主要集中于包括瓜菜、根菜、叶菜等蔬 菜,苹果、香蕉等水果及土豆、大豆等大田作物。可用“木”、“艹”、“豆” 偏旁对农作物识别。病虫害是病害和虫害的并称,病害可以通过后缀特征词 “病”进行识别;常见虫害有:稻飞虱、玉米螟、棉铃虫、棉蚜、麦蚜、麦 红蜘蛛、蝗虫等,可用偏旁部首“虫”作为虫害识别的特征。农事操作中的 农药方面,目前使用最多的一类农药是有机合成农药,主要包括有机磷酸酯 类、氨基甲酸酯类和拟除虫菊酯类3大类,这类农药名称的偏旁部首主要是 “气”、“石”、“酉”、“月”等。
另一方面,关于实体用词左右指界词特征的选用,是由于农作物、病虫 害、农事操作等实体用词常与特定的谓词、动词和副词一起出现,某些词出 现在命名实体左边,称为左指界词,出现在右边的称为右指界词。句首位置 也是一种常用的左指界,标点符号也可作为右指界。常见左指界词:种植、 是、得了、预防、注意、喷、施、用、打、加等。常见右指界词:名词、句 末位置、打、加、试试、防治等。
本发明实施例提供的农业知识智能问答方法,通过获取所述实体用词的 特征,提供了另一种问题数据集合和回答数据集合之间的问答关联关系,提 高了CRF模型的训练效率,并提升了农技知识图谱模型输出的结果的准确性、 和全面性。
基于上述实施例的内容,作为一种可选实施例,在步骤S23中,通过 问题数据集合与回答数据集合之间的问答关联关系,根据所有实体用词,构 建关联实体用词集合,包括但不限于以下步骤:基于问题数据集合与回答数 据集合的问答关联关系,建立所有实体用词之间的问答关联关系;并根据实 体用词之间的问答关联关系,构建关联实体用词集合。
例如,若每个问题数据集合中的某一实体用词A的数据项包括:问题ID、 问题内容、提问时间、地点等能容,而每个回答数据集合中的某一实体用词 B的数据项包括:回答ID、问题ID、回答内容等,则可以通过它们共同的数 据项:回答ID,建立所有实体用词A与B之间的问答关联关系,并进一步根 据A、B之间的问答关联关系,完成构建关联实体用词集合。
基于上述实施例的内容,作为一种可选实施例,在步骤S24中,基于 聚类算法和Neo4j图数据库,根据关联实体用词集合,构建农技知识图谱, 包括但不限于以下步骤:
步骤S241,基于聚类算法,对关联实体用词集合进行聚类,获取不同的 实体用词类;实体用词类包括农作物实体类、病虫害实体类以及农事操作实 体类;
步骤S242,分别以农作物实体类、病虫害实体类以及农事操作实体类作 为节点,导入至Neo4j图数据库中;
步骤S243,根据问题数据集合与回答数据集合之间的问答关联关系,获 取节点之间的连接关系,并将连接关系导入至所述Neo4j图数据库中,构建 所述农技知识图谱。
由于任意一个实体用词在不同的问答数据中可能具有不同的描述,为了 减少数据冗余性,在步骤S241中,首先将上一步骤中获取的关联实体用词集 合利用聚类算法进行聚类,聚类后的结果为获取到多个不同的实体用词类。 所有实体用词类的实体用词的总个数必然小于聚合前的关联实体用词集合中 实体用词的个数。
其中,聚类算法又称群分析,它是研究(样品或指标)分类问题的一种 统计分析方法,同时也是数据挖掘的一个重要算法。聚类算法一般有以下几 种实施方式:划分法(Partitioning Methods)、层次法(Hierarchical Methods)、 基于密度的方法(density-based methods)、基于网格的方法(grid-based methods)、基于模型的方法(Model-BasedMethods),本发明实施例不对采 用何种实施方式的聚类算法做出限定。
进一步地,由于本发明实施例主要是针对农业知识的智能问答,因此 在步骤S241中,对关联实体用词集合进行聚类,获取不同的实体用词类后, 实体用词类大致可以划分为包括:农作物实体类、病虫害实体类以及农事操 作实体类这3个大类。
进一步地,步骤S242和步骤S243可以是:分别将农作物实体类、病虫 害实体类以及农事操作实体类作为节点,并以三者之间的连接关系为基础建 立所有节点之间的连接关系。
具体地,将农作物实体类、病虫害实体类以及农事操作实体类的CSV文 件输入至Neo4j图数据库中。将上述农作物实体类、病虫害实体类以及农事 操作实体类作为节点,然后对titile属性添加唯一约束或索引UNIQUE。其中 titile属性是指对于实体用词的提示注解,例如将读取地址指向于一个实体用 词时,会获取与该实体用词项对应的提示或属性信息。并进一步地,根据农 作物实体类、病虫害实体类以及农事操作实体类三者之间的问答关系,建立 三者在Neo4j图数据库中的各个节点之间的连接关系,从而完成建立农技知识图谱这一目的。
本发明实施例提供的农业知识智能问答方法,通过引进聚类算法,有效 了提高了本方法的运算效率,简化了分析运算的工作量。并同时结合Neo4j 图数据库建立农技知识图谱,在一台机器上可以处理数十亿节点/关系/属性的 图,可以扩展到多台机器并行运行。相对于关系数据库来说,图数据库善于 处理大量复杂、互连接、低结构化的数据,这些数据变化迅速,需要频繁的 查询,而在关系数据库中,这些查询会导致大量的表连接,因此会产生性能 上的问题。Neo4j图数据库重点解决了拥有大量连接的传统RDBMS在查询时 出现的性能衰退问题。通过围绕图进行数据建模,Neo4j图数据库会以相同的 速度遍历节点与边,其遍历速度与构成图的数据量没有任何关系。此外,Neo4j 还提供了非常快的图算法、推荐系统和OLAP风格的分析,而这一切在目前 的RDBMS系统中都是无法实现的。
基于上述实施例的内容,作为一种可选实施例,在上述步骤S241中, 基于聚类算法,对关联实体用词集合进行聚类,获取不同的实体用词类,包 括以每个实体用词为基础单元,执行以下步骤:
S71,随机获取每个所述实体用词类的中心点,计算每个基础单元至每个 中心点的距离,并获取距离基础单元的最近中心点;将基础单元重新归于与 所述最近中心点相对应地实体用词类内。
S72,获取实体用词类的中心点,中心点与所述实体用此类中的每个基础 单元所构成的向量长度相同。
S73,计算每个基础单元至每个中心点的距离,并获取距离基础单元的最 近中心点;将基础单元重新归于与最近中心点相对应地实体用词类内,构建 新实体用词类。
S74,迭代执行步骤S72-S73,直至相邻两次迭代结果相同时,停止迭代 的执行。
S75,获取迭代获取的所有新实体用词类。
具体地,在步骤S71中,首先初始化在上一步骤中所获取到的总个数为 N的实体用词类的中心点,获取到N个中心点。然后重新计算所有实体用词 和N个中心点的距离,本根据距离中心点的距离,将所有的实体用词进行重 新归类。具体地,将距离中心点的距离小于设定阈值的实体用词划归于同一 实体用词类,重新获取到N个实体用词类。
在步骤S72中,重新确定N个实体用词类的中心点,其中确认中心点的 标准为:中心点与实体用词类中的每个实体用词所构成的向量长度相同。
进一步地,在步骤S73中,以步骤S72所获取的实体用词类为新基础单 元,计算每个新基础单元至每个中心点的距离,并获取距离新基础单元的最 近中心点;将新基础单元重新归于与最近中心点相对应地实体用词类内,构 建新的实体用词类。
进一步地,执行步骤S74,充分迭代执行上述步骤S72-步骤S73,直至 直到在步骤S73中重新确定的中心点与步骤S72中的原中心点的位置重合时, 停止重复迭代的执行,证明对于关联实体用词集合的聚类已趋于完成,此时 相邻两次迭代的结果也是相同的。
基于上述实施例的内容,作为另一种可选实施例,在上述步骤S241 中,基于聚类算法,对关联实体用词集合进行聚类,获取不同的实体用词类, 包括以每个实体用词为基础单元,也可以执行以下步骤:
S81,随机选取任意基础单元为中心点,将与中心点所构成的向量长度在 设定阈值内的所有基础单元组建为实体用词类,直至所有基础单元均被归于 各自的实体用词类内;
S82,以实体用词类为新基础单元,并随机将所有新基础单元再次划分为 多个新实体用词类;
S83,迭代执行步骤S81-S82,直至相邻两次迭代结果相同时,停止迭代 的执行;
S84,获取不同的实体用词类。
相较于上一实施例中对关联实体用词集合进行聚类,获取不同的实体用 词类的方法,本发明实施例的区别在于:在上一实施例中迭代执行步骤 S72-S73的过程是在每次迭代前重新计算获取中心点,而在本实施例中,迭代 执行步骤S81-S82的过程是随机获取中心点,因此在本实施例中对于获取不 同的实体用词类的方法不再一一赘述。
基于上述实施例的内容,作为一种可选实施例,农技知识图谱模型是 基于农技知识图谱训练获取得到的,包括但不限于:将测试样本输入至农技 知识图谱中,输出与测试样本对应的问题答案,将输出的问题答案与标准答 案作对比,获取样本统计数据;利用样本统计数据对农技知识图谱模型进行 训练。
其中,问题答案是将测试样本输入至农技知识图谱训练获取的,而标准 答案的获取可以通过以下几个途径获取:根据专家答案进行获取,根据搜索 相关论文文献、教科书、专利文件等方式获取,可以是邀请部分农民使用问 答机器人,在田间实施试用给出的方案,验证其可用性和可靠性;也可以是 请中国农大农学专业的专家对系统的推荐农事操作进行合理性分析和理论验 证,记录专家的建议和结论等。相对来说,标准答案相较于本发明实施例提 供的问题答案,对于测试样本的回答的准确性和权威性要高。需要说明的是,本发明实施例不对标准答案的获取方法作具体地限定。进一步地,根据问题 答案与标准答案作对比所获取样本统计数据,对农技知识图谱模型进行训练 和改进。
本发明实施例提供的农业知识智能问答方法,通过反复的将获取的问题 答案与标准答案进行对比,完成对农技知识图谱模型训练和改进,使的本实 施例方法的输出结果更为准确。
基于上述实施例的内容,作为一种可选实施例,在步骤S2中的输出 结果,还可以包括:与用户问题相关联的农事推荐、农事预警以及农技操作 信息。
即当用户提出问题时,本发明实施例提供的方法不仅将问题答案推送出 来,而且会将与这个问题相关的知识也都推送出来供用户查询,这样就做到 了一次提问,可以全面掌握所有信息,其中,推送信息可以是与用户问题相 关联的农事推荐、农事预警以及农技操作信息等。对此本发明实施例不作具 体地限定。
基于上述实施例的内容,作为一种可选实施例,在执行完步骤S2后, 即将关键字输入至农技知识图谱模型中,获取由农技知识图谱模型输出的与 用户问题对应的问题答案之后,还包括:在对话界面中显示用户问题与用户 问题对应的问题答案,对话界面中至少包含对话框,用户问题与用户问题对 应的问题答案显示在对话框中。
其中,该对话界面的设计是基于GUI设计,利用阿里巴巴矢量图标库、iconpng.com、iconfinder.com、easyicon.com等开发者图片库的支持,使用 Photoshop PS进行图片制作完成的。
如图4所示,本发明实施例提供一种农业知识智能问答系统,包括但 不限于:数据接收单元41和数据处理单元42;
其中,数据接收单元41用于获取用户问题,并提取用户问题中的至少一 个关键字;数据处理单元42用于将关键字输入至农技知识图谱模型中,获取 由农技知识图谱模型输出的与用户问题对应地问题答案;农技知识图谱模型 是基于农技知识图谱训练获取得到的。
具体地,当用户通过外置设备将问题输入至数据接收单元41,数据接收 单元41提取该问题中的至少一个关键字,其中,提取关键字的方法可以是基 于已有的自然语言处理工具包NLPIR为基础,对该问题进行格式整理及自动 分词,对分词后的语料进行自动标注,获取关键语料作为关键字。
进一步地,可以设置农技知识图谱模型运算模块,该运算模块存储于数 据处理单元42中;也可以将农技知识图谱模型存储与云端,而数据处理单元 42可以通过同云端建立的通讯连接关系,实现对农技知识图谱模型的取放。 本发明实施例提供的农技知识图谱模型可以对输入的关键字进行处理分析, 并输出与该关键字对应的问题答案。
本发明实施例提供的农业知识智能问答系统,通过设置数据处理单元, 对海量问答数据的深度学习和分析,建立农技知识图谱,并基于该图谱建立 农技知识图谱模型,对用户输入的问题描述进行关键字提取,实现智能识别 问题并生成解决方案的功能,为农业生产提供了一种便捷、科学、高效的指 导方式。
基于上述实施例的内容,作为一种可选实施例,本发明实施例提供的 农业知识智能问答系统,还可以包括显示单元,该显示单元用于显示用户问 题以及与该问题相对应地问题答案。进一步地,显示单元还用于显示农技知 识图谱。
进一步地,本发明实施例所提供的农业知识智能问答系统可以应用与机 器人领域,结合声音转换模块、文字转换模块、通讯模块蓝牙模块等等外 置单元,制成一种智能机器人,并可以实现人机互动、网络远程协助等多 种功能。
图5示例了一种服务器的实体结构示意图,如图5所示,该服务 器可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510, 通信接口520,存储器530通过通信总线540完成相互间的通信。处 理器510可以调用存储器530中的逻辑指令,以执行如下方法:获取 用户问题,并提取用户问题中的至少一个关键字;将关键字输入 至农技知识图谱模型中,获取由农技知识图谱模型输出的与用户
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实 现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质 中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献 的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软 件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可 以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方 法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储 器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上 存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例 提供的传输方法,例如包括:获取用户问题,并提取用户问题中的至少一 个关键字;将关键字输入至农技知识图谱模型中,获取由农技知识图谱模 型输出的与用户问题对应的输出结果,输出结果至少包括问题答案;其中, 农技知识图谱模型是基于农技知识图谱训练获取得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明 的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或 者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络 单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例 方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以 理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实 施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬 件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部 分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可 读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台 计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施 例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其 限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术 人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或 者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技 术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (12)
1.一种农业知识智能问答方法,其特征在于,包括:
获取用户问题,并提取所述用户问题中的至少一个关键字;
将所述关键字输入至农技知识图谱模型中,获取由所述农技知识图谱模型输出的与所述用户问题对应的输出结果,所述输出结果至少包括问题答案;
所述农技知识图谱模型是基于农技知识图谱训练获取得到的;
所述农技知识图谱的获取方法包括:
获取问答数据集合,所述问答数据集合包括:问题数据集合、回答数据集合以及所述问题数据集合与回答数据集合之间的问答关联关系;
将所述问答数据集合输入至条件随机场CRF模型,获取实体用词;所述实体用词与农作物、病虫害及农事操作相关;
通过所述问题数据集合与回答数据集合之间的问答关联关系,根据所有实体用词,构建关联实体用词集合;
基于聚类算法和Neo4j图数据库,根据所述关联实体用词集合,构建完成所述农技知识图谱;
在将所述问答数据集合输入至条件随机场CRF模型,获取实体用词之后,还包括:
获取所述实体用词的特征,所述实体用词的特征包括词性、偏旁部首、左右指界词以及附近数量词;
利用所述实体用词的特征对所述CRF模型进行训练;
所述基于聚类算法和Neo4j图数据库,根据所述关联实体用词集合,构建完成所述农技知识图谱,包括:
基于所述聚类算法,对所述关联实体用词集合进行聚类,获取不同的实体用词类;所述实体用词类包括农作物实体类、病虫害实体类以及农事操作实体类;
分别以所述农作物实体类、病虫害实体类以及农事操作实体类作为节点,导入至所述Neo4j图数据库中;
根据所述问题数据集合与回答数据集合之间的问答关联关系,获取所述节点之间的连接关系,并将所述连接关系导入至所述Neo4j图数据库中,构建所述农技知识图谱。
2.根据权利要求1所述的农业知识智能问答方法,其特征在于,所述获取问答数据集合包括:
利用爬虫程序获取互联网问答平台上的问答数据,构建所述问答数据集合;
其中,所述问题数据集合包括问题ID、提问用户名、提问信息网址、提问用户类别、提问用户地址、提问时间、提问内容以及症状图片URL;
所述回答数据集合包括:回答内容以及问题ID。
3.根据权利要求2所述的农业知识智能问答方法,其特征在于,所述通过所述问题数据集合与回答数据集合之间的问答关联关系,根据所有实体用词,构建关联实体用词集合,包括:
基于所述问题数据集合与所述回答数据集合的问答关联关系,建立所有所述实体用词之间的问答关联关系;
根据所述实体用词之间的问答关联关系,构建所述关联实体用词集合。
4.根据权利要求1所述的农业知识智能问答方法,其特征在于,所述基于所述聚类算法,对所述关联实体用词集合进行聚类,获取不同的实体用词类,包括以每个实体用词为基础单元,执行以下步骤:
S71,随机获取每个所述实体用词类的中心点,计算每个基础单元至每个中心点的距离,并获取距离所述基础单元的最近中心点;将所述基础单元重新归于与所述最近中心点相对应地实体用词类内;
S72,获取所述实体用词类的中心点,所述中心点与所述实体用词类中的每个基础单元所构成的向量长度相同;
S73,以所述实体用词类为新基础单元,计算每个新基础单元至每个所述中心点的距离,并获取距离所述新基础单元的最近中心点;将所述新基础单元重新归于与所述最近中心点相对应地实体用词类内,构建新的实体用词类;
S74,迭代执行步骤S72-S73,直至相邻两次迭代结果相同时,停止迭代的执行;
S75,获取不同的实体用词类。
5.根据权利要求1所述的农业知识智能问答方法,其特征在于,所述基于所述聚类算法,对所述关联实体用词集合进行聚类,获取不同的实体用词类,包括以每个实体用词为基础单元,执行以下步骤:
S81,随机选取任意基础单元为中心点,将与所述中心点所构成的向量长度在设定阈值内的所有基础单元组建为实体用词类,直至所有所述基础单元均被归于各自的实体用词类内;
S82,以所述实体用词类为新基础单元,并随机将所有所述新基础单元再次划分为多个新实体用词类;
S83,迭代执行步骤S81-S82,直至相邻两次迭代结果相同时,停止迭代的执行;
S84,获取不同的实体用词类。
6.根据权利要求1所述的农业知识智能问答方法,其特征在于,所述农技知识图谱模型是基于农技知识图谱训练获取得到的,包括:
将测试样本输入至所述农技知识图谱中,输出与所述测试样本对应的问题答案,将输出的问题答案与标准答案作对比,获取样本统计数据;
利用所述样本统计数据对所述农技知识图谱模型进行训练。
7.根据权利要求1所述的农业知识智能问答方法,其特征在于,所述输出结果,还包括:
与所述用户问题相关联的农事推荐、农事预警以及农技操作信息。
8.根据权利要求1所述的农业知识智能问答方法,其特征在于,所述将所述关键字输入至农技知识图谱模型中,获取由所述农技知识图谱模型输出的与所述用户问题对应的问题答案之后,还包括:
在对话界面中显示所述用户问题与所述用户问题对应的问题答案,所述对话界面中至少包含对话框,所述用户问题与所述用户问题对应的问题答案显示在所述对话框中。
9.一种农业知识智能问答系统,其特征在于,包括:数据接收单元和数据处理单元;
所述数据接收单元用于获取用户问题,并提取所述用户问题中的至少一个关键字;
所述数据处理单元用于将所述关键字输入至农技知识图谱模型中,获取由所述农技知识图谱模型输出的与所述用户问题对应地问题答案;
所述农技知识图谱模型是基于农技知识图谱训练获取得到的;
所述农技知识图谱的获取方法包括:
获取问答数据集合,所述问答数据集合包括:问题数据集合、回答数据集合以及所述问题数据集合与回答数据集合之间的问答关联关系;
将所述问答数据集合输入至条件随机场CRF模型,获取实体用词;所述实体用词与农作物、病虫害及农事操作相关;
通过所述问题数据集合与回答数据集合之间的问答关联关系,根据所有实体用词,构建关联实体用词集合;
基于聚类算法和Neo4j图数据库,根据所述关联实体用词集合,构建完成所述农技知识图谱;
在将所述问答数据集合输入至条件随机场CRF模型,获取实体用词之后,还包括:
获取所述实体用词的特征,所述实体用词的特征包括词性、偏旁部首、左右指界词以及附近数量词;
利用所述实体用词的特征对所述CRF模型进行训练;
所述基于聚类算法和Neo4j图数据库,根据所述关联实体用词集合,构建完成所述农技知识图谱,包括:
基于所述聚类算法,对所述关联实体用词集合进行聚类,获取不同的实体用词类;所述实体用词类包括农作物实体类、病虫害实体类以及农事操作实体类;
分别以所述农作物实体类、病虫害实体类以及农事操作实体类作为节点,导入至所述Neo4j图数据库中;
根据所述问题数据集合与回答数据集合之间的问答关联关系,获取所述节点之间的连接关系,并将所述连接关系导入至所述Neo4j图数据库中,构建所述农技知识图谱。
10.根据权利要求9所述的农业知识智能问答系统,其特征在于,还包括:显示单元,所述显示单元用于显示用户问题以及与所述问题相对应地问题答案;
所述显示单元还用于显示所述农技知识图谱。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任一项所述农业知识智能问答方法的步骤。
12.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至8任一项所述农业知识智能问答方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910739508.6A CN110597969B (zh) | 2019-08-12 | 2019-08-12 | 一种农业知识智能问答方法、系统以及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910739508.6A CN110597969B (zh) | 2019-08-12 | 2019-08-12 | 一种农业知识智能问答方法、系统以及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110597969A CN110597969A (zh) | 2019-12-20 |
CN110597969B true CN110597969B (zh) | 2022-05-24 |
Family
ID=68854019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910739508.6A Active CN110597969B (zh) | 2019-08-12 | 2019-08-12 | 一种农业知识智能问答方法、系统以及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110597969B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111309922B (zh) * | 2020-01-19 | 2023-11-17 | 清华大学 | 图谱构建方法、事故分类方法、装置、计算机设备和介质 |
CN111461753B (zh) * | 2020-04-17 | 2022-05-17 | 支付宝(杭州)信息技术有限公司 | 智能客服场景中的知识点召回方法及装置 |
CN111666393A (zh) * | 2020-04-29 | 2020-09-15 | 平安科技(深圳)有限公司 | 智能问答系统的验证方法、装置、计算机设备及存储介质 |
CN112231459A (zh) * | 2020-10-27 | 2021-01-15 | 恩亿科(北京)数据科技有限公司 | 一种基于知识图谱实现软件测试智能问答的方法及系统 |
CN113643052B (zh) * | 2021-04-21 | 2023-11-14 | 西安农链互联网科技有限公司 | 一种基于大数据分析的农业产销信息共享服务系统 |
CN112948566B (zh) * | 2021-04-21 | 2024-02-02 | 华东理工大学 | 化工知识图谱的构建方法及装置以及智能问答方法及装置 |
CN113204635A (zh) * | 2021-06-08 | 2021-08-03 | 重庆电子工程职业学院 | 一种用于现代农业种植的智能咨询系统 |
CN114860917B (zh) * | 2022-07-06 | 2022-10-18 | 中化现代农业有限公司 | 农业知识问答方法、装置、电子设备和存储介质 |
CN115544236A (zh) * | 2022-11-16 | 2022-12-30 | 北京红棉小冰科技有限公司 | 一种模型评估方法、装置及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103257983A (zh) * | 2012-09-10 | 2013-08-21 | 苏州大学 | 一种基于唯一性约束的Deep Web实体识别方法 |
CN106776711A (zh) * | 2016-11-14 | 2017-05-31 | 浙江大学 | 一种基于深度学习的中文医学知识图谱构建方法 |
CN107729493A (zh) * | 2017-09-29 | 2018-02-23 | 北京创鑫旅程网络技术有限公司 | 旅行知识图谱的构建方法、装置及旅行问答方法、装置 |
CN107766483A (zh) * | 2017-10-13 | 2018-03-06 | 华中科技大学 | 一种基于知识图谱的交互式问答方法及系统 |
CN108509519A (zh) * | 2018-03-09 | 2018-09-07 | 北京邮电大学 | 基于深度学习的通用知识图谱增强问答交互系统及方法 |
CN109446341A (zh) * | 2018-10-23 | 2019-03-08 | 国家电网公司 | 知识图谱的构建方法及装置 |
CN109460823A (zh) * | 2018-09-14 | 2019-03-12 | 广州神马移动信息科技有限公司 | 知识库的构建方法及其装置、电子设备、计算机可读介质 |
CN109815991A (zh) * | 2018-12-29 | 2019-05-28 | 北京城市网邻信息技术有限公司 | 机器学习模型的训练方法、装置、电子设备及存储介质 |
-
2019
- 2019-08-12 CN CN201910739508.6A patent/CN110597969B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103257983A (zh) * | 2012-09-10 | 2013-08-21 | 苏州大学 | 一种基于唯一性约束的Deep Web实体识别方法 |
CN106776711A (zh) * | 2016-11-14 | 2017-05-31 | 浙江大学 | 一种基于深度学习的中文医学知识图谱构建方法 |
CN107729493A (zh) * | 2017-09-29 | 2018-02-23 | 北京创鑫旅程网络技术有限公司 | 旅行知识图谱的构建方法、装置及旅行问答方法、装置 |
CN107766483A (zh) * | 2017-10-13 | 2018-03-06 | 华中科技大学 | 一种基于知识图谱的交互式问答方法及系统 |
CN108509519A (zh) * | 2018-03-09 | 2018-09-07 | 北京邮电大学 | 基于深度学习的通用知识图谱增强问答交互系统及方法 |
CN109460823A (zh) * | 2018-09-14 | 2019-03-12 | 广州神马移动信息科技有限公司 | 知识库的构建方法及其装置、电子设备、计算机可读介质 |
CN109446341A (zh) * | 2018-10-23 | 2019-03-08 | 国家电网公司 | 知识图谱的构建方法及装置 |
CN109815991A (zh) * | 2018-12-29 | 2019-05-28 | 北京城市网邻信息技术有限公司 | 机器学习模型的训练方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110597969A (zh) | 2019-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110597969B (zh) | 一种农业知识智能问答方法、系统以及电子设备 | |
CN106874378B (zh) | 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法 | |
CN109255031A (zh) | 基于知识图谱的数据处理方法 | |
CN110209839B (zh) | 农业知识图谱构建装置、方法及计算机可读存储介质 | |
Miao et al. | A dynamic financial knowledge graph based on reinforcement learning and transfer learning | |
CN112926325A (zh) | 基于bert神经网络的中文人物关系抽取构建方法 | |
CN114021546A (zh) | 迁移语境网络的大桃生产知识开放问答方法及装置 | |
CN113434644B (zh) | 一种农技知识服务方法及系统 | |
Kumar et al. | An algorithm for automatic text annotation for named entity recognition using Spacy framework | |
US8112707B2 (en) | Capturing reading styles | |
CN108932350A (zh) | 基于多策略的水稻病虫害智能问答方法 | |
Malik et al. | Ontology development for agriculture domain | |
Abu Bakar et al. | Base durian ontology development using modified methodology | |
CN114860917B (zh) | 农业知识问答方法、装置、电子设备和存储介质 | |
CN115878814A (zh) | 一种基于机器阅读理解的知识图谱问答方法及其系统 | |
CN116049376A (zh) | 一种信创知识检索回复的方法、装置和系统 | |
CN102663123B (zh) | 基于伪种子属性和随机漫步排序的语义属性自动抽取方法及实现该方法的系统 | |
Qbadou et al. | Towards an educational recommendation system based on big data techniques-case of Hadoop | |
JP2006085389A (ja) | 検索装置 | |
CN115168408B (zh) | 基于强化学习的查询优化方法、装置、设备及存储介质 | |
Zhekova | An Algorithm for Exploratory Analysis and Normalization of Big Data with Pandas | |
Tanjung et al. | IMPLEMENTATION OF TWO LANGUAGE CHATBOT WEB TO FIND INFORMATION ON BATIK USING THE ARTIFICIAL NEURAL NETWORK MODEL | |
US20220405336A1 (en) | System and Method for Modification, Personalization and Customization of Search Results and Search Result Ranking in an Internet-Based Search Engine | |
Georges et al. | Variability Extraction from Simulator I/O Data Schemata in Agriculture Decision-Support Software | |
Ramesh et al. | Interactive post mining association rules using cost complexity pruning and ontologies KDD |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |