CN113495900A - 基于自然语言的结构化查询语言语句获取方法及装置 - Google Patents
基于自然语言的结构化查询语言语句获取方法及装置 Download PDFInfo
- Publication number
- CN113495900A CN113495900A CN202110933193.6A CN202110933193A CN113495900A CN 113495900 A CN113495900 A CN 113495900A CN 202110933193 A CN202110933193 A CN 202110933193A CN 113495900 A CN113495900 A CN 113495900A
- Authority
- CN
- China
- Prior art keywords
- query
- position information
- filling
- text
- slot position
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000011218 segmentation Effects 0.000 claims description 64
- 238000012545 processing Methods 0.000 claims description 20
- 238000006243 chemical reaction Methods 0.000 abstract description 8
- 238000010276 construction Methods 0.000 abstract 1
- 238000012549 training Methods 0.000 description 17
- DNIAPMSPPWPWGF-UHFFFAOYSA-N monopropylene glycol Natural products CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 10
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 8
- 230000002776 aggregation Effects 0.000 description 6
- 238000004220 aggregation Methods 0.000 description 6
- 238000013145 classification model Methods 0.000 description 6
- 238000002372 labelling Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- -1 methyl propylene glycol Chemical compound 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 4
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 4
- QQONPFPTGQHPMA-UHFFFAOYSA-N propylene Natural products CC=C QQONPFPTGQHPMA-UHFFFAOYSA-N 0.000 description 4
- 125000004805 propylene group Chemical group [H]C([H])([H])C([H])([*:1])C([H])([H])[*:2] 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OWBTYPJTUOEWEK-UHFFFAOYSA-N butane-2,3-diol Chemical compound CC(O)C(C)O OWBTYPJTUOEWEK-UHFFFAOYSA-N 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了基于自然语言的结构化查询语言语句获取方法、装置、电子设备及存储介质,该方法包括:获取自然语言下的查询文本,并确定查询文本的查询类别;获取查询文本中的命名实体,并确定命名实体的实体类别;根据查询文本的查询类别,以及命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果;根据第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。本发明实施例提供的技术方案,实现了基于自然语言构建SQL查询语句,提升了用户对SQL数据库的访问便利性,提高了SQL查询语句的转换精度。
Description
技术领域
本发明实施例涉及数据库领域,尤其涉及基于自然语言的结构化查询语言语句获取方法、装置、电子设备和存储介质。
背景技术
由于结构化查询语言(Structured Query Language,SQL)数据库,具备交互性强的特点,因此被广泛应用于数据存储领域,自然语言转SQL(Natural Language to SQL,NL2SQL)技术的出现,使得用户可以使用非结构化的自然语言,访问SQL数据库,以提高用户的访问便利性。
现有的NL2SQL的实现,通常是基于深度学习模型进行端到端的学习训练,进而通过训练完成的端到端模型,实现NL2SQL;但这样的实现方式,获取到的深度学习模型可解释性不强、SQL语句的转换精度较低,且对训练数据集的要求比较高,需要大量标注好的训练集语料和测试集语料,同时端到端模型的训练,也需要较长时间完成,因此人力成本和时间成本极高。
发明内容
本发明实施例提供了基于自然语言的结构化查询语言语句获取方法、装置、电子设备和存储介质,实现了根据自然语言获取SQL查询语句。
第一方面,本发明实施例提供了一种基于自然语言的结构化查询语言语句获取方法,包括:
获取自然语言下的查询文本,并确定所述查询文本的查询类别;
获取所述查询文本中的命名实体,并确定所述命名实体的实体类别;
根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果;
根据所述第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
第二方面,本发明实施例提供了一种基于自然语言的结构化查询语言语句获取装置,包括:
查询类别获取模块,用于获取自然语言下的查询文本,并确定所述查询文本的查询类别;
实体类别获取模块,用于获取所述查询文本中的命名实体,并确定所述命名实体的实体类别;
第一填充结果获取模块,用于根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果;
查询语句获取模块,用于根据所述第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的基于自然语言的结构化查询语言语句获取方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时实现本发明任意实施例所述的基于自然语言的结构化查询语言语句获取方法。
本发明实施例提供的技术方案,在获取到自然语言下查询文本的查询类别,以及查询文本中各命名实体的实体类别后,对槽位信息模板中的槽位信息项进行填充,进而将第一填充结果,填充进SQL查询模板中,最终获取SQL查询语句,实现了基于自然语言构建SQL查询语句,提升了用户对SQL数据库的访问便利性,提高了SQL查询语句的转换精度,同时,相比于训练端到端的转换模型,减少了对训练数据集的人工标注,以及模型训练时间,极大地降低了人力成本和时间成本。
附图说明
图1是本发明实施例一提供的基于自然语言的结构化查询语言语句获取方法的流程图;
图2是本发明实施例二提供的基于自然语言的结构化查询语言语句获取方法的流程图;
图3是本发明实施例三提供的基于自然语言的结构化查询语言语句获取方法的流程图;
图4是本发明实施例四提供的基于自然语言的结构化查询语言语句获取方法的流程图;
图5是本发明实施例五提供的基于自然语言的结构化查询语言语句获取装置的结构框图;
图6是本发明实施例六提供的一种电子设备的结构框图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的基于自然语言的结构化查询语言语句获取方法的流程图,本发明实施例可适用于根据自然语言下的查询文本,获取对应的SQL查询语句,该方法可以由本发明实施例中的基于自然语言的结构化查询语言语句获取装置来执行,该装置可以通过软件和/或硬件实现,并集成在电子设备中,典型的,可以集成在连接SQL数据库的服务器中,该方法具体包括如下步骤:
S110、获取自然语言下的查询文本,并确定所述查询文本的查询类别。
自然语言是指自然地随文化演化而来的语言,例如,汉语、英语和日语等;查询文本,可以是用户直接输入的文本信息,也可以是将用户输入的语音信息进行语音识别后,获取的文本信息;在本发明实施例中,可选的,对自然语言的类型和查询文本的来源均不作具体限定。
查询类别,是用户提出的问题的问答分类,具体可以包括阈值查询、最值查询、聚合查询、分组查询、排序查询、单指标查询和多指标查询;其中,阈值查询,是查询一定阈值范围内的数据信息,例如,“北京人口大于2000万的年份有哪些”;最值查询,是对最大数值或最小数值的查询,例如,“北京的GPD最高的月份是哪个”;聚合查询,是基于聚合函数进行的查询,聚合函数包括求和运算以及求平均运算等,例如,“北京各区的GDP总计是多少”;分组查询,是基于分组函数进行的查询,例如,“北京各区的GDP分别是多少”;排序查询,是基于排序结果进行的查询,例如,“北京人口总数排名前三的区是哪些”;单指标查询,是基于单一业务指标进行的查询,例如,“北京有多少人口”,显然,“人口”为单一的业务指标;多指标查询,是基于多个业务指标进行的查询,例如,“北京的人口和GDP分别是多少”,显然,“人口”和“GDP”为两个不同的业务指标。
查询类别可以通过文本分类模型获取;具体的,文本分类模型,是预先训练完成并用于文本识别及分类的模型,例如,基于深度学习的文本分类模型,其作用在于针对输入的文本信息,进行文本特征的提取,并获取特征向量;文本特征是表示文本内容的基本单位,可以将文本信息中的字或词作为该文本信息的文本特征,而特征向量则是文本特征量化表示的结果,通常为多维度的特征向量;在获取到待识别文本信息的特征向量后,通过对特征向量的识别,输出文本信息中文本内容(即字或词)为各类别的概率,进而根据概率进行分类(即多类别分类),以确定用户的查询类别。特别的,如果文本分类模型无法识别出当前查询文本的分类类别,则将当前查询文本发送给工作人员,以提示工作人员进行人工分类标注,以增加分类类别,并根据人工分类标注完成的查询文本,对上述文本分类模型进行训练,以使文本分类模型具备对新增分类类别的识别能力。
S120、获取所述查询文本中的命名实体,并确定所述命名实体的实体类别。
命名实体(Named Entity)是文本中具有特定意义或者指代性强的实体,实体类别包括实体类(例如,人名、机构名、地名和专有名词等)、时间类和数字类(例如,日期、货币和百分比等);通过命名实体识别(Named Entity Recognition,NER)技术,对查询文本中的命名实体进行识别,获取查询文本中的各个命名实体,并确定每个命名实体的实体类别。
具体的,命名实体及命名实体的实体类别可以通过命名实体识别模型获取;其中,命名实体识别模型可以包括隐马尔可夫模型(Hidden Markov Model,HMM)、最大熵马尔可夫模型(Maximum Entropy Markov Model,MEMM)和条件随机场模型(Conditional RandomField,CRF)。HMM是用于描述含有隐含未知参数的马尔可夫过程的统计模型,通过从可观察的参数中确定过程中的隐含参数,对于过程中的状态预测效果较好,其训练时的收敛速度和应用时的识别速度均较快,具有实时性好的特点;MEMM具有结构紧凑以及通用性较强的特点;CRF则为命名实体提供了特征灵活,且全局最优的标注框架,识别准确性较高。
可选的,在本发明实施例中,在获取所述查询文本中的命名实体前,还包括:对所述查询文本进行分词处理;所述获取所述查询文本中的命名实体,包括:获取分词处理后的所述查询文本中的命名实体。分词处理,是将文字序列切分成一个一个独立词汇的过程,以汉语语言为例,对于查询文本的分词处理,可以通过机械分词的方式进行,即将文字序列的各个子序列与词典中的词汇进行匹配,若匹配成功,则确定为一个词汇;其中,词典可以为通用领域的业务词典,也可以为特定领域的业务词典;还可以通过机器学习的方式进行分词处理,即基于人工标注的词性和统计特征建立分词模型,例如,隐马尔可夫模型和条件随机场模型,根据预先标注完成的语料信息,对分词模型的参数进行训练,通过计算各种分词出现的概率,将概率最大的分词结果作为最终分词结果;其中,预先标注完成的语料信息可以是通用领域的语料信息,也可以为特定领域的语料信息;对查询文本进行的分词处理,确保了后续进行命名实体识别时,获取到的命名实体的准确性。
可选的,在本发明实施例中,所述对所述查询文本进行分词处理,包括:通过通用领域的分词模型,对所述查询文本进行初始分词,以获取初始分词文本;根据特定领域的业务词典,对所述初始分词文本进行分词调整,以获取分词处理后的所述查询文本。当对特定领域的查询文本进行分词处理时,由于不同技术领域的文本信息具备不同的文字关联特征,与通用词典存在较大差别,如果仅使用通用领域的分词模型,执行特定领域的分词处理,会存在较大的分词误差;如果使用特定领域的分词模型,则需要根据本领域的业务词典,预先标注大量的、本领域内的语料信息,并执行本领域内分词模型的迭代训练,训练过程极为繁琐,需要耗费大量的时间成本和计算资源,因此,可以通过通用领域的分词模型,对特定领域的查询文本进行初始分词,进而根据特定领域的业务词典,对初始分词文本,进行词汇合并、词汇拆分等操作。
具体的,以化学领域的查询文本“甲基丙二醇”为例,通用领域的分词模型对上述文本的分词结果为“甲基/丙/二醇”,而在化学领域的业务词典中,“甲基丙二醇”为专有名词,据此,将分词结果“甲基/丙/二醇”进行词汇合并后,获取分词处理文本“甲基丙二醇”;同样的,如果查询文本为“X甲基丙二醇X”,通用领域的分词模型对上述文本的分词结果可能为“X甲基/丙/二醇X”,根据化学领域的业务词典中的专有名词“甲基丙二醇”,将分词结果“X甲基/丙/二醇X”进行词汇拆分及合并后,获取的分词调整后的分词处理文本为“X/甲基丙二醇/X”;相比于仅通过通用领域的分词模型,对特定领域的查询文本进行分词处理,根据特定领域的业务词典进行的分词调整,极大地提高了本领域内词汇的分词准确性,同时,相比于使用特定领域的分词模型,避免了语料信息标注及模型训练的繁琐过程,减少了分词处理的时间成本,节省了计算资源。
S130、根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果。
槽位信息模板包括多个待填充的,用于反应用户意图的槽位信息项;其中,槽位信息项可以包括维度值项、业务指标项、阈值项、聚合指标项、分组指标项、查询指标项、排序数值项和时间项中的一个或多个;根据查询类别的不同,对槽位信息模板中不同的槽位信息项进行填充。特别的,当检测到出现新增查询类别时,可以根据获取到槽位信息项的扩展信息,增加新的槽位信息项,以使槽位信息模板适应查询类别的更新。
以上述技术方案为例,单指标查询对应填充维度值项、业务指标项和时间项;多指标查询对应填充维度值项、业务指标项和时间项;阈值查询对应填充维度值项、业务指标项、阈值项和时间项;最值查询对应填充维度值项、业务指标项和时间项;聚合查询对应维度值项、聚合指标项和时间项;分组查询对应维度值项、分组指标项、查询指标项和时间项;排序查询对应填充维度值项、查询指标项、数值项和时间项。
可选的,在本发明实施例中,在根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充前,还包括:根据所述查询文本的查询类别,确定与所述查询文本匹配的目标槽位信息模板;所述根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,包括:根据所述查询文本的查询类别,以及所述命名实体的实体类别,对所述目标槽位信息模板中的槽位信息项进行填充。还可以为预先构建多个不同的槽位信息模板,每个槽位信息模板中的槽位信息项不完全相同,进而根据查询类别的不同,获取匹配的目标槽位信息模板,目标槽位信息模板中的所有槽位信息项均需要填充,避免出现槽位信息项误匹配的现象。
在根据意图类别,确定待填充的槽位信息项后,根据命名实体的实体类别,将各个命名实体填充进匹配的槽位信息项中;例如,将实体类别为“地点”的命名实体,填充进“维度值项”中,将实体类别为“专有名词”的命名实体,填充进“业务指标项”中;特别的,不同的意图类别下,相同实体类别的命名实体,可能填充进不同的槽位信息项中。
具体的,以上述技术方案为例,单指标查询的文本信息“北京有多少人口”中,“北京”为查询时的维度值,对应维度值项,“人口”为业务指标,对应业务指标项;多指标查询的文本信息“北京人口和GDP分别是多少”中,“北京”对应维度值项,“人口”和“GDP”均对应业务指标项;阈值查询的文本信息“北京人口大于2000万的年份有哪些”中,“北京”对应维度值项,“人口”和“年份”对应业务指标项,“大于2000万”对应阈值项;最值查询的文本信息“北京的GPD最高的月份”中,“北京”对应维度值项,“GDP”和“月份”均对应业务指标项;聚合查询的文本信息“北京各区的GDP总计是多少”中,“北京”和“各区”对应维度值项,“GDP”对应聚合指标项;分组查询的文本信息“北京各区的GDP分别是多少”中,“北京”对应维度值项,“各区”对应分组指标项,“GDP”对应查询指标项;排序查询的文本信息“北京人口总数排名前三的区是哪些”中,“北京”对应维度值项,“人口总数”对应查询指标项,“前三”对应数值项。
S140、根据所述第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
SQL查询模板中包括七个SQL关键词,即“select”、“from”、“where”、“group by”、“having”、“order by”和“limit”,查询语句格式为“select X from X where X group byX having X order by X limit X”;其中,“select”和“from”为必填项,“where”、“groupby”、“having”、“order by”和“limit”均为选填项;“select”用来指定查询哪些数据列,“from”用来指定查询哪个数据表,“where”用来指定过滤条件,“group by”用来对结果集进行分组,“having”用来指定对分组后的数据进行再次过滤的条件,“order by”用来对结果集中的某一数据列进行排序,“limit”用来取出结果集中的某些行。
各个槽位信息项与上述SQL关键词具备关联关系,根据上述关联关系,将不同的槽位信息项中的数据信息填充进不同的关键词中,以上述技术方案为例,维度值项对应填充进“where”中,业务指标项对应填充进“select”中,阈值项对应填充进“where”中,聚合指标项对应填充进“select”中,分组指标项对应填充进“group by”中,查询指标项对应填充进“select”中,排序数值项对应填充进“limit”中,时间项对应填充进“where”中。特别的,在确定了“select”中的信息后,即可根据该数据列所在的数据表,获取数据表名称,也即确定了“from”中的信息内容。
以表1为例,表1为北京各月的GDP汇总表,表名称为“gdp table”;用户发出的查询文本为“2021年北京GDP超过500亿的月份有哪些?”,在确定该查询文本的查询类别为阈值查询后,提取该查询文本中的命名实体“北京”、“GDP”、“大于500亿”和“月份”,根据上述命名实体的实体类别,将“北京”填充进维度值项中,将“GDP”和“月份”填充进业务指标项中,将“大于500亿”填充进阈值项中,进而根据槽位信息项与SQL关键词的关联关系,将槽位信息项中的数据信息填充进SQL关键词中,获取到SQL查询语句“select month from gdp_table where year=2021 and gdp>500 and province=‘北京’”。
表1
年份year | 月份month | 省份province | GDP(亿元)gdp |
2021 | 1 | 北京 | 505 |
2021 | 2 | 北京 | 600 |
2021 | 3 | 北京 | 450 |
2020 | 1 | 北京 | 450 |
2020 | 2 | 北京 | 550 |
本发明实施例提供的技术方案,在获取到自然语言下查询文本的查询类别,以及查询文本中各命名实体的实体类别后,对槽位信息模板中的槽位信息项进行填充,进而将第一填充结果,填充进SQL查询模板中,最终获取SQL查询语句,实现了基于自然语言构建SQL查询语句,提升了用户对SQL数据库的访问便利性,提高了SQL查询语句的转换精度,同时,相比于训练端到端的转换模型,减少了对训练数据集的人工标注,以及模型训练时间,极大地降低了人力成本和时间成本。
实施例二
图2为本发明实施例二提供的基于自然语言的结构化查询语言语句获取方法的流程图,本实施例在上述技术方案的基础上进行具体化,在本实施例中,若第一填充结果中,存在缺失槽位信息的目标槽位信息项,则发出槽位信息缺失提示,该方法具体包括:
S210、获取自然语言下的查询文本,并确定所述查询文本的查询类别;执行S220。
S220、获取所述查询文本中的命名实体,并确定所述命名实体的实体类别;执行S230。
S230、根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果;执行S240。
S240、判断所述第一填充结果中,是否存在缺失槽位信息的目标槽位信息项;若是,执行S250;若否,执行S260。
S250、根据所述目标槽位信息项,发出槽位信息缺失提示,以引导用户填充所述目标槽位信息项,并获取第二填充结果;执行S270。
在槽位信息模板中,每个查询类别均对应多个槽位信息项,上述多个槽位信息项均为待填写项;如果预先构建了每个查询类别分别对应的槽位信息模板,则每个槽位信息模板中的槽位信息项均为待填写项;用户在发出查询指令时,由于用户的文字描述习惯不同,可能会出现少字、口误等现象,计算机系统在确定查询类别后,未能获取到所有待填充的槽位信息项,即存在槽位信息缺失的槽位信息项,也即目标槽位信息项;此时,发出目标槽位信息项缺失槽位信息的相关提示,以引导用户填充上述目标槽位信息项,确保待填充的槽位信息项中数据信息的完整。
S260、根据所述第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
S270、根据所述第一填充结果、所述第二填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
第一填充结果是根据查询文本,对不缺失槽位信息的槽位信息项进行填充后的填充结果,第二填充结果则是通过引导用户,将缺失槽位信息的目标槽位信息项补充后的填充结果,据此,第一填充结果和第二填充结果,已将所有待填充的槽位信息项填充完毕。
本发明实施例提供的技术方案,在确定第一填充结果中,存在缺失槽位信息的目标槽位信息项时,通过引导用户填充目标槽位信息项,以获取第二填充结果,确保了构建SQL查询语句所需的数据信息的完整性,提高了SQL查询语句的获取准确性,实现了对SQL数据库中数据信息的准确查询。
实施例三
图3为本发明实施例三提供的基于自然语言的结构化查询语言语句获取方法的流程图,本实施例在上述技术方案的基础上进行具体化,在本实施例中,如果确定所述目标槽位信息项中,存在预设数据填充项,则通过预设数据,对预设数据填充项进行填充,该方法具体包括:
S301、获取自然语言下的查询文本,并确定所述查询文本的查询类别;执行S302。
S302、获取所述查询文本中的命名实体,并确定所述命名实体的实体类别;执行S303;
S303、根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果;执行S304。
S304、判断所述第一填充结果中,是否存在缺失槽位信息的目标槽位信息项;若是,执行S305;若否,执行S309。
S305、判断所述目标槽位信息项中,是否存在预设数据填充项;若是,执行S306;若否S308。
S306、通过与所述预设数据填充项匹配的预设数据,对所述预设数据填充项进行填充,以获取第三填充结果;执行S307。
在存在缺失槽位信息的目槽位信息项中,可能存在部分槽位信息项可以通过预设数据直接填充,而不需要引导用户发出,以上述技术方案为例,槽位信息项中的时间项表示了用户想要查询的数据的发生时间,但用户在发出查询指令时,由于每个人的描述习惯不同,可能不会包含完整的查询时间,例如,用户想要查询“2021年北京有多少人口”,但实际上用户发出的查询指令往往为“北京有多少人口”,显然,时间项对应的数据信息为空白,此时,可以以当前日期作为预设数据,填充进时间项中,而不需要引导用户填充该项信息;如果数据表中不存在当前日期对应的数据信息,则将数据表中存在的,距离当前日期最近的日期(例如,2020年12月31日)作为预设数据,填充进时间项中。
S307、根据所述目标槽位信息项中,除所述预设数据填充项外的剩余槽位信息项,发出槽位信息缺失提示,以引导用户填充所述剩余槽位信息项,并获取第四填充结果;执行S311。
预设数据填充项已根据预设数据填充完毕,因此,仅需要引导用户填充目标槽位信息项中,除上述预设数据填充项之外的剩余槽位信息项即可。
S308、根据所述目标槽位信息项,发出槽位信息缺失提示,以引导用户填充所述目标槽位信息项,并获取第二填充结果;执行S310。
S309、根据所述第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
S310、根据所述第一填充结果、所述第二填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
S311、根据所述第一填充结果、所述第三填充结果、所述第四填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
第一填充结果是根据查询文本,对不缺失槽位信息的槽位信息项进行填充后的填充结果,第三填充结果则是根据预设数据,对缺失槽位信息的目标槽位信息项中的预设数据填充项补充后的填充结果,第四填充结果则是引导用户将目标槽位信息项中,除预设数据填充项外的剩余槽位信息项补充后的填充结果,据此,第一填充结果、第三填充结果和第四填充结果,已将所有待填充的槽位信息项填充完毕。
本发明实施例提供的技术方案,在确定缺失槽位信息的目标槽位信息项中,存在预设数据填充项时,通过预设数据,对预设数据填充项进行填充,以获取第三填充结果,再引导用户对目标槽位信息项中,除预设数据填充项外的剩余槽位信息项进行填充,以获取第四填充结果,在确保构建SQL查询语句所需数据信息完整的同时,减少了与用户的人机对话次数,提高了SQL查询语句的获取效率。
实施例四
图4为本发明实施例四提供的基于自然语言的结构化查询语言语句获取方法的流程图,本发明实施例在上述技术方案的基础上进行具体化,在本实施例中,根据查询类别的不同,以不同的展示方式展示数据查询结果,该方法具体包括:
S410、获取自然语言下的查询文本,并确定所述查询文本的查询类别。
S420、获取所述查询文本中的命名实体,并确定所述命名实体的实体类别。
S430、根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果。
S440、根据所述第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
S450、根据所述结构化查询语言查询语句,在结构化查询语言数据库中获取数据查询结果。
S460、根据所述查询类别,确定所述数据查询结果的展示方式,并根据所述展示方式,展示所述数据查询结果。
数据查询结果的展示方式包括地图展示、柱状图展示、折线图展示、棒状图展示、双轴数据展示和饼状图展示;由于不同的查询类别下,获取到的数据查询结果具有不同的数据特征,例如,阈值查询获取的数据查询结果,适合以棒状图的形式展示,以直观的体现数据特征,因此,可以为不同的查询类别,预先设定匹配的展示方式,进而将获取到的数据查询结果以该展示方式展示;还可以为每种查询类别,预先设定各个展示方式下的排序结果,并将排序结果发送给用户,以使用户自己选择对应的展示方式,以满足用户个性化的需求。
本发明实施例提供的技术方案,在根据SQL查询语句获取到数据查询结果后,根据查询类别的不同,以不同的展示方式展示数据查询结果,在实现多样化数据展示的同时,也将数据查询结果的数据特征,直观的展示给用户,提高了用户体验。
实施例五
图5是本发明实施例五所提供的基于自然语言的结构化查询语言语句获取装置的结构框图,该装置具体包括:查询类别获取模块510、实体类别获取模块520、第一填充结果获取模块530和查询语句获取模块540;
查询类别获取模块510,用于获取自然语言下的查询文本,并确定所述查询文本的查询类别;
实体类别获取模块520,用于获取所述查询文本中的命名实体,并确定所述命名实体的实体类别;
第一填充结果获取模块530,用于根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果;
查询语句获取模块540,用于根据所述第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
本发明实施例提供的技术方案,在获取到自然语言下查询文本的查询类别,以及查询文本中各命名实体的实体类别后,对槽位信息模板中的槽位信息项进行填充,进而将第一填充结果,填充进SQL查询模板中,最终获取SQL查询语句,实现了基于自然语言构建SQL查询语句,提升了用户对SQL数据库的访问便利性,提高了SQL查询语句的转换精度,同时,相比于训练端到端的转换模型,减少了对训练数据集的人工标注,以及模型训练时间,极大地降低了人力成本和时间成本。
可选的,在上述技术方案的基础上,基于自然语言的结构化查询语言语句获取装置,还包括:
目标模板获取模块,用于根据所述查询文本的查询类别,确定与所述查询文本匹配的目标槽位信息模板。
可选的,在上述技术方案的基础上,第一填充结果获取模块530,具体用于根据所述查询文本的查询类别,以及所述命名实体的实体类别,对所述目标槽位信息模板中的槽位信息项进行填充。
可选的,在上述技术方案的基础上,基于自然语言的结构化查询语言语句获取装置,还包括:
分词处理执行模块,用于对所述查询文本进行分词处理。
可选的,在上述技术方案的基础上,实体类别获取模块520,具体用于获取分词处理后的所述查询文本中的命名实体。
可选的,在上述技术方案的基础上,分词处理执行模块,具体包括:
初始分词文本获取单元,用于通过通用领域的分词模型,对所述查询文本进行初始分词,以获取初始分词文本;
分词调整执行单元,根据特定领域的业务词典,对所述初始分词文本进行分词调整,以获取分词处理后的所述查询文本。
可选的,在上述技术方案的基础上,基于自然语言的结构化查询语言语句获取装置,还包括:
目标槽位信息项判断模块,用于判断所述第一填充结果中,是否存在缺失槽位信息的目标槽位信息项;
第二填充结果获取模块,用于若确定所述第一填充结果中,存在所述目标槽位信息项,则根据所述目标槽位信息项,发出槽位信息缺失提示,以引导用户填充所述目标槽位信息项,并获取第二填充结果;
可选的,在上述技术方案的基础上,查询语句获取模块540,具体用于根据所述第一填充结果、所述第二填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
可选的,在上述技术方案的基础上,基于自然语言的结构化查询语言语句获取装置,还包括:
预设数据填充项获取模块,用于判断所述目标槽位信息项中,是否存在预设数据填充项;
第三填充结果获取模块,用于若确定所述目标槽位信息项中,存在预设数据填充项,则通过与所述预设数据填充项匹配的预设数据,对所述预设数据填充项进行填充,以获取第三填充结果;
可选的,在上述技术方案的基础上,第二填充结果获取模块,具体用于根据所述目标槽位信息项中,除所述预设数据填充项外的剩余槽位信息项,发出槽位信息缺失提示,以引导用户填充所述剩余槽位信息项,并获取第四填充结果。
可选的,在上述技术方案的基础上,查询语句获取模块540,具体用于根据所述第一填充结果、所述第三填充结果、所述第四填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
可选的,在上述技术方案的基础上,基于自然语言的结构化查询语言语句获取装置,还包括:
数据查询结果获取模块,用于根据所述结构化查询语言查询语句,在结构化查询语言数据库中获取数据查询结果;
数据查询结果展示模块,用于根据所述查询类别,确定所述数据查询结果的展示方式,并根据所述展示方式,展示所述数据查询结果。
上述装置可执行本发明任意实施例所提供的基于自然语言的结构化查询语言语句获取方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的方法。
实施例六
图6为本发明实施例六提供的一种电子设备的结构示意图。图6示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图6显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,存储器28,连接不同系统组件(包括存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的基于自然语言的结构化查询语言语句获取方法。也即:获取自然语言下的查询文本,并确定所述查询文本的查询类别;获取所述查询文本中的命名实体,并确定所述命名实体的实体类别;根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果;根据所述第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
实施例七
本发明实施例七还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的基于自然语言的结构化查询语言语句获取方法;该方法包括:
获取自然语言下的查询文本,并确定所述查询文本的查询类别;
获取所述查询文本中的命名实体,并确定所述命名实体的实体类别;
根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果;
根据所述第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种基于自然语言的结构化查询语言语句获取方法,其特征在于,包括:
获取自然语言下的查询文本,并确定所述查询文本的查询类别;
获取所述查询文本中的命名实体,并确定所述命名实体的实体类别;
根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果;
根据所述第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
2.根据权利要求1所述的方法,其特征在于,在根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充前,还包括:
根据所述查询文本的查询类别,确定与所述查询文本匹配的目标槽位信息模板;
所述根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,包括:
根据所述查询文本的查询类别,以及所述命名实体的实体类别,对所述目标槽位信息模板中的槽位信息项进行填充。
3.根据权利要求1所述的方法,其特征在于,在获取所述查询文本中的命名实体前,还包括:
对所述查询文本进行分词处理;
所述获取所述查询文本中的命名实体,包括:
获取分词处理后的所述查询文本中的命名实体。
4.根据权利要求3所述的方法,其特征在于,所述对所述查询文本进行分词处理,包括:
通过通用领域的分词模型,对所述查询文本进行初始分词,以获取初始分词文本;
根据特定领域的业务词典,对所述初始分词文本进行分词调整,以获取分词处理后的所述查询文本。
5.根据权利要求1所述的方法,其特征在于,在获取第一填充结果后,还包括:
判断所述第一填充结果中,是否存在缺失槽位信息的目标槽位信息项;
若确定所述第一填充结果中,存在所述目标槽位信息项,则根据所述目标槽位信息项,发出槽位信息缺失提示,以引导用户填充所述目标槽位信息项,并获取第二填充结果;
所述根据所述第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句,包括:
根据所述第一填充结果、所述第二填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
6.根据权利要求5所述的方法,其特征在于,在确定所述第一填充结果中,存在所述目标槽位信息项后,还包括:
判断所述目标槽位信息项中,是否存在预设数据填充项;
若确定所述目标槽位信息项中,存在预设数据填充项,则通过与所述预设数据填充项匹配的预设数据,对所述预设数据填充项进行填充,以获取第三填充结果;
所述根据所述目标槽位信息项,发出槽位信息缺失提示,以引导用户填充所述目标槽位信息项,并获取第二填充结果,包括:
根据所述目标槽位信息项中,除所述预设数据填充项外的剩余槽位信息项,发出槽位信息缺失提示,以引导用户填充所述剩余槽位信息项,并获取第四填充结果;
所述根据所述第一填充结果、所述第二填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句,包括:
根据所述第一填充结果、所述第三填充结果、所述第四填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
7.根据权利要求1所述的方法,其特征在于,在获取结构化查询语言查询语句后,还包括:
根据所述结构化查询语言查询语句,在结构化查询语言数据库中获取数据查询结果;
根据所述查询类别,确定所述数据查询结果的展示方式,并根据所述展示方式,展示所述数据查询结果。
8.一种基于自然语言的结构化查询语言语句获取装置,其特征在于,包括:
查询类别获取模块,用于获取自然语言下的查询文本,并确定所述查询文本的查询类别;
实体类别获取模块,用于获取所述查询文本中的命名实体,并确定所述命名实体的实体类别;
第一填充结果获取模块,用于根据所述查询文本的查询类别,以及所述命名实体的实体类别,对槽位信息模板中的槽位信息项进行填充,以获取第一填充结果;
查询语句获取模块,用于根据所述第一填充结果,以及结构化查询语言查询模板,获取结构化查询语言查询语句。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个电子设备;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的基于自然语言的结构化查询语言语句获取方法。
10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的基于自然语言的结构化查询语言语句获取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110933193.6A CN113495900B (zh) | 2021-08-12 | 2021-08-12 | 基于自然语言的结构化查询语言语句获取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110933193.6A CN113495900B (zh) | 2021-08-12 | 2021-08-12 | 基于自然语言的结构化查询语言语句获取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113495900A true CN113495900A (zh) | 2021-10-12 |
CN113495900B CN113495900B (zh) | 2024-03-15 |
Family
ID=77996769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110933193.6A Active CN113495900B (zh) | 2021-08-12 | 2021-08-12 | 基于自然语言的结构化查询语言语句获取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113495900B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114048226A (zh) * | 2021-11-12 | 2022-02-15 | 国家电网有限公司大数据中心 | 一种数据查询方法、装置、电子设备和存储介质 |
CN114090624A (zh) * | 2021-11-19 | 2022-02-25 | 中国人民银行清算总中心 | 一种自然语言转化为结构化查询语言的处理方法及装置 |
CN114090619A (zh) * | 2022-01-19 | 2022-02-25 | 支付宝(杭州)信息技术有限公司 | 自然语言的查询处理方法及装置 |
CN114090620A (zh) * | 2022-01-19 | 2022-02-25 | 支付宝(杭州)信息技术有限公司 | 查询请求的处理方法及装置 |
CN114168726A (zh) * | 2022-02-11 | 2022-03-11 | 阿里巴巴达摩院(杭州)科技有限公司 | 语句处理方法、装置、存储介质及系统 |
CN114253990A (zh) * | 2021-11-08 | 2022-03-29 | 广州广电运通信息科技有限公司 | 数据库查询方法、装置、计算机设备和存储介质 |
CN114969242A (zh) * | 2022-01-19 | 2022-08-30 | 支付宝(杭州)信息技术有限公司 | 查询内容自动补全的方法及装置 |
CN116629227A (zh) * | 2023-07-24 | 2023-08-22 | 海信集团控股股份有限公司 | 一种将文本转换为sql语句的方法及设备 |
CN116821103A (zh) * | 2023-08-29 | 2023-09-29 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备及计算机可读存储介质 |
CN116910105A (zh) * | 2023-09-12 | 2023-10-20 | 成都瑞华康源科技有限公司 | 一种基于预训练大模型的医疗信息查询系统及方法 |
CN116991977A (zh) * | 2023-09-25 | 2023-11-03 | 成都不烦智能科技有限责任公司 | 一种基于大语言模型的领域向量知识精准检索方法及装置 |
CN117931858A (zh) * | 2024-03-21 | 2024-04-26 | 金蝶软件(中国)有限公司 | 数据查询方法、装置、计算机设备和存储介质 |
WO2024179581A1 (zh) * | 2023-03-02 | 2024-09-06 | 北京火山引擎科技有限公司 | 数据处理方法、装置、设备及介质 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104657439A (zh) * | 2015-01-30 | 2015-05-27 | 欧阳江 | 用于自然语言精准检索的结构化查询语句生成系统及方法 |
US20170177715A1 (en) * | 2015-12-21 | 2017-06-22 | Adobe Systems Incorporated | Natural Language System Question Classifier, Semantic Representations, and Logical Form Templates |
US20180095962A1 (en) * | 2016-10-05 | 2018-04-05 | International Business Machines Corporation | Translation of natural language questions and requests to a structured query format |
US20180349377A1 (en) * | 2017-06-03 | 2018-12-06 | Apple Inc. | Converting natural language input to structured queries |
CN109299129A (zh) * | 2018-09-05 | 2019-02-01 | 深圳壹账通智能科技有限公司 | 自然语言的数据查询方法、装置、计算机设备及存储介质 |
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
US20190347298A1 (en) * | 2018-05-11 | 2019-11-14 | The Regents Of The University Of California | Speech based structured querying |
CN110688394A (zh) * | 2019-09-29 | 2020-01-14 | 浙江大学 | 面向新型供电城轨列车大数据运维的nl生成sql方法 |
CN110910283A (zh) * | 2019-10-18 | 2020-03-24 | 平安科技(深圳)有限公司 | 生成法律文书的方法、装置、设备和存储介质 |
CN111078844A (zh) * | 2018-10-18 | 2020-04-28 | 上海交通大学 | 软件众包的任务型对话系统及方法 |
CN111159330A (zh) * | 2018-11-06 | 2020-05-15 | 阿里巴巴集团控股有限公司 | 一种数据库查询语句的生成方法及装置 |
CN111177180A (zh) * | 2019-12-11 | 2020-05-19 | 北京百分点信息科技有限公司 | 一种数据查询方法、装置以及电子设备 |
CN111209297A (zh) * | 2019-12-31 | 2020-05-29 | 深圳云天励飞技术有限公司 | 数据查询方法、装置、电子设备及存储介质 |
US20200210525A1 (en) * | 2018-12-28 | 2020-07-02 | Microsoft Technology Licensing, Llc | Predicting query language statements from natural language analytic questions |
CN111553160A (zh) * | 2020-04-24 | 2020-08-18 | 北京北大软件工程股份有限公司 | 一种获取法律领域问句答案的方法和系统 |
CN111708800A (zh) * | 2020-05-27 | 2020-09-25 | 北京百度网讯科技有限公司 | 查询方法、装置及电子设备 |
CN112270182A (zh) * | 2020-11-12 | 2021-01-26 | 佰聆数据股份有限公司 | 一种基于多轮对话问答式的分析思路衍生方法、系统及存储介质 |
CN112632100A (zh) * | 2020-12-18 | 2021-04-09 | 中国平安人寿保险股份有限公司 | 自然语言语句解析方法、装置、电子设备及存储介质 |
-
2021
- 2021-08-12 CN CN202110933193.6A patent/CN113495900B/zh active Active
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104657439A (zh) * | 2015-01-30 | 2015-05-27 | 欧阳江 | 用于自然语言精准检索的结构化查询语句生成系统及方法 |
US20170177715A1 (en) * | 2015-12-21 | 2017-06-22 | Adobe Systems Incorporated | Natural Language System Question Classifier, Semantic Representations, and Logical Form Templates |
US20180095962A1 (en) * | 2016-10-05 | 2018-04-05 | International Business Machines Corporation | Translation of natural language questions and requests to a structured query format |
US20180349377A1 (en) * | 2017-06-03 | 2018-12-06 | Apple Inc. | Converting natural language input to structured queries |
US20190347298A1 (en) * | 2018-05-11 | 2019-11-14 | The Regents Of The University Of California | Speech based structured querying |
CN109299129A (zh) * | 2018-09-05 | 2019-02-01 | 深圳壹账通智能科技有限公司 | 自然语言的数据查询方法、装置、计算机设备及存储介质 |
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
CN111078844A (zh) * | 2018-10-18 | 2020-04-28 | 上海交通大学 | 软件众包的任务型对话系统及方法 |
CN111159330A (zh) * | 2018-11-06 | 2020-05-15 | 阿里巴巴集团控股有限公司 | 一种数据库查询语句的生成方法及装置 |
US20200210525A1 (en) * | 2018-12-28 | 2020-07-02 | Microsoft Technology Licensing, Llc | Predicting query language statements from natural language analytic questions |
CN110688394A (zh) * | 2019-09-29 | 2020-01-14 | 浙江大学 | 面向新型供电城轨列车大数据运维的nl生成sql方法 |
CN110910283A (zh) * | 2019-10-18 | 2020-03-24 | 平安科技(深圳)有限公司 | 生成法律文书的方法、装置、设备和存储介质 |
WO2021073116A1 (zh) * | 2019-10-18 | 2021-04-22 | 平安科技(深圳)有限公司 | 生成法律文书的方法、装置、设备和存储介质 |
CN111177180A (zh) * | 2019-12-11 | 2020-05-19 | 北京百分点信息科技有限公司 | 一种数据查询方法、装置以及电子设备 |
CN111209297A (zh) * | 2019-12-31 | 2020-05-29 | 深圳云天励飞技术有限公司 | 数据查询方法、装置、电子设备及存储介质 |
CN111553160A (zh) * | 2020-04-24 | 2020-08-18 | 北京北大软件工程股份有限公司 | 一种获取法律领域问句答案的方法和系统 |
CN111708800A (zh) * | 2020-05-27 | 2020-09-25 | 北京百度网讯科技有限公司 | 查询方法、装置及电子设备 |
CN112270182A (zh) * | 2020-11-12 | 2021-01-26 | 佰聆数据股份有限公司 | 一种基于多轮对话问答式的分析思路衍生方法、系统及存储介质 |
CN112632100A (zh) * | 2020-12-18 | 2021-04-09 | 中国平安人寿保险股份有限公司 | 自然语言语句解析方法、装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
李子烨: "自然语言到SQL语言翻译任务的研究", 中国优秀硕士学位论文全文数据库信息科技辑, no. 05, 15 May 2021 (2021-05-15), pages 138 - 1639 * |
胡盼盼: "自然语言处理从入门到实践", vol. 2020, 30 April 2020, 中国铁道出版社, pages: 201 - 203 * |
许柏炎: "融合结构化知识的深度语义解析相关技术研究", 中国博士学位论文全文数据库 (信息科技辑), no. 02, 15 February 2021 (2021-02-15), pages 138 - 42 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114253990A (zh) * | 2021-11-08 | 2022-03-29 | 广州广电运通信息科技有限公司 | 数据库查询方法、装置、计算机设备和存储介质 |
CN114048226A (zh) * | 2021-11-12 | 2022-02-15 | 国家电网有限公司大数据中心 | 一种数据查询方法、装置、电子设备和存储介质 |
CN114090624A (zh) * | 2021-11-19 | 2022-02-25 | 中国人民银行清算总中心 | 一种自然语言转化为结构化查询语言的处理方法及装置 |
CN114090620B (zh) * | 2022-01-19 | 2022-09-27 | 支付宝(杭州)信息技术有限公司 | 查询请求的处理方法及装置 |
CN114090619A (zh) * | 2022-01-19 | 2022-02-25 | 支付宝(杭州)信息技术有限公司 | 自然语言的查询处理方法及装置 |
CN114090620A (zh) * | 2022-01-19 | 2022-02-25 | 支付宝(杭州)信息技术有限公司 | 查询请求的处理方法及装置 |
CN114969242A (zh) * | 2022-01-19 | 2022-08-30 | 支付宝(杭州)信息技术有限公司 | 查询内容自动补全的方法及装置 |
CN114090619B (zh) * | 2022-01-19 | 2022-09-20 | 支付宝(杭州)信息技术有限公司 | 自然语言的查询处理方法及装置 |
CN114168726A (zh) * | 2022-02-11 | 2022-03-11 | 阿里巴巴达摩院(杭州)科技有限公司 | 语句处理方法、装置、存储介质及系统 |
WO2024179581A1 (zh) * | 2023-03-02 | 2024-09-06 | 北京火山引擎科技有限公司 | 数据处理方法、装置、设备及介质 |
CN116629227A (zh) * | 2023-07-24 | 2023-08-22 | 海信集团控股股份有限公司 | 一种将文本转换为sql语句的方法及设备 |
CN116629227B (zh) * | 2023-07-24 | 2023-10-24 | 海信集团控股股份有限公司 | 一种将文本转换为sql语句的方法及设备 |
CN116821103A (zh) * | 2023-08-29 | 2023-09-29 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备及计算机可读存储介质 |
CN116821103B (zh) * | 2023-08-29 | 2023-12-19 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备及计算机可读存储介质 |
CN116910105A (zh) * | 2023-09-12 | 2023-10-20 | 成都瑞华康源科技有限公司 | 一种基于预训练大模型的医疗信息查询系统及方法 |
CN116991977A (zh) * | 2023-09-25 | 2023-11-03 | 成都不烦智能科技有限责任公司 | 一种基于大语言模型的领域向量知识精准检索方法及装置 |
CN116991977B (zh) * | 2023-09-25 | 2023-12-05 | 成都不烦智能科技有限责任公司 | 一种基于大语言模型的领域向量知识精准检索方法及装置 |
CN117931858A (zh) * | 2024-03-21 | 2024-04-26 | 金蝶软件(中国)有限公司 | 数据查询方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113495900B (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113495900B (zh) | 基于自然语言的结构化查询语言语句获取方法及装置 | |
CN108717406B (zh) | 文本情绪分析方法、装置及存储介质 | |
US11403680B2 (en) | Method, apparatus for evaluating review, device and storage medium | |
CN112069298B (zh) | 基于语义网和意图识别的人机交互方法、设备及介质 | |
CN110147436B (zh) | 一种基于教育知识图谱与文本的混合自动问答方法 | |
CN112035730B (zh) | 一种语义检索方法、装置及电子设备 | |
CN110334209B (zh) | 文本分类方法、装置、介质及电子设备 | |
US20150227505A1 (en) | Word meaning relationship extraction device | |
US11055327B2 (en) | Unstructured data parsing for structured information | |
CN111324771B (zh) | 视频标签的确定方法、装置、电子设备及存储介质 | |
CN106708929B (zh) | 视频节目的搜索方法和装置 | |
CN109508441B (zh) | 通过自然语言实现数据统计分析的方法、装置及电子设备 | |
CN112613293B (zh) | 摘要生成方法、装置、电子设备及存储介质 | |
CN116244410B (zh) | 一种基于知识图谱和自然语言的指标数据分析方法及系统 | |
CN111143556A (zh) | 软件功能点自动计数方法、装置、介质及电子设备 | |
CN109213998A (zh) | 中文错字检测方法及系统 | |
CN106570196B (zh) | 视频节目的搜索方法和装置 | |
CN117251455A (zh) | 一种基于大模型的智能报表生成方法及其系统 | |
CN117743543A (zh) | 基于大语言模型的语句生成方法、装置及电子设备 | |
CN112380848B (zh) | 文本生成方法、装置、设备及存储介质 | |
CN111708870A (zh) | 基于深度神经网络的问答方法、装置及存储介质 | |
CN112182150A (zh) | 基于多元数据的聚合检索方法、装置、设备及存储介质 | |
CN112559711B (zh) | 一种同义文本提示方法、装置及电子设备 | |
CN112989050A (zh) | 一种表格分类方法、装置、设备及存储介质 | |
CN112632956A (zh) | 文本匹配方法、装置、终端和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |