CN117349515A - 搜索处理方法、电子设备和存储介质 - Google Patents
搜索处理方法、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117349515A CN117349515A CN202311219863.3A CN202311219863A CN117349515A CN 117349515 A CN117349515 A CN 117349515A CN 202311219863 A CN202311219863 A CN 202311219863A CN 117349515 A CN117349515 A CN 117349515A
- Authority
- CN
- China
- Prior art keywords
- search
- search request
- attribute
- auxiliary information
- commerce service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 62
- 238000004458 analytical method Methods 0.000 claims abstract description 41
- 238000012545 processing Methods 0.000 claims abstract description 39
- 238000000605 extraction Methods 0.000 claims description 64
- 238000002372 labelling Methods 0.000 claims description 63
- 238000012549 training Methods 0.000 claims description 39
- 230000004044 response Effects 0.000 claims description 13
- 230000011218 segmentation Effects 0.000 claims description 13
- 238000010801 machine learning Methods 0.000 claims description 5
- 238000000034 method Methods 0.000 abstract description 59
- 230000008569 process Effects 0.000 abstract description 38
- 238000005516 engineering process Methods 0.000 abstract description 17
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000005065 mining Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种搜索处理方法、电子设备和存储介质,涉及大模型技术、计算机技术领域。其中,该方法包括:获取搜索请求;对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征;基于搜索请求与辅助信息,获取搜索请求对应的搜索结果。本申请解决了相关技术中难以将行业知识注入搜索处理过程导致搜索精确性较低的技术问题。
Description
技术领域
本申请涉及大模型技术、计算机技术领域,具体而言,涉及一种搜索处理方法、电子设备和存储介质。
背景技术
近年来,基于人工智能模型的搜索引擎技术被越来越多的应用至各行各业。然而,传统的搜索引擎通常基于小模型和简单的统计算法来实现,难以适用于复杂场景。当前虽然也存在一些基于大模型的搜索引擎(如差分搜索索引,Differential Search Index,DSI),但是现有的基于大模型的搜索引擎往往完全依赖大模型的性能,难以将大模型与传统搜索引擎的行业定制和人工干预的特点相结合,这限制了现有的基于大模型的搜索引擎的搜索精确性。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种搜索处理方法、电子设备和存储介质,以至少解决相关技术中难以将行业知识注入搜索处理过程导致搜索精确性较低的技术问题。
根据本申请实施例的一个方面,提供了一种搜索处理方法,包括:获取搜索请求;对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征;基于搜索请求与辅助信息,获取搜索请求对应的搜索结果。
根据本申请实施例的另一方面,还提供了另一种搜索处理方法,包括:获取搜索请求;采用差分搜索索引模型对搜索请求进行属性特征分析以生成搜索请求关联的辅助信息,以及对搜索请求与辅助信息进行行业知识推理以输出目标文档标识,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征;基于目标文档标识获取搜索请求对应的搜索结果。
根据本申请实施例的另一方面,还提供了又一种搜索处理方法,包括:获取电商服务搜索请求;对电商服务搜索请求进行电商属性特征分析,生成电商服务搜索请求关联的电商服务辅助信息,其中,电商服务辅助信息为电商服务搜索请求对应的电商服务行业知识的目标电商属性特征组合;基于电商服务搜索请求与电商服务辅助信息,获取电商服务搜索请求对应的电商服务搜索结果。
根据本申请实施例的另一方面,还提供了一种电子设备,包括:存储器,存储有可执行程序;处理器,用于运行程序,其中,程序运行时执行任意一项上述的搜索处理方法。
根据本申请实施例的另一方面,还提供了一种计算机可读存储介质,上述计算机可读存储介质包括存储的程序,其中,在上述程序运行时控制上述计算机可读存储介质所在设备执行任意一项上述的搜索处理方法。
在本申请实施例中,首先获取搜索请求,通过对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,进一步基于搜索请求与辅助信息,获取搜索请求对应的搜索结果。上述过程中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征,由此,本申请提供的搜索处理方法通过挖掘搜索请求的属性特征,将与预设行业知识相对应的属性特征引入搜索处理中,达到了针对预设行业知识进行搜索处理的目的,从而实现了提升针对特定行业知识进行搜索的精确性的技术效果,进而解决了相关技术中难以将行业知识注入搜索处理过程导致搜索精确性较低的技术问题。
容易注意到的是,上面的通用描述和后面的详细描述仅仅是为了对本申请进行举例和解释,并不构成对本申请的限定。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请中搜索处理方法的应用场景的示意图;
图2是根据本申请实施例1的一种搜索处理方法的流程图;
图3是根据本申请实施例的一种可选的搜索处理过程的示意图;
图4是根据本申请实施例2的另一种搜索处理方法的流程图;
图5是根据本申请实施例3的另一种搜索处理方法的流程图;
图6是根据本申请实施例4的一种搜索处理装置的结构示意图;
图7是根据本申请实施例4的一种可选的搜索处理装置的结构示意图;
图8是根据本申请实施例4的另一种搜索处理装置的结构示意图;
图9是根据本申请实施例4的又一种搜索处理装置的结构示意图;
图10是根据本申请实施例5的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请提供的技术方案主要采用大模型技术实现,此处的大模型是指具有大规模模型参数的深度学习模型,通常可以包含上亿、上百亿、上千亿、上万亿甚至十万亿以上的模型参数。大模型又可以称为基石模型/基础模型(Foundation Model),通过大规模无标注的语料进行大模型的预训练,产出亿级以上参数的预训练模型,这种模型能适应广泛的下游任务,模型具有较好的泛化能力,例如大规模语言模型(Large Language Model,LLM)、多模态预训练模型(multi-modal pre-training model)等。
需要说明的是,大模型在实际应用时,可以通过少量样本对预训练模型进行微调,使得大模型可以应用于不同的任务中。例如,大模型可以广泛应用于自然语言处理(Natural Language Processing,NLP)、计算机视觉等领域,具体可以应用于如视觉问答(Visual Question Answering,VQA)、图像描述(Image Caption,IC)、图像生成等计算机视觉领域任务,也可以广泛应用于基于文本的情感分类、文本摘要生成、机器翻译等自然语言处理领域任务。因此,大模型主要的应用场景包括但不限于数字助理、智能机器人、搜索、在线教育、办公软件、电子商务、智能设计等。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释。
推理过程:模型在实际场景中经过数据输入产出对应输出的过程。
大语言模型(LLM):是指具备一定程度的通用能力的人工智能模型。
差分搜索索引(Differential Search Index,DSI):是指使用大模型替代传统搜索引擎的一种搜索系统。
命名实体识别(Named Entity Recognition,NER):是指一种用于从文本中提取命名实体的技术。
文本片段(prompt):作为大模型的输入初始文本,用于引导大模型生成特定内容。
特征(feature):是指对查询(query)进行属性打标后得到的属性信息。
实施例1
根据本申请实施例,提供了一种搜索处理方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
考虑到大模型的模型参数量庞大,且移动终端的运算资源有限,本申请实施例提供的上述搜索处理方法可以应用于如图1所示的应用场景,但不仅限于此。在如图1所示的应用场景中,大模型部署在服务器10中,服务器10可以通过局域网连接、广域网连接、因特网连接,或者其他类型的数据网络,连接一个或多个客户端设备20,此处的客户端设备20可以包括但不限于:智能手机、平板电脑、笔记本电脑、掌上电脑、个人计算机、智能家居设备、车载设备等。客户端设备20可以通过图形用户界面与用户进行交互,实现对大模型的调用,进而实现本申请实施例所提供的方法。
在上述运行环境下,本申请提供了如图2所示的搜索处理方法。图2是根据本申请实施例1的一种搜索处理方法的流程图,如图2所示,该搜索处理方法包括:
步骤S21,获取搜索请求;
步骤S22,对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征;
步骤S23,基于搜索请求与辅助信息,获取搜索请求对应的搜索结果。
上述搜索请求可以是目标应用场景中的查询(query)请求。上述目标应用场景可以但不限于是:电商、教育、医疗、会议、社交网络、金融产品、物流和导航等领域中涉及基于LLM进行搜索的场景。相对应地,预设行业知识为上述目标应用场景对应的行业知识。
上述辅助信息由预设行业知识和至少一个目标属性特征得到,至少一个目标属性特征包括对搜索请求进行属性特征挖掘得到的多个维度上的属性特征。上述搜索请求和辅助信息的结合作为搜索模型(可以是LLM)的输入,由搜索模型的输出获取上述搜索结果。可见,上述针对搜索请求的搜索处理过程中考虑到的预设行业知识和搜索请求对应的多种属性特征,因此,上述搜索处理过程能够在预设行业的应用场景内具备良好的智能搜索性能,也即,能够得到精确的搜索结果,满足特定行业的个性化搜索需求。
在本申请实施例中,首先获取搜索请求,通过对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,进一步基于搜索请求与辅助信息,获取搜索请求对应的搜索结果。上述过程中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征,由此,本申请提供的搜索处理方法通过挖掘搜索请求的属性特征,将与预设行业知识相对应的属性特征引入搜索处理中,达到了针对预设行业知识进行搜索处理的目的,从而实现了提升针对特定行业知识进行搜索的精确性的技术效果,进而解决了相关技术中难以将行业知识注入搜索处理过程导致搜索精确性较低的技术问题。
在本申请实施例中,客户端设备和服务器构成的系统可以执行如下步骤:客户端设备执行向服务器发送搜索请求,服务器执行搜索处理方法对应的步骤,对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征,基于搜索请求与辅助信息,获取搜索请求对应的搜索结果,并将搜索结果返回至客户端(或者为客户端提供搜索处理功能的使用接口)。
需要说明的是,在客户端设备的运行资源能够满足大模型的部署和运行条件的情况下,本申请实施例可以在客户端设备中进行。
在上述目标应用场景的一种具体实现方式中,根据本申请实施例提供的搜索处理方法,将目标应用场景对应的行业知识注入DSI的中间推理过程,以提升搜索结果的准确性以及提升搜索结果与对应行业的相关性。在上述具体实现方式中,搜索处理过程可以如图3所示,包括五个阶段:行业知识属性提取阶段、训练小模型阶段、特征选择阶段、思维链训练阶段和在线推理阶段。以下以该具体实现方式为例对本申请实施例提供的搜索处理方法进行进一步说明。
在一种可选的实施例中,在步骤S22中,对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,包括如下方法步骤:
步骤S221,对搜索请求进行行业知识属性提取,得到属性提取结果;
步骤S222,对属性提取结果进行属性标注,得到属性标注结果,其中,属性标注结果用于指示预设行业知识在多个维度上的知识属性;
步骤S223,对属性标注结果进行特征选择,得到辅助信息。
上述属性标注结果对应的知识属性至少包括:预设行业知识的地理属性、品牌属性、产品属性等。在上述可选的实施例中,在搜索处理中的行业知识属性提取阶段,对搜索请求进行行业知识属性提取,上述行业知识属性对应的多个维度由场景需求确定。在训练小模型阶段,对所提取的多个维度行业知识属性进行属性标注,得到属性标注结果,属性标注结果中可以包含多组标注数据,每组标注数据包括行业知识属性及其对应的标签。在特征选择阶段,对属性标注结果进行特征选择,所得到的辅助信息为多组标注数据中与搜索请求匹配的目标标注数据,在搜索处理过程中认为该目标标注数据为适合帮助得到搜索结果的行业知识。
在一种可选的实施例中,在步骤S221中,对搜索请求进行行业知识属性提取,得到属性提取结果包括以下步骤中的至少之一:
步骤S2211,基于预设行业知识,对搜索请求进行分词处理,得到第一属性提取结果;
步骤S2212,基于预设行业知识,对搜索请求进行命名实体识别,得到第二属性提取结果;
步骤S2213,基于预设行业知识,对第一属性提取结果进行同义词扩展,得到第三属性提取结果;
步骤S2214,基于预设行业知识,对搜索请求进行关键词提取,得到第四属性提取结果;
步骤S2215,基于预设行业知识,对搜索请求进行表述形式改写,得到第五属性提取结果。
作为一种示例性的实施例,从预设行业知识(如电商知识、计算机技术知识等)中提取有助于实现搜索请求(如多个query)与目标答案文本之间链接的如下多种属性。
第一种,分词信息。将搜索请求按照语义划分为多个词语,得到分词信息。例如,针对查询语句中包含的“在南京市长江大桥上”,进行语义划分后得到的分词信息为:["在","南京","市","长江大桥","上"]。
第二种,命名实体识别(NER)信息。对搜索请求中包含的行业知识实体进行识别,得到NER信息。例如,针对查询语句中包含的“苹果手机壳”,进行行业知识实体识别得到的NER信息包括:["苹果":"品牌","手机壳":"产品"]。
第三种,同义词信息。对分词信息进行同义词扩展处理,得到搜索请求对应的同义词信息,以增加搜索的覆盖范围和准确性。
第四种,关键词(keyword)信息。对搜索请求(如查询语句)中的关键词进行标识,以便于后续使用关键词。
第五种,改写信息。对搜索请求进行表述形式改写,得到改写信息,该改写信息包括同一个搜索请求对应的多种表述语句。
通过上述步骤S221、步骤S2211至步骤S2215,本申请实施例实现了在多个维度上对搜索请求的行业知识属性提取,提升了搜索处理过程中对搜索请求的机器理解,进而有助于提高搜索结果的准确性和相关性。
在一种可选的实施例中,在步骤S222中,对属性提取结果进行属性标注,得到属性标注结果,包括如下方法步骤:
步骤S2221,采用预设行业知识对应的标注模型,对属性提取结果进行属性标注,得到属性标注结果,其中,属性标注结果包括:多个属性特征组合。
作为一种示例性的实施例,上述预设行业知识对应的标注模型可以是行业定制的预训练小模型,例如,指定行业的分词模型、NER模型等。在搜索处理中的训练小模型阶段,采用上述预训练小模型对属性提取结果进行属性打标,得到多个属性特征组合。例如,采用指定行业的分词模型对该指定行业对应的搜索请求的分词结果进行属性打标,得到分词结果中n个词语对应的n组特征{f1,f2,...,fn},其中,每组特征可以包含至少一个特征,例如第i个词语对应的一组fi中包含多个特征。
在一种可选的实施例中,在步骤S223中,对属性标注结果进行特征选择,得到辅助信息,包括如下方法步骤:
步骤S2231,从属性标注结果中选取多个候选特征组合;
步骤S2232,计算多个候选特征组合对于预设结果的信息增益;
步骤S2233,基于信息增益,从多个候选特征组合中选择至少一个目标属性特征,得到辅助信息。
作为一种示例性的实施例,在搜索处理中的特征选择阶段,针对搜索请求(如多个query),从对应的属性标注结果中选取多个候选特征组合,例如,随机抽样得到m个特征组合。基于m个特征组合计算得到每个特征组合对预设结果的信息增益,其中,预设结果为搜索请求对应的预期答案。当搜索请求中包含多个query时,上述辅助信息包括每个query对应的至少一个目标属性特征F。
在一种可选的实施例中,在步骤S2232中,计算多个候选特征组合对于预设结果的信息增益,包括如下方法步骤:
步骤S321,获取基于搜索请求与辅助信息预测得到预设结果的第一概率,以及获取基于搜索请求预测得到预设结果的第二概率;
步骤S322,利用第一概率与第二概率计算得到信息增益。
作为一种示例性的实施例,计算m个特征组合对预设结果的信息增益时,将m个特征组合记为F1至Fm,对于其中任一个特征组合Fi,计算第一概率P(doc|query,Fi)和第二概率P(doc|query),该第一概率为在有辅助信息的情况下响应搜索请求得到预设结果的概率,该第二概率为没有辅助信息的情况下响应搜索请求得到预设结果的概率。对任一个特征组合Fi,计算第一概率和第二概率的差值作为对应的信息增益Hi,也即,Hi=P(doc|query,Fi)-P(doc|query)。
在一种可选的实施例中,在步骤S2233中,基于信息增益,从多个候选特征组合中选择至少一个目标属性特征,包括如下方法步骤:
步骤S331,从多个候选特征组合中选择信息增益最大的候选特征组合,得到至少一个目标属性特征。
作为一种示例性的实施例,基于m个特征组合对应的信息增益H1至Hm,从中选取信息增益最大值对应的特征组合作为至少一个目标属性特征F。例如,采用maxarg()函数,将maxarg(Hi)对应的特征组合选作F。
在一种可选的实施例中,在步骤S23中,基于搜索请求与辅助信息,获取搜索请求对应的搜索结果,包括如下方法步骤:
步骤S231,采用差分搜索索引模型对搜索请求与辅助信息进行行业知识推理,得到目标文档标识,其中,差分搜索索引模型利用多组数据通过机器学习训练得到,多组数据为第一训练数据与第二训练数据的混合数据,第一训练数据包括:样本提示、样本文档标识,第二训练数据包括:样本提示、样本提示对应的至少一个目标属性特征和样本文档标识;
步骤S232,基于目标文档标识获取搜索请求对应的搜索结果。
作为一种示例性的实施例,用于训练差分搜索索引(DSI)模型的训练集包括第一训练数据(prompt,target)和第二训练数据(query,F_target),其中,F_target由query对应的至少一个目标属性特征F与样本文档标识target拼接得到。
在搜索处理中的思维链训练阶段,将至少一个目标属性特征F作为思维链来训练DSI模型,这样DSI模型将会学习到行业知识的中间推理过程,使得搜索结果更具行业相关性。
在搜索处理中的在线推理阶段,当用户通过训练完成的DSI模型进行搜索时,首先,将用户输入的搜索请求(query_user)作为样本提示prompt,采用DSI模型利用行业知识特征组合对query_user进行分析,得到该query_user对应的至少一个目标属性特征F_user;然后,再将query_user与至少一个目标属性特征F_user的拼接结果作为样本提示prompt,通过DSI模型得到该query_user对应的文档编号,该文档编号对应的文档内容作为query_user对应的搜索结果。至此完成了一次针对query_user的搜索查询过程。
容易注意到的是,通过本申请实施例提供的上述搜索处理方式,将预设行业知识注入DSI模型的中间推理过程,提升了DSI模型搜索结果的准确性和与指定行业的相关性。
在一种可选的实施例中,通过终端设备提供一图形用户界面,图形用户界面所显示的内容至少部分地包含一电商服务搜索对话框,搜索处理方法还包括如下方法步骤:
步骤S241,响应对电商服务搜索对话框执行的输入操作,确定电商服务搜索请求;
步骤S242,响应对电商服务搜索对话框执行的发送操作,对电商服务搜索请求进行电商服务属性特征分析以生成电商服务辅助信息,以及基于电商服务搜索请求与电商服务辅助信息获取电商服务搜索结果;
步骤S243,在电商服务搜索对话框内显示电商服务搜索结果。
在上述可选的实施例中,上述电商服务搜索对话框可以用于实现预设行业对应的专属电商服务搜索功能,例如预设行业的应用场景下设置的智能问答功能,该智能问答功能不限于文本问答,还可以将上述实施例与语音转文本、文本转语音、视频转文本、文本转视频等技术结合实现语音问答功能、视频问答功能或虚拟现实/增强现实问答功能。
当检测到作用于电商服务搜索对话框的输入操作,根据该电商服务搜索对话框内的输入内容确定电商服务搜索请求,该电商服务搜索请求可以包括至少一个查询(query)语句。
当检测到作用于电商服务搜索对话框的发送操作,触发搜索事件,对电商服务搜索请求进行电商服务属性特征分析以生成电商服务辅助信息,以及基于电商服务搜索请求与电商服务辅助信息获取电商服务搜索结果,并自动触发在电商服务搜索对话框内显示电商服务搜索结果的事件。将电商服务搜索结果展示给用户的形式可以是:以文本形式或图片形式显示在图形用户界面内,转化成音频通过音频输出设备输出,转化成视频显示在图形用户界面内。
需要说明的是,上述输入操作和上述发送操作均可以是用户用手指接触上述终端设备的显示屏并触控该终端设备的操作。该触控操作可以包括单点触控、多点触控,其中,每个触控点的触控操作可以包括点击、长按、重按、划动等。上述输入操作和上述发送操作还可以是通过鼠标、键盘等输入设备实现的触控操作。
通过上述步骤S241至步骤S243,本申请实施例提供的搜索处理方法可以运行于客户端,体现一种可视化的交互方式以实现搜索处理功能,这种可视化的交互方式能够更加直观地将预设行业的问答场景通过客户端提供给用户,以便用户更加便捷地提出电商服务搜索请求并触发电商服务搜索结果的查询,这种方式对用户来说操作友好、便捷,用户体验好。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read-OnlyMemory,ROM)、随机存取器(Random Access Memory,RAM)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例2
在如实施例1中的运行环境下,本申请提供了如图4所示的另一种搜索处理方法。图4是根据本申请实施例2的另一种搜索处理方法的流程图,如图4所示,该搜索处理方法包括:
步骤S41,获取搜索请求;
步骤S42,采用差分搜索索引模型对搜索请求进行属性特征分析以生成搜索请求关联的辅助信息,以及对搜索请求与辅助信息进行行业知识推理以输出目标文档标识,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征;
步骤S43,基于目标文档标识获取搜索请求对应的搜索结果。
上述搜索请求可以是目标应用场景中的查询(query)请求。上述目标应用场景可以但不限于是:电商、教育、医疗、会议、社交网络、金融产品、物流和导航等领域中涉及基于LLM进行搜索的场景。相对应地,预设行业知识为上述目标应用场景对应的行业知识。
上述辅助信息由预设行业知识和至少一个目标属性特征得到,目标属性特征包括对搜索请求进行属性特征挖掘得到的多个属性特征。上述搜索请求和辅助信息的结合作为差分搜索索引(DSI)模型的输入,由DSI模型对搜索请求与辅助信息进行行业知识推理以输出目标文档标识,并将该目标文档标识以及对应的文档内容作为上述搜索请求对应的搜索结果。
可见,上述针对搜索请求的搜索处理过程中考虑到的预设行业知识和搜索请求对应的多种属性特征,因此,上述搜索处理过程能够在预设行业的应用场景内具备良好的智能搜索性能,也即,能够得到精确的搜索结果,满足特定行业的个性化搜索需求。
在本申请实施例中,首先获取搜索请求,通过采用差分搜索索引模型对搜索请求进行属性特征分析以生成搜索请求关联的辅助信息,以及对搜索请求与辅助信息进行行业知识推理以输出目标文档标识,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征,进一步基于目标文档标识获取搜索请求对应的搜索结果。上述过程中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征,由此,本申请提供的搜索处理方法通过挖掘搜索请求的属性特征,将与预设行业知识相对应的属性特征引入搜索处理中,达到了针对预设行业知识进行搜索处理的目的,从而实现了提升针对特定行业知识进行搜索的精确性的技术效果,进而解决了相关技术中难以将行业知识注入搜索处理过程导致搜索精确性较低的技术问题。
在本申请实施例中,客户端设备和服务器构成的系统可以执行如下步骤:客户端设备执行向服务器发送搜索请求,服务器执行搜索处理方法对应的步骤,采用差分搜索索引模型对搜索请求进行属性特征分析以生成搜索请求关联的辅助信息,以及对搜索请求与辅助信息进行行业知识推理以输出目标文档标识,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征,基于目标文档标识获取搜索请求对应的搜索结果,并将搜索结果返回至客户端(或者为客户端提供搜索处理功能的使用接口)。
需要说明的是,在客户端设备的运行资源能够满足大模型的部署和运行条件的情况下,本申请实施例可以在客户端设备中进行。
在一种可选的实施例中,在步骤S42中,采用差分搜索索引模型对搜索请求与辅助信息进行行业知识推理以输出目标文档标识,包括如下方法步骤:
步骤S421,通过搜索请求确定初始提示内容,其中,初始提示内容基于预设提示模板进行配置;
步骤S422,对初始提示内容与辅助信息进行拼接,得到目标提示内容;
步骤S423,采用差分搜索索引模型对目标提示模板进行行业知识推理,得到目标文档标识。
在应用场景中,通过所获取的搜索请求,确定该搜索请求(query)对应的初始提示内容,(该初始提示内容可以是文本片段prompt),将该初始提示内容与上述辅助信息进行拼接,得到目标提示内容,辅助信息由搜索请求对应的预设行业知识的至少一个目标属性特征(记为F)得到,由此,目标提示内容可以表示为query_F,采用训练完成的DSI模型,基于预设行业知识对该目标提示内容query_F进行行业知识推理,得到目标文档标识,进而得到搜索请求(query)对应的搜索结果。
容易注意到的是,通过本申请实施例提供的上述搜索处理方式,将预设行业知识注入DSI模型的中间推理过程,提升了DSI模型搜索结果的准确性和与指定行业的相关性。
需要说明的是,本实施例的优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
实施例3
在如实施例1中的运行环境下,本申请提供了如图5所示的另一种搜索处理方法。图5是根据本申请实施例3的另一种搜索处理方法的流程图,如图5所示,该搜索处理方法包括:
步骤S51,获取电商服务搜索请求;
步骤S52,对电商服务搜索请求进行电商属性特征分析,生成电商服务搜索请求关联的电商服务辅助信息,其中,电商服务辅助信息为电商服务搜索请求对应的电商服务行业知识的至少一个目标电商属性特征;
步骤S53,基于电商服务搜索请求与电商服务辅助信息,获取电商服务搜索请求对应的电商服务搜索结果。
上述电商服务搜索请求可以是电商服务应用场景中的查询(query)请求。相对应地,电商服务行业知识为上述电商服务应用场景对应的行业知识,例如,对话问答知识、用户评论知识等。
上述电商服务辅助信息由电商服务行业知识和至少一个目标电商属性特征得到,目标属性特征包括对电商服务搜索请求进行属性特征挖掘得到的多个属性特征。上述电商服务搜索请求和电商服务辅助信息的结合作为搜索模型(可以是LLM)的输入,由搜索模型的输出获取上述电商服务搜索结果。可见,上述针对电商服务搜索请求的搜索处理过程中考虑到的电商服务行业知识和电商服务搜索请求对应的多种属性特征,因此,上述搜索处理过程能够在预设行业的应用场景内具备良好的智能搜索性能,也即,能够得到精确的电商服务搜索结果,满足电商服务行业的个性化搜索需求。
在本申请实施例中,首先获取电商服务搜索请求,通过对电商服务搜索请求进行电商属性特征分析,生成电商服务搜索请求关联的电商服务辅助信息,进一步基于电商服务搜索请求与电商服务辅助信息,获取电商服务搜索请求对应的电商服务搜索结果。上述过程中,电商服务辅助信息为电商服务搜索请求对应的电商服务行业知识的至少一个目标电商属性特征,由此,本申请提供的搜索处理方法通过挖掘电商服务搜索请求的属性特征,将与电商服务行业知识相对应的属性特征引入搜索处理中,达到了针对电商服务行业知识进行搜索处理的目的,从而实现了提升针对电商服务行业知识进行搜索的精确性的技术效果,进而解决了相关技术中难以将行业知识注入搜索处理过程导致搜索精确性较低的技术问题。
在本申请实施例中,客户端设备和服务器构成的系统可以执行如下步骤:客户端设备执行向服务器发送电商服务搜索请求,服务器执行搜索处理方法对应的步骤,对电商服务搜索请求进行电商属性特征分析,生成电商服务搜索请求关联的电商服务辅助信息,其中,电商服务辅助信息为电商服务搜索请求对应的电商服务行业知识的至少一个目标电商属性特征,基于电商服务搜索请求与电商服务辅助信息,获取电商服务搜索请求对应的电商服务搜索结果,并将电商服务搜索结果返回至客户端(或者为客户端提供搜索处理功能的使用接口)。
需要说明的是,在客户端设备的运行资源能够满足大模型的部署和运行条件的情况下,本申请实施例可以在客户端设备中进行。
此外,除了电商服务场景外,实施例1提供的搜索处理方法还可以扩展至法律问答场景、医疗服务场景、教育问答场景等。
在法律问答场景中,搜索处理方法包括:获取法律问答搜索请求;对法律问答搜索请求进行电商属性特征分析,生成法律问答搜索请求关联的法律问答辅助信息,其中,法律问答辅助信息为法律问答搜索请求对应的法律问答行业知识的至少一个目标电商属性特征;基于法律问答搜索请求与法律问答辅助信息,获取法律问答搜索请求对应的法律问答搜索结果。
在医疗服务场景中,搜索处理方法包括:获取医疗服务搜索请求;对医疗服务搜索请求进行电商属性特征分析,生成医疗服务搜索请求关联的医疗服务辅助信息,其中,医疗服务辅助信息为医疗服务搜索请求对应的医疗服务行业知识的至少一个目标电商属性特征;基于医疗服务搜索请求与医疗服务辅助信息,获取医疗服务搜索请求对应的医疗服务搜索结果。
在教育问答场景中,搜索处理方法包括:获取教育问答搜索请求;对教育问答搜索请求进行电商属性特征分析,生成教育问答搜索请求关联的教育问答辅助信息,其中,教育问答辅助信息为教育问答搜索请求对应的教育问答行业知识的至少一个目标电商属性特征;基于教育问答搜索请求与教育问答辅助信息,获取教育问答搜索请求对应的教育问答搜索结果。
需要说明的是,本实施例的优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
实施例4
根据本申请实施例,还提供了一种用于实施上述搜索处理方法的装置实施例。图6是根据本申请实施例4的一种搜索处理装置的结构示意图,如图6所示,该装置包括:
获取模块601,用于获取搜索请求;
生成模块602,用于对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征;
处理模块603,用于基于搜索请求与辅助信息,获取搜索请求对应的搜索结果。
可选地,上述生成模块602还用于:对搜索请求进行行业知识属性提取,得到属性提取结果;对属性提取结果进行属性标注,得到属性标注结果,其中,属性标注结果用于指示预设行业知识在多个维度上的知识属性;对属性标注结果进行特征选择,得到辅助信息。
可选地,上述生成模块602还用于:基于预设行业知识,对搜索请求进行分词处理,得到第一属性提取结果;基于预设行业知识,对搜索请求进行命名实体识别,得到第二属性提取结果;基于预设行业知识,对第一属性提取结果进行同义词扩展,得到第三属性提取结果;基于预设行业知识,对搜索请求进行关键词提取,得到第四属性提取结果;基于预设行业知识,对搜索请求进行表述形式改写,得到第五属性提取结果。
可选地,上述生成模块602还用于:采用预设行业知识对应的标注模型,对属性提取结果进行属性标注,得到属性标注结果,其中,属性标注结果包括:多个属性特征组合。
可选地,上述生成模块602还用于:从属性标注结果中选取多个候选特征组合;计算多个候选特征组合对于预设结果的信息增益;基于信息增益,从多个候选特征组合中选择至少一个目标属性特征,得到辅助信息。
可选地,上述生成模块602还用于:获取基于搜索请求与辅助信息预测得到预设结果的第一概率,以及获取基于搜索请求预测得到预设结果的第二概率;利用第一概率与第二概率计算得到信息增益。
可选地,上述生成模块602还用于:从多个候选特征组合中选择信息增益最大的候选特征组合,得到至少一个目标属性特征。
可选地,上述处理模块603还用于:采用差分搜索索引模型对搜索请求与辅助信息进行行业知识推理,得到目标文档标识,其中,差分搜索索引模型利用多组数据通过机器学习训练得到,多组数据为第一训练数据与第二训练数据的混合数据,第一训练数据包括:样本提示、样本文档标识,第二训练数据包括:样本提示、样本提示对应的至少一个目标属性特征和样本文档标识;基于目标文档标识获取搜索请求对应的搜索结果。
可选地,图7是根据本申请实施例4的一种可选的搜索处理装置的结构示意图,如图7所示,该装置除包括图6所示的所有模块外,还包括:可视化模块604。通过终端设备提供一图形用户界面,图形用户界面所显示的内容至少部分地包含一电商服务搜索对话框,上述可视化模块604用于:响应对电商服务搜索对话框执行的输入操作,确定搜索请求;响应对电商服务搜索对话框执行的发送操作,对搜索请求进行属性特征分析以生成辅助信息,以及基于搜索请求与辅助信息获取搜索结果;在电商服务搜索对话框内显示搜索结果。
在本申请实施例中,首先通过获取模块,获取搜索请求,通过生成模块,对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,进一步采用处理模块,基于搜索请求与辅助信息,获取搜索请求对应的搜索结果。上述过程中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征,由此,本申请提供的搜索处理方法通过挖掘搜索请求的属性特征,将与预设行业知识相对应的属性特征引入搜索处理中,达到了针对预设行业知识进行搜索处理的目的,从而实现了提升针对特定行业知识进行搜索的精确性的技术效果,进而解决了相关技术中难以将行业知识注入搜索处理过程导致搜索精确性较低的技术问题。
此处需要说明的是,上述获取模块601、生成模块602和处理模块603对应于实施例1中的步骤S21至步骤S23,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块或单元可以是存储在存储器(例如,存储器104)中并由一个或多个处理器(例如,处理器102a,102b,……,102n)处理的硬件组件或软件组件,上述模块也可以作为装置的一部分可以运行在实施例1提供的计算机终端10中。
根据本申请实施例,还提供了另一种用于实施上述实施例2中的搜索处理方法的装置实施例。图8是根据本申请实施例4的另一种搜索处理装置的结构示意图,如图8所示,该装置包括:
获取模块801,用于获取搜索请求;
生成模块802,用于采用差分搜索索引模型对搜索请求进行属性特征分析以生成搜索请求关联的辅助信息,以及对搜索请求与辅助信息进行行业知识推理以输出目标文档标识,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征;
处理模块803,用于基于目标文档标识获取搜索请求对应的搜索结果。
可选地,上述生成模块802还用于:通过搜索请求确定初始提示内容,其中,初始提示内容基于预设提示模板进行配置;对初始提示内容与辅助信息进行拼接,得到目标提示模板;采用差分搜索索引模型对目标提示模板进行行业知识推理,得到目标文档标识。
此处需要说明的是,上述获取模块801、生成模块802和处理模块803对应于实施例2中的步骤S41至步骤S43,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块或单元可以是存储在存储器(例如,存储器104)中并由一个或多个处理器(例如,处理器102a,102b,……,102n)处理的硬件组件或软件组件,上述模块也可以作为装置的一部分可以运行在实施例1提供的计算机终端10中。
根据本申请实施例,还提供了另一种用于实施上述实施例3中的搜索处理方法的装置实施例。图9是根据本申请实施例4的又一种搜索处理装置的结构示意图,如图9所示,该装置包括:
获取模块901,用于获取电商服务搜索请求;
生成模块902,用于对电商服务搜索请求进行电商属性特征分析,生成电商服务搜索请求关联的电商服务辅助信息,其中,电商服务辅助信息为电商服务搜索请求对应的电商服务行业知识的至少一个目标电商属性特征;
获取模块903,用于基于电商服务搜索请求与电商服务辅助信息,获取电商服务搜索请求对应的电商服务搜索结果。
此处需要说明的是,上述获取模块901、生成模块902和处理模块903对应于实施例3中的步骤S51至步骤S53,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例3所公开的内容。需要说明的是,上述模块或单元可以是存储在存储器(例如,存储器104)中并由一个或多个处理器(例如,处理器102a,102b,……,102n)处理的硬件组件或软件组件,上述模块也可以作为装置的一部分可以运行在实施例1提供的计算机终端10中。
需要说明的是,本实施例的优选实施方式可以参见实施例1、实施例2或实施例3中的相关描述,此处不再赘述。
实施例5
根据本申请实施例,还提供了一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行搜索处理方法中以下步骤的程序代码:获取搜索请求;对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征;基于搜索请求与辅助信息,获取搜索请求对应的搜索结果。
可选地,图10是根据本申请实施例5的一种计算机终端的结构框图,如图10所示,该计算机终端100可以包括:一个或多个(图中仅示出一个)处理器1002、存储器1004、存储控制器1006、以及外设接口1008,其中,外设接口1008与射频模块、音频模块和显示器连接。
其中,存储器1004可用于存储软件程序以及模块,如本申请实施例中的搜索处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的搜索处理方法。存储器1004可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1004可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端100。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器1002可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取搜索请求;对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征;基于搜索请求与辅助信息,获取搜索请求对应的搜索结果。
可选地,上述处理器1002还可以执行如下步骤的程序代码:对搜索请求进行行业知识属性提取,得到属性提取结果;对属性提取结果进行属性标注,得到属性标注结果,其中,属性标注结果用于指示预设行业知识在多个维度上的知识属性;对属性标注结果进行特征选择,得到辅助信息。
可选地,上述处理器1002还可以执行如下步骤的程序代码:基于预设行业知识,对搜索请求进行分词处理,得到第一属性提取结果;基于预设行业知识,对搜索请求进行命名实体识别,得到第二属性提取结果;基于预设行业知识,对第一属性提取结果进行同义词扩展,得到第三属性提取结果;基于预设行业知识,对搜索请求进行关键词提取,得到第四属性提取结果;基于预设行业知识,对搜索请求进行表述形式改写,得到第五属性提取结果。
可选地,上述处理器1002还可以执行如下步骤的程序代码:采用预设行业知识对应的标注模型,对属性提取结果进行属性标注,得到属性标注结果,其中,属性标注结果包括:多个属性特征组合。
可选地,上述处理器1002还可以执行如下步骤的程序代码:从属性标注结果中选取多个候选特征组合;计算多个候选特征组合对于预设结果的信息增益;基于信息增益,从多个候选特征组合中选择至少一个目标属性特征,得到辅助信息。
可选地,上述处理器1002还可以执行如下步骤的程序代码:获取基于搜索请求与辅助信息预测得到预设结果的第一概率,以及获取基于搜索请求预测得到预设结果的第二概率;利用第一概率与第二概率计算得到信息增益。
可选地,上述处理器1002还可以执行如下步骤的程序代码:从多个候选特征组合中选择信息增益最大的候选特征组合,得到至少一个目标属性特征。
可选地,上述处理器1002还可以执行如下步骤的程序代码:采用差分搜索索引模型对搜索请求与辅助信息进行行业知识推理,得到目标文档标识,其中,差分搜索索引模型利用多组数据通过机器学习训练得到,多组数据为第一训练数据与第二训练数据的混合数据,第一训练数据包括:样本提示、样本文档标识,第二训练数据包括:样本提示、样本提示对应的至少一个目标属性特征和样本文档标识;基于目标文档标识获取搜索请求对应的搜索结果。
可选地,上述处理器1002还可以执行如下步骤的程序代码:响应对电商服务搜索对话框执行的输入操作,确定搜索请求;响应对电商服务搜索对话框执行的发送操作,对搜索请求进行属性特征分析以生成辅助信息,以及基于搜索请求与辅助信息获取搜索结果;在电商服务搜索对话框内显示搜索结果。
处理器1002可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取搜索请求;采用差分搜索索引模型对搜索请求进行属性特征分析以生成搜索请求关联的辅助信息,以及对搜索请求与辅助信息进行行业知识推理以输出目标文档标识,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征;基于目标文档标识获取搜索请求对应的搜索结果。
可选地,上述处理器1002还可以执行如下步骤的程序代码:通过搜索请求确定初始提示内容,其中,初始提示内容基于预设提示模板进行配置;对初始提示内容与辅助信息进行拼接,得到目标提示模板;采用差分搜索索引模型对目标提示模板进行行业知识推理,得到目标文档标识。
处理器1002可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取电商服务搜索请求;对电商服务搜索请求进行电商属性特征分析,生成电商服务搜索请求关联的电商服务辅助信息,其中,电商服务辅助信息为电商服务搜索请求对应的电商服务行业知识的至少一个目标电商属性特征;基于电商服务搜索请求与电商服务辅助信息,获取电商服务搜索请求对应的电商服务搜索结果。
采用本申请实施例,提供了一种用于实现搜索处理方法的计算机终端的方案。首先获取搜索请求,通过对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,进一步基于搜索请求与辅助信息,获取搜索请求对应的搜索结果。上述过程中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征,由此,本申请提供的搜索处理方法通过挖掘搜索请求的属性特征,将与预设行业知识相对应的属性特征引入搜索处理中,达到了针对预设行业知识进行搜索处理的目的,从而实现了提升针对特定行业知识进行搜索的精确性的技术效果,进而解决了相关技术中难以将行业知识注入搜索处理过程导致搜索精确性较低的技术问题。
本领域普通技术人员可以理解,图10所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(MobileInternet Devices,MID)等终端设备。图10其并不对上述计算机终端的结构造成限定。例如,计算机终端100还可包括比图10中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图10所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、ROM、RAM、磁盘或光盘等。
实施例6
根据本申请实施例,还提供了一种计算机可读存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例1、实施例2或实施例3所提供的搜索处理方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取搜索请求;对搜索请求进行属性特征分析,生成搜索请求关联的辅助信息,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征;基于搜索请求与辅助信息,获取搜索请求对应的搜索结果。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:对搜索请求进行行业知识属性提取,得到属性提取结果;对属性提取结果进行属性标注,得到属性标注结果,其中,属性标注结果用于指示预设行业知识在多个维度上的知识属性;对属性标注结果进行特征选择,得到辅助信息。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:基于预设行业知识,对搜索请求进行分词处理,得到第一属性提取结果;基于预设行业知识,对搜索请求进行命名实体识别,得到第二属性提取结果;基于预设行业知识,对第一属性提取结果进行同义词扩展,得到第三属性提取结果;基于预设行业知识,对搜索请求进行关键词提取,得到第四属性提取结果;基于预设行业知识,对搜索请求进行表述形式改写,得到第五属性提取结果。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:采用预设行业知识对应的标注模型,对属性提取结果进行属性标注,得到属性标注结果,其中,属性标注结果包括:多个属性特征组合。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:从属性标注结果中选取多个候选特征组合;计算多个候选特征组合对于预设结果的信息增益;基于信息增益,从多个候选特征组合中选择至少一个目标属性特征,得到辅助信息。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取基于搜索请求与辅助信息预测得到预设结果的第一概率,以及获取基于搜索请求预测得到预设结果的第二概率;利用第一概率与第二概率计算得到信息增益。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:从多个候选特征组合中选择信息增益最大的候选特征组合,得到至少一个目标属性特征。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:采用差分搜索索引模型对搜索请求与辅助信息进行行业知识推理,得到目标文档标识,其中,差分搜索索引模型利用多组数据通过机器学习训练得到,多组数据为第一训练数据与第二训练数据的混合数据,第一训练数据包括:样本提示、样本文档标识,第二训练数据包括:样本提示、样本提示对应的至少一个目标属性特征和样本文档标识;基于目标文档标识获取搜索请求对应的搜索结果。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:响应对电商服务搜索对话框执行的输入操作,确定搜索请求;响应对电商服务搜索对话框执行的发送操作,对搜索请求进行属性特征分析以生成辅助信息,以及基于搜索请求与辅助信息获取搜索结果;在电商服务搜索对话框内显示搜索结果。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取搜索请求;采用差分搜索索引模型对搜索请求进行属性特征分析以生成搜索请求关联的辅助信息,以及对搜索请求与辅助信息进行行业知识推理以输出目标文档标识,其中,辅助信息为搜索请求对应的预设行业知识的至少一个目标属性特征;基于目标文档标识获取搜索请求对应的搜索结果。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:通过搜索请求确定初始提示内容,其中,初始提示内容基于预设提示模板进行配置;对初始提示内容与辅助信息进行拼接,得到目标提示模板;采用差分搜索索引模型对目标提示模板进行行业知识推理,得到目标文档标识。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取电商服务搜索请求;对电商服务搜索请求进行电商属性特征分析,生成电商服务搜索请求关联的电商服务辅助信息,其中,电商服务辅助信息为电商服务搜索请求对应的电商服务行业知识的至少一个目标电商属性特征;基于电商服务搜索请求与电商服务辅助信息,获取电商服务搜索请求对应的电商服务搜索结果。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、ROM、RAM、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (14)
1.一种搜索处理方法,其特征在于,包括:
获取搜索请求;
对所述搜索请求进行属性特征分析,生成所述搜索请求关联的辅助信息,其中,所述辅助信息为所述搜索请求对应的预设行业知识的至少一个目标属性特征;
基于所述搜索请求与所述辅助信息,获取所述搜索请求对应的搜索结果。
2.根据权利要求1所述的搜索处理方法,其特征在于,对所述搜索请求进行属性特征分析,生成所述搜索请求关联的所述辅助信息包括:
对所述搜索请求进行行业知识属性提取,得到属性提取结果;
对所述属性提取结果进行属性标注,得到属性标注结果,其中,所述属性标注结果用于指示所述预设行业知识在多个维度上的知识属性;
对所述属性标注结果进行特征选择,得到所述辅助信息。
3.根据权利要求2所述的搜索处理方法,其特征在于,对所述搜索请求进行行业知识属性提取,得到所述属性提取结果包括以下一项或多项:
基于所述预设行业知识,对所述搜索请求进行分词处理,得到第一属性提取结果;
基于所述预设行业知识,对所述搜索请求进行命名实体识别,得到第二属性提取结果;
基于所述预设行业知识,对所述第一属性提取结果进行同义词扩展,得到第三属性提取结果;
基于所述预设行业知识,对所述搜索请求进行关键词提取,得到第四属性提取结果;
基于所述预设行业知识,对所述搜索请求进行表述形式改写,得到第五属性提取结果。
4.根据权利要求2所述的搜索处理方法,其特征在于,对所述属性提取结果进行属性标注,得到所述属性标注结果包括:
采用所述预设行业知识对应的标注模型,对所述属性提取结果进行属性标注,得到所述属性标注结果,其中,所述属性标注结果包括:多个属性特征组合。
5.根据权利要求2所述的搜索处理方法,其特征在于,对所述属性标注结果进行特征选择,得到所述辅助信息包括:
从所述属性标注结果中选取多个候选特征组合;
计算所述多个候选特征组合对于预设结果的信息增益;
基于所述信息增益,从所述多个候选特征组合中选择所述至少一个目标属性特征,得到所述辅助信息。
6.根据权利要求5所述的搜索处理方法,其特征在于,计算所述多个候选特征组合对于所述预设结果的所述信息增益包括:
获取基于所述搜索请求与所述辅助信息预测得到所述预设结果的第一概率,以及获取基于所述搜索请求预测得到所述预设结果的第二概率;
利用所述第一概率与所述第二概率计算得到所述信息增益。
7.根据权利要求5所述的搜索处理方法,其特征在于,基于所述信息增益,从所述多个候选特征组合中选择所述至少一个目标属性特征包括:
从所述多个候选特征组合中选择所述信息增益最大的候选特征组合,得到所述至少一个目标属性特征。
8.根据权利要求1所述的搜索处理方法,其特征在于,基于所述搜索请求与所述辅助信息,获取所述搜索请求对应的搜索结果包括:
采用差分搜索索引模型对所述搜索请求与所述辅助信息进行行业知识推理,得到目标文档标识,其中,所述差分搜索索引模型利用多组数据通过机器学习训练得到,所述多组数据为第一训练数据与第二训练数据的混合数据,所述第一训练数据包括:样本提示、样本文档标识,所述第二训练数据包括:所述样本提示、所述样本提示对应的至少一个目标属性特征和所述样本文档标识;
基于所述目标文档标识获取所述搜索请求对应的所述搜索结果。
9.根据权利要求1所述的搜索处理方法,其特征在于,通过终端设备提供一图形用户界面,所述图形用户界面所显示的内容至少部分地包含一电商服务搜索对话框,所述搜索处理方法还包括:
响应对所述电商服务搜索对话框执行的输入操作,确定电商服务搜索请求;
响应对所述电商服务搜索对话框执行的发送操作,对所述电商服务搜索请求进行电商服务属性特征分析以生成所述电商服务辅助信息,以及基于所述电商服务搜索请求与所述电商服务辅助信息获取所述电商服务搜索结果;
在所述电商服务搜索对话框内显示所述电商服务搜索结果。
10.一种搜索处理方法,其特征在于,包括:
获取搜索请求;
采用差分搜索索引模型对所述搜索请求进行属性特征分析以生成所述搜索请求关联的辅助信息,以及对所述搜索请求与所述辅助信息进行行业知识推理以输出目标文档标识,其中,所述辅助信息为所述搜索请求对应的预设行业知识的至少一个目标属性特征;
基于所述目标文档标识获取所述搜索请求对应的搜索结果。
11.根据权利要求10所述的搜索处理方法,其特征在于,采用所述差分搜索索引模型对所述搜索请求与所述辅助信息进行行业知识推理以输出所述目标文档标识包括:
通过所述搜索请求确定初始提示内容,其中,所述初始提示内容基于预设提示模板进行配置;
对所述初始提示内容与所述辅助信息进行拼接,得到目标提示内容;
采用所述差分搜索索引模型对所述目标提示模板进行行业知识推理,得到所述目标文档标识。
12.一种搜索处理方法,其特征在于,包括:
获取电商服务搜索请求;
对所述电商服务搜索请求进行电商属性特征分析,生成所述电商服务搜索请求关联的电商服务辅助信息,其中,所述电商服务辅助信息为所述电商服务搜索请求对应的电商服务行业知识的至少一个目标电商属性特征;
基于所述电商服务搜索请求与所述电商服务辅助信息,获取所述电商服务搜索请求对应的电商服务搜索结果。
13.一种电子设备,其特征在于,包括:
存储器,存储有可执行程序;
处理器,用于运行所述程序,其中,所述程序运行时执行权利要求1至12中任意一项所述的搜索处理方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的可执行程序,其中,在所述可执行程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至12中任意一项所述的搜索处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311219863.3A CN117349515A (zh) | 2023-09-20 | 2023-09-20 | 搜索处理方法、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311219863.3A CN117349515A (zh) | 2023-09-20 | 2023-09-20 | 搜索处理方法、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117349515A true CN117349515A (zh) | 2024-01-05 |
Family
ID=89367451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311219863.3A Pending CN117349515A (zh) | 2023-09-20 | 2023-09-20 | 搜索处理方法、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117349515A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118095448A (zh) * | 2024-04-26 | 2024-05-28 | 支付宝(杭州)信息技术有限公司 | 一种针对llm模型的医疗辅助信息提取方法及相关设备 |
-
2023
- 2023-09-20 CN CN202311219863.3A patent/CN117349515A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118095448A (zh) * | 2024-04-26 | 2024-05-28 | 支付宝(杭州)信息技术有限公司 | 一种针对llm模型的医疗辅助信息提取方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10255546B2 (en) | Question-answering system | |
CN117521675A (zh) | 基于大语言模型的信息处理方法、装置、设备及存储介质 | |
Biondi et al. | A deep learning semantic approach to emotion recognition using the IBM watson bluemix alchemy language | |
CN113392265A (zh) | 多媒体处理方法、装置及设备 | |
CN116662522B (zh) | 问题答案推荐方法、存储介质和电子设备 | |
CN116541493A (zh) | 基于意图识别的交互应答方法、装置、设备、存储介质 | |
Hassani et al. | LVTIA: A new method for keyphrase extraction from scientific video lectures | |
WO2022018676A1 (en) | Natural language enrichment using action explanations | |
CN116662495A (zh) | 问答处理方法、训练问答处理模型的方法及装置 | |
CN117349515A (zh) | 搜索处理方法、电子设备和存储介质 | |
CN115270746A (zh) | 问题样本生成方法和装置、电子设备及存储介质 | |
CN118035945B (zh) | 一种标签识别模型的处理方法和相关装置 | |
CN117932022A (zh) | 一种智能问答方法、装置、电子设备及存储介质 | |
CN113542797A (zh) | 视频播放中的互动方法、装置及计算机可读存储介质 | |
CN117332035A (zh) | 索引生成方法、电子设备和存储介质 | |
CN117421413A (zh) | 一种问答对生成方法、装置及电子设备 | |
CN117351952A (zh) | 语音指令交互方法、装置、电子设备及存储介质 | |
CN117473057A (zh) | 问答处理方法、系统、设备和存储介质 | |
CN116701604A (zh) | 问答语料库的构建方法和装置、问答方法、设备及介质 | |
CN116186220A (zh) | 信息检索方法、问答处理方法、信息检索装置及系统 | |
CN113807920A (zh) | 基于人工智能的产品推荐方法、装置、设备及存储介质 | |
CN118227910B (zh) | 一种媒体资源聚合方法、装置、设备及存储介质 | |
CN118132729B (zh) | 基于医疗知识图谱的答案生成方法及装置 | |
Xue et al. | An ontology-supported inquiry learning technique | |
Das et al. | Leveraging facial expressions as emotional context in image captioning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |