CN117610539A

CN117610539A - 意图执行方法、装置、电子设备及存储介质

Info

Publication number: CN117610539A
Application number: CN202311643403.3A
Authority: CN
Inventors: 常欣宇
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2023-12-01
Filing date: 2023-12-01
Publication date: 2024-02-27

Abstract

本申请公开了一种意图执行方法、装置、电子设备及存储介质，该意图执行方法应用于电子设备，该意图执行方法包括：获取输入的待处理信息；通过大语言模型，生成所述待处理信息对应的执行流程信息，所述执行流程信息用于实现所述待处理信息对应的用户意图；通过所述大语言模型，并根据知识数据库以及操作数据库，确定所述执行流程信息对应的目标操作，以及执行所述目标操作，所述知识数据库是根据所述电子设备的设备信息构建的，所述操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。本方法可以实现根据用户输入的信息，识别并实现复杂的用户意图。

Description

意图执行方法、装置、电子设备及存储介质

技术领域

本申请涉及电子设备技术领域，更具体地，涉及一种意图执行方法、装置、电子设备及存储介质。

背景技术

随着科技水平和生活水平的快速进步，电子设备(例如智能手机、平板电脑等)已经成为人们生活中常用的电子产品之一。目前的很多电子设备能够通过识别用户的意图，来提供相应的服务来实现用户的意图。然而，相关技术中通常只能对简单的用户意图进行识别和执行，在用户意图较为复杂时，电子设备无法较好地执行用户的意图。

发明内容

本申请提出了一种意图执行方法、装置、电子设备及存储介质，可以识别并实现复杂的用户意图。

第一方面，本申请实施例提供了一种意图执行方法，应用于电子设备，所述方法包括：获取输入的待处理信息；通过大语言模型，生成所述待处理信息对应的执行流程信息，所述执行流程信息用于实现所述待处理信息对应的用户意图；通过所述大语言模型，并根据知识数据库以及操作数据库，确定所述执行流程信息对应的目标操作，以及执行所述目标操作，所述知识数据库是根据所述电子设备的设备信息构建的，所述操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。

第二方面，本申请实施例提供了一种意图执行装置，应用于电子设备，所述装置包括：信息获取模块、意图识别模块以及操作执行模块，其中，所述信息获取模块用于获取输入的待处理信息；所述意图识别模块用于通过大语言模型，生成所述待处理信息对应的执行流程信息，所述执行流程信息用于实现所述待处理信息对应的用户意图；所述操作执行模块用于通过所述大语言模型，并根据知识数据库以及操作数据库，确定所述执行流程信息对应的目标操作，以及执行所述目标操作，所述知识数据库是根据所述电子设备的设备信息构建的，所述操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。

第三方面，本申请实施例提供了一种电子设备，包括：一个或多个处理器；存储器；一个或多个应用程序，其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个应用程序配置用于执行上述第一方面提供的意图执行方法。

第四方面，本申请实施例提供了一种计算机可读取存储介质，所述计算机可读取存储介质中存储有程序代码，所述程序代码可被处理器调用执行上述第一方面提供的意图执行方法。

本申请提供的方案，通过获取输入的待处理信息，通过大语言模型，生成待处理信息对应的执行流程信息，执行流程信息用于实现待处理信息对应的用户意图，再通过大语言模型，并根据知识数据库以及操作数据库，确定执行流程信息对应的目标操作，并执行目标操作，该知识数据库是根据电子设备的设备信息构建的，操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。由此可以实现针对具有复杂的用户意图的输入信息，将其识别为执行流程信息后，再利用大语言模型、知识数据库以及操作数据库，来确定和执行该执行流程信息对应的目标操作，从而实现能够理解和实现复杂的用户意图。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了根据本申请一个实施例的意图执行方法的流程示意图。

图2示出了根据本申请另一个实施例的意图执行方法的流程示意图。

图3示出了根据本申请又一个实施例的意图执行方法的流程示意图。

图4示出了根据本申请再一个实施例的意图执行方法的流程示意图。

图5示出了根据本申请一个实施例的意图执行装置的一种框图。

图6是本申请实施例的用于执行根据本申请实施例的意图执行方法的电子设备的框图。

图7是本申请实施例的用于保存或者携带实现根据本申请实施例的意图执行方法的程序代码的存储单元。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

意图识别是自然语言处理中的一项重要任务。目前，大多数电子设备能够识别用户的意图，然后根据识别的意图执行相应的操作，来实现用户的意图。例如，电子设备中可以设置有语音助手，以辅助用户控制终端执行一些任务，例如播放音乐、打开通话记录等，在使用语音助手控制终端的过程中，用户输入语音信号，终端需要识别该语音信号的意图信息，然后基于该意图信息，执行对应的任务。

相关技术中，电子设备在理解用户意图时，主要依赖预设的关键字，并依赖指令模板执行动作，因此在用户的意图较为复杂的情况下，电子设备无法充分地理解用户的意图，更无法自动的执行用户的复杂意图，进而会影响用户使用电子设备时的使用体验。例如，相关技术中，在用户输入了“打开APP1搜索冰激凌A”的情况下，电子设备可以识别到APP目标关键字为“APP1”，操作动作关键字为“搜索”，搜索目标关键字为“冰激凌A”，然后根据以上关键字并配合指令模板，可以执行以上用户意图；但是在搜索到冰激凌的结果后，若用户在输入意图较为复杂的输入信息“帮我找到性价比最高的一款并下单到我的公司”，由于输入信息中并不存在预设关键词，或者指令模板无法实现该意图，则电子设备通常无法理解用户的意图，或理解用户的意图后无法自动的执行用户的意图。

针对上述问题，发明人提出了本申请实施例提供的意图执行方法、装置、电子设备以及存储介质，可以实现针对具有复杂的用户意图的输入信息，将其识别为执行流程信息后，再利用大语言模型、知识数据库以及操作数据库，来确定和执行该执行流程信息对应的目标操作，从而实现能够理解和实现复杂的用户意图。其中，具体的意图执行方法在后续的实施例中进行详细的说明。

下面再结合附图对本申请实施例提供的意图执行方法进行详细介绍。

请参阅图1，图1示出了本申请一个实施例提供的意图执行方法的流程示意图。在具体的实施例中，所述意图执行方法应用于如图5所示的意图执行装置400以及配置有所述意图执行装置400的电子设备100(图6)。下面将以电子设备为例，说明本实施例的具体流程，当然，可以理解的，本实施例所应用的电子设备可以为智能手机、平板电脑、智能手表、电子书等，在此不做限定。下面将针对图1所示的流程进行详细的阐述，所述意图执行方法具体可以包括以下步骤：

步骤S110：获取输入的待处理信息。

在本申请实施例中，电子设备可以获取输入的待处理信息，以便根据输入的待处理信息，识别和执行用户的意图。

在一些实施方式中，可以获取通过文字输入的方式输入的待处理信息，也可以获取通过语音输入的方式输入的待处理信息，在此不做限定。作为一种可实施的方式，若待处理信息是通过文字的方式输入的，则可以将该输入的文字确定为待处理信息。作为又一种可实施的方式，若待处理信息是通过语音的方式输入的，则可以将该输入的语音进行转文本操作，并将转文本后获得的文字确定为待处理信息，其中，可以通过自动语音识别技术(automatic speech recognition，ASR)对输入的语音进行转文本操作。

在一些实施方式中，电子设备可以响应于用户输入的操作，显示待处理信息的输入界面，以便用户于输入界面中输入待处理信息。可选地，如电子设备可以显示语音助手对应的信息输入界面，电子设备可以在显示该信息输入界面的情况下，检测用户输入的信息，以得到待处理信息。可选地，电子设备可以显示语音助手对应的应用界面，在应用界面中检测到用于触发与该虚拟会话对象的聊天的操作时，显示与该虚拟会话对象的聊天界面，通过检测该聊天界面中用户输入的聊天信息，以得到待处理信息。其中，电子设备可以根据用户输入的用于唤醒该语音助手的语音信息，显示语音助手对应的应用界面；也可以响应于针对语音助手的应用图标的触发操作，显示语音助手对应的应用界面，具体触发语音助手的应用界面的触发方式可以不做限定。

当然，电子设备获取待处理信息的具体方式可以不做限定，例如，电子设备可以获取输入的图像，然后针对图像进行内容识别，并根据识别到的内容，确定以上待处理信息；又例如，电子设备可以获取输入的视频，然后针对视频图像进行内容识别，以及根据视频中的音频进行语音转文本处理，然后根据视频图像中识别到的内容以及语音转文本得到的内容，确定出以上待处理信息。

步骤S120：通过大语言模型，生成所述待处理信息对应的执行流程信息，所述执行流程信息用于实现所述待处理信息对应的用户意图。

在本申请实施例中，电子设备在获取到以上待处理信息后，则可以对待处理信息进行意图识别，以便根据识别到的用户意图，执行相应的操作，从而实现用户的意图，完成用户所需执行的任务。电子设备对待处理信息进行意图识别时，可以通过大语言模型，生成待处理信息对应的执行流程信息，该执行流程信息用于实现待处理信息对应的用户意图。执行流程信息可以包括实现用户意图的步骤对应的步骤信息，也就是说，在识别待处理信息对应的用户意图时，是对识别的用户意图拆解为步骤，并形成执行流程信息。其中，大语言模型(Large Language Model，LLM)是指基于大量数据和计算资源训练出的复杂的人工神经网络，能够学习到丰富的语言模式和知识，从而对自然语言输入产生准确的响应，大语言模型的主要目的是让机器能够更好地理解和生成人类的自然语言文本，如文章、对话、搜索等。

可以理解地，由于大语言模型需要的训练数据的数据量非常大，用于训练大语言模型的数据量甚至超过十亿个单词，因此大语言模型能较为准确地理解用户的意图，且能够理解复杂的用户意图，故可以通过大语言模型对执行流程信息进行意图理解，并生成其对应的执行流程信息。

在一些实施方式中，可以根据待处理信息，生成用于输入大语言模型的输入信息，然后将该输入信息输入至大语言模型中，以便大语言模型根据输入信息，输出该待处理信息对应的执行流程信息。其中，输入信息中包括提示信息，该提示信息可以是用于提示大语言模型针对待处理信息进行意图理解，并生成达成(或者实现)理解的用户意图的执行流程信息，该提示信息可以理解为prompt(提示词)。

示例性地，以上待处理信息为“帮我找到性价比最高的一款冰激凌并下单到我的公司”，那么以上prompt可以是“请分析用户表达的意图，并且给出用于达成用户意图的一个可行的执行流程信息”，在将待处理信息与prompt进行拼接后，则可以得到以上输入信息。大语言模型根据输入的该输入信息，可以输出执行流程信息：如果要“帮我找到性价比最高的一款冰激凌并下单到我的公司”，需要的执行流程信息为“1.查询购物软件中冰激凌商品的信息；2.获取公司的地址；3.选择其中优惠力度较大，评分较高，单位价格较低的一款；4.将选择的商品下单”。

在一种可能的实施方式中，可以预先创建有第一提示词模板，该第一提示词模板用于与待处理信息拼接后，得到用于输入大语言模型的输入信息，以便大语言模型能够根据输入信息输出待处理信息对应的执行流程信息。

在一种可能的实施方式中，以上大语言模型可以是部署于服务器中，在需要通过大语言模型生成待处理信息对应的执行流程信息时，电子设备可以根据待处理信息，生成以上输入信息后，将输入信息发送至服务器；对应地，服务器可以接收到该输入信息，并将输入信息输入至大语言模型中，从而得到大语言模型输出的以上待处理信息对应的执行流程信息，并将执行流程信息返回至电子设备；对应地，电子设备可以接收到服务器返回的该执行流程信息。

在一种可能的实施方式中，在电子设备的硬件配置水平比较高的情况下，以上大语言模型也可以部署于电子设备中，在需要通过大语言模型生成待处理信息对应的执行流程信息时，电子设备可以直接调用本地的大语言模型，并根据待处理信息，生成以上输入信息后，将输入信息输入至大语言模型，从而得到大语言模型输出的以上待处理信息对应的执行流程信息。

在一些实施方式中，由于本申请实施例中的大语言模型要实现针对待处理信息，对其进行用户意图理解后，并生成待处理信息对应的执行流程信息，因此可能会与大语言模型日常处理的任务存在差异，故本申请实施例中的大语言模型可以是根据以上生成执行流程信息的任务进行定制的模型，也就是说，以上大语言模型是根据训练数据，在以上生成执行流程信息的任务上进行调整和优化得到的。如此，可以保证大语言模型在生成待处理信息对应的执行流程信息时的准确性。

步骤S130：通过所述大语言模型，并根据知识数据库以及操作数据库，确定所述执行流程信息对应的目标操作，以及执行所述目标操作，所述知识数据库是根据所述电子设备的设备信息构建的，所述操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。

其中，以上执行流程信息中可以包括实现用户意图的步骤对应的步骤信息，因此要实现用户的意图，就要完成以上执行流程信息中的各个步骤信息对应的步骤，从而才能达成用户的意图。故在获取到以上执行流程信息之后，可以通过大语言模型，并根据知识数据库以及操作数据库，确定执行流程信息对应的目标操作，并执行目标操作，从而完成以上执行流程信息中的各个步骤，实现用户的意图。

在本申请实施例中，知识数据库是根据所述电子设备的设备信息构建的，操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。其中，设备信息可以指电子设备的基本信息，设备信息可以包括电子设备中安装的应用程序的应用信息、电子设备的偏好设置、电子设备对应的用户的个人信息、电子设备的配置信息等，应用信息可以包括安装的应用程序的名称、应用程序的类型等，电子设备的偏好设置可以包括设置的声音输出音量、使用的网络、屏幕的亮度、自动锁屏的时长等，电子设备对应的用户的个人信息可以包括地区、年龄、收入、家庭地址、公司地址等，电子设备的配置信息可以包括电子设备的处理器的参数、电子设备的存储器的参数、电子设备的屏幕尺寸、电子设备的最大电池电量，当然，具体的设备信息可以不做限定；不同的应用界面可以至少包括电子设备中安装的不同应用程序中的各个应用界面，应用界面中的输入操作所实现的功能可以理解为应用界面中可以实现的功能。可以理解地，由于操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的，因此操作数据库可以为大语言模型提供用于确定以上执行流程信息对应的目标操作的先验知识；而以上知识数据库是根据所述电子设备的设备信息构建的，因此知识数据库可以提供用于执行该执行流程信息对应的目标操作时的信息，故可以通过大语言模型，并根据知识数据库以及操作数据库，确定用于实现执行流程信息的所有操作(作为执行流程信息对应的目标操作)，并且能够自动的执行确定出的目标操作，进而达成用户的意图。

在一些实施方式中，电子设备可以根据以上执行流程信息，以及操作数据库中的信息，生成用于输入大语言模型的输入信息，然后将输入信息输入至大语言模型中，以便大语言模型根据输入信息，输出该执行流程信息对应的目标操作的操作信息。其中，输入信息中也可以包括有提示信息，提示信息可以用于提示大语言模型根据执行流程信息，以及以上操作数据库中的信息，确定出实现该执行流程信息所需的操作信息。示例性地，提示信息可以为“针对执行流程信息A，给出实现该执行流程信息A的具体操作；实现该执行流程信息A需要实现的操作可以参考以下信息：{abc}”，该提示信息中，abc指的是以上操作数据库中的信息，即需要将实际的操作数据库中的信息替换该abc。

可以理解地，在大语言模型中，ReAct是指一种在一次交互中循环使用推理和行动两个操作解决复杂问题的技术。具体来说，ReAct利用大语言模型自身的语义理解能力(即推理)来对输入文本进行解析和理解，从而得到对输入文本的深入认识和信息；然后利用模型以外的其他能力(即行动)去执行相应的操作，例如计算、搜索最新消息、用户自定义的行动等，来对解析后的信息进行进一步的处理和运用。通过这种方式，ReAct能够高效地实现各种复杂的交互式界面，并支持多种类型的输入和输出，从而为更加灵活和智能的应用程序提供支持，同时，ReAct也具有很好的可扩展性和适应性，可以与其他技术进行集成和融合，以满足不同领域的需求和应用。因此，基于大语言模型的ReAct，可以实现大语言模型根据输入的信息确定执行流程信息对应的目标操作。

另外，在得到大语言模型确定的目标操作后，考虑到实现很多操作时，需要使用到电子设备的设备信息，因此可以根据以上知识数据库来执行这些确定出的目标操作，从而完成以上执行流程信息的实现，即达成了用户的意图。例如，针对前述举例的执行流程信息“1.查询购物软件中冰激凌商品的信息；2.获取公司的地址；3.选择其中优惠力度较大，评分较高，单位价格较低的一款；4.将选择的商品下单”，在执行用于实现“查询购物软件中冰激凌商品的信息”对应的操作时，则可以从知识数据库中查询安装的应用程序的应用信息，并根据应用信息确定出需要使用的购物软件。

同样地，在大语言模型部署于服务器中的情况下，电子设备可以根据以上待处理信息以及操作数据库中的信息，生成输入信息并将生成的输入信息发送至服务器，从而服务器通过大语言模型根据接收到的输入信息，确定以上目标操作并反馈至电子设备；大语言模型部署于电子设备中的情况下，电子设备可以直接将以上输入信息输入到本地的大语言模型中，从而得到确定出的以上目标操作。

在一些实施方式中，在构建以上知识数据库时，可以显示提示界面，提示界面中可以包括用于提示用户将采集设备信息的提示信息；在检测到提示界面中输入的确认操作的情况下，可以扫描电子设备的设备信息，并根据设备信息构建知识数据库。其中，在构建知识数据库时，可以将以上设备信息中的每条原始信息处理为设定的大小；然后使用文本向量化(text to vector)的方法，例如哈希算法、余弦相似度、PCA(主成分分析)、Transformer架构的Embedding模型等，将处理后的以上每条原始信息编码成向量；编码后的向量可以存储在数据库中，例如MySql、SQLite、MongoDB、Redis等数据库中，数据形式为<向量编码，原始文件路径>的键值对，通过原始文件路径可以查找到向量对应的原始信息。

在一些实施方式中，以上操作数据库可以是电子设备原始配置于本地的，也可以是从服务器下载的。构建操作数据库时，不同的应用界面中的输入操作所实现的功能可以是通过自动化脚本生成的，也可以是通过人工总结生成的。其中，通过自动化脚本生成是模仿人类点击和输入，同时分析界面的响应情况，主要是通过挖掘出应用界面中可操作的按钮，操作后的效果，例如操作后显示的界面、操作后会执行的处理等。根据以上应用界面中的输入操作所实现的功能所对应的功能信息，可以将功能信息按照以上设备信息的处理方式，并存储到数据库中，从而得到操作数据库。

本申请实施例提供的意图执行方法，通过获取输入的待处理信息，针对待处理信息，利用了大语言模型的理解能力，通过大语言模型对其进行意图理解，并生成待处理信息，然后再通过大语言模型，以及预先构建的知识数据库以及操作数据库，来确定用于实现该执行流程信息对应的操作，并执行确定出的操作，从而可以达成用户的意图，进而能够实现理解和实现复杂的用户意图，提升用户在使用电子设备的意图理解的相关服务时的使用体验，并增强了电子设备的可用性。

请参阅图2，图2示出了本申请另一个实施例提供的意图执行方法的流程示意图。该意图执行方法应用于上述电子设备，下面将针对图2所示的流程进行详细的阐述，所述意图执行方法具体可以包括以下步骤：

步骤S210：获取输入的待处理信息。

步骤S220：通过大语言模型，生成所述待处理信息对应的执行流程信息，所述执行流程信息用于实现所述待处理信息对应的用户意图。

在本申请实施例中，步骤S210以及步骤S220可以参阅前述实施例的内容，在此不再赘述。

步骤S230：通过所述大语言模型，并根据知识数据库以及操作数据库，依次确定顺序执行的多个操作中的每个操作，并依次执行所述每个操作，所述知识数据库是根据所述电子设备的设备信息构建的，所述操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。

在本申请实施例中，通常当前用户的意图较为复杂时，是需要存在执行顺序关系的多个操作，才能实现以上生成的执行流程信息的，因此可以通过大语言模型，并根据知识数据库以及操作数据库，依次确定多个操作中的每个操作，并依次执行每个操作，如此，可以更好地达成用户的复杂意图。

在一些实施方式中，在通过大语言模型，并根据知识数据库以及操作数据库，依次确定多个操作中的每个操作，并依次执行每个操作时，对于需要确定和执行的第一个操作而言，可以通过大语言模型，并根据操作数据库，确定第一个操作，并根据知识数据库，执行第一个操作，并得到第一个操作的操作结果；而针对多个操作中的第N个操作，该N为大于1的正整数，即针对非第一个操作的任一操作，可以通过大语言模型，并根据第N-1个操作的操作结果以及操作数据库，确定第N个操作，并根据知识数据库，执行第N个操作，并得到第N个操作的操作结果。也就是说，对于非第一个操作的任一操作而言，在确定具体操作时，需要依赖上一操作的执行结果(即以上操作结果)，因此是通过大语言模型，并根据该操作的上一个操作的操作结果以及操作数据库，确定该操作。

示例性地，针对前述实施例中举例的执行流程信息“1.查询购物软件中冰激凌商品的信息；2.获取公司的地址；3.选择其中优惠力度较大，评分较高，单位价格较低的一款；4.将选择的商品下单”，在确定和执行用于实现“查询购物软件中冰激凌商品的信息”对应的操作时，首先可以确定出第一个操作“获取购物应用”，根据以上知识数据库执行该第一个操作后，可以得到在知识数据库中查询到的结果(即第一个操作的操作结果)“购物应用有应用j和应用k”；然后根据第一个操作的操作结果“购物应用有应用j和应用k”以及操作数据库，通过大语言模型确定出第二个操作“向用户提问：使用应用j还是应用k进行购买”，在执行第二个操作后，可以得到用户针对提示反馈的结果(即第二个操作的操作结果)“使用应用k购买”；然后根据第二个操作的操作结果“使用应用k购买”，以及操作数据库，通过大语言模型确定出第三个操作“操作应用：应用k，搜索商品，关键词：冰激凌”，在执行该第三个操作后，可以得到操作结果“通过应用k搜索到的冰激凌的商品信息列表”。

在一种可能的实施方式中，在通过大语言模型，并根据操作数据库，确定第一个操作，并根据知识数据库，执行第一个操作，并得到第一个操作的操作结果时，由于在确定和执行第一个操作时，并不存在上一个操作的操作结果，因此可以根据目标提示信息、操作数据库以及执行流程信息，生成用于输入所述大语言模型的第一输入信息，目标提示信息用于提示大语言模型根据操作数据库中的数据，输出用于实现执行流程信息的操作；将第一输入信息输入至所述大语言模型，得到大语言模型输出的第一操作信息，并将第一操作信息对应的操作确定为第一个操作。以上目标提示信息可以理解为前述实施例中所讲的提示(prompt)，用于提示大语言模型所需进行的处理。

可选地，目标提示信息可以是预先确定的提示词模板，电子设备可以将操作数据库中的信息填入到提示词模板，并将执行流程信息与提示词目标拼接，从而得到以上第一输入信息。例如，提示词模板可以是：“针对执行流程信息A，给出实现该执行流程信息A的具体操作；实现流程信息A时若需使用操作数据库中的信息，请使用以下格式：{操作编号：参数列表}；可支持的操作从操作数据库中选取，操作数据库的信息如下：{abc}；如果步骤中包含不支持的操作，请尝试用已支持的操作替代；如果仍然无法分解，请回复暂时无法支持该意图”。

在一种可能的实施方式中，在针对第N个操作，通过大语言模型，并根据第N-1个操作的操作结果以及所述操作数据库，确定第N个操作时，可以根据在确定第N-1个操作时输入至大语言模型的第二输入信息，以及第N-1个操作的操作结果，生成用于输入大语言模型的第三输入信息；将第三输入信息输入至大语言模型，得到大语言模型输出的第二操作信息，并将第二操作信息对应的操作确定为第N个操作。也就是说，可以根据上一个操作的操作结果，以及确定上一个操作时输入至大语言模型的输入信息，来生成确定和执行第N个操作时输入到大语言模型的输入信息。可选地，可以将第N-1个操作的操作结果与以上第二输入信息进行拼接，得到以上第三输入信息。可以理解地，确定上一个操作时输入至大语言模型的输入信息中已经包含了执行流程信息、相关的提示信息(可以是前述的目标提示信息)和操作数据库中的信息，因此可以直接利用确定上一个操作时输入至大语言模型的输入信息，以及上一个操作的操作结果，来生成本次需要输入至大语言模型的输入信息。

在一种可能的实施方式中，在根据知识数据库，执行第一个操作，并得到第一个操作的操作结果时，可以根据知识数据库，执行第一个操作；若执行第一个操作之后未获得操作结果，则输出第一提示信息，第一提示信息用于提示输入第一个操作对应的操作结果；获取输入的第一结果信息，作为第一个操作对应的操作结果。可以理解地，一些情况下，电子设备自动执行操作时，是无法完成所需的操作的，例如，针对“获取公司的地址”这一操作，电子设备通过查询知识数据库后，无法获得“公司的地址”，因此，可以通过输出提示信息的方式，使用户可以根据提示信息输入相应的结果信息，作为操作结果。

同样地，针对以上第N个操作，可以在执行第N个操作之后未获得操作结果的情况下，输出第二提示信息，第二提示信息用于提示输入第N个操作对应的操作结果；获取输入的第二结果信息，作为第N个操作对应的操作结果。

本申请实施例提供的意图执行方法，通过获取输入的待处理信息，针对待处理信息，利用了大语言模型的理解能力，通过大语言模型对其进行意图理解，并生成待处理信息，然后再通过大语言模型，以及预先构建的知识数据库以及操作数据库，依次确定需要顺序执行的多个操作中的每个操作，并依次执行每个操作，从而能够实现理解复杂的用户意图，并更好地达成用户的复杂意图。

请参阅图3，图3示出了本申请又一个实施例提供的意图执行方法的流程示意图。该意图执行方法应用于上述电子设备，下面将针对图3所示的流程进行详细的阐述，所述意图执行方法具体可以包括以下步骤：

步骤S310：获取输入的待处理信息。

步骤S320：通过大语言模型，生成所述待处理信息对应的执行流程信息，所述执行流程信息用于实现所述待处理信息对应的用户意图，所述执行流程信息包括多个执行步骤对应的步骤信息。

在本申请实施例中，步骤S310以及步骤S320可以参阅前述实施例的内容，在此不再赘述。

步骤S330：通过所述大语言模型，并根据知识数据库以及操作数据库，确定每个所述步骤信息对应的操作，并执行每个所述步骤信息对应的操作，所述知识数据库是根据所述电子设备的设备信息构建的，所述操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。

在本申请实施例中，通常当前用户的意图较为复杂时，在实现用户意图时是需要进行多个执行步骤的，因此以上执行流程信息中可以包括有多个执行步骤对应的步骤信息，在实现以上生成的执行流程信息时，可以通过大语言模型，并根据知识数据库以及操作数据库，确定多个执行步骤对应的步骤信息中每个步骤信息对应的操作，并执行每个步骤信息对应的操作，由此实现以上多个执行步骤，即实现了以上执行流程信息，如此，可以更好地达成用户的复杂意图。

在一些实施例中，本申请实施例提供的意图执行方法是可以与前一实施例提供的意图执行方法结合实施的，例如，实现以上执行步骤需要顺序执行的多个操作，则在确定和执行该执行步骤对应的操作时，可以通过大语言模型，并根述知识数据库以及操作数据库，依次确定该执行步骤对应的多个操作中的每个操作，并依次执行每个操作。

示例性地，针对前述实施例中举例的执行流程信息“1.查询购物软件中冰激凌商品的信息；2.获取公司的地址；3.选择其中优惠力度较大，评分较高，单位价格较低的一款；4.将选择的商品下单”，执行流程信息中包括4个步骤，可以通过大语言模型，并根据知识数据库以及操作数据库，确定以上每个步骤信息对应的操作，并执行每个步骤信息对应的操作。

其中，在确定和执行步骤“1.查询购物软件中冰激凌商品的信息”时，首先可以确定出第一个操作“获取购物应用”，根据以上知识数据库执行该第一个操作后，可以得到在知识数据库中查询到的结果(即第一个操作的操作结果)“购物应用有应用j和应用k”；然后根据第一个操作的操作结果“购物应用有应用j和应用k”以及操作数据库，通过大语言模型确定出第二个操作“向用户提问：使用应用j还是应用k进行购买”，在执行第二个操作后，可以得到用户针对提示反馈的结果(即第二个操作的操作结果)“使用应用k购买”；然后根据第二个操作的操作结果“使用应用k购买”，以及操作数据库，通过大语言模型确定出第三个操作“操作应用：应用k，搜索商品，关键词：冰激凌”，在执行该第三个操作后，可以得到操作结果“通过应用k搜索到的冰激凌的商品信息列表”，进而完成了步骤“1.查询购物软件中冰激凌商品的信息”。

在确定和执行步骤“2.获取公司的地址”时，首先可以确定出“查询知识数据库：公司地址”的第一个操作，根据以上知识数据库执行该第一个操作后，可以得到在知识数据库中查询到的结果(即第一个操作的操作结果)“无”；该情况下，根据第一个操作的操作结果“无”以及操作数据库，通过大语言模型确定出第二个操作“向用户提问：公司的收货地址是什么”，在执行第二个操作后，可以得到用户针对提示反馈的结果(即第二个操作的操作结果)“公司收货地址为：城市A的B区的C街道的小区D”，进而完成了步骤“2.获取公司的地址”。

在确定和执行步骤“3.选择其中优惠力度较大，评分较高，单位价格较低的一款”时，可以确定出“从步骤1获得的商品信息列表中确定{优惠力度较大，评分较高，单位价格较低}的商品”的操作，在执行该操作后，可以得到操作结果“确定出的商品：冰激凌f”。

在确定和执行步骤“4.将选择的商品下单”时，可以确定出“操作应用：k，购买商品：冰激凌f，收货地址”的操作，在执行该操作后，可以得到操作结果“已完成用户意图”，至此，即实现了待处理信息中包含的用户意图。

在一些实施方式中，考虑到电子设备针对输入的待处理信息进行意图理解和自动执行意图可能存在准确性的问题，因此，电子设备在通过大语言模型，并根据知识数据库以及操作数据库，确定执行流程信息对应的目标操作，以及执行目标操作之后，还可以显示评分界面；再获取评分界面中输入的数据，作为针对本次意图执行的评分数据；然后将该评分数据反馈至服务器。由此，可以使得服务器能够收集电子设备在进行意图理解和自动执行意图后的用户反馈的评分，进而可以根据收集的评分，确定电子设备的该功能的改进方向，以便在改进电子设备的该功能后，能够更好地理解和自动执行用户的复杂意图。

本申请实施例提供的意图执行方法，通过获取输入的待处理信息，针对待处理信息，利用了大语言模型的理解能力，通过大语言模型对其进行意图理解，并生成待处理信息，然后再通过大语言模型，并根据知识数据库以及操作数据库，确定执行流程信息的多个步骤信息中每个步骤信息对应的操作，并执行每个步骤信息对应的操作，从而能够实现理解复杂的用户意图，并更好地达成用户的复杂意图。

请参阅图4，图4示出了本申请再一个实施例提供的意图执行方法的流程示意图。该意图执行方法应用于上述电子设备，下面将针对图4所示的流程进行详细的阐述，所述意图执行方法具体可以包括以下步骤：

步骤S410：获取输入的待处理信息。

步骤S420：通过大语言模型，生成所述待处理信息对应的执行流程信息，所述执行流程信息用于实现所述待处理信息对应的用户意图。

在本申请实施例中，步骤S410以及步骤S420可以参阅前述实施例的内容，在此不再赘述。

步骤S430：通过所述大语言模型，并根据操作数据库，确定所述执行流程信息对应的目标操作，所述操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。

步骤S440：展示所述目标操作对应的操作提示信息，所述操作提示信息用于提示是否执行所述目标操作。

步骤S450：响应于针对所述操作提示信息的确定操作，根据所述知识数据库，执行所述目标操作，所述知识数据库是根据所述电子设备的设备信息构建的。

在本申请实施例中，考虑到电子设备在理解和执行用户意图的过程中，可能会存在意图理解有误，以及涉及用户的财产、隐私等信息的相关操作，因此电子设备通过大语言模型，并根据知识数据库以及操作数据库，确定执行流程信息对应的目标操作，以及执行目标操作时，可以在通过大语言模型，并根据操作数据库，确定执行流程信息对应的目标操作之后，展示目标操作对应的操作提示信息，操作提示信息用于提示是否执行目标操作；在展示目标操作对应的操作提示信息后，在检测到针对以上操作提示信息的确定操作的情况下，可以响应于该确定操作，根据知识数据库，执行目标操作；若在目标时长内未检测到针对以上操作提示信息的确定操作，则可以不执行以上目标操作，并结束流程，即结束本次根据以上待处理信息进行意图理解和达成用户意图的过程。如此，可以在用户确定执行以上目标操作的情况下，才执行以上目标操作，不仅可以保证意图执行的准确性，还能避免用户受到相关损失。

本申请实施例提供的意图执行方法，通过获取输入的待处理信息，针对待处理信息，利用了大语言模型的理解能力，通过大语言模型对其进行意图理解，并生成待处理信息，然后再通过大语言模型，以及预先构建的知识数据库以及操作数据库，来确定用于实现该执行流程信息对应的操作，并执行确定出的操作，从而可以达成用户的意图，进而能够实现理解和实现复杂的用户意图，提升用户在使用电子设备的意图理解的相关服务时的使用体验，并增强了电子设备的可用性；另外，在执行以上执行流程信息对应的操作之前，电子设备还通过输出相关提示信息，在检测到用户输入的确定操作的情况下，才执行以上操作，从而不仅可以保证意图执行的准确性，还能避免用户受到相关损失。

请参阅图5，其示出了本申请实施例提供的一种意图执行装置500的结构框图。该意图执行装置500应用于上电子设备，该意图执行装置500包括：信息获取模块510、意图识别模块520以及操作执行模块530。其中，所述信息获取模块510用于获取输入的待处理信息；所述意图识别模块520用于通过大语言模型，生成所述待处理信息对应的执行流程信息，所述执行流程信息用于实现所述待处理信息对应的用户意图；所述操作执行模块530用于通过所述大语言模型，并根据知识数据库以及操作数据库，确定所述执行流程信息对应的目标操作，以及执行所述目标操作，所述知识数据库是根据所述电子设备的设备信息构建的，所述操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。

在一些实施方式中，操作执行模块530可以具体用于通过所述大语言模型，并根据所述知识数据库以及操作数据库，依次确定所述多个操作中的每个操作，并依次执行所述每个操作。

在一种可能的实施方式中，操作执行模块530还可以用于针对所述多个操作中的第一个操作，通过所述大语言模型，并根据所述操作数据库，确定所述第一个操作，并根据所述知识数据库，执行所述第一个操作，并得到所述第一个操作的操作结果；针对所述多个操作中的第N个操作，通过所述大语言模型，并根据第N-1个操作的操作结果以及所述操作数据库，确定所述第N个操作，并根据所述知识数据库，执行所述第N个操作，并得到所述第N个操作的操作结果。

可选地，操作执行模块530还可以用于针对所述多个操作中的第一个操作，根据目标提示信息、所述操作数据库以及所述执行流程信息，生成用于输入所述大语言模型的第一输入信息，所述目标提示信息用于提示所述大语言模型根据所述操作数据库中的数据，输出用于实现所述执行流程信息的操作；将所述第一输入信息输入至所述大语言模型，得到所述大语言模型输出的第一操作信息，并将所述第一操作信息对应的操作确定为所述第一个操作。

可选地，操作执行模块530还可以用于针对所述多个操作中的第N个操作，根据在确定所述第N-1个操作时输入至所述大语言模型的第二输入信息，以及所述第N-1个操作的操作结果，生成用于输入所述大语言模型的第三输入信息；将所述第三输入信息输入至所述大语言模型，得到所述大语言模型输出的第二操作信息，并将所述第二操作信息对应的操作确定为所述第N个操作，其中，N为大于1的正整数。

可选地，操作执行模块530还可以用于根据所述知识数据库，执行所述第一个操作；若执行所述第一个操作之后未获得操作结果，则输出第一提示信息，所述第一提示信息用于提示输入所述第一个操作对应的操作结果；获取输入的第一结果信息，作为所述第一个操作对应的操作结果。

在一些实施方式中，所述执行流程信息包括多个执行步骤对应的步骤信息，操作执行模块530可以具体用于通过所述大语言模型，并根据知识数据库以及操作数据库，确定每个所述步骤信息对应的操作，并执行每个所述步骤信息对应的操作。

在一些实施方式中，操作执行模块530可以具体用于通过所述大语言模型，并根据所述操作数据库，确定所述执行流程信息对应的目标操作；展示所述目标操作对应的操作提示信息，所述操作提示信息用于提示是否执行所述目标操作；响应于针对所述操作提示信息的确定操作，根据所述知识数据库，执行所述目标操作。

在一些实施方式中，该意图执行装置500还可以包括界面显示模块、数据获取模块以及数据反馈模块。界面显示模块用于在所述通过所述大语言模型，并根据知识数据库以及操作数据库，确定所述执行流程信息对应的目标操作，以及执行所述目标操作之后，显示评分界面；数据获取模块用于获取所述评分界面中输入的数据，作为针对本次意图执行的评分数据；数据反馈模块用于将所述评分数据反馈至服务器。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，模块相互之间的耦合可以是电性，机械或其它形式的耦合。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

综上所述，本申请提供的方案，通过获取输入的待处理信息，通过大语言模型，生成待处理信息对应的执行流程信息，执行流程信息用于实现待处理信息对应的用户意图，再通过大语言模型，并根据知识数据库以及操作数据库，确定执行流程信息对应的目标操作，并执行目标操作，该知识数据库是根据电子设备的设备信息构建的，操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。由此可以实现针对具有复杂的用户意图的输入信息，将其识别为执行流程信息后，再利用大语言模型、知识数据库以及操作数据库，来确定和执行该执行流程信息对应的目标操作，从而实现能够理解和实现复杂的用户意图。

请参考图6，其示出了本申请实施例提供的一种电子设备的结构框图。该电子设备100可以是智能手机、平板电脑、智能手表、电子书等能够运行应用程序的电子设备。本申请中的电子设备100可以包括一个或多个如下部件：处理器110、存储器120、以及一个或多个应用程序，其中一个或多个应用程序可以被存储在存储器120中并被配置为由一个或多个处理器110执行，一个或多个应用程序配置用于执行如前述方法实施例所描述的方法。

处理器110可以包括一个或者多个处理核。处理器110利用各种接口和线路连接整个电子设备100内的各个部分，通过运行或执行存储在存储器120内的指令、程序、代码集或指令集，以及调用存储在存储器120内的数据，执行电子设备100的各种功能和处理数据。可选地，处理器110可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable LogicArray，PLA)中的至少一种硬件形式来实现。处理器110可集成中央处理器(CentralProcessing Unit，CPU)、图形处理器(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器110中，单独通过一块通信芯片进行实现。

存储器120可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。

请参考图7，其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质800中存储有程序代码，所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读存储介质800可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地，计算机可读存储介质800包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质800具有执行上述方法中的任何方法步骤的程序代码810的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码810可以例如以适当形式进行压缩。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种意图执行方法，其特征在于，应用于电子设备，所述方法包括：

获取输入的待处理信息；

通过大语言模型，生成所述待处理信息对应的执行流程信息，所述执行流程信息用于实现所述待处理信息对应的用户意图；

通过所述大语言模型，并根据知识数据库以及操作数据库，确定所述执行流程信息对应的目标操作，以及执行所述目标操作，所述知识数据库是根据所述电子设备的设备信息构建的，所述操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。

2.根据权利要求1所述的方法，其特征在于，所述目标操作包括顺序执行的多个操作，所述通过所述大语言模型，并根据知识数据库以及操作数据库，确定所述执行流程信息对应的目标操作，以及执行所述目标操作，包括：

通过所述大语言模型，并根据所述知识数据库以及操作数据库，依次确定所述多个操作中的每个操作，并依次执行所述每个操作。

3.根据权利要求2所述的方法，其特征在于，所述通过所述大语言模型，并根据所述知识数据库以及操作数据库，依次确定所述多个操作中的每个操作，并依次执行所述每个操作，包括：

针对所述多个操作中的第一个操作，通过所述大语言模型，并根据所述操作数据库，确定所述第一个操作，并根据所述知识数据库，执行所述第一个操作，并得到所述第一个操作的操作结果；

针对所述多个操作中的第N个操作，通过所述大语言模型，并根据第N-1个操作的操作结果以及所述操作数据库，确定所述第N个操作，并根据所述知识数据库，执行所述第N个操作，并得到所述第N个操作的操作结果，其中，N为大于1的正整数。

4.根据权利要求3所述的方法，其特征在于，所述针对所述多个操作中的第一个操作，通过所述大语言模型，并根据所述操作数据库，确定所述第一个操作，包括：

针对所述多个操作中的第一个操作，根据目标提示信息、所述操作数据库以及所述执行流程信息，生成用于输入所述大语言模型的第一输入信息，所述目标提示信息用于提示所述大语言模型根据所述操作数据库中的数据，输出用于实现所述执行流程信息的操作；

将所述第一输入信息输入至所述大语言模型，得到所述大语言模型输出的第一操作信息，并将所述第一操作信息对应的操作确定为所述第一个操作。

5.根据权利要求3所述的方法，其特征在于，所述针对所述多个操作中的第N个操作，通过所述大语言模型，并根据第N-1个操作的操作结果以及所述操作数据库，确定所述第N个操作，包括：

针对所述多个操作中的第N个操作，根据在确定所述第N-1个操作时输入至所述大语言模型的第二输入信息，以及所述第N-1个操作的操作结果，生成用于输入所述大语言模型的第三输入信息；

将所述第三输入信息输入至所述大语言模型，得到所述大语言模型输出的第二操作信息，并将所述第二操作信息对应的操作确定为所述第N个操作。

6.根据权利要求3所述的方法，其特征在于，所述根据所述知识数据库，执行所述第一个操作，并得到所述第一个操作的操作结果，包括：

根据所述知识数据库，执行所述第一个操作；

若执行所述第一个操作之后未获得操作结果，则输出第一提示信息，所述第一提示信息用于提示输入所述第一个操作对应的操作结果；

获取输入的第一结果信息，作为所述第一个操作对应的操作结果。

7.根据权利要求1-6任一项所述的方法，其特征在于，所述执行流程信息包括多个执行步骤对应的步骤信息，所述通过所述大语言模型，并根据知识数据库以及操作数据库，确定所述执行流程信息对应的目标操作，以及执行所述目标操作，包括：

通过所述大语言模型，并根据知识数据库以及操作数据库，确定每个所述步骤信息对应的操作，并执行每个所述步骤信息对应的操作。

8.根据权利要求1-6任一项所述的方法，其特征在于，所述通过所述大语言模型，并根据知识数据库以及操作数据库，确定所述执行流程信息对应的目标操作，以及执行所述目标操作，包括：

通过所述大语言模型，并根据所述操作数据库，确定所述执行流程信息对应的目标操作；

展示所述目标操作对应的操作提示信息，所述操作提示信息用于提示是否执行所述目标操作；

响应于针对所述操作提示信息的确定操作，根据所述知识数据库，执行所述目标操作。

9.根据权利要求1-6任一项所述的方法，其特征在于，在所述通过所述大语言模型，并根据知识数据库以及操作数据库，确定所述执行流程信息对应的目标操作，以及执行所述目标操作之后，所述方法还包括：

显示评分界面；

获取所述评分界面中输入的数据，作为针对本次意图执行的评分数据；

将所述评分数据反馈至服务器。

10.一种意图执行装置，其特征在于，应用于电子设备，所述装置包括：信息获取模块、意图识别模块以及操作执行模块，其中，

所述信息获取模块用于获取输入的待处理信息；

所述意图识别模块用于通过大语言模型，生成所述待处理信息对应的执行流程信息，所述执行流程信息用于实现所述待处理信息对应的用户意图；

所述操作执行模块用于通过所述大语言模型，并根据知识数据库以及操作数据库，确定所述执行流程信息对应的目标操作，以及执行所述目标操作，所述知识数据库是根据所述电子设备的设备信息构建的，所述操作数据库是根据不同的应用界面中的输入操作所实现的功能构建的。

11.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储器；

一个或多个程序，其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于执行如权利要求1-9任一项所述的方法。

12.一种计算机可读取存储介质，其特征在于，所述计算机可读取存储介质中存储有程序代码，所述程序代码可被处理器调用执行如权利要求1-9任一项所述的方法。