CN117743542A - 基于人工智能的信息处理方法、装置、电子设备及智能体 - Google Patents
基于人工智能的信息处理方法、装置、电子设备及智能体 Download PDFInfo
- Publication number
- CN117743542A CN117743542A CN202311763568.4A CN202311763568A CN117743542A CN 117743542 A CN117743542 A CN 117743542A CN 202311763568 A CN202311763568 A CN 202311763568A CN 117743542 A CN117743542 A CN 117743542A
- Authority
- CN
- China
- Prior art keywords
- information
- processing
- task
- memory
- tool
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 175
- 230000010365 information processing Effects 0.000 title claims abstract description 29
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 121
- 230000015654 memory Effects 0.000 claims abstract description 100
- 238000000034 method Methods 0.000 claims description 88
- 230000009471 action Effects 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 16
- 230000003936 working memory Effects 0.000 claims description 14
- 230000001149 cognitive effect Effects 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 239000003795 chemical substances by application Substances 0.000 description 140
- 230000008569 process Effects 0.000 description 21
- 238000004891 communication Methods 0.000 description 19
- 230000007246 mechanism Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 230000003993 interaction Effects 0.000 description 7
- 238000010168 coupling process Methods 0.000 description 5
- 238000005859 coupling reaction Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 206010063385 Intellectualisation Diseases 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000008451 emotion Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000019771 cognition Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000003999 initiator Substances 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 206010061619 Deformity Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007087 memory ability Effects 0.000 description 1
- 230000003924 mental process Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种基于人工智能的信息处理方法、装置、电子设备及智能体,涉及人工智能技术领域,尤其涉及大语言模型、AI智能体等领域。实现方案为:获取待处理的输入信息;确定与输入信息的处理相关联的执行信息,执行信息包括待检索的记忆信息或待调用的工具信息中的至少一者;利用执行信息获得与输入信息的处理对应的至少一个处理结果信息;以及整合至少一个处理结果信息以生成用于进行反馈的输出信息。
Description
技术领域
本公开涉及人工智能(AI)技术领域,尤其涉及大语言模型(LLM,Large LanguageModel)、AI智能体(AI Agent)等领域,具体涉及一种基于人工智能的信息处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品,以及一种AI智能体。
背景技术
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
近来,随着大语言模型的不断进步,AI在语言理解、知识记忆、逻辑推理等方面的能力取得了巨大提升,为AI智能体的发展提供了强有力的支持。AI智能体是一种以大语言模型作为核心推理引擎的高级人工智能系统,不仅具备大语言模型的语言理解与生成能力,还能够高效灵活地解决各种复杂问题,进一步释放大语言模型蕴含的机器智能,从而为用户提供更加精准、更加个性化的服务。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
本公开提供了一种基于人工智能的信息处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品,以及一种AI智能体。
根据本公开的一方面,提供了一种基于人工智能的信息处理方法,包括:获取待处理的输入信息;确定与输入信息的处理相关联的执行信息,执行信息包括待检索的记忆信息或待调用的工具信息中的至少一者;利用执行信息获得与输入信息的处理对应的至少一个处理结果信息;以及整合至少一个处理结果信息以生成用于进行反馈的输出信息。
根据本公开的另一方面,提供了一种AI智能体,被配置为执行如上的方法。
根据本公开的另一方面,提供了一种基于人工智能的信息处理装置,包括:输入单元,被配置为获取待处理的输入信息;规划单元,被配置为确定与输入信息的处理相关联的执行信息,执行信息包括待检索的记忆信息或待调用的工具信息中的至少一者;行动单元,被配置为利用执行信息获得与输入信息的处理对应的至少一个处理结果信息;以及输出单元,被配置为整合至少一个处理结果信息以生成用于进行反馈的输出信息。
根据本公开的另一方面,提供了一种电子设备,包括至少一个处理器;以及与至少一个处理器通信连接的存储器,其中,存储器存储有能够被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上所述的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如上所述的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时实现如上所述的方法。
根据本公开的一个或多个实施例,可以简单且有效地提升AI智能体的智能化程度。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
图1示出了根据本公开实施例的可以在其中实施本文描述的各种方法的示例性系统的示意图;
图2示出了根据本公开一个实施例的基于人工智能的信息处理方法的流程图;
图3示出了根据本公开另一个实施例的基于人工智能的信息处理方法的流程图;
图4示出了根据本公开实施例的确定与输入信息的处理相关联的执行信息的过程的流程图;
图5示出了根据本公开实施例的AI智能体的示意图;
图6示出了根据本公开一个实施例的基于人工智能的信息处理装置的结构框图;
图7示出了根据本公开另一个实施例的基于人工智能的信息处理装置的结构框图;
图8示出了能够用于实现本公开实施例的示例性电子设备的结构框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个要素与另一要素区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
相关技术中,现有的AI智能体还处于相当早期的发展阶段,与AI智能体有关的智能体机制的设计尚不存在统一的标准。目前在业界出现的各种AI智能体大多还停留在概念验证与初步尝试的阶段。
举例而言,现有的AI智能体一般存在以下几方面问题:
首先,AI智能体的整体架构在模块设计上存在粒度过粗或过细的问题。如果模块粒度过粗,可能会导致单个模块承载过多的认知负担,由此限制AI智能体相比于大语言模型所能带来的增益;而如果模块粒度过粗,可能会导致任务解决链路过长,累积误差增大,从而无法有效地发挥出大语言模型的语言理解能力。
其次,AI智能体通常会加入过多人为设定的规则,以适配某类特定场景下的具体问题。然而,当遇到之前从未出现过的问题时,这种依赖预设规则的设计可能会限制AI智能体在未知环境中的应变能力,使其无法灵活调整策略,从而导致在实际应用中表现出较低的泛化性能。
另外,AI智能体的具体功能实现还不够全面。一些AI智能体采用了向量数据库来模拟人脑的记忆存储功能,将所有历史交互行为均存入向量数据库。这看似可以实现无损的长期记忆,但可能会导致AI智能体无法从一系列的对话、任务或事件中提取出可复用的、抽象化的经验,导致AI智能体只会记录,不会总结,从而形成记忆上的性能瓶颈。
此外,AI智能体尚不具备更高级的认知能力,例如反思能力。即便当前获取到的结果已经满足了任务的基本要求,但这可能并不是AI智能体本身的能力上限。
针对上述至少一个问题,本公开的实施例提供了一种基于人工智能的信息处理方法和AI智能体。
在详细描述本公开实施例的方法之前,首先结合图1描述可以将本文描述的方法在其中实施的示例性系统。
图1示出了根据本公开实施例的可以将本文描述的各种方法和装置在其中实施的示例性系统100的示意图。参考图1,该系统100包括一个或多个客户端设备101、102、103、104、105和106、服务器120以及将一个或多个客户端设备耦接到服务器120的一个或多个通信网络110。客户端设备101、102、103、104、105和106可以被配置为执行一个或多个应用程序。
在本公开的实施例中,服务器120可以运行使得能够执行基于人工智能的信息处理方法或AI智能体的一个或多个服务或软件应用。
在某些实施例中,服务器120还可以提供其他服务或软件应用,这些服务或软件应用可以包括非虚拟环境和虚拟环境。在某些实施例中,这些服务可以作为基于web的服务或云服务提供,例如在软件即服务(SaaS)模型下提供给客户端设备101、102、103、104、105和/或106的用户。
在图1所示的配置中,服务器120可以包括实现由服务器120执行的功能的一个或多个组件。这些组件可以包括可由一个或多个处理器执行的软件组件、硬件组件或其组合。操作客户端设备101、102、103、104、105和/或106的用户可以依次利用一个或多个客户端应用程序来与服务器120进行交互以利用这些组件提供的服务。应当理解,各种不同的系统配置是可能的,其可以与系统100不同。因此,图1是用于实施本文所描述的各种方法的系统的一个示例,并且不旨在进行限制。
用户可以使用客户端设备101、102、103、104、105和/或106来提供与AI智能体进行交互的信息。客户端设备可以提供使客户端设备的用户能够与客户端设备进行交互的接口。客户端设备还可以经由该接口向用户输出信息。尽管图1仅描绘了六种客户端设备,但是本领域技术人员将能够理解,本公开可以支持任何数量的客户端设备。
客户端设备101、102、103、104、105和/或106可以包括各种类型的计算机设备,例如便携式手持设备、通用计算机(诸如个人计算机和膝上型计算机)、工作站计算机、可穿戴设备、智能屏设备、自助服务终端设备、服务机器人、游戏系统、瘦客户端、各种消息收发设备、传感器或其他感测设备等。这些计算机设备可以运行各种类型和版本的软件应用程序和操作系统,例如MICROSOFT Windows、APPLE iOS、类UNIX操作系统、Linux或类Linux操作系统(例如GOOGLE Chrome OS);或包括各种移动操作系统,例如MICROSOFT WindowsMobile OS、iOS、Windows Phone、Android。便携式手持设备可以包括蜂窝电话、智能电话、平板电脑、个人数字助理(PDA)等。可穿戴设备可以包括头戴式显示器(诸如智能眼镜)和其他设备。游戏系统可以包括各种手持式游戏设备、支持互联网的游戏设备等。客户端设备能够执行各种不同的应用程序,例如各种与Internet相关的应用程序、通信应用程序(例如电子邮件应用程序)、短消息服务(SMS)应用程序,并且可以使用各种通信协议。
网络110可以是本领域技术人员熟知的任何类型的网络,其可以使用多种可用协议中的任何一种(包括但不限于TCP/IP、SNA、IPX等)来支持数据通信。仅作为示例,一个或多个网络110可以是局域网(LAN)、基于以太网的网络、令牌环、广域网(WAN)、因特网、虚拟网络、虚拟专用网络(VPN)、内部网、外部网、区块链网络、公共交换电话网(PSTN)、红外网络、无线网络(例如蓝牙、WIFI)和/或这些和/或其他网络的任意组合。
服务器120可以包括一个或多个通用计算机、专用服务器计算机(例如PC(个人计算机)服务器、UNIX服务器、中端服务器)、刀片式服务器、大型计算机、服务器群集或任何其他适当的布置和/或组合。服务器120可以包括运行虚拟操作系统的一个或多个虚拟机,或者涉及虚拟化的其他计算架构(例如可以被虚拟化以维护服务器的虚拟存储设备的逻辑存储设备的一个或多个灵活池)。在各种实施例中,服务器120可以运行提供下文所描述的功能的一个或多个服务或软件应用。
服务器120中的计算单元可以运行包括上述任何操作系统以及任何商业上可用的服务器操作系统的一个或多个操作系统。服务器120还可以运行各种附加服务器应用程序和/或中间层应用程序中的任何一个,包括HTTP服务器、FTP服务器、CGI服务器、JAVA服务器、数据库服务器等。
在一些实施方式中,服务器120可以包括一个或多个应用程序,以分析和合并从客户端设备101、102、103、104、105和/或106的用户接收的数据馈送和/或事件更新。服务器120还可以包括一个或多个应用程序,以经由客户端设备101、102、103、104、105和/或106的一个或多个显示设备来显示数据馈送和/或实时事件。
在一些实施方式中,服务器120可以为分布式系统的服务器,或者是结合了区块链的服务器。服务器120也可以是云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机。云服务器是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(VPS,Virtual Private Server)服务中存在的管理难度大、业务扩展性弱的缺陷。
系统100还可以包括一个或多个数据库130。在某些实施例中,这些数据库可以用于存储数据和其他信息。例如,数据库130中的一个或多个可用于存储诸如音频文件和视频文件的信息。数据库130可以驻留在各种位置。例如,由服务器120使用的数据库可以在服务器120本地,或者可以远离服务器120且可以经由基于网络或专用的连接与服务器120通信。数据库130可以是不同的类型。在某些实施例中,由服务器120使用的数据库例如可以是关系数据库。这些数据库中的一个或多个可以响应于命令而存储、更新和检索到数据库以及来自数据库的数据。
在某些实施例中,数据库130中的一个或多个还可以由应用程序使用来存储应用程序数据。由应用程序使用的数据库可以是不同类型的数据库,例如键值存储库,对象存储库或由文件系统支持的常规存储库。
图1的系统100可以以各种方式配置和操作,以使得能够应用根据本公开所描述的各种方法。
下文将结合附图详细描述根据本公开实施例的基于人工智能的信息处理方法和AI智能体的各个方面。
图2示出了根据本公开一个实施例的基于人工智能的信息处理方法200的流程图。
在本公开的实施例中,人工智能方法200可以由AI智能体来执行。例如,AI智能体可以在与用户或外部环境进行交互的过程中执行基于人工智能的信息处理方法200。
如图2所示,方法200包括步骤S202、S204、S206和S208。
在步骤S202,获取待处理的输入信息。
在示例中,输入信息可以包括查询信息、请求信息、指令信息、信号信息、数据信息等。输入信息可以是用户在与AI智能体进行交互的过程中所提供的,也可以是AI智能体通过感知外部环境所获得的。在诸如智能相册管家、智能语音助手、智能座舱等应用场景中,输入信息可以包括诸如照片、视频、语音、文字、车辆的传感器数据等。另外,在输入信息中也可以包含有时间、地点、对象、情境等上下文信息。
在步骤S204,确定与输入信息的处理相关联的执行信息。执行信息包括待检索的记忆信息或待调用的工具信息中的至少一者。
在示例中,执行信息可以是指AI智能体为了对输入信息进行处理而需要额外使用、利用或借助的信息。在一种情况下,AI智能体可能确定仅需要检索记忆信息即可实现对输入信息的处理。在另一种情况下,AI智能体可能确定仅需要调用工具信息即可实现对输入信息的处理。在又另一种情况下,AI智能体可能确定既需要检索记忆信息又需要调用工具信息才可实现对输入信息的处理。
即,根据本公开实施例的AI智能体具有规划能力,以确定将要利用何种合适的执行信息来实现对输入信息的处理。
在示例中,记忆信息可以是指AI智能体所具有的记忆内容。记忆信息可以经由向量数据库的形式进行存储。另外,记忆信息也可以针对特定用户的用户画像、用户偏好等个性化内容进行维护。
即,根据本公开实施例的AI智能体还具有记忆存储能力。
在示例中,工具信息可以是指AI智能体所能够使用、接入、访问的工具的名称或类型。例如,用于进行数学运算的计算器、用于进行检索的检索引擎、用于进行数据分析的python语言等。
即,根据本公开实施例的AI智能体还具有运算能力。
在步骤S206,利用执行信息获得与输入信息的处理对应的至少一个处理结果信息。
在示例中,如果AI智能体确定需要检索记忆信息,则可以生成查询向量作为记忆检索器(Memory Retriever)的输入,以经由记忆检索器输出在AI智能体所具有的全部记忆信息中检索到的一个或多个相关的记忆信息。在此情况下,利用记忆信息获得与输入信息的处理对应的至少一个处理结果信息可以包括通过检索与输入信息有关的记忆信息获得至少一个记忆信息检索结果。
在示例中,如果AI智能体确定需要调用工具信息,则可以首先借助于轻量化的向量检索器快速地找到潜在有用的候选工具信息,然后再从候选工具信息中确定一个或多个相关的工具信息,由此从大量的工具信息中快速找到合适的工具信息。
在示例中,在调用工具信息对输入信息进行处理时,可以根据该工具信息的使用说明来填入相应的使用参数,从而实现利用该工具信息对输入信息的处理。在此情况下,利用工具信息获得与输入信息的处理对应的至少一个处理结果信息可以包括利用工具信息来完成对输入信息的处理,以获得至少一个工具信息调用结果。例如,利用计算器对用户提供的数学公式进行计算、利用python对用户提供的数据进行数据分析、利用搜索引擎对用户查询的天气进行天气预报等。
即,根据本公开实施例的AI智能体具有行动能力。在规划完成之后,AI智能体就可以开始付诸行动。在本公开的实施例中,AI智能体的规划能力和行动能力可以类似于管理学中PDCA(Plan(计划),Do(执行),Check(检查),Act(处理))循环所包含的计划和执行的概念。
在步骤S208,整合上述至少一个处理结果信息以生成用于进行反馈的输出信息。
在示例中,整合的操作可以是指对上述至少一个处理结果信息进行进一步的加工或处理,以生成对用户的反馈(例如向用户给出回复)或对外部环境的反馈(例如对外部环境做出行动或响应)。例如,整合上述至少一个处理结果信息可以包括选取上述至少一个记忆信息检索结果和/或上述至少一个工具信息调用结果中的一个或多个结果,或将上述至少一个记忆信息检索结果和/或上述至少一个工具信息调用结果合并成特定结果。在本公开的实施例中,整合的操作可以根据实际情况变化,也可以由大语言模型的底层推理能力来决定,本公开不对其进行限制。
在示例中,可以根据应用方法200的场景使输出信息符合该场景下的风格。例如,在智能家居等语音场景下,可以采用热情、友好、口语化的语言向用户进行播报。又例如,可以使输出信息呈多模态,诸如对输出的文本和图像进行穿插以形成图文并茂的效果。
根据本公开实施例的基于人工智能的信息处理方法200提供了一种简单且有效的AI智能体机制以提升AI智能体的智能化程度。在该AI智能体机制中,增设了AI智能体对记忆的检索功能以及对工具的调用功能。并且,由于AI智能体是通过如步骤S204的规划能力以及如步骤S206的行动能力作为单一发起方来发起对记忆信息和/或工具信息的使用并分别接收相应的使用结果,使得AI智能体的包含该规划能力和该行动能力在内的控制能力仅着眼于主要的控制功能层面,而不冗余地掺入记忆存储能力和/或运算能力的附加功能层面,同时还使得记忆存储能力与运算能力之间不存在通信耦合,由此实现了高内聚的模块功能设计和低耦合的通信机制设计,从而简单且有效地提升了AI智能体的智能化程度。
此外,由于根据本公开实施例的基于人工智能的信息处理方法200并未依赖于具体的或特定的应用场景进行设计,因此能够实现面向各种应用场景的通用AI智能体机制,由此还提升了AI智能体的灵活性和通用性,增强了AI智能体的可定制化程度。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
在下文中,将进一步详细描述根据本公开实施例的基于人工智能的信息处理方法的各个方面。
图3示出了根据本公开另一个实施例的基于人工智能的信息处理方法300的流程图。
如图3所示,方法300可以包括步骤S302、S304、S306、S307和S308。步骤S302、S304、S306和S308的操作可以与如图2所示的步骤S202、S204、S206和S208相同,因此不再赘述这些步骤的细节。
在步骤S302,可以获取待处理的输入信息。
在步骤S304,可以确定与输入信息的处理相关联的执行信息。执行信息包括待检索的记忆信息或待调用的工具信息中的至少一者。
在步骤S306,可以利用执行信息获得与输入信息的处理对应的至少一个处理结果信息。
在步骤S307,可以确定上述至少一个处理结果信息是否符合预设标准。在示例中,步骤S307可以基于大语言模型的底层推理能力来执行。
一方面,响应于确定上述至少一个处理结果信息符合预设标准(如图3所示的“是”),则方法300可以继续进行到步骤S308。
在步骤S308,整合上述至少一个处理结果信息以生成用于进行反馈的输出信息。
另一方面,响应于确定上述至少一个处理结果信息不符合预设标准(如图3所示的“否”),则方法300可以从步骤S307返回到步骤S306,重新利用执行信息获得与输入信息的处理对应的至少一个处理结果信息。
之后,可以在步骤S307再次确定该至少一个处理结果信息是否符合预设标准,由此使得方法300要么继续进行到步骤S308,要么再次返回到步骤S306以重复上述过程。
在示例中,当方法300应用于检索增强的场景时,AI智能体可以在搜索过程中根据搜索结果来动态地改变搜索词,以获得最符合用户意图的结果。
以此方式,根据本公开实施例的AI智能体可以具有评估能力。当AI智能体获得至少一个记忆信息检索结果和/或至少一个工具信息调用结果时,可以判断结果是否符合预期。评估能力可以确保AI智能体在处理复杂问题时不出现过大的误差累积,或者避免任务进程陷入死循环。
同时,根据本公开实施例的AI智能体还可以具有反思能力。当AI智能体判断至少一个记忆信息检索结果和/或至少一个工具信息调用结果不符合预期时,可以纠正之前利用执行信息的过程(例如,可以纠正之前在调用工具信息时填入的使用参数)以重新获得结果。
如前所述,在本公开的实施例中,AI智能体的规划能力、行动能力、评估能力和反思能力可以类似于管理学中PDCA循环所包含的计划、执行、检查和处理的概念。
因此,根据本公开实施例的基于人工智能的信息处理方法300在AI智能体的控制能力中进一步纳入了评估能力和反思能力,使得AI智能体能够通过自我评估和自我反思来提升能力上限,由此进一步提升AI智能体的智能化程度。
在一些实施例中,由于输入信息可以呈多模态,如图2所示的步骤S202或如图3所示的步骤S302可以包括将多模态的输入信息转换为统一的信息格式。
以此方式,能够使输入信息在后续的处理中得到无损地流通,由此确保了AI智能体准确进行处理操作。
图4示出了根据本公开实施例的确定与输入信息的处理相关联的执行信息的过程400的流程图。
在示例中,过程400可以对应于如图2所示的步骤S204或如图3所示的步骤S304。
如图4所示,过程400可以包括步骤S402、S404、以及S406或S408。
在步骤S402,可以基于输入信息,确定与输入信息的处理相关联的至少一个任务。
针对上述至少一个任务中的每个任务,在步骤S404,可以确定是否需要基于执行信息对该任务进行处理。
在示例中,AI智能体可以首先思考是否需要检索记忆信息和/或调用工具信息来对该任务进行处理。该过程可以基于大语言模型的底层推理能力来执行。
在一些实施例中,响应于确定需要基于执行信息对该任务进行处理,在步骤S406,可以确定与该任务对应的执行信息。该过程可以基于大语言模型的底层推理能力来执行。
在示例中,AI智能体可以在经过思考之后确定与该任务对应的执行信息是包括记忆信息、工具信息还是记忆信息与工具信息二者。如果AI智能体确定执行信息包括工具信息,则可以进一步确定需要何种合适的工具信息来对该任务进行处理。
以此方式,当AI智能体面对复杂问题时(例如无法在短时间内得到答案时),可以将复杂问题进行分解以通过一系列任务或子任务来解决该复杂问题。即,AI智能体可以具有对复杂问题进行分解的能力。同时,AI智能体还可以通过思考来确定适用于该一系列任务的执行信息,由此对该一系列任务的处理进行全面的规划。进而,AI智能体的智能化程度能够得到进一步提升。
在一些实施例中,响应于确定不需要基于执行信息对该任务进行处理,在步骤S408,可以生成对该任务进行处理得到的中间输出信息。该过程可以基于大语言模型的底层推理能力来执行。
在示例中,中间输出信息可以包括对用户的反馈(例如向用户给出回复),或对外部环境的反馈(例如对外部环境做出行动或响应)。可以理解的是,由于中间输出信息是针对一系列任务中的某个任务而言的,因而被称为“中间”输出信息,而区别于如图2所示的步骤S208或如图3所示的步骤S308中针对输入信息而言的输出信息。
以此方式,当AI智能体确定某个任务不需要借助于额外的执行信息即可进行处理时,可以直接生成用于进行反馈的中间输出信息,由此使得AI智能体的规划能力和行动能力更灵活及连贯。
在一些实施例中,如果在如图3所示的方法300中的步骤S307中确定上述至少一个处理结果信息不符合预设标准,则方法300也可以进行到过程400中的步骤S402,从而重新确定与输入信息的处理相关联的至少一个任务。
以此方式,AI智能体可以通过重新进行任务分解来确定之前的一系列任务中存在问题的任务,由此退回到正确的任务,避免进入错误的求解路径。
如前所述,根据本公开实施例的AI智能体还可以具有记忆存储能力,使得相应的记忆信息得以进行保存。
在一些实施例中,记忆信息可以包括工作记忆信息。工作记忆信息可以被配置为与当前正在被处理的任务相关联。
在示例中,如前所述,AI智能体可以将复杂问题进行分解以通过一系列任务来解决该复杂问题。在某个任务当前正在被处理时,AI智能体需要无损地保存这些与“当下”紧密相关的记忆,从而保证高质量地完成当下的任务。
在示例中,当AI智能体与用户或外部环境交互时,可以持续地产生行动日志。例如,当AI智能体接收到用户的追问时,需要清楚地记得用户的上一个问题与答复的具体细节,才能给出前后连贯、逻辑通顺的答复。因此,工作记忆信息可以通过行动日志的方式被保存。
因此,工作记忆信息的机制可以确保AI智能体在处理当下任务时所需的实时记忆内容,为AI智能体进行当下任务的处理提供保障。
在一些实施例中,工作记忆信息还可以被配置为与上述至少一个任务中的每个任务的处理状态相关联。
在示例中,AI智能体在执行一系列任务时,需要清楚地记得哪些任务已经执行,哪些任务还没有执行,从而完整地执行所有的一系列任务。因此,AI智能体还需要保存与任务的处理状态相关联的记忆。
因此,工作记忆信息的机制还可以确保AI智能体解决复杂问题的连贯性和完整性,为AI智能体解决复杂问题提供保障。
在一些实施例中,记忆信息可以包括事件记忆信息。事件记忆信息可以被配置为与历史事件相关联。
在示例中,事件记忆信息可以是AI智能体通过对一系列与“事件”有关的工作记忆信息进行抽象而生成的(例如,当AI智能体完成某些连续的任务后,或与用户完成一个话题的讨论后)。事件可以包括起因、经过和结果。因此,事件记忆信息可以包括AI智能体对与该事件有关的工作记忆信息形成的摘要。
在示例中,事件记忆信息可以被长期保存在向量数据库中。当AI智能体认为需要回忆某个历史事件时,可以通过调用记忆检索器(Memory Retriever)找出相关的历史事件并用于任务的处理。例如,事件可以被编码成查询向量,在查询时通过计算该查询向量与向量数据库中的向量的相似度来获得用户查询的事件。
因此,事件记忆信息的机制可以延续AI智能体对已经处理过的任务的记忆,以使得AI智能体能够形成与之相关的经验,进一步提升智能化的程度。
在一些实施例中,记忆信息可以包括角色记忆信息。角色记忆信息可以被配置为与应用本公开实施例方法的场景相关联,以使得生成的输出信息符合该场景下的风格。
在示例中,在不同的应用场景下,AI智能体可以具有不同的“人设”。角色记忆信息可以决定AI智能体对“自我”的认知,并影响其在不同场景下的行为和交流方式。例如,在电商推荐的应用场景下,AI智能体的人设可以是大方、活泼的;在情感陪伴的应用场景下,AI智能体的人设可以是共情、温柔的;在法律援助的应用场景下,AI智能体的人设可以是严肃、专业的。相应地,AI智能体可以基于这些不同的“人设”向用户给出回复,使得回复给用户的输出信息符合当下的风格。
因此,角色记忆信息的机制不仅可以让AI智能体根据不同的应用场景调整其表现形式,还可以使其更好地满足用户需求,从而与用户建立深度联系。
在一些实施例中,记忆信息可以包括认知记忆信息。认知记忆信息可以被配置为与应用本公开实施例方法的用户相关联,以使得生成的输出信息符合用户的用户画像。
在示例中,当积累的事件足够多时,AI智能体可以从中抽象出对环境或用户的高级认知,甚至形成AI智能体独有的性格或情感,以形成认知记忆信息。例如,AI智能体在与用户交互的过程中,如果多个事件均表明用户对某些话题明显具有更强的兴趣偏好,则AI智能体可以从中提炼出一个独特的用户画像并形成长期记忆,以便在后续的交互中更好地满足该用户的兴趣和习惯,从而变得越来越“懂”用户。
因此,认知记忆信息的机制可以促使AI智能体充分发挥归纳及推理能力,从而进一步提升智能化的程度。
如前所述,根据本公开实施例的AI智能体还可以具有运算能力。运算能力可以借助于对工具信息的使用而得以实现。
在一些实施例中,工具信息可以包括:插件工具、函数工具、接口工具或模型工具中的至少一者。
在示例中,计算器可以是插件工具的一种,检索引擎可以是接口工具的一种,python语言可以是函数工具的一种,大语言模型可以是模型工具的一种。
在示例中,AI智能体本身也可以作为模型工具,由另一个AI智能体进行调用。由此,可以形成一个多智能体协作的拓扑结构,从而产生群体智能。
因此,AI智能体可以借助于对各种类型的工具信息的使用而具有运算能力,从而进一步提升AI智能体的智能化程度。
在一些实施例中,工具信息可以包括统一的工具描述规范。
在示例中,工具描述规范规定了开发者和维护者应如何定义工具信息的功能、使用方法和返回格式。
通过针对各种不同类型的工具信息约定统一的工具描述规范,可以避免出现调用错误或调用失败的问题,从而为AI智能体的控制能力与运算能力之间的耦合提供了高效且稳定的通信。
在一些实施例中,本公开实施例的基于人工智能的信息处理方法(如图2所示的方法200或如图3所示的方法300)可以基于大语言模型的推理能力执行。
在示例中,步骤S204、S304中的确定与输入信息的处理相关联的执行信息的步骤(即,规划能力)、步骤S206、S306中的利用执行信息获得与输入信息的处理对应的至少一个处理结果信息的步骤(即,行动能力)、步骤S307中的确定至少一个处理结果信息是否符合预设标准的步骤(即,评估能力),以及当AI智能体判断至少一个记忆信息检索结果和/或至少一个工具信息调用结果不符合预期时纠正之前利用执行信息的过程以重新获得结果的步骤(即,反思能力),可以基于大语言模型的底层推理实现。
在示例中,如图4所示的过程400中的步骤S402、S404、S406也可以基于大语言模型的底层推理实现。
因此,本公开实施例的AI智能体在执行基于人工智能的信息处理方法时可以在大语言模型的语言理解与生成能力的基础上,进一步释放大语言模型所蕴含的机器智能,由此实现更为复杂的决策并解决更为复杂的问题。
本公开的实施例还提供了一种AI智能体,被配置为执行如上所述的基于人工智能的信息处理方法。
根据本公开实施例的AI智能体的智能体机制全面地覆盖了业界对AI智能体公认的能力定义,并且模块内部功能高度统一,模块间职责划分清晰,通信机制简单有效。
另外,根据本公开实施例的AI智能体的智能体机制并未依赖于具体的应用场景来设计,而是一种适用于各种环境的通用智能体机制,因此应用场景广泛,灵活度高,可定制程度强。
同时,根据本公开实施例的AI智能体的智能体机制将评估能力和反思能力纳入了控制能力中,由此提升了AI智能体的能力上限。另外,还同时提出了认知记忆的概念,充分发挥了AI智能体的归纳推理能力。
图5示出了根据本公开实施例的AI智能体500的示意图。
在本公开的实施例中,受到现代计算机理论中冯·诺依曼结构的启发,如图5所示,AI智能体500可以包括五个核心模块:输入模块510、控制模块520、存储模块530、运算模块540、输出模块550。
输入模块510负责接收或感知来自外界(例如用户或外部环境)的查询、请求、指令、信号或数据等信息,并将其转换为AI智能体500能够理解和处理的格式。输入模块510是AI智能体500与外界进行交互的首要环节,它使得AI智能体500能够高效、准确地从外界获取必要的“感官”信息,并对这些信息做出响应。
在示例中,输入模块510可以执行如图2所示的方法200中的步骤S202、或如图3所示的方法300中的步骤S302。
控制模块520是AI智能体500处理复杂任务能力的核心支撑。控制模块520的控制能力可以包括如下四个方面:规划能力、行动能力、评估能力和反思能力。
在示例中,以图2所示的方法200和图3所示的方法300为例,规划能力可以对应于步骤S204或步骤S304。行动能力可以对应于步骤S206或步骤S306。评估能力可以对应于步骤S307。反思能力可以对应于方法300中在确定至少一个处理结果信息不符合预设标准的情况下从步骤S307返回到步骤S306以重新利用执行信息获得与输入信息的处理对应的至少一个处理结果信息的步骤。
在示例中,控制模块520在运行过程中将会不断地与存储模块530、运算模块540和/或输出模块550进行交互。然而,注意的是,在本公开的实施例中,控制模块520作为单一发起方来发起对存储模块530、运算模块540和/或输出模块550的通信,而存储模块530、运算模块540、输出模块550之间没有通信耦合。
在示例中,控制模块520的性能可以与AI智能体500所基于的大语言模型息息相关。为了充分发挥大语言模型的能力,控制模块520的内部结构可以被设计成高度可配置、可扩展的,以便应对真实场景下各种不同类型的任务和需求。
存储模块530可以负责对历史对话、事件流等信息进行记忆。如前所述的角色记忆信息、工作记忆信息、事件记忆信息、认知记忆信息可以被包括在存储模块530中。
在示例中,AI智能体500在获取输入信息后,可以确定与该输入信息的处理相关联的执行信息。在执行信息包括记忆信息的情况下,AI智能体500可以从存储模块530中检索相关的记忆信息,并将其反馈给控制模块520。然后,控制模块520可以利用反馈回的记忆信息,获得与输入信息的处理对应的至少一个处理结果信息,并将该至少一个处理结果信息传递给输出模块550。
运算模块540可以被看作是一个预定义的工具库。如前所述的插件工具、函数工具、接口工具和模型工具可以被包括在运算模块540中。
在示例中,在AI智能体500确定执行信息包括工具信息的情况下,可以从运算模块540中调用相关的工具信息,并将其反馈给控制模块520。然后,控制模块520可以利用反馈回的工具信息,获得与输入信息的处理对应的至少一个处理结果信息,并将该至少一个处理结果信息传递给输出模块550。可以理解,虽然大语言模型有着优异的语言理解与生成能力,但它与人一样,不借助任何工具,能够解决的任务是很有限的。当AI智能体500被赋予工具调用的能力后,就可以实现诸如借助计算器完成数学运算、借助python完成数据分析、借助搜索引擎完成天气预报的任务。
在示例中,输出模块550可以执行如图2所示的方法200中的步骤S208、或如图3所示的方法300中的步骤S308。
根据本公开实施例的AI智能体500可以简单且有效地提升智能化程度,并提升灵活性和通用性。
根据本公开的实施例,还提供了一种基于人工智能的信息处理装置。
图6示出了根据本公开一个实施例的基于人工智能的信息处理装置600的结构框图。
如图6所示,装置600包括输入单元602、规划单元604、行动单元606和输出单元608。
输入单元602被配置为获取待处理的输入信息。
规划单元604被配置为确定与输入信息的处理相关联的执行信息。执行信息包括待检索的记忆信息或待调用的工具信息中的至少一者。
行动单元606被配置为利用执行信息获得与输入信息的处理对应的至少一个处理结果信息。
输出单元608被配置为整合至少一个处理结果信息以生成用于进行反馈的输出信息。
输入单元602、规划单元604、行动单元606和输出单元608的操作可以分别对应于如图2所示的步骤S202、S204、S206和S208。因此,这里不再赘述其各个方面的细节。
图7示出了根据本公开另一个实施例的基于人工智能的信息处理装置700的结构框图。
如图7所示,装置700可以包括输入单元702、规划单元704、行动单元706和输出单元708。输入单元702、规划单元704、行动单元706和输出单元708的操作可以与如图6所示的输入单元602、规划单元604、行动单元606和输出单元608相同。
在一些实施例中,装置700还可以包括:评估单元705,可以被配置为确定至少一个处理结果信息是否符合预设标准;以及反思单元707,可以被配置为响应于确定至少一个处理结果信息不符合预设标准,指示行动单元706重新利用执行信息获得与输入信息的处理对应的至少一个处理结果信息。
在一些实施例中,输入信息可以呈多模态。输入单元702可以包括:转换单元7020,被配置为将多模态的输入信息转换为统一的信息格式。
在一些实施例中,规划单元704可以包括:分解单元7040,可以被配置为基于输入信息,确定与输入信息的处理相关联的至少一个任务;以及思考单元7042,可以被配置为针对至少一个任务中的每个任务:确定是否需要基于执行信息对任务进行处理;以及响应于确定需要基于执行信息对任务进行处理,确定与任务对应的执行信息。
在一些实施例中,思考单元7042还可以被配置为:响应于确定不需要基于执行信息对任务进行处理,生成对任务进行处理得到的中间输出信息。
在一些实施例中,反思单元707还可以被配置为响应于确定至少一个处理结果信息不符合预设标准,指示分解单元7040以重新基于输入信息,确定与输入信息的处理相关联的至少一个任务。
在一些实施例中,记忆信息可以包括工作记忆信息,工作记忆信息被配置为与当前正在被处理的任务相关联。
在一些实施例中,工作记忆信息还可以被配置为与至少一个任务中的每个任务的处理状态相关联。
在一些实施例中,记忆信息可以包括事件记忆信息,事件记忆信息被配置为与历史事件相关联。
在一些实施例中,记忆信息可以包括角色记忆信息,角色记忆信息被配置为与应用装置700的场景相关联,以使得生成的输出信息符合场景下的风格。
在一些实施例中,记忆信息可以包括认知记忆信息,认知记忆信息被配置为与应用装置700的用户相关联,以使得生成的输出信息符合用户的用户画像。
在一些实施例中,工具信息可以包括:插件工具、函数工具、接口工具或模型工具中的至少一者。
在一些实施例中,工具信息可以包括统一的工具描述规范。
在一些实施例中,装置700可以基于大语言模型的推理能力执行。
根据本公开的实施例,还提供了一种电子设备,包括至少一个处理器;以及与至少一个处理器通信连接的存储器,其中,存储器存储有能够被至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
根据本公开的实施例,还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如上所述的方法。
根据本公开的实施例,还提供了一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时实现如上所述的方法。
参考图8,现将描述可以作为本公开的服务器或客户端的电子设备800的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,电子设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储电子设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
电子设备800中的多个部件连接至I/O接口805,包括:输入单元806、输出单元807、存储单元808以及通信单元809。输入单元806可以是能向电子设备800输入信息的任何类型的设备,输入单元806可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入,并且可以包括但不限于鼠标、键盘、触摸屏、轨迹板、轨迹球、操作杆、麦克风和/或遥控器。输出单元807可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元808可以包括但不限于磁盘、光盘。通信单元809允许电子设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙设备、802.11设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理。例如,在一些实施例中,该方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到电子设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行上文描述的方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行、也可以顺序地或以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
虽然已经参照附图描述了本公开的实施例或示例,但应理解,上述的方法、系统和设备仅仅是示例性的实施例或示例,本发明的范围并不由这些实施例或示例限制,而是仅由授权后的权利要求书及其等同范围来限定。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述的很多要素可以由本公开之后出现的等同要素进行替换。
Claims (32)
1.一种基于人工智能的信息处理方法,包括:
获取待处理的输入信息;
确定与所述输入信息的处理相关联的执行信息,所述执行信息包括待检索的记忆信息或待调用的工具信息中的至少一者;
利用所述执行信息获得与所述输入信息的处理对应的至少一个处理结果信息;以及
整合所述至少一个处理结果信息以生成用于进行反馈的输出信息。
2.根据权利要求1所述的方法,还包括:
确定所述至少一个处理结果信息是否符合预设标准;以及
响应于确定所述至少一个处理结果信息不符合所述预设标准,重新利用所述执行信息获得与所述输入信息的处理对应的至少一个处理结果信息。
3.根据权利要求1或2所述的方法,其中,所述输入信息呈多模态,并且所述获取待处理的输入信息,包括:将多模态的所述输入信息转换为统一的信息格式。
4.根据权利要求2或3所述的方法,其中,所述确定与所述输入信息的处理相关联的执行信息,包括:
基于所述输入信息,确定与所述输入信息的处理相关联的至少一个任务;以及
针对所述至少一个任务中的每个任务:
确定是否需要基于所述执行信息对所述任务进行处理;以及
响应于确定需要基于所述执行信息对所述任务进行处理,确定与所述任务对应的所述执行信息。
5.根据权利要求4所述的方法,其中,响应于确定不需要基于所述执行信息对所述任务进行处理,生成对所述任务进行处理得到的中间输出信息。
6.根据权利要求4或5所述的方法,还包括:
响应于确定所述至少一个处理结果信息不符合所述预设标准,重新确定与所述输入信息的处理相关联的至少一个任务。
7.根据权利要求4至6中任一项所述的方法,其中,所述记忆信息包括工作记忆信息,所述工作记忆信息被配置为与当前正在被处理的所述任务相关联。
8.根据权利要求7所述的方法,其中,所述工作记忆信息还被配置为与所述至少一个任务中的每个任务的处理状态相关联。
9.根据权利要求1至8中任一项所述的方法,其中,所述记忆信息包括事件记忆信息,所述事件记忆信息被配置为与历史事件相关联。
10.根据权利要求1至9中任一项所述的方法,其中,所述记忆信息包括角色记忆信息,所述角色记忆信息被配置为与应用所述方法的场景相关联,以使得生成的所述输出信息符合所述场景下的风格。
11.根据权利要求1至10中任一项所述的方法,其中,所述记忆信息包括认知记忆信息,所述认知记忆信息被配置为与应用所述方法的用户相关联,以使得生成的所述输出信息符合所述用户的用户画像。
12.根据权利要求1至11中任一项所述的方法,其中,所述工具信息包括:插件工具、函数工具、接口工具或模型工具中的至少一者。
13.根据权利要求12所述的方法,其中,所述工具信息包括统一的工具描述规范。
14.根据权利要求1至13中任一项所述的方法,其中,所述方法基于大语言模型的推理能力执行。
15.一种人工智能的智能体,被配置为执行根据权利要求1至14中任一项所述的方法。
16.一种基于人工智能的信息处理装置,包括:
输入单元,被配置为获取待处理的输入信息;
规划单元,被配置为确定与所述输入信息的处理相关联的执行信息,所述执行信息包括待检索的记忆信息或待调用的工具信息中的至少一者;
行动单元,被配置为利用所述执行信息获得与所述输入信息的处理对应的至少一个处理结果信息;以及
输出单元,被配置为整合所述至少一个处理结果信息以生成用于进行反馈的输出信息。
17.根据权利要求16所述的装置,还包括:
评估单元,被配置为确定所述至少一个处理结果信息是否符合预设标准;以及
反思单元,被配置为响应于确定所述至少一个处理结果信息不符合所述预设标准,指示所述行动单元重新利用所述执行信息获得与所述输入信息的处理对应的至少一个处理结果信息。
18.根据权利要求16或17所述的装置,其中,所述输入信息呈多模态,并且所述输入单元包括:转换单元,被配置为将多模态的所述输入信息转换为统一的信息格式。
19.根据权利要求17或18所述的装置,其中,所述规划单元包括:
分解单元,被配置为基于所述输入信息,确定与所述输入信息的处理相关联的至少一个任务;以及
思考单元,被配置为针对所述至少一个任务中的每个任务:
确定是否需要基于所述执行信息对所述任务进行处理;以及
响应于确定需要基于所述执行信息对所述任务进行处理,确定与所述任务对应的所述执行信息。
20.根据权利要求19所述的装置,其中,所述思考单元还被配置为:
响应于确定不需要基于所述执行信息对所述任务进行处理,生成对所述任务进行处理得到的中间输出信息。
21.根据权利要求19或20所述的装置,其中,所述反思单元还被配置为响应于确定所述至少一个处理结果信息不符合所述预设标准,指示所述分解单元以重新基于所述输入信息,确定与所述输入信息的处理相关联的至少一个任务。
22.根据权利要求19至21中任一项所述的装置,其中,所述记忆信息包括工作记忆信息,所述工作记忆信息被配置为与当前正在被处理的所述任务相关联。
23.根据权利要求22所述的装置,其中,所述工作记忆信息还被配置为与所述至少一个任务中的每个任务的处理状态相关联。
24.根据权利要求16至23中任一项所述的装置,其中,所述记忆信息包括事件记忆信息,所述事件记忆信息被配置为与历史事件相关联。
25.根据权利要求16至24中任一项所述的装置,其中,所述记忆信息包括角色记忆信息,所述角色记忆信息被配置为与应用所述装置的场景相关联,以使得生成的所述输出信息符合所述场景下的风格。
26.根据权利要求16至25中任一项所述的装置,其中,所述记忆信息包括认知记忆信息,所述认知记忆信息被配置为与应用所述装置的用户相关联,以使得生成的所述输出信息符合所述用户的用户画像。
27.根据权利要求16至26中任一项所述的装置,其中,所述工具信息包括:插件工具、函数工具、接口工具或模型工具中的至少一者。
28.根据权利要求27所述的装置,其中,所述工具信息包括统一的工具描述规范。
29.根据权利要求16至28中任一项所述的装置,其中,所述装置基于大语言模型的推理能力执行。
30.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有能够被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行根据权利要求1-14中任一项所述的方法。
31.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-14中任一项所述的方法。
32.一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现根据权利要求1-14中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311763568.4A CN117743542A (zh) | 2023-12-20 | 2023-12-20 | 基于人工智能的信息处理方法、装置、电子设备及智能体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311763568.4A CN117743542A (zh) | 2023-12-20 | 2023-12-20 | 基于人工智能的信息处理方法、装置、电子设备及智能体 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117743542A true CN117743542A (zh) | 2024-03-22 |
Family
ID=90280906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311763568.4A Pending CN117743542A (zh) | 2023-12-20 | 2023-12-20 | 基于人工智能的信息处理方法、装置、电子设备及智能体 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117743542A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118071125A (zh) * | 2024-04-22 | 2024-05-24 | 北京海致科技集团有限公司 | 基于警务大模型的任务处理方法、装置、设备及介质 |
-
2023
- 2023-12-20 CN CN202311763568.4A patent/CN117743542A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118071125A (zh) * | 2024-04-22 | 2024-05-24 | 北京海致科技集团有限公司 | 基于警务大模型的任务处理方法、装置、设备及介质 |
CN118071125B (zh) * | 2024-04-22 | 2024-11-01 | 北京海致科技集团有限公司 | 基于警务大模型的任务处理方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114612749B (zh) | 神经网络模型训练方法及装置、电子设备和介质 | |
CN112579909A (zh) | 对象推荐方法及装置、计算机设备和介质 | |
US20230052389A1 (en) | Human-object interaction detection | |
US20230047628A1 (en) | Human-object interaction detection | |
CN114004985B (zh) | 人物交互检测方法、神经网络及其训练方法、设备和介质 | |
CN116541536B (zh) | 知识增强的内容生成系统、数据生成方法、设备和介质 | |
CN117743542A (zh) | 基于人工智能的信息处理方法、装置、电子设备及智能体 | |
US20240104154A1 (en) | Ranking of recall data | |
CN115601555A (zh) | 图像处理方法及装置、设备和介质 | |
CN116841506B (zh) | 程序代码生成方法及装置、模型训练方法及装置 | |
CN116450917B (zh) | 信息搜索方法及装置、电子设备和介质 | |
CN116306862B (zh) | 用于文本处理神经网络的训练方法、装置和介质 | |
CN114881170B (zh) | 用于对话任务的神经网络的训练方法和对话任务处理方法 | |
CN116205819B (zh) | 字符图像生成方法、深度学习模型的训练方法和装置 | |
CN115690544B (zh) | 多任务学习方法及装置、电子设备和介质 | |
CN117351330A (zh) | 图像处理方法、图像处理模型的训练方法、装置和设备 | |
CN112860681B (zh) | 数据清洗方法及装置、计算机设备和介质 | |
CN115170887A (zh) | 目标检测模型训练方法、目标检测方法及其装置 | |
CN116842156B (zh) | 数据生成方法及装置、设备和介质 | |
CN115578451B (zh) | 图像处理方法、图像处理模型的训练方法和装置 | |
CN117218297B (zh) | 人体重建参数生成方法、装置、设备和介质 | |
CN115713071B (zh) | 用于处理文本的神经网络的训练方法和处理文本的方法 | |
CN118643086A (zh) | 基于大模型的数据处理方法及装置、电子设备和介质 | |
EP4113398A2 (en) | Data labeling processing method and apparatus, electronic device and medium | |
CN117273107A (zh) | 文本生成模型的训练方法和训练装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |