CN117725414A

CN117725414A - 训练内容生成模型方法、确定输出内容方法、装置及设备

Info

Publication number: CN117725414A
Application number: CN202311714112.9A
Authority: CN
Inventors: 张阳; 杨俊伟; 胡伯良
Original assignee: Beijing Haitai Fangyuan High Technology Co Ltd
Current assignee: Beijing Haitai Fangyuan High Technology Co Ltd
Priority date: 2023-12-13
Filing date: 2023-12-13
Publication date: 2024-03-19
Anticipated expiration: 2043-12-13
Also published as: CN117725414B

Abstract

本申请公开了一种训练内容生成模型的方法、确定内容生成模型输出内容的方法、装置、设备及介质，用以提高内容生成模型的输出内容的多样化、个性化及可辨识性，提高用户体验。在本申请实施例中，可以针对获取到的任一普适样本输入语料，确定预先采集的对应目标用户的个性化样本输入语料集中，与普适样本输入语料匹配的目标个性化样本输入语料；将普适样本输入语料与目标个性化样本输入语料进行融合，生成用于训练内容生成模型的训练输入，基于训练输入以及对应目标个性化样本输入语料的个性化样本输出内容，对内容生成模型进行训练，基于此，可以实现提高内容生成模型的输出内容的多样化、个性化及可辨识性，提高用户体验的目的。

Description

训练内容生成模型方法、确定输出内容方法、装置及设备

技术领域

本申请涉及数据处理技术领域，尤其涉及一种训练内容生成模型的方法、确定内容生成模型的输出内容的方法、装置、设备及介质。

背景技术

以内容生成模型为问答模型为例，由于内容生成模型可以将用户所提出的问题转化为机器可理解的格式，实现自动智能地回答用户所提出的问题，在诸多领域得到了广泛的应用。然而，相关技术中，对于不同个性的用户所提出的相同问题，内容生成模型通常会提供内容接近、甚至完全相同的答案(输出内容)，导致内容生成模型的输出内容较为单一，用户体验较低。

因此，亟需一种可以提高内容生成模型的输出内容的多样化、个性化及可辨识性，提高用户体验的技术方案。

发明内容

本申请实施例提供了一种训练内容生成模型的方法、确定内容生成模型的输出内容的方法、装置、设备及介质，用以提高内容生成模型的输出内容的多样化、个性化及可辨识性，提高用户体验。

第一方面，本申请提供了一种训练内容生成模型的方法，所述方法包括：

针对获取到的任一普适样本输入语料，确定预先采集的对应目标用户的个性化样本输入语料集中，与所述普适样本输入语料匹配的目标个性化样本输入语料；

将所述普适样本输入语料与所述目标个性化样本输入语料进行融合，生成用于训练内容生成模型的训练输入；

基于所述训练输入以及对应所述目标个性化样本输入语料的个性化样本输出内容，对所述内容生成模型进行训练。

由于本申请实施例可以将普适样本输入语料与能够反映目标用户的个性化特征的目标个性化样本输入语料进行融合，生成用于训练内容生成模型的训练输入，基于该训练输入以及能够反映目标用户的个性化特征、提高输出内容的多样化及可辨识性的个性化样本输出内容，对内容生成模型进行训练，用基于该方式训练完成的内容生成模型确定用户输入语料对应的输出内容时，可以最大程度的保证内容生成模型所提供的输出内容能够反映用户个性化特征、满足用户个性化需求，可以最大程度的提高输出内容的多样性以及可辨识性，从而实现提高内容生成模型的输出内容的多样化、个性化及可辨识性，提高用户体验的目的。

在一种可能的实施方式中，所述确定预先采集的对应目标用户的个性化样本输入语料集中，与所述普适样本输入语料匹配的目标个性化样本输入语料，包括：

基于预先训练完成的语言模型，确定所述普适样本输入语料的第一向量，并确定所述个性化样本输入语料集中每个样本输入语料的第二向量；

确定所述第一向量与每个所述第二向量之间的向量相似度；

基于所述向量相似度，确定与所述普适样本输入语料匹配的目标个性化样本输入语料。

由于本申请实施例可以基于普适样本输入语料的第一向量与每个样本输入语料的第二向量之间的向量相似度，来确定与普适样本输入语料匹配的目标个性化样本输入语料，从而可以提高确定的目标个性化样本输入语料的准确性。

在一种可能的实施方式中，所述基于所述向量相似度，确定与所述普适样本输入语料匹配的目标个性化样本输入语料，包括：

将向量相似度高于设定相似度阈值的各第二向量，分别确定为候选向量；从各候选向量中选取一个目标向量，将所述目标向量对应的个性化样本输入语料，确定为与所述普适样本输入语料匹配的目标个性化样本输入语料。

由于本申请实施例可以从向量相似度高于设定相似度阈值的各第二向量(候选向量)中选取一个目标向量，不仅可以保证目标向量与普适样本输入语料的第一向量之间的向量相似度，保证基于将目标向量对应的个性化样本输入语料，确定为与所述普适样本输入语料匹配的目标个性化样本输入语料时，确定的目标个性化样本输入语料的准确性，同时还可以提高效率。

在一种可能的实施方式中，所述将所述普适样本输入语料与所述目标个性化样本输入语料进行融合，生成用于训练内容生成模型的训练输入，包括：

将获得的所述普适样本输入语料的普适样本向量与所述目标个性化样本输入语料的个性化样本向量进行拼接，基于拼接生成的向量，确定所述训练输入。

本申请实施例可以通过将普适样本输入语料的普适样本向量与目标个性化样本输入语料的个性化样本向量进行拼接的方式，来快捷的将普适样本输入语料与目标个性化样本输入语料融合为一个语料，生成用于训练内容生成模型的训练输入，可以方便快捷的提高内容生成模型的输出内容的多样化、个性化及可辨识性。

获得普适样本输入语料对应的第一预设权重以及目标个性化样本输入语料对应的第二预设权重；

确定获得的所述普适样本输入语料的普适样本向量与所述第一预设权重的第一加权值、以及所述目标个性化样本输入语料的个性化样本向量与所述第二预设权重的第二加权值；

基于所述第一加权值以及所述第二加权值，确定所述训练输入。

本申请实施例可以通过配置普适样本输入语料的第一预设权重和目标个性化样本输入语料的第二预设权重，来提高对普适样本输入语料与目标个性化样本输入语料融合过程的灵活性，基于该方式融合生成的语料对内容生成模型进行训练时，可以提高内容生成模型的输出内容的多样化、个性化、可辨识性及准确性。

在一种可能的实施方式中，获得所述普适样本向量的过程包括：

将基于预先训练完成的语言模型确定的所述普适样本输入语料的第一向量，确定为所述普适样本向量；或者，

对所述普适样本输入语料进行切分，获得所述普适样本输入语料的第一目标编码，基于所述第一目标编码的向量，获得所述普适样本向量，其中，所述第一目标编码包括所述普适样本输入语料的词编码、位置编码以及分段编码。

本申请实施例可以基于语言模型来确定普适样本向量，或者通过对普适样本输入语料进行切分来获得普适样本输入语料的第一目标编码，基于第一目标编码的向量来获得普适样本向量，从而可以快捷准确的确定普适样本输入语料的普适样本向量。

在一种可能的实施方式中，获得所述个性化样本向量的过程包括：

将基于预先训练完成的语言模型确定的所述个性化样本输入语料的第二向量，确定为所述个性化样本向量；或者，

对所述个性化样本输入语料进行切分，获得所述个性化样本输入语料的第二目标编码，基于所述第二目标编码的向量，获得所述个性化样本向量，其中，所述第二目标编码包括所述个性化样本输入语料的词编码、位置编码以及分段编码。

本申请实施例可以基于语言模型来确定个性化样本向量，或者通过对个性化样本输入语料进行切分来获得个性化样本输入语料的第二目标编码，基于第二目标编码的向量来获得个性化样本向量，从而可以快捷准确的确定个性化样本输入语料的个性化样本向量。

第二方面，本申请提供了一种确定内容生成模型的输出内容的方法，所述方法包括：

若接收到用户输入语料，识别目标用户标识；

确定预先采集的对应所述目标用户标识的个性化输入语料集中，与所述用户输入语料匹配的目标个性化输入语料；

将所述用户输入语料与所述目标个性化输入语料进行融合，基于融合生成的目标输入以及基于第一方面任一所述的方法训练得到的内容生成模型，确定目标输出内容。

第三方面，本申请提供了一种训练内容生成模型的装置，所述装置包括：

确定模块，用于针对获取到的任一普适样本输入语料，确定预先采集的对应目标用户的个性化样本输入语料集中，与所述普适样本输入语料匹配的目标个性化样本输入语料；

生成模块，用于将所述普适样本输入语料与所述目标个性化样本输入语料进行融合，生成用于训练内容生成模型的训练输入；

训练模块，用于基于所述训练输入以及对应所述目标个性化样本输入语料的个性化样本输出内容，对所述内容生成模型进行训练。

在一种可能的实施方式中，所述确定模块，具体用于：

确定所述第一向量与每个所述第二向量之间的向量相似度；

在一种可能的实施方式中，所述确定模块，具体用于：

将向量相似度高于设定相似度阈值的各第二向量，分别确定为候选向量；

从各候选向量中选取一个目标向量，将所述目标向量对应的个性化样本输入语料，确定为与所述普适样本输入语料匹配的目标个性化样本输入语料。

在一种可能的实施方式中，所述生成模块，具体用于：

第四方面，本申请提供了一种基于内容生成模型确定输出内容的装置，所述装置包括：

接收模块，用于若接收到用户输入语料，识别目标用户标识；

匹配模块，用于确定预先采集的对应所述目标用户标识的个性化输入语料中，与所述用户输入语料匹配的目标个性化输入语料；

输出模块，用于将所述用户输入语料与所述目标个性化输入语料进行融合，基于融合生成的目标输入以及基于第一方面任一所述的方法训练得到的内容生成模型，确定目标输出内容。

第五方面，本申请提供了一种电子设备，所述电子设备至少包括处理器和存储器，所述处理器用于执行存储器中存储的计算机程序时实现如第一方面和第二方面任一所述方法的步骤。

第六方面，本申请提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面和第二方面任一所述方法的步骤。

在本申请实施例中，可以针对获取到的任一普适样本输入语料，确定预先采集的对应目标用户的个性化样本输入语料集中，与普适样本输入语料匹配的目标个性化样本输入语料；将普适样本输入语料与目标个性化样本输入语料进行融合，生成用于训练内容生成模型的训练输入，基于训练输入以及对应目标个性化样本输入语料的个性化样本输出内容，对内容生成模型进行训练。由于本申请实施例可以将普适样本输入语料与能够反映目标用户的个性化特征的目标个性化样本输入语料进行融合，生成用于训练内容生成模型的训练输入，基于该训练输入以及能够反映目标用户的个性化特征、提高输出内容的多样化及可辨识性的个性化样本输出内容，对内容生成模型进行训练，用基于该方式训练完成的内容生成模型确定用户输入语料对应的输出内容时，可以最大程度的保证内容生成模型所提供的输出内容能够反映用户个性化特征、满足用户个性化需求，可以最大程度的提高输出内容的多样性以及可辨识性，从而实现提高内容生成模型的输出内容的多样化、个性化及可辨识性，提高用户体验的目的。

附图说明

为了更清楚地说明本申请实施例或相关技术中的实施方式，下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的第一种训练内容生成模型的过程示意图；

图2为本申请实施例提供的第二种训练内容生成模型的过程示意图；

图3为本申请实施例提供的第三种训练内容生成模型的过程示意图；

图4为本申请实施例提供的一种确定内容生成模型的输出内容的过程示意图；

图5为本申请实施例提供的一种训练内容生成模型的装置示意图；

图6为本申请实施例提供的一种确定内容生成模型的输出内容的装置示意图；

图7为本申请实施例提供的一种电子设备结构示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似或同类的对象或实体，而不必然意味着限定特定的顺序或先后次序，除非另外注明。应该理解这样使用的用语在适当情况下可以互换。

为了提高内容生成模型的输出内容的多样化、个性化及可辨识性，提高用户体验，本申请实施例提供了一种训练内容生成模型的方法、确定内容生成模型的输出内容的方法、装置、设备及介质。

实施例1：

图1为本申请实施例提供的一种训练内容生成模型的过程示意图，该过程包括以下步骤：

S101：针对获取到的任一普适样本输入语料，确定预先采集的对应目标用户的个性化样本输入语料集中，与所述普适样本输入语料匹配的目标个性化样本输入语料。

本申请实施例提供的训练内容生成模型的方法应用于电子设备，该电子设备例如可以是PC、移动终端等设备，也可以是服务器等。

在一种可能的实施方式中，为了提高内容生成模型的输出内容的多样化、个性化及可辨识性，在对内容生成模型进行训练时，可以基于普适样本输入语料集以及目标用户对应的个性化样本输入语料集对内容生成模型进行训练。其中，普适样本输入语料集可以是相关技术中训练内容生成模型所用的样本输入语料集，可以认为普适样本输入语料集并不能反映用户的个性化特征。目标用户对应的个性化样本输入语料集可以认为是能够反映目标用户的个性化特征的语料集。其中，本申请对普适样本输入语料以及个性化样本输入语料的具体内容不作具体限定，可以根据需求灵活设置。另外，目标用户可以是个人、也可以是企业(组织)等，本申请对此不作具体限定。本申请对采集目标用户对应的个性化样本输入语料集的方式也不作具体限定，可以根据需求灵活选择。

在一种可能的实施方式中，在对内容生成模型进行训练时，可以针对获取的普适样本输入语料集中包含的每个普适样本输入语料，确定预先采集的对应目标用户的个性化样本输入语料集中，与该普适样本输入语料匹配的目标个性化样本输入语料。可选的，确定与普适样本输入语料匹配的目标个性化样本输入语料时，可以基于预先训练完成的语言模型，确定普适样本输入语料的第一向量(为方便描述，将基于语言模型确定的普适样本输入语料的向量称为第一向量)。另外，还可以基于预先训练完成的语言模型，确定个性化样本输入语料集中每个样本输入语料(个性化样本输入语料)的第二向量(为方便描述，将基于语言模型确定的个性化样本输入语料的向量称为第二向量)。

可选的，为了准确地确定与普适样本输入语料匹配的目标个性化样本输入语料，可以确定第一向量与每个第二向量之间的向量相似度。其中，确定第一向量、第二向量以及第一向量与第二向量之间的向量相似度的过程可以采用现有技术，在此不再赘述。可以基于第一向量与每个第二向量之间的向量相似度，确定与普适样本输入语料匹配的目标个性化样本输入语料。可选的，可以将与第一向量之间的向量相似度最高的第二向量，确定为目标向量，将该目标向量对应的个性化样本输入语料，确定为与普适样本输入语料匹配的目标个性化样本输入语料。

可选的，在确定与普适样本输入语料匹配的目标个性化样本输入语料时，还可以将与第一向量之间的向量相似度高于设定相似度阈值的各第二向量，分别确定为候选向量，然后，从各候选向量中选取一个目标向量，将该目标向量对应的个性化样本输入语料，确定为与普适样本输入语料匹配的目标个性化样本输入语料。其中，在从各候选向量中选取目标向量时，为了提高效率，可以从各候选向量中随机选取一个向量，作为目标向量。本申请对从候选向量中选取目标向量的方式不作具体限定。

S102：将所述普适样本输入语料与所述目标个性化样本输入语料进行融合，生成用于训练内容生成模型的训练输入。

在一种可能的实施方式中，为了提高内容生成模型的输出内容的多样化、个性化及可辨识性，可以将任一普适样本输入语料与匹配的目标个性化样本输入语料进行融合，融合为一个语料，从而生成用于训练内容生成模型的训练输入。

可选的，在对普适样本输入语料与目标个性化样本输入语料进行融合时，可以是将获得的普适样本输入语料的普适样本向量与目标个性化样本输入语料的个性化样本向量按照设定的先后顺序进行拼接，拼接生成一个向量，并将拼接生成的向量，确定为训练内容生成模型的训练输入。示例性的，假设普适样本向量用[Ess]表示，个性化样本向量用[Esc]表示，将普适样本向量与个性化样本向量拼接时的连接符用[sep]表示，则拼成生成的训练输入Esn可以用如下公式表示：Esn＝[Ess]+[sep]+[Esc]。

可选的，在对普适样本输入语料与目标个性化样本输入语料进行融合时，还可以获得预设的普适样本输入语料对应的第一预设权重以及目标个性化样本输入语料对应的第二预设权重。其中，本申请对第一预设权重和第二预设权重的具体数值不作具体限定，可以根据需求灵活设置。可以确定普适样本输入语料的普适样本向量与第一预设权重的第一加权值，另外，还可以确定目标个性化样本输入语料的个性化样本向量与第二预设权重的第二加权值，并可以将基于第一加权值和第二加权值生成的向量，确定为训练输入。为方便理解，下面用公式形式对确定训练输入的过程进行解释说明。示例性的，假设普适样本向量用Ess表示，个性化样本向量用Esc表示，普适样本输入语料对应的第一预设权重用α表示，目标个性化样本输入语料对应的第二预设权重用1-α表示，可以先确定普适样本向量与第一预设权重的第一加权值αEss，以及目标个性化样本向量与第二预设权重的第二加权值(1-α)Esc。可以将第一加权值与第二加权值相加生成的向量，确定为训练输入，即训练输入Esn＝αEss+(1-α)Esc。

其中，在确定普适样本输入语料的普适样本向量时，可以是基于预先训练完成的语言模型，确定普适样本输入语料的第一向量，将该第一向量确定为普适样本输入语料的普适样本向量。

另外，在确定普适样本输入语料的普适样本向量时，还可以是对普适样本输入语料进行切分，获得普适样本输入语料的词编码、位置编码以及分段编码这些第一目标编码。然后将各第一目标编码的向量进行加和等，基于各第一目标编码的向量，获得普适样本输入语料的普适样本向量。示例性的，第一目标编码中包含普适样本输入语料的词编码、位置编码以及分段编码，其中，普适样本输入语料的词编码的向量用Ews表示，位置编码的向量用Eps表示，分段编码的向量用Egs表示，则普适样本输入语料si的普适样本向量Ess＝Ews+Eps+Egs。其中，可以采用现有技术对普适样本输入语料进行切分，从而获得普适样本输入语料的词编码、位置编码、分段编码等，在此不再赘述。

与确定普适样本向量的过程类似，在确定个性化样本向量时，也可以基于预先训练完成的语言模型，确定个性化样本输入语料的第二向量，将该第二向量确定为个性化样本输入语料的个性化样本向量。

另外，在确定个性化样本输入语料的个性化样本向量时，还可以是对个性化样本输入语料进行切分，获得个性化样本输入语料的词编码、位置编码以及分段编码这些第二目标编码。然后将各第二目标编码的向量进行加和等，基于各第二目标编码的向量，获得个性化样本输入语料的个性化样本向量。示例性的，第二目标编码中包含个性化样本输入语料的词编码、位置编码以及分段编码，其中，个性化样本输入语料的词编码的向量用Ewc表示，位置编码的向量用Epc表示，分段编码的向量用Egc表示，则个性化样本输入语料ci的个性化样本向量Esc＝Ewc+Epc+Egc。

S103：基于所述训练输入以及对应所述目标个性化样本输入语料的个性化样本输出内容，对所述内容生成模型进行训练。

在一种可能的实施方式中，为了提高内容生成模型的输出内容的多样化、个性化及可辨识性，可以获得预先采集的目标个性化样本输入语料对应的个性化样本输出内容，其中，个性化样本输出内容可以认为是能够反映目标用户的个性化特征、提高输出内容的多样化及可辨识性的输出内容。可以基于训练输入以及该个性化样本输出内容，对内容生成模型进行训练。其中，本申请对个性化样本输出内容不做具体限定。基于训练输入以及该个性化样本输出内容，对内容生成模型进行训练时，可以将训练输入输入内容生成模型中，将个性化样本输出内容作为监督信号，对内容生成模型进行训练，在此不再赘述。

为方便理解，下面通过一个具体实施例对本申请提供的内容生成模型训练过程进行解释说明。参阅图2，图2为本申请实施例提供的第二种训练内容生成模型的过程示意图，该过程包括以下步骤：

S201：针对获取到的任一普适样本输入语料，基于预先训练完成的语言模型，确定该普适样本输入语料的第一向量，并确定预先采集的对应目标用户的个性化样本输入语料集中每个样本输入语料的第二向量；确定第一向量与每个第二向量之间的向量相似度；基于向量相似度，确定与普适样本输入语料匹配的目标个性化样本输入语料。

S202：将获得的普适样本输入语料的普适样本向量与目标个性化样本输入语料的个性化样本向量进行拼接，将拼接生成的向量，确定为用于训练内容生成模型的训练输入。

S203：基于训练输入以及对应目标个性化样本输入语料的个性化样本输出内容，对内容生成模型进行训练。

为方便理解，下面再通过一个具体实施例对本申请提供的内容生成模型训练过程进行解释说明。参阅图3，图3为本申请实施例提供的第三种训练内容生成模型的过程示意图，该过程包括以下步骤：

S301：针对获取到的任一普适样本输入语料，基于预先训练完成的语言模型，确定该普适样本输入语料的第一向量，并确定预先采集的对应目标用户的个性化样本输入语料集中每个样本输入语料的第二向量；确定第一向量与每个第二向量之间的向量相似度；基于向量相似度，确定与普适样本输入语料匹配的目标个性化样本输入语料。

S302：获得普适样本输入语料对应的第一预设权重以及目标个性化样本输入语料对应的第二预设权重；确定获得的普适样本输入语料的普适样本向量与第一预设权重的第一加权值、以及目标个性化样本输入语料的个性化样本向量与第二预设权重的第二加权值；将基于第一加权值和第二加权值生成的向量，确定为训练输入。

S303：基于训练输入以及对应目标个性化样本输入语料的个性化样本输出内容，对内容生成模型进行训练。

实施例2：

为了提高内容生成模型的输出内容的多样化、个性化及可辨识性，在上述实施例的基础上，本申请还提供了一种确定内容生成模型的输出内容的方法，参阅图4，图4为本申请实施例提供的一种确定内容生成模型的输出内容的过程示意图，该过程包括以下步骤：

S401：若接收到用户输入语料，识别目标用户标识。

本申请实施例提供的确定内容生成模型的输出内容的方法应用于电子设备，该电子设备例如可以是PC、移动终端等设备，也可以是服务器等。在一种可能的实施方式中，电子设备中可以安装有基于内容生成模型确定用户输入语料所对应的输出内容的应用程序(Application，App)等。示例性的，用户可以基于账户等登录App，并说出(输入)想要提问的问题等输入语料，电子设备接收到用户输入语料时，可以将当前登录App的账户的标识确定为目标用户标识。

S402：确定预先采集的对应所述目标用户标识的个性化输入语料集中，与所述用户输入语料匹配的目标个性化输入语料。

在一种可能的实施方式中，与对内容生成模型的训练过程类似，为了提高内容生成模型提供的输出内容的多样化、个性化及可辨识性，在接收到用户输入语料，并识别到用户的目标用户标识之后，可以从预先采集的对应目标用户标识的个性化输入语料集中，确定与用户本次输入的输入语料匹配的个性化输入语料。

与上述实施例中确定与普适样本输入语料匹配的目标个性化样本输入语料的过程类似，在确定与输入语料匹配的个性化输入语料时，可以基于预先训练完成的语言模型，确定输入语料的第三向量，并确定预先采集的对应目标用户标识的个性化输入语料集中每个个性化输入语料的第四向量。可以确定第三向量与每个第四向量之间的向量相似度，基于第三向量与每个第四向量之间的向量相似度，确定与输入语料匹配的目标个性化输入语料。可选的，可以将与第三向量之间的向量相似度最高的第四向量，确定为目标向量，将该目标向量对应的个性化输入语料，确定为与输入语料匹配的目标个性化输入语料。可选的，在确定与输入语料匹配的目标个性化输入语料时，还可以将与第三向量之间的向量相似度高于设定相似度阈值的各第四向量，分别确定为候选向量，从候选向量中随机选取一个目标向量，将该目标向量对应的个性化输入语料，确定为与输入语料匹配的目标个性化输入语料，在此不再赘述。

S403：将所述用户输入语料与所述目标个性化输入语料进行融合，基于融合生成的目标输入以及基于上述任一方法训练得到的内容生成模型，确定目标输出内容。

在一种可能的实施方式中，与上述实施例中将普适样本输入语料与目标个性化样本输入语料进行融合的过程类似，在将输入语料(用户输入语料)与目标个性化输入语料进行融合时，可以是将获得的用户输入语料的向量(为方便描述，将用户输入语料的向量称为普适输入向量)与目标个性化输入语料的向量(为方便描述，将个性化输入语料的向量称为个性化输入向量)按照设定的先后顺序进行拼接，拼接生成一个向量，并将拼接生成的向量，确定为输入内容生成模型中用于生成目标输出内容的目标输入。示例性的，假设普适输入向量用[Eq]表示，个性化输入向量用[Ed]表示，将普适输入向量与个性化输入向量拼接时的连接符用[sep]表示，则拼成生成的目标输入的向量Eqn可以用如下公式表示：Eqn＝[Eq]+[sep]+[Ed]。

可选的，在将用户输入语料与目标个性化输入语料进行融合时，还可以获得预设的用户输入语料对应的第一预设权重以及目标个性化输入语料对应的第二预设权重。可以确定用户输入语料的普适输入向量与第一预设权重的第三加权值，另外，还可以确定目标个性化输入语料的个性化输入向量与第二预设权重的第四加权值，并可以将基于第三加权值和第四加权值生成的向量，确定为生成的目标输入的向量。示例性的，假设普适输入向量用Eq表示，个性化输入向量用Ed表示，用户输入语料对应的第一预设权重用α表示，目标个性化输入语料对应的第二预设权重用1-α表示，可以先确定普适输入向量与第一预设权重的第三加权值αEq，以及目标个性化输入向量与第二预设权重的第四加权值(1-α)Ed。可以将第三加权值与第四加权值相加生成的向量，确定为目标输入的向量，即目标输入的向量Eqn＝αEq+(1-α)Ed。

与确定普适样本输入语料的普适样本向量的过程类似，在确定用户输入语料的普适输入向量时，可以是基于预先训练完成的语言模型，确定用户输入语料的向量(第三向量)，将该向量确定为用户输入语料的普适输入向量。另外，在确定用户输入语料的普适输入向量时，还可以是对用户输入语料进行切分，获得用户输入语料的词编码、位置编码以及分段编码这些第三目标编码。然后将各第三目标编码的向量进行加和等，基于各第三目标编码的向量，获得用户输入语料的普适输入向量。示例性的，第三目标编码中包含用户输入语料的词编码、位置编码以及分段编码，其中，用户输入语料的词编码的向量用Ewq表示，位置编码的向量用Epq表示，分段编码的向量用Egq表示，则用户输入语料qi的普适输入向量Eq＝Ewq+Epq+Egq。

另外，与确定个性化样本向量过程类似，在确定个性化输入向量时，也可以基于预先训练完成的语言模型，确定个性化输入语料的向量(第四向量)，将该向量确定为个性化输入语料的个性化输入向量。另外，在确定个性化输入语料的个性化输入向量时，还可以是对个性化输入语料进行切分，获得个性化输入语料的词编码、位置编码以及分段编码这些第四目标编码。然后将各第四目标编码的向量进行加和等，基于各第四目标编码的向量，获得个性化输入语料的个性化输入向量。示例性的，第四目标编码中包含个性化输入语料的词编码、位置编码以及分段编码，其中，个性化输入语料的词编码的向量用Ewd表示，位置编码的向量用Epd表示，分段编码的向量用Egd表示，则个性化输入语料di的个性化输入向量Ed＝Ewd+Epd+Egd。

在一种可能的实施方式中，将用户输入语料的向量Eq与目标个性化输入语料的向量Ed融合生成目标输入的向量Eqn后，可以将Eqn输入训练完成的内容生成模型中，内容生成模型可以基于该Eqn，确定适合该Eqn的目标输出内容。

由于本申请实施例中内容生成模型在训练过程中是基于能够反映用户个性化特征、提高输出内容的多样化及可辨识性的训练输入以及个性化样本输出内容进行训练的，基于训练完成的内容生成模型确定的目标输出内容也可以认为是最大程度能够反映用户个性化特征、满足用户个性化需求的输出内容，可以提高内容生成模型提供的输出内容的多样化、个性化及可辨识性，提高用户体验。

可选的，内容生成模型的模型结构可以采用类似掩码内容生成模型、自回归内容生成模型等的模型结构，例如包括自回归内容生成模型的编码层(Embedding)、转换层(Transformer)、输出层等，本申请对内容生成模型的具体模型结构不作具体限定，可以根据需求灵活设置。

另外，本申请实施例中的内容生成模型可以应用于故事续写、广告文案推送、信件撰写、输出问题的答案、根据一句话中的前面若干个词预测当前词等诸多应用场景，可以提供多种类型的输出内容。另外，本申请实施例中的内容生成模型可以是例如大语言模型等基础模型，也可以是问答模型等任务模型。对内容生成模型的训练过程可以采用监督学习方式，也可以采用自监督学习方式等，本申请对此不作具体限定。

可选的，为了提高内容生成模型的输出内容的多样化、个性化及可辨识性，在确定内容生成模型的目标输出内容时，还可以获得用户想要的目标输出内容的类型。例如，可以在接收到用户输入的输入语料时，识别输入语料中包含的目标关键词，根据预先配置的关键词与输出内容类型的对应关系，将目标关键词对应的目标输出内容类型，确定为用户想要的目标输出内容的类型。另外，也可以询问用户想要的目标输出内容类型，将用户输入的输出内容类型确定为用户想要的目标输出内容的类型，本申请对目标输出内容类型以及确定目标输出内容类型的具体方式不作具体限定，例如目标输出内容类型可以为广告文案、工作计划、工作周报、告别信件等。可选的，电子设备可以将输入语料以及目标输出内容类型等一并输入到内容生成模型中，内容生成模型可以基于输入语料以及目标输出内容类型等这些输入信息，确定属于目标输出内容类型的输出内容，从而提高内容生成模型确定的目标输出内容的准确性，提高用户体验。

相应的，在对内容生成模型进行训练时，也可以将训练输入以及对应的目标输出内容类型一并输入到内容生成模型中，基于这些输入信息以及对应的个性化样本输出内容，对内容生成模型进行训练，从而使得训练完成的内容生成模型可以准确的输出不同类型的输出内容，在此不再赘述。

下面对采集用户的个性化样本输入语料以及对应的个性化样本输出内容的过程进行介绍。

可选的，可以通过人机交互的方式来完成对个性化样本输入语料以及对应的个性化样本输出内容(也可以将个性化样本输入语料以及对应的个性化样本输出内容称为认知语料)的采集。示例性的，可以基于大语言模型(内容生成模型)体验系统来引导用户输入或者选择不同类型(如历史、小说、职场、音乐等)的问题，根据用户输入或者选择的问题，可以返回显示多个候选答案(输出内容)，用户可以选择或者输入偏好的答案，电子设备记录并对应保存不同用户输入(选择)的问题及输出内容(认知语料)。可选的，训练过程中所用的个性化样本输入语料集与基于内容生成模型确定目标输出内容时所用的个性化输入语料集可以完全相同，也可以部分相同，当然，也可以完全不同，可以根据需求灵活设置，其中，两者(个性化样本输入语料集和个性化输入语料集)的采集过程可以相同，在此不再赘述。

示例性的，用户还可以将自己创作或者喜好的文章内容等作为个性化样本输出内容输入电子设备中。另外，以用户为企业为例，用户也可以将具有自身个性化特征(个性化标识)、可以提高自身可辨识性的文章内容等输入电子设备中，以期可以基于训练完成的内容生成模型输出能够反映企业的个性化特征(个性化标识)、提高输出内容的多样化及可辨识性的输出内容，可以提升内容生成模型输出的输出内容的娱乐性、个性化、多样性的同时，还可以达到提升用户的可辨识性，从而保护用户特有知识产权的目的。

可选的，收集到个性化样本输入语料和个性化输入语料后，可以对收集到的个性化样本输入语料和个性化输入语料进行编码格式调整、分句等预处理，生成单句的个性化样本输入语料和个性化输入语料。可以基于预先训练完成的语言模型，确定预处理后的个性化样本输入语料和个性化输入语料的向量，将各向量存入认知向量库中，便于后续快捷的基于认知向量库中保存的向量，确定与普适样本输入语料匹配的目标个性化样本输入语料，以及与输入语料匹配的目标个性化输入语料，在此不再赘述。

实施例3：

基于相同的技术构思，本申请还提供了一种训练内容生成模型的装置。参阅图5，图5为本申请实施例提供的一种训练内容生成模型的装置示意图，所述装置包括：

确定模块51，用于针对获取到的任一普适样本输入语料，确定预先采集的对应目标用户的个性化样本输入语料集中，与所述普适样本输入语料匹配的目标个性化样本输入语料；

生成模块52，用于将所述普适样本输入语料与所述目标个性化样本输入语料进行融合，生成用于训练内容生成模型的训练输入；

训练模块53，用于基于所述训练输入以及对应所述目标个性化样本输入语料的个性化样本输出内容，对所述内容生成模型进行训练。

在一种可能的实施方式中，所述确定模块51，具体用于：

确定所述第一向量与每个所述第二向量之间的向量相似度；

在一种可能的实施方式中，所述确定模块51，具体用于：

在一种可能的实施方式中，所述生成模块52，具体用于：

基于相同的技术构思，本申请还提供了一种基于内容生成模型确定输出内容的装置。参阅图6，图6为本申请实施例提供的一种基于内容生成模型确定输出内容的装置示意图，所述装置包括：

接收模块61，用于若接收到用户输入语料，识别目标用户标识；

匹配模块62，用于确定预先采集的对应所述目标用户标识的个性化输入语料中，与所述用户输入语料匹配的目标个性化输入语料；

输出模块63，用于将所述用户输入语料与所述目标个性化输入语料进行融合，基于融合生成的目标输入以及基于上述任一方法训练得到的内容生成模型，确定目标输出内容。

实施例4：

在上述各实施例的基础上，本发明实施例还提供了一种电子设备，图7为本申请实施例提供的一种电子设备结构示意图，如图7所示，该电子设备包括：处理器71、通信接口72、存储器73和通信总线74，其中，处理器71，通信接口72，存储器73通过通信总线74完成相互间的通信；

所述存储器73中存储有计算机程序，当所述程序被所述处理器71执行时，使得所述处理器71执行上述任一方法实施例的步骤。

由于上述电子设备解决问题的原理与训练内容生成模型的方法以及确定内容生成模型的输出内容的方法相似，因此上述电子设备的实施可以参见方法的实施，重复之处不再赘述。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口72用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。

上述处理器可以是通用处理器，包括中央处理器、网络处理器(NetworkProcessor，NP)等；还可以是数字指令处理器(Digital Signal Processing，DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

实施例5：

在上述各实施例的基础上，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有可由电子设备执行的计算机程序，当所述程序在所述电子设备上运行时，使得所述电子设备执行上述任一方法实施例的步骤，在此不再赘述。

上述计算机可读存储介质可以是电子设备中的处理器能够存取的任何可用介质或数据存储设备，包括但不限于磁性存储器如软盘、硬盘、磁光盘(MO)等、光学存储器如CD、DVD、BD、HVD等、以及半导体存储器如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD)等。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种训练内容生成模型的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述确定预先采集的对应目标用户的个性化样本输入语料集中，与所述普适样本输入语料匹配的目标个性化样本输入语料，包括：

确定所述第一向量与每个所述第二向量之间的向量相似度；

3.根据权利要求2所述的方法，其特征在于，所述基于所述向量相似度，确定与所述普适样本输入语料匹配的目标个性化样本输入语料，包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述普适样本输入语料与所述目标个性化样本输入语料进行融合，生成用于训练内容生成模型的训练输入，包括：

5.根据权利要求1所述的方法，其特征在于，所述将所述普适样本输入语料与所述目标个性化样本输入语料进行融合，生成用于训练内容生成模型的训练输入，包括：

6.一种确定内容生成模型的输出内容的方法，其特征在于，所述方法包括：

若接收到用户输入语料，识别目标用户标识；

将所述用户输入语料与所述目标个性化输入语料进行融合，基于融合生成的目标输入以及基于权利要求1-5任一所述的方法训练得到的内容生成模型，确定目标输出内容。

7.一种训练内容生成模型的装置，其特征在于，所述装置包括：

8.一种确定内容生成模型的输出内容的装置，其特征在于，所述装置包括：

输出模块，用于将所述用户输入语料与所述目标个性化输入语料进行融合，基于融合生成的目标输入以及基于权利要求1-5任一所述的方法训练得到的内容生成模型，确定目标输出内容。

9.一种电子设备，其特征在于，所述电子设备至少包括处理器和存储器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5中任一所述方法的步骤。

10.一种计算机可读存储介质，其特征在于，其存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-5中任一所述方法的步骤。