WO2020215209A1

WO2020215209A1 - 预测操作结果的方法、电子设备和计算机程序产品

Info

Publication number: WO2020215209A1
Application number: PCT/CN2019/083905
Authority: WO
Inventors: 刘春辰; 李伟
Original assignee: 日本电气株式会社; 刘春辰
Priority date: 2019-04-23
Filing date: 2019-04-23
Publication date: 2020-10-29
Also published as: JP7355115B2; JP2022536825A; US20220222554A1

Abstract

本公开的实施例提供了用于预测操作结果的方法、电子设备和计算机程序产品。一种预测操作结果的方法包括基于第一组观测数据，确定第一预测模型。该方法还包括基于被执行第一操作的第一组观测对象和被执行不同于第一操作的第二操作的第二组观测对象，确定第一概率模型。该方法进一步包括基于第一组观测数据和第一概率模型，确定第二预测模型。该方法进一步包括确定至少第一预测模型、第二预测模型和第一概率模型的第一组合，以用于预测对目标对象执行第一操作的第一最终结果。利用本公开的实施例，能够提高个体因果效应估计的准确性，还能够扩展到具有多个处置水平的应用场景。

Description

预测操作结果的方法、电子设备和计算机程序产品

技术领域

本公开的实施例涉及机器学习领域，并且更具体地，涉及用于预测操作结果的方法、电子设备和计算机程序产品。

背景技术

随着信息技术的飞速发展，数据规模迅速增长。在这样的背景和趋势下，机器学习受到越来越广泛的关注。其中，推断因果关系是诸如医疗健康、教育、就业和生态等各个领域的基本问题。这种因果推断问题通常被称为反事实问题，例如“如果这名患者服用新药，他会存活更长时间吗？”或“如果这名学生参加教育培训计划，他会获得更高的分数吗？”

对每个个体的因果效应(treatment effect)进行预测的主要挑战是对于特定分配的处理仅能观测到事实结果，而无法观测到对应的反事实结果，没有反事实结果则难以确定真正的因果效应。因此，需要一种通过观测到的数据来更准确地预测因果效应的方法。

发明内容

本公开的实施例提供了用于预测操作结果的方案。

在本公开的第一方面中，提供了一种预测操作结果的方法。该方法包括基于第一组观测数据，确定第一预测模型，第一组观测数据包括对第一组观测对象执行第一操作的第一组观测结果，第一预测模型用于预测对目标对象执行第一操作的第一潜在结果。该方法还包括：基于被执行第一操作的第一组观测对象和被执行不同于第一操作的第二操作的第二组观测对象，确定第一概率模型，第一概率模型用于确定对目标对象执行第一操作和第二操作的相应概率。该方法还包括基于第一组观测数据和第一概率模型，确定第二预测模型，第二预测模型通过估计对第二组观测对象执行第一操作的结果来预测对目标对象执行第一操作的第二潜在结果。该方法还包括确定至少第一预测模型、第二预测模型和第一概率模型的第一组合，以用于预测对目标对象执行第一操作的第一最终结果。

在本公开的第二方面中，提供了预测操作结果的方法。该方法包括响应于确定将对目标对象执行一组操作中的一个操作，预测对目标对象执行第一操作的第一潜在结果。该方法还包括：确定对目标对象执行第一操作的第一概率和执行一组操作中的第二操作的第二概率，第二操作不同于第一操作。该方法还包括：通过估计对被执行第二操作的观测对象执行第一操作的结果来预测对目标对象执行第一操作的第二潜在结果。该方法还包括：至少基于第一潜在结果、第二潜在结果、第一概率和第二概率，预测对目标对象执行第一操作的第一最终结果。

在本公开的第三方面中，提供了一种电子设备。该电子设备包括处理器以及与处理器耦合的存储器，存储器具有存储于其中的指令，指令在被处理器执行时使设备执行动作。动作包括：基于第一组观测数据，确定第一预测模型，第一组观测数据包括对第一组观测对象执行第一操作的第一组观测结果，第一预测模型用于预测对目标对象执行第一操作的第一潜在结果；基于被执行第一操作的第一组观测对象和被执行不同于第一操作的第二操作的第二组观测对象，确定第一概率模型，第一概率模型用于确定对目标对象执行第一操作和第二操作的相应概率；基于第一组观测数据和第一概率模型，确定第二预测模型，第二预测模型通过估计对第二组观测对象执行第一操作的结果来预测对目标对象执行第一操作的第二潜在结果；以及确定至少第一预测模型、第二预测模型和第一概率模型的第一组合，以用于预测对目标对象执行第一操作的第一最终结果。

在本公开的第四方面中，提供了一种电子设备。该电子设备包括处理器以及与处理器耦合的存储器，存储器具有存储于其中的指令，指令在被处理器执行时使设备执行动作。动作包括：响应于确定将对目标对象执行一组操作中的一个操作，预测对目标对象执行第一操作的第一潜在结果；确定对目标对象执行第一操作的第一概率和执行一组操作中的第二操作的第二概率，第二操作不同于第一操作；通过估计对被执行第二操作的观测对象执行第一操作的结果来预测对目标对象执行第一操作的第二潜在结果；以及至少基于第一潜在结果、第二潜在结果、第一概率和第二概率，预测对目标对象执行第一操作的第一最终结果。

在本公开的第五方面中，提供了一种计算机程序产品，计算机程序产品被有形地存储在计算机可读介质上并且包括机器可执行指令，机器可执行指令在被执行时使机器执行根据第一方面的方法。

在本公开的第六方面中，提供了一种计算机程序产品，计算机程序产品被有形地存储在计算机可读介质上并且包括机器可执行指令，机器可执行指令在被执行时使机器执行根据第二方面的方法。

提供发明内容部分是为了简化的形式来介绍对概念的选择，它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或主要特征，也无意限制本公开的范围。

附图说明

通过结合附图对本公开示例性实施例进行更详细的描述，本公开的上述以及其它目的、特征和优势将变得更加明显，其中，在本公开示例性实施例中，相同的参考标号通常代表相同部件。在附图中：

图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图；

图2示出了根据本公开的实施例的获取模型的过程的流程图；

图3示出了根据本公开的实施例的用于确定第二预测模型的过程的流程图；

图4示出了根据本公开的实施例的预测操作结果的过程的流程图；以及

图5示出了可以用来实施本公开的实施例的示例设备的框图。

具体实施方式

下面将参考附图中示出的若干示例实施例来描述本公开的原理。虽然附图中显示了本公开的优选实施例，但应当理解，描述这些实施例仅是为了使本领域技术人员能够更好地理解进而实现本公开，而并非以任何方式限制本公开的范围。

在本文中使用的术语“包括”及其变形表示开放性包括，即“包括但不限于”。除非特别申明，术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

在本公开的实施例中，术语“处置分配机制”是指取决于个体特征并且确定观测实验中被研究的每个个体所分配的处置水平(例如，药物或安慰剂)的潜在策略。在本文中，使用T来表示处置，其取值为t，例如对于仅两个处置水平的情况t＝0，1。

在本公开的实施例中，术语“潜在结果”是指将个体分配到指定的处置水平t的情况下个体的结果，用Y _t表示。例如，在两个处置水平t＝0，1的情况下，每个个体有两个潜在的结果Y ₀和Y ₁；在三个处置水平t＝0，1，2的情况下，每个个体有三个潜在的结果Y ₀、Y ₁和Y ₂。

在本公开的实施例中，术语“反事实”是指对过去已经发生的事实进行否定而重新表征，以建构一种可能性的假设结果。举例而言，对于干预组(treated group)(T＝1)中的个体，潜在结果Y ₁是观测到的事实结果，而Y ₀是未观测到的反事实结果；然而，对于控制组(T＝0)中的个体，Y ₀是观测到的事实结果，Y ₁是未观测到的反事实结果。

在本公开的实施例中，术语“个体因果效应(ITE)”旨在基于个体(例如，患者)的特征(例如，身高、体重、年龄等，用X表示)来测量个体如何对特定处置分配(例如，药物)做出响应。在本文中，对于具有多个处置水平的情况，ITE定义为

在具有两个处置水平的情况下，ITE定义为ITE(x)＝E(Y ₁-Y ₀|X＝x)。

在本公开的实施例中，术语“协变量偏移”是指两个不同的观测组(诸如，干预组和对照组)中存在的输入特征(协变量)分布的变化。这种问题经常发生在观测性研究中，并导致所谓的“处置选择偏差”问题。

如前文所提到的，在许多实际场景中，期望能够预测个体在接受某个处置后的结果以及预测个体接受不同处置的结果差异，即个体因果效应(ITE)，以使得计算设备能够自动地做出决策或者辅助人们做出决策，即确定对某一个体是否执行某个处置或者确定对个体执行多个处置中的哪一个。例如，可能期望预测某种药物或治疗对某个患者病症的可能影响，从而自动地或辅助医生制定治疗方案。还可能期望预测培训课程能在多大程度上提高某个学生的成绩，或者预测广告推送对消费者最终购买行为的影响等。为了进行这样的预测，需要知晓反事实信息。

估计反事实信息的一种可能方法是进行随机对照实验。然而，这些实验昂贵且耗时，并且经常无法获得。因此，需要基于观测性研究来进行预测，在观测性研究中干预组和对照组下的数据分布是未知的并且通常是不同的。这导致了从观测性数据估计ITE的“处置选择偏差”问题。

传统上，估计ITE的方法主要集中在训练回归模型或执行样本重新加权来估计反事实结果，涉及最近邻匹配、倾向评分匹配、倾向评分重新加权以及一些基于树和森林的方法，如贝叶斯加性回归树(BART)和因果森林。ITE估计方面的其他近期工作包括表示学习方法和高斯过程。

在表示学习方法中，需要首先构建用于表示学习的深度神经网络以将特征空间映射到表示空间，并将干预组和对照组的分布转移到新的表示空间中。然后获得使用另外两个基于表示的深度神经网络来跨干预样本和对照样本预测事实结果的错误损失，作为事实结果损失。获得由表示引起的干预分布和对照分布之间的距离的度量作为积分概率度量(IPM)距离。最后最小化事实结果误差损失和IPM距离的加权和。

以上ITE估计方法存在若干问题。传统的结果回归方法一般不考虑“处置选择偏差”问题，而重新加权方法可能会受到有限样本的高方差影响。表示学习方法即使在无限数据下也是偏置的，并且仅能应用于只有两个处置水平的设置，这限制了其在可能有很多处置水平的实际操作中的使用。已知高斯过程相对于样本数具有较差的O(N ³)的复杂度，因此将这种方法应用于大型观测性研究并不容易。

根据本公开的实施例，提出了一种预测操作结果的方案。在该方案中，基于观测性数据，首先建立事实结果模型和倾向评分模型，接下来基于事实结果模型和倾向评分模型来确定反事实结果模型，最后通过事实和反事实结果模型的加权平均来预测处置结果和ITE。本公开的方案不仅能够修正观测性数据中的协变量偏移、提高估计处置结果和ITE的准确性，还能够扩展到具有多个处置水平的场景，并且能够容易地应用到大型观测性研究。

以下将参照附图来具体描述本公开的实施例。

图1示出了本公开的多个实施例能够在其中实现的示例环境100的示意图。在该示例环境100中，由计算设备102基于观测数据集101来生成模型103，其用于预测对目标对象107执行一个或多个操作的最终结果和个体因果效应ITE。模型103可以包括下文所详细描述的预测模型和概率模型104，并且可以限定如何来组合这些模型的输出以进行操作结果的预测。模型103还可以包括ITE表示105，其通过组合预测模型和概率模型104的输出来预测对目标对象107执行一个操作的最终结果与执行另一操作的最终结果之间的差异。在本文中，这种差异可以认为是针对目标对象107的ITE。

第一组观测数据110包括对第一组观测对象111执行第一操作的第一组观测结果112，而第二组观测数据120包括对第二组观测对象121执行第二操作的第二组观测结果122。在一些实施例中，观测数据集101还可以包括第三组观测数据130，其包括对第三组观测对象131执行第三操作的第三组观测结果132。本文中的第一操作、第二操作和第三操作互不相同，并且第一组观测对象111、第二组观测对象121和第三组观测对象131互不相同。这里所描述的第一操作、第二操作以及可选的第三操作可以认为是给予对象的不同处置，以下描述中处置和操作可以互换地使用。

尽管图1中仅示出了第一组观测数据110、第二组观测数据120和可选的第三组观测数据130，但是应当理解本公开的实施例可以应用于具有更多个处置水平的情况，从而观测数据集101还可以包括更多组观测数据，其中每组观测数据中的对象被执行不同的操作。

观测数据集101包括对每个被研究对象的操作或处置(T)、观测结果(Y)和对象的特征信息(X)。在具有两种不同的处置的情况下，T是二元的。为了便于讨论，用T＝1表示第一操作(例如，干预组)，用T＝2表示第二操作(例如，对照组)。在存在第三操作的情况下，用T＝3表示第三操作。第一组观测结果112和第二组观测结果122可以用Y来表示，并且Y可以是离散的或连续的。第一组观测对象111和第二组观测对象121可以用其特征X来表示，特征X可以包括可以是离散的或连续的许多预处理变量。观测数据集101可以来自各种学科的许多观测性研究。

计算设备106可以获取由计算设备102生成的模型103以及目标对象107的特征X，并且基于模型103来提供预测结果108。预测结果108可以包括针对对目标对象107执行某一操作的结果的预测，还可以包括针对对目标对象107执行两个不同操作的结果差异的预测，即针对ITE的预测。

举例而言，在医学研究中，操作或处置T指示患者是否接受阿司匹林，结果Y指示患者的头痛是否消失，并且特征X可以包括患者的年龄、性别、血压等信息。第一组观测数据110可以包括接受阿司匹林的多个患者的特征X以及他们在接受药物后头痛是否消失；而第二组观测数据120可以包括没有接受阿司匹林的多个患者的特征X以及他们头痛是否消失。基于这样的观测数据，计算设备102可以生成模型103，并且计算设备106可以利用模型103来预测目标对象107接受和不接受阿司匹林的情况下头痛是否能够消失，还可以预测阿司匹林对目标对象107的处置效应，以确定或者辅助确定目标对象107是否应当接受阿司匹林的治疗。

作为另一示例，操作或处置T可以指示产品是否被推荐给消费者，结果Y指示消费者是否购买该产品，并且特征X可以包括消费者的收入、购买历史等信息。在这种场景中，第一组观测数据110可以包括被推荐了产品的消费者的特征及他们是否购买了该产品；第二组观测数据120可以包括未被推荐该产品的消费者的特征及他们是否购买了该产品。类似的，计算设备106可以利用所生成的模型103来预测产品推送对目标对象107的效应，从而确定或者帮助确定是否向目标对象107进行产品推送。

为了更清楚地理解本公开的实施例所提供的方案，将参照图2来进一步描述本公开的实施例。图2示出了根据本公开的实施例的获取模型的过程200的流程图。过程200可以由图1的计算设备102来实现。为便于讨论，将结合图1来描述过程200，并且将用T＝1来表示第一操作、用T＝2来表示第二操作、用T＝t来表示任意操作。

在框210，计算设备102基于第一组观测数据110，确定第一预测模型。第一组观测数据110包括对第一组观测对象111执行第一操作的第一组观测结果112，并且第一预测模型用于预测对目标对象107执行第一操作的第一潜在结果。本文中的第一预测模型也可以被称为针对第一操作的事实结果预测模型。

可以使用任何适当的方法来确定第一预测模型，例如使用神经网络。在一些实施例中，计算设备102可以基于第一组观测对象111和第一组观测结果112，建立用于确定第一预测模型的第一目标函数，并且通过最小化第一目标函数来确定第一预测模型的模型参数。

例如，计算设备102可以训练深度神经网络以针对第一组观测对象111(例如，T＝1的观测对象)中的各个观测对象的特征X对相应的观测结果Y进行建模，从而得到给定T＝1和特征X情况下Y的条件期望，即E(Y|X，T＝1)。在完全训练神经网络模型之后，所建立的第一预测模型，即针对第一操作的事实结果模型，可以如式(1)所示：

E(Y|X，T＝1) (1)

在一些实施例中，计算设备102还可以基于第二组观测数据120，确定针对第二操作的事实结果预测模型，该模型在本文中也被称为第四预测模型。第四预测模型用于预测对目标对象107执行第二操作的潜在结果。

与第一预测模型的确定类似，计算设备102也可以使用神经网络来确定第四预测模型。例如，计算设备102可以训练深度神经网络以针对第二组观测对象121(例如，T＝2)中的各个观测对象的特征X对相应的观测结果Y进行建模，从而得到给定T＝2和特征X情况下Y的条件期望，即E(Y|X，T＝2)。在完全训练神经网络模型之后，所建立的第四预测模型，即针对第二操作的事实结果模型，可以如式(2)所示：

E(Y|X，T＝2) (2)

在实际操作中，为了降低训练深度神经网络时的计算复杂度，可以将隐藏层的数量设置为1或2，所有隐藏层的维数相同且大于特征X的维度，学习率为候选集{1.0，0.1，0.01，0.001，0.0001}，正则化参数为候选集{0，1e-4，1e-2}，批量大小为64，迭代次数为10000。然后可以使用机器学习算法中经常采用的训练/测试分裂技术来从候选集合中选择最佳参数。

应当理解，以上关于神经网络的训练方式仅是示意性而无意限制本公开的范围。还应当理解，对于任何T＝t的情况，都可以类似地基于观测的数据来确定针对第t操作的事实结果预测模型，如式(3)所示：

E(Y|X，T＝t) (3)

还可以通过其他方式来确定针对任意操作t的事实结果预测模型。例如，可以学习特征X的表示，然后在特征X的表示空间中通过神经网络的学习来确定针对操作t的事实结果预测模型。

在框220，计算设备102基于被执行第一操作的第一组观测对象111和被执行不同于第一操作的第二操作的第二组观测对象121，确定第一概率模型。该第一概率模型用于确定对目标对象107执行第一操作和第二操作的相应概率。

在存在第三操作的实施例中，计算设备102可以基于第一组观测对象111、第二组观测对象121和被执行第三操作的第三组观测对象131，确定第二概率模型。该第二概率模型用于确定对目标对象107执行第三操作的概率。

在本文中将第一概率模型、第二概率模型以及可能的更多概率模型统称为概率模型。应当理解，第一概率模型可以包括分别用于确定对目标对象107执行第一操作的第一概率和执行第二操作的第二概率的两个模型，例如下文所描述的P(T＝1|X)和P(T＝2|X)。

概率模型的一个实现可以是倾向评分模型。计算设备102可以使用深度神经网络来针对特征X(观测数据集101中的各组观测对象)对处置或操作T进行建模，从而获得概率模型。例如，计算设备102可以训练深度神经网络以针对观测对象的特征X对相应的操作T进行建模，从而得到在给定特征X情况下个体对象被执行第t操作的条件概率，作为概率模型，即式(4)：

P(T＝t|X) (4)

式(4)表示对具有特征X的目标对象107执行第t操作的概率。例如，P(T＝1|X)表示对具有特征X的目标对象107执行第一操作的概率；P(T＝2|X)表示对具有特征X的目标对象107执行第二操作的概率；P(T＝3|X)表示对具有特征X的目标对象107执行第二操作的概率。诸如式(4)所示的概率模型可以被认为是倾向评分模型或如上文所提及的处置分配机制。应当理解，可以使用观测数据集101中的所有观测对象来训练用于概率模型的神经网络。

在实际应用中训练该深度神经网络时，由于T的取值是离散的，因此可以交叉熵损失作为损失函数，隐藏层数为1或2，所有隐藏层的维数相同且大于特征X的维数，学习率是候选集{0.8，0.1，0.05，0.005，0.001}，正则化参数为0，批量大小为64，迭代次数为10000。类似于上述事实结果预测模型的深度神经网络的训练，计算设备102也可以使用训练/测试分裂技术从候选集中选择最佳超参数。

在框230，计算设备102基于第一组观测数据110和在框220处确定的第一概率模型，确定第二预测模型。第二预测模型通过估计对第二组观测对象121执行第一操作的结果来预测对目标对象107执行第一操作的潜在结果。

在存在第三操作的实施例中，计算设备102还可以基于第一组观测数据110、第一概率模型和第二概率模型，确定第三预测模型。第三预测模型通过估计对第三组观测对象131执行第一操作的结果来预测对目标对象107执行第一操作的第三潜在结果。本文中描述的第二预测模型和第三预测模型可以认为是针对第一操作的反事实结果预测模型。

在此方面，图3示出了根据本公开的实施例的用于确定第二预测模型的过程300的流程图。还将结合图3来描述用于确定反事实结果模型的一般过程。在一些实施例中，过程300可以视为图2中的框230的一种实现，并且例如可以由如图1所示的计算设备102来执行。应当理解，过程300还可以包括未示出的附加步骤和/或可以省略所示出的步骤。本公开的范围在此方面不受限制。

在框310，计算设备102基于在框220处确定的第一概率模型、第一组观测对象111的数目和第二组观测对象121的数目，确定样本权重。该样本权重用于修正第二组观测对象121的分布相对于第一组观测对象111的分布的偏移。在此确定的样本权重可以认为是重要性采样权重，其用于修正上文提及的协变量偏移问题，并且该样本权重将用于后续的反事实结果预测。

总体而言，对于被执行第

操作的观测对象，其针对第t操作的权重

如式(5)所示：

其中p(X|T＝t)表示给定T＝t情况下X的条件密度函数。

在此由于要确定的是针对第一操作的反事实结果预测模型，因此首先考虑针对未被执行第一操作的观测对象的样本权重。以图1所示的情况为例，对于被执行第二操作的第二组观测对象121，其针对第一操作的样本权重表示为w _2，1：＝w ₂表示为式(6)：

可以根据式(7)来计算w ₂：

其中

可以由第一组观测对象111的数目和第二组观测对象121的数目来估计，

可以由在框220处确定的概率模型来估计。

接下来，计算设备102可以基于所确定的样本权重(例如，式(7))和第一组观测数据110来确定第二预测模型，也即针对第一操作的反事实结果预测模型。例如，计算设备102可以采用迁移学习技术来确定第二预测模型。

在框320处，计算设备102基于样本权重、第一组观测对象111和第一组观测结果112，建立用于确定第二预测模型的第二目标函数。

第二组观测对象121被执行第一操作的反事实结果Y ₁是无法观测到的。可以基于迁移学习方法，借助于结果Y ₁被观测到的第一组观测对象111及对应的第一组观测结果112来预测针对第二组观测对象121的反事实结果。例如，可以建立如式(8)所示的目标函数：

其中h ₂(·)表示深度神经网络，α ₂表示正则化参数，以及

表示模型复杂度惩罚项。该目标函数表示对第一组观测对象111中的每个观测对象i(T _i＝1)求和。应当理解，对于具有多于两个处置水平的情况，这里建立的目标函数还应当包括其他t操作的权重项w _ti。

在框330，计算设备102通过最小化第二目标函数来确定第二预测模型的模型参数，从而获得第二预测模型。例如，计算设备102可以通过最小化如式(8)所示的目标函数来学习神经网络h ₂(X)，并且利用h ₂(X)来获得第二预测模型，如式(9)所示：

E(Y ₁|X，T＝2) (9)

在存在第三操作的实施例中，计算设备102还可以考虑被执行第三操作的第三组对象131针对第一操作的权重w _3，1：＝w ₃，如可以通过式(5)导出的。由此可以类似地得到上文提及的第三预测模型，如式(9’)所示：

E(Y ₁|X，T＝3) (9’)

以上描述了确定针对第一操作的反事实结果预测模型，即第二预测模型和可能的第三预测模型的过程。在一些实施例中，计算设备102还可以类似地确定针对任何第t操作(例如，第二操作)的反事实结果预测模型。为了便于讨论，在本文中将针对第二操作的反事实结果预测模型称为第五预测模型。例如，计算设备102可以基于第二组观测数据120和在框220处确定的第一概率模型，确定第五预测模型。第五预测模型通过估计对第一组观测对象111执行第二操作的结果来预测对目标对象107执行第二操作的潜在结果。

可以与参考图3所描述的过程类似地来确定第五预测模型。在此由于要确定的是针对第二操作的反事实结果预测模型，因此首先考虑针对未被执行第二操作的观测对象的样本权重。与相对框310所描述的类似，对于被执行第一操作的第一组观测对象111，其针对第二操作的样本权重表示为w _1，2：＝w ₁表示为式(10)：

可以根据式(10)来计算w ₁：

其中

可以由第一组观测对象111的数目和第二组观测对象121 的数目来估计，

可以由在框220处确定的概率模型来估计。特别地，在仅有两个处置水平的情况下，w ₁＝1/w ₂。

与相对框320所描述的类似，计算设备102接下来基于样本权重、第二组观测对象121和第二组观测结果122，建立用于确定五预测模型的目标函数。

第一组观测对象111被执行第二操作的反事实结果Y ₂是无法观测到的。可以基于迁移学习方法，借助于结果T ₂被观测到的第二组观测对象121及对应的第二组观测结果122来预测针对第一组观测对象111的反事实结果。例如，可以建立如式(12)所示的目标函数：

其中h ₁(·)表示深度神经网络，α ₁表示正则化参数，以及

表示模型复杂度惩罚项。该目标函数表示对第二组观测对象121中的每个观测对象i(T _i＝2)求和。

与相对框330所描述的类似，计算设备102接下来可以通过最小化如式(12)所示的目标函数来学习神经网络h ₁(X)，并且利用h ₁(X)来获得第五预测模型，如式(13)所示：

E(Y ₂|X，T＝1) (13)

在存在第三操作的实施例中，还可以类似地确定被执行第三操作的第三组观测对象131针对第二操作的反事实结果预测模型，如式(13’)所示：

E(Y ₂|X，T＝3) (13’)

上文已以两个和三个处置水平为例，描述了反事实结果预测模型的确定。对于多个处置水平的情况，计算设备102可以针对任何

来针对第t操作的反事实结果预测模型，如式(14)所示：

在这样的实施例中，通过将传统的重新权重方法中的变量w _1i ^γ和w _0i ^γ替换为如上所描述的样本权重，可以避免传统方法中的不稳定问题。另外，这种方法的另一优点是仍然可以使用训练/测试分离技术来选择最优参数，具体地尽管反事实结果是未观测到的，但可以使用经加权的误差作为测试误差。

继续参考图2，在框240，计算设备102确定至少第一预测模型、第二预测模型和第一概率模型的第一组合，以用于预测对目标对象107执行第一操作的第一最终结果。例如，计算设备102可以利用式(1)、(4)和(9)来确定第一组合。例如，计算设备102可以根据预定关系将各个预测模型和概率模型的输出进行组合。

总体而言，对于任何第t操作，对具有特征X的目标对象107执行该第t操作的最终结果可以通过下式来预测：

其中项E(Y|T＝t，X)是相对于框210所描述的事实结果预测模型，P(T＝t|X)和

是相对于框220所描述的概率模型即倾向评分模型，

是相对于框230和图3所描述的反事实结果预测模型。

对于用于预测对目标对象107执行第一操作的最终结果的第一组合，上述式(15)可以具体化为：

当仅具有两个处置水平(例如，1和2)时，第一组合又可以具体化为：

E(Y ₁|X)＝E(Y|X，T＝1)P(T＝1|X)

+P(T＝2|X)E(Y ₁|X，T＝2) (17)

当具有三个处置水平(例如，1、2和3)时，第一组合又可以具体化为：

E(Y ₁|X)＝E(Y|X，T＝1)P(T＝1|X)

+P(T＝2|X)E(Y ₁|X，T＝2)+P(T＝3|X)E(Y ₁|X，T＝3) (17’)

以此方式，计算设备102生成用于预测对目标对象107执行第一操作的最终结果的第一组合。计算设备102可以提供以上描述的事实结果预测模型、反事实结果预测模型和概率模型作为模型103的一部分，以供计算设备106来确定预测结果和ITE。

在一些实施例中，计算设备102可以生成用于预测对目标对象107执行任意第t操作的最终结果的组合。例如，计算设备102可以基于上文提及的第四预测模型、第五预测模型和概率模型来确定第二组合，以用于预测对目标对象107执行第二操作的第二最终结果。

对于用于预测对目标对象107执行第二操作的最终结果的第二组合，上述式(15)可以具体化为：

当仅具有两个处置水平时，计算设备102可以例如利用式(2)、(4)和(13)来确定第二组合。与式(17)类似，在这种情况下，第二组合可以具体化为：

E(Y ₂|X)＝E(Y|X，T＝2)P(T＝2|X)

+P(T＝1|X)E(Y ₂|X，T＝1) (19)

计算设备102可以提供以如上方式确定的、用于预测对目标对象107执行第t操作的最终结果的组合，即E(Y _t|X)，从而能够预测目标对象107被执行某一操作或处置的结果。在一些情况下，还期望预测对目标对象107执行不同处置或操作的差异，即期望预测ITE。

在一些实施例中，计算设备102可以基于上述第一组合和上述第二组合，确定差异表示，以用于预测对目标对象107执行第一操作的第一最终结果与对目标对象107执行第二操作的第二最终结果之间的差异。差异表示例如是图1中所示的ITE表示105。

总体上，针对任意两个操作t ₁和t ₂的个体因果效应ITE可以如下式：

其中

和

可以由式(15)得出。从式(20)可以看出ITE的值不仅取决于个体(目标对象107)的特征信息(X的取值)，还取决于所考虑的处置水平。该定义允许预测任何两个处置水平之间的ITE。

计算设备102可以将包括但不限于预测模型和概率模型104以及ITE表示105的模型103提供给例如计算设备106。基于模型103，计算设备106可以针对目标对象107来预测操作或处置结果和个体因果效应中的至少一项。例如，计算设备106可以针对患者来预测给予某种治疗与不给予该治疗之间的差异，从而自动地或者辅助医生或患者做出决策。

以上描述了根据本公开的用于获取预测操作结果和ITE的模型。该模型不仅能够提高估计处置结果和ITE的准确性，还能够扩展到具有多个处置水平的场景。另外，该方案还能够容易地应用到大型观测性研究。

图4示出了根据本公开的实施例的预测操作结果的过程400的流程图。过程400可以由图1的计算设备106来实现。为便于讨论，将结合图1来描述过程400。

在框410，计算设备106确定是否将对目标对象107执行一组操作中的一个操作。例如，如果计算设备106接收到关于目标对象107的特征X的输入(X的值x)，则可以认为将要对目标对象107执行某个操作。应当理解，在描述第一操作和第二操作时可以是指具有多个处置水平的情况中的任意两个操作，而不限于仅具有两个处置水平的情况。

如果在框410确定将对目标对象107执行一组操作中的一个操作，则过程进行到框420。在框420，计算设备106预测对目标对象107执行第一操作(t ₁)的第一潜在结果。计算设备106可以获取上文关于框210所描述的第一预测模型，并且基于该第一预测模型来预测第一潜在结果。例如，利用式(3)来获取第一潜在结果E(Y|X＝x，T＝t ₁)。

在框430，计算设备106确定对目标对象107执行第一操作(t ₁)的第一概率和第二操作(t ₂)的第二概率。计算设备106可以获取上文关于框220所描述的概率模型，并且基于该概率模型来确定相应概率。例如，计算设备106可以利用式(4)确定对目标对象107执行第一操作(t ₁)和第二操作(t ₂)的概率分别为P(T＝t ₁|X＝x)和P(T＝t ₂|X＝x)。在存在第三操作(t ₃)的实施例中，计算设备106还可以利用式(4)确定对目标对象107执行第三操作(t ₃)的概率分别为P(T＝t ₃|X＝x)

在框440，计算设备106通过估计对被执行第二操作的观测对象(例如，第二组观测对象120)执行第一操作的结果来预测对目标对象107执行第一操作的第二潜在结果。计算设备106可以获取上文关于框230和图3所描述的第二预测模型，并且基于该第二预测模型来预测第二潜在结果。例如，计算设备106可以利用式(14)来计算第二潜在结果

在存在第三操作(t ₃)的实施例中，计算设备106还可以获取上文关于所描述的第三预测模型，并且基于该第三预测模型来预测第三潜在结果。例如，计算设备106可以利用式(14)来计算第三潜在结果

在框450，计算设备106至少基于第一潜在结果、第二潜在结果、第一概率和第二概率，预测对目标对象107执行第一操作的第一最终结果。例如，计算设备106可以利用框420、430和440处的计算来确定第一最终结果。例如，在具有两个处置水平的情况下第一最终结果可以表示为：

在存在第三操作的实施例中，计算设备106可以基于第一潜在结果、第二潜在结果、第三潜在结果、第一概率、第二概率和第三概率来预测第一最终结果。例如，在具有三个处置水平的情况下第一最终结果可以表示为：

在一些实施例中，计算设备106还可以预测对目标对象107执第二操作的第四潜在结果，例如基于上文描述的第四预测模型。计算设备106可以通过估计对被执行第一操作的观测对象执行第二操作的结果来预测对目标对象107执行第二操作的第五潜在结果，例如基于上文描述的第五预测模型。计算设备106可以进而基于第四潜在结果、第五潜在结果和相应概率，预测对目标对象107执行第二操作的第二最终结果。例如，在具有两个处置水平的情况下第二最终结果可以表示为：

在具有三个处置水平的情况下第二最终结果可以表示为：

在一些实施例中，计算设备106可以预测针对目标对象107执行第一操作的第一最终结果与针对目标对象107执行第二操作的第二最终结果之间的差异，即第一操作相对于第二操作的ITE。例如，计算设备106可以基于ITE表示105来针对目标对象107计算第一操作t ₁相对于第二操作t ₂的ITE：

在一些实施例中，计算设备106可以(例如，向用户)提供预测的第一最终结果、第二最终结果以及ITE中的至少一项(例如，图1中所示的预测结果108)，以帮助诸如用户做出是对目标对象107执行第一操作还是执行第二操作的决策。

在一些实施例中，计算设备106可以基于所确定的差异(例如，ITE)，从第一操作和第二操作中确定将要对目标对象107执行的目标操作。计算设备106可以简单地基于所确定的差异来选择目标操作。例如，如果所确定的差异指示ITE为正面效应或积极效应，则计算设备106可以确定将要对目标对象107执行第一操作。计算设备106还可以进一步结合其他因素来选择目标操作，例如，结合第一操作与第二操作之间的成本差异(例如，时间成本、费用成本)。举例而言，如果ITE与成本差异之比大于阈值比，则计算设备106可以确定将要对目标对象107执行第一操作。

虽然将过程200和过程400描述为在两个计算设备处实现，但是应当理解，本文中所描述的过程可以在同一计算设备处实现，也可以由分布式计算系统实现。本公开的范围在此方面不受限制。

下面来描述一个具体示例。这里使用的数据集来自基于婴儿健康与发展计划(IHDP)的半模拟研究。IHDP数据具有来自真实随机实验的处置和特征，研究高质量儿童护理和家访对未来认知测试分数的影响。该实验使用模拟的结果，使得真正的因果效应是已知的。从实验数据开始，通过移除干预群体的子集来创建观测研究。数据集由747个个体(139个干预，608个对照)组成，每个个体由度量儿童及其母亲的特性的25个协变量表示。

处置表示早产儿是否接受过高质量儿童护理和来自受过训练的提供者的家访；连续性的结果表示婴儿未来认知测试分数；这25个特征包括对孩子的度量——出生体重、头围、早产儿出生周数、性别、双胞胎状态，以及对目前的度量——母亲在分娩时的年龄、婚姻状况、受教育程度。总共有6个连续协变量和19个二元协变量。

在上文关于框210描述的步骤中，获得给定婴儿的25个特征情况下一个早产儿的预测的未来认知测试分数。

在上文关于框220描述的步骤中，基于婴儿的25个特征获得关于一个早产儿接受高质量儿童护理和家访的潜在概率的预测。

在上文关于框230描述的步骤中，对于接受高质量儿童护理和家访的婴儿，获得假设其未接受此类儿童护理服务的情况下预测的未来认知测试分数；对于未接受高质量儿童护理和家访的婴儿，获得假设其接受了这种儿童护理服务的情况下预测的未来认知测试分数。

最后，基于以上步骤可以获得高质量儿童护理和来自受过训练的提供者的家访对每个早产儿的未来认知测试分数的因果效应的估计。

使用上文所述的传统方法、表示学习方法以及本公开的方法对上述IHDP数据进行学习从而预测ITE。结果显示本公开的方法在非均匀效应的估计精度(HEPE)和均方根误差方面均优于传统方法和表示学习方法。

下面结合具体实施例来描述本公开方案的实现。

在医疗领域中，针对同一病症，医生或患者自身可能需要从多种治疗手段或方式中进行选择，例如需要选择要不要给予某种药物、或者从多种药物中选择一种、或者从多种物理疗法(诸如，红外、磁疗)中选择一种等。以下为了便于描述，将用治疗手段A、B、C等来表示。通常医生会基于个人经验来选择治疗手段，但这严重依赖于主观判断和经验积累。医疗机构通常具有分别接受A、B、C治疗的同一病症的病患的治疗情况(以下称为观测数据)。

观测数据可以包括先前个体患者的各种特征，例如年龄、体重、血压以及与病症有关的各项检查数据等，并且包括这些个体患者在接受治疗后的治疗效果，例如病症是否消失、接受治疗后的生理参数等。期望利用这样的观测数据来预测这些治疗手段对当前正要接受治疗的目标患者的治疗效果以及不同治疗手段之间的效果差异(例如，ITE)，从而确定针对该目标患者的治疗手段。然而，这样的观测数据通常具有上文提及的协变量偏移问题。例如，由于不同治疗手段之间的成本差异，观测数据可能存在个体患者在经济状况方面的偏移。如果不考虑这样协变量偏移问题，所获得预测结果将不够客观和准确。

利用本公开中提供的方案可以解决协变量偏移引起的问题，准确预测目标患者针对治疗手段A、B、C的治疗效果以及任意两个治疗手段之间的效果差异。所预测的治疗效果和/或效果差异可以被提供给医生或患者，以辅助他们选择治疗手段。附加地或备选地，计算设备也可以基于预定规则自动地确定治疗手段，如上文所描述的。因此，以这种方式可以为患者选择更适合和更有效的治疗手段。

在教育领域中，学生可能需要从具体安排不同的多个同类课程(例如，听、说、读、写比例不同的英语课程)中进行选择，或者教育机构需要向学生推荐更适合的课程。教育机构通常具有这方面的观测数据。观测数据可以包括先前参加课程D、E、F等的学生的特征，例如年龄、性别、是否参加过类似课程、家庭经济情况等信息，以及个体学生在参加相应课程后的表现，例如考试成绩、获奖情况等。

期望利用这样的观测数据来帮助当前正在进行课程选择的学生做出决策，或者向其推荐更合适的课程。与前文提及的类似，观测数据通常存在协变量偏移，这导致传统预测方法不能准确、客观地向学生推荐课程。

利用本公开中提供的上述方案可以解决协变量偏移问题，准确预测目标学生针对课程D、E、F的学习效果以及任意两个课程之间的效果差异。所预测的学习效果和/或效果差异可以被提供给学生，以辅助他们进行课程选择。附加地或备选地，计算设备也可以基于预定规则向学生推荐更合适的课程，如上文所描述的。例如，如果针对课程D和E的ITE指示正面或积极效应，则可以将课程D推荐给目标学生。因此，以这种方式可以为学生选择更适合和更有益的课程。

图5示出了可以用来实现本公开的实施例的示例设备500的示意性框图。如图所示，设备500包括中央处理单元(CPU)501，其可以根据存储在只读存储器(ROM)502中的计算机程序指令或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序指令，来执行各种适当的动作和处理。在RAM 503中，还可存储设备500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

设备500中的多个部件连接至I/O接口505，包括：输入单元506，例如键盘、鼠标等；输出单元507，例如各种类型的显示器、扬声器等；存储单元508，例如磁盘、光盘等；以及通信单元509，例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理单元501执行上文所描述的各个方法和处理，例如过程200、300和400中的任一个。例如，在一些实施例中，过程200、300和400可以被实现为计算机软件程序或计算机程序产品，其被有形地包含于机器可读介质，例如存储单元508。在一些实施例中，计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由CPU 501执行时，可以执行上文描述的过程200、300和400中的任一个的一个或多个步骤。备选地，在其他实施例中，CPU 501可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行过程200、300和400中的任一个。

根据本公开的一些实施例，提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现根据本公开的方法。

本领域的技术人员应当理解，上述本公开的方法的各个步骤可以通过通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本公开不限制于任何特定的硬件和软件结合。

应当理解，尽管在上文的详细描述中提及了设备的若干装置或子装置，但是这种划分仅仅是示例性而非强制性的。实际上，根据本公开的实施例，上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之，上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。

以上所述仅为本公开的可选实施例，并不用于限制本公开，对于本领域的技术人员来说，本公开可以有各种更改和变化。凡在本公开的精神和原则之内，所作的任何修改、等效替换、改进等，均应包含在本公开的保护范围之内。

Claims

一种预测操作结果的方法，包括：

基于第一组观测数据，确定第一预测模型，所述第一组观测数据包括对第一组观测对象执行第一操作的第一组观测结果，所述第一预测模型用于预测对目标对象执行所述第一操作的第一潜在结果；

基于被执行所述第一操作的所述第一组观测对象和被执行不同于所述第一操作的第二操作的第二组观测对象，确定第一概率模型，所述第一概率模型用于确定对所述目标对象执行所述第一操作和所述第二操作的相应概率；

基于所述第一组观测数据和所述第一概率模型，确定第二预测模型，所述第二预测模型通过估计对所述第二组观测对象执行所述第一操作的结果来预测对所述目标对象执行所述第一操作的第二潜在结果；以及

确定至少所述第一预测模型、所述第二预测模型和所述第一概率模型的第一组合，以用于预测对所述目标对象执行所述第一操作的第一最终结果。
根据权利要求1所述的方法，还包括：

基于所述第一组观测对象、所述第二组观测对象和被执行第三操作的第三组观测对象，确定第二概率模型，所述第三操作不同于所述第一操作和所述第二操作，所述第二概率模型用于确定对所述目标对象执行所述第三操作的概率；以及

基于所述第一组观测数据、所述第一概率模型和所述第二概率模型，确定第三预测模型，所述第三预测模型通过估计对所述第三组观测对象执行所述第一操作的结果来预测对所述目标对象执行所述第一操作的第三潜在结果；并且

其中确定所述第一组合包括将所述第一预测模型、所述第二预测模型、所述第三预测模型、所述第一概率模型和所述第二概率模型的输出相组合。
根据权利要求1所述的方法，其中确定所述第一预测模型包括：

基于所述第一组观测对象和所述第一组观测结果，建立用于确定所述第一预测模型的第一目标函数；以及

通过最小化所述第一目标函数来确定所述第一预测模型的模型参数。
根据权利要求1所述的方法，其中确定所述第二预测模型包括：

基于所述第一概率模型、所述第一组观测对象的数目和所述第二组观测对象的数目，确定样本权重，所述样本权重用于修正所述第二组观测对象的分布相对于所述第一组观测对象的分布的偏移；以及

基于所述样本权重和所述第一组观测数据来确定所述第二预测模型。
根据权利要求4所述的方法，其中基于所述样本权重和所述第一组测数据来确定所述第二预测模型包括：

基于所述样本权重、所述第一组观测对象和所述第一组观测结果，建立用于确定所述第二预测模型的第二目标函数；以及

通过最小化所述第二目标函数来确定所述第二预测模型的模型参数。
根据权利要求1所述的方法，还包括：

基于第二组观测数据，确定第四预测模型，所述第二组观测数据包括对所述第二组观测对象执行所述第二操作的第二组观测结果，所述第四预测模型用于预测对所述目标对象执行所述第二操作的第四潜在结果；

基于所述第二组观测数据和所述第一概率模型，确定第五预测模型，所述第五预测模型通过估计对所述第一组观测对象执行所述第二操作的结果来预测对所述目标对象执行所述第二操作的第五潜在结果；以及

确定至少所述第四预测模型、所述第五预测模型和所述第一概率模型的第二组合，以用于预测对所述目标对象执行所述第二操作的第二最终结果。
根据权利要求6所述的方法，还包括：

基于所述第一组合和所述第二组合确定差异表示，所述差异表示用于预测对所述目标对象执行所述第一操作的第一最终结果与对所述目标对象执行所述第二操作的第二最终结果之间的差异。
一种预测操作结果的方法，包括：

响应于确定将对目标对象执行一组操作中的一个操作，预测对所述目标对象执行所述一组操作中的第一操作的第一潜在结果；

确定对所述目标对象执行所述第一操作的第一概率和执行所述一组操作中的第二操作的第二概率，所述第二操作不同于所述第一操作；

通过估计对被执行所述第二操作的观测对象执行所述第一操作的结果来预测对所述目标对象执行所述第一操作的第二潜在结果；以及

至少基于所述第一潜在结果、所述第二潜在结果、所述第一概率和所述第二概率，预测对所述目标对象执行所述第一操作的第一最终结果。
根据权利要求8所述的方法，其中所述一组操作还包括不同于所述第一操作和所述第二操作的第三操作，并且所述方法还包括：

确定对所述目标对象执行所述第三操作的第三概率；以及

通过估计对被执行所述第三操作的观测对象执行所述第一操作的结果来预测对所述目标对象执行所述第一操作的第三潜在结果；并且

其中预测所述第一最终结果包括基于所述第一潜在结果、所述第二潜在结果、所述第三潜在结果、所述第一概率、所述第二概率和所述第三概率来预测所述第一最终结果。
根据权利要求8所述的方法，其中预测所述第一潜在结果包括：

获取第一预测模型，所述第一预测模型是基于第一组观测数据确定的，所述第一组观测数据包括对第一组观测对象执行所述第一操作的第一组观测结果；以及

基于所述第一预测模型，预测所述第一潜在结果。
根据权利要求10所述的方法，其中确定所述第一概率和所述第二概率包括：

获取概率模型，所述概率模型是基于被执行所述第一操作的第一组观测对象和被执行所述第二操作的第二组观测对象确定的；以及

基于所述概率模型，确定所述第一概率和所述第二概率。
根据权利要求11所述的方法，其中预测所述第二潜在结果包括：

获取第二预测模型，所述第二预测模型是基于所述第一组观测数据和所述概率模型确定的；以及

基于所述第二预测模型，预测所述第二潜在结果。
根据权利要求8所述的方法，还包括：

预测对所述目标对象执行所述第二操作的第四潜在结果；

通过估计对被执行所述第一操作的观测对象执行所述第二操作的结果来预测对所述目标对象执行所述第二操作的第五潜在结果；以及

至少基于所述第四潜在结果、所述第五潜在结果、所述第一概率和所述第二概率，预测对所述目标对象执行所述第二操作的第二最终结果。
根据权利要求8所述的方法，还包括：

预测对所述目标对象执行所述第一操作的所述第一最终结果与对所述目标对象执行所述第二操作的第二最终结果之间的差异。
根据权利要求14所述的方法，还包括：

基于所述差异，从所述第一操作和所述第二操作中确定将要对所述目标对象执行的目标操作。
一种电子设备，包括：

处理器；以及

处理器耦合的存储器，所述存储器具有存储于其中的指令，所述指令在被处理器执行时使所述设备执行动作，所述动作包括：

基于第一组观测数据，确定第一预测模型，所述第一组观测数据包括对第一组观测对象执行第一操作的第一组观测结果，所述第一预测模型用于预测对目标对象执行所述第一操作的第一潜在结果；

基于被执行所述第一操作的所述第一组观测对象和被执行不同于所述第一操作的第二操作的第二组观测对象，确定第一概率模型，所述第一概率模型用于确定对所述目标对象执行所述第一操作和所述第二操作的相应概率；

基于所述第一组观测数据和所述第一概率模型，确定第二预测模型，所述第二预测模型通过估计对所述第二组观测对象执行所述第一操作的结果来预测对所述目标对象执行所述第一操作的第二潜在结果；以及

确定至少所述第一预测模型、所述第二预测模型和所述第一概率模型的第一组合，以用于预测对所述目标对象执行所述第一操作的第一最终结果。
根据权利要求16所述的电子设备，其中所述动作还包括：

基于所述第一组观测对象、所述第二组观测对象和被执行第三操作的第三组观测对象，确定第二概率模型，所述第三操作不同于所述第一操作和所述第二操作，所述第二概率模型用于确定对所述目标对象执行所述第三操作的概率；以及

基于所述第一组观测数据、所述第一概率模型和所述第二概率模型，确定第三预测模型，所述第三预测模型通过估计对所述第三组观测对象执行所述第一操作的结果来预测对所述目标对象执行所述第一操作的第三潜在结果；并且

其中确定所述第一组合包括将所述第一预测模型、所述第二预测模型、所述第三预测模型、所述第一概率模型和所述第二概率模型的输出相组合。
根据权利要求16所述的电子设备，其中确定所述第一预测模型包括：

基于所述第一组观测对象和所述第一组观测结果，建立用于确定所述第一预测模型的第一目标函数；以及

通过最小化所述第一目标函数来确定所述第一预测模型的模型参数。
根据权利要求16所述的电子设备，其中确定所述第二预测模型包括：

基于所述第一概率模型、所述第一组观测对象的数目和所述第二组观测对象的数目，确定样本权重，所述样本权重用于修正所述第二组观测对象的分布相对于所述第一组观测对象的分布的偏移；以及

基于所述样本权重和所述第一组观测数据来确定所述第二预测模型。
根据权利要求19所述的电子设备，其中基于所述样本权重和所述第一组测数据来确定所述第二预测模型包括：

基于所述样本权重、所述第一组观测对象和所述第一组观测结果，建立用于确定所述第二预测模型的第二目标函数；以及

通过最小化所述第二目标函数来确定所述第二预测模型的模型参数。
根据权利要求16所述的电子设备，其中所述动作还包括：

基于第二组观测数据，确定第四预测模型，所述第二组观测数据包括对所述第二组观测对象执行所述第二操作的第二组观测结果，所述第四预测模型用于预测对所述目标对象执行所述第二操作的第四潜在结果；

基于所述第二组观测数据和所述第一概率模型，确定第五预测模型，所述第五预测模型通过估计对所述第一组观测对象执行所述第二操作的结果来预测对所述目标对象执行所述第二操作的第五潜在结果；以及

确定至少所述第四预测模型、所述第五预测模型和所述第一概率模型的第二组合，以用于预测对所述目标对象执行所述第二操作的第二最终结果。
根据权利要求21所述的电子设备，其中所述动作还包括：

基于所述第一组合和所述第二组合确定差异表示，所述差异表示用于预测对所述目标对象执行所述第一操作的第一最终结果与对所述目标对象执行所述第二操作的第二最终结果之间的差异。
一种电子设备，包括：

处理器；以及

处理器耦合的存储器，所述存储器具有存储于其中的指令，所述指令在被处理器执行时使所述设备执行动作，所述动作包括：

响应于确定将对目标对象执行一组操作中的一个操作，预测对所述目标对象执行所述一组操作中的第一操作的第一潜在结果；

确定对所述目标对象执行所述第一操作的第一概率和执行所述一组操作中的第二操作的第二概率，所述第二操作不同于所述第一操作；

通过估计对被执行所述第二操作的观测对象执行所述第一操作的结果来预测对所述目标对象执行所述第一操作的第二潜在结果；以及

至少基于所述第一潜在结果、所述第二潜在结果、所述第一概率和所述第二概率，预测对所述目标对象执行所述第一操作的第一最终结果。
根据权利要求23所述的电子设备，其中所述一组操作还包括不同于所述第一操作和所述第二操作的第三操作，并且所述动作还包括：

确定对所述目标对象执行所述第三操作的第三概率；以及

通过估计对被执行所述第三操作的观测对象执行所述第一操作的结果来预测对所述目标对象执行所述第一操作的第三潜在结果；并且

其中预测所述第一最终结果包括基于所述第一潜在结果、所述第二潜在结果、所述第三潜在结果、所述第一概率、所述第二概率和所述第三概率来预测所述第一最终结果。
根据权利要求23所述的电子设备，其中测所述第一潜在结果包括：

获取第一预测模型，所述第一预测模型是基于第一组观测数据确定的，所述第一组观测数据包括对第一组观测对象执行所述第一操作的第一组观测结果；以及

基于所述第一预测模型，预测所述第一潜在结果。
根据权利要求25所述的电子设备，其中确定所述第一概率和所述第二概率包括：

获取概率模型，所述概率模型是基于被执行所述第一操作的第一组观测对象和被执行所述第二操作的第二组观测对象确定的；以及

基于所述概率模型，确定所述第一概率和所述第二概率。
根据权利要求26所述的电子设备，其中预测所述第二潜在结果包括：

获取第二预测模型，所述第二预测模型是基于所述第一组观测数据和所述概率模型确定的；以及

基于所述第二预测模型，预测所述第二潜在结果。
根据权利要求23所述的电子设备，其中所述动作还包括：

预测对所述目标对象执行所述第二操作的第四潜在结果；

通过估计对被执行所述第一操作的观测对象执行所述第二操作的结果来预测对所述目标对象执行所述第二操作的第五潜在结果；以及

基于所述第四潜在结果、所述第五潜在结果、所述第一概率和所述第二概率，预测对所述目标对象执行所述第二操作的第二最终结果。
根据权利要求23所述的电子设备，其中所述动作还包括：

预测对所述目标对象执行所述第一操作的所述第一最终结果与对所述目标对象执行所述第二操作的第二最终结果之间的差异。
根据权利要求29所述的电子设备，其中所述动作还包括：

基于所述差异，从所述第一操作和所述第二操作中确定将要对所述目标对象执行的目标操作。
一种计算机程序产品，所述计算机程序产品被有形地存储在计算机可读介质上并且包括机器可执行指令，所述机器可执行指令在被执行时使机器执行根据权利要求1至7中任一项所述的方法。
一种计算机程序产品，所述计算机程序产品被有形地存储在计算机可读介质上并且包括机器可执行指令，所述机器可执行指令在被执行时使机器执行根据权利要求8至15中任一项所述的方法。