CN112085714A

CN112085714A - 一种肺结节检测方法、模型训练方法、装置、设备及介质

Info

Publication number: CN112085714A
Application number: CN202010900390.3A
Authority: CN
Inventors: 王静雯
Original assignee: Guangzhou Shiyuan Electronics Thecnology Co Ltd
Current assignee: Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority date: 2020-08-31
Filing date: 2020-08-31
Publication date: 2020-12-15
Anticipated expiration: 2040-08-31
Also published as: CN112085714B

Abstract

本发明公开了一种肺结节检测方法、模型训练方法、装置、设备及介质。方法包括：获取待检测的多张肺部CT图像，分别从多张肺部CT图像中提取出几何特征，几何特征用于表征潜在结节的几何信息，基于几何特征计算各肺部CT图像之间的相似度矩阵，针对每一几何特征，将相似度矩阵和几何特征输入预置的图卷积神经网络中进行处理，得到图像特征；基于图像特征确定各肺部CT图像存在肺结节的概率。通过各肺部CT图像的几何特征计算各肺部CT图像之间的相似度矩阵，利用图卷积神经网络充分挖掘待检测的肺部CT图像之间的潜在几何信息和相似关系，能够降低肺部CT图片中血管及其他肺部阴影结构对检测结果的影响，提高了检测精度。

Description

一种肺结节检测方法、模型训练方法、装置、设备及介质

技术领域

本发明实施例涉及图像处理技术领域，尤其涉及一种肺结节检测方法、模型训练方法、装置、设备及介质。

背景技术

受环境、吸烟以及遗传等因素的影响，肺癌是我国死亡率和发病率最高的恶性肿瘤。根据医学数据显示，早期肺癌5年生存率显著高于中晚期肺癌，早发现、早诊断和治疗是改善肺癌的重要途径。

判断肺部是否存在肺结节是判定癌症的一项有力指标，因此肺结节的早期筛查变得尤为重要。其中，胸部低剂量CT图像具有分层薄、视野清晰、干扰因素少等特点，因此，基于肺部CT图像检测肺结节是目前国际公认的有效手段。随着计算机人工智能的发展，计算机辅助诊断系统越来越多的应用到CT图片的分析中，这可以减轻医生工作负担。

但是，通过计算机辅助诊断系统的自动检测会出现漏检、误检等现象。这是由于在CT图片中肺结节和血管及其他肺部阴影结构形态相似，因此会导致大量假阳从而影响检测结果。

发明内容

本发明提供一种肺结节检测方法、模型训练方法、装置、设备及介质，能够降低肺部CT图片中血管及其他肺部阴影结构对检测结果的影响，大大提高了检测精度。

第一方面，本发明实施例提供了一种肺结节检测方法，包括：

获取待检测的多张肺部CT图像；

分别从多张所述肺部CT图像中提取出几何特征，所述几何特征用于表征潜在结节的几何信息；

基于所述几何特征计算各所述肺部CT图像之间的相似度矩阵；

针对每一所述几何特征，将所述相似度矩阵和所述几何特征输入预置的图卷积神经网络中进行处理，得到图像特征；

基于所述图像特征确定各所述肺部CT图像存在肺结节的概率。

第二方面，本发明实施例还提供了一种肺结节检测模型训练方法，包括：

获取数据集，所述数据集包括由多张带有标签的肺部CT图像样本组成的训练集，所述标签用于标示所述肺部CT图像样本是否存在肺结节；

确定肺结节检测模型，所述肺结节检测模型包括卷积神经网络、图卷积神经网络和第一分类器；

将所述训练集中的肺部CT图像样本输入所述卷积神经网络中进行卷积处理，得到几何特征，所述几何特征用于表征所述训练集中的肺部CT图像样本的潜在结节的几何信息；

基于所述几何特征计算所述训练集中各肺部CT图像样本之间的相似度矩阵；

针对每一所述几何特征，将所述相似度矩阵和所述几何特征输入所述图卷积神经网络中进行处理，得到图像特征；

将所述图像特征输入所述第一分类器，得到所述训练集中多个肺部CT图像样本存在肺结节的第一概率分布；

通过损失函数计算所述第一概率分布与所述训练集中多个肺部CT图像样本的标签的真实值分布之间的第一损失值；

基于所述第一损失值更新所述卷积神经网络、所述图卷积神经网络和所述第一分类器的参数。

第三方面，本发明实施例还提供了一种肺结节检测装置，包括：

图像获取模块，用于获取待检测的多张肺部CT图像；

几何特征提取模块，用于分别从多张所述肺部CT图像中提取出几何特征，所述几何特征用于表征潜在结节的几何信息；

相似度矩阵计算模块，用于基于所述几何特征计算各所述肺部CT图像之间的相似度矩阵；

图像特征提取模块，用于针对每一所述几何特征，将所述相似度矩阵和所述几何特征输入预置的图卷积神经网络中进行处理，得到图像特征；

概率确定模块，用于基于所述图像特征确定各所述肺部CT图像存在肺结节的概率。

第四方面，本发明实施例还提供了一种肺结节检测模型训练装置，包括：

数据集获取模块，用于获取数据集，所述数据集包括由多张带有标签的肺部CT图像样本组成的训练集，所述标签用于标示所述肺部CT图像样本是否存在肺结节；

检测模型确定模块，用于确定肺结节检测模型，所述肺结节检测模型包括卷积神经网络、图卷积神经网络和第一分类器；

几何特征提取模块，用于将所述训练集中的肺部CT图像样本输入所述卷积神经网络中进行卷积处理，得到几何特征，所述几何特征用于表征所述训练集中的肺部CT图像样本的潜在结节的几何信息；

相似度矩阵计算模块，用于基于所述几何特征计算所述训练集中各肺部CT图像样本之间的相似度矩阵；

图像特征提取模块，用于针对每一所述几何特征，将所述相似度矩阵和所述几何特征输入所述图卷积神经网络中进行处理，得到图像特征；

第一概率分布计算模块，用于将所述图像特征输入所述第一分类器，得到所述训练集中多个肺部CT图像样本存在肺结节的第一概率分布；

第一损失值计算模块，用于通过损失函数计算所述第一概率分布与所述训练集中多个肺部CT图像样本的标签的真实值分布之间的第一损失值；

参数更新模块，用于基于所述第一损失值更新所述卷积神经网络、所述图卷积神经网络和所述第一分类器的参数。

第五方面，本发明实施例还提供了一种计算机设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明第一方面提供的肺结节检测方法，或实现如本发明第二方面提供的肺结节检测模型训练方法。

第六方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明第一方面提供的肺结节检测方法，或实现如本发明第二方面提供的肺结节检测模型训练方法。

本发明实施例提供的肺结节检测方法，包括：获取待检测的多张肺部CT图像，分别从多张肺部CT图像中提取出几何特征，几何特征用于表征潜在结节的几何信息，基于几何特征计算各肺部CT图像之间的相似度矩阵，针对每一几何特征，将相似度矩阵和几何特征输入预置的图卷积神经网络中进行处理，得到图像特征；基于图像特征确定各肺部CT图像存在肺结节的概率。通过各肺部CT图像的几何特征计算各肺部CT图像之间的相似度矩阵，利用图卷积神经网络充分挖掘待检测的肺部CT图像之间的潜在几何信息和相似关系，能够降低肺部CT图片中血管及其他肺部阴影结构对检测结果的影响，大大提高了检测精度。

附图说明

图1为本发明实施例一提供的一种肺结节检测方法的流程图；

图2A是本发明实施例二提供的一种肺结节检测方法的流程图；

图2B为本发明实施例二提供的一种肺结节检测模型的结构示意图；

图2C为本发明实施例二提供的一种卷积神经网络的结构示意图；

图2D为本发明实施例二提供的一种图卷积神经网络的结构示意图；

图3为本发明实施例三提供的一种肺结节检测模型训练方法的流程图；

图4A为本发明实施例四提供的一种肺结节检测模型训练方法的流程图；

图4B为本发明实施例四中对卷积神经网络和第二分类器的训练过程的示意图；

图5为本发明实施例五提供的一种肺结节检测装置的结构示意图；

图6为本发明实施例六提供的一种肺结节检测模型训练装置的结构示意图；

图7为本发明实施例七提供的一种计算机设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种肺结节检测方法的流程图，本实施例可适用于CT图片中肺结节和血管及其他肺部阴影结构形态相似，导致大量假阳的情况，该方法可以由本发明实施例提供的肺结节检测装置来执行，该装置可以由软件和/或硬件的方式实现，通常配置于计算机设备中，如图1所示，该方法具体包括如下步骤：

S101、获取待检测的多张肺部CT图像。

具体的，CT(Computed Tomography)图像，即电子计算机断层扫描图像，它是利用精确准直的X线束、γ射线、超声波等，与灵敏度极高的探测器一同围绕人体的某一部位作一个接一个的断面扫描。探测器接收透过该层面的X射线，转变为可见光后，由光电转换变为电信号，再经模拟/数字转换器(analog/digital converter)转为数字，输入计算机处理，得到CT图像。肺部CT图像即对胸腔肺部的断层扫描图像。

在本发明实施例中，肺部CT图像可以是二维CT图像或三维CT图像，本发明实施例在此不做限定。二维CT图像即普通CT图像就是CT平扫图像，只需对器官一次扫描即可。三维CT图像针对不同的区域则需要进行连续多次扫描，得到多张二维CT图像，然后针对多张二维CT图像进行重构，得到立体的三维CT图像。三维CT图像能够使得原来平面的图像变得立体起来，病变组织与临近正常组织间的密度差加大，能够更清楚地显示病变的组织的情况。因此，在本发明的一具体实施例中，肺部CT图像选用三维CT图像。

S102、分别从多张肺部CT图像中提取出几何特征。

具体的，分别对多张肺部CT图像进行图像处理，例如卷积、池化等操作，分别从各肺部CT图像中提取出对应的几何特征。几何特征用于表征肺部CT图像中潜在结节(包括真结节和假结节)的几何信息。

S103、基于几何特征计算各肺部CT图像之间的相似度矩阵。

具体的，相似度矩阵用于表征各肺部CT图像中潜在结节之间的相似关系。对于通过检测模型预测出的肺结节，无论真结节(真阳)还是假结节(假阳)在结构上都具有一定的相似性，而当前已经有很多研究工作证明，几何信息对于描述待检测实例之间的关系非常有用。

具体的，在本发明实施例中，通过计算各几何特征之间的相似度得到相似度矩阵。在本发明实施例中，可以通过计算各几何特征之间的欧氏距离、马氏距离、余弦相似度或Cosin距离来表征各几何特征之间的相似度，本发明实施例在此不做限定。

S104、针对每一几何特征，将相似度矩阵和几何特征输入预先训练好的图卷积神经网络中进行处理，得到图像特征。

具体的，针对每一几何特征(或者说是肺部CT图像)，将上述步骤中得到的相似度矩阵和几何特征输入预置的图卷积神经网络(Graph Neural Networks，GNN)中进行处理，从中提取出图像特征。

本发明实施例基于几何特征计算各肺部CT图像之间的相似度矩阵，利用图卷积神经网络充分挖掘待检测实例之间的潜在几何信息和相似关系，能够降低肺部CT图片中血管及其他肺部阴影结构对检测结果的影响，大大提高检测精度。

S105、基于图像特征确定各肺部CT图像存在肺结节的概率。

具体的，将上述步骤中得到的图像特征输入至预先训练好的分类器中，具体的，在训练好的分类器中，分类器可以是sigmoid分类器，sigmoid分类器的分类函数是sigmoid函数。在机器学习尤其是深度学习中，sigmoid函数是个非常常用而且比较重要的函数，尤其在二分类的场景中使用广泛。在本发明实施例中，sigmoid函数把输入的图像特征映射为概率值为0-1之间的实数并输出。通过设置适当的阈值t，当sigmoid函数输出的概率值大于阈值t时，则认为该肺部CT图像存在肺结节。

实施例二

图2A是本发明实施例二提供的一种肺结节检测方法的流程图，本实施例在上述实施例一的基础上进行细化，详细描述了从肺部CT图像中提取出几何特征的过程、计算相似度矩阵的过程以及图卷积神经网络的处理过程，如图2A所示，该方法包括：

S201、获取待检测的多张肺部CT图像。

在本发明的一具体实施例中，肺部CT图像选用96×96×96尺寸大小的三维CT图像，即肺部CT图像在长、宽、高三个维度的的尺寸均为96像素。三维CT图像能够使得原来平面的图像变得立体起来，病变组织与临近正常组织间的密度差加大，能够更清楚地显示病变的组织的情况。

在本发明的一些实施例中，为了使输入的肺部CT图像满足尺寸要求，可以对获得的肺部CT图像进行预处理，例如，对肺部CT图像进行尺寸调整，得到满足要求的肺部CT图像。

图2B为本发明实施例二提供的一种肺结节检测模型的结构示意图，如图2B所示，该肺结节检测模型包括卷积神经网络、图卷积神经网络和分类器。卷积神经网络用于从肺部CT图像x_i中提取几何特征，图卷积神经网络对输入的几何特征和相似度矩阵进行处理，得到图像特征，分类器用于将图像特征映射为概率值0-1之间的实数并输出。

S202、将多张肺部CT图像分别输入预置的卷积神经网络中进行处理，得到几何特征。

具体的，将多张肺部CT图像分别输入预先训练好的卷积神经网络中进行卷积处理，得到各肺部CT图像对应的几何特征。几何特征用于表征肺部CT图像中潜在结节(包括真结节和假结节)的几何信息。

图2C为本发明实施例二提供的一种卷积神经网络的结构示意图，示例性的，如图2C所示，卷积神经网络包括第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第五卷积层和第五池化层。

步骤S202中，卷积神经网络对肺部CT图像的处理过程如下：

1、将肺部CT图像输入第一卷积层中进行卷积操作，得到第一特征。

具体的，第一卷积层的卷积核大小为7×7×7，输入通道数为3，卷积步长为1×2×2。第一卷积层对输入的肺部CT图像按照上述参数进行卷积操作，得到第一特征。

2、将第一特征输入第二卷积层中进行卷积操作，得到第二特征。

具体的，第二卷积层包括两个卷积块，分别为第一卷积块和第二卷积块，第一卷积块和第二卷积块的卷积核大小均为1×1×1，通道数均为64，卷积步长均为1×1×1。第一卷积块接收第一特征，按照上述参数进行卷积操作，并将得到的结果输出给第二卷积块。第二卷积块接收第一卷积块的输出，并按照上述参数进行卷积操作，得到第二特征。

3、将第二特征输入第一池化层中进行最大池化操作，得到第三特征。

具体的，第一池化层的池化窗口大小为3×3×3，步长为2×2×2。第一池化层接收第二特征，按照上述参数进行最大池化操作，得到第三特征。最大池化操作即在池化窗口内选取的第二特征的局部区域内的最大的一个数来代表该片区域，保留第二特征各通道数据中的最大特征，得到第三特征。池化是为了减少训练参数的数量，降低第二卷积层输出的第二特征的维度，减小过拟合现象，只保留最有用的特征信息，减少噪声的传递。在本发明其他实施例中，第一池化层也可以对第二特征进行平均池化操作，得到第三特征，本发明实施例在此不做限定。

4、将第三特征输入第三卷积层中进行卷积操作，得到第四特征。

具体的，第三卷积层与第二卷积层的结构类似，同样包括两个卷积块，分别为第三卷积块和第四卷积块，第三卷积块和第四卷积块的卷积核大小均为1×1×1，卷积步长均为1×1×1，通道数为128。第三卷积块接收第三特征，按照上述参数进行卷积操作，并将得到的结果输出给第四卷积块。第四卷积块接收第三卷积块的输出，并按照上述参数进行卷积操作，得到第四特征。

5、将第四特征输入第二池化层中进行最大池化操作，得到第五特征。

具体的，第二池化层的池化窗口大小为3×3×3，步长为2×2×2。第二池化层接收第四特征，按照上述参数进行最大池化操作，得到第五特征。在本发明其他实施例中，第二池化层也可以对第四特征进行平均池化操作，得到第五特征，本发明实施例在此不做限定。

6、将第五特征输入第四卷积层中进行卷积操作，得到第六特征。

具体的，第四卷积层与第二卷积层的结构类似，同样包括两个卷积块，分别为第五卷积块和第六卷积块，第五卷积块和第六卷积块的卷积核大小均为1×1×1，卷积步长均为1×1×1，通道数为256。第五卷积块接收第五特征，按照上述参数进行卷积操作，并将得到的结果输出给第六卷积块。第六卷积块接收第五卷积块的输出，并按照上述参数进行卷积操作，得到第六特征。

7、将第六特征输入第三池化层中进行最大池化操作，得到第七特征。

具体的，第三池化层的池化窗口大小为3×3×3，步长为2×2×2。第三池化层接收第六特征，按照上述参数进行最大池化操作，得到第七特征。在本发明其他实施例中，第三池化层也可以对第六特征进行平均池化操作，得到第七特征，本发明实施例在此不做限定。

8、将第七特征输入第五卷积层中进行卷积操作，得到第八特征。

具体的，第五卷积层与第二卷积层的结构类似，同样包括两个卷积块，分别为第七卷积块和第八卷积块，第七卷积块和第八卷积块的卷积核大小均为1×1×1，卷积步长均为1×1×1，通道数为512。第七卷积块接收第七特征，按照上述参数进行卷积操作，并将得到的结果输出给第八卷积块。第八卷积块接收第七卷积块的输出，并按照上述参数进行卷积操作，得到第八特征。

9、将第八特征输入第四池化层中进行最大池化操作，得到几何特征。

具体的，第四池化层的池化窗口大小为3×3×3，步长为2×2×2。第四池化层接收第八特征，按照上述参数进行最大池化操作，得到几何特征X_i，X_i为第i个肺部CT图像对应的几何特征。在本发明其他实施例中，第四池化层也可以对第八特征进行平均池化操作，得到几何特征，本发明实施例在此不做限定。

示例性的，在本发明实施例中，卷积神经网络对肺部CT图像处理后，得到1×2048的向量作为几何特征。

需要说明的是，上述实施例中以卷积神经网络包括5个卷积层为例，对本发明进行示例性说明，在本发明其他实施例中，卷积神经网络中的卷积层的数量可以根据需要设定，本发明实施例在此不做限定，此外，在本发明其他实施例中，卷积神经网络还可以包括残差卷积神经网络。

S203、对每一几何特征进行归一化处理，得到各几何特征的边缘概率分布。

其中，某一组概率的加和叫做边缘概率，对于一个任意大小(n×m)的概率矩阵，每一个元素表示一个概率，对于其中任一行或任一列求和，得到的概率就是边缘概率。边缘概率的分布情况，就叫边缘概率分布。在本发明实施例中，对上述步骤中得到的几何特征进行归一化处理，即将几何特征中的元素映射成0-1之间的实数，具体的，可以采用线性函数归一化或0均值标准化等方法来实现归一化，本发明实施例在此不做限定。归一化处理后，得到几何特征中各元素的概率分布。示例性的，在本发明实施例中，几何特征为1×2048的向量，归一化得到的概率矩阵也为1×2048的矩阵，因此，该概率矩阵的边缘概率分布即为归一化得到的概率矩阵，即边缘概率分布为1×2048的矩阵。

S204、基于边缘概率分布计算各几何特征之间的传输矩阵，各几何特征之间包括多个传输矩阵。

具体的，假设V_i表示肺部CT图像i对应的边缘概率分布，V_j表示肺部CT图像j对应的边缘概率分布，V_i到V_j的传输矩阵为γ。对于传输问题，V_i描述了起点的传输物质数量，V_j描述了终点的物质数量，传输矩阵γ要满足如下条件：传输矩阵γ的第a行元素总和等于传输起点V_i在第a行的元素的值，同理，传输矩阵γ的第b列元素总和等于传输终点V_i在第b列的元素的值。用数学公式表示，即V_i和V_j之间的传输矩阵γ需要满足如下公式的约束：

其中n_i和n_j分别表示肺部CT图像i和肺部CT图像j的几何特征的大小，即2048维，

表示由1组成的大小为n_i维的向量，

表示由1组成的大小为n_j维的向量。γ表示边缘概率分布V_i和边缘概率分布V_j之间的传输矩阵，传输矩阵γ为2048×2048的矩阵。

由以上可知，在满足上述约束的下，我们可以求得多个传输矩阵γ，接下来我们将阐述如何从多个传输矩阵γ中筛选出使得V_i到V_j传输代价最小的目标传输矩阵。

S205、计算任意两个几何特征中任意两个元素之间的距离，得到距离矩阵。

具体的，两个几何特征中任意两个元素之间的距离通过如下距离计算公式得到：

其中，

为几何特征X_i在a维的值，

为几何特征X_j在b维的值，

表示

范数，即

所有元素的平方和的平方根。

C为多个几何特征之间的距离矩阵，其中，该距离矩阵C中的元素为C(a，b)，距离矩阵C为2048×2048的矩阵。

S206、基于传输矩阵与距离矩阵从多个传输矩阵中确定目标传输矩阵，目标传输矩阵使得各几何特征之间的传输代价最小。

具体的，在本发明一实施例中，首先计算各传输矩阵γ与距离矩阵C的内积，然后将内积最小时的传输矩阵γ作为目标传输矩阵γ₀。具体的，目标传输矩阵γ₀的计算公式如下：

其中，<γ，C>表示传输矩阵γ与距离矩阵C的内积，所谓内积，就是传输矩阵γ与距离矩阵C对应元素乘积之和。

需要说明的是，上述基于传输矩阵与距离矩阵从多个传输矩阵中确定目标传输矩阵的方法为对本发明的示例性的说明，在本发明其他实施例中，也可以通过其他算法计算使得各几何特征之间的传输代价最小的传输矩阵，本发明实施例在此不做限定。

S207、基于目标传输矩阵计算各肺部CT图像之间的相似度矩阵。

在本发明一具体实施例中，步骤S207可以包括如下子步骤：

S2071、计算目标传输矩阵与距离矩阵的内积作为各几何特征之间的瓦瑟斯坦距离。

具体的，计算目标传输矩阵γ₀与距离矩阵C的内积作为各几何特征之间的瓦瑟斯坦(Wasserstein)距离，具体的，瓦瑟斯坦距离计算的计算公式如下：

W_ij＝<γ₀，C>

其中，γ₀表示肺部CT图像i对应的边缘概率分布V_i到肺部CT图像j对应的边缘概率分布V_j的目标传输矩阵，W_ij表示瓦瑟斯坦距离，<γ₀，C>为肺部CT图像i对应的边缘概率分布V_i到肺部CT图像j对应的边缘概率分布V_j的目标传输矩阵与距离矩阵C的内积。

S2072、基于瓦瑟斯坦距离计算每一肺部CT图像与该肺部CT图像的K近邻内的肺部CT图像的相似度，得到相似度矩阵。

具体的，相似度矩阵的数学表达如下式所示：

其中，Ν_k(x_i)表示几何特征X_i的K近邻，β为带宽系数，

K为近邻系数，K值可以根据需要设定。所谓X_i的K近邻即几何特征X_i的K个邻近的几何特征。

相似度矩阵A中，主对角线的元素为1，即X_i＝X_j时，相似度为1。若X_i属于的X_j的K近邻，或X_j属于的X_i的K近邻，则按照

计算X_i与X_j的相似度；若X_i不属于的X_j的K近邻，或X_j不属于的X_i的K近邻，则将X_i与X_j的相似度记为0。

上述实施例中，基于瓦瑟斯坦距离计算每一肺部CT图像与该肺部CT图像的K近邻内的肺部CT图像的相似度，瓦瑟斯坦距离可以挖掘待测试肺部CT图像在高维空间的几何信息，而高维空间的几何信息正是图卷积神经网络所需要的，因此采用瓦瑟斯坦距离计算相似度矩阵，更有利于图卷积神经网络得到更准确的图像特征，提高肺结节检测的准确性。

此外，通过将每个肺部CT图像和其K近邻个肺部CT图像的特征结合在一起，利用图卷积神经网络充分学习并挖掘K近邻个肺部CT图像之间潜在的几何信息和相似关系，从而得到更准确的图像特征，提高肺结节检测的准确性。

需要说明的是，在本发明其他实施例中，也可以基于欧氏距离、余弦距离等计算每一肺部CT图像与该肺部CT图像的K近邻内的肺部CT图像的相似度，本发明实施例在此不做限定。

S208、对相似度矩阵进行正则化处理，得到正则化矩阵。

具体的，对相似度矩阵A的正则化公式如下所示：

其中，

为相似度矩阵A正则化后得到的正则化矩阵，D为对角矩阵，对角矩阵D中主对角线的元素为D_ii，D_ii＝∑_jA_ij，

即为将对角矩阵D上主对角线上的元素开方得到的矩阵。

S209、针对每一几何特征，将正则化矩阵和几何特征输入预置的图卷积神经网络中进行处理，得到图像特征。

具体的，针对每一几何特征(或者说是肺部CT图像)，将上述步骤中得到的正则化矩阵和几何特征输入预置的图卷积神经网络中进行处理，从中提取出图像特征。

图2D为本发明实施例二提供的一种图卷积神经网络的结构示意图，示例性的，如图2D所示，图卷积神经网络包括第一图卷积层、第二图卷积层和第三图卷积层。图卷积层的卷积操作的数学表达如下式所示：

其中，H^l表示通过第l层图卷积层处理后得到的特征矩阵，W^l为第l层图卷积层的图卷积参数，

为相似度矩阵A的正则化矩阵，σ为激活函数，示例性的，在本发明实施例中，选用ReLU函数作为激活函数。ReLU函数的表达式为：

f(x)＝max(0,x)

当输入为负数时，则完全不激活，ReLU函数死掉。ReLU函数输出要么是0，要么是正数。ReLU可以克服梯度消失的问题，加快训练速度。需要说明的是，在本发明的其他实施例中，图卷积层中的激活函数也可以是其他激活函数，例如，Sigmoid函数或Tanh函数，本发明实施例在此不做限定。

示例性的，在本发明一具体实施例中，步骤S209包括如下子步骤：

S2091、将正则化矩阵和几何特征输入第一图卷积层中进行卷积处理，得到第一图卷积特征。

具体的，针对每一几何特征X_i，将上述步骤中得到的正则化矩阵

和几何特征X_i输入第一图卷积层中进行卷积操作，得到第一图卷积特征H¹。示例性的，第一图卷积层的卷积操作的数学表达如下式所示：

其中，H¹表示通过第一图卷积层处理后得到的第一图卷积特征，W⁰为第一图卷积层的图卷积参数。

S2092、将正则化矩阵和第一图卷积特征输入第二图卷积层中进行卷积处理，得到第二图卷积特征。

具体的，将正则化矩阵

和第一图卷积层输出的第一图卷积特征H¹输入第二图卷积层中进行卷积处理，得到第二图卷积特征H²。示例性的，第二图卷积层的卷积操作的数学表达如下式所示：

其中，H²表示通过第二图卷积层处理后得到的第二图卷积特征，W¹为第二图卷积层的图卷积参数。

S2093、将正则化矩阵和第二图卷积特征输入第三图卷积层中进行卷积处理，得到图像特征。

具体的，将正则化矩阵

和第二图卷积层输出的第二图卷积特征H²输入第三图卷积层中进行卷积处理，得到第三图卷积特征H³。示例性的，第三图卷积层的卷积操作的数学表达如下式所示：

其中，H³表示通过第三图卷积层处理后得到的图卷积特征，即图像特征，W²为第三图卷积层的图卷积参数。

由以上可知，整个图卷积神经网络的卷积操作过程的数学表达为：

其中，W＝{W⁽⁰⁾，W⁽¹⁾，W⁽²⁾}，可以预先对图卷积神经网络进行训练，得到最优的图卷积参数。

需要说明的是，上述实施例中，以图卷积神经网络包括三个图卷积层为例对本发明实施例进行示例性说明，在本发明其他实施例中，图卷积神经网络中的图卷积层的数量可以根据分类问题和分类数据进行设定，本发明实施例在此不做限定。

S210、将图像特征输入分类器，得到各肺部CT图像存在肺结节的概率。

具体的，将上述步骤中得到的图像特征输入至预先训练好的sigmoid分类器中，sigmoid分类器把输入的图像特征映射为概率值0-1之间的实数并输出。通过设置适当的阈值t，当sigmoid函数输出的概率值大于阈值t时，则认为该肺部CT图像存在肺结节。

本发明实施例提供的肺结节检测方法，通过各肺部CT图像的几何特征计算各肺部CT图像之间的相似度矩阵，利用图卷积神经网络充分挖掘待检测的肺部CT图像之间的潜在几何信息和相似关系，能够降低肺部CT图片中血管及其他肺部阴影结构对检测结果的影响，大大提高检测精度。进一步的，本发明实施例基于瓦瑟斯坦距离计算每一肺部CT图像与该肺部CT图像的K近邻内的肺部CT图像的相似度，瓦瑟斯坦距离可以挖掘待测试肺部CT图像在高维空间的几何信息，而高维空间的几何信息正是图卷积神经网络所需要的，因此采用瓦瑟斯坦距离计算相似度矩阵，更有利于图卷积神经网络得到更准确的图像特征，提高肺结节检测的准确性。此外，通过将每个肺部CT图像和其K近邻个肺部CT图像的特征结合在一起，利用图卷积神经网络充分学习并挖掘K近邻个肺部CT图像之间潜的几何信息和相似关系，从而得到更准确的图像特征，提高肺结节检测的准确性。

实施例三

图3为本发明实施例三提供的一种肺结节检测模型训练方法的流程图，本实施例可用于本发明实施例提供的肺结节检测模型的训练，该方法可以由本发明实施例提供的肺结节检测模型训练装置来执行，该装置可以由软件和/或硬件的方式实现，通常配置于计算机设备中。如图3所示，该方法具体包括如下步骤：

S301、获取数据集，数据集包括由多张带有标签的肺部CT图像样本组成的训练集。

具体的，在本发明其中一实施例中，数据集包括由多张带有标签的肺部CT图像样本组成的训练集，标签用于标示肺部CT图像样本是否存在肺结节，在后续的实施例中，我们将训练集中的肺部CT图像样本称之为训练样本。在本发明的一具体实施例中，训练样本选用96×96×96尺寸大小的三维CT图像，即训练样本在长、宽、高三个维度的的尺寸均为96像素。

我们用D＝{x_i,y_i}ⁿ来表示训练集中的训练样本，其中，n为训练样本的数量。y_i为标签，并且y_i∈{0,1}，即训练样本属于肺结节和非肺结节两个类别，“1”表示存在肺结节，“0”表示不存在(即非肺结节)。

S302、确定肺结节检测模型，肺结节检测模型包括卷积神经网络、图卷积神经网络和第一分类器。

具体的，如图2B所示，本发明实施例提供的肺结节检测模型包括卷积神经网络、图卷积神经网络和分类器。卷积神经网络用于从肺部CT图像x_i中提取几何特征，图卷积神经网络对输入的几何特征和相似度矩阵进行处理，得到图像特征，第一分类器用于将图像特征映射为概率值0-1之间的实数并输出。

需要说明的是，上述实施例中以卷积神经网络包括5个卷积层，图卷积神经网络包括三个图卷积层为例对本发明实施例进行示例性说明，在本发明其他实施例中，卷积神经网络中的卷积层的数量可以根据需要设定，本发明实施例在此不做限定，此外，在本发明其他实施例中，卷积神经网络还可以包括残差卷积神经网络。在本发明其他实施例中，图卷积神经网络中的图卷积层的数量可以根据分类问题和分类数据进行设定，本发明实施例在此不做限定。

S303、将训练集中的肺部CT图像样本输入卷积神经网络中进行卷积处理，得到几何特征。

具体的，将训练集中各肺部CT图像样本(即训练样本)输入卷积神经网络中进行卷积处理，得到各训练样本对应的几何特征。几何特征用于表征训练样本中潜在结节(包括真结节和假结节)的几何信息。具体的，卷积神经网络对训练样本的处理过程参考本申请实施例二中卷积神经网络对肺部CT图像的处理过程，本发明实施例在此不再赘述。

S304、基于几何特征计算训练集中各肺部CT图像样本之间的相似度矩阵。

具体的，计算相似度矩阵包括如下步骤：

将每一几何特征进行归一化处理，得到各几何特征的边缘概率分布。

基于边缘概率分布计算各几何特征之间的传输矩阵，各几何特征之间包括多个传输矩阵。

计算任意两个几何特征中任意两个元素之间的距离，得到距离矩阵。

基于传输矩阵与距离矩阵从多个传输矩阵中确定目标传输矩阵，目标传输矩阵使得各几何特征之间的传输代价最小。

基于目标传输矩阵计算各肺部CT图像之间的相似度矩阵。

上述各步骤的具体过程参考本申请实施例二中对应的步骤，本发明实施例在此不再赘述。

S305、针对每一几何特征，将相似度矩阵和几何特征输入图卷积神经网络中进行处理，得到图像特征。

具体的，首先对相似度矩阵正则化，得到正则化矩阵，然后将正则化矩阵和几何特征输入图卷积神经网络中进行处理，得到图像特征。

具体的，正则化的过程和图卷积神经网络的处理过程在本发明实施例二中已有详细记载，本发明实施例在此不再赘述。

S306、将图像特征输入第一分类器，得到训练集中多个肺部CT图像样本存在肺结节的第一概率分布。

具体的，将图像特征输入第一分类器，第一分类器为sigmoid分类器，sigmoid分类器把输入的图像特征映射为概率值0-1之间的实数并输出，得到训练集中多个肺部CT图像样本存在肺结节的第一概率分布。

S307、通过损失函数计算第一概率分布与训练集中多个肺部CT图像样本的标签的真实值分布之间的第一损失值。

具体的，通过损失函数计算第一概率分布与训练集中多个肺部CT图像样本的标签的真实值分布之间的第一损失值。示例性的，在本发明一具体实施例中，计算第一概率分布与真实值分布之间的交叉熵损失作为第一损失值。具体的，第一概率分布与真实值分布之间的交叉熵损失的计算公式如下：

其中，Pr(y_i＝j|G(x_i)；θ_G；θ_C)为预测训练样本x_i为标签j的概率，θ_G为图卷积神经网络的图卷积参数，θ_C为第一分类器的参数，n为训练样本的数量，y_i为标签，并且y_i∈{0,1}，M为样本总的类别数(或标签的类比数)，本发明实施例中，标签训练样本属于肺结节和非肺结节两个类别，“1”表示存在肺结节，“0”表示不存在(即非肺结节)，即M＝2。f(y_i＝j)为判断训练样本x_i的标签是否为类别j，若是，则其值为1，若否，则其值为0。

需要说明的是，上述实施例中，以计算第一概率分布与真实值分布之间的交叉熵损失作为第一损失值为例对本发明进行示例性说明，在本发明其他实施例中，也可以计算第一概率分布与真实值分布之间的平方损失、绝对值损失和对数损失等，本发明实施例在此不做限定。

S307、基于第一损失值更新卷积神经网络、图卷积神经网络和第一分类器的参数。

具体的，将第一损失值与预设的第一阈值进行比较，在第一损失值大于第一阈值时，对肺结节检测模型中的卷积神经网络、图卷积神经网络和第一分类器的参数进行更新，并返回执行步骤S301、获取数据集；在第一损失值小于或等于第一阈值时，确定肺结节检测模型训练完成。

本发明实施例提供的肺结节检测模型训练方法，通过将训练集中的肺部CT图像样本输入卷积神经网络中进行卷积处理，得到几何特征，基于几何特征计算训练集中各肺部CT图像样本之间的相似度矩阵，针对每一几何特征，将相似度矩阵和几何特征输入图卷积神经网络中进行处理，得到图像特征，将图像特征输入第一分类器，得到训练集中多个肺部CT图像样本存在肺结节的第一概率分布，通过损失函数计算第一概率分布与训练集中多个肺部CT图像样本的标签的真实值分布之间的第一损失值，基于第一损失值更新卷积神经网络、图卷积神经网络和第一分类器的参数。通过各训练样本的几何特征计算各训练样本之间的相似度矩阵，利用图卷积神经网络充分挖掘训练样本之间的潜在几何信息和相似关系，从而能够降低训练样本中血管及其他肺部阴影结构对第一分类器的输出结果的影响，提高了肺结节检测模型训练的效率和准确性，得到更优的肺结节检测模型。

实施例四

图4A为本发明实施例四提供的一种肺结节检测模型训练方法的流程图，本实施例在上述实施例三的基础上进行细化，详细描述了训练集包括不带标签的测试集时的半监督训练过程，如图4A所示，该方法包括：

S401、获取数据集，数据集包括由多张带有标签的肺部CT图像样本组成的训练集以及由多张不带标签的肺部CT图像样本组成的测试集。

具体的，我们将训练集中的肺部CT图像样本称之为训练样本，将测试集中的肺部CT图像样本称之为测试样本。

S402、确定肺结节检测模型，肺结节检测模型包括卷积神经网络、图卷积神经网络、第一分类器和第二分类器。

本发明实施例提供的肺结节检测模型包括卷积神经网络、图卷积神经网络、第一分类器和第二分类器。卷积神经网络用于从肺部CT图像x_i中提取几何特征。第二分类器用于将几何特征映射为概率值0-1之间的实数并输出。图卷积神经网络对输入的几何特征和相似度矩阵进行处理，得到图像特征，第一分类器用于将图像特征映射为概率值0-1之间的实数并输出。

S403、将训练集中的肺部CT图像样本输入卷积神经网络中进行卷积处理，得到几何特征。

图4B为本发明实施例四中对卷积神经网络和第二分类器的训练过程的示意图，如图4所示，将训练集中的训练样本输入卷积神经网络中进行卷积处理，得到几何特征。

具体的，卷积神经网络对训练样本的处理过程参考本申请实施例二中卷积神经网络对肺部CT图像的处理过程，本发明实施例在此不再赘述。

S404、将几何特征输入第二分类器，得到训练集中各肺部CT图像样本存在肺结节的第二概率分布。

具体的，将几何特征输入第二分类器，第二分类器为sigmoid分类器，sigmoid分类器把输入的图像特征映射为概率值0-1之间的实数并输出，得到训练集中多个肺部CT图像样本存在肺结节的第二概率分布。

S405、计算第二概率分布与真实值分布之间的交叉熵损失作为第二损失值。

示例性的，在本发明一具体实施例中，计算第二概率分布与真实值分布之间的交叉熵损失作为第二损失值。具体的，第二概率分布与真实值分布之间的交叉熵损失的计算公式如下：

其中，Pr(y_i＝j|x_i；θ_E；θ_C)为预测训练样本x_i为标签j的概率，θ_E为卷积神经网络的卷积参数，θ_C为第二分类器的参数，n为训练样本的数量，y_i为标签，并且y_i∈{0,1}，M为样本总的类别数(或标签的类比数)，本发明实施例中，标签训练样本属于肺结节和非肺结节两个类别，“1”表示存在肺结节，“0”表示不存在(即非肺结节)，即M＝2。f(y_i＝j)为判断训练样本x_i的标签是否为类别j，若是，则其值为1，若否，则其值为0。

S406、基于第二损失值更新卷积神经网络和第二分类器的参数。

具体的，将第二损失值与预设的第二阈值进行比较，在第二损失值大于第一阈值时，对卷积神经网络和第二分类器的参数进行更新，并返回执行步骤S401、获取数据集；在第二损失值小于或等于第二阈值时，确定卷积神经网络和第二分类器训练完成。

需要说明的是，上述实施例中的第二分类器仅在该步骤中训练卷积神经网络和第二分类器的过程中用到，在后续的步骤中，以及模型应用过程中第二分类器不起作用。

在本发明实施例中，首先采用带标签的训练样本对卷积神经网络和第二分类器进行训练，提高卷积神经网络提取到的几何特征的准确性。

S407、将训练集中的肺部CT图像样本输入肺结节检测模型中进行处理，得到训练集中多个肺部CT图像样本存在肺结节的第一概率分布。

具体的，将训练样本输入上述步骤训练好的卷积神经网络中进行卷积处理，得到各训练样本对应的几何特征。基于几何特征计算训练样本之间的相似度矩阵。针对每一几何特征，将相似度矩阵和几何特征输入图卷积神经网络中进行处理，得到图像特征。将图像特征输入第一分类器，得到训练集中多个训练样本存在肺结节的第一概率分布。

具体的，上述处理过程在本发明前述实施例二中已有详细记载，本发明实施例在此不再赘述。

S408、通过损失函数计算第一概率分布与训练集中多个肺部CT图像样本的标签的真实值分布之间的第一损失值。

示例性的，在本发明一具体实施例中，计算第一概率分布与真实值分布之间的交叉熵损失作为第一损失值。具体的，第一损失值的计算过程在本发明前述实施例三中已有详细记载，本发明实施例在此不再赘述。

S409、基于第一损失值更新卷积神经网络、图卷积神经网络和第一分类器的参数。

S410、将测试集中的肺部CT图像样本输入肺结节检测模型进行处理，得到测试集中各肺部CT图像样本存在肺结节的概率。

具体的，将测试集中的测试样本输入上述步骤中训练好的肺结节检测模型进行处理，得到测试集中各测试样本存在肺结节的概率。肺结节检测模型对测试样本的处理过程可以参考本发明前述实施例二中对肺部CT图像的处理过程，本发明实施例在此不再赘述。

S411、基于概率确定测试集中各肺部CT图像样本的伪标签。

具体的，将肺结节检测模型输出的预测概率与概率阈值进行比较，当预测概率大于或等于概率阈值时，确定该测试样本的伪标签为阳性(存在肺结节)，当预测概率小于概率阈值时，确定该测试样本的伪标签为阴性(不存在肺结节)。

S412、将测试集中的肺部CT图像样本和伪标签作为训练集。

具体的，将测试集中的测试样本，以及上述步骤中得到的测试样本的伪标签作为训练集，并返回步骤S407、将训练集中的肺部CT图像样本输入肺结节检测模型中进行处理，得到训练集中多个肺部CT图像样本存在肺结节的第一概率分布，以重新训练肺结节检测模型。

通常，对样本标注(打标签)需要耗费大量的时间，因此，现实中带标签的样本的数量很少，而不带标签的样本很多。上述实施例通过半监督学习训练方法，将带标签的训练样本对肺结节检测模型进行训练，得到初步优化的肺结节检测模型。然后将不带标签的测试样本输入上述初步优化的肺结节检测模型中进行处理，得到测试样本的伪标签，然后将带标签的训练样本和带伪标签的测试样本一起作为训练数据，进一步对肺结节检测模型进行训练，最终得到训练好的肺结节检测模型。如此，可以减少样本标注的时间成本，次外，将训练集和测试集一起输入有利于充分挖掘训练样本和测试样本之间的相似度，从而提高模型的检测准确性。

本发明实施例提供的肺结节检测模型训练方法，通过各训练样本的几何特征计算各训练样本之间的相似度矩阵，利用图卷积神经网络充分挖掘训练样本之间的潜在几何信息和相似关系，从而能够降低训练样本中血管及其他肺部阴影结构对第一分类器的输出结果的影响，提高了肺结节检测模型训练的效率和准确性，得到更优的肺结节检测模型。通过半监督学习训练方法，减少样本标注的时间成本，次外，将训练集和测试集一起输入有利于充分挖掘训练样本和测试样本之间的相似度，从而提高模型的检测准确性。

实施例五

图5为本发明实施例五提供的一种肺结节检测装置的结构示意图，如图5所示，该肺结节检测装置包括：

图像获取模块501，用于获取待检测的多张肺部CT图像；

几何特征提取模块502，用于分别从多张所述肺部CT图像中提取出几何特征，所述几何特征用于表征潜在结节的几何信息；

相似度矩阵计算模块503，用于基于所述几何特征计算各所述肺部CT图像之间的相似度矩阵；

图像特征提取模块504，用于针对每一所述几何特征，将所述相似度矩阵和所述几何特征输入预置的图卷积神经网络中进行处理，得到图像特征；

概率确定模块505，用于基于所述图像特征确定各所述肺部CT图像存在肺结节的概率。

在本发明的一些实施例中，所述几何特征提取模块502包括：

几何特征提取子模块，用于将多张所述肺部CT图像分别输入预置的卷积神经网络中进行处理，得到几何特征。

在本发明的一些实施例中，所述卷积神经网络包括第一卷积层、第二卷积层、第一池化层、第三卷积层、第二池化层、第四卷积层、第三池化层、第五卷积层和第四池化层；

所述几何特征提取子模块包括：

第一特征提取单元，用于将所述肺部CT图像输入所述第一卷积层中进行卷积操作，得到第一特征；

第二特征提取单元，用于将所述第一特征输入所述第二卷积层中进行卷积操作，得到第二特征；

第三特征提取单元，用于将所述第二特征输入所述第一池化层中进行最大池化操作，得到第三特征；

第四特征提取单元，用于将所述第三特征输入所述第三卷积层中进行卷积操作，得到第四特征；

第五特征提取单元，用于将所述第四特征输入所述第二池化层中进行最大池化操作，得到第五特征；

第六特征提取单元，用于将所述第五特征输入所述第四卷积层中进行卷积操作，得到第六特征；

第七特征提取单元，用于将所述第六特征输入所述第三池化层中进行最大池化操作，得到第七特征；

第八特征提取单元，用于将所述第七特征输入所述第五卷积层中进行卷积操作，得到第八特征；

几何特征提取单元，用于将所述第八特征输入所述第四池化层中进行最大池化操作，得到几何特征。

在本发明的一些实施例，所述相似度矩阵计算模块503包括：

归一化处理子模块，用于对每一所述几何特征进行归一化处理，得到各所述几何特征的边缘概率分布；

传输矩阵计算子模块，用于基于所述边缘概率分布计算各所述几何特征之间的传输矩阵，各所述几何特征之间包括多个所述传输矩阵；

距离矩阵计算子模块，用于计算任意两个所述几何特征中任意两个元素之间的距离，得到距离矩阵；

目标传输矩阵确定子模块，用于基于所述传输矩阵与所述距离矩阵从多个所述传输矩阵中确定目标传输矩阵，所述目标传输矩阵使得各所述几何特征之间的传输代价最小；

相似度矩阵计算子模块，用于基于所述目标传输矩阵计算各所述肺部CT图像之间的相似度矩阵。

在本发明的一些实施例，所述目标传输矩阵确定子模块包括：

内积计算单元，用于计算所述传输矩阵与所述距离矩阵的内积；

目标传输矩阵确定单元，用于将所述内积最小时的传输矩阵作为目标传输矩阵。

在本发明的一些实施例中，所述相似度矩阵计算子模块包括：

瓦瑟斯坦距离计算单元，用于计算所述目标传输矩阵与所述距离矩阵的内积作为各所述几何特征之间的瓦瑟斯坦距离；

相似度计算单元，用于基于所述瓦瑟斯坦距离计算每一所述肺部CT图像与该肺部CT图像的K近邻内的肺部CT图像的相似度，得到相似度矩阵。

在本发明的一些实施例中，所述图卷积神经网络包括第一图卷积层、第二图卷积层和第三图卷积层，所述图像特征提取模块504包括：

正则化处理子模块，用于对所述相似度矩阵进行正则化处理，得到正则化矩阵；

第一图卷积特征提取子模块，用于将所述正则化矩阵和所述几何特征输入所述第一图卷积层中进行卷积处理，得到第一图卷积特征；

第二图卷积特征提取子模块，用于将所述正则化矩阵和所述第一图卷积特征输入所述第二图卷积层中进行卷积处理，得到第二图卷积特征；

图像特征提取子模块，用于将所述正则化矩阵和所述第二图卷积特征输入所述第三图卷积层中进行卷积处理，得到图像特征。

在本发明的一些实施例中，所述概率确定模块505包括：

概率确定子模块，用于将所述图像特征输入sigmoid分类器，得到各所述肺部CT图像存在肺结节的概率。

上述肺结节检测装置可执行本发明上述实施例一或实施例二所提供的方法，具备执行方法相应的功能模块和有益效果。

实施例六

图6为本发明实施例六提供的一种肺结节检测模型训练装置的结构示意图，如图6所示，该肺结节检测模型训练装置包括：

数据集获取模块601，用于获取数据集，所述数据集包括由多张带有标签的肺部CT图像样本组成的训练集，所述标签用于标示所述肺部CT图像样本是否存在肺结节；

检测模型确定模块602，用于确定肺结节检测模型，所述肺结节检测模型包括卷积神经网络、图卷积神经网络和第一分类器；

几何特征提取模块603，用于将所述训练集中的肺部CT图像样本输入所述卷积神经网络中进行卷积处理，得到几何特征，所述几何特征用于表征所述训练集中的肺部CT图像样本的潜在结节的几何信息；

相似度矩阵计算模块604，用于基于所述几何特征计算所述训练集中各肺部CT图像样本之间的相似度矩阵；

图像特征提取模块605，用于针对每一所述几何特征，将所述相似度矩阵和所述几何特征输入所述图卷积神经网络中进行处理，得到图像特征；

第一概率分布计算模块606，用于将所述图像特征输入所述第一分类器，得到所述训练集中多个肺部CT图像样本存在肺结节的第一概率分布；

第一损失值计算模块607，用于通过损失函数计算所述第一概率分布与所述训练集中多个肺部CT图像样本的标签的真实值分布之间的第一损失值；

第一参数更新模块608，用于基于所述第一损失值更新所述卷积神经网络、所述图卷积神经网络和所述第一分类器的参数。

在本发明的一些实施例中，所述第一损失值计算模块607包括：

第一损失值计算单元，用于计算所述第一概率分布与所述真实值分布之间的交叉熵损失作为所述第一损失值。

在本发明的一些实施例中，所述肺结节检测模型还包括第二分类器，肺结节检测模型训练装置还包括：

第二概率分布计算模块，用于在将所述训练集中的肺部CT图像样本输入所述卷积神经网络中进行卷积处理，得到几何特征之后，将所述几何特征输入所述第二分类器，得到所述训练集中各肺部CT图像样本存在肺结节的第二概率分布；

第二损失值计算模块，用于计算所述第二概率分布与所述真实值分布之间的交叉熵损失作为所述第二损失值；

第二参数更新模块，用于基于所述第二损失值更新所述卷积神经网络和所述第二分类器的参数。

在本发明的一些实施例中，所述数据集还包括由多张不带标签的肺部CT图像样本组成的测试集，肺结节检测模型训练装置还包括：

概率计算模块，用于在基于所述第一损失值更新所述卷积神经网络、所述图卷积神经网络和所述第一分类器的参数之后，将所述测试集中的肺部CT图像样本输入所述肺结节检测模型进行处理，得到所述测试集中各肺部CT图像样本存在肺结节的概率；

伪标签确定模块，用于基于所述概率确定所述测试集中各肺部CT图像样本的伪标签；

返回执行模块，用于将所述测试集中的肺部CT图像样本和伪标签作为训练集，并返回将所述训练集中的肺部CT图像样本输入所述卷积神经网络中进行卷积处理，得到第一几何特征的步骤，以重新训练所述肺结节检测模型。

上述肺结节检测模型训练装置可执行本发明上述实施例三或实施例四所提供的方法，具备执行方法相应的功能模块和有益效果。

实施例七

本发明实施例七提供了一种计算机设备，图7为本发明实施例七提供的一种计算机设备的结构示意图，如图7所示，该计算机设备包括处理器701、存储器702、通信模块703、输入装置704和输出装置705；计算机设备中处理器701的数量可以是一个或多个，图7中以一个处理器701为例；计算机设备中的处理器701、存储器702、通信模块703、输入装置704和输出装置705可以通过总线或其他方式连接，图7中以通过总线连接为例。上述处理器701、存储器702、通信模块703、输入装置704和输出装置705可以集成在计算机设备的控制主板上。

存储器702作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本实施例中的肺结节检测方法或肺结节检测模型训练方法对应的模块。处理器701通过运行存储在存储器702中的软件程序、指令以及模块，从而执行计算机设备的各种功能应用以及数据处理，即实现上述实施例提供的肺结节检测方法或肺结节检测模型训练方法。

存储器702可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据计算机设备的使用所创建的数据等。此外，存储器702可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器702可进一步包括相对于处理器701远程设置的存储器，这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

通信模块703，用于与外界设备(例如智能终端)建立连接，并实现与外界设备的数据交互。输入装置704可用于接收输入的数字或字符信息，以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。

本实施例提供的一种计算机设备，可执行本发明上述任意实施例提供的肺结节检测方法或肺结节检测模型训练方法，具体相应的功能和有益效果。

实施例八

本发明实施例八提供了一种包含计算机可执行指令的存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明上述任意实施例提供的肺结节检测方法或肺结节检测模型训练方法。

肺结节检测方法包括：

获取待检测的多张肺部CT图像；

肺结节检测模型训练方法包括：

当然，本发明实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的方法操作，还可以执行本发明实施例所提供的肺结节检测方法或肺结节检测模型训练方法中的相关操作。

需要说明的是，对于装置、设备和存储介质实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(RandomAccess Memory，RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是机器人，个人计算机，服务器，或者网络设备等)执行本发明任意实施例所述的肺结节检测方法或肺结节检测模型训练方法。

值得注意的是，上述装置中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

应当理解的是，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行装置执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种肺结节检测方法，其特征在于，包括：

获取待检测的多张肺部CT图像；

2.根据权利要求1所述的肺结节检测方法，其特征在于，所述分别从多张所述肺部CT图像中提取出几何特征，包括：

将多张所述肺部CT图像分别输入预置的卷积神经网络中进行处理，得到几何特征。

3.根据权利要求2所述的肺结节检测方法，其特征在于，所述卷积神经网络包括第一卷积层、第二卷积层、第一池化层、第三卷积层、第二池化层、第四卷积层、第三池化层、第五卷积层和第四池化层；

所述将多张所述肺部CT图像分别输入预置的卷积神经网络中进行处理，得到几何特征，包括：

将所述肺部CT图像输入所述第一卷积层中进行卷积操作，得到第一特征；

将所述第一特征输入所述第二卷积层中进行卷积操作，得到第二特征；

将所述第二特征输入所述第一池化层中进行最大池化操作，得到第三特征；

将所述第三特征输入所述第三卷积层中进行卷积操作，得到第四特征；

将所述第四特征输入所述第二池化层中进行最大池化操作，得到第五特征；

将所述第五特征输入所述第四卷积层中进行卷积操作，得到第六特征；

将所述第六特征输入所述第三池化层中进行最大池化操作，得到第七特征；

将所述第七特征输入所述第五卷积层中进行卷积操作，得到第八特征；

将所述第八特征输入所述第四池化层中进行最大池化操作，得到几何特征。

4.根据权利要求1-3任一所述的肺结节检测方法，其特征在于，所述基于所述几何特征计算各所述肺部CT图像之间的相似度矩阵，包括：

对每一所述几何特征进行归一化处理，得到各所述几何特征的边缘概率分布；

基于所述边缘概率分布计算各所述几何特征之间的传输矩阵，各所述几何特征之间包括多个所述传输矩阵；

计算任意两个所述几何特征中任意两个元素之间的距离，得到距离矩阵；

基于所述传输矩阵与所述距离矩阵从多个所述传输矩阵中确定目标传输矩阵，所述目标传输矩阵使得各所述几何特征之间的传输代价最小；

基于所述目标传输矩阵计算各所述肺部CT图像之间的相似度矩阵。

5.根据权利要求4所述的肺结节检测方法，其特征在于，所述基于所述传输矩阵与所述距离矩阵从多个所述传输矩阵中确定目标传输矩阵，包括：

计算所述传输矩阵与所述距离矩阵的内积；

将所述内积最小时的传输矩阵作为目标传输矩阵。

6.根据权利要求4所述的肺结节检测方法，其特征在于，所述基于所述目标传输矩阵计算各所述肺部CT图像之间的相似度矩阵，包括：

计算所述目标传输矩阵与所述距离矩阵的内积作为各所述几何特征之间的瓦瑟斯坦距离；

基于所述瓦瑟斯坦距离计算每一所述肺部CT图像与该肺部CT图像的K近邻内的肺部CT图像的相似度，得到相似度矩阵。

7.根据权利要求1-3任一所述的肺结节检测方法，其特征在于，所述图卷积神经网络包括第一图卷积层、第二图卷积层和第三图卷积层，所述针对每一所述几何特征，将所述相似度矩阵和所述几何特征输入预置的图卷积神经网络中进行处理，得到图像特征，包括：

对所述相似度矩阵进行正则化处理，得到正则化矩阵；

将所述正则化矩阵和所述几何特征输入所述第一图卷积层中进行卷积处理，得到第一图卷积特征；

将所述正则化矩阵和所述第一图卷积特征输入所述第二图卷积层中进行卷积处理，得到第二图卷积特征；

将所述正则化矩阵和所述第二图卷积特征输入所述第三图卷积层中进行卷积处理，得到图像特征。

8.根据权利要求1-3任一所述的肺结节检测方法，其特征在于，所述基于所述图像特征确定各所述肺部CT图像存在肺结节的概率，包括：

将所述图像特征输入分类器，得到各所述肺部CT图像存在肺结节的概率。

9.一种肺结节检测模型训练方法，其特征在于，包括：

10.根据权利要求9所述的肺结节检测模型训练方法，其特征在于，所述通过损失函数计算所述第一概率分布与所述训练集中多个肺部CT图像样本的标签的真实值分布之间的第一损失值，包括：

计算所述第一概率分布与所述真实值分布之间的交叉熵损失作为所述第一损失值。

11.根据权利要求9所述的肺结节检测模型训练方法，其特征在于，所述肺结节检测模型还包括第二分类器，在将所述训练集中的肺部CT图像样本输入所述卷积神经网络中进行卷积处理，得到几何特征之后，还包括：

将所述几何特征输入所述第二分类器，得到所述训练集中各肺部CT图像样本存在肺结节的第二概率分布；

计算所述第二概率分布与所述真实值分布之间的交叉熵损失作为第二损失值；

基于所述第二损失值更新所述卷积神经网络和所述第二分类器的参数。

12.根据权利要求9-11任一所述的肺结节检测模型训练方法，其特征在于，所述数据集还包括由多张不带标签的肺部CT图像样本组成的测试集，在基于所述第一损失值更新所述卷积神经网络、所述图卷积神经网络和所述第一分类器的参数之后，还包括：

将所述测试集中的肺部CT图像样本输入所述肺结节检测模型进行处理，得到所述测试集中各肺部CT图像样本存在肺结节的概率；

基于所述概率确定所述测试集中各肺部CT图像样本的伪标签；

将所述测试集中的肺部CT图像样本和伪标签作为训练集，并返回将所述训练集中的肺部CT图像样本输入所述卷积神经网络中进行卷积处理，得到第一几何特征的步骤，以重新训练所述肺结节检测模型。

13.一种肺结节检测装置，其特征在于，包括：

图像获取模块，用于获取待检测的多张肺部CT图像；

14.一种肺结节检测模型训练装置，其特征在于，包括：

15.一种计算机设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-8中任一所述的肺结节检测方法，或实现如权利要求9-12中任一所述的肺结节检测模型训练方法。

16.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-8中任一所述的肺结节检测方法，或实现如权利要求9-12中任一所述的肺结节检测模型训练方法。