CN113379773B - 基于双重注意力机制的分割模型建立、分割方法及装置 - Google Patents
基于双重注意力机制的分割模型建立、分割方法及装置 Download PDFInfo
- Publication number
- CN113379773B CN113379773B CN202110590827.2A CN202110590827A CN113379773B CN 113379773 B CN113379773 B CN 113379773B CN 202110590827 A CN202110590827 A CN 202110590827A CN 113379773 B CN113379773 B CN 113379773B
- Authority
- CN
- China
- Prior art keywords
- medical image
- segmentation
- dual
- attention
- segmented
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/40—ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10088—Magnetic resonance imaging [MRI]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Radiology & Medical Imaging (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Image Analysis (AREA)
Abstract
本发明属于医疗影像分割领域,公开了一种基于双重注意力机制的分割模型建立、分割方法及装置,分割方法用于获取原始医学图像数据集,对每张原始医学图像标注类别和目标区域获得带标签的医学图像数据集;建立Mask R‑CNN分割网络,Mask R‑CNN分割网络包括特征金字塔网络和双重注意力模块,的双重注意力模块设置在特征金字塔网络的残差块中,的双重注意力模块包括串联的通道关注模块和空间关注模块且的双重注意力模块设置在特征金字塔网络中的卷积残差块和恒等残差块之中;利用带标签的医学图像数据集训练Mask R‑CNN分割网络,训练结束后获得基于双重注意力机制的分割模型。本发明引入了双重注意力机制,优化了分割的边界,而且能减少漏分割、误分割的现象。
Description
技术领域
本发明属于医疗影像分割领域,具体涉及一种基于双重注意力机制的分割 模型建立、分割方法及装置。
背景技术
随着计算机视觉的发展,特别是卷积神经网络表示能力的提升,图像分割 领域已经取得了极大地发展,这为医疗影像的分割应用奠定了坚实的基础。生 物医疗影像分割作为计算机辅助诊断的一项重要而又困难的工作,是进一步获 取诊断信息的关键。在传统的诊疗系统中,医学图像分割需要专业的医生手动 进行,不仅费时费力,还容易受主观因素的影响。然而基于深度学习进行的分 割以其人类不可比拟的速度和越来越高的准确率正成为医生诊断的重要参考 依据。但是,相较于普通图像的分割结果,临床诊断对医疗影像的分割结果的 准确性提出了更高的要求,除此之外,医学图像的高变异性,形态结构的复杂 性和模糊性以及稀缺的标注标签都对医学图像分割提出了极大地挑战。
随着深度卷积神经网络表示能力的不断提升,尤其是全卷积神经网络 (FCNs)的应用,医学图像的分割不断取得突破。例如,U-Net通过设计了一 种‘U’形的网络和增加了一个对称的扩张路径去增强网络的定位表示能力,无 论是需要的数据量,效率还是准确率,都明显优于先前的方法。U-net及其变 体在CT和MRI等医学影像上表现良好,一方面原因是CT和MRI等的影像 语义较为简单,结构较为固定,U-net的skip connection发挥了重要的作用, 另一方面,U-net网络参数少,面对相对较少的医学数据集不容易过拟合。
由于影像中病灶的纹理、颜色、形态、大小变化各异,边界模糊不清楚, 数量有限,因此,卷积神经网络能否提取有效特征信息成为准确分割的关键, 此外,影像拍摄时的伪影,光照(例如光照的强度大小、反光等),气泡,毛 发遮挡,背景板,标尺等都给分割任务带来了重重困难。对于口腔白斑数据集 来说,白斑分割任务难点在于形态表现出多样性,有颗粒状、皱纸状、疣状等, 斑块的大小不一,界限与周围组织不明显,发生部位多变等。更具有挑战的是, 白斑分割任务只能依靠二维图像提供的信息,难以综合利用诸如质感、触感等 其他维度更抽象的信息。
发明内容
本发明的目的在于提供一种基于双重注意力机制的分割模型建立、分割方 法及装置,用以解决现有技术中的病灶区域的特征提取能力较弱,分割结果不 精确的问题。
为了实现上述任务,本发明采用以下技术方案:
一种基于双重注意力机制的分割模型建立方法,包括如下步骤:
步骤1:获取原始医学图像数据集,对每张原始医学图像标注类别和目标 区域获得带标签的医学图像数据集;
步骤2:建立Mask R-CNN分割网络,所述Mask R-CNN分割网络包括特 征金字塔网络和双重注意力模块,所述的双重注意力模块设置在特征金字塔网 络的残差块中,所述的双重注意力模块包括串联的通道关注模块和空间关注模 块且所述的双重注意力模块设置在特征金字塔网络中的卷积残差块和恒等残 差块之中;
步骤3:利用带标签的医学图像数据集训练Mask R-CNN分割网络,训练 结束后获得基于双重注意力机制的分割模型。
进一步的,对每张原始医学图像标注目标区域包括两种情况,情况一为对 原始医学图像标注目标形状获得像素级标注医学图像数据集作为带标签的医 学图像数据,情况二为对每张原始医学图像利用box标注目标所在矩形框获得 目标框级标注医学图像数据集作为带标签的医学图像数据。
一种基于双重注意力机制的分割方法,包括如下步骤:
步骤一:获取待分割原始医学图像;
步骤二:采用如基于双重注意力机制的分割模型建立方法获得基于双重注 意力机制的分割模型;
步骤三:若训练步骤二中模型的标签集为像素级标注医学图像数据集,则 将待分割原始医学图像输入基于双重注意力机制的分割模型中,获得待分割原 始医学图像的目标形状和类别;
若训练步骤二中模型的标签集为目标框级标注医学图像数据集,则将待分 割原始医学图像输入基于双重注意力机制的分割模型中,获得待分割原始医学 图像的目标框和类别,将待分割原始医学图像的目标框依次进行GrabCut和 ConvCRF,获得待分割原始医学图像的目标形状。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序 被处理器执行时实现如基于双重注意力机制的分割方法。
一种基于双重注意力机制的分割装置,该装置包括处理器和用于存储能够 在处理器上运行的多个功能模块的存储器,所述功能模块包括基于双重注意力 机制的分割模型和分割模块;
所述的基于双重注意力机制的分割模型采用如权利要求2的基于双重注 意力机制的分割模型建立方法获得;
所述的分割模块用于获取待分割原始医学图像,若训练基于双重注意力机 制的分割模型的标签集为像素级标注医学图像数据集,则将待分割原始医学图 像输入基于双重注意力机制的分割模型中,获得待分割原始医学图像的目标形 状和类别;若训练基于双重注意力机制的分割模型的标签集为目标框级标注医 学图像数据集,则将待分割原始医学图像输入基于双重注意力机制的分割模型 中,获得待分割原始医学图像的目标框和类别,将待分割原始医学图像的目标 框依次进行GrabCut和ConvCRF,获得待分割原始医学图像的目标形状。
本发明与现有技术相比具有以下技术特点:
(1)本发明在Mask RCNN中引入了双重注意力机制,提出了Att-Mask RCNN网络,增强对病灶区域的特征提取能力。通过注意力机制,使网络专注 于重要的特性,抑制了不必要的特性,这种方式增加了卷积网络的表示能力。 通过调整特征图,网络不仅表现更好,而且对噪声输入有更强的鲁棒性。实验 证明,注意力机制不仅可以优化分割的边界,而且能减少漏分割、误分割的现 象。
(2)针对医学图像的分割难点,常规分割网络难以有效提取感兴趣的区 域特征,分割表现受限的挑战,本发明引入了双重注意力机制,提出了Att-Mask RCNN网络。该网络将弱监督分割采用框级别的标注作为输入标签,充分利用 分割性能优秀同时具备目标检测能力,舍弃了强监督分割分支,增加了一个弱 监督分割分支来实现最终的弱监督分割目标。框级别标注最大的优点是可以训 练出较好的定位能力,锚定目标的位置。
(3)本发明构建了一个端到端的医学图像分割框架,可以进行准确的病 灶分割,实现了计算机辅助诊断,为医生的诊断提供重要的参考信息;
(4)针对医学影像强监督分割标注效率低下,成本昂贵的问题,我们提 出了一种基于框级别标注的弱监督分割网络,实现了媲美强监督分割效果。
附图说明
图1为基于双重关注机制的医学影像分割框架;
图2为双重关注整体结构;
图3为恒等残差块和卷积残差块示意图;
图4为全监督分割方法和弱监督方法在ISIC 2018数据集中的分割结果展 示;
图5为全监督分割方法和弱监督分割方法在口腔白斑数据集中的分割结 果展示;
图6为对比例中加入双重注意力机制的医学影像分割框架。
具体实施方式
ResNets:由何凯明等人在2015年发表的论文《Deep Residual Learning forImage Recognition》中提出,中文名字叫作深度残差网络,主要作用是图像分 类。现在在图像分割、目标检测等领域都有很广泛的运用,成为基础的骨干网 络,根据网络层数的划分,分为ResNet18,ResNet34,ResNet50,ResNet101和 ResNet152等。
Mask R-CNN:由何凯明等人在2017年发表的论文《Mask R-CNN》中提 出,是一个双阶段的通用实例分割(实例分割不仅需要找到图像中的目标,还 需要对其进行分割。)模型。该模型在原有的Faster R-CNN的基础上,通过 为在每个感兴趣区域上添加预测分割遮罩分支实现分割功能,因其具有良好的 性能和结构设计可以泛化到其他的任务,如实例分割、物体边缘检测、人体关 键点检测等。
FPN:中文名叫特征金字塔网络,该网络通过引入了下采样、上采样和横 向连接的过程能够在增加较少计算量的前提下融合低分辨率语义信息较强的 特征图和高分辨率语义信息较弱但空间信息丰富的特征图,解决小目标检测能 力不足问题。
box-level:是弱监督分割任务中输入标签的级别,所谓弱监督分割,就是 用更容易获得的真值标注替代逐像素的真值标注,常见的输入有图像级别 (image-level)和边界框级别(box-level)。图像级别标注中一张图片的目标 分类代表一个标签,box-level用一个紧贴图像中目标的矩形框给出目标位置信 息和分类标签。
GrabCut:GrabCut是在论文《"GrabCut"-Interactive Foreground Extractionusing Iterated Graph Cuts》中提出的一种前景和后景分割算法。该算法利用了 图像中的纹理(颜色)信息和边界(反差)信息,只要少量的用户交互操作即 可得到比较好的分割结果。
ConvCRF:在《Convolutional CRFs for Semantic Segmentation》论文中被 提出,是一种结合随机条件场与卷积神经网络的高效分割优化方法,该方法能 以卷积运算的方式解决CRF训练速度慢和训练难的问题,可以用在图像分割 的后处理优化阶段上。
Keras框架:Keras框架是一个用Python编写的高级神经网络API,它能 够以TensorFlow,CNTK,或者Theano作为后端运行。Keras封装了很多高层 的神经网络模块,例如全连接层(Dense),卷积层(Conv2D),长短时记忆 模型(LSTM)等等,让实现神经网络的过程更加简单有效。
在本实施例中公开了一种基于双重注意力机制的分割模型建立方法,包括 如下步骤:
步骤1:获取原始医学图像数据集,对每张原始医学图像标注类别和目标 区域获得带标签的医学图像数据集;
步骤2:建立Mask R-CNN分割网络,所述Mask R-CNN分割网络包括特 征金字塔网络和双重注意力模块,所述的双重注意力模块设置在特征金字塔网 络的残差块中,所述的双重注意力模块包括串联的通道关注模块和空间关注模 块且所述的双重注意力模块设置在特征金字塔网络中的卷积残差块和恒等残 差块之中;
步骤3:利用带标签的医学图像数据集训练Mask R-CNN分割网络,训练 结束后获得基于双重注意力机制的分割模型。
实施例1
在本实施例中公开了一种基于双重注意力机制的分割模型建立方法,在本 实施例中,对每张原始医学图像标注目标区域包括两种情况,情况一为对原始 医学图像标注目标形状获得像素级标注医学图像数据集作为带标签的医学图 像数据,情况二为对每张原始医学图像利用box标注目标所在矩形框获得目标 框级标注医学图像数据集作为带标签的医学图像数据。
具体的,目标一般为病灶,在本实施例中为口腔白斑,类别一般为病灶类 型,常见病灶类型包括颗粒状、皱纸状、疣状等。
具体的,步骤3中,若采用像素级标注医学图像数据集训练,则获得全监 督分割模型,训练过程和原始的Mask R-CNN相同,训练时候更新检测分支和 分割分支参数分支,推理阶段会在分割分支生成最终分割结果。若采用目标框 级标注医学图像数据集训练,则获得弱监督分割模型。弱监督分割模型的训练 过程区别于强监督过程,它使用框级别的弱监督标签数据集进行,只会训练更 新检测分支的参数,实质上是训练一个目标检测网络的过程。在推理阶段,检 测分支将会提供目标的矩形检测边界框。
具体的,所述的双重注意力模块用于给定输入特征,通过通道关注模块在 通道轴上计算出一维的通道关注图,通过空间关注模块在空间轴上计算出二维 的空间关注图,串联通道关注图和空间关注图计算出最终的特征图。
具体的,所述的特征金字塔网络(FPN)中包含三个过程,分别是:
1.自底向上的过程。自底向上的过程以ResNets为例,使用每个阶段的最 后一层residual block输出的特征激活为输出,将conv2,conv3,conv4和conv5 这些最后residual block的输出表示为C2,C3,C4,C5。
2.横向连接。采用1×1的卷积核进行连接。
3.自上而下的过程是将更抽象、语义信息更强的高层特征进行上采样,通 过横向连接将上采样的输出结果和自底向上生成的feature map进行融合。
具体的,所述的双重注意力模块设置在特征金字塔网络(FPN)自底向上 的过程中,具体是设置在ResNets中的如图3所示的卷积残差块和恒等残差块 之中。
在本实施例中还公开了一种基于双重注意力机制的分割方法,包括如下步 骤:
步骤一:获取待分割原始医学图像;
步骤二:采用本实施例中所述的基于双重注意力机制的分割模型建立方法 获得基于双重注意力机制的分割模型;
步骤三:若训练步骤二中模型的标签集为像素级标注医学图像数据集,则 将待分割原始医学图像输入基于双重注意力机制的分割模型中,获得待分割原 始医学图像的目标形状和类别;
若训练步骤二中模型的标签集为目标框级标注医学图像数据集,则将待分 割原始医学图像输入基于双重注意力机制的分割模型中,获得待分割原始医学 图像的目标框和类别,将待分割原始医学图像的目标框依次进行GrabCut和 ConvCRF,获得待分割原始医学图像的目标形状。
在本实施例中还公开了一种计算机可读存储介质,其上存储有计算机程 序,其特征在于,该程序被处理器执行时实现如权利要求2的基于双重注意力 机制的分割方法。
在本实施例中还公开了一种基于双重注意力机制的分割装置,该装置包括 处理器和用于存储能够在处理器上运行的多个功能模块的存储器,所述功能模 块包括基于双重注意力机制的分割模型和分割模块;
所述的基于双重注意力机制的分割模型采用本实施例中基于双重注意力 机制的分割模型建立方法获得;
所述的分割模块用于获取待分割原始医学图像,若训练基于双重注意力机 制的分割模型的标签集为像素级标注医学图像数据集,则将待分割原始医学图 像输入基于双重注意力机制的分割模型中,获得待分割原始医学图像的目标形 状和类别;若训练基于双重注意力机制的分割模型的标签集为目标框级标注医 学图像数据集,则将待分割原始医学图像输入基于双重注意力机制的分割模型 中,获得待分割原始医学图像的目标框和类别,将待分割原始医学图像的目标 框依次进行GrabCut和ConvCRF,获得待分割原始医学图像的目标形状。
实施例2
在本实施例中公开了一种基于双重注意力机制的分割装置如图1所示,在 该实施例中,使用Keras框架,选用了ResNet-50作为骨干网络,采用了COCO 作为预训练模型,batch size,learning rate,weight decay,momentum,和Epoch分 别为4,0.01,10-4,0.9,60,优化器为ADAM,进行了旋转,仿射变换和随 机裁剪等的数据增强。实验机器为单卡GeForce RTX 24G GPUs。选用了标准 的F1-Score,Sensitivity Specificity,Accuracy,Jaccard similarity来评价模型。
本实施例中的数据集采用ISIC 2018挑战赛数据集,该数据集是由InternationalSkin Imaging Collaboration(ISIC)在2018公布,选用了挑战赛任务 1的皮肤镜图像病变边界分割数据集,包含了2594张原始图片和对应的二值 掩码真值标注。为了能和其他的方法对比,本发明和其他的方法进行了相同的 设置,划分训练集1815张,验证集259张,测试集520。将图片输入大小设 置768x 768。在全监督分割中,标签是原始数据集的二值掩码值,在弱监督 分割中,标签是原始数据集病变区域的紧贴外界矩形框。
图4展示了一些本发明提出的全监督分割方法和弱监督分割方法的分割 结果,在表1中,本发明和其他的一些未采用双重注意力机制的方法进行了对 比,可以看出,本发明提出的全监督分割方法,不仅相较于原始的Mask RCNN 的分割方法有较大的提升,而且相较于其他的全监督方法也取得了具有竞争了 的结果;本发明的弱监督分割方法也取得了媲美全监督分割方法的表现,甚至 超过了一些全监督的分割方法。
表1.本发明提出的分割网络与其他方法在ISIC 2018数据集的分割表现比较
实施例3
在本实施例中公开了一种基于双重注意力机制的分割装置如图1所示,在 实施例1的基础上,本实施例采用从医院获取到的口腔白斑医学图像数据集作 为原始数据集。口腔白斑是一种口腔黏膜的损伤,是一种癌前病变。
口腔白斑医学图像数据集包含了90张原始图像和对应的由专业医生标注 的掩码标注图像。我们划分了训练集为77张,验证集为13张。相比于ISIC 2018 数据集,口腔白斑数据集的分割任务更具有挑战性,不仅数量稀少,数量仅为 ISIC 2018数据集的3%,而且,病损区域的边界更加模糊不清,形态不规则和 多变。在全监督分割实验中,输入的真值标签是原始数据集的二值掩码值,在 弱监督分割实验中,输入的真值标签是原始数据集病变区域的紧贴外界矩形 框。
图5展示了一些本发明提出的全监督分割方法和弱监督分割方法在口腔 白斑数据集上分割结果。在表2中本发明的方法同样也和其他的一些先进方法 进行了对比,不难发现,其中一些在皮肤病数据集表现优异的分割方法在口腔 白斑数据集上效果严重下降,与此同时,本发明所提出的全监督分割方法取得 了最好的效果,弱监督的方法也达到了全监督的90%。由此可见本发明提出的 方法的有效性和先进性。
表2.提出的分割网络与其他方法在口腔白斑数据集的分割表现比较
上述实施例中,提出了一个端到端的医学图像的分割框架(图2),在这 个框架里,如果需要分割的对象有像素级的分割标签,可以利用全监督分支得 到精细的分割结果,但是如果只有box-level的标签,依然可以利用弱监督分 割分支得到媲美全监督的分割结果。在整个框架里,通过在多层FPN网络中 加入了双重注意力机制来提高网络的分割性能。图4和图5展示的分割结果对 比中可以看出,加入关注机制后,本发明提出的全监督分割方法相比原始的 Mask R-CNN网络不仅能减少误分割、漏分割的现象,而且边界细节分割更加精确。关注机制能帮助网络从输入图像中提取更加有用、更加丰富的特征。特 别实在口腔白斑数据集中,由于口腔白斑数据集数量少,图像尺寸极大,达到 了7630x4512的高清级别,病灶区域的尺度变化极大,常规的网络多次卷积 后虽然提取到了更加高层次的特征,但是也会丢失大量的细节,如果病灶区域 较小的话,就会被忽略掉,导致出现漏分割的现象,相反,本发明的基于双重 关注的特征金字塔网络能对语义信息更加丰富的高层次特征和分辨率更高的 低层次特征进行融合,有效减少漏分割的现象。在弱监督分割方法中,得益于 融合了关注机制的检测分支,对病损区域的定位能力大为提升,为GrabCut 的分割提供了准确的box坐标。
本发明的端到端医学分割框架,它同时集成了全监督和弱监督分割分支。 实验证明,通过在Mask RCNN中加入双重注意力机制,网络能关注重要区域 的特征,抑制不重要的特征,提高了对病灶的定位能力,不仅提高了全监督分 割的效果,还为弱监督分支提供了更加准确的边界框。在弱监督分割中,相比 其他一般的方法使用伪标签来进行训练,该方法能大幅减少真值标签和伪标签 的差距,实现媲美全监督分割的效果。在ISIC 2018数据集和口腔数据集上的 实验结果证明了方法的先进性。
对比例1
本对比例公开了一种基于双重注意力机制的分割模型建立方法,如图6 所示,该方法在Mask RCNN中也加入了双重注意力机制,但其加入位置与上 述实施例不同,本实施例在ResNets网络的{C2,C3,C4,C5}每个阶段后加 入双重注意力机制,增强ResNets骨干网络的特征提取能力。
相较于上述实施例中图1所示的分割模型,该模型在ISIC2018数据集上 的表现如表3所示:
表3 ISIC2018数据集上两种全监督分割方法效果对比
相较于实施例1和实施例2中图1所示的分割模型,该模型在口腔白斑数 据集上的表现如表4所示:
表4口腔白斑数据集上两种全监督分割方法效果对比
从上述表格可以看出,将双重注意力模块设置在特征金字塔网络中的卷积 残差块和恒等残差块之中将会获得比其他位置更好的分割效果。
Claims (3)
1.基于双重注意力机制的分割方法,其特征在于,包括如下步骤:
步骤一:获取待分割原始医学图像;
步骤二:构建基于双重注意力机制的分割模型,构建方法包括如下子步骤:
步骤1:获取原始医学图像数据集,对每张原始医学图像标注类别和目标区域获得带标签的医学图像数据集;其中,对每张原始医学图像标注目标区域包括两种情况,情况一为对原始医学图像标注目标形状获得像素级标注医学图像数据集作为带标签的医学图像数据,情况二为对每张原始医学图像利用box标注目标所在矩形框获得目标框级标注医学图像数据集作为带标签的医学图像数据;
步骤2:建立Mask R-CNN分割网络,所述Mask R-CNN分割网络包括特征金字塔网络和双重注意力模块,所述的双重注意力模块设置在特征金字塔网络的残差块中,所述的双重注意力模块包括串联的通道关注模块和空间关注模块且所述的双重注意力模块设置在特征金字塔网络中的卷积残差块和恒等残差块之中;所述的双重注意力模块用于给定输入特征,通过通道关注模块在通道轴上计算出一维的通道关注图,通过空间关注模块在空间轴上计算出二维的空间关注图,串联通道关注图和空间关注图计算出最终的特征图;
步骤3:利用带标签的医学图像数据集训练Mask R-CNN分割网络,训练结束后获得基于双重注意力机制的分割模型;
步骤三:若训练步骤二中模型的标签集为像素级标注医学图像数据集,则将待分割原始医学图像输入基于双重注意力机制的分割模型中,获得待分割原始医学图像的目标形状和类别;
若训练步骤二中模型的标签集为目标框级标注医学图像数据集,则将待分割原始医学图像输入基于双重注意力机制的分割模型中,获得待分割原始医学图像的目标框和类别,将待分割原始医学图像的目标框依次进行GrabCut和ConvCRF,获得待分割原始医学图像的目标形状。
2.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1的基于双重注意力机制的分割方法。
3.基于双重注意力机制的分割装置,其特征在于,该装置包括处理器和用于存储能够在处理器上运行的多个功能模块的存储器,所述功能模块包括基于双重注意力机制的分割模型和分割模块;
所述的基于双重注意力机制的分割模型采用如权利要求1的基于双重注意力机制的分割方法中的步骤二获得;
所述的分割模块用于获取待分割原始医学图像,若训练基于双重注意力机制的分割模型的标签集为像素级标注医学图像数据集,则将待分割原始医学图像输入基于双重注意力机制的分割模型中,获得待分割原始医学图像的目标形状和类别;若训练基于双重注意力机制的分割模型的标签集为目标框级标注医学图像数据集,则将待分割原始医学图像输入基于双重注意力机制的分割模型中,获得待分割原始医学图像的目标框和类别,将待分割原始医学图像的目标框依次进行GrabCut和ConvCRF,获得待分割原始医学图像的目标形状。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110590827.2A CN113379773B (zh) | 2021-05-28 | 2021-05-28 | 基于双重注意力机制的分割模型建立、分割方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110590827.2A CN113379773B (zh) | 2021-05-28 | 2021-05-28 | 基于双重注意力机制的分割模型建立、分割方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113379773A CN113379773A (zh) | 2021-09-10 |
CN113379773B true CN113379773B (zh) | 2023-04-28 |
Family
ID=77574763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110590827.2A Active CN113379773B (zh) | 2021-05-28 | 2021-05-28 | 基于双重注意力机制的分割模型建立、分割方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113379773B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114332463A (zh) * | 2021-12-31 | 2022-04-12 | 成都工业职业技术学院 | 一种mr脑肿瘤图像实例分割方法、装置、设备及存储介质 |
CN114693925B (zh) * | 2022-03-15 | 2024-09-27 | 平安科技(深圳)有限公司 | 图像分割的方法、装置、计算机设备及存储介质 |
CN114821072B (zh) * | 2022-06-08 | 2023-04-18 | 四川大学 | 一种从动态冰图像中提取气泡的方法、装置、设备和介质 |
CN115331245B (zh) * | 2022-10-12 | 2023-02-03 | 中南民族大学 | 一种基于图像实例分割的表格结构识别方法 |
CN115831329B (zh) * | 2022-12-21 | 2023-08-18 | 青海大学附属医院 | 融合医生关注图像的包虫分类模型构建方法、系统及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10430946B1 (en) * | 2019-03-14 | 2019-10-01 | Inception Institute of Artificial Intelligence, Ltd. | Medical image segmentation and severity grading using neural network architectures with semi-supervised learning techniques |
CN111160311A (zh) * | 2020-01-02 | 2020-05-15 | 西北工业大学 | 基于多注意力机制双流融合网络的黄河冰凌语义分割方法 |
CN111681252A (zh) * | 2020-05-30 | 2020-09-18 | 重庆邮电大学 | 一种基于多路径注意力融合的医学图像自动分割方法 |
WO2020244108A1 (en) * | 2019-06-05 | 2020-12-10 | Boe Technology Group Co., Ltd. | Methods and apparatuses for semantically segmenting input image, and computer-program product |
CN112465830A (zh) * | 2020-11-11 | 2021-03-09 | 上海健康医学院 | 一种磨玻璃样肺结节自动分割方法及计算机设备 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109949317B (zh) * | 2019-03-06 | 2020-12-11 | 东南大学 | 基于逐步对抗学习的半监督图像实例分割方法 |
CN110111340B (zh) * | 2019-04-28 | 2021-05-14 | 南开大学 | 基于多路割的弱监督实例分割方法 |
CN110189334B (zh) * | 2019-05-28 | 2022-08-09 | 南京邮电大学 | 基于注意力机制的残差型全卷积神经网络的医学图像分割方法 |
CN110532955B (zh) * | 2019-08-30 | 2022-03-08 | 中国科学院宁波材料技术与工程研究所 | 基于特征注意力和子上采样的实例分割方法和装置 |
US11461998B2 (en) * | 2019-09-25 | 2022-10-04 | Samsung Electronics Co., Ltd. | System and method for boundary aware semantic segmentation |
CN110910414B (zh) * | 2019-10-31 | 2022-05-17 | 五邑大学 | 图像轮廓生成方法、图像标注方法、电子装置及存储介质 |
CN111178213B (zh) * | 2019-12-23 | 2022-11-18 | 大连理工大学 | 一种基于深度学习的航拍车辆检测方法 |
CN111161290B (zh) * | 2019-12-27 | 2023-04-18 | 西北大学 | 一种图像分割模型的构建方法、图像分割方法及系统 |
CN112150428B (zh) * | 2020-09-18 | 2022-12-02 | 青岛大学 | 一种基于深度学习的医学图像分割方法 |
CN112270280B (zh) * | 2020-11-02 | 2022-10-14 | 重庆邮电大学 | 一种基于深度学习的遥感图像中的露天矿场检测方法 |
CN112330696B (zh) * | 2020-12-02 | 2022-08-09 | 青岛大学 | 人脸分割方法、装置及计算机可读存储介质 |
CN112651978B (zh) * | 2020-12-16 | 2024-06-07 | 广州医软智能科技有限公司 | 舌下微循环图像分割方法和装置、电子设备、存储介质 |
CN112613519B (zh) * | 2020-12-18 | 2023-11-24 | 浙江大华技术股份有限公司 | 图像分割方法、网络的训练方法、电子设备及存储介质 |
CN112733708A (zh) * | 2021-01-08 | 2021-04-30 | 山东交通学院 | 一种基于半监督学习的肝门静脉检测定位方法与系统 |
CN112836713B (zh) * | 2021-03-12 | 2024-11-05 | 南京大学 | 基于图像无锚框检测的中尺度对流系统识别与追踪方法 |
-
2021
- 2021-05-28 CN CN202110590827.2A patent/CN113379773B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10430946B1 (en) * | 2019-03-14 | 2019-10-01 | Inception Institute of Artificial Intelligence, Ltd. | Medical image segmentation and severity grading using neural network architectures with semi-supervised learning techniques |
WO2020244108A1 (en) * | 2019-06-05 | 2020-12-10 | Boe Technology Group Co., Ltd. | Methods and apparatuses for semantically segmenting input image, and computer-program product |
CN111160311A (zh) * | 2020-01-02 | 2020-05-15 | 西北工业大学 | 基于多注意力机制双流融合网络的黄河冰凌语义分割方法 |
CN111681252A (zh) * | 2020-05-30 | 2020-09-18 | 重庆邮电大学 | 一种基于多路径注意力融合的医学图像自动分割方法 |
CN112465830A (zh) * | 2020-11-11 | 2021-03-09 | 上海健康医学院 | 一种磨玻璃样肺结节自动分割方法及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113379773A (zh) | 2021-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113379773B (zh) | 基于双重注意力机制的分割模型建立、分割方法及装置 | |
Chan et al. | Texture-map-based branch-collaborative network for oral cancer detection | |
Rehman et al. | RAAGR2-Net: A brain tumor segmentation network using parallel processing of multiple spatial frames | |
CN112150428A (zh) | 一种基于深度学习的医学图像分割方法 | |
CN113506310B (zh) | 医学图像的处理方法、装置、电子设备和存储介质 | |
CN114399510B (zh) | 结合图像和临床元数据的皮肤病灶分割和分类方法及系统 | |
CN112446892A (zh) | 一种基于注意力学习的细胞核分割方法 | |
Yamanakkanavar et al. | MF2-Net: A multipath feature fusion network for medical image segmentation | |
CN111091575B (zh) | 一种基于强化学习方法的医学图像分割方法 | |
CN110570394A (zh) | 医学图像分割方法、装置、设备及存储介质 | |
Liu et al. | An automatic cardiac segmentation framework based on multi-sequence MR image | |
Oguz et al. | Combining deep learning and multi-atlas label fusion for automated placenta segmentation from 3DUS | |
Du et al. | An integrated deep learning framework for joint segmentation of blood pool and myocardium | |
Singh et al. | Prior wavelet knowledge for multi-modal medical image segmentation using a lightweight neural network with attention guided features | |
CN117496144A (zh) | 一种应用于皮损分割的多注意力编解码器网络和系统 | |
Zhang et al. | Medical image fusion based on quasi-cross bilateral filtering | |
Liu et al. | Hybrid CNN-Transformer model for medical image segmentation with pyramid convolution and multi-layer perceptron | |
Ahmed et al. | COMA-Net: Towards generalized medical image segmentation using complementary attention guided bipolar refinement modules | |
CN113538363A (zh) | 一种基于改进U-Net的肺部医学影像分割方法及装置 | |
Lal | TC-SegNet: robust deep learning network for fully automatic two-chamber segmentation of two-dimensional echocardiography | |
Zhao et al. | Development of an approach to extracting coronary arteries and detecting stenosis in invasive coronary angiograms | |
Bhangale et al. | Multi-feature similarity based deep learning framework for semantic segmentation | |
Zheng et al. | LW-XNet for segmentation and classification of skin lesions from dermoscopy images | |
Arsa et al. | Efficient multi-stage feedback attention for diverse lesion in cancer image segmentation | |
Aboghazalah et al. | Using X-ray Image Processing Techniques to Improve Pneumonia Diagnosis based on Machine Learning Algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |