WO2020088328A1

WO2020088328A1 - 一种结肠息肉图像的处理方法和装置及系统

Info

Publication number: WO2020088328A1
Application number: PCT/CN2019/112788
Authority: WO
Inventors: 付星辉; 孙钟前; 尚鸿; 章子健; 杨巍
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2018-10-31
Filing date: 2019-10-23
Publication date: 2020-05-07
Also published as: US11468563B2; JP7090836B2; US11748883B2; US20210004959A1; EP3876188A1; CN109447973A; US20220392068A1; EP3876188B1; JP2021520980A; EP3876188A4; CN109447973B

Abstract

一种肠息肉图像的处理方法和装置及系统，用于实时发现息肉位置并判断息肉的性质，提高息肉图像的处理效率。一种结肠息肉图像的处理方法，包括：使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测，从所述内窥镜图像上定位出息肉图像块，所述息肉图像块包括：息肉在所述内窥镜图像中的位置区域(101)；使用息肉性质识别模型在所述息肉图像块上进行息肉类型的分类检测，输出识别结果(102)。

Description

一种结肠息肉图像的处理方法和装置及系统

本申请要求于2018年10月31日提交中国专利局、申请号为201811287489.X、发明名称“一种结肠息肉图像的处理方法和装置及系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及计算机技术领域，尤其涉及一种结肠息肉图像的处理方法和装置及系统。

背景技术

当前，我国高发的恶性肿瘤类型中，结肠癌位居前5位以内。而结肠癌在北美和欧洲的发病率同样居高不下。结肠癌是常发于结肠部位的消化道恶性肿瘤。一般来讲，晚期结肠癌50％的患者将死于复发及转移，早期结肠癌接近100％患者可以完全治愈。因此，结肠癌的防治很有必要。但是通过临床症状无法预测出结肠早癌。

现有技术中在识别结肠息肉时，通常采用滑窗的方式来检测息肉图像(滑窗指的是在一个内窥镜视频图像帧中，采用先从上到下、然后从左至右的方式滑动图像块)，或者采用人工标注息肉位置的方式。在确定出息肉位置后，再使用计算机视觉(Computer Vision)提取方法，通过分类方法输出识别结果。

现有技术提供的上述方案中，对于滑窗的方式，在一个内窥镜视频图像帧上采用滑窗的方式计算每个图像块是否包含息肉，由于图像块很多，导致计算量大，实时性不符合要求，在内窥镜被控制移动时，对于实时采集到的图像无法实时的输出识别结果。对于人工标注的方式，实时性不符合要求，在内窥镜被控制移动时，对于实时采集到的图像无法实时的输出识别结果。

发明内容

本申请实施例提供了一种结肠息肉图像的处理方法和装置及系统，用于实时发现息肉位置并判断息肉的性质，提高息肉图像的处理效率。

本申请实施例提供以下技术方案：

一方面，本申请实施例提供一种结肠息肉图像的处理方法，包括：

结肠息肉图像的处理装置使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测，从所述内窥镜图像上定位出息肉图像块，所述息肉图像块包括：息肉在所述内窥镜图像中的位置区域；

所述结肠息肉图像的处理装置使用息肉性质识别模型在所述息肉图像块上进行息肉类型的分类检测，输出识别结果。

另一方面，本申请实施例还提供一种结肠息肉图像的处理装置，包括：

位置检测模块，被设置为使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测，从所述内窥镜图像上定位出息肉图像块，所述息肉图像块包括：息肉在所述内窥镜图像中的位置区域；

息肉分类模块，被设置为使用息肉性质识别模型在所述息肉图像块上进行息肉类型的分类检测，输出识别结果。

在前述方面中，结肠息肉图像的处理装置的组成模块还可以执行前述一方面以及各种可能的实现方式中所描述的步骤，详见前述对前述一方面以及各种可能的实现方式中的说明。

另一方面，本申请实施例还提供一种医疗系统，所述医疗系统包括：内窥镜装置和结肠息肉图像的处理装置，所述内窥镜装置和所述结肠息肉图像的处理装置之间建立有通信连接；其中，

所述内窥镜装置，被设置为生成内窥镜视频流；并将所述内窥镜视频流发送给所述结肠息肉图像的处理装置；

所述结肠息肉图像的处理装置，被设置为从所述内窥镜装置接收到所述内窥镜视频流；从所述内窥镜视频流中获取待处理的内窥镜图像；使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测，从所述内窥镜图像上定位出息肉图像块，所述息肉图像块包括：息肉在所述内窥镜图像中的位置区域；使用息肉性质识别模型在所述息肉图像块上进行息肉类型的分类检测，输出识别结果。

另一方面，本申请实施例提供一种图像的处理方法，包括：

图像的处理装置使用目标对象定位模型对待处理的图像进行目标对象位置检测，从所述图像上定位出目标对象图像块，所述目标对象图像块包括：所述目标对象在所述图像中的位置区域；

所述图像的处理装置使用目标对象性质识别模型在所述目标对象图像块上进行目标对象类型的分类检测，输出识别结果。

另一方面，本申请实施例提供一种结肠息肉图像的处理装置，该结肠息肉图像的处理装置包括：处理器、存储器；存储器被设置为存储指令；处理器被设置为执行存储器中的指令，使得结肠息肉图像的处理装置执行如前述一方面中任一项的方法。

另一方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面所述的方法。

在本申请实施例中，首先使用息肉定位模型对内窥镜图像进行息肉位置检测，从内窥镜图像上定位出息肉图像块，息肉图像块包括：息肉在内窥镜图像中的位置区域。最后使用息肉性质识别模型在息肉图像块上进行息肉类型的分类检测，输出识别结果。本申请实施例中由于采用的是息肉定位模型来检测息肉位置，可以直接从内窥镜图像中定位出息肉图像块，针对息肉类型的分类检测也是在该息肉图像块上进行，而不需要在整个内窥镜图像上进行，因此实时性符合要求，在内窥镜被控制移动时，对于实时采集到的图像可以实时的输出识别结果，提高息肉图像的处理效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域的技术人员来讲，还可以根据这些附图获得其他的附图。

图1-a为本申请实施例提供的一种医疗系统的组成结构示意图；

图1-b为本申请实施例提供的一种结肠息肉图像的处理方法的流程方框示意图；

图2为本申请实施例提供的内窥镜图像的示意图；

图3为本申请实施例提供的内窥镜图像为合格图片的示意图；

图4为本申请实施例提供的内窥镜图像为色调异常及过曝欠曝图片的示意图；

图5为本申请实施例提供的内窥镜图像为模糊图片的示意图；

图6-a为本申请实施例提供的内窥镜图像为白光类型图片的示意图；

图6-b为本申请实施例提供的内窥镜图像为NBI类型图片的示意图；

图7为本申请实施例提供的在内窥镜图像上圈出的息肉图像块的示意图；

图8-a为本申请实施例提供的一种结肠息肉图像的处理装置的组成结构示意图；

图8-b为本申请实施例提供的另一种结肠息肉图像的处理装置的组成结构示意图；

图8-c为本申请实施例提供的另一种结肠息肉图像的处理装置的组成结构示意图；

图8-d为本申请实施例提供的一种图片类型识别模块的组成结构示意图；

图8-e为本申请实施例提供的一种息肉分类模块的组成结构示意图；

图9为本申请实施例提供的结肠息肉图像的处理方法应用于终端的组成结构示意图；

图10为本申请实施例提供的结肠息肉图像的处理方法应用于服务器的组成结构示意图。

具体实施方式

为使得本申请实施例的发明目的、特征、优点能够更加的明显和易懂，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本申请一部分实施例，而非全部实施例。基于本申请中的实施例，本领域的技术人员所获得的所有其他实施例，都属于本申请实施例保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。

以下分别进行详细说明。

本申请结肠息肉图像的处理方法的一个实施例，具体可以应用于针对内窥镜视频流的结肠息肉图像处理场景中，通过本申请实施例对结肠息肉图像的处理，输出识别结果，该识别结果可用于辅助医生在做内窥镜检查时实时发现息肉并判断息肉的性质，指导医生下一步的操作。

本申请实施例还提供一种医疗系统，如图1-a所示，医疗系统10包括：内窥镜装置20和结肠息肉图像的处理装置30，内窥镜装置20和结肠息肉图像的处理装置30之间建立有通信连接；其中，

内窥镜装置20，被设置为生成内窥镜视频流；并将内窥镜视频流发送给结肠息肉图像的处理装置30；

结肠息肉图像的处理装置30，被设置为从内窥镜装置20接收到内窥镜视频流；从内窥镜视频流中获取待处理的内窥镜图像；使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测，从内窥镜图像上定位出息肉图像块，息肉图像块包括：息肉在内窥镜图像中的位置区域；使用息肉性质识别模型在息肉图像块上进行息肉类型的分类检测，输出识别结果。

在本申请实施例提供的医疗系统中包括内窥镜装置和结肠息肉图像的处理装置，内窥镜装置和结肠息肉图像的处理装置之间可以采用有线或者无线的方式来传输内窥镜视频流，内窥镜装置可以通过内窥镜对患者体内的结肠进行图像拍摄，从而生成内窥镜视频流，结肠息肉图像的处理装置使用息肉定位模型来检测息肉位置，可以直接从内窥镜图像中定位出息肉图像块，针对息肉类型的分类检测也是在该息肉图像块上进行，而不需要在整个内窥镜图像上进行，因此实时性符合要求，在内窥镜被控制移动时，对于实时采集到的图像可以实时的输出识别结果，提高息肉图像的处理效率。

请参阅图1-b所示，本申请一个实施例提供的结肠息肉图像的处理方法，可以包括如下步骤：

101、结肠息肉图像的处理装置使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测，从内窥镜图像上定位出息肉图像块，息肉图像块包括：息肉在内窥镜图像中的位置区域。

在本申请实施例中，待处理的内窥镜图像可以是结肠息肉图像的处理装置从内窥镜视频流中获取到单个帧的内窥镜图像，也可以是结肠息肉图像的处理装置从内窥镜装置接收到的单个帧的内窥镜图像。在获取到单个帧的内窥镜图像之后，使用预先完成的息肉定位模型在该内窥镜图像上进行息肉位置检测，该息肉定位模型中包括有训练完成的网络参数，通过该息肉定位模型的网络参数可以检测在内窥镜图像上哪些图像区域符合息肉的特征，从而确定出符合息肉的特征的位置区域为本申请实施例中从内窥镜图像向圈出的息肉图像块，如图7所示，为本申请实施例提供的在内窥镜图像上圈出的息肉图像块的示意图，息肉图像块包括：息肉在内窥镜图像中的位置区域，本申请实施例中使用预先完成的息肉定位模型，通过模型检测可以快速的圈出息肉图像块，以保证在生成内窥镜视频流后能够实时的确定出息肉图像块，以保证息肉类型的分类检测可以实时进行。

在本申请的一些实施例中，针对内窥镜图像的图片类型的不同，可以分为白光类型图片和NBI类型图片，因此本申请实施例中预先训练的息肉定位模型也需要分为白光息肉定位模型和NBI息肉定位模型。

其中，白光息肉定位模型，通过如下方式得到：结肠息肉图像的处理装置使用神经网络算法，通过白光类型图片训练数据对原始的息肉定位模型进行息肉位置训练；

NBI息肉定位模型，通过如下方式得到：结肠息肉图像的处理装置使用神经网络算法，通过NBI类型图片训练数据对原始的息肉定位模型进行息肉位置训练。

在本申请实施例中，首先针对白光类型和NBI类型分别预先获取训练数据，即获取到白光类型图片训练数据和NBI类型图片训练数据，使用神经网络算法预先训练出息肉定位模型，该息肉定位模型可以采用多种机器学习算法完成训练，例如该息肉定位模型具体可以是深度神经网络模型、循环神经网络模型等，例如该息肉定位模型可以通过YOLO V2算法完成训练等。

在本申请的一些实施例中，在息肉定位模型分为白光息肉定位模型和NBI息肉定位模型的实现场景下，上述步骤101结肠息肉图像的处理装置使用息肉定位模型对内窥镜图像进行息肉位置检测，从内窥镜图像上定位出息肉图像块，包括：

当内窥镜图像为白光类型图片时，使用白光息肉定位模型进行息肉定位，从内窥镜图像上定位出白光息肉图像块；

当内窥镜图像为NBI类型图片时，使用NBI息肉定位模型进行息肉定位，从内窥镜图像上定位出NBI息肉图像块。

在本申请实施例中需要在内窥镜图像中定位到具体的息肉位置，给下一步息肉性质识别提供输入数据。考虑到实时性的要求，本申请实施例采用YOLO v2算法对息肉进行定位检测。YOLOv2的原理以及实现如下，该YOLOv2是一种检测与分类联合训练方法，使用这种联合训练方法在COCO检测数据集和ImageNet分类数据集上训练出了YOLO9000模型，其可以检测超过9000多类物体。YOLOv2相比YOLOv1做了很多方面的改进，这也使得YOLOv2的性能有显著的提升，并且YOLOv2的速度依然很快。YOLO V2算法是YOLO算法的升级版，是一种端到端的实时的目标检测与识别算法，算法利用单个神经网络，将目标检测问题转化为提取图像中的边界框(bounding boxes)和类别概率的回归问题。相比于YOLO，YOLO v2算法采用多尺度训练方法及借用Faster RCNN锚框(anchor box)思想，在保证检测速度的同时，极大提升模型检测的精度及泛化能力。

该YOLO v2算法应用到本申请实施例的息肉定位任务中，检测的目标为结肠息肉，锚框(anchor box)的尺寸设置根据自有的息肉训练数据聚类得到。算法训练时，运用了迁移学习技术，其中，迁移学习是指将一个领域的已经成熟的知识应用到其他的场景中，用神经网络的词语来表述，就是一层层网络中每个节点的权重从一个训练好的网络迁移到一个全新的网络里，而不是从头开始，不需要每个特定任务训练一个神经网络。使用一个开源的大规模的有标注的数据集训练好的参数初始化，例如该数据集可以是Imagenet数据。Imagenet数据是计算机视觉领域有关图像分类和目标检测的开源数据集。涵盖成千上万中类别，数据量在百万以上。使用经过大量数据集训练的模型初始化参数，能更好的让模型收敛到全局最优解。

在图像分类模型中，会区分出白光类型图片和NBI类型图片。这两类图像在息肉表观形态上有很大区别，其中，NBI类型图片可观测到血管流向，且血液的颜色在NBI类型图片中表现为黑色，因此需要分别针对白光图片数据和NBI图片数据训练息肉定位模型，简称为白光息肉定位模型和NBI息肉定位模型。此两种息肉定位模型均是采用上述介绍的方法来训练，唯一的区别在于模型的训练数据，白光息肉定位模型训练数据为白光类型图片，NBI息肉定位模型为NBI类型图片。算法流程中，当上一模块判断为白光类型图时，则调用白光息肉定位模型进行息肉定位，反之，则调用NBI息肉定位模型定位息肉。当有定位到息肉时，输出圈出的息肉图像块，以作为息肉性质识别模型的输入。

在上述步骤101之前，本申请实施例提供的结肠息肉图像的处理方法，还可以包括如下步骤100。

100、结肠息肉图像的处理装置从内窥镜视频流中获取待处理的内窥镜图像。

在本申请实施例中，医生操作内窥镜检查结肠时，内窥镜装置可以生成内窥镜视频流，该内窥镜视频流包括一段连续的多个帧的内窥镜图像，内窥镜装置生成内窥镜视频流之后，将内窥镜视频流发送给结肠息肉图像的处理装置，结肠息肉图像的处理装置可以从内窥镜装置接收到内窥镜视频流，从内窥镜视频流中获取单个帧的内窥镜图像，针对每个帧的内窥镜图像都可以按照本申请实施例提供的方法进行息肉位置以及息肉类型识别，从而可以实时识别内窥镜视频流中结肠息肉性质，在医生操作内窥镜检查结肠时，实时定位到视频流中的结肠息肉位置并判别息肉性质，若判别的息肉性质为非腺瘤息肉时，医生可以不用切除此息肉送病理检查。通过本申请实施例针对每个帧的内窥镜图像进行处理，可以辅助医生实时发现息肉，防止息肉漏诊，还可以辅助医生判别息肉性质,提升医生判别息肉准确率。后续步骤中将针对单个帧的内窥镜图像进行图像处理，以输出识别结果，对于内窥镜视频流中其它帧的内窥镜图像的处理，也可以参阅前述的处理过程，此处仅作说明。

如图2所示，为本申请实施例提供的内窥镜图像的示意图。在生成内窥镜视频流之后，从该内窥镜视频流中提取到一个帧的内窥镜图像，在图2所示的图片中，内窥镜图像为方框内所示的结肠图像，内窥镜图像左侧为内窥镜的参数，可以根据实际场景来设置内窥镜的参数取值。该内窥镜的参数与图像处理无关，因此在采集到内窥镜视频流之后，可以只保留结肠图像区域部分。

在现有技术设计的算法中，需要人为的筛选掉低质量的噪音数据，但是现有技术的算法在实际生产环境下不能使用。人为的筛选掉低质量的噪音数据，导致设计的算法效果在理想环境下不错，但在实际场景中不可用。为解决该问题，在本申请的一些实施例中，步骤100从内窥镜视频流中获取待处理的内窥镜图像之后，本申请实施例提供的方法还包括如下步骤：

结肠息肉图像的处理装置从内窥镜图像上提取颜色特征、梯度变化特征及亮度异常特征；

结肠息肉图像的处理装置根据颜色特征、梯度变化特征及亮度异常特征判断内窥镜图像是否为低质量图片，低质量图片包括：模糊图片、色调异常及过曝欠曝图片、低分辨率图片；

当内窥镜图像不是低质量图片时，触发执行如下步骤101:结肠息肉图像的处理装置使用息肉定位模型对内窥镜图像进行息肉位置检测。

其中，低质量图片也可以称为低质图片。针对输入的视频流中的单个帧的内窥镜图像，判断是否为低质图片，若为低质图片，则直接过滤，不进行后续的模块识别。实际生产环境中，会存在大量的拍摄模糊及因肠道准备不充分导致的粪水图片，影响后续息肉定位及性质识别模块算法效果，基于此，本申请实施例中可以通过提取颜色特征、梯度变化特征及亮度异常特征，基于提取到的这三种特征来检测内窥镜图像是否为低质图片。

本申请实施例定义的低质图片包含三类：模糊、色调异常及过曝欠曝、图像分辨率低。如图3所示，为本申请实施例提供的内窥镜图像为合格图片的示意图。图3所示的左右两幅图片均为合格图片，合格图片指的是除模糊、色调异常及过曝欠曝、图像分辨率低以外的图片。如图4所示，为本申请实施例提供的内窥镜图像为色调异常及过曝欠曝图片的示意图，在图4中所示的左右两幅图片中均出现颜色异常情况，因此为不合格图片。如图5所示，为本申请实施例提供的内窥镜图像为模糊图片的示意图，在图5所示的左右两幅图片中均出现模糊情况，因此为不合格图片。接下来针对模糊图片、色调异常及过曝欠曝图片、低分辨率图片的具体识别过程分别进行举例说明。

在识别低分辨率的图片时，主要是通过计算图片中有效像素面积来实现，有效的像素面积是指剪裁图片上下左右的黑边之后的面积，如图2中白色方框所框住的面积。剪裁黑边算法主要是通过统计每行或者每列像素值的灰度值分布。满足灰色或者黑色的像素值大于一定比例，则认为此行或者列应该剪除。剪除黑边之后的有效面积若小于一定的阈值则认为低分辨率图片，该阈值可根据实际应用自行设定。

模糊图片的检测算法思路如下：

(1)、对输入图像做一个标准差sigma＝2.5的高斯滤波，消除因图像采样时产生的摩尔纹。

(2)、定义原始图像为R，经过一次像素值为3*3的中值滤波之后得到图像P。

(3)、分别计算图像P与图像R的梯度，采用索贝尔(Sobel)边缘检测算子得到中值滤波图像梯度图G_P和原始图像梯度图G_R，G_P和G_R图像突出了图像边缘细节，对图像边缘进行增强。

(4)、计算G_P和G_R图像的相似度，例如可以采用分类模型的评估方法F分数(F-Score)类似算法，来进行筛选。其中，越模糊的图像，G_P和G_R相似度越高。

最后可以根据G_P和G_R相似度确定内窥镜图像是否为模糊图片。

在色调异常及过曝欠曝图片的检测算法中，考虑到异常种类非常多，难以穷举。因此会建立色调合格拍摄正常的标准库文件。检测算法思路为：

(1)、将图像分为7*7的图像块，并获取其中9个图像块。

(2)、在HSV(Hue,Saturation,Value)空间下计算每个图像块的H、S、V。

(3)、以H和S为特征与标准图像的HS分别进行匹配，设定相似度阈值t，计算图像每个图像块是否与标准库相似。

(4)、将9份图像块的匹配度相似结果进行累积计数，匹配度大于阈值t的加1，当累积值>5时，则认为该图像为目标色调匹配图像，并返回检测结果为真(True)。

对于满足上述目标色调匹配结果的内窥镜图像可以确定为色调异常及过曝欠曝图片。

在本申请的一些实施例中，内窥镜视频流可以采用多种拍摄方式来生成，因此内窥镜视频流中的内窥镜图像可以根据拍摄方式的不同具有多种图片类型，在针对不同的图片类型进行息肉位置检测时需要采用不同的息肉定位模型，详见后续实施例中的说明。

步骤100从内窥镜视频流中获取待处理的内窥镜图像之后，本申请实施例提供的方法还包括如下步骤：

结肠息肉图像的处理装置对内窥镜图像进行图片类型识别，确定内窥镜图像为白光类型图片，或者内镜窄带成像(Narrow Band Imaging，NBI)类型图片。

其中，根据内窥镜视频流采用的不同拍摄方式，从该视频流中提取出的内窥镜图像也可以有不同的图片类型，例如该内窥镜图像可以是白光类型图片，或者该内窥镜图像可以是NBI类型图片。如图6-a所示，为本申请实施例提供的内窥镜图像为白光类型图片的示意图，白光类型图片指的是采用普通光源成像的红(Red，R)、绿(Green，G)、蓝(Blue，B)(简称RGB)图像，如图6-b所示，为本申请实施例提供的内窥镜图像为NBI类型图片的示意图，NBI类型图片是利用滤光器过滤掉内镜光源所发出的红蓝绿光波中的宽带光谱，仅留下窄带光谱用于诊断消化道各种疾病。

进一步的，在本申请的一些实施例中，对内窥镜图像进行图片类型识别，确定内窥镜图像为白光类型图片，或者NBI类型图片，包括：

使用神经网络算法，通过白光类型图片训练数据和NBI类型图片训练数据对原始的图像分类模型进行分类训练，得到训练完成的图像分类模型；

使用训练完成的图像分类模型从内窥镜图像上提取到血管颜色特征；

使用训练完成的图像分类模型对血管颜色特征的取值进行分类，得到内窥镜图像为白光类型图片，或者NBI类型图片。

在本申请实施例中，首先针对白光类型和NBI类型分别预先获取训练数据，即获取到白光类型图片训练数据和NBI类型图片训练数据，使用神经网络算法预先训练出图像分类模型，该图像分类模型可以采用多种机器学习算法完成训练，例如该图像分类模型具体可以是深度神经网络模型(Deep Neural Networks，DNN)、循环神经网络模型等，例如该深度神经网络模型可以是稠密连接卷积网络(Densely Connected Convolutional Networks，DenseNet)等。预先收集到白光类型图片训练数据和NBI类型图片训练数据之后，然后通过白光类型图片训练数据和NBI类型图片训练数据进行模型训练后，输出训练完成的图像分类模型。

在图像分类模型的训练完成之后，使用训练完成的图像分类模型从内窥镜图像上提取到血管颜色特征，血管颜色特征是该内窥镜图像的分类依据，最后使用训练完成的图像分类模型对血管颜色特征的取值进行分类，得到内窥镜图像为白光类型图片，或者NBI类型图片。

在本申请实施例中，图像分类模型输入的为合格的单个帧的内窥镜图像，该图像分类模型的输出为该内窥镜图像是白光类型图片还是NBI类型的图片。医生在实际操作内窥镜检查时，当发现疑似息肉时，往往会采用NBI模式来诊断当前息肉的病理分型。NBI模式的图片可以更清晰的显示出血管走向。如图6-a所示为白光类型图片，如图6-b所示为NBI类型图片。举例说明，本申请实施例图像分类模型可以采用稠密连接卷积网络(DenseNet)对图片类型进行分类识别，当然，本申请实施例中亦可采用其他图片分类网络实现类似功能，但是识别效果上会有一定程度的差异，此处不做限定。

图像分类模型的执行可以转化为一个图像分类问题。所使用的图像分类算法为DenseNet卷积网络。网络的输入图像大小为224*224，故首先对输入的原始图片进行放缩，缩放到一个固定的224*224大小。考虑到此图像分类模型的任务，更偏好于较低级的特征组合，如血管颜色等，故在设计DenseNet结构深度和宽度组合时，采用更宽更浅的模式。最终所使用的网络结构为DenseNet-40，其中，40指的是网络的层数，通过网络参数调优，增长率(growth-rate)设置为48，特征经过传输层(transition layer)压缩比为0.5，效果达到最优。模型结构如下表1所示：

需要说明的是，在上述表1所示的实施例中，DenseNet-40中各个层的功能实现以及执行过程可以根据场景来确定。另外，网络层中的conv包含三个操作：批量归一化层(batchnorm)、激活层(ReLU)、卷积层。

102、结肠息肉图像的处理装置使用息肉性质识别模型在息肉图像块上进行息肉类型的分类检测，输出识别结果。

在本申请实施例中，从内窥镜图像上圈出息肉图像块之后，接下来只需要在该息肉图像块上，使用预先训练好的息肉性质识别模型进行息肉类型的分类检测，输出识别结果，该识别结果可以输出最大概率的息肉类型，该识别结果也可以输出各个置信度条件下的息肉类型，其中，置信度是在息肉性质识别模型的预测后，判断在该息肉图像块中包含各种息肉类型的可信程度。

在本申请实施例中，息肉性质识别模型可以执行息肉性质判别任务，例如通过一个图像分类任务来实现，输入是息肉定位模型输出的定位框的图片数据。如图7所示，在内窥镜图像上圈出的息肉图像块为息肉定位模型检测到的息肉，作为息肉性质识别模型的输入数据。模块输出可以是四个类别值(0,1,2,3)，其中0表示此区域没有息肉是正常的，1表示非腺瘤息肉，2表示腺瘤性息肉，3表示腺癌，另外，针对正常、非腺瘤、腺瘤、腺癌还可以分别设置一个置信度条件，若输出为0，则纠正息肉定位模型的判断结果，此区域并无息肉，为正常区域。

在本申请的一些实施例中，步骤102结肠息肉图像的处理装置使用息肉性质识别模型在息肉图像块上进行息肉类型的分类检测，输出识别结果包括：

使用神经网络算法，通过不同息肉类型的息肉图片训练数据对原始的息肉性质识别模型进行息肉类型的分类检测训练，得到训练完成的息肉性质识别模型；

使用训练完成的息肉性质识别模型从息肉图像块上提取到息肉类型特征；

使用训练完成的息肉性质识别模型对息肉类型特征的取值进行分类，输出识别结果。

在本申请实施例中，首先获取到不同息肉类型的息肉图片训练数据，使用神经网络算法预先训练出息肉性质识别模型，该息肉性质识别模型可以采用多种机器学习算法完成训练，例如该息肉性质识别模型具体可以是深度神经网络模型、循环神经网络模型等，例如该深度神经网络模型可以是DenseNet等。预先收集到不同息肉类型的息肉图片训练数据之后，然后通过不同息肉类型的息肉图片训练数据进行模型训练后，输出训练完成的息肉性质识别模型。

在息肉性质识别模型的训练完成之后，使用训练完成的息肉性质识别模型从息肉图像块上提取到息肉类型特征，息肉类型特征是息肉图像块的分类依据，最后使用训练完成的息肉性质识别模型对息肉类型特征的取值进行分类，得到识别结果。

在本申请的一些实施例中，步骤102结肠息肉图像的处理装置从内窥镜图像上定位出息肉图像块之后，本申请实施例提供的方法还包括：

结肠息肉图像的处理装置按照预设的图像外扩比例，对息肉图像块在内窥镜图像上所占的息肉区域进行上下左右方向上的外扩，得到外扩后的息肉图像块；

结肠息肉图像的处理装置将外扩后的息肉图像块输入到息肉性质识别模型中。

在本申请实施例中，息肉性质识别模型的息肉性质分类任务，可以采用DenseNet卷积网络算法来实现，因算法要求输入的图片大小必须一致，而息肉定位模块输出的息肉位置大小不一。在构造算法输入数据时，本申请实施例采用的方法是：对息肉定位模型输出的息肉图像块，向上下左右外扩10％比例区域，以保证框住的区域有一定的上下文语义信息，辅助后续的息肉性质识别模型提取特征，外扩后的区域直接归一化到模型要求的输入大小224*224。考虑到任务的复杂性，可以采用更深的DenseNet网络。最终所使用的网络结构为DenseNet-121。通过网络参数调优，growth-rate设置为24，特征经过transition layer压缩比为0.5，效果达到最优。模型结构如下表2所示：

最终，本申请实施例提供的息肉图像的处理方法，处理每一帧的内窥镜图像需要大约100毫秒(ms)左右，满足实时性要求，算法效果和不同水平的医生做对比，和顶级医生水平相当。部署到基层医院，可实时辅助医生发现息肉及识别息肉。

在本申请实施例中，在医生做内窥镜检查时可实时帮助医生发现息肉并判断息肉的性质。防止医生漏诊息肉，同时帮助医生提升息肉性质判别准确率。若判断为高置信度的非腺瘤性息肉，医生可不用切除送病理，这样可减少医生的操作时间，进一步减少患者高并发风险及患者诊疗费用，减轻内镜医生负担及病理科医生负担。

通过以上实施例对本申请实施例的描述可知，首先使用息肉定位模型对内窥镜图像进行息肉位置检测，从内窥镜图像上定位出息肉图像块，息肉图像块包括：息肉在内窥镜图像中的位置区域。最后使用息肉性质识别模型在息肉图像块上进行息肉类型的分类检测，输出识别结果。本申请实施例中由于采用的是息肉定位模型来检测息肉位置，可以直接从内窥镜图像中定位出息肉图像块，针对息肉类型的分类检测也是在该息肉图像块上进行，而不需要在整个内窥镜图像上进行，因此实时性符合要求，在内窥镜被控制移动时，对于实时采集到的图像可以实时的输出识别结果，提高息肉图像的处理效率。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请实施例并不受所描述的动作顺序的限制，因为依据本申请实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请实施例所必须的。

为便于更好的实施本申请实施例的上述方案，下面还提供用于实施上述方案的相关装置。

请参阅图8-a所示，本申请实施例提供的一种结肠息肉图像的处理装置800，可以包括一个或多个处理器，以及一个或多个存储程序单元的存储器，其中，程序单元由处理器执行，程序单元包括：位置检测模块801、息肉分类模块802，其中，

位置检测模块801，被设置为使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测，从所述内窥镜图像上定位出息肉图像块，所述息肉图像块包括：息肉在所述内窥镜图像中的位置区域；

息肉分类模块802，被设置为使用息肉性质识别模型在所述息肉图像块上进行息肉类型的分类检测，输出识别结果。

在本申请的一些实施例中，如图8-a所示，结肠息肉图像的处理装置800，还可以包括：图像获取模块803，

所述图像获取模块803，被设置为从内窥镜视频流中获取待处理的内窥镜图像。

在本申请的一些实施例中，请参阅图8-b所示，所述结肠息肉图像的处理装置800，还包括：

低质量图片识别模块804，被设置为所述位置检测模块801使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测之前，从所述内窥镜图像上提取颜色特征、梯度变化特征及亮度异常特征；根据所述颜色特征、所述梯度变化特征及所述亮度异常特征判断所述内窥镜图像是否为低质量图片，所述低质量图片包括：模糊图片、色调异常及过曝欠曝图片、低分辨率图片；当所述内窥镜图像不是所述低质量图片时，触发执行所述位置检测模块。

在本申请的一些实施例中，请参阅图8-c所示，所述结肠息肉图像的处理装置800，还包括：

图片类型识别模块805，被设置为所述位置检测模块801使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测之前，对所述内窥镜图像进行图片类型识别，确定所述内窥镜图像为白光类型图片，或者内镜窄带成像NBI类型图片。

在本申请的一些实施例中，请参阅图8-d所示，所述图片类型识别模块805，包括：

图像分类模型训练单元8051，被设置为使用神经网络算法，通过白光类型图片训练数据和NBI类型图片训练数据对原始的图像分类模型进行分类训练，得到训练完成的图像分类模型；

血管颜色特征提取单元8052，被设置为使用所述训练完成的图像分类模型从所述内窥镜图像上提取到血管颜色特征；

图片分类单元8053，被设置为使用所述训练完成的图像分类模型对所述血管颜色特征的取值进行分类，得到所述内窥镜图像为所述白光类型图片，或者所述NBI类型图片。

在本申请的一些实施例中，所述息肉定位模型，包括：白光息肉定位模型和NBI息肉定位模型；

其中，所述白光息肉定位模型，通过如下方式得到：使用神经网络算法，通过所述白光类型图片训练数据对原始的息肉定位模型进行息肉位置训练；

所述NBI息肉定位模型，通过如下方式得到：使用神经网络算法，通过所述NBI类型图片训练数据对原始的息肉定位模型进行息肉位置训练。

在本申请的一些实施例中，所述位置检测模块801，具体被设置为当所述内窥镜图像为所述白光类型图片时，使用所述白光息肉定位模型进行息肉定位，从所述内窥镜图像上定位出白光息肉图像块；当所述内窥镜图像为所述NBI类型图片时，使用所述NBI息肉定位模型进行息肉定位，从所述内窥镜图像上定位出NBI息肉图像块。

在本申请的一些实施例中，请参阅图8-e所示，所述息肉分类模块802，包括：

息肉性质识别模型训练单元8021，被设置为使用神经网络算法，通过不同息肉类型的息肉图片训练数据对原始的息肉性质识别模型进行息肉类型的分类检测训练，得到训练完成的息肉性质识别模型；

息肉类型特征提取单元8022，被设置为使用所述训练完成的息肉性质识别模型从所述息肉图像块上提取到息肉类型特征；

息肉分类单元8023，被设置为使用所述训练完成的息肉性质识别模型对所述息肉类型特征的取值进行分类，输出识别结果。

本申请实施例还提供了另一种终端，如图9所示，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(Personal Digital Assistant，PDA)、销售终端(Point of Sales，POS)、车载电脑等任意终端设备，以终端为手机为例：

图9示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图9，手机包括：射频(Radio Frequency，RF)电路1010、存储器1020、输入单元1030、显示单元1040、传感器1050、音频电路1060、无线保真(wireless fidelity，WiFi)模块1070、处理器1080、以及电源1090等部件。本领域技术人员可以理解，图9中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图9对手机的各个构成部件进行具体的介绍：

RF电路1010可被设置为收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器1080处理；另外，将设计上行的数据发送给基站。通常，RF电路1010包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier，LNA)、双工器等。此外，RF电路1010还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(Global System of Mobile communication，GSM)、通用分组无线服务(General Packet Radio Service，GPRS)、码分多址(Code Division Multiple Access，CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(Short Messaging Service，SMS)等。

存储器1020可被设置为存储软件程序以及模块，处理器1080通过运行存储在存储器1020的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器1020可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器1020可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1030可被设置为接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元1030可包括触控面板1031以及其他输入设备1032。触控面板1031，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1031上或在触控面板1031附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板1031可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器1080，并能接收处理器1080发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1031。除了触控面板1031，输入单元1030还可以包括其他输入设备1032。具体地，其他输入设备1032可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元1040可被设置为显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1040可包括显示面板1041，可选的，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1041。进一步的，触控面板1031可覆盖显示面板1041，当触控面板1031检测到在其上或附近的触摸操作后，传送给处理器1080以确定触摸事件的类型，随后处理器1080根据触摸事件的类型在显示面板1041上提供相应的视觉输出。虽然在图9中，触控面板1031与显示面板1041是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板1031与显示面板1041集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器1050，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1041的亮度，接近传感器可在手机移动到耳边时，关闭显示面板1041和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路1060、扬声器1061，传声器1062可提供用户与手机之间的音频接口。音频电路1060可将接收到的音频数据转换后的电信号，传输到扬声器1061，由扬声器1061转换为声音信号输出；另一方面，传声器 1062将收集的声音信号转换为电信号，由音频电路1060接收后转换为音频数据，再将音频数据输出处理器1080处理后，经RF电路1010以发送给比如另一手机，或者将音频数据输出至存储器1020以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块1070可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图9示出了WiFi模块1070，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器1080是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器1020内的软件程序和/或模块，以及调用存储在存储器1020内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器1080可包括一个或多个处理单元；优选的，处理器1080可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1080中。

手机还包括给各个部件供电的电源1090(比如电池)，优选的，电源可以通过电源管理系统与处理器1080逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本申请实施例中，该终端所包括的处理器1080还具有控制执行以上由终端执行的结肠息肉图像的处理方法流程。

图10是本申请实施例提供的一种服务器结构示意图，该服务器1100可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)1122(例如，一个或一个以上处理器)和存储器1132，一个或一个以上存储应用程序1142或数据1144的存储介质1130(例如一个或一个以上海量存储设备)。其中，存储器1132和存储介质1130可以是短暂存储或持久存储。存储在存储介质1130的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1122可以设置为与存储介质1130通信，在服务器1100上执行存储介质1130中的一系列指令操作。

服务器1100还可以包括一个或一个以上电源1126，一个或一个以上有线或无线网络接口1150，一个或一个以上输入输出接口1158，和/或，一个或一个以上操作系统1141，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述实施例中由服务器所执行的结肠息肉图像的处理方法步骤可以基于该图10所示的服务器结构。

另外需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本申请提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本申请实施例可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本申请实施例而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

综上所述，以上实施例仅用以说明本申请实施例的技术方案，而非对其限制；尽管参照上述实施例对本申请实施例进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对上述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

工业实用性

在本申请实施例中，首先使用息肉定位模型对内窥镜图像进行息肉位置检测，从内窥镜图像上定位出息肉图像块，息肉图像块包括：息肉在内窥镜图像中的位置区域。最后使用息肉性质识别模型在息肉图像块上进行息肉类型的分类检测，输出识别结果。本申请实施例中由于采用的是息肉定位模型来检测息肉位置，可以直接从内窥镜图像中定位出息肉图像块，针对息肉类型的分类检测也是在该息肉图像块上进行，而不需要在整个内窥镜图像上进行，因此实时性符合要求，在内窥镜被控制移动时，对于实时采集到的图像可以实时的输出识别结果，提高息肉图像的处理效率、

Claims

一种结肠息肉图像的处理方法，包括：

结肠息肉图像的处理装置使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测，从所述内窥镜图像上定位出息肉图像块，所述息肉图像块包括：息肉在所述内窥镜图像中的位置区域；

所述结肠息肉图像的处理装置使用息肉性质识别模型在所述息肉图像块上进行息肉类型的分类检测，输出识别结果。
根据权利要求1所述的方法，其中，所述结肠息肉图像的处理装置使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测之前，所述方法还包括：

所述结肠息肉图像的处理装置从所述内窥镜图像上提取颜色特征、梯度变化特征及亮度异常特征；

所述结肠息肉图像的处理装置根据所述颜色特征、所述梯度变化特征及所述亮度异常特征判断所述内窥镜图像是否为低质量图片，所述低质量图片包括：模糊图片、色调异常及过曝欠曝图片、低分辨率图片；

当所述内窥镜图像不是所述低质量图片时，触发执行如下步骤:所述结肠息肉图像的处理装置使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测。
根据权利要求1所述的方法，其中，所述结肠息肉图像的处理装置使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测之前，所述方法还包括：

所述结肠息肉图像的处理装置对所述内窥镜图像进行图片类型识别，确定所述内窥镜图像为白光类型图片，或者内镜窄带成像NBI类型图片。
根据权利要求3所述的方法，其中，所述结肠息肉图像的处理装置对所述内窥镜图像进行图片类型识别，确定所述内窥镜图像为白光类型图片，或者内镜窄带成像NBI类型图片，包括：

使用神经网络算法，通过白光类型图片训练数据和NBI类型图片训练数据对原始的图像分类模型进行分类训练，得到训练完成的图像分类模型；

使用所述训练完成的图像分类模型从所述内窥镜图像上提取到血管颜色特征；

使用所述训练完成的图像分类模型对所述血管颜色特征的取值进行分类，得到所述内窥镜图像为所述白光类型图片，或者所述NBI类型图片。
根据权利要求3或4所述的方法，其中，所述息肉定位模型，包括：白光息肉定位模型和NBI息肉定位模型；

其中，所述白光息肉定位模型，通过如下方式得到：所述结肠息肉图像的处理装置使用神经网络算法，通过所述白光类型图片训练数据对原始的息肉定位模型进行息肉位置训练；

所述NBI息肉定位模型，通过如下方式得到：所述结肠息肉图像的处理装置使用神经网络算法，通过所述NBI类型图片训练数据对原始的息肉定位模型进行息肉位置训练。
根据权利要求5所述的方法，其中，所述结肠息肉图像的处理装置使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测，从所述内窥镜图像上定位出息肉图像块，包括：

当所述内窥镜图像为所述白光类型图片时，使用所述白光息肉定位模型进行息肉定位，从所述内窥镜图像上定位出白光息肉图像块；

当所述内窥镜图像为所述NBI类型图片时，使用所述NBI息肉定位模型进行息肉定位，从所述内窥镜图像上定位出NBI息肉图像块。
根据权利要求1所述的方法，其中，所述结肠息肉图像的处理装置使用息肉性质识别模型在所述息肉图像块上进行息肉类型的分类检测，输出识别结果包括：

使用神经网络算法，通过不同息肉类型的息肉图片训练数据对原始的息肉性质识别模型进行息肉类型的分类检测训练，得到训练完成的息肉性质识别模型；

使用所述训练完成的息肉性质识别模型从所述息肉图像块上提取到息肉类型特征；

使用所述训练完成的息肉性质识别模型对所述息肉类型特征的取值进行分类，输出识别结果。
根据权利要求1至4中任一项，或权利要求7所述的方法，其中，所述从所述内窥镜图像上定位出息肉图像块之后，所述方法还包括：

所述结肠息肉图像的处理装置按照预设的图像外扩比例，对所述息肉图像块在所述内窥镜图像上所占的息肉区域进行上下左右方向上的外扩，得到外扩后的息肉图像块；

所述结肠息肉图像的处理装置将所述外扩后的息肉图像块输入到所述息肉性质识别模型中。
一种结肠息肉图像的处理装置，包括一个或多个处理器，以及一个或多个存储程序单元的存储器，其中，所述程序单元由所述处理器执行，所述程序单元包括：

位置检测模块，被设置为使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测，从所述内窥镜图像上定位出息肉图像块，所述息肉图像块包括：息肉在所述内窥镜图像中的位置区域；

息肉分类模块，被设置为使用息肉性质识别模型在所述息肉图像块上进行息肉类型的分类检测，输出识别结果。
根据权利要求9所述的装置，其中，所述程序单元包括，还包括：

低质量图片识别模块，被设置为所述位置检测模块使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测之前，从所述内窥镜图像上提取颜色特征、梯度变化特征及亮度异常特征；根据所述颜色特征、所述梯度变化特征及所述亮度异常特征判断所述内窥镜图像是否为低质量图片，所述低质量图片包括：模糊图片、色调异常及过曝欠曝图片、低分辨率图片；当所述内窥镜图像不是所述低质量图片时，触发执行所述位置检测模块。
根据权利要求9所述的装置，其中，所述程序单元包括，还包括：

图片类型识别模块，被设置为所述位置检测模块使用息肉定位模型对待处理的内窥镜图像进行息肉位置检测之前，对所述内窥镜图像进行图片类型识别，确定所述内窥镜图像为白光类型图片，或者内镜窄带成像NBI类型图片。
根据权利要求11所述的装置，其中，所述图片类型识别模块，包括：

图像分类模型训练单元，被设置为使用神经网络算法，通过白光类型图片训练数据和NBI类型图片训练数据对原始的图像分类模型进行分类训练，得到训练完成的图像分类模型；

血管颜色特征提取单元，被设置为使用所述训练完成的图像分类模型从所述内窥镜图像上提取到血管颜色特征；

图片分类单元，被设置为使用所述训练完成的图像分类模型对所述血管颜色特征的取值进行分类，得到所述内窥镜图像为所述白光类型图片，或者所述NBI类型图片。
根据权利要求11或12所述的装置，其中，所述息肉定位模型，包括：白光息肉定位模型和NBI息肉定位模型；

其中，所述白光息肉定位模型，通过如下方式得到：使用神经网络算法，通过所述白光类型图片训练数据对原始的息肉定位模型进行息肉位置训练；

所述NBI息肉定位模型，通过如下方式得到：使用神经网络算法，通过所述NBI类型图片训练数据对原始的息肉定位模型进行息肉位置训练。
根据权利要求13所述的装置，其中，所述位置检测模块，具体被设置为当所述内窥镜图像为所述白光类型图片时，使用所述白光息肉定位模型进行息肉定位，从所述内窥镜图像上定位出白光息肉图像块；当所述内窥镜图像为所述NBI类型图片时，使用所述NBI息肉定位模型进行息肉定位，从所述内窥镜图像上定位出NBI息肉图像块。
一种医疗系统，所述医疗系统包括：内窥镜装置和结肠息肉图像的处理装置，所述内窥镜装置和所述结肠息肉图像的处理装置之间建立有通信连接；其中，

所述内窥镜装置，被设置为生成内窥镜视频流；并将所述内窥镜视频流发送给所述结肠息肉图像的处理装置；

所述结肠息肉图像的处理装置，被设置为从所述内窥镜装置接收到所述内窥镜视频流；从所述内窥镜视频流中获取待处理的内窥镜图像；并执行前述如权利要求1至8中任意一项所述的方法。
一种图像的处理方法，包括：

图像的处理装置使用目标对象定位模型对待处理的图像进行目标对象位置检测，从所述图像上定位出目标对象图像块，所述目标对象图像块包括：所述目标对象在所述图像中的位置区域；

所述图像的处理装置使用目标对象性质识别模型在所述目标对象图像块上进行目标对象类型的分类检测，输出识别结果。
根据权利要求16所述的方法，其中，所述图像的处理装置使用目标对象定位模型对待处理的图像进行目标对象位置检测之前，所述方法还包括：

所述图像的处理装置从所述图像上提取颜色特征、梯度变化特征及亮度异常特征；

所述图像的处理装置根据所述颜色特征、所述梯度变化特征及所述亮度异常特征判断所述图像是否为低质量图片，所述低质量图片包括：模糊图片、色调异常及过曝欠曝图片、低分辨率图片；

当所述图像不是所述低质量图片时，触发执行如下步骤:所述图像的处理装置使用目标对象定位模型对待处理的图像进行目标对象位置检测。
根据权利要求16所述的方法，其中，所述图像的处理装置使用目标对象定位模型对待处理的图像进行目标对象位置检测之前，所述方法还包括：

所述图像的处理装置对所述图像进行图片类型识别，确定所述图像为白光类型图片，或者内镜窄带成像NBI类型图片。
根据权利要求18所述的方法，其中，所述图像的处理装置对所述图像进行图片类型识别，确定所述图像为白光类型图片，或者内镜窄带成像NBI类型图片，包括：

使用神经网络算法，通过白光类型图片训练数据和NBI类型图片训练数据对原始的图像分类模型进行分类训练，得到训练完成的图像分类模型；

使用所述训练完成的图像分类模型从所述图像上提取到指定对象颜色特征；

使用所述训练完成的图像分类模型对所述指定对象颜色特征的取值进行分类，得到所述图像为所述白光类型图片，或者所述NBI类型图片。
根据权利要求18或19所述的方法，其中，所述目标对象定位模型，包括：白光目标对象定位模型和NBI目标对象定位模型；

其中，所述白光目标对象定位模型，通过如下方式得到：所述图像的处理装置使用神经网络算法，通过所述白光类型图片训练数据对原始的目标对象定位模型进行目标对象位置训练；

所述NBI目标对象定位模型，通过如下方式得到：所述图像的处理装置使用神经网络算法，通过所述NBI类型图片训练数据对原始的目标对象定位模型进行目标对象位置训练。
根据权利要求20所述的方法，其中，所述图像的处理装置使用目标对象定位模型对待处理的图像进行目标对象位置检测，从所述内窥镜图像上定位出目标对象图像块，包括：

当所述图像为所述白光类型图片时，使用所述白光目标对象定位模型进行目标对象定位，从所述图像上定位出白光目标对象图像块；

当所述图像为所述NBI类型图片时，使用所述NBI目标对象定位模型进行目标对象定位，从所述图像上定位出NBI目标对象图像块。
根据权利要求16所述的方法，其中，所述图像的处理装置使用目标对象性质识别模型在所述目标对象图像块上进行目标对象类型的分类检测，输出识别结果包括：

使用神经网络算法，通过不同目标对象类型的目标对象图片训练数据对原始的目标对象性质识别模型进行目标对象类型的分类检测训练，得到训练完成的目标对象性质识别模型；

使用所述训练完成的目标对象性质识别模型从所述目标对象图像块上提取到目标对象类型特征；

使用所述训练完成的目标对象性质识别模型对所述目标对象类型特征的取值进行分类，输出识别结果。
根据权利要求16至19中任一项，或权利要求22所述的方法，其中，所述从所述图像上定位出目标对象图像块之后，所述方法还包括：

所述图像的处理装置按照预设的图像外扩比例，对所述目标对象图像块在所述图像上所占的目标对象区域进行上下左右方向上的外扩，得到外扩后的目标对象图像块；

所述图像的处理装置将所述外扩后的目标对象图像块输入到所述目标对象性质识别模型中。