CN113486819A - 一种基于YOLOv4算法的船舶目标检测方法 - Google Patents
一种基于YOLOv4算法的船舶目标检测方法 Download PDFInfo
- Publication number
- CN113486819A CN113486819A CN202110779963.6A CN202110779963A CN113486819A CN 113486819 A CN113486819 A CN 113486819A CN 202110779963 A CN202110779963 A CN 202110779963A CN 113486819 A CN113486819 A CN 113486819A
- Authority
- CN
- China
- Prior art keywords
- ship target
- ship
- target detection
- image
- yolov4
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 98
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 27
- 238000012545 processing Methods 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 35
- 230000009466 transformation Effects 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 7
- 238000009499 grossing Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 230000003287 optical effect Effects 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000003064 k means clustering Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明属于船舶检测技术领域,具体公开一种基于YOLOv4算法的船舶目标检测方法,包括如下步骤:S1:基于YOLOv4算法建立船舶目标检测模型;S2:获取船舶目标待检测图像;S3:将船舶目标待检测图像输入船舶目标检测模型,得到船舶目标检测结果图像。本发明解决了现有技术存在的提取船舶目标困难、检测模型泛化能力不强以及检测的精度有限的问题。
Description
技术领域
本发明属于船舶检测技术领域,具体涉及一种基于YOLOv4算法的船舶目标检测方法。
背景技术
海上运输是国际物流中最主要的运输方式,其运输总量占据全球货运总量的2/3以上。然而,随着航运流量的迅速增长,海上违规事件时有发生,破坏环境的船舶事故、海盗行为、非法捕鱼、贩毒和非法货物运输等事件时有发生,严重破坏了海洋运输秩序,对我国的经济和安全造成了严重的影响,这迫使许多组织对海洋进行更密切的监视,因此,对船舶进行有效的检测和识别具有重要的理论意义和应用价值。
现有技术的问题:
1)船舶检测不同于常见的人脸检测、车辆检测等问题,船舶图像背景复杂,存在多种干扰信息,包括光照因素、云雾天气、水面波动、船舶目标小,使得提取船舶目标变得困难,增加了处理时间甚至造成了大量的漏检误检等现象。另外,数据集稀缺,样本不均衡,造成许多检测模型泛化能力不强,使得目前船舶检测工作极具挑战性。
2)现有技术中,目标检测大都通过手工特征提取的方法,比如使用图像处理、统计分析等手段,然后根据获取的特征构建合适的模型或者使用模型集成来进行目标的检测识别,这样难以获取高层的语义信息,检测的精度有限。
发明内容
本发明旨在于至少在一定程度上解决上述技术问题之一。
为此,本发明目的在于提供一种基于YOLOv4算法的船舶目标检测方法,用于解决现有技术存在的提取船舶目标困难、检测模型泛化能力不强以及检测的精度有限的问题。
本发明所采用的技术方案为:
一种基于YOLOv4算法的船舶目标检测方法,包括如下步骤:
S1:基于YOLOv4算法建立船舶目标检测模型;
S2:获取船舶目标待检测图像;
S3:将船舶目标待检测图像输入船舶目标检测模型,得到船舶目标检测结果图像。
进一步地,步骤S1的具体方法为:
S1-1:基于卫星船舶图像数据集,获取初始船舶图像数据集,并对初始船舶图像数据集进行预处理,得到预处理后船舶图像数据集;
S1-2:将预处理后船舶图像数据集中每个图像进行网格划分,并获取每个网格的预测框,得到带有预测框的最终船舶图像数据集;
S1-3:建立YOLOv4模型;
S1-4:将最终船舶图像数据集输入YOLOv4模型进行训练,得到船舶目标检测模型。
进一步地,步骤S1-1中,预处理包括依次进行的图像格式处理和数据增强处理。
进一步地,数据增强处理包括对图像进行的几何变换处理、光学变换处理、增加噪声处理、归一化处理以及Mosaic数据增强处理。
进一步地,步骤S1-2中,获取网格的预测框的具体方法为:
A-1:设置当前网格的先验框;
A-2:获取预测框与先验框的偏移量;
A-3:根据偏移量获取当前网格的预测框。
进一步地,步骤S1-3中,YOLOv4模型包括依次连接的骨架网络结构CSPDarknet-53和特征融合网络PAN。
进一步地,步骤S1-4的具体方法为:
S1-4-1:基于标签平滑方法将最终船舶图像数据集输入YOLOv4模型进行训练,得到初始船舶目标检测模型;
S1-4-2:使用CIoU损失函数对初始船舶目标检测模型进行优化,得到最优船舶目标检测模型。
进一步地,标签平滑方法的公式为:
P=P×(1-ε)+ε/Nc
式中,P为标签值;ε为错误率;Nc为类别个数;
CIoU损失函数的公式为:
LCIoU=1-CIoU
式中,LCIoU为CIoU损失函数;CIoU为回归损失值。
进一步地,最优船舶目标检测模型的损失函数的公式为:
式中,loss为损失总值;lbox、lcls、lobj分别为回归损失、分类损失和置信度损失;λcoord、λclass、λobj、λnoobj分别为回归损失因子、分类损失因子、第一置信度损失因子以及第二置信度损失因子;wi、hi分别为真实框的宽和真实框的高;pi(C)为船舶目标的概率真实值;为船舶目标的概率预估值;CIoU为回归损失值;i、j分别为区域指示量和每个区域的预测框指示量;S2、B分别为区域总数和每个区域的预测框总数;ci为第i个区域第j个边界框的置信度真实值;为第i个区域第j个边界框的置信度预估值;为目标指示量,当第i个区域第j个边界框有目标时为1,否则为0;与相反。
进一步地,步骤S3的具体方法为:
S3-1:将船舶目标待检测图像进行网格划分,并获取所有网格的的初始预测框;
S3-2:将带有初始预测框的船舶目标待检测图像输入船舶目标检测模型进行检测,得到船舶目标检测结果;
S3-3:若船舶目标检测结果为当前网格内含有船舶目标,则将对应的初始预测框进行筛选得到最终预测框,输出带有最终预测框的船舶目标检测结果图像。
本发明的有益效果为:
1)本发明基于卫星船舶图像数据集,获取船舶图像数据集,包括各种复杂的环境,提高了数据集的丰富程度,并对船舶图像数据集进行增强,提高了模型的泛化能力。
2)本发明基于建立YOLOv4模型,基于神经网络自动提取图像数据特征,进行目标的检测识别,提高了检测的精度。
本发明的其他有益效果将在具体实施方式中进行详细说明。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是基于YOLOv4算法的船舶目标检测方法流程图。
图2是卫星船舶图像数据集示例。
图3是预处理后船舶图像示例。
图4是Mosaic数据增强处理后图像示例。
图5是YOLO v4神经网络结构图。
图6是带有预测框的最终船舶图像示例。
图7是船舶目标检测结果图像示例。
图8是YOLOv4模型分析曲线图。
图9是YOLO-Lite模型分析曲线图。
图10是K-Means聚类方法流程。
具体实施方式
下面结合附图及具体实施例来对本发明作进一步阐述。在此需要说明的是,对于这些实施例方式的说明虽然是用于帮助理解本发明,但并不构成对本发明的限定。本发明公开的功能细节仅用于描述本发明的示例实施例。然而,可用很多备选的形式来体现本发明,并且不应当理解为本发明限制在本发明阐述的实施例中。
应当理解,本发明使用的术语仅用于描述特定实施例,并不意在限制本发明的示例实施例。若术语“包括”、“包括了”、“包含”和/或“包含了”在本发明中被使用时,指定所声明的特征、整数、步骤、操作、单元和/或组件的存在性,并且不排除一个或多个其他特征、数量、步骤、操作、单元、组件和/或他们的组合存在性或增加。
应当理解,还应当注意到在一些备选实施例中,所出现的功能/动作可能与附图出现的顺序不同。例如,取决于所涉及的功能/动作,实际上可以实质上并发地执行,或者有时可以以相反的顺序来执行连续示出的两个图。
应当理解,在下面的描述中提供了特定的细节,以便于对示例实施例的完全理解。然而,本领域普通技术人员应当理解可以在没有这些特定细节的情况下实现示例实施例。例如可以在框图中示出系统,以避免用不必要的细节来使得示例不清楚。在其他实例中,可以不以不必要的细节来示出众所周知的过程、结构和技术,以避免使得示例实施例不清楚。
实施例1
一种基于YOLOv4算法的船舶目标检测方法,如图1所示,包括如下步骤:
S1:基于YOLOv4算法建立船舶目标检测模型,具体方法为:
S1-1:基于如图2的(a)至(d)所示的卫星船舶图像数据集,获取初始船舶图像数据集,并对初始船舶图像数据集进行预处理,得到预处理后船舶图像数据集,预处理后船舶图像如图3的(a)至(h)所示;
该卫星船舶图像数据集包含从卫星提取的192556张JPEG图像,分辨率在1.5m以内;这些图像包含各种形状和尺寸的邮轮、商业船和渔船,有大量图像不包含船只,也有些图像可能包含多只船,图像内的船只大小不一,可能是在不同的拍摄地点(公海、码头),不同的天气下(黑夜、雨天、雾天)获取的,图像的种类比较丰富,很适合用来做船舶检测分析;
预处理包括依次进行的图像格式处理和数据增强处理,数据增强处理包括对图像进行的几何变换处理、光学变换处理、增加噪声处理、归一化处理以及Mosaic数据增强处理;
几何变换处理丰富物体在图像中出现的位置和尺度等,从而满足模型的平移不变性和尺度不变性,例如平移、翻转、缩放和裁剪等;由于外星图像中,方向可以是任意的,船头朝哪个方向都是可以的,所以进行水平和垂直翻转可以很好的扩充数据集,在训练过程中,每一次迭代都有一定概率对图像进行水平垂直翻转或者90度旋转;
光学变换处理增加不同光照和场景下的图像,典型的操作有亮度、对比度、色相与饱和度的随意扰动、通道色域之间的变换;
增加噪声处理通过在原始图像中增加一定的扰动,如高斯噪声,可以使模型对可能遇到的噪声具有抗干扰性,从而提升模型的泛化能力;
归一化处理图像处理完成后,需要对图像进行裁剪,让图像缩放到固定的尺寸768×768;
如图4所示,Mosaic数据增强处理采用了4张图片进行拼接,丰富图像的上下文信息,增强模型的鲁棒性;
S1-2:将预处理后船舶图像数据集中每个图像进行网格划分,得到带有预测框的最终船舶图像数据集,带有预测框的最终船舶图像如图6所示,获取网格的预测框的具体方法为:
A-1:设置当前网格的先验框;
A-2:获取预测框与先验框的偏移量;
A-3:根据偏移量获取当前网格的预测框,利用先验框和偏移量得到预测框;
S1-3:建立如图5所示的YOLOv4模型,YOLOv4模型包括依次连接的骨架网络结构CSPDarknet-53和特征融合网络PAN;
骨架网络结构CSPDarknet53由CBL模块、CBM模块、CSPX残差模块、SPP模块以及Concat特征模块组成,主要有三个方面的优点,减少计算量,降低内存,增强CNN的提取特征的能力,使得在轻量化的同时保持准确性,图中的各模块意义如下:CBL代表卷积、BN及LeakyReLU三层的结合;CBM,代表卷积、BN及Mish三层的结合;CSPX,代表残差模块,后面的数字代表有几个串联的残差模块,SPP代表空间金字塔池化,由卷积拼接成,卷积核大小是{1×1,5×5,9×9,13×13};Concat代表特征图的拼接,直接进行通道的堆叠;CSPDarknet53有着非常优秀的提取特征的能力,经过5次下采样和特征融合,最终输出3种尺度的特征图,相当于把整张图片分割成不同的网格,每个网格对应原图上的一块区域,然后在每个网格中预测是否有物体以及属于该类物体的类别;每个网格会生成5+C个值,1个置信度得分,4个边界框回归的偏移量tx、ty、tw、th,C个是类别概率;
YOLOv4神经网络最基本的结构块是CSPBlock,CSPBlock是由残差结构组成的卷积块,用于提取特征和下采样,CSP模块的结构并不复杂,将原来的残差块的堆叠分成了两部分,一部分继续残差模块的堆叠,另一部分则像一个大的残差边,经过少量的处理直接连接到最后;CSP模块主要由DBL的基本结构堆叠而成,每个CSP模块前面的卷积核的大小都是3×3,步长为2,因此可以起到下采样的作用,后面的是几个残差连接,可以加深网络;Backbone有5个CSP模块,下采样率32,当输入图像是768×768时,经过5次CSP模块后得到24×24大小的特征图;
S1-4:将最终船舶图像数据集输入YOLOv4模型进行训练,得到船舶目标检测模型,具体方法为:
S1-4-1:基于标签平滑方法将最终船舶图像数据集输入YOLOv4模型进行训练,得到初始船舶目标检测模型;
标签平滑方法的公式为:
P=P×(1-ε)+ε/Nc
式中,P为标签值;ε为错误率;Nc为类别个数;
S1-4-2:使用CIoU损失函数对初始船舶目标检测模型进行优化,得到最优船舶目标检测模型,CIoU损失函数的公式为:
LCIoU=1-CIoU
式中,LCIoU为CIoU损失函数;CIoU为回归损失值;
优化后显著提升检测效果,船舶检测的AP可达到95.00%,马赛克增强提高了模型的鲁棒性,而标签平滑可以校准网络,都可以提高模型的泛化能力;
最优船舶目标检测模型的损失函数的公式为:
式中,loss为损失总值;lbox、lcls、lobj分别为回归损失、分类损失和置信度损失;λcoord、λclass、λobj、λnoobj分别为回归损失因子、分类损失因子、第一置信度损失因子以及第二置信度损失因子;wi、hi分别为真实框的宽和真实框的高;pi(C)为船舶目标的概率真实值;为船舶目标的概率预估值;CIoU为回归损失值;i、j分别为区域指示量和每个区域的预测框指示量;S2、B分别为区域总数和每个区域的预测框总数;ci为第i个区域第j个边界框的置信度真实值;为第i个区域第j个边界框的置信度预估值;为目标指示量,当第i个区域第j个边界框有目标时为1,否则为0;与相反;
S2:获取船舶目标待检测图像,并对船舶目标检测图像进行预处理;
预处理包括依次进行的图像格式处理和数据增强处理,数据增强处理包括对图像进行的几何变换处理、光学变换处理、增加噪声处理、归一化处理以及Mosaic数据增强处理;
S3:将船舶目标待检测图像输入船舶目标检测模型,得到船舶目标检测结果图像,具体方法为:
S3-1:将船舶目标待检测图像进行网格划分,首先需要将图片缩放到指定尺寸(768×768),再将图片划分成S×S的小格,具体做法是,将图片输入到骨架网络结构CSPDarknet-53中,骨架网络结构CSPDarknet-53有着非常优秀的提取特征的能力,经过下采样和特征融合,最终输出3种尺度的特征图,分别为24×24、48×48、96×96,相当于把整张图片分割成24×24、48×48、96×96的网格,每个网格对应原图上的一块区域,然后在每个网格中预测是否有物体以及属于该类物体的类别,并获取所有网格的的初始预测框,以24×24的网格来讲,每个网格预测3个框,共产生24×24×3=1728个预测框,整个网络一共生成30528个预测框,通过网络的反向传播和梯度下降,修正网络参数,使网络收敛,最终得到整个网络的权重值,用于预测;
本实施例中,使用K-Means聚类方法获取所有网格的的初始预测框,使用K-means聚类来代替人工设计,自动生成一组更加适合数据集的Anchor预选框;K-Means聚类是典型的一个聚类算法,算法思想是首先确定K个初始对象作为种子对象,然后将其他对象分配到距离他最近的一个类别种,然后把每个类对象的平均值作为新的聚类中心,不断重复这个过程直到每个类不再发生变化,如图10所示,其具体方法为:
B-1:选取预处理后船舶图像的K个边框值(w,h)作为初始的聚类中心,其中(w,h)为归一化处理后船舶图像的真实框的宽和高;
B-2:计算每个真实框到每个聚类中心的距离,然后把边框分配给距离最近的类,本实施例中,距离是IoU距离,公式为:
d(box,centroid)=1-IoU(box,centroid)
式中,d(box,centroid)为真实框到聚类中心的距离;IoU(box,centroid)为真实框到聚类中心的IoU距离;
B-3:更新每个类别的聚类中心,将类中所有框平均值作为新聚类中心;
B-4:重复步骤B-2至B-3,直到聚类中心不再变化或者所有边框的类别不再发生变化;
每个网格共有3个预选框,按照图像被压缩的步长,确定预选框的尺寸;比如,下采样三次后,图像被放缩为原来的1/8,此时的步长就是8,那么8×8就作为这一层预选框的基础尺度,在这基础上,进行放缩,放缩的倍数分别为203、213和223,然后产生三种不同的长宽比的预选框,一共生成3种大小长宽比例不同的预选框;
通过K-Means算法得到多组预选框,选取其中得分最高的一组作为当前网格的最终的预选框,最衡量一组预选框的好坏时,使用真实框和这一组预选框的平均IoU作为标准,通过K-Means聚类得到的预选框求得的准确率为68.6%;
S3-2:将如图6所示的带有初始预测框的船舶目标待检测图像输入船舶目标检测模型进行检测,得到船舶目标检测结果;
S3-3:若船舶目标检测结果为当前网格内含有船舶目标,则根据IoU和置信度进行非极大值抑制筛初始选预测框得到最终预测框,输出如图7的(a)至(e)所示的带有最终预测框的船舶目标检测结果图像;
实验测试集图片共有8512张,包含船舶目标16264个,在置信度0.01的分数下,一共检测到28955个物体,当预测框和真实框的IoU阈值取0.5时,获得正例14979个,经过NMS之后,测得IoU阈值0.5的情况下,如图8的(a)和(b)所示,准确率为94.46%,召回率为93.42%,YOLOv4检测的平均精度可以达到95.00%,比现有技术的YOLOv3的船舶检测结果提高了3.3个百分点。
YOLO v4模型对于船舶目标检测的精度还是有很大的提升,使用了两种网络轻量化的方法来加快模型的检测速度,一种是使用轻量化的骨干网络MobileNet,MobileNet就是一个很轻量化的模型,将MobileNet应用到YOLO v4算法中可以减低参数,提高检测的速度;
MobileNet的最大的创新在于深度可分离卷积;深度可分离卷积将图像的区域和通道分开,在每个通道上单独进行卷积计算,然后使用1×1的逐点卷积改变通道;虽然深度可分离卷积将一步卷积过程扩展为两步,但减少了冗余计算;比如一个卷积层,输入为3通道的图片,输出为32通道的特征图,卷积核大小为3×3;如果用标准的卷积运算,需要用32个3通道的3×3卷积取扫描特征图计算,需要的参数量为32×3×3×3,等于864个;如果使用深度可分离卷积,先用3个3×3卷积去和输入图片的每个通道分别进行卷积计算,在用32个3通道的1×1卷积核做逐点计算,所需的参数量为3×3×3+32×3,一共是123个,因此总体上计算量大大降低;
二是针对船舶目标检测的轻量化网络YOLOv4-Lite简化了网络,改变了每个特征图的维度,降低了网络参数;因为船舶数据集的目标比较集中,主要包含小目标和中等目标,因此只需要在两个尺度上进行预测。
MobileNet v2-YOLOv4船舶检测的性能如图9的(a)和(b)所示,使用MobileNet v2作为YOLOv4检测方法的特征提取网络,在检测精度上和使用的CSPDarkNet-53的YOLOv4算法相比有所将低,大约降低了3个百分点,然而,检测的速度却大大提升,由原来的14帧每秒提升到37帧每秒,检测速度提高了3倍,在0.5的置信度和0.5的IoU域值下,YOLO-Lite模型的检测准确率是91.25%,检测的召回率是89.2%,检测的速度大大提升,YOLO-Lite模型的检测速度可达到58FPS。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所描述的实施例仅仅是示意性的,若涉及到作为分离部件说明的单元,其可以是或者也可以不是物理上分开的;若涉及到作为单元显示的部件,其可以是或者也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。本领域技术人员在不付出创造性的劳动的情况下,即可理解并实施。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
本发明不局限于上述可选的实施方式,任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制,本发明的保护范围应当以权利要求书中界定的为准,并且说明书可以用于解释权利要求书。
Claims (10)
1.一种基于YOLOv4算法的船舶目标检测方法,其特征在于:包括如下步骤:
S1:基于YOLOv4算法建立船舶目标检测模型;
S2:获取船舶目标待检测图像;
S3:将船舶目标待检测图像输入船舶目标检测模型,得到船舶目标检测结果图像。
2.根据权利要求1所述的一种基于YOLOv4算法的船舶目标检测方法,其特征在于:所述的步骤S1的具体方法为:
S1-1:基于卫星船舶图像数据集,获取初始船舶图像数据集,并对初始船舶图像数据集进行预处理,得到预处理后船舶图像数据集;
S1-2:将预处理后船舶图像数据集中每个图像进行网格划分,并获取每个网格的预测框,得到带有预测框的最终船舶图像数据集;
S1-3:建立YOLOv4模型;
S1-4:将最终船舶图像数据集输入YOLOv4模型进行训练,得到船舶目标检测模型。
3.根据权利要求2所述的一种基于YOLOv4算法的船舶目标检测方法,其特征在于:所述的步骤S1-1中,预处理包括依次进行的图像格式处理和数据增强处理。
4.根据权利要求3所述的一种基于YOLOv4算法的船舶目标检测方法,其特征在于:所述的数据增强处理包括对图像进行的几何变换处理、光学变换处理、增加噪声处理、归一化处理以及Mosaic数据增强处理。
5.根据权利要求2所述的一种基于YOLOv4算法的船舶目标检测方法,其特征在于:所述的步骤S1-2中,获取网格的预测框的具体方法为:
A-1:设置当前网格的先验框;
A-2:获取预测框与先验框的偏移量;
A-3:根据偏移量获取当前网格的预测框。
6.根据权利要求2所述的一种基于YOLOv4算法的船舶目标检测方法,其特征在于:所述的步骤S1-3中,所述的YOLOv4模型包括依次连接的骨架网络结构CSPDarknet-53和特征融合网络PAN。
7.根据权利要求2所述的一种基于YOLOv4算法的船舶目标检测方法,其特征在于:所述的步骤S1-4的具体方法为:
S1-4-1:基于标签平滑方法将最终船舶图像数据集输入YOLOv4模型进行训练,得到初始船舶目标检测模型;
S1-4-2:使用CIoU损失函数对初始船舶目标检测模型进行优化,得到最优船舶目标检测模型。
8.根据权利要求7所述的一种基于YOLOv4算法的船舶目标检测方法,其特征在于:所述的标签平滑方法的公式为:
P=P×(1-ε)+ε/Nc
式中,P为标签值;ε为错误率;Nc为类别个数;
所述的CIoU损失函数的公式为:
LCIoU=1-CIoU
式中,LCIoU为CIoU损失函数;CIoU为回归损失值。
9.根据权利要求8所述的一种基于YOLOv4算法的船舶目标检测方法,其特征在于:所述的最优船舶目标检测模型的损失函数的公式为:
10.根据权利要求1所述的一种基于YOLOv4算法的船舶目标检测方法,其特征在于:所述的步骤S3的具体方法为:
S3-1:将船舶目标待检测图像进行网格划分,并获取所有网格的的初始预测框;
S3-2:将带有初始预测框的船舶目标待检测图像输入船舶目标检测模型进行检测,得到船舶目标检测结果;
S3-3:若船舶目标检测结果为当前网格内含有船舶目标,则将对应的初始预测框进行筛选得到最终预测框,输出带有最终预测框的船舶目标检测结果图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110779963.6A CN113486819A (zh) | 2021-07-09 | 2021-07-09 | 一种基于YOLOv4算法的船舶目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110779963.6A CN113486819A (zh) | 2021-07-09 | 2021-07-09 | 一种基于YOLOv4算法的船舶目标检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113486819A true CN113486819A (zh) | 2021-10-08 |
Family
ID=77938380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110779963.6A Pending CN113486819A (zh) | 2021-07-09 | 2021-07-09 | 一种基于YOLOv4算法的船舶目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113486819A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113989769A (zh) * | 2021-10-26 | 2022-01-28 | 重庆理工大学 | 一种基于深度学习的车辆检测模型构建方法 |
CN114399654A (zh) * | 2021-11-11 | 2022-04-26 | 国网江苏省电力有限公司苏州供电分公司 | 一种输电线通道入侵目标识别告警方法 |
CN114463650A (zh) * | 2022-01-06 | 2022-05-10 | 江苏科技大学 | 一种基于胶囊神经网络的船舶目标检测方法 |
CN115147723A (zh) * | 2022-07-11 | 2022-10-04 | 武汉理工大学 | 一种内河船舶识别与测距方法、系统、介质、设备及终端 |
CN115966009A (zh) * | 2023-01-03 | 2023-04-14 | 迪泰(浙江)通信技术有限公司 | 一种船舶智能检测系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147807A (zh) * | 2019-01-04 | 2019-08-20 | 上海海事大学 | 一种船舶智能识别跟踪方法 |
CN112800838A (zh) * | 2020-12-28 | 2021-05-14 | 浙江万里学院 | 一种基于深度学习的航道船舶检测与识别方法 |
CN112836668A (zh) * | 2021-02-22 | 2021-05-25 | 集美大学 | 一种船舶目标检测方法、终端设备及存储介质 |
-
2021
- 2021-07-09 CN CN202110779963.6A patent/CN113486819A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147807A (zh) * | 2019-01-04 | 2019-08-20 | 上海海事大学 | 一种船舶智能识别跟踪方法 |
CN112800838A (zh) * | 2020-12-28 | 2021-05-14 | 浙江万里学院 | 一种基于深度学习的航道船舶检测与识别方法 |
CN112836668A (zh) * | 2021-02-22 | 2021-05-25 | 集美大学 | 一种船舶目标检测方法、终端设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
CHRISTIAN SZEGEDY等: "Rethinking the Inception Architecture for Computer Vision", 《2016 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
XIAOYANG0307: "YOLOV4用到的一些tricks以及代码实现(2)——CIou_Loss", 《HTTPS://BLOG.CSDN.NET/XIAOYANG0307/ARTICLE/DETAILS/114262225》 * |
XUELONG HU等: "Real-time detection of uneaten feed pellets in underwater images for aquaculture using an improved YOLO-V4 network", 《COMPUTERS AND ELECTRONICS IN AGRICULTURE》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113989769A (zh) * | 2021-10-26 | 2022-01-28 | 重庆理工大学 | 一种基于深度学习的车辆检测模型构建方法 |
CN114399654A (zh) * | 2021-11-11 | 2022-04-26 | 国网江苏省电力有限公司苏州供电分公司 | 一种输电线通道入侵目标识别告警方法 |
CN114463650A (zh) * | 2022-01-06 | 2022-05-10 | 江苏科技大学 | 一种基于胶囊神经网络的船舶目标检测方法 |
CN115147723A (zh) * | 2022-07-11 | 2022-10-04 | 武汉理工大学 | 一种内河船舶识别与测距方法、系统、介质、设备及终端 |
CN115147723B (zh) * | 2022-07-11 | 2023-05-09 | 武汉理工大学 | 一种内河船舶识别与测距方法、系统、介质、设备及终端 |
CN115966009A (zh) * | 2023-01-03 | 2023-04-14 | 迪泰(浙江)通信技术有限公司 | 一种船舶智能检测系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112308019B (zh) | 基于网络剪枝和知识蒸馏的sar舰船目标检测方法 | |
CN113486819A (zh) | 一种基于YOLOv4算法的船舶目标检测方法 | |
CN111179217A (zh) | 一种基于注意力机制的遥感图像多尺度目标检测方法 | |
CN114565860B (zh) | 一种多维度增强学习合成孔径雷达图像目标检测方法 | |
CN111797712B (zh) | 基于多尺度特征融合网络的遥感影像云与云阴影检测方法 | |
CN113160062B (zh) | 一种红外图像目标检测方法、装置、设备及存储介质 | |
CN111079739B (zh) | 一种多尺度注意力特征检测方法 | |
CN110796009A (zh) | 基于多尺度卷积神经网络模型的海上船只检测方法及系统 | |
CN108428220B (zh) | 静止轨道卫星序列遥感影像海岛礁区域自动几何校正方法 | |
CN106295613A (zh) | 一种无人机目标定位方法及系统 | |
CN107731011B (zh) | 一种港口泊船监测方法、系统及电子设备 | |
CN111753677A (zh) | 基于特征金字塔结构的多角度遥感船舶图像目标检测方法 | |
CN114022408A (zh) | 基于多尺度卷积神经网络的遥感图像云检测方法 | |
CN111241970A (zh) | 基于yolov3算法与滑动窗口策略的SAR影像海面舰船检测方法 | |
CN115147731A (zh) | 一种基于全空间编码注意力模块的sar图像目标检测方法 | |
CN115359366A (zh) | 基于参数优化的遥感图像目标检测方法 | |
CN115223056A (zh) | 基于多尺度特征增强的光学遥感图像舰船目标检测方法 | |
CN115965862A (zh) | 基于掩码网络融合图像特征的sar舰船目标检测方法 | |
CN115272876A (zh) | 一种基于深度学习的遥感图像船舶目标检测方法 | |
CN115047455A (zh) | 一种轻量化的sar图像舰船目标检测方法 | |
CN114972918A (zh) | 基于集成学习与ais数据的遥感图像舰船目标识别方法 | |
CN116109942A (zh) | 一种可见光遥感图像舰船目标检测方法 | |
CN114565824B (zh) | 基于全卷积网络的单阶段旋转舰船检测方法 | |
CN117011614A (zh) | 基于深度学习的野山参艼芦体检测和品质等级分类方法及系统 | |
CN110069987B (zh) | 基于改进vgg网络的单阶段船舶检测算法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211008 |
|
RJ01 | Rejection of invention patent application after publication |