CN112084815A - 一种基于摄像机焦距变换的目标检测方法、存储介质及处理器 - Google Patents
一种基于摄像机焦距变换的目标检测方法、存储介质及处理器 Download PDFInfo
- Publication number
- CN112084815A CN112084815A CN201910510818.0A CN201910510818A CN112084815A CN 112084815 A CN112084815 A CN 112084815A CN 201910510818 A CN201910510818 A CN 201910510818A CN 112084815 A CN112084815 A CN 112084815A
- Authority
- CN
- China
- Prior art keywords
- target
- data
- training set
- focal length
- camera
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 104
- 238000006243 chemical reaction Methods 0.000 title claims description 20
- 238000012549 training Methods 0.000 claims abstract description 146
- 230000009466 transformation Effects 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 22
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 230000002093 peripheral effect Effects 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims description 2
- 238000003384 imaging method Methods 0.000 abstract description 10
- 238000004088 simulation Methods 0.000 abstract 1
- 238000013135 deep learning Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000013461 design Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/67—Focus control based on electronic image sensor signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于摄像机焦距变换的目标检测方法、存储介质及处理器,其中,方法包括建立第一、第二数据训练集,第一训练数据集为拍摄原图训练数据集,第二训练数据集为摄像机模拟焦距变换的目标所在区域训练数据集;设计目标检测网络,分别训练第一、第二数据训练集;调用基于第一数据训练集的目标检测网络对第一数据训练集进行检测,得出第一数据训练集目标置信度;判断第一数据训练集目标置信度是否在置信度阈值范围内,在则判断该区域内有目标物,否则改变摄像机焦距,获得该目标区域附近的第三数据训练集。通过更改摄像机焦距,使得目标在成像结果上的尺寸变大,提高被检测目标物体的置信度,减小了误检率,提升了检测性能。
Description
【技术领域】
本发明涉及目标检测技术领域,尤其涉及一种基于摄像机焦距变换的目标检测方法、存储介质及处理器。
【背景技术】
高分辨率的无人机图像在全球范围内越来越常见,它包含大量可与维护、土地开发、疾病控制、缺陷定位、监测等应用相关联的信息。这些数据往往是通过网络传输至地面站,由地面站工作人员对图像数据进行分析,并确定其中是否有可用目标,从而对其目标所包含的信息进行分析。由于无人机往往拍摄的场景较大、飞行高度较高,使其成像结果中目标物体尺寸较小,这往往需要巨大的人力和时间去分析。随着人工智能的兴起,常规目标检测的精度得到大幅提高,很多工程应用、学术研究均将基于深度学习的目标检测算法作为研究重点。其次将目标检测算法运用在无人机上也是迫切需要的,例如无人机的监控场景中的行人计数,目标种类判断等。因此实现无人机俯拍场景下的自动目标检测是一个亟需解决的问题。
现有技术中,如有一种水面异物检测方法,解决现有技术存在水面异物检测准确率低的技术问题,只是针对无人机拍摄的水面图像进行处理,不能涵盖其他的场景,具有场景的局限性,场景较小。虽然用了基于卷积神经网络的yolo v3的目标检测算法,但对算法的图像输入要求较高,处理较为麻烦,不利于满足算法的实时要求。
还有基于深度学习的油气管道全智能巡检系统,采用无人机搭载高分辨率可见光相机从空中获得影像数据,用户可用图传设备在地面上实时看到处理后的影像;再利用其预置的深度神经网络识别器自动发现危害油气管道安全的行为;一旦发现危害管道安全的行为,则可以保存相关数据,并通过4G网络向监管部门传输位置数据、时间数据和影像数据,且触发警报。该方案主要是针对油管场景进行检测,同时是对危害油气管道安全的行为进行识别,并不包括对其目标进行检测;包括的模块较多,方法复杂。
以上技术方案都是对特定场景下的目标进行检测,不具有广泛适用性。
【发明内容】
本发明所要解决的技术问题是提供一种基于摄像机焦距变换的目标检测方法、存储介质及处理器,能够通过更改摄像机焦距,使得目标在成像结果上的尺寸变大,提高被检测目标物体的置信度,减小了误检率,提升了检测性能。
为解决上述技术问题,本发明一实施例提供了一种基于摄像机焦距变换的目标检测方法,包括:
建立第一数据训练集和第二数据训练集,所述第一训练数据集为拍摄原图训练数据集,第二训练数据集为摄像机模拟焦距变换的目标所在区域训练数据集;
设计基于深度卷积网络的目标检测网络,分别训练第一数据训练集和第二数据训练集;
调用基于第一数据训练集的目标检测网络对第一数据训练集进行检测,得出第一数据训练集目标置信度;
判断第一数据训练集目标置信度是否在置信度阈值范围内,如果在,则判断该区域内有目标物,否则则改变摄像机的焦距,获得该目标区域附近的第三数据训练集;
利用基于第二数据训练集的目标检测网络,训练第三数据训练集,获得目标在第一数据训练集中的位置信息和置信度。
优选地,建立第一数据训练集和第二数据训练集包括:摄像机拍摄目标区域视频,对所述目标区域视频进行解码,获取原图图片。
优选地,建立第一数据训练集和第二数据训练集包括:通过摄像机模拟焦距变换,获取所述目标区域周边图片。
优选地,所述置信度阈值范围为0.5~1。
优选地,所述基于深度卷积网络的目标检测网络采用四个残差模块组成检测网络的骨干网络。
优选地,摄像机拍摄目标区域视频,对所述目标区域视频进行解码,获取原图图片包括:在解码过程中,每隔20~30帧保存一帧原图图片。
优选地,从所述原图图片中选择包括三个以上目标物体的原图图片作为第一数据训练集待标注的数据。
优选地,通过摄像机模拟焦距变换,获取所述目标区域周边图片包括:改变摄像机焦距,对所述目标区域周边进行录像获取视频,对视频进行解码。
优选地,所述四个残差模块中第一个残差模块包含一个残差基础模块,第二个残差模块包含两个残差基础模块,第三个残差模块包含两个残差基础模块,第四个残差模块包含四个残差基础模块,所述第四个残差模块输入大小由416像素×416像素,经过四个残差模块后变为26像素×26像素。
优选地,对目标物体的原图图片中的目标进行标注,得到矩形框左上角和右下角在图像中的坐标和目标物的种类,保存标注结果。
优选地,在解码过程中,每隔20~30帧保存一帧目标区域周边图片。
另一方面,本发明一实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序运行时执行上述的目标检测方法。
本发明一实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述的目标检测方法。
与现有技术相比,上述技术方案具有以下优点:建立两个训练集,并设计目标检测网络分别对两个数据集进行训练。在设计网络过程中,通过对无人机成像数据进行观察,设计一种适合无人机俯拍数据的检测模型,使其中小目标的特征很好的被抽象出来。在调用模型阶段,首先调用利用原始数据训练的模型,通过对目标置信度阈值的设定,使得大于阈值的被检测目标直接输出结果,在没有大于阈值的被检测目标中,通过调整机载摄像机的焦距,获得被检测目标区域附近的图像并调用利用模拟焦距变换的数据训练的模型,使其能够更好的检测模型,并提高其在原图中的置信度。通过对无人机机载摄像机焦距的改变,使得目标在成像结果上的尺寸变大,提高被检测目标物体的置信度,与只调用一个模型并单单修改置信度阈值相比,减小了误检率,提升了检测性能。
【附图说明】
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是基于摄像机焦距变换的目标检测方法流程图。
图2是基于深度学习的two-stage目标检测算法流程图。
图3是基于深度学习的one-stage目标检测算法流程图。
图4是基于摄像机焦距变换的目标检测方法中残差网络的基础模块结构示意图。
图5是基于摄像机焦距变换的目标检测方法中网络训练流程图。
图6是基于摄像机焦距变换的目标检测方法一优选实施例流程图。
【具体实施方式】
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一
图1是基于摄像机焦距变换的目标检测方法流程图。如图1所示,一种基于摄像机焦距变换的目标检测方法,包括步骤:
S11、建立第一数据训练集和第二数据训练集,所述第一训练数据集为拍摄原图训练数据集,第二训练数据集为摄像机模拟焦距变换的目标所在区域训练数据集;
S12、设计基于深度卷积网络的目标检测网络,分别训练第一数据训练集和第二数据训练集;
S13、调用基于第一数据训练集的目标检测网络对第一数据训练集进行检测,得出第一数据训练集目标置信度;
S14、判断第一数据训练集目标置信度是否在置信度阈值范围内,如果在,则判断该区域内有目标物,否则则改变摄像机的焦距,获得该目标区域附近的第三数据训练集;
S15、利用基于第二数据训练集的目标检测网络,训练第三数据训练集,获得目标在第一数据训练集中的位置信息和置信度。
图2是基于深度学习的two-stage目标检测算法流程图。基于深度学习的目标检测算法主要分为one-stage思想和two-stage思想。two-stage从图片输入进检测网络得到检测结果需要两个步骤,第一步需要产生图像中可能包含目标物体的候选框;第二步利用候选框的特征对框的位置信息进行微调和分类,从而得到目标种类的置信度和位置。one-stage思想不需要先产生可能包含目标物体的候选框,通过卷积神经网络产生的特征图直接得到目标种类的置信度和位置。
图3是基于深度学习的one-stage目标检测算法流程图。如图3所示,在网络设计的步骤中,本发明为了保证实时性,设计了参数较少的检测网络,利用目标检测算法的one-stage思想设计检测网络进行训练,即从图像输入到输出结果只需要一个卷积神经网络。
在该两种思想中,two-stage思想精度较高,但速度较慢,不满足工程应用的实时性要求;one-stage思想的速度具有优势。近年来,随着基于深度学习的目标检测算法中的one-stage算法的发展,利用该思想在目标检测领域里的精度已经可以和利用two-stage思想的算法相提并论,例如SSD系列和yolo系列。因此在本方案中将利用one-stage思想进行网络设计。
图4是基于摄像机焦距变换的目标检测方法中残差网络的基础模块结构示意图。如图4所示,本发明使用的目标检测网络是以深度残差网络为骨干网络。残差网络为2015年提出的网络,其特征提取性能优于其他深度网络。one-stage思想的目标检测网络,其骨干网络均较深,例如SSD系列和yolo系列,会更加有利于对图像特征的提取以及对图像特征的抽象化。但在无人机的大场景俯拍下,目标物体的尺寸相对于原图像较小,如采用较深的骨干网络对图像的特征提取,可能会造成小目标被完全抽象掉,从而影响算法性能,因此本发明使用较浅的残差模块作为骨干网络。
本发明采用四个残差模块组成检测网络的骨干网络,使得网络结果可以很好地提取图像特征,保留了小目标物体的抽象特征。本发明采用的残差模块的个数相对于SSD系列和yolo系列已经少了较多。一个基本的残差模块如图4所示,x为残差模块的输入,F(x)为卷积神经网络的原始映射。relu为深度残差模块中的激活函数,H(x)为深度残差模块的输出函数,深度残差模块采用原始映射F(x)和输入x加和后构成新的网络输出函数。四个残差模块中第一个残差模块包含一个残差基础模块,第二个残差模块包含两个残差基础模块,第三个残差模块包含两个残差基础模块,第四个残差模块包含四个残差基础模块,所述第四个残差模块输入大小由416像素×416像素,经过四个残差模块后变为26像素×26像素。
在one-stage思想中,最后的检测模块是在基于骨干网络生成的特征图上的每一个像素(可看成一个格子)生成多个不同长宽比的框来完成目标位置的预测。如果目标物体的中心落在特征图的某个格子里,则该格子就会参与目标位置预测。因此需对不同长宽比的框预定义。由于其公共数据集中的目标尺寸范围较大,所以需要定义较大范围长宽比的格子。但在无人机大场景下,目标尺寸相对于原图较小,导致其目标尺寸在原图中的变化范围不大,所以在本发明中对框的长宽比的采用了较小的范围。
在深度学习领域中,网络通过对数据的学习即训练过程形成网络对数据的认知能力。在训练过程,算法一般通过loss函数指导网络学习。当loss函数的函数值达到最小值,意味着网络训练结束即达到了最优状态。本发明中用的loss函数为:
本发明全部使用了均方和误差作为loss函数,由三部分组成:坐标误差、IOU误差和分类误差。其中corrdErr为坐标误差,坐标误差主要指导网络对即将预测的框的坐标位置学习,iouErr主要是指导网络在特征图上的某一个格子(像素)是否包含目标物体学习,从而指导网络对目标位置的预测。clsErr主要指导格子中包含某种目标物体的学习。在上述公式中,i为在特征上的位置,S2为特征图的大小S×S。
图5是基于摄像机焦距变换的目标检测方法中网络训练流程图。如图5所示,一种基于摄像机焦距变换的目标检测方法中网络训练流程,包括步骤:
S21、训练数据集建立,包括第一数据训练集和第二数据训练集;这里所述第一训练数据集为拍摄原图训练数据集,第二训练数据集为摄像机模拟焦距变换的目标所在区域训练数据集;
S22、目标检测网络设计,这里目标检测网络是基于深度卷积网络的目标检测网络,分别用于训练第一数据训练集和第二数据训练集;
S231、利用第一数据训练集训练第一模型;
S232、利用第二数据训练集训练第二模型;
S241、输出第一网络模型;
S242、输出第二网络模型。
进行网络训练后,再进行网络输出。本方案已经建立了数据集,并且利用两个数据集训练网络,通过loss函数指导网络训练,并假设网络模型已经达到了最优状态。此处本发明将利用原始图像训练出的模型称为第一网络模型,利用目标周边区域训练出的模型称为第二网络模型。
本发明通过控制机载摄像机焦距的变换来提高目标检测的精度。其具体步骤如下所示:
当无人机巡航时,首先对传回来的图像数据解码后调用模型1对原始图片中的目标物体进行检测,对图像进行目标检测会得到目标种类的置信度和位置。一般定义当置信度大于0.5小于1时便会认为是某种物体。在该步骤中,如果检测出的目标物体的置信度大于阈值0.5时则直接输出目标检测结果,则认为是目标区域。
当检测出的目标物体的置信度大于阈值0.5时会直接输出结果,但在无人机俯拍的大场景下,检测算法得到的置信度往往较低。如果直接对原图检测时设定较低的置信度阈值,可能会造成较多的误检。因此在本发明中当原图检测出的置信度在0.1和0.5之间时,通过软件调大机载摄像机的焦距,使其抓拍阈值在0.1和0.5之间的目标区域,获得该目标区域附近的第三数据训练集,并将得到的图像输入第二网络模型中,对其是某种物体的置信度重新判断,从而提高其置信度,降低误检。本步骤通过软件控制机载摄像机的焦距变大,使其目标在成像效果上相对于原图变大。当系统判断出某目标置信度偏低需要调整无人机焦距时,通过网络通信或者红外蓝牙,将要调整的焦距范围压缩为二进制文件,传递给无人机中的摄像头内嵌系统,从而达到控制改变焦距。因此提升了置信度,减少了原图中出现误检的概率,达到了检测性能提升的目的
将第一网络模型和第二网络模型的检测结果进行整合,其中目标置信度按照两个模型输出较高的值,目标的位置信息统一按照原图的坐标进行输出。
图6是基于摄像机焦距变换的目标检测方法一优选实施例流程图。如图6所示,进入网络训练阶段:数据集建立,设计网络和训练网络,输出第一网络模型和第二网络模型。再输入摄像机拍摄的原图图片,调用第一网络模型,判断置信度是否大于0.5,如果是,则输出第一结果;如果否则调大焦距,得到置信度低于0.5的目标区域附近的图像,再调用第二网络模型,输出第二结果。再将输出的第一结果和第二结果进行整合,输出最终结果。
实施例二
本发明的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述的基于摄像机焦距变换的目标检测方法流程。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下基于摄像机焦距变换的目标检测方法流程的程序代码:
S11、建立第一数据训练集和第二数据训练集,所述第一训练数据集为拍摄原图训练数据集,第二训练数据集为摄像机模拟焦距变换的目标所在区域训练数据集;建立第一数据训练集和第二数据训练集包括:摄像机拍摄目标区域视频,对所述目标区域视频进行解码,获取原图图片;通过摄像机模拟焦距变换,获取所述目标区域周边图片。摄像机拍摄目标区域视频,对所述目标区域视频进行解码,获取原图图片包括:在解码过程中,每隔20~30帧保存一帧原图图片。从所述原图图片中选择包括三个以上目标物体的原图图片作为第一数据训练集待标注的数据。通过摄像机模拟焦距变换,获取所述目标区域周边图片包括:改变摄像机焦距,对所述目标区域周边进行录像获取视频,对视频进行解码。
S12、设计基于深度卷积网络的目标检测网络,分别训练第一数据训练集和第二数据训练集。
S13、调用基于第一数据训练集的目标检测网络对第一数据训练集进行检测,得出第一数据训练集目标置信度。
S14、判断第一数据训练集目标置信度是否在置信度阈值范围内,如果在,则判断该区域内有目标物,否则则改变摄像机的焦距,获得该目标区域附近的第三数据训练集。置信度阈值范围一般设置为0.5~1。
S15、利用基于第二数据训练集的目标检测网络,训练第三数据训练集,获得目标在第一数据训练集中的位置信息和置信度。基于深度卷积网络的目标检测网络采用四个残差模块组成检测网络的骨干网络。对目标物体的原图图片中的目标进行标注,得到矩形框左上角和右下角在图像中的坐标和目标物的种类,保存标注结果。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
由此可见,通过采用本发明存储介质,减小了存储容量,内置的基于摄像机焦距变换的目标检测方法流程的程序,通过更改摄像机焦距,使得目标在成像结果上的尺寸变大,提高被检测目标物体的置信度,减小了误检率,提升了检测性能。
实施例三
本发明的实施例还提供了一种处理器,该处理器用于运行程序,其中,该程序运行时执行上述的基于摄像机焦距变换的目标检测方法中的步骤。
可选地,在本实施例中,上述程序用于执行以下步骤:
S11、建立第一数据训练集和第二数据训练集,所述第一训练数据集为拍摄原图训练数据集,第二训练数据集为摄像机模拟焦距变换的目标所在区域训练数据集;
S12、设计基于深度卷积网络的目标检测网络,分别训练第一数据训练集和第二数据训练集;
S13、调用基于第一数据训练集的目标检测网络对第一数据训练集进行检测,得出第一数据训练集目标置信度;
S14、判断第一数据训练集目标置信度是否在置信度阈值范围内,如果在,则判断该区域内有目标物,否则则改变摄像机的焦距,获得该目标区域附近的第三数据训练集;
S15、利用基于第二数据训练集的目标检测网络,训练第三数据训练集,获得目标在第一数据训练集中的位置信息和置信度。
可选地,本实施例中的具体示例可以参考上述实施例及具体实施时所描述的示例,本实施例在此不再赘述。
由此可见,通过采用本发明处理器,内置的基于摄像机焦距变换的目标检测方法流程的程序,通过更改摄像机焦距,使得目标在成像结果上的尺寸变大,提高被检测目标物体的置信度,减小了误检率,提升了检测性能。
由上述说明可知,使用根据本发明的基于摄像机焦距变换的目标检测方法、存储介质及处理器,通过建立两个训练集,并设计目标检测网络分别对两个数据集进行训练;在设计网络过程中,通过对无人机成像数据进行观察,设计一种适合无人机俯拍数据的检测模型,使其中小目标的特征很好的被抽象出来;在调用模型阶段,首先调用利用原始数据训练的模型,通过对目标置信度阈值的设定,使得大于阈值的被检测目标直接输出结果,在没有大于阈值的被检测目标中,通过调整机载摄像机的焦距,获得被检测目标区域附近的图像并调用利用模拟焦距变换的数据训练的模型,使其能够更好的检测模型,并提高其在原图中的置信度;通过对无人机机载摄像机焦距的改变,使得目标在成像结果上的尺寸变大,提高被检测目标物体的置信度,与只调用一个模型并单单修改置信度阈值相比,减小了误检率,提升了检测性能。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (13)
1.一种基于摄像机焦距变换的目标检测方法,其特征在于,包括:
建立第一数据训练集和第二数据训练集,所述第一训练数据集为拍摄原图训练数据集,第二训练数据集为摄像机模拟焦距变换的目标所在区域训练数据集;
设计基于深度卷积网络的目标检测网络,分别训练第一数据训练集和第二数据训练集;
调用基于第一数据训练集的目标检测网络对第一数据训练集进行检测,得出第一数据训练集目标置信度;
判断第一数据训练集目标置信度是否在置信度阈值范围内,如果在,则判断该区域内有目标物,否则则改变摄像机的焦距,获得该目标区域附近的第三数据训练集;
利用基于第二数据训练集的目标检测网络,训练第三数据训练集,获得目标在第一数据训练集中的位置信息和置信度。
2.根据权利要求1所述的基于摄像机焦距变换的目标检测方法,其特征在于,建立第一数据训练集和第二数据训练集包括:摄像机拍摄目标区域视频,对所述目标区域视频进行解码,获取原图图片。
3.根据权利要求1所述的基于摄像机焦距变换的目标检测方法,其特征在于,建立第一数据训练集和第二数据训练集包括:通过摄像机模拟焦距变换,获取所述目标区域周边图片。
4.根据权利要求1所述的基于摄像机焦距变换的目标检测方法,其特征在于,所述置信度阈值范围为0.5~1。
5.根据权利要求1所述的基于摄像机焦距变换的目标检测方法,其特征在于,所述基于深度卷积网络的目标检测网络采用四个残差模块组成检测网络的骨干网络。
6.根据权利要求2所述的基于摄像机焦距变换的目标检测方法,其特征在于,摄像机拍摄目标区域视频,对所述目标区域视频进行解码,获取原图图片包括:在解码过程中,每隔20~30帧保存一帧原图图片。
7.根据权利要求2所述的基于摄像机焦距变换的目标检测方法,其特征在于,从所述原图图片中选择包括三个以上目标物体的原图图片作为第一数据训练集待标注的数据。
8.根据权利要求3所述的基于摄像机焦距变换的目标检测方法,其特征在于,通过摄像机模拟焦距变换,获取所述目标区域周边图片包括:改变摄像机焦距,对所述目标区域周边进行录像获取视频,对视频进行解码。
9.根据权利要求5所述的基于摄像机焦距变换的目标检测方法,其特征在于,所述四个残差模块中第一个残差模块包含一个残差基础模块,第二个残差模块包含两个残差基础模块,第三个残差模块包含两个残差基础模块,第四个残差模块包含四个残差基础模块,所述第四个残差模块输入大小由416像素×416像素,经过四个残差模块后变为26像素×26像素。
10.根据权利要求7所述的基于摄像机焦距变换的目标检测方法,其特征在于,对目标物体的原图图片中的目标进行标注,得到矩形框左上角和右下角在图像中的坐标和目标物的种类,保存标注结果。
11.根据权利要求8所述的基于摄像机焦距变换的目标检测方法,其特征在于,在解码过程中,每隔20~30帧保存一帧目标区域周边图片。
12.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至11中任一项所述的目标检测方法。
13.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至11中任一项所述的目标检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910510818.0A CN112084815A (zh) | 2019-06-13 | 2019-06-13 | 一种基于摄像机焦距变换的目标检测方法、存储介质及处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910510818.0A CN112084815A (zh) | 2019-06-13 | 2019-06-13 | 一种基于摄像机焦距变换的目标检测方法、存储介质及处理器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112084815A true CN112084815A (zh) | 2020-12-15 |
Family
ID=73733659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910510818.0A Pending CN112084815A (zh) | 2019-06-13 | 2019-06-13 | 一种基于摄像机焦距变换的目标检测方法、存储介质及处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112084815A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113065513A (zh) * | 2021-01-27 | 2021-07-02 | 武汉星巡智能科技有限公司 | 智能摄像头自训练置信度阈值的优化方法、装置及设备 |
WO2023159611A1 (zh) * | 2022-02-28 | 2023-08-31 | 深圳市大疆创新科技有限公司 | 图像拍摄方法、装置与可移动平台 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106971152A (zh) * | 2017-03-16 | 2017-07-21 | 天津大学 | 一种基于航拍图像的检测输电线路中鸟巢的方法 |
CN107506729A (zh) * | 2017-08-24 | 2017-12-22 | 中国科学技术大学 | 一种基于深度学习的能见度检测方法 |
US20190130230A1 (en) * | 2017-10-26 | 2019-05-02 | Samsung Sds Co., Ltd. | Machine learning-based object detection method and apparatus |
-
2019
- 2019-06-13 CN CN201910510818.0A patent/CN112084815A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106971152A (zh) * | 2017-03-16 | 2017-07-21 | 天津大学 | 一种基于航拍图像的检测输电线路中鸟巢的方法 |
CN107506729A (zh) * | 2017-08-24 | 2017-12-22 | 中国科学技术大学 | 一种基于深度学习的能见度检测方法 |
US20190130230A1 (en) * | 2017-10-26 | 2019-05-02 | Samsung Sds Co., Ltd. | Machine learning-based object detection method and apparatus |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113065513A (zh) * | 2021-01-27 | 2021-07-02 | 武汉星巡智能科技有限公司 | 智能摄像头自训练置信度阈值的优化方法、装置及设备 |
CN113065513B (zh) * | 2021-01-27 | 2024-07-09 | 武汉星巡智能科技有限公司 | 智能摄像头自训练置信度阈值的优化方法、装置及设备 |
WO2023159611A1 (zh) * | 2022-02-28 | 2023-08-31 | 深圳市大疆创新科技有限公司 | 图像拍摄方法、装置与可移动平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110956094B (zh) | 一种基于非对称双流网络的rgb-d多模态融合人员检测方法 | |
Kim et al. | High-speed drone detection based on yolo-v8 | |
CN109840531B (zh) | 训练多标签分类模型的方法和装置 | |
CN111784685A (zh) | 一种基于云边协同检测的输电线路缺陷图像识别方法 | |
CN114445706A (zh) | 一种基于特征融合的输电线路目标检测与识别方法 | |
KR20200047307A (ko) | 유용한 학습 데이터를 취사 선별하기 위한 cnn 기반 학습 방법 및 학습 장치 그리고 이를 이용한 테스트 방법 및 테스트 장치 | |
CN111950453A (zh) | 一种基于选择性注意力机制的任意形状文本识别方法 | |
CN112464912B (zh) | 基于YOLO-RGGNet的机器人端人脸检测方法 | |
CN113076871A (zh) | 一种基于目标遮挡补偿的鱼群自动检测方法 | |
CN110390308B (zh) | 一种基于时空对抗生成网络的视频行为识别方法 | |
CN109635661B (zh) | 一种基于卷积神经网络的远场无线充电接收目标检测方法 | |
CN111260687B (zh) | 一种基于语义感知网络和相关滤波的航拍视频目标跟踪方法 | |
CN110705412A (zh) | 一种基于运动历史图像的视频目标检测方法 | |
CN114399734A (zh) | 一种基于视觉信息的森林火灾预警方法 | |
CN111126278A (zh) | 针对少类别场景的目标检测模型优化与加速的方法 | |
CN112085031A (zh) | 目标检测方法及系统 | |
CN113420819A (zh) | 一种基于CenterNet的轻量级水下目标检测方法 | |
CN112926461B (zh) | 神经网络训练、行驶控制方法及装置 | |
CN117611994A (zh) | 基于注意力机制加权特征融合的遥感图像目标检测方法 | |
CN117542082A (zh) | 一种基于YOLOv7的行人检测方法 | |
CN112084815A (zh) | 一种基于摄像机焦距变换的目标检测方法、存储介质及处理器 | |
CN116580324A (zh) | 一种基于YOLOv5的无人机对地目标检测方法 | |
CN112288026A (zh) | 一种基于类激活图的红外弱小目标检测方法 | |
CN114155551A (zh) | 基于YOLOv3改进的复杂环境下的行人检测方法及装置 | |
CN116721288A (zh) | 一种基于YOLOv5的安全帽检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |