CN116958809A - 一种特征库迁移的遥感小样本目标检测方法 - Google Patents
一种特征库迁移的遥感小样本目标检测方法 Download PDFInfo
- Publication number
- CN116958809A CN116958809A CN202310717317.6A CN202310717317A CN116958809A CN 116958809 A CN116958809 A CN 116958809A CN 202310717317 A CN202310717317 A CN 202310717317A CN 116958809 A CN116958809 A CN 116958809A
- Authority
- CN
- China
- Prior art keywords
- remote sensing
- target
- small sample
- detection model
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 78
- 238000013508 migration Methods 0.000 title claims abstract description 11
- 230000005012 migration Effects 0.000 title claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims abstract description 11
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 38
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/766—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种特征库迁移的遥感小样本目标检测方法,首先针对输入的待检测遥感图像,基于深度卷积神经网络进行多尺度特征提取,生成常见类别的检测模型;设置小样本特征库,并将所述小样本特征库加入检测模型进行训练,使所述检测模型在小样本检测的同时保持对常见目标的检测能力;针对待检测遥感图像对称性高的特点,在检测模型完成训练后进行检测结果预测时,引入对称矩阵参数系数,通过对定位分支参数进行修正,提升小样本检测目标检测精度。上述方法解决了在遥感图像中针对数量较为稀少的目标类别特征建模较差,无法精确识别的问题,提升了遥感图像检测在实际应用中的有效性。
Description
技术领域
本发明涉及目标检测技术领域,尤其涉及一种特征库迁移的遥感小样本目标检测方法。
背景技术
目标检测问题是遥感图像处理领域的一个重要的问题,其中小样本目标的检测是一种较为困难的任务场景,但有着极高的应用价值。小样本目标检测是对场景中不常见或样本数量稀少的目标类别进行精确定位识别的任务,小样本目标检测技术通过学习常见类别样本和少量稀少类别样本组成的数据集,从中提取目标的特征信息,构建出一种能准确识别定位常见类别目标和较为准确识别定位稀少类别目标的模型。
近年来,小样本检测技术发展迅速,有很多优秀的小样本目标检测算法,这些算法对于图像中目标尺度占比较大(图像和目标长宽比一般不超过10)并且较少数量的目标,在小样本的条件下可以实现较好的性能,但是对于遥感图像,由于其图像尺寸大,图像和目标长宽比大,目标尺寸变化范围广等特点,现有的目标检测技术应用于这类仅有少量样本的小样本检测任务时效果较差,检测模型无法通过少数训练样本对目标进行精准的检测识别。
发明内容
本发明的目的是提供一种特征库迁移的遥感小样本目标检测方法,该方法解决了在遥感图像中针对数量较为稀少的目标类别特征建模较差,无法精确识别的问题,提升了遥感图像检测在实际应用中的有效性。
本发明的目的是通过以下技术方案实现的:
一种特征库迁移的遥感小样本目标检测方法,所述方法包括:
步骤1、首先针对输入的待检测遥感图像,基于深度卷积神经网络进行多尺度特征提取,生成非小样本类别的检测模型;
步骤2、设置小样本特征库,并将所述小样本特征库加入检测模型进行训练,使所述检测模型在小样本检测的同时保持对常见目标的检测能力;
步骤3、针对待检测遥感图像对称性高的特点,在检测模型完成训练后进行检测结果预测时,引入对称矩阵参数系数,通过对检测模型预测结果输出的回归分支参数进行修正,提升小样本检测目标检测精度。
由上述本发明提供的技术方案可以看出,上述方法解决了在遥感图像中针对数量较为稀少的目标类别特征建模较差,无法精确识别的问题,提升了遥感图像检测在实际应用中的有效性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的特征库迁移的遥感小样本目标检测方法流程示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,这并不构成对本发明的限制。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
如图1所示为本发明实施例提供的特征库迁移的遥感小样本目标检测方法流程示意图,所述方法包括:
步骤1、首先针对输入的待检测遥感图像,基于深度卷积神经网络进行多尺度特征提取,生成非小样本类别的检测模型;
在该步骤中,首先设置包含非小样本类别目标的遥感数据集A,对非小样本类别目标进行位置坐标和类别标注,确保遥感数据集A中无小样本目标或小样本目标在训练中不参与损失函数计算;
设置基于FasterRCNN的卷积神经网络,卷积神经网络的特征提取模块设为HRNet的高分辨率特征提取模块,利用所述遥感数据集A对卷积神经网络进行训练。
步骤2、设置小样本特征库,并将所述小样本特征库加入检测模型进行训练,使所述检测模型在小样本检测的同时保持对常见目标的检测能力;
在该步骤中,具体是在训练好的检测模型中加入支援(support)分支,设置包含小样本目标的遥感数据集B,对小样本目标进行位置坐标和类别标注,确保遥感数据集B中无常见目标或常见目标在训练中不作为负样本参与损失函数计算;
固定检测模型的其他参数,对支援分支和分类器进行单独训练,得到小样本目标的特征提取器参数;
对遥感数据集B的每一类样本,设有样本量为K,每个样本通过支援分支生成的特征
向量为m,该样本通过检测模型生成的特征向量为n,K个样本的平均向量分别为构建该类别特征库,对二者进行相似度度量,选择余弦相似度,将每个小样本目标生成的相似度β作为检测模型分支的参数系数;
检测模型的预测结果输出分为用于判别目标类别的分类分支和用于定位目标位置的回归分支;将所述分类分支的最后一层1*P维向量去掉,P为常见目标数量,Q为小样本目标数量,初始化一层1*(P+Q)的向量作为分类向量,对遥感数据集A和B进行模型训练,训练遥感数据集A中的类别时,所述分类分支的参数系数为1;训练遥感数据集B中的类别时,所述分类分支的系数为4中生成的对应相似度β;
在检测模型收敛后,将所述分类分支的参数系数设为1,并再次进行训练至收敛,最终完成检测模型训练。
步骤3、针对待检测遥感图像对称性高的特点,在检测模型完成训练后进行检测结果预测时,引入对称矩阵参数系数,通过对检测模型预测结果输出的回归分支参数进行修正,提升小样本检测目标检测精度。
在该步骤中,具体是对待检测遥感图像的特征向量进行多个对称矩阵相乘,再比较各结果与原向量的相似度,即距离度量,取与最小距离向量夹角的一半为目标朝向,通过添加旋转矩阵的方式为检测模型的最后一层参数增添系数,具体来说:
在去掉支援分支,对输入的待检测遥感图像经过特征提取、特征库向量比对后,得到回归分支和分类分支的向量;
对回归分支的向量,解码回坐标平面后,根据其在二维平面的对称性,分别与以下4个矩阵进行相乘,得到的4个特征向量与原向量进行余弦相似度计算,取与最小距离向量夹角的一半为目标朝向,夹角记为θ,4个矩阵为:
根据夹角θ添加旋转矩阵为检测模型的最后一层参数增添系数,该旋转矩阵为:
最终通过分类分支的预测结果进行softmax分类,得到分类结果;并通过回归分支进行定位预测。
值得注意的是,本发明实施例中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
综上所述,本发明实施例所述方法可以在小样本目标检测任务中较好的检测小样本类别和常见类别,性能优于现有多种算法,在遥感图像中更有远超其他方法的表现;本申请针对遥感图像目标对称性高的特点,通过引入对称矩阵变换的方式,提供准确的定位和分类监督,进一步提升遥感小目标检测的精确度。
另外,本发明所述方法与现在主流的小样本目标检测算法进行了对比,在遥感图像场景中的精确度有了极大的提升,每种小样本目标的样本量为单样本、三样本和五样本情况下,模型检测性能均优于现有算法,证明了本发明的有效性。
另外,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,相应的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。本文背景技术部分公开的信息仅仅旨在加深对本发明的总体背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
Claims (4)
1.一种特征库迁移的遥感小样本目标检测方法,其特征在于,所述方法包括:
步骤1、首先针对输入的待检测遥感图像,基于深度卷积神经网络进行多尺度特征提取,生成非小样本类别的检测模型;
步骤2、设置小样本特征库,并将所述小样本特征库加入检测模型进行训练,使所述检测模型在小样本检测的同时保持对常见目标的检测能力;
步骤3、针对待检测遥感图像对称性高的特点,在检测模型完成训练后进行检测结果预测时,引入对称矩阵参数系数,通过对检测模型预测结果输出的回归分支参数进行修正,提升小样本检测目标检测精度。
2.根据权利要求1所述特征库迁移的遥感小样本目标检测方法,其特征在于,在步骤1中,首先设置包含非小样本类别目标的遥感数据集A,对非小样本类别目标进行位置坐标和类别标注,确保遥感数据集A中无小样本目标或小样本目标在训练中不参与损失函数计算;
设置基于FasterRCNN的卷积神经网络,卷积神经网络的特征提取模块设为HRNet的高分辨率特征提取模块,利用所述遥感数据集A对卷积神经网络进行训练。
3.根据权利要求1所述特征库迁移的遥感小样本目标检测方法,其特征在于,在步骤2中,在训练好的检测模型中加入支援分支,设置包含小样本目标的遥感数据集B,对小样本目标进行位置坐标和类别标注,确保遥感数据集B中无常见目标或常见目标在训练中不作为负样本参与损失函数计算;
固定检测模型的其他参数,对支援分支和分类器进行单独训练,得到小样本目标的特征提取器参数;
对遥感数据集B的每一类样本,设有样本量为K,每个样本通过支援分支生成的特征向量为m,该样本通过检测模型生成的特征向量为n,K个样本的平均向量分别为构建该类别特征库,对二者进行相似度度量,选择余弦相似度,将每个小样本目标生成的相似度β作为检测模型分支的参数系数;
检测模型的预测结果输出分为用于判别目标类别的分类分支和用于定位目标位置的回归分支;将所述分类分支的最后一层1*P维向量去掉,P为常见目标数量,Q为小样本目标数量,初始化一层1*(P+Q)的向量作为分类向量,对遥感数据集A和B进行模型训练,训练遥感数据集A中的类别时,所述分类分支的参数系数为1;训练遥感数据集B中的类别时,所述分类分支的系数为4中生成的对应相似度β;
在检测模型收敛后,将所述分类分支的参数系数设为1,并再次进行训练至收敛,最终完成检测模型训练。
4.根据权利要求1所述特征库迁移的遥感小样本目标检测方法,其特征在于,在步骤3中,具体是对待检测遥感图像的特征向量进行多个对称矩阵相乘,再比较各结果与原向量的相似度,即距离度量,取与最小距离向量夹角的一半为目标朝向,通过添加旋转矩阵的方式为检测模型的最后一层参数增添系数,具体来说:
在去掉支援分支,对输入的待检测遥感图像经过特征提取、特征库向量比对后,得到回归分支和分类分支的向量;
对回归分支的向量,解码回坐标平面后,根据其在二维平面的对称性,分别与以下4个矩阵进行相乘,得到的4个特征向量与原向量进行余弦相似度计算,取与最小距离向量夹角的一半为目标朝向,夹角记为θ,4个矩阵为:
根据夹角θ添加旋转矩阵为检测模型的最后一层参数增添系数,该旋转矩阵为:
最终通过分类分支的预测结果进行softmax分类,得到分类结果;并通过回归分支进行定位预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310717317.6A CN116958809A (zh) | 2023-06-16 | 2023-06-16 | 一种特征库迁移的遥感小样本目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310717317.6A CN116958809A (zh) | 2023-06-16 | 2023-06-16 | 一种特征库迁移的遥感小样本目标检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116958809A true CN116958809A (zh) | 2023-10-27 |
Family
ID=88457374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310717317.6A Pending CN116958809A (zh) | 2023-06-16 | 2023-06-16 | 一种特征库迁移的遥感小样本目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116958809A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117409340A (zh) * | 2023-12-14 | 2024-01-16 | 上海海事大学 | 无人机集群多视角融合航拍港口监控方法、系统、介质 |
-
2023
- 2023-06-16 CN CN202310717317.6A patent/CN116958809A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117409340A (zh) * | 2023-12-14 | 2024-01-16 | 上海海事大学 | 无人机集群多视角融合航拍港口监控方法、系统、介质 |
CN117409340B (zh) * | 2023-12-14 | 2024-03-22 | 上海海事大学 | 无人机集群多视角融合航拍港口监控方法、系统、介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xie et al. | Multilevel cloud detection in remote sensing images based on deep learning | |
CN110991311B (zh) | 一种基于密集连接深度网络的目标检测方法 | |
CN113240012B (zh) | 一种基于二维图像的无监督多视角三维目标检索方法及装置 | |
CN113963165B (zh) | 一种基于自监督学习的小样本图像分类方法及系统 | |
Yang et al. | Active matting | |
CN116503399B (zh) | 基于yolo-afps的绝缘子污闪检测方法 | |
CN114155388B (zh) | 一种图像识别方法、装置、计算机设备和存储介质 | |
Kang et al. | Noise-tolerant deep neighborhood embedding for remotely sensed images with label noise | |
CN110942473A (zh) | 一种基于特征点网格化匹配的运动目标跟踪检测方法 | |
CN111738319B (zh) | 一种基于大规模样本的聚类结果评价方法及装置 | |
Cheng et al. | Water quality monitoring method based on TLD 3D fish tracking and XGBoost | |
CN111144466B (zh) | 一种图像样本自适应的深度度量学习方法 | |
CN116958809A (zh) | 一种特征库迁移的遥感小样本目标检测方法 | |
CN116524357A (zh) | 高压线路鸟巢检测方法、模型训练方法、装置及设备 | |
CN111339342B (zh) | 一种基于角度三元中心损失的三维模型检索方法 | |
CN110263196B (zh) | 图像检索方法、装置、电子设备及存储介质 | |
CN114926647B (zh) | 点云识别方法、装置、设备和计算机可读存储介质 | |
CN114067155B (zh) | 基于元学习的图像分类方法、装置、产品及存储介质 | |
CN113011597B (zh) | 一种回归任务的深度学习方法和装置 | |
CN111695526B (zh) | 网络模型生成方法、行人重识别方法及装置 | |
Wang et al. | VTAAN: Visual tracking with attentive adversarial network | |
CN115049546A (zh) | 样本数据处理方法、装置、电子设备及存储介质 | |
CN114842251A (zh) | 图像分类模型的训练及图像处理方法、装置和计算设备 | |
CN114241470A (zh) | 一种基于注意力机制的自然场景文字检测方法 | |
CN114463543A (zh) | 基于级联决策和交互标注自提升的弱监督语义分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |