[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN104992191B - 基于深度学习的特征和最大置信路径的图像分类方法 - Google Patents

基于深度学习的特征和最大置信路径的图像分类方法 Download PDF

Info

Publication number
CN104992191B
CN104992191B CN201510438236.8A CN201510438236A CN104992191B CN 104992191 B CN104992191 B CN 104992191B CN 201510438236 A CN201510438236 A CN 201510438236A CN 104992191 B CN104992191 B CN 104992191B
Authority
CN
China
Prior art keywords
layer
image
node
class
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510438236.8A
Other languages
English (en)
Other versions
CN104992191A (zh
Inventor
曲延云
卢畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University
Original Assignee
Xiamen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University filed Critical Xiamen University
Priority to CN201510438236.8A priority Critical patent/CN104992191B/zh
Publication of CN104992191A publication Critical patent/CN104992191A/zh
Application granted granted Critical
Publication of CN104992191B publication Critical patent/CN104992191B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

基于深度学习的特征和最大置信路径的图像分类方法,属于模式识别领域。在一个足够大的图像库上训练卷积神经网络;利用训练好的卷积神经网络模型提取图像特征;计算每个类的均值向量;利用谱聚类算法对代表每一类的均值向量进行迭代聚类,用以构建视觉树;针对树的每个非叶子节点训练svm;对给定的测试图像,自顶向下,判断测试图片到对应子节点的概率,找到路径概率最大的叶子节点即为最终的目标类。利用CNN提取图像特征,具有很好的判别性和鲁棒性;给出了两个类的距离计算公式,通过推导极大地优化了计算复杂性,得到类之间的相似性,从而迭代使用谱聚类算法构建视觉树;利用类之间的视觉关系,对于大型图像分类有很好的效果。

Description

基于深度学习的特征和最大置信路径的图像分类方法
技术领域
本发明属于模式识别领域,尤其是涉及可用于大规模图像分类的基于深度学习的特征和最大置信路径的图像分类方法。
背景技术
在计算机视觉领域,图像分类是一个非常重要,也是一个非常经典的研究问题。然而,随着图像数量增大,图像种类增多,大规模图像分类目前仍然是一个非常具有挑战性的任务。由于图像数量增大,计算量也会增大,需要的时间也会增大,对硬件要求也高,如果仍然采用传统方法训练一个多类分类器来作为最终的分类依据的话,将会出现计算复杂性和准确性等一系列问题。所以有必要设计一套新的分类架构和分类方法。
与传统的图像分类任务相比,大规模的图像分类任务的难点在于:(1)当图像数量和种类增多时,计算量也随之增大,对硬件要求更高。(2)从很多目标类中识别一种目标类比从少量目标类中识别一种目标类难度加大了很多,因为类数量增多时,必然存在一种现象:有些类很相似,有些类差异性很大。这些相似的类严重地影响着分类的准确率。现有的方法主要分为两大类,一类是利用深度学习构建深度卷积神经网络,先构建模型,然后通过大量训练数据调整参数,这类方法需要大量训练数据,计算量大,对编程能力要求高,不能给出类别间的关系,缺少友善的可视化效果,只能给出分类结果;另一类就是构建树形结构,采用层次分类方法,它可以很好可视化分类效果,但由于没有完全利用树结构也就是类之间的关系,即没有给出一个好的打分机制。另外,图片特征维度大,特异性和鲁棒性不够好,导致分类结果不理想。
Ning Zhou and Jianping Fan在文献“Jointly Learning Visually CorrelatedDictionaries for Large-scale Visual Recognition Applications”中提到构建视觉树以及联合字典学习,通过构建视觉树将相似的类聚在一起,不同节点学习不同的字典,以增大图像表示的特异性。然而在进行分类的时候,他们并没有充分利用树节点之间的关系,只是每层选择一个最大的分类结果向后传播,这样只要前面有分类错误,分类就会出错。另外,该方法中学习到的字典特异性也不是很好,最终的准确率与深度卷积神经网络相差很远。因此本发明利用了深度卷积神经网络中特征特异性好的优势,并结合类之间的关系构建了一个好的打分机制,提升了分类准确率。
发明内容
本发明的目的在于针对大型图像分类计算量大和分类准确率低等问题,提供一种基于深度学习的特征和最大置信路径的图像分类方法。
本发明包括以下步骤:
(1)利用在ILSVRC2012图像库预训练卷积神经网络AlexNet。该网络的输入是RGB图像,大小是227*227,该网络由5个卷积层,两个全连接层和一个输出层组成。第一层的结构由卷积层,整流激活层ReLU,以及池化层组成。卷积层参数为(96,11,4,0)表示卷积核有96个,卷积核大小是11*11,步长是4,四元组最后一位0表示保持原图像大小,不补零;卷积后形成的特征图经过ReLU层,得到大小为55*55的特征图共96个,记为55*55*96;池化层采用池化核大小为3*3,步长为2,池化后进行归一化,归一化大小为5。第二层的卷积层参数为(256,5,1,2);经过ReLu层,进入池化层,池化核为3*3,步长为2,池化后进行归一化,归一化大小为5.第三层卷积的参数为(384,3,1,1);经过ReLU层后进入第四层。第四层的网络结构与第三层相同。第五层的卷积参数为(256,3,1,1);经过ReLU层进入池化层,池化核大小为3*3,步长为2。第六层,第七层为全连接层,输出都是4096维的向量。第8层是输出层,是全连接层,输出为1000维向量,表示1000个类别的概率。
(2)对任意大规模图像库,用步骤(1)中训练好的AlexNet提取库中的所有图片特征,用该网络的第七层全连接层的输出表示图像;
(3)用AlexNet提取库中任意一个类Ci,其中样例图像数量为Ni,第l张图像对应的特征为计算第i个类均值向量Qi,计算第i个类方差
(4)计算每两个类之间的距离,构成一个对称的距离矩阵D;
(5)根据距离矩阵D计算相似矩阵A;
(6)根据相似矩阵A,迭代使用谱聚类算法,构建视觉树T;
(7)对每个簇训练一个支持向量机分类器(SVM),所有的SVM分类器形成一个有结构的树形分类器;
(8)对任意一张测试图像,依次从树的根节点对应的SVM分类器划分,每一个SVM分类器都会给出一个置信分数,判断该测试图像属于该节点的各个子节点的概率,一直到叶子节点,将叶子节点与根节点间的路径中所经过的节点对应的置信分数相乘,作为路径的置信值,其中根节点处概率设置为1;为了加快速度,在树的每一层都过滤一次,仅保留置信分数排在前K个的节点。
在步骤(3)中,所述类均值向量Qi的计算公式为
第i个类方差的计算公式为
在步骤(4)中,所述计算每两个类之间的距离的公式为后一个等式由前一个等式推导出来。
在步骤(5)中,所述相似矩阵A的类间相似性计算公式为 取作图像特征的维度。
在步骤(6)中,所述根据相似矩阵A,迭代使用谱聚类算法,构建视觉树T的具体方法可为:首先对所有类别对应的相似矩阵A,使用谱聚类算法,形成K个簇,每个簇里面含有多个相似的类,继续对每个簇对应的相似矩阵使用谱聚类算法,直到满足树的最大深度限制条件或者簇的最小类成员个数限制条件就停止聚类;簇对应树的非叶子节点,由多个目标类组成;树的叶子节点即为目标类。
在步骤(8)中,使用一对多的支持向量机分类器执行以下步骤:
(8.1)SVM进行划分的时候,会给出测试图片到每一层每个节点的置信距离。若在某一层到节点ci的距离为d,通过logistic函数,可以将该距离映射到0到1的一个概率值上,其计算公式为其中parent(ci)为直到ci的父节点的路径;
(8.2)通过一个贝叶斯网络求出测试图像被分到该节点ci的路径的概率,即是求根节点到该节点所经过的一条路径的概率,计算公式为
P(ci)=P(ci|parent(ci))*P(parent(ci)))
其中P(ci)为直到节点ci的最终路径概率,P(parent(ci))为直到ci的父节点的路径parent(ci)的概率;
(8.3)为了加快计算速度,避免遍历所有路径,树每层都选取概率最大的前K个中间节点。
本发明利用深度学习的优势,提取卷积神经网络AlexNet最后一个全连接层的输出作为图像特征,并构建视觉树,训练对应的分类器,给出了对应的打分机制。本发明具有如下突出优点:
1.本发明利用卷积神经网络AlexNet提取图像特征,具有很好的判别性和鲁棒性。
2.本发明给出了两个类的距离计算公式,考虑到了每个样本,并通过推导极大地优化了计算复杂性。并进一步得到类之间的相似性,从而迭代使用谱聚类算法构建视觉树。
3.本发明给出了一个高效的打分机制,充分利用了类之间的视觉关系,实验结果显示本发明所使用的方法对于大型图像分类有很好的效果,并且在当前流行的方法中有明显的优势。
附图说明
图1是本发明用卷积神经网络AlexNet提取特征的流程图。
图2是本发明判断测试图片的流程图。
具体实施方式
参考图1和2,本发明的实施步骤包括提取图像特征,构建视觉树并训练对应分类器,和根据本发明提出的打分机制测试图片三个部分。
步骤1,训练一个卷积神经网络AlexNet。
下载一个大的图像库,如ImageNet2012图像分类比赛库,训练一个卷积神经网络AlexNet
步骤2,提取特征
用步骤1训练好的卷积神经网络AlexNet对实验数据库中所有图像提取特征,也就是在该网络的第七层的输出作为图像的特征,用于后面的计算。
步骤3,计算相似矩阵
(3a)计算每个类的均值向量类方差 为图片第i类的第l张图片对应的特征。
(3b)利用公式计算每两个类之间的距离,计算所有距离后就可以构造一个对称的距离矩阵,正对角线上的值都是0。
(3c)根据两个类之间的距离计算两个类之间的相似性,计算公式为 的选择为图像的特征维度,从而构造一个对称的相似矩阵A。
步骤4,构造视觉树
(4a)通过步骤3得到的相似矩阵,使用谱聚类,将相似的类聚在一起,N个类被聚成K个簇,每个簇由一些相似的类聚在一起;
(4b)判断是否达到停止聚类的条件,即是否达到设定的树的最大高度,簇中类的个数是否小于设定的最小阈值;否则进入(4c);
(4c)对上次聚类生成的簇,继续使用谱聚类,对应的相似矩阵为A的子矩阵,即由该簇中的类在A中对应的行和列组成;
(4d)重复步骤(4b)和(4c),完成视觉树的构建。
步骤5,训练分类器。
针对树的每个非叶子节点,训练SVM分类器,用于将测试图像划分到其子节点中,并给出对应的分数。
步骤6,分类。
(6a)对给定的测试图像,丢给视觉树中根节点对应的分类器,进行分类,打分,给出分数最高的k个子节点。
(6b)判断当前k个节点是否为叶子节点,若k个节点都是叶子节点,则停止;否则进入步骤(6c)。
(6c)对新的k个节点中的每个非叶子节点,用其对应的分类器对测试图片打分,将其划分到子节点去,将该分数与其父节点对应的分数相乘,作为该子节点最终分数,再新生成的所有节点中选择分数最高的前k个。
(6d)重复步骤(6b)和(6c),完成分类,输出k个目标类,以及对应的分数。
本发明通过以下实验进行优点和有效性的证明
1.实验条件:
实验室用台式机参数:3G缓存的Tesla C2050GPU,CPU为16Inter(R)Xeon(R)X5647,主频为2.93GHz,内存为32G,操作系统为Ubuntu12.04 64位系统,实验平台为caffe,python2.7。
实验室用本发明提出的基于卷积神经网络特征和最大置信路径的大型图像分类方法,其中卷积神经网络AlexNet的训练方法见参考文献“Krizhevsky A,Sutskever I,Hinton G E.Imagenet classification with deep convolutional neural networks[C]//Advances in neural information processing systems.2012:1097-1105.”。
1.实验结果以及结果分析:
表1是在ImageNet2010图像分类比赛库上,本发明和当前其它六个流行的方法相比较。结果显示本发明有很大的优势,其中Top1 accuracy表示给出一个分类结果,分类正确的准确率,Top5 accuracy表示给出5个分类结果,其中有一个正确的准确率。
表1
Model Top-1 accuracy Top-5 accuracy
Sparse coding[1] 52.9% 71.8%
SIFT+FV[2] 54.3% 74.3%
JDL+AP Clustering[3] 38.9% N/A
Fisher Vector[4] 45.7% 65.9%
NEC[5] 52.9% 71.8%
Visual forest[6] 41.1% N/A
本发明 61.2% 81.7%
参考文献:
[1]Berg,A.,Deng,J.,Fei-Fei,L.:Large scale visual recognitionchallenge 2010.www.image-net.org(2010)。
[2]Sánchez,J.,Perronnin,F.:High-dimensional signature compression forlarge-scale image classification.In:Computer Vision and Pattern Recognition(CVPR),2011 IEEE Conference on,pp.1665-1672.IEEE,(2011)。
[3]Zhou,N.,Fan,J.:Jointly learning visually correlated dictionariesfor large-scale visual recognition applications.Pattern Analysis and MachineIntelligence,IEEE Transactions on 36,715-730(2014)。
[4]Perronnin,F.,Akata,Z.,Harchaoui,Z.,Schmid,C.:Towards good practicein large-scale learning for image classification.In:Computer Vision andPattern Recognition(CVPR),2012IEEE Conference on,pp.3482-3489.IEEE,(2012)。
[5]Lin,Y.,Lv,F.,Zhu,S.,Yang,M.,Cour,T.,Yu,K.,Cao,L.,Huang,T.:Large-scale image classification:fast feature extraction and svm training.In:Computer Vision and Pattern Recognition(CVPR),2011IEEE Conference on,pp.1689-1696.IEEE,(2011)。
[6]Fan,J.,Zhang,J.,Mei,K.,Peng,J.,Gao,L.:Cost-sensitive learning ofhierarchical tree classifiers for large-scale image classification and novelcategory detection.Pattern Recognition(2014)。
本发明主要解决了大规模图像分类问题中由于图像类别多,数据量大导致的分类准确率低和计算复杂性大的问题。本发明主要步骤是:1)在一个足够大的图像库上训练卷积神经网络。2)利用训练好的卷积神经网络模型提取图像特征。3)计算每个类的均值向量。4)利用谱聚类算法对代表每一类的均值向量进行迭代聚类,用以构建视觉树。5)针对树的每个非叶子节点训练svm。6)对给定的测试图像,自顶向下,判断测试图片到对应子节点的概率,找到路径概率最大的叶子节点即为最终的目标类。本发明可以用于大规模图像分类。

Claims (6)

1.基于深度学习的特征和最大置信路径的图像分类方法,其特征在于包括以下步骤:
(1)利用在ILSVRC2012图像库预训练卷积神经网络AlexNet,该网络的输入是RGB图像,大小是227×227,该网络由5个卷积层、两个全连接层和一个输出层组成,第一层的结构由卷积层、整流激活层ReLU以及池化层组成;卷积层参数为(96,11,4,0)表示卷积核有96个,卷积核大小是11×11,步长是4,四元组最后一位0表示保持原图像大小,不补零;卷积后形成的特征图经过ReLU层,得到大小为55×55的特征图共96个,记为55×55×96;池化层采用池化核大小为3×3,步长为2,池化后进行归一化,归一化大小为5;第二层的卷积层参数为(256,5,1,2);经过ReLU 层,进入池化层,池化核为3×3,步长为2,池化后进行归一化,归一化大小为5; 第三层卷积的参数为(384,3,1,1);经过ReLU层后进入第四层;第四层的网络结构与第三层相同;第五层的卷积参数为(256,3,1,1);经过ReLU层进入池化层,池化核大小为3×3,步长为2;第六层、第七层为全连接层,输出都是4096维的向量;第8层是输出层,是全连接层,输出为1000维向量,表示1000个类别的概率;
(2)对任意大规模图像库,用步骤(1)中训练好的AlexNet提取库中的所有图片特征,用该网络的第七层的全连接层输出表示图像;
(3)用AlexNet提取库中任意一个类Ci,其中样例图像数量为Ni,第l张图像对应的特征为Il i,计算第i个类均值向量Qi,计算第i个类方差σi 2
(4)计算每两个类之间的距离,构成一个对称的距离矩阵D;
(5)根据距离矩阵D计算相似矩阵A;
(6)根据相似矩阵A,迭代使用谱聚类算法,构建视觉树T;
(7)对每个簇训练一个支持向量机分类器,所有的SVM分类器形成一个有结构的树形分类器;
(8)对任意一张测试图像,依次从树的根节点对应的SVM分类器划分,每一个SVM分类器都会给出一个置信分数,判断该测试图像属于该节点的各个子节点的概率,一直到叶子节点,将叶子节点与根节点间的路径中所经过的节点对应的置信分数相乘,作为路径的置信值,其中根节点处概率设置为1;为了加快速度,在树的每一层仅保留置信分数排在前K个的节点。
2.如权利要求1所述基于深度学习的特征和最大置信路径的图像分类方法,其特征在于在步骤(3)中,所述类均值向量Qi的计算公式为:
第i个类方差的计算公式为:
3.如权利要求2所述基于深度学习的特征和最大置信路径的图像分类方法,其特征在于在步骤(4)中,所述计算每两个类之间的距离的公式为后一个等式由前一个等式推导出来。
4.如权利要求3所述基于深度学习的特征和最大置信路径的图像分类方法,其特征在于在步骤(5)中,所述相似矩阵A的类间相似性计算公式为 取作图像的特征维度。
5.如权利要求4所述基于深度学习的特征和最大置信路径的图像分类方法,其特征在于在步骤(6)中,所述根据相似矩阵A,迭代使用谱聚类算法,构建视觉树T的具体方法为:首先对所有类别对应的相似矩阵A,使用谱聚类算法,形成K个簇,每个簇里面含有多个相似的类,继续对每个簇对应的相似矩阵使用谱聚类算法,直到满足树的最大深度限制条件或者簇的最小类成员个数限制条件就停止聚类;簇对应树的非叶子节点,由多个目标类组成;树的叶子节点即为目标类。
6.如权利要求5所述基于深度学习的特征和最大置信路径的图像分类方法,其特征在于在步骤(8)中,使用的一对多的支持向量机分类器执行以下步骤:
(8.1)SVM进行划分的时候,会给出测试图片到每一层每个节点的置信距离,若在某一层到节点ci的距离为d,通过logistic函数,将该距离映射到0到1的一个概率值上,其计算公式为:
其中,parent(ci)为直到ci的父节点的路径;
(8.2)通过一个贝叶斯网络求出测试图像被分到该节点ci的路径的概率,即是求根节点到该节点所经过的一条路径的概率,计算公式为:
P(ci)=P(ci|parent(ci))*P(parent(ci)))
其中,P(ci)为直到节点ci的最终路径概率,P(parent(ci))为直到ci的父节点的路径parent(ci)的概率;
(8.3)为了加快计算速度,避免遍历所有路径,树每层都选取概率最大的前K个中间节点。
CN201510438236.8A 2015-07-23 2015-07-23 基于深度学习的特征和最大置信路径的图像分类方法 Expired - Fee Related CN104992191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510438236.8A CN104992191B (zh) 2015-07-23 2015-07-23 基于深度学习的特征和最大置信路径的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510438236.8A CN104992191B (zh) 2015-07-23 2015-07-23 基于深度学习的特征和最大置信路径的图像分类方法

Publications (2)

Publication Number Publication Date
CN104992191A CN104992191A (zh) 2015-10-21
CN104992191B true CN104992191B (zh) 2018-01-26

Family

ID=54304004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510438236.8A Expired - Fee Related CN104992191B (zh) 2015-07-23 2015-07-23 基于深度学习的特征和最大置信路径的图像分类方法

Country Status (1)

Country Link
CN (1) CN104992191B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512683B (zh) * 2015-12-08 2019-03-08 浙江宇视科技有限公司 基于卷积神经网络的目标定位方法及装置
WO2017113232A1 (zh) * 2015-12-30 2017-07-06 中国科学院深圳先进技术研究院 一种基于深度学习的产品分类方法及装置
WO2017124221A1 (en) * 2016-01-18 2017-07-27 Xiaogang Wang System and method for object detection
CN107688576B (zh) * 2016-08-04 2020-06-16 中国科学院声学研究所 一种cnn-svm模型的构建及倾向性分类方法
CN107067022B (zh) * 2017-01-04 2020-09-04 美的集团股份有限公司 图像分类模型的建立方法、建立装置和设备
CN106960243A (zh) * 2017-03-06 2017-07-18 中南大学 一种改进卷积神经网络结构的方法
CN107066586B (zh) * 2017-04-17 2019-07-05 清华大学深圳研究生院 鞋模型检索管理方法和系统
CN107247990A (zh) * 2017-06-01 2017-10-13 郑州云海信息技术有限公司 一种rack服务器深度学习优化的方法
JP2020525127A (ja) * 2017-06-26 2020-08-27 ザ・リサーチ・ファウンデーション・フォー・ザ・ステイト・ユニヴァーシティ・オブ・ニューヨーク 仮想膵臓撮影法のためのシステム、方法、およびコンピュータ・アクセス可能媒体
CN107301417A (zh) * 2017-06-28 2017-10-27 广东工业大学 一种无监督多层神经网络的车辆品牌识别的方法及装置
CN107958259A (zh) * 2017-10-24 2018-04-24 哈尔滨理工大学 一种基于卷积神经网络的图像分类方法
CN108009472B (zh) * 2017-10-25 2020-07-21 五邑大学 一种基于卷积神经网络和贝叶斯分类器的指背关节纹识别方法
CN108376399A (zh) * 2018-02-11 2018-08-07 甘肃省电力公司风电技术中心 基于光伏板实时监测的沙尘影响程度分析方法
CN109002843A (zh) * 2018-06-28 2018-12-14 Oppo广东移动通信有限公司 图像处理方法和装置、电子设备、计算机可读存储介质
CN108831519A (zh) * 2018-09-05 2018-11-16 上海麦色智能科技有限公司 一种基于形态学和临床实践的皮肤疾病分类装置
CN109522937B (zh) * 2018-10-23 2021-02-19 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN111007871B (zh) * 2019-11-29 2022-04-29 厦门大学 无人机动态特征识别方法、介质、设备及装置
CN111708788A (zh) * 2020-05-08 2020-09-25 深圳市金蝶天燕云计算股份有限公司 业务单据数据的计算方法及相关设备
CN112200170B (zh) * 2020-12-07 2021-11-30 北京沃东天骏信息技术有限公司 图像识别方法、装置、电子设备和计算机可读介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102147851B (zh) * 2010-02-08 2014-06-04 株式会社理光 多角度特定物体判断设备及多角度特定物体判断方法
CN102902976A (zh) * 2011-07-29 2013-01-30 中国科学院电子学研究所 一种基于目标及其空间关系特性的图像场景分类方法
CN104346622A (zh) * 2013-07-31 2015-02-11 富士通株式会社 卷积神经网络分类器及其分类方法和训练方法

Also Published As

Publication number Publication date
CN104992191A (zh) 2015-10-21

Similar Documents

Publication Publication Date Title
CN104992191B (zh) 基于深度学习的特征和最大置信路径的图像分类方法
CN113378632B (zh) 一种基于伪标签优化的无监督域适应行人重识别方法
CN109670528B (zh) 面向行人重识别任务的基于成对样本随机遮挡策略的数据扩充方法
Chai et al. Symbiotic segmentation and part localization for fine-grained categorization
CN103605972B (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
WO2019237240A1 (zh) 一种增强型生成式对抗网络以及目标样本识别方法
CN109063649B (zh) 基于孪生行人对齐残差网络的行人重识别方法
CN108614997B (zh) 一种基于改进AlexNet的遥感图像识别方法
CN104268593A (zh) 一种小样本情况下多稀疏表示的人脸识别方法
CN109063719B (zh) 一种联合结构相似性和类信息的图像分类方法
CN108921047B (zh) 一种基于跨层融合的多模型投票均值动作识别方法
CN106845525A (zh) 一种基于底层融合特征的深度置信网络图像分类协议
CN104504362A (zh) 基于卷积神经网络的人脸检测方法
CN104966104A (zh) 一种基于三维卷积神经网络的视频分类方法
CN112784929B (zh) 一种基于双元组扩充的小样本图像分类方法及装置
Afsari et al. Group action induced distances for averaging and clustering linear dynamical systems with applications to the analysis of dynamic scenes
CN113688894A (zh) 一种融合多粒度特征的细粒度图像分类方法
CN107316053A (zh) 一种布料图像快速匹配检索方法
CN105303195A (zh) 一种词袋图像分类方法
CN104751153B (zh) 一种识别场景文字的方法及装置
CN108154156B (zh) 基于神经主题模型的图像集成分类方法及装置
Huang et al. Deep clustering based on embedded auto-encoder
CN110751027A (zh) 一种基于深度多示例学习的行人重识别方法
Huang et al. Chinese herbal medicine leaves classification based on improved AlexNet convolutional neural network
CN103778913A (zh) 一种病理嗓音的识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180126

Termination date: 20200723

CF01 Termination of patent right due to non-payment of annual fee