[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN106295506A - 一种基于集成卷积神经网络的年龄识别方法 - Google Patents

一种基于集成卷积神经网络的年龄识别方法 Download PDF

Info

Publication number
CN106295506A
CN106295506A CN201610592214.1A CN201610592214A CN106295506A CN 106295506 A CN106295506 A CN 106295506A CN 201610592214 A CN201610592214 A CN 201610592214A CN 106295506 A CN106295506 A CN 106295506A
Authority
CN
China
Prior art keywords
layer
convolution kernel
lamination
volume
neural networks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610592214.1A
Other languages
English (en)
Inventor
文贵华
李怀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201610592214.1A priority Critical patent/CN106295506A/zh
Publication of CN106295506A publication Critical patent/CN106295506A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于集成卷积神经网络的年龄识别方法,步骤如下:S1、获取年龄识别训练数据库中的训练子集并且对其进行扩充,得到扩充后的训练子集;选取出M个经过上述扩充后的训练子集训练得到的卷积神经网络分类器作为基分类器;S2、获取待测人脸图像;S3、在测试时,将待测人脸图像分别输入步骤S1获取到的M个基分类器,然后融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。具有年龄识别准确率高,减少了人脸图像的年龄特征提取对人的依赖性,能够估计多种人群的年龄,具有应用广泛的优点。

Description

一种基于集成卷积神经网络的年龄识别方法
技术领域
本发明涉及一种图像处理技术领域,特别涉及一种基于集成卷积神经网络的年龄识别方法。
背景技术
人脸年龄识别是根据采集的人脸图像,提取人脸图像的年龄特征,采用计算机图像处理等相关技术进行处理和分析,判断人脸图像所属年龄类别的一种计算机视觉技术。年龄识别问题在学术研究和商业应用方面有着广泛的应用前景,比如对于酒吧,网吧或私人会所等成年人的娱乐场所,通过年龄识别系统可以禁止未满18周岁的未成年人进入;对于销售香烟和酒的自动售货机,可以通过安装实时摄像头,实时得到顾客年龄类别,拒绝向未满18周岁的未成年人提供销售烟酒服务;在公共电脑服务中,比如电子阅览室,通过自动年龄识别系统拦截未成年人浏览成人信息的网站和其它限制性电影。另外在一些电子顾客管理系统中,在顾客登录的时候采集顾客的人脸图像并自动进行年龄识别,从而实现在不干扰顾客的情况下对不同年龄段的顾客消费偏好和购物特点进行收集以及后续顾客数据的分析和挖掘,根据后续的数据分析结果为不同年龄段的顾客提供个性化的产品或服务。在人机交互方面,可以为不同年龄段的用户提供符合年龄特点的人机交互界面以及进行权限控制。
目前有很多年龄识别的方法,大体上将年龄识别系统分为两个部分:人脸图像的特征提取和年龄分类的算法选择。而分类就是依靠机器学习算法来实现,效果比较显著的有支持向量机(SVM)、神经网络、K最近邻算法、高斯混合模型(GMM)、随机森林、集成学习等等。国内外学者在解决语音情感识别问题时,大都采用这些分类算法,但是这些分类算法极大地依赖于对人脸图像的特征提取,而目前采用的特征抽取方法是人工设计的,如主动外观模型、人脸测量模型等,再通过特征选择算法剔除冗余或者不相关的特征,得出最优或者次优特征子集,这一步骤的目的一方面是提高识别准确率,另一方面是降低特征的维数,从而提升模型训练速度。但是这个过程极大地依赖人工专家的经验,并且需要反复进行实验才能完成的,不仅工作量大,而且很难找到一种最优的人脸年龄特征表达,从而影响了人脸年龄识别的效果。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种识别准确率高的基于集成卷积神经网络的年龄识别方法。
本发明的目的通过下述技术方案实现:一种基于集成卷积神经网络的年龄识别方法,其特征在于,步骤如下:
S1、获取年龄识别训练数据库中的训练子集并且对其进行扩充,得到扩充后的训练子集;选取出M个经过上述扩充后的训练子集训练得到的卷积神经网络分类器作为基分类器;
S2、获取待测人脸图像;
S3、在测试时,将待测人脸图像分别输入步骤S1获取到的M个基分类器,然后融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。
优选的,所述步骤S1中基分类器获取过程具体如下:
S11、将年龄识别训练库分成训练集和验证集;其中年龄识别训练库包括人脸图像以及各人脸图像对应年龄类别;
S12、对训练集进行N次随机抽样,得到N个训练子集;
S13、采用图像变换方法自动扩充步骤S12中得到N个训练子集,得到N个扩充后的训练子集;
S14、随机生成N个卷积神经网络模型,然后利用步骤S13中得到的N个扩充后的训练子集分别对N个卷积神经网络模型进行训练,得到N个卷积神经网络分类器;
S15、计算N个卷积神经网络分类器在年龄识别训练库验证集上的识别准确率;
S16、选择识别准确率排名前M的M个卷积神经网络分类器作为基分类器。
更进一步的,所述步骤S12中对训练集进行的N次随机抽样为放回随机抽样。
更进一步的,其特征在于,所述步骤S13中图像变换方法包括对训练子集的人脸图像进行图像旋转、图像RGB通道扰动和图像中添加高斯噪声。
更进一步的,使用Python图形处理库的函数对训练子集中人脸图像进行图像旋转变换。
优选的,所述M为6,即步骤S1中选取出6个卷积神经网络分类器作为基分类器,即包括6个基分类器。
更进一步的,6个基分类器分别为四层卷积层的卷积神经网络模型训练得到的第一基分类器、第二基分类器和第三基分类器以及三层卷积层的卷积神经网络模型训练得到的基分类器第四基分类器、第五基分类器和第六基分类器。
更进一步的,训练得到第一基分类器的四层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv11、第一下采样层pool11、第二卷积层conv12、第二下采样层pool12、第三卷积层conv13、第四卷积层conv14、第三下采样层pool15、第一全连接层fc16和第二全连接层fc17;其中第一卷积层conv11层的卷积核个数96,卷积核大小为9*9;第二卷积层conv12层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv13层的卷积核个数为256,卷积核大小为5*5;第四卷积层conv14层的卷积核个数为256,卷积核大小为3*3;
训练得到第二基分类器的四层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv21、第一下采样层pool21、第二卷积层conv22、第二下采样层pool22、第三卷积层conv23、第四卷积层conv24、第三下采样层pool15、第一全连接层fc26和第二全连接层fc27;第一卷积层conv21层的卷积核个数为128,卷积核大小为9*9;第二卷积层conv22层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv23层的卷积核个数为256,卷积核大小为3*3;第四卷积层conv24的卷积核个数为384,卷积核大小为3*3;
训练得到第三基分类器的四层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv31、第一下采样层pool31、第二卷积层conv32、第二下采样层pool32、第三卷积层conv33、第四卷积层conv34、第三下采样层pool35、第一全连接层fc36和第二全连接层fc37;第一卷积层conv31层的卷积核个数为96,卷积核大小为7*7;第二卷积层conv32层的卷积核个数为256,卷积核大小为5*5;第三卷积层conv33层的卷积核个数为512,卷积核大小为5*5;第四卷积层conv34层的卷积核个数为384,卷积核大小为3*3;
训练得到第四基分类器的3层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv41、第一下采样层pool41、第二卷积层conv42、第二下采样层pool42、第三卷积层conv43、第三下采样层pool45、第一全连接层fc46和第二全连接层fc47;第一卷积层conv41层的卷积核个数为96,卷积核大小为9*9;第二卷积层conv42层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv43层的卷积核个数为256,卷积核大小为5*5;
训练得到第五基分类器的3层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv51、第一下采样层pool51、第二卷积层conv52、第二下采样层pool52、第三卷积层conv53、第三下采样层pool55、第一全连接层fc56和第二全连接层fc57;第一卷积层conv51层的卷积核个数为128,卷积核大小为9*9;第二卷积层conv52层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv53层的卷积核个数为384,卷积核大小为5*5;
训练得到第六基分类器的3层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv61、第一下采样层pool61、第二卷积层conv62、第二下采样层pool62、第三卷积层conv63、第三下采样层pool65、第一全连接层fc16和第二全连接层fc17;第一卷积层conv61层的卷积核个数为96,卷积核大小为7*7;第二卷积层conv62层的卷积核个数为256,卷积核大小为5*5;第三卷积层conv63层的卷积核个数为384,卷积核大小为3*3。
优选的,所述卷积神经网络分类器中的分类器采用SoftMax分类器。
优选的,所述步骤S3中采用简单投票融合方法融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。
本发明相对于现有技术具有如下的优点及效果:
(1)本发明方法首先选取出M个经过年龄识别训练数据库中的扩充后的训练子集训练得到的卷积神经网络分类器作为基分类器;然后将待测人脸图像输入至M个基分类器,最后融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。具有年龄识别准确率高,减少了人脸图象的年龄特征提取对人的依赖性,能够估计多种人群的年龄,以及应用广泛的优点。另外本发明方法中对卷积神经网络分类器进行训练的训练子集为扩充后的训练子集,扩充后的训练子集有效增大了训练子集中的样本数,能够充分的对卷积神经网络模型进行训练,进一步提高了卷积神经网络分类器针对年龄识别准确率。
(2)本发明方法随机生成N个卷积神经网络模型,利用年龄识别训练数据库中经过扩充后的训练子集训练随机生成的N个卷积神经网络模型,以获取到对应的卷积神经网络分类器,然后利用年龄识别训练数据库中的验证集验证各卷积神经网络分类器年龄识别的准确率,最后选取出年龄识别准确率排名前M的卷积神经网络分类器作为基分类器,能够大大提高本发明方法年龄识别准确率。
(3)本发明方法中选取出的基分类器可为多个结构不同的卷积神经网络模型训练得到的,本发明方法利用多个结构差异化的卷积神经网络模型集成识别,能够获得更好的人脸年龄识别性能,进一步提高年龄识别的准确率。
附图说明
图1是本发明方法基分类器生成框图。
图2是本发明方法中四层卷积层的卷积神经网络模型结构框图。
图3是本发明方法中三层卷积层的卷积神经网络模型结构框图。
图4是本发明方法中年龄识别阶段示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
本实施例公开了一种基于集成卷积神经网络的年龄识别方法,步骤如下:
S1、获取年龄识别训练数据库中的训练子集并且对其进行扩充,得到扩充后的训练子集;选取出M个经过上述扩充后的训练子集训练得到的卷积神经网络分类器作为基分类器;本步骤中基分类器获取过程具体如下:
S11、将年龄识别训练库分成训练集和验证集;其中年龄识别训练库包括人脸图像以及各人脸图像对应年龄类别;
S12、对训练集进行N次随机放回抽样,得到N个训练子集;其中N的范围可以为5~500。
S13、采用图像变换方法自动扩充步骤S12中得到N个训练子集,得到N个扩充后的训练子集,分别为扩充训练子集1、扩充训练子集2,…,扩充训练子集N;
S14、随机生成N个卷积神经网络模型B_CNN_1,、、、,B_CNN_N,然后利用步骤S13中得到的N个扩充后的训练子集分别对N个卷积神经网络模型进行训练,得到N个卷积神经网络分类器CNN1,、、、,CNNN,具体如图1所示;本实施例中卷积神经网络分类器中的分类器采用SoftMax分类器;
S15、计算N个卷积神经网络分类器在年龄识别训练库验证集上的识别准确率;
S16、选择识别准确率排名前M的M个卷积神经网络分类器作为基分类器。
S2、获取待测人脸图像。
S3、在测试时,将待测人脸图像分别输入步骤S1获取到的M个基分类器,然后融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。本步骤中采用简单投票融合方法融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。
本实施例上述步骤S13中所使用的图像变换方法包括对训练子集的人脸图像进行图像旋转、图像RGB通道扰动和图像中添加高斯噪声。
图像旋转:图像旋转是指围绕某一个点以顺时针或者逆时针方向对给定的输入人脸图像进行旋转一定的角度。本实施例中使用Python Imaging Library(Python图形处理库,PIL)库的函数对训练集中人脸图像进行旋转变换。
RGB通道扰动:RGB模型表示的图像采用三种基色R、G、B表示。自然界的任意一种颜色都可以通过R、G、B三种基色按照不同的比例组合而成。通过改变RGB每一个通道的值,可以产生原图像的不同的衍生图像,对原图像进行RGB值进行随机扰动。
添加高斯噪声:图像中的噪声主要是指对图像产生干扰的杂质,通过在图像中添加高斯噪声产生新的图像样本。
本实施例方法中,针对人脸图像所做的图像变换包括对训练子集的人脸图像进行顺时针旋转5°、逆时针旋转5°、对RGB的3个通道值分别进行扰动,以及添加高斯噪声变换操作,这样1张图像将增加6张图像,训练子集扩大为原来的7倍。
本本实施例上述步骤S1中M为6,即步骤S1中选取出6个卷积神经网络分类器作为基分类器,包括6个基分类器。
本实施例中6个基分类器分别为四层卷积层的卷积神经网络模型训练得到的第一基分类器CNN1、第二基分类器CNN2和第三基分类器CNN3以及三层卷积层的卷积神经网络模型训练得到的基分类器第四基分类器CNN4、第五基分类器CNN5和第六基分类器CNN6。如图2所示,本实施例四层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv1、第一下采样层pool1、第二卷积层conv2、第二下采样层pool2、第三卷积层conv3、第四卷积层conv4、第三下采样层pool5、第一全连接层fc6和第二全连接层fc7;如图3所示,本实施例三层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv1、第一下采样层pool1、第二卷积层conv2、第二下采样层pool2、第三卷积层conv3、第三下采样层pool5、第一全连接层fc6和第二全连接层fc7。
本实施例训练得到第一基分类器的四层卷积层的卷积神经网络模型B_CNN_1输入层至输出层之间依次为第一卷积层conv11、第一下采样层pool11、第二卷积层conv12、第二下采样层pool12、第三卷积层conv13、第四卷积层conv14、第三下采样层pool15、第一全连接层fc16和第二全连接层fc17;其中第一卷积层conv11层的卷积核个数96,卷积核大小为9*9;第二卷积层conv12层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv13层的卷积核个数为256,卷积核大小为5*5;第四卷积层conv14层的卷积核个数为256,卷积核大小为3*3。
训练得到第二基分类器的四层卷积层的卷积神经网络模型B_CNN_2输入层至输出层之间依次为第一卷积层conv21、第一下采样层pool21、第二卷积层conv22、第二下采样层pool22、第三卷积层conv23、第四卷积层conv24、第三下采样层pool15、第一全连接层fc26和第二全连接层fc27;第一卷积层conv21层的卷积核个数为128,卷积核大小为9*9;第二卷积层conv22层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv23层的卷积核个数为256,卷积核大小为3*3;第四卷积层conv24的卷积核个数为384,卷积核大小为3*3。
训练得到第三基分类器的四层卷积层的卷积神经网络模型B_CNN_3输入层至输出层之间依次为第一卷积层conv31、第一下采样层pool31、第二卷积层conv32、第二下采样层pool32、第三卷积层conv33、第四卷积层conv34、第三下采样层pool35、第一全连接层fc36和第二全连接层fc37;第一卷积层conv31层的卷积核个数为96,卷积核大小为7*7;第二卷积层conv32层的卷积核个数为256,卷积核大小为5*5;第三卷积层conv33层的卷积核个数为512,卷积核大小为5*5;第四卷积层conv34层的卷积核个数为384,卷积核大小为3*3。
训练得到第四基分类器的3层卷积层的卷积神经网络模型B_CNN_4输入层至输出层之间依次为第一卷积层conv41、第一下采样层pool41、第二卷积层conv42、第二下采样层pool42、第三卷积层conv43、第三下采样层pool45、第一全连接层fc46和第二全连接层fc47;第一卷积层conv41层的卷积核个数为96,卷积核大小为9*9;第二卷积层conv42层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv43层的卷积核个数为256,卷积核大小为5*5。
训练得到第五基分类器的3层卷积层的卷积神经网络模型B_CNN_5输入层至输出层之间依次为第一卷积层conv51、第一下采样层pool51、第二卷积层conv52、第二下采样层pool52、第三卷积层conv53、第三下采样层pool55、第一全连接层fc56和第二全连接层fc57;第一卷积层conv51层的卷积核个数为128,卷积核大小为9*9;第二卷积层conv52层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv53层的卷积核个数为384,卷积核大小为5*5。
训练得到第六基分类器的3层卷积层的卷积神经网络模型B_CNN_6输入层至输出层之间依次为第一卷积层conv61、第一下采样层pool61、第二卷积层conv62、第二下采样层pool62、第三卷积层conv63、第三下采样层pool65、第一全连接层fc16和第二全连接层fc17;第一卷积层conv61层的卷积核个数为96,卷积核大小为7*7;第二卷积层conv62层的卷积核个数为256,卷积核大小为5*5;第三卷积层conv63层的卷积核个数为384,卷积核大小为3*3。
本实施例卷积神经网络模型的卷积层的权值使用均值为0,方差为0.01的高斯分布函数进行随机初始化,全连接层Dropout的随机丢弃率分别设置为0.5,训练的Batchsize设置为128,momentum设置为0.9,初始学习率为0.01,迭代次数50000次。
如图4所示,本实施例中步骤S3中,将待测人脸图像分别输入第一基分类器CNN1、第二基分类器CNN2、第三基分类器CNN3、第四基分类器CNN4、第五基分类器CNN5和第六基分类器CNN6。然后采用简单投票融合方法融合这6个基分类器输出的年龄类别,实现对这6个基分类器输出的识别结果进行投票表决,得票最多的年龄类别就是该输入人脸图像的年龄类别,作为最终的一个年龄类别。本实施例方法集成卷积神经网络,就是利用多个结构差异化的卷积神经网络构成的分类器进行集成测试,以获得更好的年龄识别性能。
其中下表1为将数据集Adience和Gallagher分别作为年龄识别训练数据库时,采用本实施例年龄识别方法(集成+图像变换+CNNs)和采用现有技术中一些年龄识别方法识别时的准确率,其中准确率采用常用的WA准确率:
WA=(识别准确样本总数)/(所有测试样本总数);
表1
其中Adience数据集是Eran Eidinger等人在研究非实验室条件下的人脸图像的年龄和性别分类问题中创建的数据集。该数据集的图像都是现实生活环境下的真实图像,具有不同光照,不同姿态,不同背景和不同表情等因素的影响,对生产环境下的人脸年龄识别问题更有研究意义。Adience数据集将年龄分成0-2岁,4-6岁,8-12岁,25-32岁,38-43岁,48-53岁,>60岁共8个类别。Gallagher数据集是Andrew C.Gallagher等人从Flickr.com采集的照片,都是现实生活环境下的照片。同样地,这些图片具有不同光照,不同姿态,不同背景和不同表情等因素的影响,目前在非实验室条件下图像年龄识别问题的研究中得到广泛使用。Gallagher数据集将年龄分成0-2岁,3-7岁,8-12岁,13-19岁,20-36岁,37-65岁,>66岁共7个类别。从表1中可以看出,相比现有技术其他年龄识别方法,本实施例年龄识别方法的准确率最高。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.一种基于集成卷积神经网络的年龄识别方法,其特征在于,步骤如下:
S1、获取年龄识别训练数据库中的训练子集并且对其进行扩充,得到扩充后的训练子集;选取出M个经过上述扩充后的训练子集训练得到的卷积神经网络分类器作为基分类器;
S2、获取待测人脸图像;
S3、在测试时,将待测人脸图像分别输入步骤S1获取到的M个基分类器,然后融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。
2.根据权利要求1所述的基于集成卷积神经网络的年龄识别方法,其特征在于,所述步骤S1中基分类器获取过程具体如下:
S11、将年龄识别训练库分成训练集和验证集;其中年龄识别训练库包括人脸图像以及各人脸图像对应年龄类别;
S12、对训练集进行N次随机抽样,得到N个训练子集;
S13、采用图像变换方法自动扩充步骤S12中得到N个训练子集,得到N个扩充后的训练子集;
S14、随机生成N个卷积神经网络模型,然后利用步骤S13中得到的N个扩充后的训练子集分别对N个卷积神经网络模型进行训练,得到N个卷积神经网络分类器;
S15、计算N个卷积神经网络分类器在年龄识别训练库验证集上的识别准确率;
S16、选择识别准确率排名前M的M个卷积神经网络分类器作为基分类器。
3.根据权利要求2所述的基于集成卷积神经网络的年龄识别方法,其特征在于,所述步骤S12中对训练集进行的N次随机抽样为放回随机抽样。
4.根据权利要求2所述的基于集成卷积神经网络的年龄识别方法,其特征在于,其特征在于,所述步骤S13中图像变换方法包括对训练子集的人脸图像进行图像旋转、图像RGB通道扰动和图像中添加高斯噪声。
5.根据权利要求4所述的基于集成卷积神经网络的年龄识别方法,其特征在于,使用Python图形处理库的函数对训练子集中人脸图像进行图像旋转变换。
6.根据权利要求2所述的基于集成卷积神经网络的年龄识别方法,其特征在于,所述M为6,即步骤S1中选取出6个卷积神经网络分类器作为基分类器,即包括6个基分类器。
7.根据权利要求6所述的基于集成卷积神经网络的年龄识别方法,其特征在于,6个基分类器分别为四层卷积层的卷积神经网络模型训练得到的第一基分类器、第二基分类器和第三基分类器以及三层卷积层的卷积神经网络模型训练得到的基分类器第四基分类器、第五基分类器和第六基分类器。
8.根据权利要求7所述的基于集成卷积神经网络的年龄识别方法,其特征在于,训练得到第一基分类器的四层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv11、第一下采样层pool11、第二卷积层conv12、第二下采样层pool12、第三卷积层conv13、第四卷积层conv14、第三下采样层pool15、第一全连接层fc16和第二全连接层fc17;其中第一卷积层conv11层的卷积核个数96,卷积核大小为9*9;第二卷积层conv12层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv13层的卷积核个数为256,卷积核大小为5*5;第四卷积层conv14层的卷积核个数为256,卷积核大小为3*3;
训练得到第二基分类器的四层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv21、第一下采样层pool21、第二卷积层conv22、第二下采样层pool22、第三卷积层conv23、第四卷积层conv24、第三下采样层pool15、第一全连接层fc26和第二全连接层fc27;第一卷积层conv21层的卷积核个数为128,卷积核大小为9*9;第二卷积层conv22层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv23层的卷积核个数为256,卷积核大小为3*3;第四卷积层conv24的卷积核个数为384,卷积核大小为3*3;
训练得到第三基分类器的四层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv31、第一下采样层pool31、第二卷积层conv32、第二下采样层pool32、第三卷积层conv33、第四卷积层conv34、第三下采样层pool35、第一全连接层fc36和第二全连接层fc37;第一卷积层conv31层的卷积核个数为96,卷积核大小为7*7;第二卷积层conv32层的卷积核个数为256,卷积核大小为5*5;第三卷积层conv33层的卷积核个数为512,卷积核大小为5*5;第四卷积层conv34层的卷积核个数为384,卷积核大小为3*3;
训练得到第四基分类器的3层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv41、第一下采样层pool41、第二卷积层conv42、第二下采样层pool42、第三卷积层conv43、第三下采样层pool45、第一全连接层fc46和第二全连接层fc47;第一卷积层conv41层的卷积核个数为96,卷积核大小为9*9;第二卷积层conv42层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv43层的卷积核个数为256,卷积核大小为5*5;
训练得到第五基分类器的3层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv51、第一下采样层pool51、第二卷积层conv52、第二下采样层pool52、第三卷积层conv53、第三下采样层pool55、第一全连接层fc56和第二全连接层fc57;第一卷积层conv51层的卷积核个数为128,卷积核大小为9*9;第二卷积层conv52层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv53层的卷积核个数为384,卷积核大小为5*5;
训练得到第六基分类器的3层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv61、第一下采样层pool61、第二卷积层conv62、第二下采样层pool62、第三卷积层conv63、第三下采样层pool65、第一全连接层fc16和第二全连接层fc17;第一卷积层conv61层的卷积核个数为96,卷积核大小为7*7;第二卷积层conv62层的卷积核个数为256,卷积核大小为5*5;第三卷积层conv63层的卷积核个数为384,卷积核大小为3*3。
9.根据权利要求1所述的基于集成卷积神经网络的年龄识别方法,其特征在于,所述卷积神经网络分类器中的分类器采用SoftMax分类器。
10.根据权利要求1所述的基于集成卷积神经网络的年龄识别方法,其特征在于,所述步骤S3中采用简单投票融合方法融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。
CN201610592214.1A 2016-07-25 2016-07-25 一种基于集成卷积神经网络的年龄识别方法 Pending CN106295506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610592214.1A CN106295506A (zh) 2016-07-25 2016-07-25 一种基于集成卷积神经网络的年龄识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610592214.1A CN106295506A (zh) 2016-07-25 2016-07-25 一种基于集成卷积神经网络的年龄识别方法

Publications (1)

Publication Number Publication Date
CN106295506A true CN106295506A (zh) 2017-01-04

Family

ID=57652472

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610592214.1A Pending CN106295506A (zh) 2016-07-25 2016-07-25 一种基于集成卷积神经网络的年龄识别方法

Country Status (1)

Country Link
CN (1) CN106295506A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951867A (zh) * 2017-03-22 2017-07-14 成都擎天树科技有限公司 基于卷积神经网络的人脸识别方法、装置、系统及设备
CN106980830A (zh) * 2017-03-17 2017-07-25 中国人民解放军国防科学技术大学 一种基于深度卷积网络自亲缘关系识别方法与装置
CN107169454A (zh) * 2017-05-16 2017-09-15 中国科学院深圳先进技术研究院 一种人脸图像年龄估算方法、装置及其终端设备
CN107437099A (zh) * 2017-08-03 2017-12-05 哈尔滨工业大学 一种基于机器学习的特定服饰图像识别与检测方法
CN107545245A (zh) * 2017-08-14 2018-01-05 中国科学院半导体研究所 一种年龄估计方法及设备
CN107622261A (zh) * 2017-11-03 2018-01-23 北方工业大学 基于深度学习的人脸年龄估计方法及装置
CN107704816A (zh) * 2017-09-27 2018-02-16 珠海格力电器股份有限公司 食物的蒸煮方法及装置
CN107729078A (zh) * 2017-09-30 2018-02-23 广东欧珀移动通信有限公司 后台应用程序管控方法、装置、存储介质及电子设备
CN108021863A (zh) * 2017-11-01 2018-05-11 平安科技(深圳)有限公司 电子装置、基于图像的年龄分类方法及存储介质
CN108109152A (zh) * 2018-01-03 2018-06-01 深圳北航新兴产业技术研究院 医学图像分类和分割方法和装置
CN108537026A (zh) * 2018-03-30 2018-09-14 百度在线网络技术(北京)有限公司 应用程序控制方法、装置和服务器
CN108596042A (zh) * 2018-03-29 2018-09-28 青岛海尔智能技术研发有限公司 开门控制方法和系统
CN109063750A (zh) * 2018-07-17 2018-12-21 西安电子科技大学 基于cnn和svm决策融合的sar目标分类方法
CN109726703A (zh) * 2019-01-11 2019-05-07 浙江工业大学 一种基于改进集成学习策略的人脸图像年龄识别方法
CN110956190A (zh) * 2018-09-27 2020-04-03 深圳云天励飞技术有限公司 图像识别方法及装置、计算机装置和计算机可读存储介质
CN111242235A (zh) * 2020-01-19 2020-06-05 中国科学院计算技术研究所厦门数据智能研究院 一种相似特征测试数据集生成方法
CN111680664A (zh) * 2020-06-22 2020-09-18 南方电网科学研究院有限责任公司 一种人脸图像年龄识别方法、装置和设备
CN112070535A (zh) * 2020-09-03 2020-12-11 常州微亿智造科技有限公司 电动汽车价格预测方法和装置
CN112446310A (zh) * 2020-11-19 2021-03-05 杭州趣链科技有限公司 基于区块链的年龄识别系统、方法及装置
CN112656431A (zh) * 2020-12-15 2021-04-16 中国科学院深圳先进技术研究院 基于脑电的注意力识别方法、装置、终端设备和存储介质
CN115205637A (zh) * 2022-09-19 2022-10-18 山东世纪矿山机电有限公司 一种矿车物料的智能识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101099675A (zh) * 2007-07-26 2008-01-09 上海交通大学 带有弱分类器的组合系数的人脸检测方法
CN103632168A (zh) * 2013-12-09 2014-03-12 天津工业大学 一种机器学习中的分类器集成方法
CN105354565A (zh) * 2015-12-23 2016-02-24 北京市商汤科技开发有限公司 基于全卷积网络人脸五官定位与判别的方法及系统
CN105426963A (zh) * 2015-12-01 2016-03-23 北京天诚盛业科技有限公司 用于人脸识别的卷积神经网络的训练方法、装置及应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101099675A (zh) * 2007-07-26 2008-01-09 上海交通大学 带有弱分类器的组合系数的人脸检测方法
CN103632168A (zh) * 2013-12-09 2014-03-12 天津工业大学 一种机器学习中的分类器集成方法
CN105426963A (zh) * 2015-12-01 2016-03-23 北京天诚盛业科技有限公司 用于人脸识别的卷积神经网络的训练方法、装置及应用
CN105354565A (zh) * 2015-12-23 2016-02-24 北京市商汤科技开发有限公司 基于全卷积网络人脸五官定位与判别的方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GIL LEVI等: ""Age and Gender Classification using Convolutional Neural Networks"", 《2015 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION WORKSHOPS (CVPRW)》 *
周志华等: ""神经网络集成"", 《计算机学报》 *
郭红玲等: ""多分类器选择集成方法"", 《计算机工程与应用》 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106980830A (zh) * 2017-03-17 2017-07-25 中国人民解放军国防科学技术大学 一种基于深度卷积网络自亲缘关系识别方法与装置
CN106951867A (zh) * 2017-03-22 2017-07-14 成都擎天树科技有限公司 基于卷积神经网络的人脸识别方法、装置、系统及设备
CN106951867B (zh) * 2017-03-22 2019-08-23 成都擎天树科技有限公司 基于卷积神经网络的人脸识别方法、装置、系统及设备
CN107169454A (zh) * 2017-05-16 2017-09-15 中国科学院深圳先进技术研究院 一种人脸图像年龄估算方法、装置及其终端设备
CN107169454B (zh) * 2017-05-16 2021-01-01 中国科学院深圳先进技术研究院 一种人脸图像年龄估算方法、装置及其终端设备
CN107437099A (zh) * 2017-08-03 2017-12-05 哈尔滨工业大学 一种基于机器学习的特定服饰图像识别与检测方法
CN107545245A (zh) * 2017-08-14 2018-01-05 中国科学院半导体研究所 一种年龄估计方法及设备
CN107704816A (zh) * 2017-09-27 2018-02-16 珠海格力电器股份有限公司 食物的蒸煮方法及装置
CN107729078A (zh) * 2017-09-30 2018-02-23 广东欧珀移动通信有限公司 后台应用程序管控方法、装置、存储介质及电子设备
WO2019062411A1 (zh) * 2017-09-30 2019-04-04 Oppo广东移动通信有限公司 后台应用程序管控方法、存储介质及电子设备
CN107729078B (zh) * 2017-09-30 2019-12-03 Oppo广东移动通信有限公司 后台应用程序管控方法、装置、存储介质及电子设备
CN108021863A (zh) * 2017-11-01 2018-05-11 平安科技(深圳)有限公司 电子装置、基于图像的年龄分类方法及存储介质
CN107622261A (zh) * 2017-11-03 2018-01-23 北方工业大学 基于深度学习的人脸年龄估计方法及装置
CN108109152A (zh) * 2018-01-03 2018-06-01 深圳北航新兴产业技术研究院 医学图像分类和分割方法和装置
CN108596042A (zh) * 2018-03-29 2018-09-28 青岛海尔智能技术研发有限公司 开门控制方法和系统
CN108537026A (zh) * 2018-03-30 2018-09-14 百度在线网络技术(北京)有限公司 应用程序控制方法、装置和服务器
CN109063750A (zh) * 2018-07-17 2018-12-21 西安电子科技大学 基于cnn和svm决策融合的sar目标分类方法
CN109063750B (zh) * 2018-07-17 2022-05-13 西安电子科技大学 基于cnn和svm决策融合的sar目标分类方法
CN110956190A (zh) * 2018-09-27 2020-04-03 深圳云天励飞技术有限公司 图像识别方法及装置、计算机装置和计算机可读存储介质
CN109726703A (zh) * 2019-01-11 2019-05-07 浙江工业大学 一种基于改进集成学习策略的人脸图像年龄识别方法
CN111242235A (zh) * 2020-01-19 2020-06-05 中国科学院计算技术研究所厦门数据智能研究院 一种相似特征测试数据集生成方法
CN111242235B (zh) * 2020-01-19 2023-04-07 中科(厦门)数据智能研究院 一种相似特征测试数据集生成方法
CN111680664A (zh) * 2020-06-22 2020-09-18 南方电网科学研究院有限责任公司 一种人脸图像年龄识别方法、装置和设备
CN112070535A (zh) * 2020-09-03 2020-12-11 常州微亿智造科技有限公司 电动汽车价格预测方法和装置
CN112446310A (zh) * 2020-11-19 2021-03-05 杭州趣链科技有限公司 基于区块链的年龄识别系统、方法及装置
CN112656431A (zh) * 2020-12-15 2021-04-16 中国科学院深圳先进技术研究院 基于脑电的注意力识别方法、装置、终端设备和存储介质
CN115205637A (zh) * 2022-09-19 2022-10-18 山东世纪矿山机电有限公司 一种矿车物料的智能识别方法

Similar Documents

Publication Publication Date Title
CN106295506A (zh) 一种基于集成卷积神经网络的年龄识别方法
CN109948425B (zh) 一种结构感知自注意和在线实例聚合匹配的行人搜索方法及装置
CN108171209A (zh) 一种基于卷积神经网络进行度量学习的人脸年龄估计方法
CN111325115B (zh) 带有三重约束损失的对抗跨模态行人重识别方法和系统
CN101271469B (zh) 一种基于三维模型库下二维图像的识别和物体的重建方法
Tiwari Supervised learning: From theory to applications
CN109299268A (zh) 一种基于双通道模型的文本情感分析方法
Li et al. Sign language recognition based on computer vision
CN106778496A (zh) 活体检测方法及装置
CN107945153A (zh) 一种基于深度学习的路面裂缝检测方法
CN107451607A (zh) 一种基于深度学习的典型人物的身份识别方法
CN104504362A (zh) 基于卷积神经网络的人脸检测方法
CN109902912B (zh) 一种基于性格特征的个性化图像美学评价方法
CN110263822B (zh) 一种基于多任务学习方式的图像情感分析方法
CN109325516A (zh) 一种面向图像分类的集成学习方法及装置
CN109801225A (zh) 基于多任务全卷积神经网络的人脸网纹污迹去除方法
CN110097090A (zh) 一种基于多尺度特征融合的图像细粒度识别方法
CN110110602A (zh) 一种基于三维残差神经网络和视频序列的动态手语识别方法
CN107301376A (zh) 一种基于深度学习多层刺激的行人检测方法
CN107506792A (zh) 一种半监督的显著对象检测方法
Wang et al. Quantifying legibility of indoor spaces using Deep Convolutional Neural Networks: Case studies in train stations
CN106815563A (zh) 一种基于人体表观结构的人群数量预测方法
CN113807278A (zh) 一种基于深度学习的土地利用分类及变化预测方法
Liu et al. Face aging simulation with deep convolutional generative adversarial networks
CN107944373A (zh) 一种基于深度学习的视频异常行为检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170104

RJ01 Rejection of invention patent application after publication