[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN108108723A - 一种基于深度学习的人脸特征提取方法 - Google Patents

一种基于深度学习的人脸特征提取方法 Download PDF

Info

Publication number
CN108108723A
CN108108723A CN201810052447.1A CN201810052447A CN108108723A CN 108108723 A CN108108723 A CN 108108723A CN 201810052447 A CN201810052447 A CN 201810052447A CN 108108723 A CN108108723 A CN 108108723A
Authority
CN
China
Prior art keywords
layer
length
convolution kernel
layers
activation primitive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810052447.1A
Other languages
English (en)
Inventor
胡钟山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Anytec Holdings Co ltd
Original Assignee
Shenzhen Anytec Holdings Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Anytec Holdings Co ltd filed Critical Shenzhen Anytec Holdings Co ltd
Priority to CN201810052447.1A priority Critical patent/CN108108723A/zh
Publication of CN108108723A publication Critical patent/CN108108723A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

一种基于深度学习的人脸特征提取方法,包括以下步骤:步骤1:初始化输入图像尺寸为W*W,卷积核大小为K*K,步长为S,填充大小为P,输出个数为NUM和各层的权重为θi;步骤2:准备人脸图像数据;步骤3:构建具有46层的深度学习的人脸特征提取网络;步骤4:将准备的人脸图像数据输入到步骤3中构建的人脸特征提取网络中,训练softmax分类器;步骤5:启动人脸特征提取网络,进行网络训练:网络训练T时间后,通过微调求对人脸特征提取网络进行精度提升,最终出来的权重系统θ,即为所求模型;通过该模型对未知样本进行特征提取,流程结束。

Description

一种基于深度学习的人脸特征提取方法
技术领域
本发明属于电箱、电箱测试仪技术领域,具体而言是一种PUD测试台。
背景技术
人脸识别是一种基于人的脸部特征信息进行身份识别的生物识别技术。与其他生物特征相比,人脸特征具有天然性、方便性和非接触性等优点,使其在安全监控、身份验证、人机交互等方面具有巨大的应用前景。
随着监控摄像头的广泛应用,人脸识别系统的市场需求也在逐渐扩大,然而,在这些应用中被监控人群大多数处于非约束状态,当前的人脸识别产品和人脸识别系统都需要对检测到的人脸具有一定的限定或者是要求。这些限定条件已经成为人脸识别技术推广和应用的主要障碍。存在这些限定条件是因为:在非可控条件下,复杂干扰因素将导致人脸识别精度极具下降,不能满足应用需求。在非可控条件下,不仅可能存在强光变化、大范围的姿态变化、夸张的表情变化、有意或者是无意的遮挡、图像分辨率的高低等严重的干扰因素,而且这些因素可能随机组合地出现在视频人脸图像中。这些复杂干扰将导致同一个人的人脸识别依然是一个非常困难的问题。
因此,人脸识别技术非常具有研究价值。一般而言,人脸识别过程分为两个过程:人脸特征提取和人脸相似度得分值计算。人脸特征提取过程是提取人脸图片的一些关键特征形成人脸特征向量,人脸相似度得分值计算过程是计算两个人脸特征向量之间的相似度,相似度越高则表明两张人脸图片越有可能来自于同一个人,反之,则越表明两张人脸图片来自于不同的人。在某些情况下,更关心的是人脸特征提取部分。
现有的人脸特征提取方法包括第一类:LBP(局部二值模式)方法和它的变种方法等,这些局部纹理特征提取方法通过对整张人脸图片进行分块统计形成直方图向量,并将各个块的直方图向量级联最终形成人脸特征向量。由于这种方法是对整张人脸进行局部纹理特征提取,因此,其所形成的特征向量维数是比较大的,并且其中包含了一些冗余信息。此外,这种方式对于复杂环境下表情或姿态的变化并不鲁棒,准确率受到环境因素影响的影响,近些年越来越多的深度模型,尤其是卷积神经网络(CNN)被用来提取深层视觉特征,通过模仿人大脑皮层的神经网络,采用卷积、池化、非线性变化等手段提出的卷积神经网络模型,可以获取更抽象更本质的视觉特征。但仍然存在人脸图像受到光照、表情、姿态、化妆等多种因素的影响,给人脸图像特征的提取带来了很大的干扰,从而大大降低了识别的效率。
第二类:SIFT特征提取方法已被广泛应用于一般物体的识别,它的主要思想是找到图像在不同尺度下的关键点,并用方向直方图来描述关键点作为图像的特征向量。然而,SIFT方法用于人脸图像时,不能准确定位到人脸中的关键点,因为其主要适用于具有较高对比度的一般物体的识别,而人脸图像之间具有较高的相似性。
第三类:基于几何特征的人脸特征提取,该方法当人脸受到遮挡时,从图像中提取稳定的特征比较困难,鲁棒性差;
第四类:基于主成分分析的人脸特征提取,该方法容易受光照、人脸旋转和面部表情变化的影响;
第五类:基于模板匹配的人脸特征提取,该方法对人脸面部的大的表情变化很敏感。
第六类:基于多层神经网络的特征提取,该方法效果准确度直接依赖于网络结构。
综上所述,针对现有技术中存在的问题,有必要提供一种具有实用性、新颖性的装置。
发明内容
本发明根据现有技术中存在的不能准确定位到人脸中的关键点、识别的效率低、特征向量维数是比较大,运算分析复杂等问题,提供一种基于深度学习的人脸特征提取方法。
本发明的技术方案如下:一种基于深度学习的人脸特征提取方法,包括以下步骤:
步骤1:初始化输入图像尺寸为W*W,卷积核大小为K*K,步长为S,填充大小为P,输出个数为NUM和各层的权重为θi
步骤2:准备人脸图像数据;
步骤3:构建具有46层的深度学习的人脸特征提取网络;
步骤4:将准备的人脸图像数据输入到步骤3中构建的人脸特征提取网络中,训练softmax分类器;
步骤5:启动人脸特征提取网络,进行网络训练:网络训练T时间后,通过微调求对人脸特征提取网络进行精度提升,最终出来的权重系统θ,即为所求模型;通过该模型对未知样本进行特征提取,流程结束。
作为一种优选的技术方案,初始化输入图像尺寸设置为227*227,卷积核大小设置为K*K,步长设置为S,填充大小设置为P,输出个数设置为NUM,随机初始化权重系统设置为θi
作为一种优选的技术方案,所述步骤3中的人脸特征提取网络的构建如下:
第一层:数据输入层,输入图像数据:数据长宽为227*227,图像数据取值范围:0-255;
第二层:卷积层conv1:卷积核大小:11*11;步长:4;输出个数:96;
第三层:激活层relu1:使用relu函数为激活函数;
第四层:池化层pool1:卷积核大小:3*3;步长:2;池化类型:最大值;填充:1;
第五层:卷积层:卷积核大小:1*1;步长:4;输出个数:256;
第六层:bn层:采用全局归一化;
第七层:scale层:全局缩放;
第八层:卷积层:卷积核大小:1*1;步长:1;输出个数:64;
第九层:bn层:采用全局归一化;
第十层:scale层:全局缩放;
第十一层:激活层:使用relu函数为激活函数;
第十二层:卷积层:卷积核大小:3*3;步长:1;输出个数:64;填充:1;
第十三层:bn层:采用全局归一化;
第十四层:scale层:采用全局缩放;
第十五层:激活层:使用relu函数为激活函数;
第十六层:卷积层:卷积核大小:1*1;步长:1;输出个数:256;填充:1;
第十七层:bn层:采用全局归一化;
第十八层:scale层:采用全局缩放;
第十九层:Eltwise层:相加得到最终的;
第二十层:激活层:使用relu函数为激活函数;
第二十一层:卷积层:卷积核大小:1*1;步长:1;输出个数:64;
第二十二层:bn层:采用全局归一化;
第二十三层:scale层:采用全局缩放;
第二十四层:激活层:使用relu函数为激活函数;
第二十五层:卷积层:卷积核大小:3*3;步长:1;输出个数:64;填充:1;
第二十六层:bn层:采用全局归一化;
第二十七层:scale层:采用全局缩放;
第二十八层:激活层:使用relu函数为激活函数;
第二十九层:卷积层:卷积核大小:1*1;步长:1;输出个数:256;
第三十层:bn层:采用全局归一化;
第三十一层:scale层:采用全局缩放;
第三十二层:Eltwise层:得到res2b=res2b+res2b_branch2c;
第三十三层:激活层:使用relu函数为激活函数;
第三十四层:卷积层conv2:卷积核大小:3*3;步长:1;输出个数:384;填充:1;
第三十五层:激活函数relu2:使用relu函数为激活函数;
第三十六层:卷积层conv3:卷积核大小:3*3;步长:1;输出个数:384;填充:1;
第三十七层:激活函数relu3:使用relu函数为激活函数;
第三十八层:卷积层conv4:卷积核大小:3*3;步长:1;输出个数:256;填充:1;
第三十九层:激活函数relu4:使用relu函数为激活函数;
第四十层:池化层pool4:卷积核大小:7*7;步长:1;池化类型:均值;
第四十一层:全连接层fc5:输出个数:4096;
第四十二层:激活函数relu5:使用relu函数为激活函数;
第四十三层:全连接层fc6:输出个数:4096;
第四十四层:激活函数relu6:使用relu函数为激活函数;
第四十五层:全连接层fc7:输出个数:1000;
第四十六层:分类器prob。
作为一种优选的技术方案,步骤5中所述网络训练,包括对原始的数据进行卷积操作、池化、激活操作后,得到最终的特征;
所述卷积,是指用模板对图像进行卷积操作,
所述的池化操作,是指对图像进行采样,池化操作为均值池化与最大值池化;平均池化是指计算图像区域的平均值作为该区域池化后的值;最大池化是指选图像区域的最大值作为该区域池化后的值;
所述激活操作,是指利用卷积核计算出神经元的激活值,提供网络的非线性建模能力,从而增加网络的特征描述能力。
作为一种优选的技术方案,所述步骤4中训练softmax分类器,具体包括以下几个步骤:步骤4.1:初始化参数W=227,随机初始化每一层权重系统θi,卷积核大小K*K,步长为S,填充大小为P,输出个数NUM,分别对不同层进行初始化;
步骤4.2:输入训练数据与对应标签;
步骤4.3:训练网络,网络节点的误差与权重更新如下:
对于输出节点i的误差项δi,如公式(1)所示:
δi=yi(1-yi)(ti-yi) (1)
其中y是节点i的输出值,t是样本对应于i的目标值;
对于隐藏节点的误差项ρi,如公式(2)所示:
其中a是节点的输出值,w是节点i到下一个节点k的连接权重;
由此可得,每个连接上的权值如公式(3)所示:
wji←wji+ηδjλji (3)
其中η为学习率常量,λ是节点i传递给节点j的输入;
步骤4.4:输入测试样本,测试分类器,并根据结果对分类器进行微调,进一步提高准确率。
与现有技术相比较,本发明的有益效果在于:
(1)本发明提出了非常适合人脸特征提取的网络结构,通过构建这种结构的深度神经网络,将人脸图像数据映射成一组向量特征,用于描述人脸。该方法提取的特征具有很强的鲁棒性,不易受光照、形变等影响。经实验验证,该结构能得到很高的准确率。
(2)本发明构建一个四十六层的深度神经网络,通过卷积运算提取一些边缘、形状特征等低层特征,然后用这些基础特征去构建更高层的特征,借以描述更抽象的特征,从而得到更精确的人脸特征。
(3)本发明通过该网络提取的特征,经过验证识别率优于其他结构的神经网络,同时对人脸姿态、表情具有很好的鲁棒性。
附图说明
图1为本发明的整体流程框图;
图2为46层深度学习人脸特征提取网络的构件图;
图3为发明的训练softmax分类器的结构框图。
具体实施例
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图1、及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
结合图1所示:一种基于深度学习的人脸特征提取方法,包括以下步骤:
步骤1:初始化输入图像尺寸为W*W,卷积核大小为K*K,步长为S,填充大小为P,输出个数为NUM和各层的权重为θi
步骤2:准备人脸图像数据;
步骤3:构建具有46层的深度学习的人脸特征提取网络;
步骤4:将准备的人脸图像数据输入到步骤3中构建的人脸特征提取网络中,训练softmax分类器;
步骤5:启动人脸特征提取网络,进行网络训练:网络训练T时间后,通过微调求对人脸特征提取网络进行精度提升,最终出来的权重系统θ,即为所求模型;通过该模型对未知样本进行特征提取,流程结束。
本发明的第一实施例:初始化输入图像尺寸设置为227*227,卷积核大小设置为K*K,步长设置为S,填充大小设置为P,输出个数设置为NUM,随机初始化权重系统设置为θi
结合图2所示:所述步骤3中的人脸特征提取网络的构建如下:
第一层:数据输入层,输入图像数据:数据长宽为227*227,图像数据取值范围:0-255;
第二层:卷积层conv1:卷积核大小:11*11;步长:4;输出个数:96;
第三层:激活层relu1:使用relu函数为激活函数;
第四层:池化层pool1:卷积核大小:3*3;步长:2;池化类型:最大值;填充:1;
第五层:卷积层:卷积核大小:1*1;步长:4;输出个数:256;
第六层:bn层:采用全局归一化;
第七层:scale层:全局缩放;
第八层:卷积层:卷积核大小:1*1;步长:1;输出个数:64;
第九层:bn层:采用全局归一化;
第十层:scale层:全局缩放;
第十一层:激活层:使用relu函数为激活函数;
第十二层:卷积层:卷积核大小:3*3;步长:1;输出个数:64;填充:1;
第十三层:bn层:采用全局归一化;
第十四层:scale层:采用全局缩放;
第十五层:激活层:使用relu函数为激活函数;
第十六层:卷积层:卷积核大小:1*1;步长:1;输出个数:256;填充:1;
第十七层:bn层:采用全局归一化;
第十八层:scale层:采用全局缩放;
第十九层:Eltwise层:相加得到最终的;
第二十层:激活层:使用relu函数为激活函数;
第二十一层:卷积层:卷积核大小:1*1;步长:1;输出个数:64;
第二十二层:bn层:采用全局归一化;
第二十三层:scale层:采用全局缩放;
第二十四层:激活层:使用relu函数为激活函数;
第二十五层:卷积层:卷积核大小:3*3;步长:1;输出个数:64;填充:1;
第二十六层:bn层:采用全局归一化;
第二十七层:scale层:采用全局缩放;
第二十八层:激活层:使用relu函数为激活函数;
第二十九层:卷积层:卷积核大小:1*1;步长:1;输出个数:256;
第三十层:bn层:采用全局归一化;
第三十一层:scale层:采用全局缩放;
第三十二层:Eltwise层:得到res2b=res2b+res2b_branch2c;
第三十三层:激活层:使用relu函数为激活函数;
第三十四层:卷积层conv2:卷积核大小:3*3;步长:1;输出个数:384;填充:1;
第三十五层:激活函数relu2:使用relu函数为激活函数;
第三十六层:卷积层conv3:卷积核大小:3*3;步长:1;输出个数:384;填充:1;
第三十七层:激活函数relu3:使用relu函数为激活函数;
第三十八层:卷积层conv4:卷积核大小:3*3;步长:1;输出个数:256;填充:1;
第三十九层:激活函数relu4:使用relu函数为激活函数;
第四十层:池化层pool4:卷积核大小:7*7;步长:1;池化类型:均值;
第四十一层:全连接层fc5:输出个数:4096;
第四十二层:激活函数relu5:使用relu函数为激活函数;
第四十三层:全连接层fc6:输出个数:4096;
第四十四层:激活函数relu6:使用relu函数为激活函数;
第四十五层:全连接层fc7:输出个数:1000;
第四十六层:分类器prob。
本发明的第二实施例:
步骤5中所述网络训练,包括对原始的数据进行卷积操作、池化、激活操作后,得到最终的特征;
所述卷积,是指用模板对图像进行卷积操作,
所述的池化操作,是指对图像进行采样,池化操作为均值池化与最大值池化;平均池化是指计算图像区域的平均值作为该区域池化后的值;最大池化是指选图像区域的最大值作为该区域池化后的值;
所述激活操作,是指利用卷积核计算出神经元的激活值,提供网络的非线性建模能力,从而增加网络的特征描述能力,具体定义如下公式:
f(x)=max(0,x)
其中x为当前神经元的值,选0与x之间的最大值为当前操作的结果;
其中残差网络结构如下:
输入x经过网络后的输出为F(x),同时让x直接传入到底部的激活层,得到最终的输出H(x)。结合图3所示:所述步骤4中训练softmax分类器,具体包括以下几个步骤:
步骤4.1:初始化参数W=227,随机初始化每一层权重系统θi,卷积核大小K*K,步长为S,填充大小为P,输出个数NUM,分别对不同层进行初始化;
步骤4.2:输入训练数据与对应标签;
步骤4.3:训练网络,网络节点的误差与权重更新如下:
对于输出节点i的误差项δi,如公式(1)所示:
δi=yi(1-yi)(ti-yi) (1)
其中y是节点i的输出值,t是样本对应于i的目标值;
对于隐藏节点的误差项ρi,如公式(2)所示:
其中a是节点的输出值,w是节点i到下一个节点k的连接权重;
由此可得,每个连接上的权值如公式(3)所示:
wji←wji+ηδjλji (3)
其中η为学习率常量,λ是节点i传递给节点j的输入;
步骤4.4:输入测试样本,测试分类器,并根据结果对分类器进行微调,进一步提高准确率。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构变换,或直接或间接运用附属在其他相关产品的技术领域,均同理包括在本发明的专利保护范围内。

Claims (5)

1.一种基于深度学习的人脸特征提取方法,其特征在于,包括以下步骤:
步骤1:初始化输入图像尺寸为W*W,卷积核大小为K*K,步长为S,填充大小为P,输出个数为NUM和各层的权重为θi
步骤2:准备人脸图像数据;
步骤3:构建具有46层的深度学习的人脸特征提取网络;
步骤4:将准备的人脸图像数据输入到步骤3中构建的人脸特征提取网络中,训练softmax分类器;
步骤5:启动人脸特征提取网络,进行网络训练:网络训练T时间后,通过微调求对人脸特征提取网络进行精度提升,最终出来的权重系统θ,即为所求模型;通过该模型对未知样本进行特征提取,流程结束。
2.根据权利要求1中所述的一种基于深度学习的人脸特征提取方法,其特征在于,初始化输入图像尺寸设置为227*227,卷积核大小设置为K*K,步长设置为S,填充大小设置为P,输出个数设置为NUM,随机初始化权重系统设置为θi
3.根据权利要求1中所述的一种基于深度学习的人脸特征提取方法,其特征在于,所述步骤3中的人脸特征提取网络的构建如下:
第一层:数据输入层,输入图像数据:数据长宽为227*227,图像数据取值范围:0-255;
第二层:卷积层conv1:卷积核大小:11*11;步长:4;输出个数:96;
第三层:激活层relu1:使用relu函数为激活函数;
第四层:池化层pool1:卷积核大小:3*3;步长:2;池化类型:最大值;填充:1;
第五层:卷积层:卷积核大小:1*1;步长:4;输出个数:256;
第六层:bn层:采用全局归一化;
第七层:scale层:全局缩放;
第八层:卷积层:卷积核大小:1*1;步长:1;输出个数:64;
第九层:bn层:采用全局归一化;
第十层:scale层:全局缩放;
第十一层:激活层:使用relu函数为激活函数;
第十二层:卷积层:卷积核大小:3*3;步长:1;输出个数:64;填充:1;
第十三层:bn层:采用全局归一化;
第十四层:scale层:采用全局缩放;
第十五层:激活层:使用relu函数为激活函数;
第十六层:卷积层:卷积核大小:1*1;步长:1;输出个数:256;填充:1;
第十七层:bn层:采用全局归一化;
第十八层:scale层:采用全局缩放;
第十九层:Eltwise层:相加得到最终的;
第二十层:激活层:使用relu函数为激活函数;
第二十一层:卷积层:卷积核大小:1*1;步长:1;输出个数:64;
第二十二层:bn层:采用全局归一化;
第二十三层:scale层:采用全局缩放;
第二十四层:激活层:使用relu函数为激活函数;
第二十五层:卷积层:卷积核大小:3*3;步长:1;输出个数:64;填充:1;
第二十六层:bn层:采用全局归一化;
第二十七层:scale层:采用全局缩放;
第二十八层:激活层:使用relu函数为激活函数;
第二十九层:卷积层:卷积核大小:1*1;步长:1;输出个数:256;
第三十层:bn层:采用全局归一化;
第三十一层:scale层:采用全局缩放;
第三十二层:Eltwise层:得到res2b=res2b+res2b_branch2c;
第三十三层:激活层:使用relu函数为激活函数;
第三十四层:卷积层conv2:卷积核大小:3*3;步长:1;输出个数:384;填充:1;
第三十五层:激活函数relu2:使用relu函数为激活函数;
第三十六层:卷积层conv3:卷积核大小:3*3;步长:1;输出个数:384;填充:1;
第三十七层:激活函数relu3:使用relu函数为激活函数;
第三十八层:卷积层conv4:卷积核大小:3*3;步长:1;输出个数:256;填充:1;
第三十九层:激活函数relu4:使用relu函数为激活函数;
第四十层:池化层pool4:卷积核大小:7*7;步长:1;池化类型:均值;
第四十一层:全连接层fc5:输出个数:4096;
第四十二层:激活函数relu5:使用relu函数为激活函数;
第四十三层:全连接层fc6:输出个数:4096;
第四十四层:激活函数relu6:使用relu函数为激活函数;
第四十五层:全连接层fc7:输出个数:1000;
第四十六层:分类器prob。
4.根据权利要求1中所述的基于深度学习的人脸特征提取方法,其特征在于:
步骤5中所述网络训练,包括对原始的数据进行卷积操作、池化、激活操作后,得到最终的特征;
所述卷积,是指用模板对图像进行卷积操作,
所述的池化操作,是指对图像进行采样,池化操作为均值池化与最大值池化;平均池化是指计算图像区域的平均值作为该区域池化后的值;最大池化是指选图像区域的最大值作为该区域池化后的值;
所述激活操作,是指利用卷积核计算出神经元的激活值,提供网络的非线性建模能力,从而增加网络的特征描述能力。
5.根据权利要求1中所述的一种基于深度学习的人脸特征提取方法,其特征在于,所述步骤4中训练softmax分类器,具体包括以下几个步骤:
步骤4.1:初始化参数W=227,随机初始化每一层权重系统θi,卷积核大小K*K,步长为S,填充大小为P,输出个数NUM,分别对不同层进行初始化;
步骤4.2:输入训练数据与对应标签;
步骤4.3:训练网络,网络节点的误差与权重更新如下:
对于输出节点i的误差项δi,如公式(1)所示:
δi=yi(1-yi)(ti-yi) (1)
其中y是节点i的输出值,t是样本对应于i的目标值;
对于隐藏节点的误差项ρi,如公式(2)所示:
<mrow> <msub> <mi>&amp;rho;</mi> <mi>i</mi> </msub> <mo>=</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>&amp;Element;</mo> <mi>o</mi> <mi>u</mi> <mi>t</mi> <mi>p</mi> <mi>u</mi> <mi>t</mi> <mi>s</mi> </mrow> </munder> <msub> <mi>w</mi> <mrow> <mi>k</mi> <mi>i</mi> </mrow> </msub> <msub> <mi>&amp;rho;</mi> <mi>k</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>
其中a是节点的输出值,w是节点i到下一个节点k的连接权重;
由此可得,每个连接上的权值如公式(3)所示:
wji←wji+ηδjλji (3)
其中η为学习率常量,λ是节点i传递给节点j的输入;
步骤4.4:输入测试样本,测试分类器,并根据结果对分类器进行微调,进一步提高准确率。
CN201810052447.1A 2018-01-19 2018-01-19 一种基于深度学习的人脸特征提取方法 Pending CN108108723A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810052447.1A CN108108723A (zh) 2018-01-19 2018-01-19 一种基于深度学习的人脸特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810052447.1A CN108108723A (zh) 2018-01-19 2018-01-19 一种基于深度学习的人脸特征提取方法

Publications (1)

Publication Number Publication Date
CN108108723A true CN108108723A (zh) 2018-06-01

Family

ID=62220170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810052447.1A Pending CN108108723A (zh) 2018-01-19 2018-01-19 一种基于深度学习的人脸特征提取方法

Country Status (1)

Country Link
CN (1) CN108108723A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109100627A (zh) * 2018-10-31 2018-12-28 红相股份有限公司 一种基于端到端模式的电力设备局部放电故障诊断方法
CN109116203A (zh) * 2018-10-31 2019-01-01 红相股份有限公司 基于卷积神经网络的电力设备局部放电故障诊断方法
CN109259733A (zh) * 2018-10-25 2019-01-25 深圳和而泰智能控制股份有限公司 一种睡眠中呼吸暂停检测方法、装置和检测设备
CN109409258A (zh) * 2018-10-11 2019-03-01 深圳市恩钛控股有限公司 一种基于深度学习面部识别算法的智能人脸检测识别系统
CN109460974A (zh) * 2018-10-29 2019-03-12 广州皓云原智信息科技有限公司 一种基于姿态识别的考勤系统
CN109615674A (zh) * 2018-11-28 2019-04-12 浙江大学 基于混合损失函数3d cnn的动态双示踪pet重建方法
CN110175553A (zh) * 2019-05-23 2019-08-27 银河水滴科技(北京)有限公司 基于步态识别与人脸识别建立特征库的方法及装置
CN110222623A (zh) * 2019-05-31 2019-09-10 深圳市恩钛控股有限公司 微表情研判方法和系统
CN110427859A (zh) * 2019-05-31 2019-11-08 北京金山云网络技术有限公司 一种人脸检测方法、装置、电子设备及存储介质
CN110837777A (zh) * 2019-10-10 2020-02-25 天津大学 基于改进VGG-Net的部分遮挡的人脸表情识别方法
CN111401290A (zh) * 2020-03-24 2020-07-10 杭州博雅鸿图视频技术有限公司 一种人脸检测方法及系统、计算机可读存储介质
CN112001202A (zh) * 2019-05-27 2020-11-27 北京君正集成电路股份有限公司 一种二次人脸检测的网络结构设置方法
CN112167212A (zh) * 2019-07-02 2021-01-05 上海临石信息科技有限公司 一种无人机喷药控制系统及方法
CN113205122A (zh) * 2021-04-23 2021-08-03 微马科技有限公司 基于低成本运算平台的人脸检测方法、装置及介质
CN113392899A (zh) * 2021-06-10 2021-09-14 电子科技大学 一种基于二值化图像分类网络的图像分类方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912990A (zh) * 2016-04-05 2016-08-31 深圳先进技术研究院 人脸检测的方法及装置
CN106951867A (zh) * 2017-03-22 2017-07-14 成都擎天树科技有限公司 基于卷积神经网络的人脸识别方法、装置、系统及设备
CN107273864A (zh) * 2017-06-22 2017-10-20 星际(重庆)智能装备技术研究院有限公司 一种基于深度学习的人脸检测方法
US20170344808A1 (en) * 2016-05-28 2017-11-30 Samsung Electronics Co., Ltd. System and method for a unified architecture multi-task deep learning machine for object recognition

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912990A (zh) * 2016-04-05 2016-08-31 深圳先进技术研究院 人脸检测的方法及装置
US20170344808A1 (en) * 2016-05-28 2017-11-30 Samsung Electronics Co., Ltd. System and method for a unified architecture multi-task deep learning machine for object recognition
CN106951867A (zh) * 2017-03-22 2017-07-14 成都擎天树科技有限公司 基于卷积神经网络的人脸识别方法、装置、系统及设备
CN107273864A (zh) * 2017-06-22 2017-10-20 星际(重庆)智能装备技术研究院有限公司 一种基于深度学习的人脸检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
万士宁: "基于卷积神经网络的人脸识别研究与实现", 《中国优秀硕士学位论文全文数据库》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109409258A (zh) * 2018-10-11 2019-03-01 深圳市恩钛控股有限公司 一种基于深度学习面部识别算法的智能人脸检测识别系统
CN109409258B (zh) * 2018-10-11 2022-05-24 深圳市恩钛控股有限公司 一种基于深度学习面部识别算法的智能人脸检测识别系统
CN109259733A (zh) * 2018-10-25 2019-01-25 深圳和而泰智能控制股份有限公司 一种睡眠中呼吸暂停检测方法、装置和检测设备
CN109460974A (zh) * 2018-10-29 2019-03-12 广州皓云原智信息科技有限公司 一种基于姿态识别的考勤系统
CN109460974B (zh) * 2018-10-29 2021-09-07 广州皓云原智信息科技有限公司 一种基于姿态识别的考勤系统
CN109116203A (zh) * 2018-10-31 2019-01-01 红相股份有限公司 基于卷积神经网络的电力设备局部放电故障诊断方法
CN109100627A (zh) * 2018-10-31 2018-12-28 红相股份有限公司 一种基于端到端模式的电力设备局部放电故障诊断方法
CN109615674B (zh) * 2018-11-28 2020-09-18 浙江大学 基于混合损失函数3d cnn的动态双示踪pet重建方法
CN109615674A (zh) * 2018-11-28 2019-04-12 浙江大学 基于混合损失函数3d cnn的动态双示踪pet重建方法
CN110175553A (zh) * 2019-05-23 2019-08-27 银河水滴科技(北京)有限公司 基于步态识别与人脸识别建立特征库的方法及装置
CN110175553B (zh) * 2019-05-23 2021-07-30 银河水滴科技(宁波)有限公司 基于步态识别与人脸识别建立特征库的方法及装置
CN112001202A (zh) * 2019-05-27 2020-11-27 北京君正集成电路股份有限公司 一种二次人脸检测的网络结构设置方法
CN112001202B (zh) * 2019-05-27 2023-07-07 北京君正集成电路股份有限公司 一种二次人脸检测的网络结构设置方法
CN110427859A (zh) * 2019-05-31 2019-11-08 北京金山云网络技术有限公司 一种人脸检测方法、装置、电子设备及存储介质
CN110222623A (zh) * 2019-05-31 2019-09-10 深圳市恩钛控股有限公司 微表情研判方法和系统
CN112167212A (zh) * 2019-07-02 2021-01-05 上海临石信息科技有限公司 一种无人机喷药控制系统及方法
CN110837777A (zh) * 2019-10-10 2020-02-25 天津大学 基于改进VGG-Net的部分遮挡的人脸表情识别方法
CN111401290A (zh) * 2020-03-24 2020-07-10 杭州博雅鸿图视频技术有限公司 一种人脸检测方法及系统、计算机可读存储介质
CN113205122A (zh) * 2021-04-23 2021-08-03 微马科技有限公司 基于低成本运算平台的人脸检测方法、装置及介质
CN113392899B (zh) * 2021-06-10 2022-05-10 电子科技大学 一种基于二值化图像分类网络的图像分类方法
CN113392899A (zh) * 2021-06-10 2021-09-14 电子科技大学 一种基于二值化图像分类网络的图像分类方法

Similar Documents

Publication Publication Date Title
CN108108723A (zh) 一种基于深度学习的人脸特征提取方法
Thai et al. Image classification using support vector machine and artificial neural network
Celebi et al. Gesture recognition using skeleton data with weighted dynamic time warping.
Viraktamath et al. Face detection and tracking using OpenCV
Ming et al. Simple triplet loss based on intra/inter-class metric learning for face verification
CN107808129A (zh) 一种基于单个卷积神经网络的面部多特征点定位方法
Qiang et al. SqueezeNet and fusion network-based accurate fast fully convolutional network for hand detection and gesture recognition
CN107886064A (zh) 一种基于卷积神经网络的人脸识别场景适应的方法
Yang et al. CNN based 3D facial expression recognition using masking and landmark features
CN109902583B (zh) 一种基于双向独立循环神经网络的骨架手势识别方法
Gu et al. Multiple stream deep learning model for human action recognition
CN107679513A (zh) 图像处理方法、装置及服务器
CN110378208A (zh) 一种基于深度残差网络的行为识别方法
CN107944459A (zh) 一种rgb‑d物体识别方法
CN104636732A (zh) 一种基于序列深信度网络的行人识别方法
CN108182397A (zh) 一种多姿态多尺度的人脸验证方法
CN111028319A (zh) 一种基于面部运动单元的三维非真实感表情生成方法
Vishwakarma et al. Simple and intelligent system to recognize the expression of speech-disabled person
Singh et al. Leaf identification using feature extraction and neural network
Lakshmi et al. Off-line signature verification using Neural Networks
CN107122725A (zh) 一种基于联合稀疏判别分析的人脸识别方法及其系统
Nguyen et al. A new hand representation based on kernels for hand posture recognition
CN104700439A (zh) 基于单张目标画像的人脸画像合成方法
US20220198124A1 (en) Method and apparatus for recognizing handwriting inputs in multiple-user environment
Wang et al. AdvST: Generating Unrestricted Adversarial Images via Style Transfer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180601