CN112818946A - 年龄识别模型的训练、年龄识别方法、装置及电子设备 - Google Patents
年龄识别模型的训练、年龄识别方法、装置及电子设备 Download PDFInfo
- Publication number
- CN112818946A CN112818946A CN202110250897.3A CN202110250897A CN112818946A CN 112818946 A CN112818946 A CN 112818946A CN 202110250897 A CN202110250897 A CN 202110250897A CN 112818946 A CN112818946 A CN 112818946A
- Authority
- CN
- China
- Prior art keywords
- age
- value
- probability
- identification model
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 91
- 238000000034 method Methods 0.000 title claims abstract description 80
- 230000006870 function Effects 0.000 claims description 54
- 238000002372 labelling Methods 0.000 claims description 32
- 230000015654 memory Effects 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000012544 monitoring process Methods 0.000 abstract description 5
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/178—Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及视频监控技术领域,具体涉及年龄识别模型的训练、年龄识别方法、装置及电子设备,所述训练方法包括获取样本图像以及各个样本图像的标注信息,所述标注信息包括多个年龄标注值及各个年龄维度的概率;将样本图像输入年龄识别模型中,得到多个年龄预测值及各个年龄预测值的概率;根据各个年龄维度的概率、各个年龄预测值的概率、多个年龄标注值及多个年龄预测值进行损失函数的计算,以对年龄识别模型进行训练,确定目标年龄识别模型。利用年龄维度的概率表征标注的差异,后续结合该差异进行年龄识别模型的训练,使得训练得到的目标年龄识别模型能够准确地识别出年龄值,提高了年龄识别的准确率。
Description
技术领域
本发明涉及视频监控技术领域,具体涉及年龄识别模型的训练、年龄识别方法、装置及电子设备。
背景技术
随着深度学习的发展,越来越多针对图像所示属性的识别算法应运而生,其中就有一部分是关于人脸图像中所示年龄属性的研究。现阶段,有一种技术是将年龄的识别视作一个回归问题,即,将真实的人的年龄标签输入深度神经网络中,通过迭代训练方式,用欧式距离损失函数的训练回归出这个真实值。还另外一种通用的方法则是将这种回归问题视为一种分类问题,即,将年龄分为不同的年龄组,例如将真实年龄的0至5岁分为一个年龄组,那么一个包含0至85的年龄集的图像,则可以分为形如[(0,5),(5,10)(10,15),(15,20),(20,30),…,(70,75)(75,80)(80,85)]的年龄组。使用这种分类的年龄组作为标签,通过深度神经网络,使用softmax损失函数的训练则可以学习到图像所示的年龄属于具体哪个年龄组。
上述介绍的现有技术中,在实际的监控安防领域中,直接应用的效果不佳,原因如下:基于欧式距离的方法使用的是图像的全局信息,而在实际的安防场景中,背景过于复杂,会导致过多的背景信息参与计算,导致回归值和真实的年龄标签有一定差距,相对不准确。而基于分类的方法得到的年龄段信息,不适合实际的业务需求,即实际业务需要相对准确的实际年龄信息而非年龄段信息。
发明内容
有鉴于此,本发明实施例提供了一种年龄识别方法、装置及电子设备,以解决年龄识别准确率偏低的问题。
根据第一方面,本发明实施例提供了一种年龄识别模型的训练方法,所述训练方法包括:
获取样本图像以及各个所述样本图像的标注信息,所述标注信息包括真实年龄值及各个年龄维度的概率;
将所述样本图像输入年龄识别模型中,得到多个年龄预测值及各个所述年龄预测值的概率;
根据各个所述年龄维度的概率、各个所述年龄预测值的概率、所述真实年龄值及多个所述年龄预测值进行损失函数的计算,以对所述年龄识别模型进行训练,确定目标年龄识别模型。
本发明实施例提供的年龄识别模型的训练方法,在标注信息中包括真实年龄值及各个年龄维度的概率,利用年龄维度的概率表征标注的差异,后续结合该差异进行年龄识别模型的训练,使得训练得到的目标年龄识别模型能够准确地识别出年龄值,提高了年龄识别的准确率。
结合第一方面,在第一方面第一实施方式中,获取各个所述样本图像的标注信息,包括:
获取同一所述样本图像的多个年龄标注值;
利用所述多个年龄标注值,计算标注年龄的分布信息,以得到所述真实年龄值以及各个所述年龄维度的概率。
本发明实施例提供的年龄识别模型的训练方法,由于年龄标注值带有主观意识,但是多个年龄标注值符合某种分布情况,通过计算标注年龄的分布信息得到各个年龄维度的概率,从而能够保证所得到的各个年龄维度的概率更符合实际情况。
结合第一方面第一实施方式,在第一方面第二实施方式中,所述利用所述多个年龄标注值,计算各个所述年龄标注值的分布信息,以得到所述真实年龄值以及各个所述年龄维度的概率,包括:
计算所述多个年龄标注值的均值以及方差,所述真实年龄值为所述均值;
利用所述均值以及方差计算各个所述年龄维度的高斯权重,得到各个所述年龄维度的概率。
本发明实施例提供的年龄识别模型的训练方法,对各个年龄维度进行高斯权重的计算,即将各个年龄维度拟合为高斯分布,能够尽可能消除人工标注的主观意识对标注结果的影响。
结合第一方面,在第一方面第三实施方式中,所述根据各个所述年龄维度的概率、各个所述年龄预测值的概率、所述真实年龄值及多个所述年龄预测值进行损失函数的计算,以对所述年龄识别模型进行训练,确定目标年龄识别模型,包括:
获取目标年龄预测值,所述目标年龄预测值为最大概率的年龄预测值;
基于各个所述年龄预测值的概率、各个年龄维度的概率、多个年龄预测值以及所述真实年龄值,计算损失函数值;
利用所述损失函数值,调整所述年龄识别模型的参数,确定所述目标年龄识别模型。
本发明实施例提供的年龄识别模型的训练方法,在训练过程中结合年龄预测值的概率,或年龄维度的概率进行损失函数的计算,使得计算得到的损失函数值更能够符合实际情况,提高了损失函数计算的准确性。
结合第一方面第三实施方式,在第一方面第四实施方式中,所述基于各个所述年龄预测值的概率、各个年龄维度的概率、多个年龄预测值以及所述真实年龄值,计算损失函数值,包括:
利用所述目标年龄预测值与所述真实年龄值的差值,确定惩罚系数;
利用各个所述年龄预测值的概率、各个年龄维度的概率、所述惩罚系数、多个年龄预测值以及所述真实年龄值,计算损失函数值。
本发明实施例提供的年龄识别模型的训练方法,由于惩罚系数反应的是目标年龄预测值与真实年龄值的差值,因此通过在损失函数的计算过程中增加惩罚系数,能够加快训练过程,提高训练效率。
结合第一方面第四实施方式,在第一方面第五实施方式中,采用如下公式进行损失函数的计算:
根据第二方面,本发明实施例还提供了一种年龄识别方法,所述识别方法包括:
获取待识别图像;
将所述待识别图像输入目标年龄识别模型中得到多个年龄值及各个所述年龄值的概率,并确定最大概率的年龄值为目标年龄值,所述目标年龄识别模型是根据本发明第一方面,或第一方面任一项实施方式中所述的年龄识别模型的训练方法训练得到的。
本发明实施例提供的年龄识别方法,利用识别准确率较高的目标年龄识别模型进行待识别图像中人脸年龄的识别,可以保证识别的准确性,使得识别出来的年龄值更接近真实值。
根据第三方面,本发明实施例还提供了一种年龄识别模型的训练装置,所述训练装置包括:
第一获取模块,用于获取样本图像以及各个所述样本图像的标注信息,所述标注信息包括真实年龄值及各个年龄维度的概率;
预测模块,用于将所述样本图像输入年龄识别模型中,得到多个年龄预测值及各个所述年龄预测值的概率;
训练模块,用于根据各个所述年龄维度的概率、各个所述年龄预测值的概率、所述真实年龄值及多个所述年龄预测值进行损失函数的计算,以对所述年龄识别模型进行训练,确定目标年龄识别模型。
本发明实施例提供的年龄识别模型的训练装置,在标注信息中包括真实年龄值及各个年龄维度的概率,利用年龄维度的概率表征标注的差异,后续结合该差异进行年龄识别模型的训练,使得训练得到的目标年龄识别模型能够准确地识别出年龄值,提高了年龄识别的准确率。
根据第四方面,本发明实施例还提供了一种年龄识别装置,所述识别装置包括:
第二获取模块,用于获取待识别图像;
识别模块,用于将所述待识别图像输入目标年龄识别模型中得到多个年龄值及各个所述年龄值的概率,并确定最大概率的年龄值为目标年龄值,所述目标年龄识别模型是根据本发明第一方面,或第一方面任一项实施方式中所述的年龄识别模型的训练方法训练得到的。
本发明实施例提供的年龄识别装置,利用识别准确率较高的目标年龄识别模型进行待识别图像中人脸年龄的识别,可以保证识别的准确性,使得识别出来的年龄值更接近真实值。
根据第五方面,本发明实施例提供了一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中所述的年龄识别模型的训练方法,或执行第二方面中所述的年龄识别方法。
根据第六方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行第一方面或者第一方面的任意一种实施方式中所述的年龄识别模型的训练方法,或执行第二方面中所述的年龄识别方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的年龄识别模型的训练方法的流程图;
图2是根据本发明实施例的年龄识别模型的训练方法的流程图;
图3是根据本发明实施例的年龄识别模型的训练方法的流程图;
图4是根据本发明实施例的年龄识别模型的训练示意图;
图5是根据本发明实施例的年龄识别方法的流程图;
图6是根据本发明实施例的年龄识别模型的训练装置的结构框图;
图7是根据本发明实施例的年龄识别装置的结构框图;
图8是本发明实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中的样本图像以及待识别图像均为人脸图像,可以是通过对采集到的包含人脸的图像进行剪裁得到的,也可以是直接采集人脸图像得到的,在此对其并不作任何限制。
根据本发明实施例,提供了一种年龄识别模型的训练方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种年龄识别模型的训练方法,可用于电子设备,如电脑、手机、平板电脑等,图1是根据本发明实施例的年龄识别模型的训练方法的流程图,如图1所示,该流程包括如下步骤:
S11,获取样本图像以及各个样本图像的标注信息。
其中,所述标注信息包括真实年龄值及各个年龄维度的概率。
样本图像可以各种人脸图像,进一步地,为了提高监控场景下的鲁棒性,也可以在获取到的人脸图像的基础上,再生成不同风格的监控背景。例如,可以采用对抗生成网络,生成各种风格的人脸图像等等。在此对其并不做任何限制,具体可以根据实际情况进行相应的设置。可选地,还可以将获取到的图像进行统一的处理,将其分辨率设置为预设的分辨率,例如224*224,以加强训练模型的泛化能力。
对于所收集到的人脸图像,由于并不知道该人的真实年龄,可以通过人工标注的方式预估年龄。但是不同的人有不同的主观认识,为了尽可能消除该主观意识带来的影响,将多人对同一个样本图像的年龄标注值的均值作为真实年龄值,也可以是计算各个年龄标注值在所有年龄标注值中所占的百分比,将百分比最大的年龄标注值确定为真实年龄值。在此对真实年龄值的确定方式并不做任何限定。
在样本图像的标注信息中除了有真实年龄值以外,还有各个年龄维度的概率。所述的年龄维度可以是在真实年龄值的左右设置多个年龄维度,例如,真实年龄值为20,那么可以设置年龄维度为15、16、17、18、19、20、21、22、23、24以及25;也可以是不考虑真实年龄值,将所有样本图像的年龄维度均设置为0-99,即100维。具体地,对应于各个年龄维度均有相应的概率,从而就可以形成样本图像的标注信息。例如,年龄维度0,对应于概率a1;年龄维度1,对应于概率a2;……;年龄维度99,对应于概率a99。相应地,对应于每一个样本图像,均具有上述类型的标注信息。
其中,各个年龄维度的概率计算可以通过对年龄标注值进行统计分析后得到;也可以是在真实年龄值的基础上,人工设置各个年龄维度的概率。
可选地,一个真实年龄为十八岁左右的人拍成的图像,不同的人对该图像有不同的主观猜测,但是都是基于十八岁这个年龄段,或上或下,同时,也很明确一点,尽管不同的人对同一张图像有不同的主观意识,但是把一个十八岁的人的人脸图像去让不同的人进行识别,把该图认为六十岁的人的概率近乎为零。因此,在确定各个年龄维度的概率时还应该结合到年龄的分布情况。
关于该步骤具体将在下文中进行详细描述。
S12,将样本图像输入年龄识别模型中,得到多个年龄预测值及各个年龄预测值的概率。
所述的年龄识别模型用于对输入的样本图像进行特征提取,得到多个年龄预测值及各个年龄预测值的概率。所述的年龄识别模型可以是基于卷积神经网络构建的,也可以是基于其他类型的神经网络构建的,在此对年龄识别模型的具体网络结构并不做任何限制,具体可以根据实际情况进行相应的设置。
例如,可以选取ResNet、VGG、MobileNet等经典卷积神经网络中的任意一个作为年龄识别模型的主干网络,即backbone,在本发明实施例中,该backbone的作用是用来提取输入的人脸图像的特征。考虑到年龄识别更需要网络底层的信息,因此可以使用backbone前几层进行特征提取,然后使用全连接层,并在全连接层后加入后续步骤的处理进行迭代训练,得到模型。在推理时,则直接使用全连接层的输出作为预测年龄值。
其中,年龄识别模型所输出的年龄预测值的数量也是可以根据实际情况进行相应的设置,在此对其并不做任何限制。例如,可以输出10个年龄预测值,也可以输出5个年龄预测值,也可以输出100个年龄预测值。
在本实施例中,以年龄识别模型输出100个年龄预测值为例。具体地,年龄识别模型输出0-99之间的100个年龄预测值,以及各个年龄预测值的概率。
S13,根据各个年龄维度的概率、各个年龄预测值的概率、真实年龄值及多个年龄预测值进行损失函数的计算,以对年龄识别模型进行训练,确定目标年龄识别模型。
电子设备在得到各个年龄维度的概率,以及各个年龄标注值及其概率之后,就可以在此基础上进行损失函数的计算。例如,可以采用欧式距离的方式计算损失函数值,也可以采用其他方式计算损失函数值等等。可选地,在进行损失函数的计算过程中还可以结合惩罚系数进行,所述的惩罚系数用于表示年龄预测值与真实年龄值之间的差值。具体地,年龄预测值与真实年龄值之间的差值越大,惩罚系数越大;年龄预测值与真实年龄值之间的差值越小,惩罚系数越小。在此对损失函数的计算并不做任何限制,具体可以根据实际情况进行相应的设置。
例如,可以将各个概率作为对应年龄的权重,计算各个权重与年龄的乘积,在此基础上进行损失函数的计算。
电子设备在得到损失函数值之后,可以通过反向传播的方式对年龄识别模型进行训练,进而确定目标年龄识别模型。其中,训练的停止条件可以是设置迭代次数,也可以是设置损失函数的阈值等等。
关于该步骤具体将在下文中进行详细描述。
本实施例提供的年龄识别模型的训练方法,在标注信息中包括真实年龄值及各个年龄维度的概率,利用年龄维度的概率表征标注的差异,后续结合该差异进行年龄识别模型的训练,使得训练得到的目标年龄识别模型能够准确地识别出年龄值,提高了年龄识别的准确率。
在本实施例中提供了一种年龄识别模型的训练方法,可用于电子设备,如电脑、手机、平板电脑等,图2是根据本发明实施例的年龄识别模型的训练方法的流程图,如图2所示,该流程包括如下步骤:
S21,获取样本图像以及各个样本图像的标注信息。
其中,所述标注信息包括真实年龄值及各个年龄维度的概率。
具体地,上述S21可以包括如下步骤:
S211,获取样本图像。
电子设备获取样本图像的方式可以参见上文实施例S11中的相关描述,在此不再赘述。
S212,获取同一样本图像的多个年龄标注值。
多个年龄标注值可以是多个对同一样本图像进行年龄标注得到的,也可以是通过其他方式标注得到的,在此对其并不做任何限制。
S213,利用多个年龄标注值,计算标注年龄的分布信息,以得到真实年龄值以及各个年龄维度的概率。
如上文所述,虽然不同的人对同一样本图像进行标注可以得到不同的年龄标注值,但是所得到的年龄标注值还是符合某种分布。例如,正态分布、高斯分布等等。
电子设备可以在多个年龄标注值的基础上计算其分布信息,得到各个年龄维度的概率。所述的分布信息,可以基于正态分布,计算各个年龄标注值的正态权重;也可以基于高斯分布,计算各个年龄维度的高斯权重。
在本实施例的一些可选实施方式中,上述S213可以包括如下步骤:
(1)计算多个年龄标注值的均值以及方差,所述真实年龄值为所述均值。
在本实施例中,将多个年龄标注值拟合为符合高斯分布。但是若统一使用标准的高斯分布均值和方差,则与多人不同的主观意识不符,因此需要对多人标注得到的年龄标注值进行进一步处理。其中,进一步处理的预期结果是,如果送入年龄识别模型的真实年龄标签为十八岁,则年龄识别模型的回归至为18岁,则认为模型预测的对的概率几乎为100%;反之,如果送至模型的真实年龄标签为18岁,模型预测的预测值为60岁,则认为模型预测对的概率几乎为0。
基于此,电子设备先计算多个年龄标注值的均值以及方差,再在此基础上。例如,同一张图像,由10人进行标注,第1~10人分别将其标注为21岁、25岁、26岁、24岁、26岁、22岁、24岁、23岁、24岁、23岁,则此张图像的标注时的均值为23.8,方差为2.36。由此就可以确定,该图像对应的真实年龄值为23.8。
(2)利用均值以及方差计算各个年龄维度的高斯权重,得到各个年龄维度的概率。
电子设备在得到均值以及方差之后,就可以在此基础上计算每个年龄维度的概率,所述的概率即为每个年龄维度的高斯权重。
具体地,在本实施例中,将多个年龄标注值的均值作为样本图像对应的真实年龄值。电子设备采用公式(1),得到各个年龄维度的概率:
labelmean=(label1+label2+label3+...+labeln)/n
labelage=fgaussi(labelmean) (1)
其中,labelmean表示最终送到年龄识别网络的真实年龄值,labeln表示不同的人对该张人脸图像的预估年龄,labelage表示各个年龄维度的概率,该标签为100维的年龄概率(此处100为是模仿人的年龄值是0-99岁,其中0表示未知年龄),fgaussi表示高斯分布函数。
高斯权重的计算方式可以如公式(2)所示:
其中,σ表示每张样本图像多人标注的标准差,u为多个标注的均值,x为各个年龄维度。
结合上述的示例,由公式(2)可以计算得到年龄为24时的维度的概率为0.9974,年龄为23和25时的概率为0.9933,其他维度的概率也可以以此计算得到。
对各个年龄维度进行高斯权重的计算,即将各个年龄维度拟合为高斯分布,能够尽可能消除人工标注的主观意识对标注结果的影响。
S22,将样本图像输入年龄识别模型中,得到多个年龄预测值及各个年龄预测值的概率。
详细请参见图1所示实施例的S12,在此不再赘述。
S23,根据各个年龄维度的概率、各个年龄预测值的概率、真实年龄值及多个年龄预测值进行损失函数的计算,以对年龄识别模型进行训练,确定目标年龄识别模型。
详细请参见图1所示实施例的S13,在此不再赘述。
本实施例提供的年龄识别模型的训练方法,由于年龄标注值带有主观意识,但是多个年龄标注值符合某种分布情况,通过计算标注年龄的分布信息得到各个年龄维度的概率,从而能够保证所得到的各个年龄维度的概率更符合实际情况。
在本实施例中提供了一种年龄识别模型的训练方法,可用于电子设备,如电脑、手机、平板电脑等,图3是根据本发明实施例的年龄识别模型的训练方法的流程图,如图3所示,该流程包括如下步骤:
S31,获取样本图像以及各个样本图像的标注信息。
其中,所述标注信息包括真实年龄值及各个年龄维度的概率。
详细请参见图2所示实施例的S21,在此不再赘述。
S32,将样本图像输入年龄识别模型中,得到多个年龄预测值及各个年龄预测值的概率。
详细请参见图1所示实施例的S12,在此不再赘述。
S33,根据各个年龄维度的概率、各个年龄预测值的概率、真实年龄值及多个年龄预测值进行损失函数的计算,以对年龄识别模型进行训练,确定目标年龄识别模型。
具体地,上述S33可以包括如下步骤:
S331,获取目标年龄预测值。
其中,所述目标年龄预测值为最大概率的年龄预测值。
电子设备在得到多个年龄预测值之后,比较各个年龄预测值对应的概率,将最大概率的年龄预测值确定为目标年龄预测值。
S332,基于各个年龄预测值的概率、各个年龄维度的概率、多个年龄预测值以及真实年龄值,计算损失函数值。
电子设备可以在欧式距离计算的基础上,结合各个年龄预测值的概率以及各个年龄维度的概率,计算损失函数值。
例如,可以先计算各个年龄预测值与真实年龄差值的平方,在此基础上在将各个年龄预测值或年龄维度的概率作为权重,乘以差值平方的结果;再将对应于各个年龄预测值的计算结果进行求和,就可以得到损失函数值。
在本实施例的一些可选实施方式中,上述S332可以包括如下步骤:
(1)利用目标年龄预测值与真实年龄值的差值,确定惩罚系数。
在本实施例中对损失函数进行改进,具体地,若使用欧式距离进行回归,则是回归一个模型的输入值,并没有考虑到任何应用背景,但是对于年龄的预测,如果真实年龄是十八岁,预测结果为六十或二十,除了考虑上述的高斯权重外,还应该考虑真实年龄与预测年龄值之间的差值。即,预测为六十的误差更大。
如上文所述,目标年龄预测值为最大概率的年龄预测值。电子设备将目标年龄预测值与真实年龄值的差值作为惩罚系数。
(2)利用各个年龄预测值的概率、各个年龄维度的概率、惩罚系数、多个年龄预测值以及真实年龄值,计算损失函数值。
具体地,采用如下公式进行损失函数的计算:
其中,Ek为第K次迭代后的损失函数值,α为惩罚系数,为第k次迭代的所述目标年龄预测值,y为所述真实年龄值,l为所述年龄预测值的数量,Wj为第j个所述年龄预测值的概率或第j个所述年龄维度的概率。在迭代开始时,可以采用年龄维度的概率进行损失函数的计算,在后续的迭代过程中再采用各个圆领预测值的概率进行损失函数的计算。
由于惩罚系数反应的是目标年龄预测值与真实年龄值的差值,因此通过在损失函数的计算过程中增加惩罚系数,能够加快训练过程,提高训练效率。
S333,利用损失函数值,调整年龄识别模型的参数,确定目标年龄识别模型。
电子设备在计算得到损失函数值之后,就可以在此基础上调整年龄识别模型的参数,进而确定目标年龄识别模型。
本实施例提供的年龄识别模型的训练方法,在训练过程中结合年龄预测值的概率,或年龄维度的概率进行损失函数的计算,使得计算得到的损失函数值更能够符合实际情况,提高了损失函数计算的准确性。
作为本实施例的一个具体实施方式,如图4所示,所述的年龄识别模型的训练方法,包括:
获取样本图像的标注信息,所述的标注信息是对预估年龄标签进行预处理后得到的;然后再基于高斯核生成年龄权重,即得到各个年龄维度的概率。
进一步地,将人脸图像输入到年龄识别模型中,利用年龄识别模型的特征提取主干网络进行预测,得到多个年龄预测值以及各个年龄预测值的概率;在此基础上,结合标注信息进行损失函数的计算,进而利用计算得到的损失函数值对年龄识别模型进行训练,确定目标年龄识别模型。
其中,表1示出了使用欧式距离的年龄预测值和本发明实施例中的年龄预测值的对比:
表1欧式距离的年龄预测值和本发明实施例中的年龄预测值的对比
由表1可知,年龄标注值,即经过公式(1)计算后得到的标注是36岁,在无任何处理的情况下,使用欧式距离进行训练,得到的年龄是39岁,与标注年龄的误差是3岁,而使用本发明实施例提供的方法,得到的年龄值为35岁,与标注年龄段误差则仅为1岁。同理,使用欧氏距离进行训练,得到的年龄误差为3岁和5岁,而使用本发明实施例提供的方法误差为0岁和2岁,在其他类似的人脸图像上也可以得到该不失一般性的结论。
根据本发明实施例,提供了一种年龄识别方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种年龄识别方法,可用于电子设备,如电脑、手机、平板电脑等,图5是根据本发明实施例的年龄识别模型的训练方法的流程图,如图5所示,该流程包括如下步骤:
S41,获取待识别图像。
所述的待识别图像可以是电子设备从外界获取到的,也可以是事先存储在电子设备中的,在此对待识别图像的来源并不做任何限制。例如,第三方图像采集设备采集到包含人脸的待识别图像,并将采集到的待识别图像发送给电子设备;相应地,电子设备就能够获取到该待识别图像。
S42,将待识别图像输入目标年龄识别模型中得到多个年龄值及各个年龄值的概率,并确定最大概率的年龄值为目标年龄值。
其中,所述目标年龄识别模型是根据上述任一项实施方式中所述的年龄识别模型的训练方法训练得到的。
电子设备在获取到待识别图像之后,将其输入目标年龄识别模型中,所述的目标年龄识别模型输出多个年龄值及各个年龄值的概率。例如,电子设备输出的100个年龄值以及各个年龄对应的概率,年龄值为0-99。
进一步地,电子设备将概率最大的年龄值确定为待识别图像对应的目标年龄值。
关于年龄识别模型的训练过程请参见上文实施例所述,在此不再赘述。
本实施例提供的年龄识别方法,利用识别准确率较高的目标年龄识别模型进行待识别图像中人脸年龄的识别,可以保证识别的准确性,使得识别出来的年龄值更接近真实值。
在本实施例中还提供了一种年龄识别模型的训练装置,或年龄识别装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种年龄识别模型的训练装置,如图6所示,包括:
第一获取模块51,用于获取样本图像以及各个所述样本图像的标注信息,所述标注信息包括真实年龄值及各个年龄维度的概率;
预测模块52,用于将所述样本图像输入年龄识别模型中,得到多个年龄预测值及各个所述年龄预测值的概率;
训练模块53,用于根据各个年龄维度的概率、各个年龄预测值的概率、真实年龄值及多个年龄预测值进行损失函数的计算,以对年龄识别模型进行训练,确定目标年龄识别模型。
本实施例提供的年龄识别模型的训练装置,在标注信息中包括真实年龄值及各个年龄维度的概率,利用年龄维度的概率表征标注的差异,后续结合该差异进行年龄识别模型的训练,使得训练得到的目标年龄识别模型能够准确地识别出年龄值,提高了年龄识别的准确率。
本实施例提供一种年龄识别装置,如图7所示,包括:
第二获取模块61,用于获取待识别图像;
识别模块62,用于将所述待识别图像输入目标年龄识别模型中得到多个年龄值及各个所述年龄值的概率,并确定最大概率的年龄值为目标年龄值,所述目标年龄识别模型是根据本发明上述任一项实施方式中所述的年龄识别模型的训练方法训练得到的。
本实施例提供的年龄识别装置,利用识别准确率较高的目标年龄识别模型进行待识别图像中人脸年龄的识别,可以保证识别的准确性,使得识别出来的年龄值更接近真实值。
本实施例中的年龄识别模型的训练装置,以及年龄识别装置是以功能单元的形式来呈现,这里的单元是指ASIC电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
上述各个模块的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本发明实施例还提供一种电子设备,具有上述图6所示的年龄识别模型的训练装置,或图7所示的年龄识别装置。
请参阅图8,图8是本发明可选实施例提供的一种电子设备的结构示意图,如图8所示,该电子设备可以包括:至少一个处理器71,例如CPU(Central Processing Unit,中央处理器),至少一个通信接口73,存储器74,至少一个通信总线72。其中,通信总线72用于实现这些组件之间的连接通信。其中,通信接口73可以包括显示屏(Display)、键盘(Keyboard),可选通信接口73还可以包括标准的有线接口、无线接口。存储器74可以是高速RAM存储器(Random Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器74可选的还可以是至少一个位于远离前述处理器71的存储装置。其中处理器71可以结合图6或图7所描述的装置,存储器74中存储应用程序,且处理器71调用存储器74中存储的程序代码,以用于执行上述任一方法步骤。
其中,通信总线72可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。通信总线72可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器74可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器74还可以包括上述种类的存储器的组合。
其中,处理器71可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。
其中,处理器71还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic arraylogic,缩写:GAL)或其任意组合。
可选地,存储器74还用于存储程序指令。处理器71可以调用程序指令,实现如本申请图1至3实施例中所示的年龄识别模型的训练方法,或图5实施例中所示的年龄识别方法。
本发明实施例还提供了一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的年龄识别模型的训练方法或年龄识别方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(FlashMemory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (11)
1.一种年龄识别模型的训练方法,其特征在于,所述训练方法包括:
获取样本图像以及各个所述样本图像的标注信息,所述标注信息包括真实年龄值及各个年龄维度的概率;
将所述样本图像输入年龄识别模型中,得到多个年龄预测值及各个所述年龄预测值的概率;
根据各个所述年龄维度的概率、各个所述年龄预测值的概率、所述真实年龄值及多个所述年龄预测值进行损失函数的计算,以对所述年龄识别模型进行训练,确定目标年龄识别模型。
2.根据权利要求1所述的训练方法,其特征在于,获取各个所述样本图像的标注信息,包括:
获取同一所述样本图像的多个年龄标注值;
利用所述多个年龄标注值,计算标注年龄的分布信息,以得到所述真实年龄值以及各个所述年龄维度的概率。
3.根据权利要求2所述的训练方法,其特征在于,所述利用所述多个年龄标注值,计算各个所述年龄标注值的分布信息,以得到所述真实年龄值以及各个所述年龄维度的概率,包括:
计算所述多个年龄标注值的均值以及方差,所述真实年龄值为所述均值;
利用所述均值以及方差计算各个所述年龄维度的高斯权重,得到各个所述年龄维度的概率。
4.根据权利要求1所述的训练方法,其特征在于,所述根据各个所述年龄维度的概率、各个所述年龄预测值的概率、所述真实年龄值及多个所述年龄预测值进行损失函数的计算,以对所述年龄识别模型进行训练,确定目标年龄识别模型,包括:
获取目标年龄预测值,所述目标年龄预测值为最大概率的年龄预测值;
基于各个所述年龄预测值的概率、各个年龄维度的概率、多个年龄预测值以及所述真实年龄值,计算损失函数值;
利用所述损失函数值,调整所述年龄识别模型的参数,确定所述目标年龄识别模型。
5.根据权利要求4所述的训练方法,其特征在于,所述基于各个所述年龄预测值的概率、各个年龄维度的概率、多个年龄预测值以及所述真实年龄值,计算损失函数值,包括:
利用所述目标年龄预测值与所述真实年龄值的差值,确定惩罚系数;
利用各个所述年龄预测值的概率、各个年龄维度的概率、所述惩罚系数、多个年龄预测值以及所述真实年龄值,计算损失函数值。
7.一种年龄识别方法,其特征在于,所述识别方法包括:
获取待识别图像;
将所述待识别图像输入目标年龄识别模型中得到多个年龄值及各个所述年龄值的概率,并确定最大概率的年龄值为目标年龄值,所述目标年龄识别模型是根据权利要求1-6中任一项所述的年龄识别模型的训练方法训练得到的。
8.一种年龄识别模型的训练装置,其特征在于,所述训练装置包括:
第一获取模块,用于获取样本图像以及各个所述样本图像的标注信息,所述标注信息包括真实年龄值及各个年龄维度的概率;
预测模块,用于将所述样本图像输入年龄识别模型中,得到多个年龄预测值及各个所述年龄预测值的概率;
训练模块,用于根据各个所述年龄维度的概率、各个所述年龄预测值的概率、所述真实年龄值及多个所述年龄预测值进行损失函数的计算,以对所述年龄识别模型进行训练,确定目标年龄识别模型。
9.一种年龄识别装置,其特征在于,所述识别装置包括:
第二获取模块,用于获取待识别图像;
识别模块,用于将所述待识别图像输入目标年龄识别模型中得到多个年龄值及各个所述年龄值的概率,并确定最大概率的年龄值为目标年龄值,所述目标年龄识别模型是根据权利要求1-6中任一项所述的年龄识别模型的训练方法训练得到的。
10.一种电子设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-6中任一项所述的年龄识别模型的训练方法,或执行权利要求7所述的年龄识别方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行权利要求1-6中任一项所述的年龄识别模型的训练方法,或执行权利要求7所述的年龄识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110250897.3A CN112818946A (zh) | 2021-03-08 | 2021-03-08 | 年龄识别模型的训练、年龄识别方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110250897.3A CN112818946A (zh) | 2021-03-08 | 2021-03-08 | 年龄识别模型的训练、年龄识别方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112818946A true CN112818946A (zh) | 2021-05-18 |
Family
ID=75862986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110250897.3A Pending CN112818946A (zh) | 2021-03-08 | 2021-03-08 | 年龄识别模型的训练、年龄识别方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112818946A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113456031A (zh) * | 2021-08-09 | 2021-10-01 | 首都医科大学附属北京天坛医院 | 一种脑状态预测模型的训练装置、预测装置及电子设备 |
CN113780454A (zh) * | 2021-09-17 | 2021-12-10 | 平安科技(深圳)有限公司 | 模型训练及调用方法、装置、计算机设备、存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399813A (zh) * | 2019-07-10 | 2019-11-01 | 深兰科技(上海)有限公司 | 一种年龄识别方法、装置、电子设备及存储介质 |
CN112085000A (zh) * | 2020-09-21 | 2020-12-15 | 北京金山云网络技术有限公司 | 年龄识别方法、年龄识别模型的训练方法及装置 |
-
2021
- 2021-03-08 CN CN202110250897.3A patent/CN112818946A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110399813A (zh) * | 2019-07-10 | 2019-11-01 | 深兰科技(上海)有限公司 | 一种年龄识别方法、装置、电子设备及存储介质 |
CN112085000A (zh) * | 2020-09-21 | 2020-12-15 | 北京金山云网络技术有限公司 | 年龄识别方法、年龄识别模型的训练方法及装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113456031A (zh) * | 2021-08-09 | 2021-10-01 | 首都医科大学附属北京天坛医院 | 一种脑状态预测模型的训练装置、预测装置及电子设备 |
CN113780454A (zh) * | 2021-09-17 | 2021-12-10 | 平安科技(深圳)有限公司 | 模型训练及调用方法、装置、计算机设备、存储介质 |
CN113780454B (zh) * | 2021-09-17 | 2023-10-24 | 平安科技(深圳)有限公司 | 模型训练及调用方法、装置、计算机设备、存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229509B (zh) | 用于识别物体类别的方法及装置、电子设备 | |
CN110020592B (zh) | 物体检测模型训练方法、装置、计算机设备及存储介质 | |
CN110472675B (zh) | 图像分类方法、图像分类装置、存储介质与电子设备 | |
CN110909618B (zh) | 一种宠物身份的识别方法及装置 | |
CN108564102A (zh) | 图像聚类结果评价方法和装置 | |
CN110135505B (zh) | 图像分类方法、装置、计算机设备及计算机可读存储介质 | |
CN111753863A (zh) | 一种图像分类方法、装置、电子设备及存储介质 | |
CN110928862A (zh) | 数据清洗方法、数据清洗设备以及计算机存储介质 | |
CN109271957B (zh) | 人脸性别识别方法以及装置 | |
US20240087368A1 (en) | Companion animal life management system and method therefor | |
WO2024060684A1 (zh) | 模型训练方法、图像处理方法、设备及存储介质 | |
CN115034315B (zh) | 基于人工智能的业务处理方法、装置、计算机设备及介质 | |
CN108509994B (zh) | 人物图像聚类方法和装置 | |
CN113869449A (zh) | 一种模型训练、图像处理方法、装置、设备及存储介质 | |
CN113780145A (zh) | 精子形态检测方法、装置、计算机设备和存储介质 | |
CN111401343B (zh) | 识别图像中人的属性的方法、识别模型的训练方法和装置 | |
CN111340213A (zh) | 神经网络的训练方法、电子设备、存储介质 | |
CN112818946A (zh) | 年龄识别模型的训练、年龄识别方法、装置及电子设备 | |
CN116434051A (zh) | 一种输电线路异物检测方法、系统及存储介质 | |
CN113011532A (zh) | 分类模型训练方法、装置、计算设备及存储介质 | |
CN112991280A (zh) | 视觉检测方法、系统及电子设备 | |
CN110210314B (zh) | 人脸检测方法、装置、计算机设备及存储介质 | |
CN111915595A (zh) | 图像质量评价方法、图像质量评价模型的训练方法和装置 | |
CN114120454A (zh) | 活体检测模型的训练方法、装置、电子设备及存储介质 | |
CN112668710B (zh) | 模型训练、管状物提取、数据识别方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210518 |