CN109034078B

CN109034078B - 年龄识别模型的训练方法、年龄识别方法及相关设备

Info

Publication number: CN109034078B
Application number: CN201810864567.1A
Authority: CN
Inventors: 葛彦昊; 李季檩; 汪铖杰; 黄飞跃; 吴永坚; 黄小明; 梁小龙; 晏轶超; 贺珂珂
Original assignee: Tencent Technology Shenzhen Co Ltd; Tencent Cloud Computing Beijing Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd; Tencent Cloud Computing Beijing Co Ltd
Priority date: 2018-08-01
Filing date: 2018-08-01
Publication date: 2023-07-14
Anticipated expiration: 2038-08-01
Also published as: CN109034078A

Abstract

本申请涉及一种年龄识别模型的训练方法，该方法包括：获取包含有人脸的训练图像集，将训练图像集中的训练图像作为年龄识别模型的输入，获取年龄识别模型输出的各个训练图像中的人脸对应的预测年龄值，根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄，根据统计预测年龄和对应的标注年龄值计算得到年龄统计误差值，根据年龄统计误差值对年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。该年龄识别模型的训练方法提高了年龄识别的准确度。此外，还提出了一种年龄识别模型的训练装置、年龄识别方法、装置、计算机设备及存储介质。

Description

年龄识别模型的训练方法、年龄识别方法及相关设备

技术领域

本申请涉及计算机处理技术领域，特别是涉及一种年龄识别模型的训练方法、年龄识别方法及相关设备。

背景技术

年龄识别是指通过人脸图像对人的年龄进行识别。传统的年龄识别模型往往只能对年龄跨度比较小的场景进行年龄识别，在年龄跨度比较大的场景下(比如，监控场景)，对于某些年龄段的识别效果比较差。

发明内容

基于此，有必要针对上述问题，提出了一种对各个年龄段识别准确度高的年龄识别模型的训练方法、装置、计算机设备及存储介质、年龄识别方法、装置、计算机设备及存储介质。

一种年龄识别模型的训练方法，所述方法包括：

获取包含有人脸的训练图像集，所述训练图像集中的各个训练图像中的人脸存在对应的标注年龄值；

将所述训练图像集中的训练图像作为年龄识别模型的输入，获取所述年龄识别模型输出的各个训练图像中的人脸对应的预测年龄值；

根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄；

根据所述统计预测年龄和对应的标注年龄值计算得到年龄统计误差值；

根据所述年龄统计误差值对所述年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。

一种年龄识别模型的训练装置，所述装置包括：

图像集获取模块，用于获取包含有人脸的训练图像集，所述训练图像集中的各个训练图像中的人脸存在对应的标注年龄值；

训练输入输出模块，用于将所述训练图像集中的训练图像作为年龄识别模型的输入，获取所述年龄识别模型输出的各个训练图像中的人脸对应的预测年龄值；

第一计算模块，用于根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄；

第二计算模块，用于根据所述统计预测年龄和对应的标注年龄值计算得到年龄统计误差值；

调整模块，用于根据所述年龄统计误差值对所述年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：

一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行以下步骤：

上述年龄识别模型的训练方法、装置、计算机设备及存储介质，根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值计算得到与各个标注年龄值对应的统计预测年龄，然后采用统计预测年龄和对应的标注年龄值计算得到年龄统计误差值，进而根据年龄统计误差值对年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。通过采用创新性的年龄统计误差值对年龄识别模型进行训练，得到的目标年龄识别模型，即使在年龄段不可控的场景下，对处于各个年龄段的人脸都能够得到准确度比较高的识别效果。

一种年龄识别方法，所述方法包括：

获取包含有人脸的待识别图像；

将所述待识别图像作为年龄识别模型的输入，所述年龄识别模型采用年龄统计误差值作为误差度量标准，所述年龄统计误差值是根据标注年龄值和对应于同一标注年龄值的多个训练图像中的人脸对应的预测年龄值进行统计计算得到的；

获取所述年龄识别模型输出的与所述待识别图像中的人脸对应的年龄值。

一种年龄识别装置，所述装置包括：

待识别图像获取模块，用于获取包含有人脸的待识别图像；

输入模块，用于将所述待识别图像作为年龄识别模型的输入，所述年龄识别模型采用年龄统计误差值作为误差度量标准，所述年龄统计误差值是根据标注年龄值和对应于同一标注年龄值的多个训练图像中的人脸对应的预测年龄值进行统计计算得到的；

输出模块，用于获取所述已训练的年龄识别模型输出的与所述待识别图像中的人脸对应的年龄值。

获取包含有人脸的待识别图像；

上述年龄识别方法、装置、计算机设备及存储介质，通过获取包含有人脸的待识别图像，将待识别图像作为年龄识别模型的输入，然后获取年龄识别模型输出的与待识别图像中的人脸对应的年龄。其中，年龄识别模型是采用年龄统计误差值作为误差度量标准进行训练得到的，年龄统计误差值是根据标注年龄值和对应于同一标注年龄值的多个训练图像中的人脸对应的预测年龄值进行统计计算得到的，通过采用创新性的年龄统计误差值作为误差度量标准对年龄识别模型进行训练，能够提高年龄识别模型对各个年龄段的预测准确度，在年龄段不可控的场景下，对处于各个年龄段的人脸都能够得到准确度比较高的识别效果。

附图说明

图1为一个实施例中年龄识别方法的应用环境图；

图2为一个实施例中年龄识别模型的训练方法流程图；

图3为一个实施例中随机擦除前后的示意图；

图4为一个实施例中随机模糊前后的示意图；

图5为一个实施例中超分辨率处理前后的示意图；

图6为一个实施例中不同角度的人脸图像的示意图；

图7为一个实施例中年龄识别方法的流程图；

图8为一个实施例中识别出人脸年龄的示意图；

图9A为一个实施例中监控场景下的人脸识别的示意图；

图9B为一个实施例中监控场景下的多张人脸识别效果的示意图；

图10为一个实施例中年龄识别模型的结构示意图；

图11为一个实施例中年龄识别模型应用的架构图；

图12为一个实施例中统计得到的年龄分布的示意图；

图13为另一个实施例中年龄识别方法的流程图；

图14为一个实施例中年龄识别模型的训练装置的结构框图；

图15为另一个实施例中年龄识别模型的训练装置的结构框图；

图16为一个实施例中年龄识别装置的结构框图；

图17为另一个实施例中年龄识别装置的结构框图；

图18为一个实施例中计算机设备的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

图1为一个实施例中年龄识别模型的训练方法的应用环境图。参照图1，该年龄识别方法应用于年龄识别模型的训练系统。该年龄识别模型的训练系统包括终端110和服务器120。终端110和服务器120通过网络连接，终端110具体可以是台式终端或移动终端，移动终端具体可以是手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。终端110用于将包含有人脸的训练图像集上传到服务器120，服务器120用于获取包含有人脸的训练图像集，训练图像集中的各个训练图像中的人脸存在对应的标注年龄值，将训练图像集中的训练图像作为年龄识别模型的输入，获取年龄识别模型输出的各个训练图像中的人脸对应的预测年龄值，根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄，根据统计预测年龄和对应的标注年龄值计算得到年龄统计误差值，根据年龄统计误差值对年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。

在另一个实施例中，上述年龄识别方法可以直接应用于终端110，终端110用于获取包含有人脸的训练图像集，训练图像集中的各个训练图像中的人脸存在对应的标注年龄值，将训练图像集中的训练图像作为年龄识别模型的输入，获取年龄识别模型输出的各个训练图像中的人脸对应的预测年龄值，根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄，根据统计预测年龄和对应的标注年龄值计算得到年龄统计误差值，根据年龄统计误差值对年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。

如图2所示，在一个实施例中，提供了一种年龄识别模型的训练方法，该方法既可以应用于终端，也可以应用于服务器，本实施例以应用于终端举例说明。该年龄识别模型的训练方法具体包括如下步骤：

步骤S202，获取包含有人脸的训练图像集，训练图像集中的各个训练图像中的人脸存在对应的标注年龄值。

其中，训练图像集是指对模型进行训练需要用到的图像的集合。为了对年龄识别模型进行训练，需要采用包含有人脸的训练图像对年龄识别模型进行训练。训练图像集中的训练图像中包含的人脸都对应有相应的年龄标注，即训练标签。

步骤S204，将训练图像集中的训练图像作为年龄识别模型的输入，获取年龄识别模型输出的各个训练图像中的人脸对应的预测年龄值。

其中，预测年龄值是年龄识别模型预测得到的年龄值。通过将训练图像作为年龄识别模型的输入，然后获取年龄识别模型输出的与训练图像中的人脸对应的预测年龄值，便于后续根据预测年龄值与相应的标注年龄值之间的差距来对年龄识别模型中的参数进行调整，以使得年龄识别模型朝着更加准确的方向进行优化。

步骤S206，根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄。

其中，标注年龄值是指期望年龄识别模型输出的年龄值。每个训练图像中的人脸都对应有相应的标注年龄值。将对应于同一标注年龄值的训练图像作为一个集合。然后获取该集合中每个训练图像对应的预测年龄值。为了进行区分，将对应于同一标注年龄值的训练图像称为“目标训练图像”。

获取到同一标注年龄对应的各个目标训练图像中的人脸对应的预测年龄值后，根据各个目标训练图像对应的预测年龄计算得到与该标注年龄对应的统计预测年龄。在一个实施例中，统计预测年龄是根据各个目标训练图像对应的预测年龄值的平均值计算得到的。在另一个实施例中，统计预测年龄是根据各个目标训练图像对应的预测年龄值的中值计算得到的。举个例子，假设对应于同一标注年龄值(比如，25岁)的目标训练图像有5个，这5个目标训练图像对应的预测年龄值分别为：19岁、24岁、26岁、28岁、32岁。如果采用平均值计算，那么对应的统计预测年龄为：(19+24+26+28+32)/5＝25.8岁。如果采用中值计算，即取处于中间位置的年龄，那么对应的统计年龄为26岁，如果处于中间位置有两个，则取两个数值的平均。

步骤S208，根据统计预测年龄和对应的标注年龄值计算得到年龄统计误差值。

其中，年龄统计误差值是根据统计预测年龄和对应的标注年龄值计算得到的，是用来衡量统计预测年龄与对应的标注年龄值之间的误差的标准。

步骤S210，根据年龄统计误差值对年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。

其中，计算得到年龄统计误差值后，根据年龄统计误差值对年龄识别模型中的参数进行调整。然后对调整后的年龄识别模型通过重复上述步骤继续训练，直到满足收敛条件，得到目标年龄识别模型。目标年龄识别模型即是已训练的年龄识别模型。在一个实施例中，收敛条件是预先设置的用于衡量年龄统计误差值的阈值，直到计算得到的年龄统计误差值小于该设置的阈值时，即说明年龄识别模型训练完成。

在一个实施例中，年龄统计误差函数可以表示为：

其中，Gt表示标注年龄，Val表示预测得到预测年龄，Mean(Val)是指对应于标注年龄的统计预测年龄，统计预测年龄是根据对应于同一标注年龄的多个预测年龄计算得到的。N表示当前迭代轮次进入模型的标注年龄的数目，比如，假设当前迭代轮次中存在60个不同的标注年龄，则N＝60。通过采用创新性的年龄统计误差值作为误差度量标准能够解决训练样本年龄分布不均衡导致预测准确度低的问题，从而提高了年龄识别的准确度。

上述年龄识别模型的训练方法，根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值计算得到与各个标注年龄值对应的统计预测年龄，然后采用统计预测年龄和对应的标注年龄值计算得到年龄统计误差值，进而根据年龄统计误差值对年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。通过采用创新性的年龄统计误差值对年龄识别模型进行训练，得到的目标年龄识别模型，即使在年龄段不可控的场景下，对处于各个年龄段的人脸都能够得到准确度比较高的识别效果。

在一个实施例中，获取包含有人脸的训练图像集之后，还包括：对训练图像集中的训练图像进行增强处理，得到增强处理后的训练图像，增强处理包括：随机擦除、随机模糊、超分辨率处理中的至少一种；将训练图像集中的训练图像作为年龄识别模型的输入，包括：将增强处理后的训练图像作为年龄识别模型的输入。

其中，为了提高年龄识别模型的泛化性，引入数据增强方式对训练图像集中的训练图像进行增强处理。增加处理包括：随机擦除、随机模糊、超分辨率处理中的至少一种。随机擦除是指随机将训练图像中的某一位置进行擦除，便于后续在遮挡的情况下仍然能够实现对包含的人脸进行年龄的准确识别。随机模糊是指将训练图像进行模糊处理，便于后续在图像模糊的情况下仍然能够对包含的人脸进行年龄的准确识别。超分辨率处理是指将训练图像进行超分辨率处理得到相对清晰的图像，然后作为训练图像进行训练，即作为辅助来提高年龄识别模型的泛化性。

通过增强处理可以增加训练图像的多样性。在训练的过程中，将增强处理前的训练图像和增强处理后的训练图像都作为训练模型的训练样本，从而提高训练得到的年龄识别模型的准确度。通过引入增强处理方式，可以分别针对解决在人脸光照条件不可控、人脸远近模糊程度不可控以及人脸遮挡情况不可控的情况下，提高人脸年龄识别的准确度。

在一个实施例中，对训练图像集中的训练图像进行增强处理,得到增强处理后的训练图像，包括：当增强处理包括随机擦除时，从训练图像中随机选取擦除区域，将擦除区域的像素进行随机赋值，得到随机擦除处理后的训练图像；和/或当增强处理包括随机模糊时，随机选取一个方向对训练图像进行卷积运算，得到随机模糊处理后的训练图像；和/或当增强处理包括超分辨率处理时，通过图像超分辨率模型对训练图像进行超分辨率处理，得到超分辨率处理后的训练图像。

其中，增强处理包括随机擦除、随机模糊、超分辨率处理中的至少一种。随机擦除是通过从训练图像中随机选取擦除区域，然后将擦除区域的像素进行随机赋值，即可得到随机擦除处理后的训练图像。如图3所示，为一个实施例中，进行随机擦除前后的示意图。随机模糊是通过随机选取一个方向对训练图像进行卷积运算得到随机模糊处理后的训练图像。如图4所示，为一个实施例中，进行随机模糊前后的示意图。超分辨率处理是通过训练得到的超分辨率模型对训练图像进行超分辨率处理，即可得到超分辨率处理后的较为清晰的图像。如图5为一个实施例中，进行超分辨率处理前后的示意图。

在一个实施例中，包含有人脸的训练图像集中包含有多个角度的人脸图像,多个角度的人脸图像属于多个不同的年龄段。

其中，由于在某些场景下，比如，监控场景，由于人脸角度不可控，为了对处于任何角度的人脸都能够进行年龄识别。在训练图像集中包含有多个角度的人脸图像，如图6所示，为一个实施例中，训练图像集中处于不同角度的人脸图像的示意图。另外，为了能够对各个年龄段的人脸都能够得到准确的识别，在训练样本中需要包含有各个年龄段的训练图像。即为了在人脸角度不可控的情况下实现对人脸年龄的准确识别，在训练图像中需要包含有多个角度的人脸。为了实现对不同年龄段的准确识别，在训练图像中还需要包含有各个年龄段的训练图像。

在一个实施例中，根据各个目标训练图像中的人脸对应的预测年龄值，得到与标准年龄值对应的统计预测年龄，包括：将得到的各个目标训练图像中的人脸对应的预测年龄值进行平均得到平均预测年龄，将平均预测年龄作为与标准年龄值对应的统计预测年龄。

其中，统计预测年龄采用平均预测年龄，平均预测年龄是指将对应于同一标准年龄值的各个目标训练图像对应的预测年龄进行平均得到的。通过采用平均预测年龄能够解决训练样本中年龄分布不均衡导致的预测准确度不高的问题，提高了年龄识别模型对各个年龄段的预测准确度。

在一个实施例中，根据统计预测年龄和对应的标准年龄值计算得到年龄统计误差值，包括：获取误差调整系数；根据误差调整系数、统计预测年龄和对应的标准年龄值计算得到年龄统计误差值。

其中，由于人在年幼时，样貌随年龄增长变化较为明显，而年长时，样貌随年龄增长变化较为不明显，所以人在年幼时，预测的误差会比较大。通过获取误差调整系数，利用误差调整系数对不同年龄段对应的年龄统计误差值进行调整，从而能够针对各个年龄段得到更加准确的预测效果。即误差调整系数用于根据不同的年龄对相应的年龄统计误差值进行调整。在一个实施例中，误差调整系数与标准年龄值成反相关，即标准年龄值越大，相应的误差调整系数越小。根据误差调整系数、统计年龄预测和对应的标注共同来计算得到最终的年龄统计误差值。

在一个实施例中，获取误差调整系数，包括：根据统计预测年龄和对应的标准年龄值计算得到误差调整控制参数；根据误差调整控制参数计算得到误差调整系数，误差调整系数与误差调整控制系数成反相关。

其中，误差调整控制参数用于控制误差调整系数的大小，即控制年龄统计误差值的调整幅度。误差调整控制参数与统计预测年龄、以及对应的标准年龄值相关。在一个实施例中，误差调整控制参数为统计预测年龄和对应的标准年龄值中的最大值，即误差调整控制参数可以表示为max(Mean(Val)，Gt)，Gt表示标准年龄值，Mean(Val)是指对应于标准年龄值的统计预测年龄。

在计算得到误差调整控制参数后，获取误差调整函数，通过将误差调整控制参数代入误差调整函数计算得到误差调整值。误差调整系数与误差调整控制系数成反相关。在一个实施例中，误差调整系数与误差调整控制参数的关系可以采用如下公式表示：f(x)＝2k/(x+k),x为误差调整控制参数，k为大于x的常数。

在一个实施例中，获取年龄预测模型对应的预测年龄区间，获取预测年龄区间中的最大值，根据预测年龄区间的最大值和误差调整控制参数计算得到误差调整系数。

其中，预测年龄区间是指预测的年龄范围，比如，该预测年龄模型能够预测的年龄范围为0-70岁，那么该预测年龄区间中的最大值为70岁。根据预测年龄区间的最大值和误差调整控制参数计算得到误差调整系数。可以采用如下公式表示：f(x)＝2K/(x+K)，其中，K为预测年龄区间的最大值，x为误差调整控制参数。

在一个实施例中，年龄统计误差值采用以下公式计算得到：

其中，f(x)＝2K/(max(Mean(Val)，Gt)+K)。其中，f(x)表示误差调整系数，K表示预设年龄区间的最大值，max(Mean(Val)，Gt))为误差调整控制参数，Gt表示标准年龄值。

如图7所示，在一个实施例中，提出了一种年龄识别方法。该方法既可以应用于终端，也可以应用于服务器，本实施例以应用于终端举例说明。该年龄识别方法具体包括如下步骤：

步骤S702，获取包含有人脸的待识别图像。

其中，待识别图像是指待识别人脸年龄的图像。待识别图像可以是终端通过调用摄像头实时拍摄得到的包含有人脸的图像，也可以是获取的已存储的包含有人脸的图像。待识别图像中的人脸可以是任意角度的，比如，可以是侧脸、也可以正脸等。待识别图像中可以包括一张人脸，也可以包含有多张人脸。如果包含有多张人脸，后续需要识别出图像中每一张人脸对应的年龄。

步骤S704，将待识别图像作为年龄识别模型的输入，年龄识别模型采用年龄统计误差值作为误差度量标准，年龄统计误差值是根据标注年龄值和对应于同一标注年龄值的多个训练图像中的人脸对应的预测年龄值进行统计计算得到的。

其中，年龄识别模型用于识别待识别图像中包含的人脸对应的年龄值。年龄统计误差值是根据设置的年龄统计误差函数计算得到的，年龄统计误差函数是以标注年龄值和相应的统计预测年龄为变量的。通过将获取到的标注年龄值和相应的统计预测年龄代入年龄统计误差函数即可计算得到相应的年龄统计误差值。

标注年龄值是指对训练图像中的人脸进行标注的年龄值，可以理解为人脸对应的实际年龄，即期望输出的年龄值。在一个实施例中，标注年龄值采用的是基于视觉主观判断的目测年龄。在不能获取到训练图像中的人脸的实际年龄的情况下(比如监控场景下)，相应的标注年龄值是通过专业人士进行目测得到的，然后进行标注的。统计预测年龄是通过统计对应于同一标注年龄的多个训练图像对应的预测年龄值得到的，预测年龄值是通过将训练图像输入年龄识别模型得到的。

在一个实施例中，统计预测年龄可以采用计算中值的方式得到，比如，将预测得到的对应于同一标注年龄值的多个预测年龄按照大小进行排序，然后选取处于中间的预测年龄值作为统计预测年龄。在另一个实施例中，统计预测年龄是采用均值的方式计算得到的，即将预测得到的多个预测年龄进行平均，将得到的均值作为统计预测年龄。

举个例子，假设有多个训练图像中的人脸对应的标注年龄值都是25岁，分别将该多个训练图像作为训练图像的输入，得到每个训练图像中的人脸对应的预测年龄值，然后根据该多个训练图像对应的预测年龄值计算得到统计预测年龄。

采用统计预测年龄和标注年龄值计算得到年龄统计误差值，然后根据年龄统计误差值对模型中的参数进行调整训练，可以在样本年龄分布不均衡的情况下，仍然能够得到对各个年龄段识别准确度高的年龄识别模型。由于在特殊场景下，训练样本的年龄分布不可控，如果年龄分布不均衡容易导致模型的预测年龄倾向于分布比较大的年龄区间，而本实施例中通过采用统计预测年龄和标注年龄值计算得到年龄统计误差值可以有效的解决上述由于年龄分布不均衡导致的预测准确度低的问题。

步骤S706，获取年龄识别模型输出的与待识别图像中的人脸对应的年龄值。

其中，通过将包含有人脸的待识别图像作为已训练的年龄识别模型的输入，即可获取输出的与待识别图像中的人脸对应的预测年龄值。如图8所示，为一个实施例中，识别出的人脸对应的年龄示意图。

上述年龄识别方法，通过获取包含有人脸的待识别图像，将待识别图像作为已训练的年龄识别模型的输入，然后获取已训练的年龄识别模型输出的与待识别图像中的人脸对应的年龄值。上述年龄识别模型是采用年龄统计误差值作为误差度量标准进行训练得到的，年龄统计误差值是根据标注年龄值和相应的统计预测年龄进行计算得到的，统计预测年龄是根据对应于同一标注年龄值的多个训练图像对应的年龄识别模型输出的预测年龄进行统计计算得到的。通过采用创新性的年龄统计误差值作为误差度量标准对年龄识别模型进行训练，能够提高年龄识别模型对各个年龄段的预测准确度，在年龄段不可控的特殊场景下，对处于各个年龄段的人脸都能够得到准确度比较高的识别效果。

如图9A所示，为一个实施例中应用于监控场景下的示意图。如图9A所示，首先获取在监控场景下的视频图像，然后对视频图像中的人脸进行检测，提取出包含有人脸的目标图片，为了便于识别，提取的包含有人脸的目标图片中仅包括一张人脸。如果视频图像中存在多张人脸，则相应地从视频图像中提取中多张目标图片。然后将目标图片作为年龄识别模型的输入，然后获取年龄识别模型输出的年龄。如图9B所示，为一个实施例中，在监控场景下存在多张人脸时，对多张人脸的年龄进行识别得到的识别结果的示意图。

在一个实施例中，年龄识别模型是采用卷积神经网络模型进行训练得到的，年龄识别模型包括：多个卷积层，相邻的卷积层之间包括预设数目的激活层和池化层。

其中，年龄识别模型是采用卷积神经网络模型(Convolutional Neural Network，CNN)训练得到的。年龄识别模型包括多个卷积层，相邻卷积层之间包括预设数目的激活层和池化层。卷积层用于对图像进行卷积运算提取图像特征。激活层用于对图像进行非线性运算，用于描述图像的非线性特征。激活层是采用激活函数来实现的。比如，ReLu函数。池化层用于对图像中的各个权重进行投影得到降维后的图像。

如图10所示，在一个实施例中，年龄识别模型包括有17层卷积层和一层输出层，其中第一卷积层为7X7的卷积层，第2-17的卷积层都为3X3的卷积层。其中，7X7,3X3是指卷积层的卷积核的大小。相邻卷积层之间还包括：ReLu层(即激活层)和Pooling(池化)层。其中，最后一层的池化核为5X5，其他层的池化核7X7。本实施例中，创新性的对最后一层的池化层的内部结构修改为了5X5，可以在一定程度上提升模型表达能力的同时基本不改变预训练模型的参数权重，从而可以避免重复的预训练过程。其中，预训练过程是指初始化模型中各个参数的过程。为了避免重复的预训练过程，将原来的卷积神经网络模型中的最后一层的池化层的池化核修改为5X5，既可以提高模型的表达能力，又可以避免重复的预训练过程。

在一个实施例中，将待识别图像作为已训练的年龄识别模型的输入之前，包括：对将待识别图像中的人脸进行识别，得到目标人脸区域；将待识别图像作为已训练的年龄识别模型的输入，包括：将待识别图像对应的目标人脸区域作为已训练的年龄识别模型的输入。

其中，目标人脸区域是指人脸所在的区域。通过对待识别图像进行人脸检测识别，确定人脸对应的剪裁框，然后根据剪裁框进行剪裁即得到目标人脸区域，之后将目标人脸区域作为已训练的年龄识别模型的输入。由于获取到的待识别图像可能还包括很多无用的信息，在输入模型之前，首先对待识别图像中的人脸进行检测，然后提取出目标人脸区域，通过将目标人脸区域作为已训练的年龄识别模型的输入，这样有利于提高人脸年龄预测的准确性。

如图11所示，在一个监控场景的实施例中，包括前端模块(存在于终端)和后台模块(存在于服务器)，其中，前端模块包括：视频采集模块和人脸检测模块。后台模块包括：人脸分析模块、统计分析模块和数据库模块。具体地，首先由视频采集模块通过摄像头实时采集现实场景中的图像，然后视频采集模块将采集到的图像发送给人脸检测模块，人脸检测模块用于对采集到的图像进行人脸检测，当检测到图像中包含有人脸时，将人脸所在的区域进行剪裁得到目标人脸图像，将得到的目标人脸图像上传到服务器的人脸分析模块，人脸分析模块中包含有年龄识别模型，根据年龄识别模型对目标人脸图像中的人脸进行年龄识别，得到人脸对应的年龄值。然后将分析得到的年龄传递给统计分析模块，统计分析模块用于根据获取到的多个人脸的年龄进行统计得到相应的年龄分布，如图12所示，为一个实施例中，统计得到的年龄分布的示意图。数据库模块用于存储人脸信息以及相应的年龄，便于后续查找。

如图13所示，在一个实施例中，提出了一种年龄识别方法，该方法包括：

步骤S1301，获取包含有人脸的训练图像集，训练图像集中的各个训练图像中的人脸存在对应的标注年龄值。

步骤S1302，将训练图像集中的训练图像作为年龄识别模型的输入，获取年龄识别模型输出的各个训练图像中的人脸对应的预测年龄值。

步骤S1303，根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄。

步骤S1304，将得到的各个目标训练图像对应的预测年龄进行平均得到平均预测年龄，将平均预测年龄作为与标注年龄值对应的统计预测年龄。

步骤S1305，根据所述统计预测年龄和对应的标注年龄值计算得到年龄统计误差值。

步骤S1306，根据所述年龄统计误差值对所述年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。

步骤S1307，获取包含有人脸的待识别图像。

步骤S1308，将待识别图像作为年龄识别模型的输入；

步骤S1309，获取所述年龄识别模型输出的与所述待识别图像中的人脸对应的年龄值。

如图14所示，在一个实施例中，提出了一种年龄识别模型的训练装置，该装置包括：

图像集获取模块1402，用于获取包含有人脸的训练图像集，所述训练图像集中的各个训练图像中的人脸存在对应的标注年龄值；

训练输入输出模块1404，用于将所述训练图像集中的训练图像作为年龄识别模型的输入，获取所述年龄识别模型输出的各个训练图像中的人脸对应的预测年龄值；

第一计算模块1406，用于根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄；

第二计算模块1408，用于根据所述统计预测年龄和对应的标注年龄值计算得到年龄统计误差值；

调整模块1410，用于根据所述年龄统计误差值对所述年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。

如图15所示，在一个实施例中，所述获取包含有人脸的训练图像集之后，还包括：

增强处理模块1403，用于对所述训练图像集中的训练图像进行增强处理，得到增强处理后的训练图像，所述增强处理包括：随机擦除、随机模糊、超分辨率处理中的至少一种；

所述训练输入输出模块还用于将所述增强处理后的训练图像作为年龄识别模型的输入。

在一个实施例中，所述增强处理模块还用于当所述增强处理包括随机擦除时，从所述训练图像中随机选取擦除区域，将所述擦除区域的像素进行随机赋值，得到随机擦除处理后的训练图像；和/或当所述增强处理包括随机模糊时，随机选取一个方向对所述训练图像进行卷积运算，得到随机模糊处理后的训练图像；和/或当所述增强处理包括超分辨率处理时，通过图像超分辨率模型对所述训练图像进行超分辨率处理，得到超分辨率处理后的训练图像。

在一个实施例中，所述包含有人脸的训练图像集中包含有多个角度的人脸图像,所述多个角度的人脸图像属于多个不同的年龄段。

在一个实施例中，所述第一计算模块1406还用于将得到的各个目标训练图像中的人脸对应的预测年龄值进行平均得到平均预测年龄，将所述平均预测年龄作为与所述标注年龄值对应的统计预测年龄。

在一个实施例中，第二计算模块1408还用于获取误差调整系数；根据所述误差调整系数、所述统计预测年龄和对应的标注年龄值计算得到年龄统计误差值。

在一个实施例中，第二计算模块1408还用于根据所述统计预测年龄和对应的标注年龄值计算得到误差调整控制参数；根据所述误差调整控制参数计算得到所述误差调整系数，所述误差调整系数与所述误差调整控制系数成反相关。

如图16所示，在一个实施例中，提出了一种年龄识别装置，所述装置包括：

待识别图像获取模块1602，用于获取包含有人脸的待识别图像；

输入模块1604，用于将所述待识别图像作为年龄识别模型的输入，所述年龄识别模型采用年龄统计误差值作为误差度量标准，所述年龄统计误差值是根据标注年龄值和对应于同一标注年龄值的多个训练图像中的人脸对应的预测年龄值进行统计计算得到的；

输出模块1606，用于获取所述年龄识别模型输出的与所述待识别图像中的人脸对应的年龄值。

在一个实施例中，所述年龄识别模型是采用卷积神经网络模型进行训练得到的，所述年龄识别模型包括：多个卷积层，所述相邻的卷积层之间包括预设数目的激活层和池化层。

如图17所示，在一个实施例中，上述年龄识别装置还包括：

识别模块1603，用于对所述将所述待识别图像中的人脸进行识别，得到目标人脸区域；

所述输入模块还用于将所述待识别图像对应的目标人脸区域作为已训练的年龄识别模型的输入。

图18示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端，也可以是服务器。如图18所示，该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现年龄识别模型的训练方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行年龄识别模型的训练方法。本领域技术人员可以理解，图18中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的年龄识别模型的训练方法可以实现为一种计算机程序的形式，计算机程序可在如图18所示的计算机设备上运行。计算机设备的存储器中可存储组成该年龄识别模型的训练装置的各个程序模块，比如，图14的图像集获取模块1402、训练输入输出模块1404、第一计算模块1406、第二计算模块1408和调整模块1410。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的年龄识别装置中的步骤。例如，图18所示的计算机设备可以通过如图14所示的年龄识别装置的图像集获取模块1402获取包含有人脸的训练图像集，所述训练图像集中的各个训练图像中的人脸存在对应的标注年龄值；通过训练输入输出模块1404将所述训练图像集中的训练图像作为年龄识别模型的输入，获取所述年龄识别模型输出的各个训练图像中的人脸对应的预测年龄值；通过第一计算模块1406根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄；通过第二计算模块1408根据所述统计预测年龄和对应的标注年龄值计算得到年龄统计误差值；通过调整模块1410根据所述年龄统计误差值对所述年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。

在一个实施例中，提出了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：获取包含有人脸的训练图像集，所述训练图像集中的各个训练图像中的人脸存在对应的标注年龄值；将所述训练图像集中的训练图像作为年龄识别模型的输入，获取所述年龄识别模型输出的各个训练图像中的人脸对应的预测年龄值；根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄；根据所述统计预测年龄和对应的标注年龄值计算得到年龄统计误差值；根据所述年龄统计误差值对所述年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。

在一个实施例中，所述获取包含有人脸的训练图像集之后，所述计算机程序还使得所述处理器执行如下步骤：对所述训练图像集中的训练图像进行增强处理，得到增强处理后的训练图像，所述增强处理包括：随机擦除、随机模糊、超分辨率处理中的至少一种；所述将所述训练图像集中的训练图像作为年龄识别模型的输入，包括：将所述增强处理后的训练图像作为年龄识别模型的输入。

在一个实施例中，所述对所述训练图像集中的训练图像进行增强处理,得到增强处理后的训练图像，包括：当所述增强处理包括随机擦除时，从所述训练图像中随机选取擦除区域，将所述擦除区域的像素进行随机赋值，得到随机擦除处理后的训练图像；和/或当所述增强处理包括随机模糊时，随机选取一个方向对所述训练图像进行卷积运算，得到随机模糊处理后的训练图像；和/或当所述增强处理包括超分辨率处理时，通过图像超分辨率模型对所述训练图像进行超分辨率处理，得到超分辨率处理后的训练图像。

在一个实施例中，所述根据所述各个目标训练图像中的人脸对应的预测年龄值，得到与所述标注年龄值对应的统计预测年龄，包括：将得到的各个目标训练图像中的人脸对应的预测年龄值进行平均得到平均预测年龄，将所述平均预测年龄作为与所述标注年龄值对应的统计预测年龄。

在一个实施例中，所述根据所述统计预测年龄和对应的所述标注年龄值计算得到年龄统计误差值，包括：获取误差调整系数；根据所述误差调整系数、所述统计预测年龄和对应的标注年龄值计算得到年龄统计误差值。

在一个实施例中，所述获取误差调整系数，包括：根据所述统计预测年龄和对应的标注年龄值计算得到误差调整控制参数；根据所述误差调整控制参数计算得到所述误差调整系数，所述误差调整系数与所述误差调整控制系数成反相关。

在一个实施例中，提出了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：获取包含有人脸的待识别图像；将所述待识别图像作为年龄识别模型的输入，所述年龄识别模型采用年龄统计误差值作为误差度量标准，所述年龄统计误差值是根据标注年龄值和对应于同一标注年龄值的多个训练图像中的人脸对应的预测年龄值进行统计计算得到的；获取所述年龄识别模型输出的与所述待识别图像中的人脸对应的年龄值。

在一个实施例中，所述将所述待识别图像作为年龄识别模型的输入之前，所述计算机程序还使得所述处理器执行如下步骤：对所述将所述待识别图像中的人脸进行识别，得到目标人脸区域；所述将所述待识别图像作为已训练的年龄识别模型的输入，包括：将所述待识别图像对应的目标人脸区域作为已训练的年龄识别模型的输入。

在一个实施例中，提出了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行以下步骤：获取包含有人脸的训练图像集，所述训练图像集中的各个训练图像中的人脸存在对应的标注年龄值；将所述训练图像集中的训练图像作为年龄识别模型的输入，获取所述年龄识别模型输出的各个训练图像中的人脸对应的预测年龄值；根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄；根据所述统计预测年龄和对应的标注年龄值计算得到年龄统计误差值；根据所述年龄统计误差值对所述年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型。

在一个实施例中，提出了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行以下步骤：获取包含有人脸的待识别图像；将所述待识别图像作为年龄识别模型的输入，所述年龄识别模型采用年龄统计误差值作为误差度量标准，所述年龄统计误差值是根据标注年龄值和对应于同一标注年龄值的多个训练图像中的人脸对应的预测年龄值进行统计计算得到的；获取所述年龄识别模型输出的与所述待识别图像中的人脸对应的年龄值。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种年龄识别模型的训练方法，所述方法包括：

根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄；所述目标训练图像为对应于同一标注年龄值的训练图像；

根据所述年龄统计误差值对所述年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型；所述收敛条件是预先设置的用于衡量所述年龄统计误差值的阈值。

2.根据权利要求1所述的方法，其特征在于，所述获取包含有人脸的训练图像集之后，还包括：

对所述训练图像集中的训练图像进行增强处理，得到增强处理后的训练图像，所述增强处理包括：随机擦除、随机模糊、超分辨率处理中的至少一种；

所述将所述训练图像集中的训练图像作为年龄识别模型的输入，包括：

将所述增强处理后的训练图像作为年龄识别模型的输入。

3.根据权利要求2所述的方法，其特征在于，所述对所述训练图像集中的训练图像进行增强处理，得到增强处理后的训练图像，包括：

当所述增强处理包括随机擦除时，从所述训练图像中随机选取擦除区域，将所述擦除区域的像素进行随机赋值，得到随机擦除处理后的训练图像；和/或

当所述增强处理包括随机模糊时，随机选取一个方向对所述训练图像进行卷积运算，得到随机模糊处理后的训练图像；和/或

当所述增强处理包括超分辨率处理时，通过图像超分辨率模型对所述训练图像进行超分辨率处理，得到超分辨率处理后的训练图像。

4.根据权利要求1所述的方法，其特征在于，所述包含有人脸的训练图像集中包含有多个角度的人脸图像,所述多个角度的人脸图像属于多个不同的年龄段。

5.根据权利要求1所述的方法，其特征在于，所述根据所述各个目标训练图像中的人脸对应的预测年龄值，得到与所述标注年龄值对应的统计预测年龄，包括：

将得到的各个目标训练图像中的人脸对应的预测年龄值进行平均得到平均预测年龄，将所述平均预测年龄作为与所述标注年龄值对应的统计预测年龄。

6.根据权利要求1所述的方法，其特征在于，所述根据所述统计预测年龄和对应的标注年龄值计算得到年龄统计误差值，包括：

获取误差调整系数；

根据所述误差调整系数、所述统计预测年龄和对应的标注年龄值计算得到年龄统计误差值。

7.根据权利要求6所述的方法，其特征在于，所述获取误差调整系数，包括：

根据所述统计预测年龄和对应的标注年龄值计算得到误差调整控制参数；

根据所述误差调整控制参数计算得到所述误差调整系数，所述误差调整系数与所述误差调整控制系数成反相关。

8.一种年龄识别方法，所述方法包括：

获取包含有人脸的待识别图像；

将所述待识别图像作为年龄识别模型的输入，所述年龄识别模型是采用年龄统计误差值作为误差度量标准进行训练所得的，所述年龄统计误差值是根据标注年龄值和对应于同一标注年龄值的多个目标训练图像中的人脸对应的预测年龄值进行统计计算得到的；所述目标训练图像为对应于同一标注年龄值的训练图像；

9.根据权利要求8所述的方法，其特征在于，所述年龄识别模型是采用卷积神经网络模型进行训练得到的，所述年龄识别模型包括：多个卷积层，相邻的卷积层之间包括预设数目的激活层和池化层。

10.根据权利要求8所述的方法，其特征在于，所述将所述待识别图像作为年龄识别模型的输入之前，包括：

对所述将所述待识别图像中的人脸进行识别，得到目标人脸区域；

所述将所述待识别图像作为已训练的年龄识别模型的输入，包括：

将所述待识别图像对应的目标人脸区域作为已训练的年龄识别模型的输入。

11.一种年龄识别模型的训练装置，所述装置包括：

第一计算模块，用于根据对应于同一标注年龄值的各个目标训练图像中的人脸对应的预测年龄值，计算得到与各个标注年龄值对应的统计预测年龄；所述目标训练图像为对应于同一标注年龄值的训练图像；

调整模块，用于根据所述年龄统计误差值对所述年龄识别模型中的参数进行调整，直至满足收敛条件，得到目标年龄识别模型；所述收敛条件是预先设置的用于衡量所述年龄统计误差值的阈值。

12.根据权利要求11所述的装置，其特征在于，所述装置还包括：

增强处理模块，用于对所述训练图像集中的训练图像进行增强处理，得到增强处理后的训练图像，所述增强处理包括：随机擦除、随机模糊、超分辨率处理中的至少一种；

所述输入输出模块还用于将所述增强处理后的训练图像作为年龄识别模型的输入。

13.根据权利要求12所述的装置，其特征在于，所述增强处理模块，还用于：

14.根据权利要求11所述的装置，其特征在于，所述包含有人脸的训练图像集中包含有多个角度的人脸图像,所述多个角度的人脸图像属于多个不同的年龄段。

15.根据权利要求11所述的装置，其特征在于，所述第一计算模块，还用于：

16.根据权利要求11所述的装置，其特征在于，所述第二计算模块，还用于：

获取误差调整系数；

17.根据权利要求16所述的装置，其特征在于，所述第二计算模块，还用于：

18.一种年龄识别装置，所述装置包括：

待识别图像获取模块，用于获取包含有人脸的待识别图像；

输入模块，用于将所述待识别图像作为年龄识别模型的输入，所述年龄识别模型是采用年龄统计误差值作为误差度量标准进行训练所得的，所述年龄统计误差值是根据标注年龄值和对应于同一标注年龄值的多个目标训练图像中的人脸对应的预测年龄值进行统计计算得到的；所述目标训练图像为对应于同一标注年龄值的训练图像；

19.根据权利要求18所述的装置，其特征在于，所述年龄识别模型是采用卷积神经网络模型进行训练得到的，所述年龄识别模型包括：多个卷积层，相邻的卷积层之间包括预设数目的激活层和池化层。

20.根据权利要求18所述的装置，其特征在于，所述装置还包括：

识别模块，用于对所述将所述待识别图像中的人脸进行识别，得到目标人脸区域；

所述输入模块还用于：

21.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至10中任一项所述方法的步骤。

22.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至10中任一项所述方法的步骤。