CN112164404A

CN112164404A - 一种基于声纹识别技术的远程身份认证方法及系统

Info

Publication number: CN112164404A
Application number: CN202011173448.5A
Authority: CN
Inventors: 朱明增; 覃景涛; 温黎明; 欧健美; 马红康; 周素君; 刘秀丽; 覃秋勤; 冀北振; 刘小兰
Original assignee: Hezhou Power Supply Bureau of Guangxi Power Grid Co Ltd
Current assignee: Hezhou Power Supply Bureau of Guangxi Power Grid Co Ltd
Priority date: 2020-10-28
Filing date: 2020-10-28
Publication date: 2021-01-01

Abstract

本发明公开了一种基于声纹识别技术的远程身份认证方法及系统，远程身份认证方法包括：采集相关人员的个人语音样本和个人身份信息；利用个人语音样本，生成个人识别模型；关联个人识别模型与个人身份信息；集合多个个人识别模型和多个个人身份信息，生成相关人员识别模型库；采集识别人员的个人声纹信息；利用个人声纹信息，采用声纹辨认方法，在相关人员识别模型库中初步确认识别人员的个人身份信息；利用个人声纹信息，采用声纹确认方法，二次确认识别人员的个人身份信息；匹配校验识别人员的个人身份信息与合格人员名单。在本发明实施例中，采用远程身份认证方法及系统能百分百确保对方是合格人员，确保对方业务技能达标，避免造成安全隐患。

Description

一种基于声纹识别技术的远程身份认证方法及系统

技术领域

本发明涉及身份认证技术领域，具体而言，涉及一种基于声纹识别技术的远程身份认证方法及系统。

背景技术

电网安全规定，工作票签发人、工作负责人和工作许可人(简称“三种人”)每年应进行“三种人”资格考试，合格后以发文的形式公布；另外，与上级调度机构进行调度业务联系的值班调度员和运行单位值班人员必须通过调度机构组织的认证培训和受令资格考核，并取得受令资格；调度业务都是通过电话联系，以自报名字的方式确认身份，因此，若对方没有通过“三种人”资格考试以及没有受令资格，而以谎报合格人员名字的方式开展工作，由于安全意识不足和业务技能薄弱，会存在很大的安全隐患。

发明内容

本发明的目的在于克服现有技术的不足，本发明提供了一种基于声纹识别技术的远程身份认证方法及系统，在开展调度业务时，采用所述远程身份认证方法及系统能百分百确认对方身份，确保对方是合格人员，确保对方业务技能达标，避免造成安全隐患。

相应的，本发明实施例提供了一种基于声纹识别技术的远程身份认证方法，其特征在于，所述远程身份认证方法包括：

采集相关人员的个人语音样本和个人身份信息；

利用所述个人语音样本，生成个人识别模型；

关联所述个人识别模型与所述个人身份信息；

集合多个所述个人识别模型和相关联的多个所述个人身份信息，生成相关人员识别模型库；

采集识别人员的个人声纹信息；

利用所述个人声纹信息，并采用声纹辨认方法，在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息；

利用所述个人声纹信息，并采用声纹确认方法，二次确认所述识别人员的个人身份信息；

匹配校验所述识别人员的个人身份信息与合格人员名单。

可选的实施方式，所述利用所述个人语音样本，生成个人识别模型，包括：

提取所述个人语音样本的个人语音MFCC特征；

利用神经网络算法对所述个人语音MFCC特征进行训练，生成个人识别模型。

可选的实施方式，所述利用所述个人声纹信息，并采用声纹辨认方法，在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息，包括：

比对所述个人声纹信息与所述相关人员识别模型库，结合概率模型法得到所述相关人员模型库中个人模型的相似性打分；

对所述相似性打分进行相似性打分判别，根据所述相似性打分判别初步确认所述识别人员的个人身份信息。

可选的实施方式，所述概率模型法基于高斯混合算法并利用M个多位高斯分布加权得到。

可选的实施方式，所述利用所述个人声纹信息，并采用声纹确认方法，二次确认所述识别人员的个人身份信息，包括：

利用语音识别技术，识别所述个人声纹信息中的声纹身份信息；

对所述声纹身份信息与所述识别人员的个人身份信息进行一致性判断，获取一致性判断结果；

根据所述一致性判断结果二次确认所述识别人员的个人身份信息。

可选的实施方式，所述匹配校验所述识别人员的个人身份信息与合格人员名单，包括：

录入合格人员名单；

判断所述识别人员的个人身份信息是否在所述合格人员名单中；

若所述识别人员的个人身份信息不在所述合格人员名单中，则产生语音告警信号。

另外，本发明实施例还提供了一种远程身份认证系统，所述远程身份认证系统包括：

样本采集模块：用于采集相关人员的个人语音样本和个人身份信息；

模型生成模块：用于利用所述个人语音样本，生成个人识别模型；

关联模块：用于关联所述个人识别模型与所述个人身份信息；

模型库生成模块：用于集合多个所述个人识别模型和相关联的多个所述个人身份信息，生成相关人员识别模型库；

声纹采集模块：用于采集识别人员的个人声纹信息；

声纹辨认模块：用于利用所述个人声纹信息，并采用声纹辨认方法，在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息；

声纹确认模块：用于利用所述个人声纹信息，并采用声纹确认方法，二次确认所述识别人员的个人身份信息；

匹配校验模块：用于匹配校验所述识别人员的个人身份信息与合格人员名单。

可选的实施方式，所述模型生成模块包括：

特征提取单元：用于提取所述个人语音样本的个人语音MFCC特征；

模型生成单元：用于利用神经网络算法对所述个人语音MFCC特征进行训练，生成个人识别模型。

可选的实施方式，所述声纹辨认模块包括：

比对单元：用于比对所述个人声纹信息与所述相关人员识别模型库，结合概率模型法得到所述相关人员模型库中个人模型的相似性打分；

确认单元：用于对所述相似性打分进行相似性打分判别，根据所述相似性打分判别初步确认所述识别人员的个人身份信息。

可选的实施方式，所述声纹确认模块包括：

识别单元：用于利用语音识别技术，识别所述个人声纹信息中的声纹身份信息；

一致性判断单元：用于对所述声纹身份信息与所述识别人员的个人身份信息进行一致性判断，获取一致性判断结果；

二次确认单元：用于根据所述一致性判断结果二次确认所述识别人员的个人身份信息。

本发明实施例提供了一种基于声纹识别技术的远程身份认证方法及系统，在开展调度业务时，采用所述远程身份认证方法及系统可以结合声纹识别身份认证技术和语音识别身份认证技术来智能识别对方是否为合格人员，若所述识别人员的个人身份信息不在所述合格人员名单中，则产生语音告警信号，可以通过语音告警的方式提醒调度员注意所述识别人员的身份，消除调度电话业务无法辨识对方身份的盲点，百分百确认对方身份，确保对方是合格人员，确保对方业务技能达标，避免造成安全隐患。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见的，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例中远程身份认证方法的流程示意图；

图2是本发明实施例中S12的具体流程示意图；

图3是本发明实施例中S16的具体流程示意图；

图4是本发明实施例中S17的具体流程示意图；

图5是本发明实施例中S18的具体流程示意图；

图6是本发明实施例中远程身份认证系统的具体组成示意图；

图7是本发明实施例中模型生成模块的组成示意图；

图8是本发明实施例中声纹辨认模块的组成示意图；

图9是本发明实施例中声纹确认模块的组成示意图；

图10是本发明实施例中匹配校验模块的组成示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

图1是本发明实施例中远程身份认证方法的流程示意图。

本发明实施例提供了一种基于声纹识别技术的远程身份认证方法，所述远程身份认证方法包括：

S11：采集相关人员的个人语音样本和个人身份信息；

首先，需要采集相关人员的个人语音样本和个人身份信息，在本发明实施例中，相关人员指的是与上级调度机构进行调度业务联系的值班调度员，或者运行单位值班人员等等，需要依次采集相关人员充足的个人语音样本，同时采集相关人员的个人身份信息，即采集相关人员的名字。

S12：利用所述个人语音样本，生成个人识别模型；

图2是本发明实施例中S12的具体流程示意图。

在本发明实施例中，利用所述个人语音样本，生成个人识别模型，具体包括：

S121：提取所述个人语音样本的个人语音MFCC特征；

需要说明的是，MFCC是Mel频率倒谱系数的缩写，Mel频率是基于人耳听觉特性提出来的，它与Hz频率成非线性对应关系，MFCC则是利用它们之间的这种关系，计算得到的Hz频谱特征。

提取所述个人语音样本的个人语音MFCC特征，具体包括：

预滤波：CODEC前端带宽为300-3400Hz的抗混叠滤波器；

A/D变换：8kHz的采样频率，12bit的线性量化精度；

预加重：通过一个一阶有限激励响应高通滤波器，使信号的频谱变得平坦，不易受到有限字长效应的影响；

分帧：根据语音的短时平稳特性，个人语音样本可以以帧为单位进行处理，具体选取的语音帧长为32ms，帧叠为16ms；

加窗：采用哈明窗对一帧语音加窗，以减小吉布斯效应的影响；

快速傅立叶变换：将时域信号变换成为信号的功率谱；

三角窗滤波：用一组Mel频标上线性分布的三角窗滤波器(共24个三角窗滤波器)，对信号的功率谱滤波，每一个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽，以此来模拟人耳的掩蔽效应；

求对数：三角窗滤波器组的输出求取对数，可以得到近似于同态变换的结果。

离散余弦变换：除各维信号之间的相关性，将信号映射到低维空间；

谱加权：由于倒谱的低阶参数易受说话人特性、信道特性等的影响，而高阶参数的分辨能力比较低，所以需要进行谱加权，抑制其低阶和高阶参数；

差分参数：量实验表明，在语音特征中加入表征语音动态特性的差分参数，能够提高系统的识别性能，具体加入了MFCC参数的一阶差分参数和二阶差分参数；

短时能量：语音的短时能量也是重要的特征参数，本系统中我们采用了语音的短时归一化对数能量及其一阶差分、二阶差分参数。

S122：利用神经网络算法对所述个人语音MFCC特征进行训练，生成个人识别模型。

提取了所述个人语音MFCC特征以后，利用神经网络算法对所述个人语音MFCC特征进行训练，生成个人识别模型。

S13：关联所述个人识别模型与所述个人身份信息；

在本发明实施例中，关联所述个人识别模型与所述个人身份信息，使所述个人识别模型与所述个人身份信息产生联结关系，即关联所述个人识别模型和相关人员的姓名，使所述个人识别模型与相关人员的姓名产生联结关系。

S14：集合多个所述个人识别模型和相关联的多个所述个人身份信息，生成相关人员识别模型库；

在本发明实施例中，集合所有相关人员的多个所述个人识别模型和相关联的多个所述个人身份信息，生成相关人员识别模型库，即集合所有相关人员的多个所述个人识别模型和相关联的多个姓名，生成相关人员识别模型库。

S15：采集识别人员的个人声纹信息；

在开展调度业务时，通过电话实时采集识别人员的个人声纹信息。

S16：利用所述个人声纹信息，并采用声纹辨认方法，在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息；

声纹辨认是指判定待测试声纹信息属于所述相关人员识别模型库中的哪一个人，是一个“多选一”的过程；声纹辨认包括开集识别和闭集识别，开集识别指的是待测试声纹信息可能不属于所述相关人员识别模型库中的任意一位，闭集识别指的是待测试声纹信息必定属于所述相关人员识别模型库中的任意一位，在本发明实施例中，优选采用闭集识别，以提高识别效率。

图3是本发明实施例中S16的具体流程示意图。

在本发明实施例中，所述利用所述个人声纹信息，并采用声纹辨认方法，在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息，具体包括：

S161：比对所述个人声纹信息与所述相关人员识别模型库，结合概率模型法得到所述相关人员模型库中个人模型的相似性打分；

优选地，所述概率模型法基于高斯混合算法并利用M个多位高斯分布加权得到，能有效提高相似性打分的准确率。

S162：对所述相似性打分进行相似性打分判别，根据所述相似性打分判别初步确认所述识别人员的个人身份信息。

相似性打分判别是指，当所述个人声纹信息与所述相关人员识别模型库中个人识别模型的相似性打分高于预设值，判别所述个人声纹信息属于个人识别模型，则根据所述个人识别模型的关联关系确认所述识别人员的个人身份信息，即确认所述识别人员的姓名；当所述个人声纹信息与所述相关人员识别模型库中个人识别模型的相似性打分低于预设值，判断所述识别人员不是合格人员。

S17：利用所述个人声纹信息，并采用声纹确认方法，二次确认所述识别人员的个人身份信息；

声纹确认是确定待测试声纹信息是否来自目标人员，是一个“一对一”的判决问题。

图4是本发明实施例中S17的具体流程示意图。

所述利用所述个人声纹信息，并采用声纹确认方法，二次确认所述识别人员的个人身份信息，具体包括：

S171：利用语音识别技术，识别所述个人声纹信息中的声纹身份信息；

为了提升声纹确认效率，在本发明实施例中，声纹确认使用的文本相关方式，文本相关方式是指识别人员必须按照事先指定的文本内容进行发音，具体实施中，识别人员需要自报姓名，利用语音识别技术，识别所述个人声纹信息中的声纹身份信息，即识别出所述个人声纹信息中包含的姓名。

S172：对所述声纹身份信息与所述识别人员的个人身份信息进行一致性判断，获取一致性判断结果；

在本发明实施例中，识别出识别人员自报的姓名，同时在S16步骤初步确认所述识别人员的姓名，对所述声纹身份信息与所述识别人员的个人身份信息进行一致性判断，获取一致性判断结果，即对所述识别人员自报的姓名和在S16步骤初步确认的所述识别人员的姓名进行一致性判断，获取一致性判断结果。

S173：根据所述一致性判断结果二次确认所述识别人员的个人身份信息。

在本发明实施例中，当所述一致性判断结果为一致时，可以二次确认所述识别人员的个人身份信息，当所述一致性判断结果为不一致时，为了安全起见，判断所述识别人员不是合格人员。

S18：匹配校验所述识别人员的个人身份信息与合格人员名单；

图5是本发明实施例中S18的具体流程示意图。

在本发明实施例中，所述匹配校验所述识别人员的个人身份信息与合格人员名单，具体包括：

S181：录入合格人员名单；

S182：判断所述识别人员的个人身份信息是否在所述合格人员名单中；

S183：若所述识别人员的个人身份信息不在所述合格人员名单中，则产生语音告警信号；

在本发明实施例中，首先需要录入合格人员名单，合格人员是指通过“三种人”资格考试并获得受令资格的人员，所述合格人员名单包含合格人员的姓名；然后，判断所述识别人员的个人身份信息是否在所述合格人员名单中，若所述识别人员的个人身份信息在所述合格人员名单中，则可以确保对方是合格人员，可以进行调度业务；若所述识别人员的个人身份信息不在所述合格人员名单中，则产生语音告警信号，可以通过语音告警的方式提醒调度员注意所述识别人员的身份。

图6是本发明实施例中远程身份认证系统的具体组成示意图。

另外，本发明实施例提供了一种基于声纹识别技术的远程身份认证系统，所述远程身份认证系统包括：

图7是本发明实施例中模型生成模块的组成示意图。

具体的，所述模型生成模块包括：

声纹采集模块：用于采集识别人员的个人声纹信息；

图8是本发明实施例中声纹辨认模块的组成示意图。

具体的，所述声纹辨认模块包括：

图9是本发明实施例中声纹确认模块的组成示意图。

具体的，所述声纹确认模块包括：

图10是本发明实施例中匹配校验模块的组成示意图。

具体的，所述匹配校验模块包括：

录入单元：用于录入合格人员名单；

名单判断单元：用于判断所述识别人员的个人身份信息是否在所述合格人员名单中；

语音告警单元：用于产生语音告警信号；

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，ReadOnly Memory)、随机存取存储器(RAM，Random AccessMemory)、磁盘或光盘等。

另外，以上对本发明实施例所提供的一种基于声纹识别技术的远程身份认证方法及系统进行了详细介绍，本文中应采用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于声纹识别技术的远程身份认证方法，其特征在于，所述远程身份认证方法包括：

采集相关人员的个人语音样本和个人身份信息；

利用所述个人语音样本，生成个人识别模型；

关联所述个人识别模型与所述个人身份信息；

采集识别人员的个人声纹信息；

匹配校验所述识别人员的个人身份信息与合格人员名单。

2.根据权利要求1所述的远程身份认证方法，其特征在于，所述利用所述个人语音样本，生成个人识别模型，包括：

提取所述个人语音样本的个人语音MFCC特征；

3.根据权利要求1所述的远程身份认证方法，其特征在于，所述利用所述个人声纹信息，并采用声纹辨认方法，在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息，包括：

4.根据权利要求3所述的远程身份认证方法，其特征在于，所述概率模型法基于高斯混合算法并利用M个多位高斯分布加权得到。

5.根据权利要求1所述的远程身份认证方法，其特征在于，所述利用所述个人声纹信息，并采用声纹确认方法，二次确认所述识别人员的个人身份信息，包括：

6.根据权利要求1所述的远程身份认证方法，其特征在于，所述匹配校验所述识别人员的个人身份信息与合格人员名单，包括：

录入合格人员名单；

7.一种基于声纹识别技术的远程身份认证系统，其特征在于，所述远程身份认证系统包括：

声纹采集模块：用于采集识别人员的个人声纹信息；

8.根据权利要求7所述的远程身份认证系统，其特征在于，所述模型生成模块包括：

9.根据权利要求7所述的远程身份认证系统，其特征在于，所述声纹辨认模块包括：

10.根据权利要求7所述的远程身份认证系统，其特征在于，所述声纹确认模块包括：