[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN112164404A - 一种基于声纹识别技术的远程身份认证方法及系统 - Google Patents

一种基于声纹识别技术的远程身份认证方法及系统 Download PDF

Info

Publication number
CN112164404A
CN112164404A CN202011173448.5A CN202011173448A CN112164404A CN 112164404 A CN112164404 A CN 112164404A CN 202011173448 A CN202011173448 A CN 202011173448A CN 112164404 A CN112164404 A CN 112164404A
Authority
CN
China
Prior art keywords
personal
personnel
voiceprint
information
identity information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011173448.5A
Other languages
English (en)
Inventor
朱明增
覃景涛
温黎明
欧健美
马红康
周素君
刘秀丽
覃秋勤
冀北振
刘小兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hezhou Power Supply Bureau of Guangxi Power Grid Co Ltd
Original Assignee
Hezhou Power Supply Bureau of Guangxi Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hezhou Power Supply Bureau of Guangxi Power Grid Co Ltd filed Critical Hezhou Power Supply Bureau of Guangxi Power Grid Co Ltd
Priority to CN202011173448.5A priority Critical patent/CN112164404A/zh
Publication of CN112164404A publication Critical patent/CN112164404A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/12Score normalisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/14Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/18Artificial neural networks; Connectionist approaches
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明公开了一种基于声纹识别技术的远程身份认证方法及系统,远程身份认证方法包括:采集相关人员的个人语音样本和个人身份信息;利用个人语音样本,生成个人识别模型;关联个人识别模型与个人身份信息;集合多个个人识别模型和多个个人身份信息,生成相关人员识别模型库;采集识别人员的个人声纹信息;利用个人声纹信息,采用声纹辨认方法,在相关人员识别模型库中初步确认识别人员的个人身份信息;利用个人声纹信息,采用声纹确认方法,二次确认识别人员的个人身份信息;匹配校验识别人员的个人身份信息与合格人员名单。在本发明实施例中,采用远程身份认证方法及系统能百分百确保对方是合格人员,确保对方业务技能达标,避免造成安全隐患。

Description

一种基于声纹识别技术的远程身份认证方法及系统
技术领域
本发明涉及身份认证技术领域,具体而言,涉及一种基于声纹识别技术的远程身份认证方法及系统。
背景技术
电网安全规定,工作票签发人、工作负责人和工作许可人(简称“三种人”)每年应进行“三种人”资格考试,合格后以发文的形式公布;另外,与上级调度机构进行调度业务联系的值班调度员和运行单位值班人员必须通过调度机构组织的认证培训和受令资格考核,并取得受令资格;调度业务都是通过电话联系,以自报名字的方式确认身份,因此,若对方没有通过“三种人”资格考试以及没有受令资格,而以谎报合格人员名字的方式开展工作,由于安全意识不足和业务技能薄弱,会存在很大的安全隐患。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种基于声纹识别技术的远程身份认证方法及系统,在开展调度业务时,采用所述远程身份认证方法及系统能百分百确认对方身份,确保对方是合格人员,确保对方业务技能达标,避免造成安全隐患。
相应的,本发明实施例提供了一种基于声纹识别技术的远程身份认证方法,其特征在于,所述远程身份认证方法包括:
采集相关人员的个人语音样本和个人身份信息;
利用所述个人语音样本,生成个人识别模型;
关联所述个人识别模型与所述个人身份信息;
集合多个所述个人识别模型和相关联的多个所述个人身份信息,生成相关人员识别模型库;
采集识别人员的个人声纹信息;
利用所述个人声纹信息,并采用声纹辨认方法,在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息;
利用所述个人声纹信息,并采用声纹确认方法,二次确认所述识别人员的个人身份信息;
匹配校验所述识别人员的个人身份信息与合格人员名单。
可选的实施方式,所述利用所述个人语音样本,生成个人识别模型,包括:
提取所述个人语音样本的个人语音MFCC特征;
利用神经网络算法对所述个人语音MFCC特征进行训练,生成个人识别模型。
可选的实施方式,所述利用所述个人声纹信息,并采用声纹辨认方法,在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息,包括:
比对所述个人声纹信息与所述相关人员识别模型库,结合概率模型法得到所述相关人员模型库中个人模型的相似性打分;
对所述相似性打分进行相似性打分判别,根据所述相似性打分判别初步确认所述识别人员的个人身份信息。
可选的实施方式,所述概率模型法基于高斯混合算法并利用M个多位高斯分布加权得到。
可选的实施方式,所述利用所述个人声纹信息,并采用声纹确认方法,二次确认所述识别人员的个人身份信息,包括:
利用语音识别技术,识别所述个人声纹信息中的声纹身份信息;
对所述声纹身份信息与所述识别人员的个人身份信息进行一致性判断,获取一致性判断结果;
根据所述一致性判断结果二次确认所述识别人员的个人身份信息。
可选的实施方式,所述匹配校验所述识别人员的个人身份信息与合格人员名单,包括:
录入合格人员名单;
判断所述识别人员的个人身份信息是否在所述合格人员名单中;
若所述识别人员的个人身份信息不在所述合格人员名单中,则产生语音告警信号。
另外,本发明实施例还提供了一种远程身份认证系统,所述远程身份认证系统包括:
样本采集模块:用于采集相关人员的个人语音样本和个人身份信息;
模型生成模块:用于利用所述个人语音样本,生成个人识别模型;
关联模块:用于关联所述个人识别模型与所述个人身份信息;
模型库生成模块:用于集合多个所述个人识别模型和相关联的多个所述个人身份信息,生成相关人员识别模型库;
声纹采集模块:用于采集识别人员的个人声纹信息;
声纹辨认模块:用于利用所述个人声纹信息,并采用声纹辨认方法,在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息;
声纹确认模块:用于利用所述个人声纹信息,并采用声纹确认方法,二次确认所述识别人员的个人身份信息;
匹配校验模块:用于匹配校验所述识别人员的个人身份信息与合格人员名单。
可选的实施方式,所述模型生成模块包括:
特征提取单元:用于提取所述个人语音样本的个人语音MFCC特征;
模型生成单元:用于利用神经网络算法对所述个人语音MFCC特征进行训练,生成个人识别模型。
可选的实施方式,所述声纹辨认模块包括:
比对单元:用于比对所述个人声纹信息与所述相关人员识别模型库,结合概率模型法得到所述相关人员模型库中个人模型的相似性打分;
确认单元:用于对所述相似性打分进行相似性打分判别,根据所述相似性打分判别初步确认所述识别人员的个人身份信息。
可选的实施方式,所述声纹确认模块包括:
识别单元:用于利用语音识别技术,识别所述个人声纹信息中的声纹身份信息;
一致性判断单元:用于对所述声纹身份信息与所述识别人员的个人身份信息进行一致性判断,获取一致性判断结果;
二次确认单元:用于根据所述一致性判断结果二次确认所述识别人员的个人身份信息。
本发明实施例提供了一种基于声纹识别技术的远程身份认证方法及系统,在开展调度业务时,采用所述远程身份认证方法及系统可以结合声纹识别身份认证技术和语音识别身份认证技术来智能识别对方是否为合格人员,若所述识别人员的个人身份信息不在所述合格人员名单中,则产生语音告警信号,可以通过语音告警的方式提醒调度员注意所述识别人员的身份,消除调度电话业务无法辨识对方身份的盲点,百分百确认对方身份,确保对方是合格人员,确保对方业务技能达标,避免造成安全隐患。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例中远程身份认证方法的流程示意图;
图2是本发明实施例中S12的具体流程示意图;
图3是本发明实施例中S16的具体流程示意图;
图4是本发明实施例中S17的具体流程示意图;
图5是本发明实施例中S18的具体流程示意图;
图6是本发明实施例中远程身份认证系统的具体组成示意图;
图7是本发明实施例中模型生成模块的组成示意图;
图8是本发明实施例中声纹辨认模块的组成示意图;
图9是本发明实施例中声纹确认模块的组成示意图;
图10是本发明实施例中匹配校验模块的组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1是本发明实施例中远程身份认证方法的流程示意图。
本发明实施例提供了一种基于声纹识别技术的远程身份认证方法,所述远程身份认证方法包括:
S11:采集相关人员的个人语音样本和个人身份信息;
首先,需要采集相关人员的个人语音样本和个人身份信息,在本发明实施例中,相关人员指的是与上级调度机构进行调度业务联系的值班调度员,或者运行单位值班人员等等,需要依次采集相关人员充足的个人语音样本,同时采集相关人员的个人身份信息,即采集相关人员的名字。
S12:利用所述个人语音样本,生成个人识别模型;
图2是本发明实施例中S12的具体流程示意图。
在本发明实施例中,利用所述个人语音样本,生成个人识别模型,具体包括:
S121:提取所述个人语音样本的个人语音MFCC特征;
需要说明的是,MFCC是Mel频率倒谱系数的缩写,Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系,MFCC则是利用它们之间的这种关系,计算得到的Hz频谱特征。
提取所述个人语音样本的个人语音MFCC特征,具体包括:
预滤波:CODEC前端带宽为300-3400Hz的抗混叠滤波器;
A/D变换:8kHz的采样频率,12bit的线性量化精度;
预加重:通过一个一阶有限激励响应高通滤波器,使信号的频谱变得平坦,不易受到有限字长效应的影响;
分帧:根据语音的短时平稳特性,个人语音样本可以以帧为单位进行处理,具体选取的语音帧长为32ms,帧叠为16ms;
加窗:采用哈明窗对一帧语音加窗,以减小吉布斯效应的影响;
快速傅立叶变换:将时域信号变换成为信号的功率谱;
三角窗滤波:用一组Mel频标上线性分布的三角窗滤波器(共24个三角窗滤波器),对信号的功率谱滤波,每一个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽,以此来模拟人耳的掩蔽效应;
求对数:三角窗滤波器组的输出求取对数,可以得到近似于同态变换的结果。
离散余弦变换:除各维信号之间的相关性,将信号映射到低维空间;
谱加权:由于倒谱的低阶参数易受说话人特性、信道特性等的影响,而高阶参数的分辨能力比较低,所以需要进行谱加权,抑制其低阶和高阶参数;
差分参数:量实验表明,在语音特征中加入表征语音动态特性的差分参数,能够提高系统的识别性能,具体加入了MFCC参数的一阶差分参数和二阶差分参数;
短时能量:语音的短时能量也是重要的特征参数,本系统中我们采用了语音的短时归一化对数能量及其一阶差分、二阶差分参数。
S122:利用神经网络算法对所述个人语音MFCC特征进行训练,生成个人识别模型。
提取了所述个人语音MFCC特征以后,利用神经网络算法对所述个人语音MFCC特征进行训练,生成个人识别模型。
S13:关联所述个人识别模型与所述个人身份信息;
在本发明实施例中,关联所述个人识别模型与所述个人身份信息,使所述个人识别模型与所述个人身份信息产生联结关系,即关联所述个人识别模型和相关人员的姓名,使所述个人识别模型与相关人员的姓名产生联结关系。
S14:集合多个所述个人识别模型和相关联的多个所述个人身份信息,生成相关人员识别模型库;
在本发明实施例中,集合所有相关人员的多个所述个人识别模型和相关联的多个所述个人身份信息,生成相关人员识别模型库,即集合所有相关人员的多个所述个人识别模型和相关联的多个姓名,生成相关人员识别模型库。
S15:采集识别人员的个人声纹信息;
在开展调度业务时,通过电话实时采集识别人员的个人声纹信息。
S16:利用所述个人声纹信息,并采用声纹辨认方法,在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息;
声纹辨认是指判定待测试声纹信息属于所述相关人员识别模型库中的哪一个人,是一个“多选一”的过程;声纹辨认包括开集识别和闭集识别,开集识别指的是待测试声纹信息可能不属于所述相关人员识别模型库中的任意一位,闭集识别指的是待测试声纹信息必定属于所述相关人员识别模型库中的任意一位,在本发明实施例中,优选采用闭集识别,以提高识别效率。
图3是本发明实施例中S16的具体流程示意图。
在本发明实施例中,所述利用所述个人声纹信息,并采用声纹辨认方法,在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息,具体包括:
S161:比对所述个人声纹信息与所述相关人员识别模型库,结合概率模型法得到所述相关人员模型库中个人模型的相似性打分;
优选地,所述概率模型法基于高斯混合算法并利用M个多位高斯分布加权得到,能有效提高相似性打分的准确率。
S162:对所述相似性打分进行相似性打分判别,根据所述相似性打分判别初步确认所述识别人员的个人身份信息。
相似性打分判别是指,当所述个人声纹信息与所述相关人员识别模型库中个人识别模型的相似性打分高于预设值,判别所述个人声纹信息属于个人识别模型,则根据所述个人识别模型的关联关系确认所述识别人员的个人身份信息,即确认所述识别人员的姓名;当所述个人声纹信息与所述相关人员识别模型库中个人识别模型的相似性打分低于预设值,判断所述识别人员不是合格人员。
S17:利用所述个人声纹信息,并采用声纹确认方法,二次确认所述识别人员的个人身份信息;
声纹确认是确定待测试声纹信息是否来自目标人员,是一个“一对一”的判决问题。
图4是本发明实施例中S17的具体流程示意图。
所述利用所述个人声纹信息,并采用声纹确认方法,二次确认所述识别人员的个人身份信息,具体包括:
S171:利用语音识别技术,识别所述个人声纹信息中的声纹身份信息;
为了提升声纹确认效率,在本发明实施例中,声纹确认使用的文本相关方式,文本相关方式是指识别人员必须按照事先指定的文本内容进行发音,具体实施中,识别人员需要自报姓名,利用语音识别技术,识别所述个人声纹信息中的声纹身份信息,即识别出所述个人声纹信息中包含的姓名。
S172:对所述声纹身份信息与所述识别人员的个人身份信息进行一致性判断,获取一致性判断结果;
在本发明实施例中,识别出识别人员自报的姓名,同时在S16步骤初步确认所述识别人员的姓名,对所述声纹身份信息与所述识别人员的个人身份信息进行一致性判断,获取一致性判断结果,即对所述识别人员自报的姓名和在S16步骤初步确认的所述识别人员的姓名进行一致性判断,获取一致性判断结果。
S173:根据所述一致性判断结果二次确认所述识别人员的个人身份信息。
在本发明实施例中,当所述一致性判断结果为一致时,可以二次确认所述识别人员的个人身份信息,当所述一致性判断结果为不一致时,为了安全起见,判断所述识别人员不是合格人员。
S18:匹配校验所述识别人员的个人身份信息与合格人员名单;
图5是本发明实施例中S18的具体流程示意图。
在本发明实施例中,所述匹配校验所述识别人员的个人身份信息与合格人员名单,具体包括:
S181:录入合格人员名单;
S182:判断所述识别人员的个人身份信息是否在所述合格人员名单中;
S183:若所述识别人员的个人身份信息不在所述合格人员名单中,则产生语音告警信号;
在本发明实施例中,首先需要录入合格人员名单,合格人员是指通过“三种人”资格考试并获得受令资格的人员,所述合格人员名单包含合格人员的姓名;然后,判断所述识别人员的个人身份信息是否在所述合格人员名单中,若所述识别人员的个人身份信息在所述合格人员名单中,则可以确保对方是合格人员,可以进行调度业务;若所述识别人员的个人身份信息不在所述合格人员名单中,则产生语音告警信号,可以通过语音告警的方式提醒调度员注意所述识别人员的身份。
图6是本发明实施例中远程身份认证系统的具体组成示意图。
另外,本发明实施例提供了一种基于声纹识别技术的远程身份认证系统,所述远程身份认证系统包括:
样本采集模块:用于采集相关人员的个人语音样本和个人身份信息;
模型生成模块:用于利用所述个人语音样本,生成个人识别模型;
图7是本发明实施例中模型生成模块的组成示意图。
具体的,所述模型生成模块包括:
特征提取单元:用于提取所述个人语音样本的个人语音MFCC特征;
模型生成单元:用于利用神经网络算法对所述个人语音MFCC特征进行训练,生成个人识别模型。
关联模块:用于关联所述个人识别模型与所述个人身份信息;
模型库生成模块:用于集合多个所述个人识别模型和相关联的多个所述个人身份信息,生成相关人员识别模型库;
声纹采集模块:用于采集识别人员的个人声纹信息;
声纹辨认模块:用于利用所述个人声纹信息,并采用声纹辨认方法,在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息;
图8是本发明实施例中声纹辨认模块的组成示意图。
具体的,所述声纹辨认模块包括:
比对单元:用于比对所述个人声纹信息与所述相关人员识别模型库,结合概率模型法得到所述相关人员模型库中个人模型的相似性打分;
确认单元:用于对所述相似性打分进行相似性打分判别,根据所述相似性打分判别初步确认所述识别人员的个人身份信息。
声纹确认模块:用于利用所述个人声纹信息,并采用声纹确认方法,二次确认所述识别人员的个人身份信息;
图9是本发明实施例中声纹确认模块的组成示意图。
具体的,所述声纹确认模块包括:
识别单元:用于利用语音识别技术,识别所述个人声纹信息中的声纹身份信息;
一致性判断单元:用于对所述声纹身份信息与所述识别人员的个人身份信息进行一致性判断,获取一致性判断结果;
二次确认单元:用于根据所述一致性判断结果二次确认所述识别人员的个人身份信息。
匹配校验模块:用于匹配校验所述识别人员的个人身份信息与合格人员名单。
图10是本发明实施例中匹配校验模块的组成示意图。
具体的,所述匹配校验模块包括:
录入单元:用于录入合格人员名单;
名单判断单元:用于判断所述识别人员的个人身份信息是否在所述合格人员名单中;
语音告警单元:用于产生语音告警信号;
本发明实施例提供了一种基于声纹识别技术的远程身份认证方法及系统,在开展调度业务时,采用所述远程身份认证方法及系统可以结合声纹识别身份认证技术和语音识别身份认证技术来智能识别对方是否为合格人员,若所述识别人员的个人身份信息不在所述合格人员名单中,则产生语音告警信号,可以通过语音告警的方式提醒调度员注意所述识别人员的身份,消除调度电话业务无法辨识对方身份的盲点,百分百确认对方身份,确保对方是合格人员,确保对方业务技能达标,避免造成安全隐患。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,ReadOnly Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或光盘等。
另外,以上对本发明实施例所提供的一种基于声纹识别技术的远程身份认证方法及系统进行了详细介绍,本文中应采用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于声纹识别技术的远程身份认证方法,其特征在于,所述远程身份认证方法包括:
采集相关人员的个人语音样本和个人身份信息;
利用所述个人语音样本,生成个人识别模型;
关联所述个人识别模型与所述个人身份信息;
集合多个所述个人识别模型和相关联的多个所述个人身份信息,生成相关人员识别模型库;
采集识别人员的个人声纹信息;
利用所述个人声纹信息,并采用声纹辨认方法,在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息;
利用所述个人声纹信息,并采用声纹确认方法,二次确认所述识别人员的个人身份信息;
匹配校验所述识别人员的个人身份信息与合格人员名单。
2.根据权利要求1所述的远程身份认证方法,其特征在于,所述利用所述个人语音样本,生成个人识别模型,包括:
提取所述个人语音样本的个人语音MFCC特征;
利用神经网络算法对所述个人语音MFCC特征进行训练,生成个人识别模型。
3.根据权利要求1所述的远程身份认证方法,其特征在于,所述利用所述个人声纹信息,并采用声纹辨认方法,在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息,包括:
比对所述个人声纹信息与所述相关人员识别模型库,结合概率模型法得到所述相关人员模型库中个人模型的相似性打分;
对所述相似性打分进行相似性打分判别,根据所述相似性打分判别初步确认所述识别人员的个人身份信息。
4.根据权利要求3所述的远程身份认证方法,其特征在于,所述概率模型法基于高斯混合算法并利用M个多位高斯分布加权得到。
5.根据权利要求1所述的远程身份认证方法,其特征在于,所述利用所述个人声纹信息,并采用声纹确认方法,二次确认所述识别人员的个人身份信息,包括:
利用语音识别技术,识别所述个人声纹信息中的声纹身份信息;
对所述声纹身份信息与所述识别人员的个人身份信息进行一致性判断,获取一致性判断结果;
根据所述一致性判断结果二次确认所述识别人员的个人身份信息。
6.根据权利要求1所述的远程身份认证方法,其特征在于,所述匹配校验所述识别人员的个人身份信息与合格人员名单,包括:
录入合格人员名单;
判断所述识别人员的个人身份信息是否在所述合格人员名单中;
若所述识别人员的个人身份信息不在所述合格人员名单中,则产生语音告警信号。
7.一种基于声纹识别技术的远程身份认证系统,其特征在于,所述远程身份认证系统包括:
样本采集模块:用于采集相关人员的个人语音样本和个人身份信息;
模型生成模块:用于利用所述个人语音样本,生成个人识别模型;
关联模块:用于关联所述个人识别模型与所述个人身份信息;
模型库生成模块:用于集合多个所述个人识别模型和相关联的多个所述个人身份信息,生成相关人员识别模型库;
声纹采集模块:用于采集识别人员的个人声纹信息;
声纹辨认模块:用于利用所述个人声纹信息,并采用声纹辨认方法,在所述相关人员识别模型库中初步确认所述识别人员的个人身份信息;
声纹确认模块:用于利用所述个人声纹信息,并采用声纹确认方法,二次确认所述识别人员的个人身份信息;
匹配校验模块:用于匹配校验所述识别人员的个人身份信息与合格人员名单。
8.根据权利要求7所述的远程身份认证系统,其特征在于,所述模型生成模块包括:
特征提取单元:用于提取所述个人语音样本的个人语音MFCC特征;
模型生成单元:用于利用神经网络算法对所述个人语音MFCC特征进行训练,生成个人识别模型。
9.根据权利要求7所述的远程身份认证系统,其特征在于,所述声纹辨认模块包括:
比对单元:用于比对所述个人声纹信息与所述相关人员识别模型库,结合概率模型法得到所述相关人员模型库中个人模型的相似性打分;
确认单元:用于对所述相似性打分进行相似性打分判别,根据所述相似性打分判别初步确认所述识别人员的个人身份信息。
10.根据权利要求7所述的远程身份认证系统,其特征在于,所述声纹确认模块包括:
识别单元:用于利用语音识别技术,识别所述个人声纹信息中的声纹身份信息;
一致性判断单元:用于对所述声纹身份信息与所述识别人员的个人身份信息进行一致性判断,获取一致性判断结果;
二次确认单元:用于根据所述一致性判断结果二次确认所述识别人员的个人身份信息。
CN202011173448.5A 2020-10-28 2020-10-28 一种基于声纹识别技术的远程身份认证方法及系统 Pending CN112164404A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011173448.5A CN112164404A (zh) 2020-10-28 2020-10-28 一种基于声纹识别技术的远程身份认证方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011173448.5A CN112164404A (zh) 2020-10-28 2020-10-28 一种基于声纹识别技术的远程身份认证方法及系统

Publications (1)

Publication Number Publication Date
CN112164404A true CN112164404A (zh) 2021-01-01

Family

ID=73865064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011173448.5A Pending CN112164404A (zh) 2020-10-28 2020-10-28 一种基于声纹识别技术的远程身份认证方法及系统

Country Status (1)

Country Link
CN (1) CN112164404A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112992156A (zh) * 2021-02-05 2021-06-18 浙江浙达能源科技有限公司 一种基于声纹认证的配电网调度身份认证系统
CN113488061A (zh) * 2021-08-05 2021-10-08 国网江苏省电力有限公司 基于改进Synth2Aug的配网调度员身份验证方法及系统
CN116612762A (zh) * 2023-05-05 2023-08-18 中山大学附属第六医院 基于声纹识别的医患身份核对方法、系统、装置及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324232A (zh) * 2011-09-12 2012-01-18 辽宁工业大学 基于高斯混合模型的声纹识别方法及系统
CN102780706A (zh) * 2012-08-14 2012-11-14 俞琳 基于电力系统业务的用户认证方法
CN103106717A (zh) * 2013-01-25 2013-05-15 上海第二工业大学 基于声纹识别的智能仓库声控门卫系统及其身份认证方法
CN103313249A (zh) * 2013-05-07 2013-09-18 百度在线网络技术(北京)有限公司 用于终端的提醒方法、系统和服务器
CN103971690A (zh) * 2013-01-28 2014-08-06 腾讯科技(深圳)有限公司 一种声纹识别方法和装置
CN109243465A (zh) * 2018-12-06 2019-01-18 平安科技(深圳)有限公司 声纹认证方法、装置、计算机设备以及存储介质
CN110310647A (zh) * 2017-09-29 2019-10-08 腾讯科技(深圳)有限公司 一种语音身份特征提取器、分类器训练方法及相关设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102324232A (zh) * 2011-09-12 2012-01-18 辽宁工业大学 基于高斯混合模型的声纹识别方法及系统
CN102780706A (zh) * 2012-08-14 2012-11-14 俞琳 基于电力系统业务的用户认证方法
CN103106717A (zh) * 2013-01-25 2013-05-15 上海第二工业大学 基于声纹识别的智能仓库声控门卫系统及其身份认证方法
CN103971690A (zh) * 2013-01-28 2014-08-06 腾讯科技(深圳)有限公司 一种声纹识别方法和装置
CN103313249A (zh) * 2013-05-07 2013-09-18 百度在线网络技术(北京)有限公司 用于终端的提醒方法、系统和服务器
CN110310647A (zh) * 2017-09-29 2019-10-08 腾讯科技(深圳)有限公司 一种语音身份特征提取器、分类器训练方法及相关设备
CN109243465A (zh) * 2018-12-06 2019-01-18 平安科技(深圳)有限公司 声纹认证方法、装置、计算机设备以及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112992156A (zh) * 2021-02-05 2021-06-18 浙江浙达能源科技有限公司 一种基于声纹认证的配电网调度身份认证系统
CN113488061A (zh) * 2021-08-05 2021-10-08 国网江苏省电力有限公司 基于改进Synth2Aug的配网调度员身份验证方法及系统
CN113488061B (zh) * 2021-08-05 2024-02-23 国网江苏省电力有限公司 基于改进Synth2Aug的配网调度员身份验证方法及系统
CN116612762A (zh) * 2023-05-05 2023-08-18 中山大学附属第六医院 基于声纹识别的医患身份核对方法、系统、装置及存储介质
CN116612762B (zh) * 2023-05-05 2023-12-26 中山大学附属第六医院 基于声纹识别的医患身份核对方法、系统、装置及存储介质

Similar Documents

Publication Publication Date Title
CN112164404A (zh) 一种基于声纹识别技术的远程身份认证方法及系统
Sithara et al. Study of MFCC and IHC feature extraction methods with probabilistic acoustic models for speaker biometric applications
CN113823293B (zh) 一种基于语音增强的说话人识别方法及系统
Asda et al. Development of Quran reciter identification system using MFCC and neural network
CN102496366B (zh) 一种与文本无关的说话人识别方法
Sekkate et al. Speaker identification for OFDM-based aeronautical communication system
Mary et al. Analysis and detection of mimicked speech based on prosodic features
Al-Karawi et al. Using combined features to improve speaker verification in the face of limited reverberant data
Iwok et al. Evaluation of Machine Learning Algorithms using Combined Feature Extraction Techniques for Speaker Identification
Ranjan Speaker Recognition and Performance Comparison based on Machine Learning
Moinuddin et al. Speaker Identification based on GFCC using GMM
Nagaraja et al. Multilingual speaker identification with the constraint of limited data using multitaper MFCC
Nagakrishnan et al. Generic speech based person authentication system with genuine and spoofed utterances: different feature sets and models
Mansour et al. A comparative study in emotional speaker recognition in noisy environment
Chelali et al. MFCC and vector quantization for Arabic fricatives speech/speaker recognition
Bashar et al. Text-independent speaker identification system using average pitch and formant analysis
Nguyen et al. Vietnamese speaker authentication using deep models
Al-Qaisi Arabic word dependent speaker identification system using artificial neural network
Zouhir et al. Robust speaker recognition based on biologically inspired features
Islam Modified mel-frequency cepstral coefficients (MMFCC) in robust text-dependent speaker identification
Dawande et al. Analysis of different feature extraction techniques for speaker recognition system: A review
Chaudhari et al. Effect of varying MFCC filters for speaker recognition
Corsi Speaker recognition: A survey
Soltane et al. An Intelligent Text Independent Speaker Identification Using VQ-GMM Model Based Multiple Classifier System
Revathi et al. Use of perceptual features in iterative clustering based twins identification system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210101