CN110610709A - 基于声纹识别的身份辨别方法 - Google Patents
基于声纹识别的身份辨别方法 Download PDFInfo
- Publication number
- CN110610709A CN110610709A CN201910916553.4A CN201910916553A CN110610709A CN 110610709 A CN110610709 A CN 110610709A CN 201910916553 A CN201910916553 A CN 201910916553A CN 110610709 A CN110610709 A CN 110610709A
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- sample
- user
- voice
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000013598 vector Substances 0.000 claims abstract description 85
- 230000006870 function Effects 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 18
- 238000013135 deep learning Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000012360 testing method Methods 0.000 claims abstract description 15
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 239000012634 fragment Substances 0.000 claims abstract description 7
- 238000013467 fragmentation Methods 0.000 claims abstract description 7
- 238000006062 fragmentation reaction Methods 0.000 claims abstract description 7
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/18—Artificial neural networks; Connectionist approaches
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及语音识别领域,尤其涉及基于声纹识别的身份辨别方法,包括:基于语料库通过深度学习算法训练声纹模型;将用户的样本语音输入训练完成的声纹模型得到样本声纹特征向量,并将样本声纹特征向量注册到声纹数据库;采集用户接听时的外呼语音,通过vad算法实时将外呼语音进行分片处理,得到若干段语音;将分片处理后的外呼语音分别输入训练完成的声纹模型,得到对应的测试声纹特征向量;基于测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量,通过余弦相似度函数进行相似度计算;根据计算得到的相似度,判断外呼语音是否为同一用户所发出。本发明实现外呼过程中,判别机主是否有换人接听。
Description
技术领域
本发明涉及语音识别领域,尤其涉及基于声纹识别的身份辨别方法。
背景技术
声纹识别是根据语音中的波长、频率以及强度等百余种特征维度,识别说话人身份的一种人工智能技术。由于声纹识别具有安全可靠性,有着非常多的应用场景,如公共安全、金融、社保、智能硬件等多个领域。
随着人工智能的发展,人们对声纹识别系统的要求也在逐步提高,有更快的识别速度、更低的使用成本、更准确的识别。但是由于应用场景的不同,往往遇到很多问题,使用通用的声纹识别系统会导致识别结果不尽人意。
针对机器人智能外呼的场景,机器人无法识别通话过程中机主是否有换其他人来接听。
发明内容
为解决上述问题,本发明提出基于声纹识别的身份辨别方法,以判断通话过程中机主是否有换其他人来接听。
基于声纹识别的身份辨别方法,包括:
基于语料库通过深度学习算法训练声纹模型;
将用户的样本语音输入训练完成的声纹模型得到样本声纹特征向量,并将样本声纹特征向量注册到声纹数据库;
采集用户接听时的外呼语音,通过vad算法实时将外呼语音进行分片处理,得到若干段语音;
将分片处理后的外呼语音分别输入训练完成的声纹模型,得到对应的测试声纹特征向量;
基于测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量,通过余弦相似度函数进行相似度计算;
根据计算得到的相似度,判断外呼语音是否为同一用户所发出。
优选的,所述基于语料库训练声纹模型包括:
从特定说话人中选取一句话,标记为锚样本;
从同一说话人中选取的另外一句话,标记为正样本;
从不同说话人选取的一句话,标记为负样本;
将锚样本和正样本进行训练时,让其结果尽可能接近于1;
将锚样本和负样本进行训练时,让其结果尽可能接近于0。
所述基于语料库通过深度学习算法训练声纹模型还包括:
将划分好的样本放到到神经网络中的输入层进行训练;
为避免模型过早陷入局部最优点,在输出层加入softmax函数,对结果进行归一化处理;
并输入到交叉熵损失函数,得到模型的损失值;
通过反向传播不断迭代参数,使得模型的损失最小化,最终得到声纹模型。
优选的,所述将用户的样本语音输入训练完成的声纹模型得到样本声纹特征向量,并将样本声纹特征向量注册到声纹数据库包括:
获取用户的样本语音,通过训练完成的声纹模型得到样本声纹特征向量,获取对应的特征向量i-vector或d-vector;
对特征向量i-vector或d-vector求均值,得到用户的样本声纹特征向量;
将用户id和对应的样本声纹特征向量注册到声纹数据库。
优选的,所述基于测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量,通过余弦相似度函数进行相似度计算包括:
使用余弦相似度函数计算测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量相似度得到评估分数;
根据评估分数得到每段语音对应的评估分数向量;
再通过softmax层将分数进行归一化,转化为相似的概率。
优选的,所述根据计算得到的相似度,判断外呼语音是否为同一用户所发出包括:
当相似的概率大于等于设定阈值时,判断外呼语音为同一用户所发出;
当相似的概率小于设定阈值时,判断外呼语音为不同用户所发出。
本发明具备以下有益效果:
1.将用户的样本语音输入训练完成的声纹模型得到样本声纹特征向量,并将样本声纹特征向量注册到声纹数据库;采集用户接听时的外呼语音,通过vad算法实时将外呼语音进行分片处理,得到若干段语音;将分片处理后的外呼语音分别输入训练完成的声纹模型,得到对应的测试声纹特征向量;基于测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量,通过余弦相似度函数进行相似度计算;根据计算得到的相似度,判断外呼语音是否为同一用户所发出,从而判别外呼过程中,机主是否有换人接听;
2.通过深度学习算法训练声纹模型,无需考虑信道、设备等其他因素的干扰,从而保证了较高的辨别准确率。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1是本发明实施例一种基于声纹识别的身份辨别方法的流程图;
图2是本发明实施例一种基于声纹识别的身份辨别方法中步骤S2的流程图;
图3是本发明实施例一种基于声纹识别的身份辨别方法中步骤S5的流程图。
具体实施方式
以下结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
本发明的基本思想是基于语料库通过深度学习算法训练声纹模型;将用户的样本语音输入训练完成的声纹模型得到样本声纹特征向量,并将样本声纹特征向量注册到声纹数据库;采集用户接听时的外呼语音,通过vad算法实时将外呼语音进行分片处理,得到若干段语音;将分片处理后的外呼语音分别输入训练完成的声纹模型,得到对应的测试声纹特征向量;基于测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量,通过余弦相似度函数进行相似度计算;根据计算得到的相似度,判断外呼语音是否为同一用户所发出,从而判别外呼过程中,机主是否有换人接听。
基于以上构思,本发明实施例提出一种基于声纹识别的身份辨别方法,如图 1所示,包括以下步骤:
S1:基于语料库通过深度学习算法训练声纹模型;
S2:将用户的样本语音输入训练完成的声纹模型得到样本声纹特征向量,并将样本声纹特征向量注册到声纹数据库;
S3:采集用户接听时的外呼语音,通过vad算法实时将外呼语音进行分片处理,得到若干段语音;
S4:将分片处理后的外呼语音分别输入训练完成的声纹模型,得到对应的测试声纹特征向量;
S5:基于测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量,通过余弦相似度函数进行相似度计算;
S6:根据计算得到的相似度,判断外呼语音是否为同一用户所发出。
深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或语音识别)。
在本实施例中,通过深度学习算法训练声纹模型,无需考虑信道、设备等其他因素的干扰,从而保证了较高的辨别准确率。
在本实施例中,基于语料库通过深度学习算法训练声纹模型的方法为:
从特定说话人中选取一句话,标记为锚样本;从同一说话人中选取的另外一句话,标记为正样本;从不同说话人选取的一句话,标记为负样本;将锚样本和正样本进行训练时,让其结果尽可能接近于1;将锚样本和负样本进行训练时,让其结果尽可能接近于0。将锚样本和正样本进行训练时,我们要让其结果尽可能接近,即结果接近于1。将锚样本和负样本进行训练时,我们要让其结果尽可能远离,即结果接近于0。
准备好了训练数据,为了避免过训练时早陷入局部最优点,使用了Softmax+ 交叉熵预训练方法,最终得到声纹模型。具体的,首先将划分好的样本放到到神经网络中的输入层进行训练,为避免模型过早陷入局部最优点,在输出层加入 softmax函数,对结果进行归一化处理,并输入到交叉熵损失函数,得到模型的损失值,通过反向传播不断迭代参数、使得模型的损失最小化,最终得到最优的预训练模型,即声纹模型。
在本实施例中,如图2所示,将用户的样本语音输入训练完成的声纹模型得到样本声纹特征向量,并将样本声纹特征向量注册到声纹数据库的方法为:
S21:获取用户的样本语音,通过训练完成的声纹模型得到样本声纹特征向量,获取对应的特征向量i-vector或d-vector;
S22:对特征向量i-vector或d-vector求均值,得到用户的样本声纹特征向量;
S23:将用户id和对应的样本声纹特征向量注册到声纹数据库。
用户id与其样本声纹特征向量一一对应,并将用户id与其样本声纹特征向量注册到声纹数据库。当需要对另一用户进行身份辨别时,首先根据其用户id,在声纹数据库中搜索是否存在相同的用户id。当声纹数据库中存在相同的用户id时,说明该用户的声纹特征向量已经注册到声纹数据库;当声纹数据库中不存在相同的用户id时,说明该用户的声纹特征向量未注册到声纹数据库。若该用户在声纹数据库中已经注册有样本声纹特征量,则不需要进行声纹特征向量的提取。
为提高身份识别的准确度,在采集用户接听时的外呼语音后,通过vad算法实时将外呼语音进行分片处理,得到若干段语音。在本实施例中通过对每小段语音进行辨别,相对于一大段语音进行辨别,更能够实现身份的辨别。
在本实施例中,通过对外呼语音的实时采集以及实时的分片处理,从而实现对用户身份的实时识别。
在本实施例中,如图3所示,基于测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量,通过余弦相似度函数进行相似度计算的方法为:
S51:使用余弦相似度函数计算测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量相似度得到评估分数;
S52:根据评估分数得到每段语音对应的评估分数向量;
S53:再通过softmax层将分数进行归一化,转化为相似的概率。
在本实施例中,根据计算得到的相似度,判断外呼语音是否为同一用户所发出的方法为:
当相似的概率大于等于设定阈值时,判断外呼语音为同一用户所发出;
当相似的概率小于设定阈值时,判断外呼语音为不同用户所发出。
每段语音通过上述步骤的处理均可以得到其相似的概率,通过与设定阈值的比较来判断该段语音是否为同一用户发出,并根据判断的结果在该段语音上打标,便于后续的追踪处理。
本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (6)
1.基于声纹识别的身份辨别方法,其特征在于,包括:
基于语料库通过深度学习算法训练声纹模型;
将用户的样本语音输入训练完成的声纹模型得到样本声纹特征向量,并将样本声纹特征向量注册到声纹数据库;
采集用户接听时的外呼语音,通过vad算法实时将外呼语音进行分片处理,得到若干段语音;
将分片处理后的外呼语音分别输入训练完成的声纹模型,得到对应的测试声纹特征向量;
基于测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量,通过余弦相似度函数进行相似度计算;
根据计算得到的相似度,判断外呼语音是否为同一用户所发出。
2.根据权利要求1所述的基于声纹识别的身份辨别方法,其特征在于,所述基于语料库通过深度学习算法训练声纹模型包括:
从特定说话人中选取一句话,标记为锚样本;
从同一说话人中选取的另外一句话,标记为正样本;
从不同说话人选取的一句话,标记为负样本;
将锚样本和正样本进行训练时,让其结果尽可能接近于1;
将锚样本和负样本进行训练时,让其结果尽可能接近于0。
3.根据权利要求2所述的基于声纹识别的身份辨别方法,其特征在于,所述基于语料库通过深度学习算法训练声纹模型还包括:
将划分好的样本放到到神经网络中的输入层进行训练;
为避免模型过早陷入局部最优点,在输出层加入softmax函数,对结果进行归一化处理;
并输入到交叉熵损失函数,得到模型的损失值;
通过反向传播不断迭代参数,使得模型的损失最小化,最终得到声纹模型。
4.根据权利要求1所述的基于声纹识别的身份辨别方法,其特征在于,所述将用户的样本语音输入训练完成的声纹模型得到样本声纹特征向量,并将样本声纹特征向量注册到声纹数据库包括:
获取用户的样本语音,通过训练完成的声纹模型得到样本声纹特征向量,获取对应的特征向量i-vector或d-vector;
对特征向量i-vector或d-vector求均值,得到用户的样本声纹特征向量;
将用户id和对应的样本声纹特征向量注册到声纹数据库。
5.根据权利要求1所述的基于声纹识别的身份辨别方法,其特征在于,所述基于测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量,通过余弦相似度函数进行相似度计算包括:
使用余弦相似度函数计算测试声纹特征向量与声纹数据库中该用户的样本声纹特征向量相似度得到评估分数;
根据评估分数得到每段语音对应的评估分数向量;
再通过softmax层将分数进行归一化,转化为相似的概率。
6.根据权利要求5所述的基于声纹识别的身份辨别方法,其特征在于,所述根据计算得到的相似度,判断外呼语音是否为同一用户所发出包括:
当相似的概率大于等于设定阈值时,判断外呼语音为同一用户所发出;
当相似的概率小于设定阈值时,判断外呼语音为不同用户所发出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910916553.4A CN110610709A (zh) | 2019-09-26 | 2019-09-26 | 基于声纹识别的身份辨别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910916553.4A CN110610709A (zh) | 2019-09-26 | 2019-09-26 | 基于声纹识别的身份辨别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110610709A true CN110610709A (zh) | 2019-12-24 |
Family
ID=68893430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910916553.4A Pending CN110610709A (zh) | 2019-09-26 | 2019-09-26 | 基于声纹识别的身份辨别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110610709A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111416911A (zh) * | 2019-12-31 | 2020-07-14 | 国网浙江省电力有限公司金华供电公司 | 一种基于人工智能的外呼系统呼叫平台 |
CN111524521A (zh) * | 2020-04-22 | 2020-08-11 | 北京小米松果电子有限公司 | 声纹提取模型训练方法和声纹识别方法、及其装置和介质 |
CN111599345A (zh) * | 2020-04-03 | 2020-08-28 | 厦门快商通科技股份有限公司 | 语音识别算法评估方法、系统、移动终端及存储介质 |
CN112418191A (zh) * | 2021-01-21 | 2021-02-26 | 深圳阜时科技有限公司 | 指纹识别模型构建方法、存储介质及计算机设备 |
CN112435673A (zh) * | 2020-12-15 | 2021-03-02 | 北京声智科技有限公司 | 一种模型训练方法及电子终端 |
CN112565242A (zh) * | 2020-12-02 | 2021-03-26 | 携程计算机技术(上海)有限公司 | 基于声纹识别的远程授权方法、系统、设备及存储介质 |
CN112738344A (zh) * | 2020-12-28 | 2021-04-30 | 北京三快在线科技有限公司 | 一种识别用户身份的方法、装置、存储介质及电子设备 |
CN112992154A (zh) * | 2021-05-08 | 2021-06-18 | 北京远鉴信息技术有限公司 | 一种基于增强型声纹库的语音身份确定方法及系统 |
CN113327617A (zh) * | 2021-05-17 | 2021-08-31 | 西安讯飞超脑信息科技有限公司 | 声纹判别方法、装置、计算机设备和存储介质 |
CN113327618A (zh) * | 2021-05-17 | 2021-08-31 | 西安讯飞超脑信息科技有限公司 | 声纹判别方法、装置、计算机设备和存储介质 |
CN113555022A (zh) * | 2021-07-23 | 2021-10-26 | 平安科技(深圳)有限公司 | 基于语音的同人识别方法、装置、设备及存储介质 |
CN115223565A (zh) * | 2021-06-29 | 2022-10-21 | 达闼机器人股份有限公司 | 声纹注册方法、装置、介质和电子设备 |
CN118212927A (zh) * | 2024-03-07 | 2024-06-18 | 中科世通亨奇(北京)科技有限公司 | 基于声音特征的身份识别方法、系统、存储介质及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108091326A (zh) * | 2018-02-11 | 2018-05-29 | 张晓雷 | 一种基于线性回归的声纹识别方法及系统 |
CN108766445A (zh) * | 2018-05-30 | 2018-11-06 | 苏州思必驰信息科技有限公司 | 声纹识别方法及系统 |
CN108899032A (zh) * | 2018-06-06 | 2018-11-27 | 平安科技(深圳)有限公司 | 声纹识别方法、装置、计算机设备及存储介质 |
CN109166586A (zh) * | 2018-08-02 | 2019-01-08 | 平安科技(深圳)有限公司 | 一种识别说话人的方法及终端 |
CN109903774A (zh) * | 2019-04-12 | 2019-06-18 | 南京大学 | 一种基于角度间隔损失函数的声纹识别方法 |
US20190272829A1 (en) * | 2017-02-16 | 2019-09-05 | Ping An Technology (Shenzhen) Co., Ltd. | Voiceprint recognition method, device, storage medium and background server |
-
2019
- 2019-09-26 CN CN201910916553.4A patent/CN110610709A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190272829A1 (en) * | 2017-02-16 | 2019-09-05 | Ping An Technology (Shenzhen) Co., Ltd. | Voiceprint recognition method, device, storage medium and background server |
CN108091326A (zh) * | 2018-02-11 | 2018-05-29 | 张晓雷 | 一种基于线性回归的声纹识别方法及系统 |
CN108766445A (zh) * | 2018-05-30 | 2018-11-06 | 苏州思必驰信息科技有限公司 | 声纹识别方法及系统 |
CN108899032A (zh) * | 2018-06-06 | 2018-11-27 | 平安科技(深圳)有限公司 | 声纹识别方法、装置、计算机设备及存储介质 |
CN109166586A (zh) * | 2018-08-02 | 2019-01-08 | 平安科技(深圳)有限公司 | 一种识别说话人的方法及终端 |
CN109903774A (zh) * | 2019-04-12 | 2019-06-18 | 南京大学 | 一种基于角度间隔损失函数的声纹识别方法 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111416911A (zh) * | 2019-12-31 | 2020-07-14 | 国网浙江省电力有限公司金华供电公司 | 一种基于人工智能的外呼系统呼叫平台 |
CN111599345A (zh) * | 2020-04-03 | 2020-08-28 | 厦门快商通科技股份有限公司 | 语音识别算法评估方法、系统、移动终端及存储介质 |
CN111524521A (zh) * | 2020-04-22 | 2020-08-11 | 北京小米松果电子有限公司 | 声纹提取模型训练方法和声纹识别方法、及其装置和介质 |
CN111524521B (zh) * | 2020-04-22 | 2023-08-08 | 北京小米松果电子有限公司 | 声纹提取模型训练方法和声纹识别方法、及其装置和介质 |
CN112565242A (zh) * | 2020-12-02 | 2021-03-26 | 携程计算机技术(上海)有限公司 | 基于声纹识别的远程授权方法、系统、设备及存储介质 |
CN112435673B (zh) * | 2020-12-15 | 2024-05-14 | 北京声智科技有限公司 | 一种模型训练方法及电子终端 |
CN112435673A (zh) * | 2020-12-15 | 2021-03-02 | 北京声智科技有限公司 | 一种模型训练方法及电子终端 |
CN112738344B (zh) * | 2020-12-28 | 2022-12-09 | 北京三快在线科技有限公司 | 一种识别用户身份的方法、装置、存储介质及电子设备 |
CN112738344A (zh) * | 2020-12-28 | 2021-04-30 | 北京三快在线科技有限公司 | 一种识别用户身份的方法、装置、存储介质及电子设备 |
CN112418191A (zh) * | 2021-01-21 | 2021-02-26 | 深圳阜时科技有限公司 | 指纹识别模型构建方法、存储介质及计算机设备 |
CN112992154A (zh) * | 2021-05-08 | 2021-06-18 | 北京远鉴信息技术有限公司 | 一种基于增强型声纹库的语音身份确定方法及系统 |
CN113327617A (zh) * | 2021-05-17 | 2021-08-31 | 西安讯飞超脑信息科技有限公司 | 声纹判别方法、装置、计算机设备和存储介质 |
CN113327618A (zh) * | 2021-05-17 | 2021-08-31 | 西安讯飞超脑信息科技有限公司 | 声纹判别方法、装置、计算机设备和存储介质 |
CN113327617B (zh) * | 2021-05-17 | 2024-04-19 | 西安讯飞超脑信息科技有限公司 | 声纹判别方法、装置、计算机设备和存储介质 |
CN113327618B (zh) * | 2021-05-17 | 2024-04-19 | 西安讯飞超脑信息科技有限公司 | 声纹判别方法、装置、计算机设备和存储介质 |
CN115223565A (zh) * | 2021-06-29 | 2022-10-21 | 达闼机器人股份有限公司 | 声纹注册方法、装置、介质和电子设备 |
CN113555022A (zh) * | 2021-07-23 | 2021-10-26 | 平安科技(深圳)有限公司 | 基于语音的同人识别方法、装置、设备及存储介质 |
CN118212927A (zh) * | 2024-03-07 | 2024-06-18 | 中科世通亨奇(北京)科技有限公司 | 基于声音特征的身份识别方法、系统、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110610709A (zh) | 基于声纹识别的身份辨别方法 | |
CN110491416B (zh) | 一种基于lstm和sae的电话语音情感分析与识别方法 | |
CN109559736B (zh) | 一种基于对抗网络的电影演员自动配音方法 | |
CN107222865A (zh) | 基于可疑行为识别的通讯诈骗实时检测方法和系统 | |
CN112435673B (zh) | 一种模型训练方法及电子终端 | |
CN113571067B (zh) | 一种基于边界攻击的声纹识别对抗样本生成方法 | |
CN106683661A (zh) | 基于语音的角色分离方法及装置 | |
CN110211594B (zh) | 一种基于孪生网络模型和knn算法的说话人识别方法 | |
CN110120230B (zh) | 一种声学事件检测方法及装置 | |
CN108876951A (zh) | 一种基于声音识别的教学考勤方法 | |
CN107993664B (zh) | 一种基于竞争神经网络的鲁棒说话人识别方法 | |
CN108806694A (zh) | 一种基于声音识别的教学考勤方法 | |
CN116153337B (zh) | 合成语音溯源取证方法及装置、电子设备及存储介质 | |
Alamsyah et al. | Speech gender classification using bidirectional long short term memory | |
CN109104534A (zh) | 一种提高外呼机器人意图检测准确率、召回率的系统 | |
CN115862634A (zh) | 一种声纹识别方法及嵌入式装置 | |
CN110085236B (zh) | 一种基于自适应语音帧加权的说话人识别方法 | |
CN112669836B (zh) | 命令的识别方法、装置及计算机可读存储介质 | |
KR20220047080A (ko) | 화자 인식을 위한 음성인식기 기반 풀링 기법의 화자 임베딩 추출 방법 및 시스템, 그리고 이를 위한 기록매체 | |
Reshma et al. | A survey on speech emotion recognition | |
CN113948089B (zh) | 声纹模型训练和声纹识别方法、装置、设备及介质 | |
CN111475634B (zh) | 基于座席语音切分的代表性话术片段抽取装置及方法 | |
CN108629024A (zh) | 一种基于声音识别的教学考勤方法 | |
CN108694950A (zh) | 一种基于深度混合模型的说话人确认方法 | |
CN114067803A (zh) | 一种基于距离相关的度量学习的说话人确认方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191224 |
|
RJ01 | Rejection of invention patent application after publication |