CN109036436A

CN109036436A - 一种声纹数据库建立方法、声纹识别方法、装置及系统

Info

Publication number: CN109036436A
Application number: CN201811089314.8A
Authority: CN
Inventors: 骆明顺
Original assignee: Guangzhou Speakin Network Technology Co Ltd
Current assignee: Guangzhou Speakin Network Technology Co Ltd
Priority date: 2018-09-18
Filing date: 2018-09-18
Publication date: 2018-12-18

Abstract

本发明公开了一种声纹数据库建立方法、声纹识别方法、装置及系统，包括获取声纹信息，并提取声纹信息的声纹特征；采用预先建立的模式识别模型对声纹特征进行模式匹配，得到与声纹特征对应的标签信息；将标签信息与声纹信息对应存储至声纹数据库中，以便在声纹识别时依据标签信息对声纹信息进行筛选。通过本申请中的声纹数据库建立方法所建立的声纹数据库中不仅包括声纹信息，还包括与声纹信息对应的标签信息，从而在后续声纹识别时就能够根据相应的标签信息缩小声纹信息的检索范围，从而提高声纹识别的识别效率，降低声纹识别所花费的时间。

Description

一种声纹数据库建立方法、声纹识别方法、装置及系统

技术领域

本发明实施例涉及声纹识别技术领域，特别是涉及一种声纹数据库建立方法、声纹识别方法、装置及系统。

背景技术

声纹是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明，声纹不仅具有特定性，而且有相对稳定性的特点，声纹识别是一项根据语音波形中反映说话人生理和行为特征的语音参数，自动识别说话人身份的技术，并且用于十分广泛。

在进行声纹识别时，通常是基于预先建立的声纹数据库进行识别，现有技术中的声纹数据库在建立时只存储有与被采集人员对应的声纹信息，在通过该声纹数据库进行声纹识别时，需要将待识别声纹与声纹数据库中存储的所有声纹信息进行逐一匹配，由于声纹数据库中所存储的声纹信息数据量较大，故采用现有技术中的数据库使声纹识别所花费的时间较长，降低声纹识别效率。

鉴于此，如何提供一种解决上述技术问题的声纹数据库建立方法、声纹识别方法、装置及系统成为本领域技术人员需要解决的问题。

发明内容

本发明实施例的目的是提供一种声纹数据库建立方法、声纹识别方法、装置及系统，通过本申请中所建立的声纹数据库在进行声纹识别时有利于提高声纹识别的识别效率，降低声纹识别所花费的时间。

为解决上述技术问题，本发明实施例提供了一种声纹数据库建立方法，包括：

获取声纹信息，并提取所述声纹信息的声纹特征；

采用预先建立的模式识别模型对所述声纹特征进行模式匹配，得到与所述声纹特征对应的标签信息；

将所述标签信息与所述声纹信息对应存储至声纹数据库中，以便在声纹识别时依据所述标签信息对声纹信息进行筛选。

可选的，所述采用预先建立的模式识别模型对所述声纹特征进行模式匹配，得到与所述声纹特征对应的标签信息的过程包括：

采用预先建立的模式识别模型对所述声纹特征进行分析，得到与所述声纹特征对应的模式信息；所述模式信息包括语种信息、年龄信息、性别信息或籍贯信息中的一种或多种的组合；

依据所述模式信息生成与所述声纹特征对应的标签信息。

可选的，所述模式识别模型的建立方法包括：

采用预设算法对与多个历史声纹信息分别对应的声纹特征进行分析训练，得到所述模式识别模型；所述预设算法包括语种识别算法、性别识别算法、年龄识别算法或籍贯识别算法中的一种或多种的组合。

可选的，所述声纹特征包括声强、响度、音高、基音周期或基音频率中的一种或多种。

本发明实施例相应的提供了一种声纹数据库建立装置，包括：

第一提取模块，用于获取声纹信息，并提取所述声纹信息的声纹特征；

处理模块，用于采用预先建立的模式识别模型对所述声纹特征进行模式匹配，得到与所述声纹特征对应的标签信息；

存储模块，用于将所述标签信息与所述声纹信息对应存储至声纹数据库中，以便在声纹识别时依据所述标签信息对声纹信息进行筛选。

可选的，所述处理模块包括：

分析单元，用于采用预先建立的模式识别模型对所述声纹特征进行分析，得到与所述声纹特征对应的模式信息；所述模式信息包括语种信息、年龄信息、性别信息或籍贯信息中的一种或多种的组合；

生成单元，用于依据所述模式信息生成与所述声纹特征对应的标签信息。

本发明实施例还提供了一种声纹数据库建立系统，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上述所述的声纹数据库建立方法的步骤。

本发明实施例还提供了一种声纹识别方法，包括：

获取待识别声纹信息，依据所述待识别声纹信息提取相应的个人标签信息；

依据与所述个人标签信息从声纹数据库中筛选出与所述个人标签信息对应的多个声纹信息；所述声纹数据库为依据如上述所述的声纹数据库建立方法建立的声纹数据库；

将所述待识别声纹信息与各个所述声纹信息进行一一匹配，得到与所述待识别声纹信息对应的目标声纹信息，并获取与所述目标声纹信息对应的身份信息。

本发明实施例还相应的提供了一种声纹识别装置，包括：

第二提取模块，用于获取待识别声纹信息，依据所述待识别声纹信息提取相应的个人标签信息；

筛选模块，用于依据与所述个人标签信息从声纹数据库筛选出与所述个人标签信息对应的多个声纹信息；所述声纹数据库为依据如上述所述的声纹数据库建立方法建立的声纹数据库；

匹配模块，用于将所述待识别声纹信息与各个所述声纹信息进行一一匹配，得到与所述待识别声纹信息对应的目标声纹信息，并获取与所述目标声纹信息对应的身份信息。

本发明实施例还提供了一种声纹识别系统，包括：

存储器，用于存储计算机程序；

本发明实施例提供了一种声纹数据库建立方法、声纹识别方法、装置及系统，包括：获取声纹信息，并提取声纹信息的声纹特征；采用预先建立的模式识别模型对声纹特征进行模式匹配，得到与声纹特征对应的标签信息；将标签信息与声纹信息对应存储至声纹数据库中，以便在声纹识别时依据标签信息对声纹信息进行筛选。可见，通过本申请中的声纹数据库建立方法所建立的声纹数据库中不仅包括声纹信息，还包括与声纹信息对应的标签信息，从而在后续声纹识别时就能够根据相应的标签信息缩小声纹信息的检索范围，从而提高声纹识别的识别效率，降低声纹识别所花费的时间。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对现有技术和实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种声纹数据库建立方法的流程示意图；

图2为本发明实施例提供的一种声纹数据库建立装置的结构示意图；

图3为本发明实施例提供的一种声纹识别方法的流程示意图；

图4为本发明实施例提供的一种声纹识别装置的结构示意图。

具体实施方式

本发明实施例提供了一种声纹数据库建立方法、声纹识别方法、装置及系统，通过本申请中所建立的声纹数据库在进行声纹识别时有利于提高声纹识别的识别效率，降低声纹识别所花费的时间。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参照图1，图1为本发明实施例提供的一种声纹数据库建立方法的流程示意图。

该方法，包括：

S110：获取声纹信息，并提取声纹信息的声纹特征；

需要说明的是，本申请中在建立声纹数据库时，可以在采集相应人员的声音信息后经过相应的处理得到其声纹信息，然后再对该声纹信息进行声纹特征提取，得到对应的声纹特征；其中，所提取的声纹特征可以包括声强、响度、音高、基音周期或基音频率中的一种或多种，当然，还可以包括信噪比、谐噪比、频率微扰、振幅围绕等其他语音特征，具体本申请不做限定。

具体的，在物理学中，把单位时间内通过垂直于声波传播方向的单位面积的平均声能，称为声强；响度是一种主观心理量，是人类主观感觉到的声音强弱程度，一般来说声音频率一定时，声强越强响度也越大，但是响度与频率有关，相同的声强频率不同时响度也可能不同；音高指各种不同高低的声音，即声音的高度，声音基本特征的一种；基音周期和基音频率也是声纹特征特征之一。

S120：采用预先建立的模式识别模型对声纹特征进行模式匹配，得到与声纹特征对应的标签信息；

具体的，本申请中的模式识别模型是预先依据预设算法和多个历史声纹信息进行建立的，其建立过程为：

采用预设算法对与多个历史声纹信息分别对应的声纹特征进行分析训练，得到模式识别模型；预设算法包括语种识别算法、性别识别算法、年龄识别算法或籍贯识别算法中的一种或多种的组合。

可以理解的是，预先采集大量的声纹信息(这些声纹信息作为历史声纹信息)，通过语种识别算法对这些历史声纹信息进行分析处理后，得到语种模式识别模型，通过性别识别算法对这些历史声纹信息进行分析处理后，得到性别模式识别模型，通过年龄识别算法对这些历史声纹信息进行分析处理，得到年龄模式识别模型，通过籍贯识别算法对这里历史声纹信息进行分析处理，得到籍贯模式识别模型，其中，语种识别算法、性别识别算法、年龄识别算法或籍贯识别算法均为基于ivector算法。

其中，本申请中采用预先建立的模式识别模型对声纹特征进行模式匹配，得到与声纹特征对应的标签信息的过程，具体可以为：

采用预先建立的模式识别模型对声纹特征进行分析，得到与声纹特征对应的模式信息；模式信息包括语种信息、年龄信息、性别信息或籍贯信息中的一种或多种的组合；依据模式信息生成与声纹特征对应的标签信息。

具体的，在采用模式识别模型对提取到的声纹特征进行模式匹配时，可以通过语种模式识别模型对声纹特征进行分析匹配，得到语种信息；通过性别模式识别模型对声纹特征进行分离匹配，得到性别信息；通过年龄模式识别模型对声纹特征进行分析匹配，得到年龄信息，通过籍贯识别算法对声纹特征进行分析匹配得地籍贯信息。也即，本申请中在得到相应的模式信息后，可以根据具体的模式信息生成标签信息，例如在对声纹特征进行模式匹配后，得到的模式信息为年龄信息、性别信息和籍贯信息，则可以根据该年龄信息、性别信息和籍贯信息生成与该声纹信息对应的标签信息(例如：45-男-天津)。

S130：将标签信息与声纹信息对应存储至声纹数据库中，以便在声纹识别时依据标签信息对声纹信息进行筛选。

具体的，在得到与声纹特征对应的标签信息后，将该标签信息与该声纹信息对应存储到声纹数据库中，当然，同时存储的还有与该声纹信息对应的身份信息，具体的可以将标签信息、身份信息和身份信息写入同一条记录中，并将该记录存储至声纹数据库中。当然，对于每一个获取到的声纹信息均采用上述方法得到与其对应的标签信息，将标签信息-声纹信息-身份信息的记录，并存储至声纹数据库中，从而得到存储有大量记录的声纹数据库，以用于后续的声纹识别。在根据该声纹数据库进行声纹识别时，可以通过待识别声纹信息提取出与其对应的个人标签信息，例如年龄-性别-籍贯，从而根据该个人标签信息到声纹数据库中进行筛选，从而筛选出与该个人标签信息一致的多个标签信息，进而得到与每个标签信息对应的声纹信息，也即筛选出多个声纹信息，从而缩小了声纹信息匹配的范围，再将待识别声纹信息与所筛选出的多个声纹信息进行一一匹配，确定出与该声纹信息一致的目标声纹信息，进而得到与该目标声纹信息对应的身份信息，从而大大提高声纹识别效率。

另外，还需要说明的是，本申请中在建立声纹数据库时，也可以在原声纹数据库的基础上建立，原有数据库中存储有预先采集的声纹信息及与声纹信息对应的身份信息，可以通过本申请中的方法从原声纹数据库中一一获取声纹信息，并对声纹信息逐个处理得到与每个声纹信息对应的标签信息，并将标签信息写入与相应的声纹信息对应的记录中，从而得到新的声纹数据库。

本发明实施例提供了一种声纹数据库建立方法，包括：获取声纹信息，并提取声纹信息的声纹特征；采用预先建立的模式识别模型对声纹特征进行模式匹配，得到与声纹特征对应的标签信息；将标签信息与声纹信息对应存储至声纹数据库中，以便在声纹识别时依据标签信息对声纹信息进行筛选。可见，通过本申请中的声纹数据库建立方法所建立的声纹数据库中不仅包括声纹信息，还包括与声纹信息对应的标签信息，从而在后续声纹识别时就能够根据相应的标签信息缩小声纹信息的检索范围，从而提高声纹识别的识别效率，降低声纹识别所花费的时间。

在上述实施例的基础行，本发明实施例相应的提供了一种声纹数据库建立装置，具体请参照图2，该装置包括：

第一提取模块21，用于获取声纹信息，并提取声纹信息的声纹特征；

处理模块22，用于采用预先建立的模式识别模型对声纹特征进行模式匹配，得到与声纹特征对应的标签信息；

存储模块23，用于将标签信息与声纹信息对应存储至声纹数据库中，以便在声纹识别时依据标签信息对声纹信息进行筛选。

在上一实施例的基础上，进一步的，处理模块22包括：

分析单元，用于采用预先建立的模式识别模型对声纹特征进行分析，得到与声纹特征对应的模式信息；模式信息包括语种信息、年龄信息、性别信息或籍贯信息中的一种或多种的组合；

生成单元，用于依据模式信息生成与声纹特征对应的标签信息。

需要说明的是，本实施例中所提供的声纹数据库建立装置具有与上述实施例中提供的的声纹数据库建立方法相同的有益效果，并且对于本实施例中所涉及到的声纹数据库建立方法的介绍，请参照上述实施例，本实施例不再赘述。

在上述任一实施例的基础上，本发明实施例还提供了一种声纹数据库建立系统。该系统包括：

存储器，用于存储计算机程序；

处理器，用于执行计算机程序时实现如上述声纹数据库建立方法的步骤。

例如，处理器用于实现获取声纹信息，并提取声纹信息的声纹特征；采用预先建立的模式识别模型对声纹特征进行模式匹配，得到与声纹特征对应的标签信息；将标签信息与声纹信息对应存储至声纹数据库中，以便在声纹识别时依据标签信息对声纹信息进行筛选。

在上述任一实施例的基础上，本发明实施例提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现如上述声纹数据库建立方法的步骤。

具体的，该计算机可读存储介质可以包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

在上述任一实施例的基础上，本发明实施例还提供了一种声纹识别方法，该方法与上述实施例中的声纹数据库建立方法相对应，具体请参照图3。该方法包括：

S310：获取待识别声纹信息，依据待识别声纹信息提取相应的个人标签信息；

S320：依据与个人标签信息从声纹数据库中筛选出与个人标签信息对应的多个声纹信息；声纹数据库为依据如上述声纹数据库建立方法建立的声纹数据库；

S330：将待识别声纹信息与各个声纹信息进行一一匹配，得到与待识别声纹信息对应的目标声纹信息，并获取与目标声纹信息对应的身份信息。

需要说明的是，本实施例中所提供的声纹识别方法应用于基于采用上述实施例中所提供的声纹数据库建立方法所建立的声纹数据库。

具体的，在对待识别声纹信息进行识别，以确定与该待识别声纹信息对应的身份信息时，可以通过待识别声纹信息提取出与其对应的个人标签信息，例如年龄-性别-籍贯，从而根据该个人标签信息到声纹数据库中进行筛选，从而筛选出与该个人标签信息一致的多个标签信息，进而得到与每个标签信息对应的声纹信息，也即筛选出多个声纹信息，从而缩小了声纹信息匹配的范围，再将待识别声纹信息与所筛选出的多个声纹信息进行一一匹配，确定出与该声纹信息一致的目标声纹信息，进而得到与该目标声纹信息对应的身份信息，从而大大提高声纹识别效率，减少识别过程所花费的时间。本实施例中提供的声纹识别方法可以用于公安系统的身份认证，有利于减轻刑侦工作的难度，还可以用于企事业单位中的身份验证等工作，便于相关企业的人员管理，当然，也可以用于其他的具体领域，本申请不做限定。

在上述实施例的基础上，本发明实施例还相应的提供了一种声纹识别装置，具体请参照图4。该装置包括：

第二提取模块41，用于获取待识别声纹信息，依据待识别声纹信息提取相应的个人标签信息；

筛选模块42，用于依据与个人标签信息从声纹数据库筛选出与个人标签信息对应的多个声纹信息；声纹数据库为依据如上述声纹数据库建立方法建立的声纹数据库；

匹配模块43，用于将待识别声纹信息与各个声纹信息进行一一匹配，得到与待识别声纹信息对应的目标声纹信息，并获取与目标声纹信息对应的身份信息。

本实施例中所提供的声纹识别装置具有与上述实施例中提供的的声纹识别方法相同的有益效果，并且对于本实施例中所涉及到的声纹识别方法的介绍，请参照上述实施例，本实施例不再赘述。

在上述任一实施例的基础上，本发明实施例还提供了一种声纹识别系统，包括：

存储器，用于存储计算机程序；

例如，本实施例中的处理器用于实现获取待识别声纹信息，依据待识别声纹信息提取相应的个人标签信息；依据与个人标签信息从声纹数据库中筛选出与个人标签信息对应的多个声纹信息；声纹数据库为依据如上述声纹数据库建立方法建立的声纹数据库；将待识别声纹信息与各个声纹信息进行一一匹配，得到与待识别声纹信息对应的目标声纹信息，并获取与目标声纹信息对应的身份信息。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

还需要说明的是，在本说明书中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其他实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种声纹数据库建立方法，其特征在于，包括：

获取声纹信息，并提取所述声纹信息的声纹特征；

2.根据权利要求1所述的声纹数据库建立方法，其特征在于，所述采用预先建立的模式识别模型对所述声纹特征进行模式匹配，得到与所述声纹特征对应的标签信息的过程包括：

依据所述模式信息生成与所述声纹特征对应的标签信息。

3.根据权利要求1或2所述的声纹数据库建立方法，其特征在于，所述模式识别模型的建立方法包括：

4.根据权利要求3所述的声纹数据库建立方法，其特征在于，所述声纹特征包括声强、响度、音高、基音周期或基音频率中的一种或多种。

5.一种声纹数据库建立装置，其特征在于，包括：

6.根据权利要求5所述的声纹数据库建立装置，其特征在于，所述处理模块包括：

7.一种声纹数据库建立系统，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至4任意一项所述的声纹数据库建立方法的步骤。

8.一种声纹识别方法，其特征在于，包括：

依据与所述个人标签信息从声纹数据库中筛选出与所述个人标签信息对应的多个声纹信息；所述声纹数据库为依据如权利要求1-4任意一项所述的声纹数据库建立方法建立的声纹数据库；

9.一种声纹识别装置，其特征在于，包括：

筛选模块，用于依据与所述个人标签信息从声纹数据库筛选出与所述个人标签信息对应的多个声纹信息；所述声纹数据库为依据如权利要求1-4任意一项所述的声纹数据库建立方法建立的声纹数据库；

10.一种声纹识别系统，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求8所述的声纹数据库建立方法的步骤。