[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN103377652A - 一种用于进行语音识别的方法、装置和设备 - Google Patents

一种用于进行语音识别的方法、装置和设备 Download PDF

Info

Publication number
CN103377652A
CN103377652A CN2012101246546A CN201210124654A CN103377652A CN 103377652 A CN103377652 A CN 103377652A CN 2012101246546 A CN2012101246546 A CN 2012101246546A CN 201210124654 A CN201210124654 A CN 201210124654A CN 103377652 A CN103377652 A CN 103377652A
Authority
CN
China
Prior art keywords
information
recognition result
user
sound bite
content information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101246546A
Other languages
English (en)
Other versions
CN103377652B (zh
Inventor
朱频频
李波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI ZHIZHEN NETWORK TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI ZHIZHEN NETWORK TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI ZHIZHEN NETWORK TECHNOLOGY Co Ltd filed Critical SHANGHAI ZHIZHEN NETWORK TECHNOLOGY Co Ltd
Priority to CN201210124654.6A priority Critical patent/CN103377652B/zh
Publication of CN103377652A publication Critical patent/CN103377652A/zh
Application granted granted Critical
Publication of CN103377652B publication Critical patent/CN103377652B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明的目的是提供一种用于进行语音识别的方法、装置和设备。本发明通过对网络设备对待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息;并根据所述识别结果内容信息,在用户信息库中进行匹配查询,以获得与待识别语音消息的至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项;并根据待使用所述识别结果信息的应用,对所述相匹配的用户信息项执行相应操作。与现有技术相比,本发明能够根据用户信息库,对网络设备语音识别所得的信息进行纠错,提高了语音识别的准确率。

Description

一种用于进行语音识别的方法、装置和设备
技术领域
本发明涉及语音识别领域,尤其涉及一种用于进行语音识别的方法、装置和设备。
背景技术
现有技术中,已存在由网络设备识别来自用户设备的语音消息,并将该语音消息的识别结果反馈给用户设备的技术。然而,由于网络设备是基于通用语音库来识别语音消息的,因此,对于个性化较强的语音信息,例如,人名等,网络设备往往难以获得较好的识别结果。
发明内容
本发明的目的是提供一种用于进行语音识别的方法、装置和设备。
根据本发明的一个方面,提供一种在用户设备中用于进行语音识别的方法,其中,该方法包括以下步骤:
a向网络设备发送待识别语音信息;
b接收所述网络设备反馈的、所述待识别语音信息的识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息;
c根据所述识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项;
d根据待使用所述识别结果信息的应用,对所述相匹配的用户信息项执行相应操作。
根据本发明的另一个方面,还提供了一种在网络设备中用于辅助用户设备进行语音识别的方法,其中,该方法包括以下步骤:
A获取来自所述用户设备的待识别语音信息;
B对所述待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息;
C根据所述识别结果内容信息,在使用所述用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项;
D将所述识别结果内容信息和所述用户信息项提供给所述用户设备。
根据本发明的另一个方面,还提供了一种在用户设备中用于进行语音识别的识别装置,其中,该识别装置包括:
发送装置,用于向网络设备发送待识别语音信息;
接收装置,用于接收所述网络设备反馈的、所述待识别语音信息的识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息;
第一匹配查询装置,用于根据所述识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项;
执行装置,用于根据待使用所述识别结果信息的应用,对所述相匹配的用户信息项执行相应操作。
根据本发明的另一个方面,还提供了一种在网络设备中用于辅助用户设备进行语音识别的辅助装置,其中,该辅助装置包括:
语音获取装置,用于获取来自所述用户设备的待识别语音信息;
语音识别装置,用于对所述待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息;
第二匹配查询装置,用于根据所述识别结果内容信息,在使用所述用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项;
提供装置,用于将所述识别结果内容信息和所述用户信息项提供给所述用户设备。
与现有技术相比,本发明具有以下优点:1)使得用户设备能够根据本地用户信息库,对网络设备语音识别所得的信息进行本地纠错,提高了语音识别的准确率;2)可由用户设备执行用户信息纠错,降低了网络设备的负担,并且由于用户通常直接在用户设备上更新其用户信息库,因此,基于本地用户信息库进行语音识别,能够保证纠错操作所基于的用户信息是最新的;3)使得网络设备能够根据网络用户信息库,对其识别获得的识别结果内容信息进行纠错,使其能够向用户提供个性化的识别结果。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明一个优选实施例的用于进行语音识别的方法流程图;
图2为本发明另一个优选实施例的用于进行语音识别的方法流程图;
图3为本发明一个优选实施例的用于进行语音识别的系统结构示意图;
图4为本发明另一个优选实施例的用于进行语音识别的系统结构示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1为本发明一个优选实施例的用于进行语音识别的方法流程图。根据本优选实施例的方法包括步骤S11、步骤S21、步骤S22、步骤S27、步骤S12、步骤S13和步骤S14。其中,本发明的方法主要通过用户设备来实现。优选地,本发明的方法通过网络设备和用户设备来实现。其中,所述用户设备包括但不限于PC机、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述用户设备和网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
需要说明的是,所述用户设备和网络设备仅为举例,其他现有的或今后可能出现的用户设备、网络设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S11中,用户设备向网络设备发送待识别语音信息。
其中,用户设备可接收来自用户的待识别语音信息,并发送给网络设备。
例如,用户设备获取来自用户的待识别语音信息“给杜宇青打个电话”,并发送给网络设备。
接着,在步骤S21中,网络设备获取来自用户设备的待识别语音信息。
例如,网络设备接收来自用户设备的语音信息“给杜宇青打个电话”。
接着,在步骤S22中,网络设备对该待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括该待识别语音消息中至少一个语音片段的识别结果内容信息。
优选地,一个语音片段的识别结果内容信息包括但不限于以下至少一项:
1)该语音片段的文字信息;
例如,对该语音片段进行语音识别所得的汉字信息、英文单词信息等。
需要说明的是,当一个语音片段能够识别得到多个发音相同或相似的文字信息时,网络设备可由其中选择一个或多个文字信息作为识别结果内容信息或其一部分,或者,网络设备将所有识别得到的文字信息作为识别结果内容信息或其一部分。
2)该语音片段的拼音信息;
例如,对该语音片段“杜宇青”进行语音识别所得的拼音信息“duyuqing”等。
3)该语音片段的语音波形信息;
例如,网络设备由语音信息“给杜宇青打个电话”中提取出其无法识别的语音片段“杜宇青”的语音波形信息,作为识别结果内容信息或其一部分。
具体地,网络设备基于预确定的语音信息库,对待识别语音信息进行识别,并获得该待识别语音信息中至少一个语音片段的识别结果内容信息。
例如,网络设备基于预确定的语音消息库,对待识别语音消息“给杜宇青打个电话”进行识别,获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”。
优选地,网络设备对语音信息进行语音识别所得的识别结果信息中还包括至少一个语音片段的分类信息。其中,该分类信息用于标识语音片段的类型,例如,语音片段属于人名、地名、拨号类、邮件类等。
其中,网络设备可通过多种方式获得语音片段的分类信息。例如,当在语音信息库中查询到与语音片段相匹配的信息时,直接获取该信息的分类信息,作为语音片段的分类信息;又例如,网络设备通过对语音识别所得的文本信息进行语义分析,从而确定该文本信息对应的语音片段的分类信息等。
更优选地,该分类信息中包含用于标识其对应的语音片段的识别结果内容信息是否需要由进行用户设备进行本地匹配查询的标识信息,网络设备可根据所确定的语音片段的分类,确定所述标识信息。例如,预定分类“人名”、“地名”需要由进行用户设备进行本地匹配查询,则当网络设备确定语音片段的分类为“人名”或“地名”时,在分类信息中加入用于标识其对应的语音片段的识别结果内容信息需要由进行用户设备进行本地匹配查询的标识信息,当网络设备确定语音片段的分类为其他分类时,在分类信息中加入用于标识其对应的语音片段的识别结果内容信息不需要由进行用户设备进行本地匹配查询的标识信息,或者,网络设备不在分类信息中加入标识信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对待识别语音信息进行语音识别,获得包括其中至少一个语音片段的识别结果内容信息的识别结果信息的实现方式,均应包含在本发明的范围内。
接着,在步骤S27中,网络设备将识别结果信息发送给用户设备。
接着,在步骤S12中,用户设备接收网络设备反馈的、所述待识别语音信息的识别结果信息。
接着,在步骤S13中,用户设备根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,所述本地用户信息库包括存储于所述用户设备或该用户设备的外接存储设备中,且用于存储用户信息的信息库;优选地,该本地用户信息库可作为一个整体,存储所有的用户信息,或者,该本地用户信息库包括多个独立的用户信息库,如包括用户电话联系人信息库、用户MSN联系人信息库、用户常用地名信息库、用户常用餐厅名称信息库等。
其中,所述用户信息项包括用户的一项信息;例如,联系人姓名、联系人邮箱、联系人电话、用户常用地名、用户常用餐厅名称等。
具体地,用户设备根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式包括但不限于:
1)用户设备分别根据所有语音片段的识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所有语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
例如,在步骤S12中,用户设备获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”;则用户设备分别根据上述三个语音片段的识别结果内容信息,在本地用户信息库中进行匹配查询,并仅获得与语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”相匹配的用户信息项“联系人姓名:杜宇青”。
又例如,在步骤S12中,用户设备获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的语音波形信息以及语音片段“打个电话”的文字信息“打个电话”;则用户设备分别根据语音片段“给”和“打个电话”的识别结果内容信息,在本地用户信息库的、存储有文本信息的用户信息库中进行匹配查询,未获得相匹配的用户信息项,并且,用户设备根据语音片段“杜宇青”在本地用户信息库的、存储有语音信息的用户信息库中进行匹配查询,并确定与语音片段“杜宇青”的语音波形信息相匹配的用户信息项为“联系人姓名:杜宇青”。其中,本地用户信息库中的语音波形信息可来自用户,并且,该语音波形信息对应的文本信息,或与该语音波形信息相匹配的用户信息项可由用户设置。
2)用户设备由所有语音片段中选择部分语音片段,并根据所选择的语音片段的识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所选择的语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
例如,在步骤S12中,用户设备获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”;则用户设备基于通用词汇库,判断文字信息“给”和“打个电话”为通用词汇,无需对其执行本地匹配查询的操作,接着,用户设备根据其文字信息未被判断为通用词汇的语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”,在本地用户信息库中进行匹配查询,并仅获得与语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”相匹配的用户信息项“联系人姓名:杜宇青”。
3)用户设备根据识别结果内容信息,在与预确定的、待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。本实现方式将在后续优选方案中予以详述,在此不再赘述。
优选地,识别结果内容信息包括文字信息以及拼音信息,步骤S13进一步包括用户设备根据所述文字信息,在所述本地用户信息库中查询与之匹配的用户信息项,并当未能查询到所述匹配的用户信息项时,根据所述拼音信息,在所述本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的拼音信息相匹配的用户信息项的步骤。
例如,对于在步骤S12中获得的语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”,用户设备根据文字信息“杜玉清”在本地用户信息库中查询,且未能查询到相匹配的用户信息项;接着,用户设备根据拼音信息“duyuqing”在本地用户信息库中进行匹配查询,获得与拼音信息“duyuqing”相匹配的用户信息项“联系人姓名:杜宇青”。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的实现方式,例如,分别根据一个语音片段的文字信息、拼音信息和语音波形信息在本地用户信息库中进行查询,并当查询到多个分别与上述三项信息匹配的用户信息项时,由其中选择用户使用频率最高的用户信息项,或将该多个相匹配的用户信息项呈现给用户以供其选择等,均应包含在本发明的范围内。
接着,在步骤S14中,用户设备根据待使用所述识别结果信息的应用,对与识别结果内容信息相匹配的用户信息项执行相应操作。
其中,所述待使用所述识别结果信息的应用包括任何可能被用户设备确定为需要使用所述识别结果信息的应用。优选地,该待使用识别结果信息的应用包括但不限于:
1)用户设备中当前处于活动状态的应用;
例如,用户设备中当前已启动并处于活动状态的邮箱应用;又例如,用户设备中当前正在向另一用户设备拨号的通话应用等。
2)用户设备根据识别结果内容信息确定的待启动应用;
例如,用户设备中存储有预确定的命令词汇库,其中,该命令词汇库存储有常用命令词汇以及分别与各个常用命令词汇对应的应用,用户设备在步骤S12中获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”;则用户设备根据上述三个语音片段的文本信息,在预确定的命令词汇库中查询,并确定与文本信息“电话”对应的应用为通话应用,则用户设备将通话应用作为待使用所述识别结果信息的应用。
3)识别结果信息中还包括至少一个语音片段的分类信息,用户设备根据该分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用。本实现方式将在后续优选方案中予以详述,在此不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何可能被用户设备确定为需要使用所述识别结果信息的应用,均应包含在本发明所述待使用识别结果信息的应用的范围内。
具体地,用户设备能够通过多种方式,来根据待使用识别结果信息的应用,对与识别结果内容信息相匹配的用户信息项执行相应操作,。
例如,待使用识别结果信息的应用为通话应用,步骤S13中获得的用户信息项为“联系人姓名:杜宇青”;用户设备根据应用为通话应用,确定需要将联系人姓名呈现给用户,则用户设备将联系人姓名“杜宇青”呈现给用户。
又例如,待使用识别结果信息的应用为outlook邮箱,步骤S13中获得的用户信息项为“联系人姓名:杜宇青”;用户设备根据应用为outlook邮箱,确定其需要获取联系人对应的邮箱信息,并提供给outlook,则用户设备获取联系人“杜宇青”的邮箱信息“duyuqingxiaoi.com”,并将该邮箱信息提供给outlook邮箱,以供outlook邮箱执行其待执行的操作。
优选地,所述用户设备对与识别结果内容信息相匹配的用户信息项执行的相应操作包括但不限于以下至少一项:
1)将所述相匹配的用户信息项以与所述待使用识别结果信息的应用相关联的方式呈现给用户。
例如,相匹配的用户信息项包含联系人名称,待使用识别结果信息的应用为通话应用;则当通话应用在拨号时,用户设备将用户信息项中包含的联系人名称呈现给用户。
又例如,相匹配的用户信息项包含餐厅名称,待使用识别结果信息的应用为地图查询应用;则当地图查询应用查询获得餐厅具体位置时,用户设备将用户信息项中包含的餐厅名称呈现给用户。
2)用户设备获取与所述相匹配的用户信息项相关联的其他用户信息项,用以所述应用待执行的操作。
优选地,用户设备能够通过用户信息项的类型、用户信息项在用户设备中存在的存储关联关系等,确定与所述相匹配的用户信息项相关联的其他用户信息项。
例如,相匹配的用户信息项为“联系人姓名:杜宇青”,待使用识别结果信息的应用为outlook邮箱;则用户设备根据应用为outlook邮箱,获取与联系人姓名“杜宇青”存储在同一联系人资料册中的联系人邮箱“duyuqingxiaoi.com”,并将给联系人邮箱提供给outlook邮箱,用以其待执行的邮件发送操作。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据待使用所述识别结果信息的应用,对与识别结果内容信息相匹配的用户信息项执行相应操作的实现方式,均应包含在本发明的范围内。
作为本实施例的优选方案之一,识别结果信息还包括至少一个语音片段的分类信息,本发明还包括在步骤S13之前执行的步骤S15,步骤S13进一步包括步骤S13’。
在步骤S15中,用户设备根据识别结果信息中的分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用。
具体地,用户设备根据分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用的方式包括但不限于:
1)用户设备直接根据分类信息,确定待启动的应用。
例如,用户设备在步骤S12中获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇”、“人名”和“拨号”,则用户设备根据上述三个分类信息,在预确定的分类信息与应用的对应关系表中进行查询,获得与分类信息“拨号”对应的应用“通话应用”,作为待启动的应用。
2)用户设备根据分类信息,确定待启动的应用的应用类型,并根据应用类型,确定待启动的应用。
例如,用户设备在步骤S12中获得语音片段“给”、“杜宇青”和“发邮件”的分类信息分别为“常用词汇”、“人名”和“邮件”;则用户设备根据上述三个分类信息,在预确定的分类信息与应用类型的对应关系表中进行查询,获得与分类信息“邮件”对应的应用类型为邮箱;接着,用户设备选择该应用类型中默认的outlook邮箱,作为待启动的应用。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据识别结果信息中的分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用的实现方式,均应包含在本发明的范围内。
在步骤S13’中,用户设备根据识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,与所述待启动的应用相关联的本地用户信息库包括预确定的、与待启动应用存在关联关系的本地用户信息库。
例如,与通话应用相关联的本地用户信息库包括本地通讯录,与outlook邮箱应用相关联的本地用户信息库包括本地邮箱联系人信息,与地图查询应用相关联的本地用户信息库包括用户常用餐厅名称信息和用户常用地名信息等。
其中,本步骤中用户设备根据识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与步骤S13中用户设备根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
优选地,本发明在步骤S13之前还包括步骤S16,前述步骤S13’包括步骤S13”。
在步骤S16中,用户设备根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息。
具体地,用户设备根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的方式包括但不限于:
1)当分类信息中包含用于标识其对应的语音片段的识别结果内容信息是否需要进行所述匹配查询的标识信息时,用户设备直接根据该标识信息,确定至少一个语音片段中需要进行匹配查询的识别结果内容信息。
例如,标识信息“1”用于标识需要进行匹配查询,标识信息“0”用于标识无需进行匹配查询。用户设备在步骤S12中获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇;0”、“人名;1”和“拨号;0”,则用户设备直接根据语音片段“杜宇青”的分类信息中包含标识信息“1”,确定该语音片段的识别结果内容信息需要进行所述匹配查询。
又例如,预定包含标识信息“1”的分类信息对应的语音片段需要进行匹配查询,未包含标识信息“1”的分类信息对应的语音片段无需进行匹配查询。用户设备在步骤S12中获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇”、“人名;1”和“拨号”,则用户设备直接根据语音片段“杜宇青”的分类信息中包含标识信息“1”,确定该语音片段需要进行所述匹配查询。
2)用户设备根据分类信息,在预确定的、需要进行匹配查询的分类信息库中进行查询,以确定至少一个语音片段中需要进行匹配查询的识别结果内容信息。
例如,用户设备在步骤S12中获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇”、“人名”和“拨号”,则用户设备根据上述三个分类信息,在预确定的、需要进行匹配查询的分类信息库中进行查询,并查询得到分类信息“人名”,则用户设备确定分类信息“人名”对应的语音片段“杜宇青”的识别结果内容信息需要进行匹配查询。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的实现方式,均应包含在本发明的范围内。
在步骤S13”中,用户设备根据需要进行匹配查询的识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述需要进行匹配查询的识别结果内容信息相匹配的用户信息项。
其中,本步骤中根据需要进行匹配查询的识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述需要进行匹配查询的识别结果内容信息相匹配的用户信息项的方式,与步骤S13中用户设备根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
本发明使得用户设备能够根据本地用户信息库,对网络设备语音识别所得的信息进行本地纠错,提高了语音识别的准确率;此外,由于纠错操作是由用户设备执行的,故降低了网络设备的负担,并且由于用户通常直接在用户设备上更新其用户信息库,因此,基于本地用户信息库进行语音识别,能够保证纠错操作所基于的用户信息是最新的。
图2为本发明另一个优选实施例的用于进行语音识别的方法流程图。本实施例包括步骤S11、步骤S21、步骤S22、步骤S23、步骤S24、步骤S17和步骤S18。
在步骤S11中,用户设备向网络设备发送待识别语音消息。
接着,在步骤S21中,网络设备获取来自所述用户设备的待识别语音信息。
接着,在步骤S22中,网络设备对所述待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息。
其中,本步骤已在参照图1所示实施例中予以详述,在此不再赘述。
接着,在步骤S23中,网络设备根据所述识别结果内容信息,在使用所述用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,网络设备可根据来自用户设备的、所述用户的身份信息,确定使用所述用户设备的用户的网络用户信息库。优选地,所述用户的身份信息可根据用户设备提供的以下至少一项信息来确定:
1)用户设备的标识信息;
例如,用户设备的芯片序列号;用户设备系统序列号;用户设备的移动识别号码,如手机号等。
2)用户的注册信息;
例如,用户ID和密码等。
其中,用户的网络用户信息库可由用户设备同步至网络设备中,例如,当用户设备接入网络时,用户设备自动将本地用户信息库同步至网络设备中;或者,用户的网络用户信息库可由用户直接在网络设备中建立或更新,例如,用户设备通过网络设备提供的网络用户信息库创建或修改页面,来建立或更新其网络用户信息库等。
具体地,网络设备根据确定的用户身份,获取其网络用户信息库,并根据所述识别结果内容信息,在网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,本步骤中网络设备根据识别结果内容信息,在网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与步骤S13中用户设备根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
优选地,本步骤中,网络设备根据识别结果内容信息中的文字信息,在网络用户信息库中查询与之匹配的用户信息项;并当未能查询到所述匹配的用户信息项时,根据所述拼音信息,在所述在使用用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的拼音信息相匹配的用户信息项。
接着,在步骤S24中,网络设备将识别结果内容信息和用户信息项提供给所述用户设备。
接着,在步骤S17中,用户设备接收网络设备反馈的、待识别语音信息的识别结果信息和用户信息项。
接着,在步骤S18中,用户设备根据待使用识别结果内容信息的应用,对用户信息项执行相应操作。
其中,本步骤与步骤S14相同或相似,在此不再赘述。
其中,当相应操作包括获取与用户信息项相关联的其他用户信息项时,用户设备可通过其本地用户信息库,获取该相关联的其他用户信息项,或者,用户设备可向网络设备发送请求,以请求网络设备在网络用户信息库中获取该相关联的其他用户信息项,并提供给用户设备。
作为本实施例的优选方案之一,识别结果内容信息还包括至少一个语音片段的分类信息,本实施例的方法还包括步骤S25,步骤S23包括步骤S23’,步骤S24包括步骤S24’,步骤S17包括步骤S17’,步骤S18包括步骤S18’。
在步骤S25中,网络设备根据分类信息,确定所述用户设备中待使用所述识别结果信息的应用。
其中,本步骤中网络设备根据分类信息,确定所述用户设备中待使用所述识别结果信息的应用的方式,与步骤S15中用户设备根据分类信息,确定用户设备中待使用所述识别结果信息的应用的方式相同或相似,在此不再赘述。
在步骤S23’中,网络设备根据所述识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,本步骤中网络设备根据所述识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与步骤S23中网络设备根据所述识别结果内容信息,在使用所述用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
优选地,网络设备还可根据所确定的应用,由网络用户信息库中获取与所述相匹配的用户信息项相关联的其他用户信息项。
在步骤S24’中,网络设备将所述识别结果内容信息、所述用户信息项和所述应用的标识信息提供给所述用户设备。
优选地,网络设备将所述识别结果内容信息、所述用户信息项、与该用户信息项相关联的其他用户信息项和所述应用的标识信息提供给所述用户设备。
接着,在步骤S17’中,用户设备接收网络设备反馈的、识别结果内容信息、用户信息项和待使用所述识别结果信息的应用的标识信息。
优选地,用户设备接收所述识别结果内容信息、所述用户信息项、与该用户信息项相关联的其他用户信息项和所述应用的标识信息提供给所述用户设备。
接着,在步骤S18’中,用户设备根据标识信息,确定待使用识别结果内容信息的应用,并根据该应用,对用户信息项执行相应操作。
优选地,本实施例在步骤S23之前还包括步骤S26,步骤S23’包括步骤S23”。
在步骤S26中,网络设备根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息。
其中,本步骤中网络设备根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的方式,与步骤S16中用户设备根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的方式相同或相似,在此不再赘述。
在步骤S23”中,网络设备根据需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,本步骤中网络设备根据需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与步骤S13”中用户设备根据需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
本实施例使得网络设备能够根据网络用户信息库,对其识别获得的识别结果内容信息进行纠错,使其能够向用户提供个性化的识别结果。
图3为本发明一个优选实施例的用于进行语音识别的系统结构示意图。本实施例的系统包括用户设备和网络设备;其中,用户设备包括用于执行本发明的操作的识别装置,该识别装置包括发送装置11、接收装置12、第一匹配查询装置13和执行装置14。
用户设备中的发送装置11向网络设备发送待识别语音信息。
其中,发送装置11可接收来自用户的待识别语音信息,并发送给网络设备。
例如,发送装置11获取来自用户的待识别语音信息“给杜宇青打个电话”,并发送给网络设备。
接着,网络设备获取来自用户设备的待识别语音信息。
例如,网络设备接收来自用户设备的语音信息“给杜宇青打个电话”。
接着,网络设备对该待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括该待识别语音消息中至少一个语音片段的识别结果内容信息。
优选地,一个语音片段的识别结果内容信息包括但不限于以下至少一项:
1)该语音片段的文字信息;
例如,对该语音片段进行语音识别所得的汉字信息、英文单词信息等。
需要说明的是,当一个语音片段能够识别得到多个发音相同或相似的文字信息时,网络设备可由其中选择一个或多个文字信息作为识别结果内容信息或其一部分,或者,网络设备将所有识别得到的文字信息作为识别结果内容信息或其一部分。
2)该语音片段的拼音信息;
例如,对该语音片段“杜宇青”进行语音识别所得的拼音信息“duyuqing”等。
3)该语音片段的语音波形信息;
例如,网络设备由语音信息“给杜宇青打个电话”中提取出其无法识别的语音片段“杜宇青”的语音波形信息,作为识别结果内容信息或其一部分。
具体地,网络设备基于预确定的语音信息库,对待识别语音信息进行识别,并获得该待识别语音信息中至少一个语音片段的识别结果内容信息。
例如,网络设备基于预确定的语音消息库,对待识别语音消息“给杜宇青打个电话”进行识别,获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”。
优选地,网络设备对语音信息进行语音识别所得的识别结果信息中还包括至少一个语音片段的分类信息。其中,该分类信息用于标识语音片段的类型,例如,语音片段属于人名、地名、拨号类、邮件类等。
其中,网络设备可通过多种方式获得语音片段的分类信息。例如,当在语音信息库中查询到与语音片段相匹配的信息时,直接获取该信息的分类信息,作为语音片段的分类信息;又例如,网络设备通过对语音识别所得的文本信息进行语义分析,从而确定该文本信息对应的语音片段的分类信息等。
更优选地,该分类信息中包含用于标识其对应的语音片段的识别结果内容信息是否需要由进行用户设备进行本地匹配查询的标识信息,网络设备可根据所确定的语音片段的分类,确定所述标识信息。例如,预定分类“人名”、“地名”需要由进行用户设备进行本地匹配查询,则当网络设备确定语音片段的分类为“人名”或“地名”时,在分类信息中加入用于标识其对应的语音片段的识别结果内容信息需要由进行用户设备进行本地匹配查询的标识信息,当网络设备确定语音片段的分类为其他分类时,在分类信息中加入用于标识其对应的语音片段的识别结果内容信息不需要由进行用户设备进行本地匹配查询的标识信息,或者,网络设备不在分类信息中加入标识信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对待识别语音信息进行语音识别,获得包括其中至少一个语音片段的识别结果内容信息的识别结果信息的实现方式,均应包含在本发明的范围内。
接着,网络设备将识别结果信息发送给用户设备。
接着,用户设备中的接收装置12接收网络设备反馈的、所述待识别语音信息的识别结果信息。
接着,用户设备中的第一匹配查询装置13根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,所述本地用户信息库包括存储于所述用户设备或该用户设备的外接存储设备中,且用于存储用户信息的信息库;优选地,该本地用户信息库可作为一个整体,存储所有的用户信息,或者,该本地用户信息库包括多个独立的用户信息库,如包括用户电话联系人信息库、用户MSN联系人信息库、用户常用地名信息库、用户常用餐厅名称信息库等。
其中,所述用户信息项包括用户的一项信息;例如,联系人姓名、联系人邮箱、联系人电话、用户常用地名、用户常用餐厅名称等。
具体地,第一匹配查询装置13根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式包括但不限于:
1)第一匹配查询装置13分别根据所有语音片段的识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所有语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
例如,接收装置12获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”;则第一匹配查询装置13分别根据上述三个语音片段的识别结果内容信息,在本地用户信息库中进行匹配查询,并仅获得与语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”相匹配的用户信息项“联系人姓名:杜宇青”。
又例如,接收装置12获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的语音波形信息以及语音片段“打个电话”的文字信息“打个电话”;则第一匹配查询装置13分别根据语音片段“给”和“打个电话”的识别结果内容信息,在本地用户信息库的、存储有文本信息的用户信息库中进行匹配查询,未获得相匹配的用户信息项,并且,第一匹配查询装置13根据语音片段“杜宇青”在本地用户信息库的、存储有语音信息的用户信息库中进行匹配查询,并确定与语音片段“杜宇青”的语音波形信息相匹配的用户信息项为“联系人姓名:杜宇青”。其中,本地用户信息库中的语音波形信息可来自用户,并且,该语音波形信息对应的文本信息,或与该语音波形信息相匹配的用户信息项可由用户设置。
2)第一匹配查询装置13由所有语音片段中选择部分语音片段,并根据所选择的语音片段的识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所选择的语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
例如,接收装置12获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”;则第一匹配查询装置13基于通用词汇库,判断文字信息“给”和“打个电话”为通用词汇,无需对其执行本地匹配查询的操作,接着,第一匹配查询装置13根据其文字信息未被判断为通用词汇的语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”,在本地用户信息库中进行匹配查询,并仅获得与语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”相匹配的用户信息项“联系人姓名:杜宇青”。
3)第一匹配查询装置13根据识别结果内容信息,在与预确定的、待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。本实现方式将在后续优选方案中予以详述,在此不再赘述。
优选地,识别结果内容信息包括文字信息以及拼音信息,第一匹配查询装置13进一步包括第一文字匹配查询装置(图未示)和第一拼音匹配查询装置(图未示)。第一文字匹配查询装置根据所述文字信息,在所述本地用户信息库中查询与之匹配的用户信息项,并当第一文字匹配查询装置未能查询到所述匹配的用户信息项时,第一拼音匹配查询装置根据所述拼音信息,在所述本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的拼音信息相匹配的用户信息项。
例如,对于接收装置12获得的语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”,第一文字匹配查询装置根据文字信息“杜玉清”在本地用户信息库中查询,且未能查询到与该文字信息相匹配的用户信息项;接着,第一拼音匹配查询装置根据拼音信息“duyuqing”在本地用户信息库中进行匹配查询,获得与拼音信息“duyuqing”相匹配的用户信息项“联系人姓名:杜宇青”。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的实现方式,例如,分别根据一个语音片段的文字信息、拼音信息和语音波形信息在本地用户信息库中进行查询,并当查询到多个分别与上述三项信息匹配的用户信息项时,由其中选择用户使用频率最高的用户信息项,或将该多个相匹配的用户信息项呈现给用户以供其选择等,均应包含在本发明的范围内。
接着,用户设备中的执行装置14根据待使用所述识别结果信息的应用,对与识别结果内容信息相匹配的用户信息项执行相应操作。
其中,所述待使用所述识别结果信息的应用包括任何可能被用户设备确定为需要使用所述识别结果信息的应用。优选地,该待使用识别结果信息的应用包括但不限于:
1)用户设备中当前处于活动状态的应用;
例如,用户设备中当前已启动并处于活动状态的邮箱应用;又例如,用户设备中当前正在向另一用户设备拨号的通话应用等。
2)用户设备根据识别结果内容信息确定的待启动应用;
例如,用户设备中存储有预确定的命令词汇库,其中,该命令词汇库存储有常用命令词汇以及分别与各个常用命令词汇对应的应用,接收装置12获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”;则用户设备根据上述三个语音片段的文本信息,在预确定的命令词汇库中查询,并确定与文本信息“电话”对应的应用为通话应用,则用户设备将通话应用作为待使用所述识别结果信息的应用。
3)识别结果信息中还包括至少一个语音片段的分类信息,用户设备根据该分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用。本实现方式将在后续优选方案中予以详述,在此不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何可能被用户设备确定为需要使用所述识别结果信息的应用,均应包含在本发明所述待使用识别结果信息的应用的范围内。
具体地,执行装置14能够通过多种方式,来根据待使用识别结果信息的应用,对与识别结果内容信息相匹配的用户信息项执行相应操作,。
例如,待使用识别结果信息的应用为通话应用,第一匹配查询装置13获得的用户信息项为“联系人姓名:杜宇青”;执行装置14根据应用为通话应用,确定需要将联系人姓名呈现给用户,则执行装置14将联系人姓名“杜宇青”呈现给用户。
又例如,待使用识别结果信息的应用为outlook邮箱,第一匹配查询装置13获得的用户信息项为“联系人姓名:杜宇青”;执行装置14根据应用为outlook邮箱,确定其需要获取联系人对应的邮箱信息,并提供给outlook,则执行装置14获取联系人“杜宇青”的邮箱信息“duyuqingxiaoi.com”,并将该邮箱信息提供给outlook邮箱,以供outlook邮箱执行其待执行的操作。
优选地,执行装置14对与识别结果内容信息相匹配的用户信息项执行的相应操作包括但不限于以下至少一项:
1)执行装置14将所述相匹配的用户信息项以与所述待使用识别结果信息的应用相关联的方式呈现给用户。
例如,相匹配的用户信息项包含联系人名称,待使用识别结果信息的应用为通话应用;则当通话应用在拨号时,执行装置14将用户信息项中包含的联系人名称呈现给用户。
又例如,相匹配的用户信息项包含餐厅名称,待使用识别结果信息的应用为地图查询应用;则当地图查询应用查询获得餐厅具体位置时,执行装置14将用户信息项中包含的餐厅名称呈现给用户。
2)执行装置14获取与所述相匹配的用户信息项相关联的其他用户信息项,用以所述应用待执行的操作。
优选地,执行装置14能够通过用户信息项的类型、用户信息项在用户设备中存在的存储关联关系等,确定与所述相匹配的用户信息项相关联的其他用户信息项。
例如,相匹配的用户信息项为“联系人姓名:杜宇青”,待使用识别结果信息的应用为outlook邮箱;则执行装置14根据应用为outlook邮箱,获取与联系人姓名“杜宇青”存储在同一联系人资料册中的联系人邮箱“duyuqingxiaoi.com”,并将给联系人邮箱提供给outlook邮箱,用以其待执行的邮件发送操作。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据待使用所述识别结果信息的应用,对与识别结果内容信息相匹配的用户信息项执行相应操作的实现方式,均应包含在本发明的范围内。
作为本实施例的优选方案之一,识别结果信息还包括至少一个语音片段的分类信息,识别装置还包括第一应用确定装置(图未示),第一匹配查询装置进一步包括第一子匹配查询装置(图未示)。
第一应用确定装置根据识别结果信息中的分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用。
具体地,第一应用确定装置根据分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用的方式包括但不限于:
1)第一应用确定装置直接根据分类信息,确定待启动的应用。
例如,接收装置12获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇”、“人名”和“拨号”,则第一应用确定装置根据上述三个分类信息,在预确定的分类信息与应用的对应关系表中进行查询,获得与分类信息“拨号”对应的应用“通话应用”,作为待启动的应用。
2)第一应用确定装置根据分类信息,确定待启动的应用的应用类型,并根据应用类型,确定待启动的应用。
例如,接收装置12获得语音片段“给”、“杜宇青”和“发邮件”的分类信息分别为“常用词汇”、“人名”和“邮件”;则第一应用确定装置根据上述三个分类信息,在预确定的分类信息与应用类型的对应关系表中进行查询,获得与分类信息“邮件”对应的应用类型为邮箱;接着,第一应用确定装置选择该应用类型中默认的outlook邮箱,作为待启动的应用。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据识别结果信息中的分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用的实现方式,均应包含在本发明的范围内。
第一子匹配查询装置根据识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,与所述待启动的应用相关联的本地用户信息库包括预确定的、与待启动应用存在关联关系的本地用户信息库。
例如,与通话应用相关联的本地用户信息库包括本地通讯录,与outlook邮箱应用相关联的本地用户信息库包括本地邮箱联系人信息,与地图查询应用相关联的本地用户信息库包括用户常用餐厅名称信息和用户常用地名信息等。
其中,第一子匹配查询装置根据识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与第一匹配查询装置根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
优选地,识别装置还包括第一匹配对象确定装置(图未示),前述第一字匹配查询装置包括第二子匹配查询装置(图未示)。
第一匹配对象确定装置根据分类信息,确定待识别语音消息的至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息。
具体地,第一匹配对象确定装置根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的方式包括但不限于:
1)当分类信息中包含用于标识其对应的语音片段的识别结果内容信息是否需要进行所述匹配查询的标识信息时,第一匹配对象确定装置直接根据该标识信息,确定至少一个语音片段中需要进行匹配查询的识别结果内容信息。
例如,标识信息“1”用于标识需要进行匹配查询,标识信息“0”用于标识无需进行匹配查询。接收装置12获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇;0”、“人名;1”和“拨号;0”,则第一匹配对象确定装置直接根据语音片段“杜宇青”的分类信息中包含标识信息“1”,确定该语音片段的识别结果内容信息需要进行所述匹配查询。
又例如,预定包含标识信息“1”的分类信息对应的语音片段需要进行匹配查询,未包含标识信息“1”的分类信息对应的语音片段无需进行匹配查询。接收装置12获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇”、“人名;1”和“拨号”,则第一匹配对象确定装置直接根据语音片段“杜宇青”的分类信息中包含标识信息“1”,确定该语音片段需要进行所述匹配查询。
2)第一匹配对象确定装置根据分类信息,在预确定的、需要进行匹配查询的分类信息库中进行查询,以确定至少一个语音片段中需要进行匹配查询的识别结果内容信息。
例如,接收装置12获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇”、“人名”和“拨号”,则第一匹配对象确定装置根据上述三个分类信息,在预确定的、需要进行匹配查询的分类信息库中进行查询,并查询得到分类信息“人名”,则第一匹配对象确定装置确定分类信息“人名”对应的语音片段“杜宇青”的识别结果内容信息需要进行匹配查询。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的实现方式,均应包含在本发明的范围内。
第二子匹配查询装置根据需要进行匹配查询的识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述需要进行匹配查询的识别结果内容信息相匹配的用户信息项。
其中,第二子匹配查询装置根据需要进行匹配查询的识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述需要进行匹配查询的识别结果内容信息相匹配的用户信息项的方式,与第一匹配查询装置13根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
本发明使得用户设备能够根据本地用户信息库,对网络设备语音识别所得的信息进行本地纠错,提高了语音识别的准确率;此外,由于纠错操作是由用户设备执行的,故降低了网络设备的负担,并且由于用户通常直接在用户设备上更新其用户信息库,因此,基于本地用户信息库进行语音识别,能够保证纠错操作所基于的用户信息是最新的。
图4为本发明另一个优选实施例的用于进行语音识别的系统结构示意图。本实施例的系统包括用户设备和网络设备;其中,网络设备包括用于执行本发明操作的辅助装置,该辅助装置包括语音获取装置21、语音识别装置22、第二匹配查询装置23和提供装置24。
首先,用户设备向网络设备发送待识别语音消息。
接着,网络设备中的语音获取装置21获取来自所述用户设备的待识别语音信息。
接着,网络设备中的语音识别装置22对所述待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息。
其中,语音识别装置22对所述待识别语音信息进行语音识别,获得识别结果信息的方式,与参照图3所示实施例中网络设备对所述待识别语音信息进行语音识别,获得识别结果信息的方式相同或相似,在此不再赘述。
接着,网络设备中的第二匹配查询装置23根据所述识别结果内容信息,在使用所述用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,第二匹配查询装置23可根据来自用户设备的、所述用户的身份信息,确定使用所述用户设备的用户的网络用户信息库。优选地,所述用户的身份信息可根据用户设备提供的以下至少一项信息来确定:
1)用户设备的标识信息;
例如,用户设备的芯片序列号;用户设备系统序列号;用户设备的移动识别号码,如手机号等。
2)用户的注册信息;
例如,用户ID和密码等。
其中,用户的网络用户信息库可由用户设备同步至网络设备中,例如,当用户设备接入网络时,用户设备自动将本地用户信息库同步至网络设备中;或者,用户的网络用户信息库可由用户直接在网络设备中建立或更新,例如,用户设备通过网络设备提供的网络用户信息库创建或修改页面,来建立或更新其网络用户信息库等。
具体地,第二匹配查询装置23根据确定的用户身份,获取其网络用户信息库,并根据所述识别结果内容信息,在网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,第二匹配查询装置23根据识别结果内容信息,在网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与第一匹配查询装置13根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
优选地,第二匹配查询装置23进一步包括第二文字匹配查询装置(图未示)和第二拼音匹配查询装置(图未示)。第二文字匹配查询装置根据识别结果内容信息中的文字信息,在网络用户信息库中查询与之匹配的用户信息项;当未能查询到所述匹配的用户信息项时,第二拼音匹配查询装置根据所述拼音信息,在所述在使用用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的拼音信息相匹配的用户信息项。
接着,网络设备中的提供装置24将识别结果内容信息和用户信息项提供给所述用户设备。
接着,用户设备接收网络设备反馈的、待识别语音信息的识别结果信息和用户信息项。
接着,用户设备根据待使用识别结果内容信息的应用,对用户信息项执行相应操作。
其中,用户设备根据待使用识别结果内容信息的应用,对用户信息项执行相应操作的方式,与参照图3所示实施例中执行装置14根据待使用识别结果内容信息的应用,对用户信息项执行相应操作的方式相同或相似,在此不再赘述。
其中,当相应操作包括获取与用户信息项相关联的其他用户信息项时,用户设备可通过其本地用户信息库,获取该相关联的其他用户信息项,或者,用户设备可向网络设备发送请求,以请求网络设备在网络用户信息库中获取该相关联的其他用户信息项,并提供给用户设备。
作为本实施例的优选方案之一,识别结果内容信息还包括至少一个语音片段的分类信息,本实施例的辅助装置还包括第二应用确定装置(图未示),第二匹配查询装置23包括第三子匹配查询装置(图未示),提供装置24包括子提供装置(图未示)。
网络设备中的第二应用确定装置根据分类信息,确定所述用户设备中待使用所述识别结果信息的应用。
其中,第二应用确定装置根据分类信息,确定所述用户设备中待使用所述识别结果信息的应用的方式,与参照图3所示实施例中第一应用确定装置用户设备根据分类信息,确定用户设备中待使用所述识别结果信息的应用的方式相同或相似,在此不再赘述。
网络设备中的第三子匹配查询装置根据所述识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,第三子匹配查询装置根据所述识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与第二匹配查询装置23根据所述识别结果内容信息,在使用所述用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
优选地,网络设备还可根据所确定的应用,由网络用户信息库中获取与所述相匹配的用户信息项相关联的其他用户信息项。
网络设备中的子提供装置将所述识别结果内容信息、所述用户信息项和所述应用的标识信息提供给所述用户设备。
优选地,子提供装置将所述识别结果内容信息、所述用户信息项、与该用户信息项相关联的其他用户信息项和所述应用的标识信息提供给所述用户设备。
接着,用户设备接收网络设备反馈的、识别结果内容信息、用户信息项和待使用所述识别结果信息的应用的标识信息。
优选地,用户设备接收所述识别结果内容信息、所述用户信息项、与该用户信息项相关联的其他用户信息项和所述应用的标识信息提供给所述用户设备。
接着,用户设备根据标识信息,确定待使用识别结果内容信息的应用,并根据该应用,对用户信息项执行相应操作。
优选地,辅助装置还包括第二匹配对象确定装置(图未示),第三子匹配查询装置包括第四子匹配查询装置(图未示)。
网络设备中的第二匹配对象确定装置根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息。
其中,第二匹配对象确定装置根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的方式,与参照图3所示实施例中第一匹配对象确定装置根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的方式相同或相似,在此不再赘述。
网络设备中的第四子匹配查询装置根据需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,第四子匹配查询装置根据需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与参照图3所示实施例中第二子匹配查询装置根据需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
本实施例使得网络设备能够根据网络用户信息库,对其识别获得的识别结果内容信息进行纠错,使其能够向用户提供个性化的识别结果
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、加载于通用目的计算机中的软件程序或任何其他类似软件和/或硬件设备来实现。
本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个功能或步骤的电路等。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (24)

1.一种在用户设备中用于进行语音识别的方法,其中,该方法包括以下步骤:
a向网络设备发送待识别语音信息;
b接收所述网络设备反馈的、所述待识别语音信息的识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息;
c根据所述识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项;
d根据待使用所述识别结果信息的应用,对所述相匹配的用户信息项执行相应操作。
2.根据权利要求1所述的方法,其中,所述识别结果信息还包括至少一个语音片段的分类信息,其中,该方法在所述步骤c之前还包括以下步骤:
-根据所述分类信息,确定待启动的应用,作为所述待使用所述识别结果信息的应用;
其中,所述步骤c包括以下步骤:
-根据所述识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
3.根据权利要求2所述的方法,其中,该方法在所述步骤c之前还包括以下步骤:
-根据所述分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息;
其中,所述步骤c包括以下步骤:
-根据所述需要进行匹配查询的识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述需要进行匹配查询的识别结果内容信息相匹配的用户信息项。
4.根据权利要求1至3中任一项所述的方法,其中,所述识别结果内容信息包括以下至少一项:
-文字信息;
-拼音信息。
5.根据权利要求4所述的方法,其中,所述识别结果内容信息包括所述文字信息以及所述拼音信息,所述步骤c包括以下步骤:
-根据所述文字信息,在所述本地用户信息库中查询与之匹配的用户信息项;
-当未能查询到所述匹配的用户信息项时,根据所述拼音信息,在所述本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的拼音信息相匹配的用户信息项。
6.根据权利要求1至5中任一项所述的方法,其中,所述相应操作包括以下至少一项:
-将所述相匹配的用户信息项以与所述待使用识别结果信息的应用相关联的方式呈现给用户;
-获取与所述相匹配的用户信息项相关联的其他用户信息项,用以所述应用待执行的操作。
7.一种在网络设备中用于辅助用户设备进行语音识别的方法,其中,该方法包括以下步骤:
A获取来自所述用户设备的待识别语音信息;
B对所述待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息;
C根据所述识别结果内容信息,在使用所述用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项;
D将所述识别结果内容信息和所述用户信息项提供给所述用户设备。
8.根据权利要求7所述的方法,其中,所述识别结果信息还包括至少一个语音片段的分类信息,其中,该方法在所述步骤C之前还包括以下步骤:
-根据所述分类信息,确定所述用户设备中待使用所述识别结果信息的应用;
其中,所述步骤C包括以下步骤:
-根据所述识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项;
其中,所述步骤D包括以下步骤:
-将所述识别结果内容信息、所述用户信息项和所述应用的标识信息提供给所述用户设备。
9.根据权利要求8所述的方法,其中,该方法在所述步骤C之前还包括以下步骤:
-根据所述分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息;
其中,所述步骤C包括以下步骤:
-根据所述需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
10.根据权利要求7至9中任一项所述的方法,其中,所述识别结果内容信息包括以下至少一项:
-文字信息;
-拼音信息。
11.根据权利要求10所述的方法,其中,所述识别结果内容信息包括所述文字信息以及所述拼音信息,所述步骤C包括以下步骤:
-根据所述文字信息,在所述在使用用户设备的用户的网络用户信息库中查询与之匹配的用户信息项;
-当未能查询到所述匹配的用户信息项时,根据所述拼音信息,在所述在使用用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的拼音信息相匹配的用户信息项。
12.一种在用户设备中用于进行语音识别的识别装置,其中,该识别装置包括:
发送装置,用于向网络设备发送待识别语音信息;
接收装置,用于接收所述网络设备反馈的、所述待识别语音信息的识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息;
第一匹配查询装置,用于根据所述识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项;
执行装置,用于根据待使用所述识别结果信息的应用,对所述相匹配的用户信息项执行相应操作。
13.根据权利要求12所述的识别装置,其中,所述识别结果信息还包括至少一个语音片段的分类信息,其中,该识别装置还包括:
第一应用确定装置,用于根据所述分类信息,确定待启动的应用,作为所述待使用所述识别结果信息的应用;
其中,所述第一匹配查询装置包括:
第一子匹配查询装置,用于根据所述识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
14.根据权利要求13所述的识别装置,其中,该识别装置还包括:
第一匹配对象确定装置,用于根据所述分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息;
其中,所述第一子匹配查询装置包括:
第二子匹配查询装置,用于根据所述需要进行匹配查询的识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述需要进行匹配查询的识别结果内容信息相匹配的用户信息项。
15.根据权利要求12至14中任一项所述的识别装置,其中,所述识别结果内容信息包括以下至少一项:
-文字信息;
-拼音信息。
16.根据权利要求15所述的识别装置,其中,所述识别结果内容信息包括所述文字信息以及所述拼音信息,所述第一匹配查询装置包括:
第一文字匹配查询装置,用于根据所述文字信息,在所述本地用户信息库中查询与之匹配的用户信息项;
第一拼音匹配查询装置,用于当未能查询到所述匹配的用户信息项时,根据所述拼音信息,在所述本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的拼音信息相匹配的用户信息项。
17.根据权利要求12至16中任一项所述的识别装置,其中,所述相应操作包括以下至少一项:
-将所述相匹配的用户信息项以与所述待使用识别结果信息的应用相关联的方式呈现给用户;
-获取与所述相匹配的用户信息项相关联的其他用户信息项,用以所述应用待执行的操作。
18.一种在网络设备中用于辅助用户设备进行语音识别的辅助装置,其中,该辅助装置包括:
语音获取装置,用于获取来自所述用户设备的待识别语音信息;
语音识别装置,用于对所述待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息;
第二匹配查询装置,用于根据所述识别结果内容信息,在使用所述用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项;
提供装置,用于将所述识别结果内容信息和所述用户信息项提供给所述用户设备。
19.根据权利要求18所述的辅助装置,其中,所述识别结果信息还包括至少一个语音片段的分类信息,其中,该辅助装置还包括:
第二应用确定装置,用于根据所述分类信息,确定所述用户设备中待使用所述识别结果信息的应用;
其中,所述第二匹配查询装置包括:
第三子匹配查询装置,用于根据所述识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项;
其中,所述提供装置包括:
子提供装置,用于将所述识别结果内容信息、所述用户信息项和所述应用的标识信息提供给所述用户设备。
20.根据权利要求19所述的辅助装置,其中,该辅助装置还包括:
第二匹配对象确定装置,用于根据所述分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息;
其中,所述第二匹配查询装置包括:
第四子匹配查询装置,用于根据所述需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
21.根据权利要求18至21中任一项所述的辅助装置,其中,所述识别结果内容信息包括以下至少一项:
-文字信息;
-拼音信息。
22.根据权利要求21所述的辅助装置,其中,所述识别结果内容信息包括所述文字信息以及所述拼音信息,所述第二匹配查询装置包括:
第二文字匹配查询装置,用于根据所述文字信息,在所述在使用用户设备的用户的网络用户信息库中查询与之匹配的用户信息项;
第二拼音匹配查询装置,用于当未能查询到所述匹配的用户信息项时,根据所述拼音信息,在所述在使用用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的拼音信息相匹配的用户信息项。
23.一种用户设备,包括如权利要求12至17中至少一项所述的识别装置。
24.一种网络设备,包括如权利要求18至22中至少一项所述的辅助装置。
CN201210124654.6A 2012-04-25 2012-04-25 一种用于进行语音识别的方法、装置和设备 Active CN103377652B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210124654.6A CN103377652B (zh) 2012-04-25 2012-04-25 一种用于进行语音识别的方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210124654.6A CN103377652B (zh) 2012-04-25 2012-04-25 一种用于进行语音识别的方法、装置和设备

Publications (2)

Publication Number Publication Date
CN103377652A true CN103377652A (zh) 2013-10-30
CN103377652B CN103377652B (zh) 2016-04-13

Family

ID=49462683

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210124654.6A Active CN103377652B (zh) 2012-04-25 2012-04-25 一种用于进行语音识别的方法、装置和设备

Country Status (1)

Country Link
CN (1) CN103377652B (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015096429A1 (zh) * 2013-12-25 2015-07-02 中兴通讯股份有限公司 通话声音识别方法及装置
WO2015096503A1 (en) * 2013-12-24 2015-07-02 Tencent Technology (Shenzhen) Company Limited Method, device and system for associating and managing payment accounts
CN105120373A (zh) * 2015-09-06 2015-12-02 上海智臻智能网络科技股份有限公司 语音传输控制方法及系统
CN105206272A (zh) * 2015-09-06 2015-12-30 上海智臻智能网络科技股份有限公司 语音传输控制方法及系统
CN105895090A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 语音信号处理方法及装置
CN106328145A (zh) * 2016-08-19 2017-01-11 北京云知声信息技术有限公司 语音修正方法及装置
CN106682006A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 关于通信内容的信息提示方法和装置
CN106686242A (zh) * 2016-12-30 2017-05-17 深圳天珑无线科技有限公司 联系人信息处理方法及装置
CN106713111A (zh) * 2015-11-17 2017-05-24 腾讯科技(深圳)有限公司 一种添加好友的处理方法、终端及服务器
CN106875943A (zh) * 2017-01-22 2017-06-20 上海云信留客信息科技有限公司 一种用于大数据分析的语音识别系统
CN107179714A (zh) * 2017-05-17 2017-09-19 广东美的制冷设备有限公司 基于设备控制的时段识别方法和装置
CN107357772A (zh) * 2017-07-04 2017-11-17 贵州小爱机器人科技有限公司 表单填写方法、装置和计算机设备
CN107451119A (zh) * 2017-07-26 2017-12-08 上海智臻智能网络科技股份有限公司 基于语音交互的语义识别方法及装置、存储介质、计算机设备
CN107562907A (zh) * 2017-09-11 2018-01-09 武汉科技大学 一种智能律师专家系统及案件应答装置
CN107657471A (zh) * 2016-09-22 2018-02-02 腾讯科技(北京)有限公司 一种虚拟资源的展示方法、客户端及插件
CN107707745A (zh) * 2017-09-25 2018-02-16 百度在线网络技术(北京)有限公司 用于提取信息的方法和装置
CN107808667A (zh) * 2016-09-06 2018-03-16 丰田自动车株式会社 声音识别装置以及声音识别方法
CN108920125A (zh) * 2018-04-03 2018-11-30 北京小蓦机器人技术有限公司 一种用于确定语音识别结果的方法与设备
CN109741738A (zh) * 2018-12-10 2019-05-10 平安科技(深圳)有限公司 语音控制方法、装置、计算机设备及存储介质
CN110111782A (zh) * 2019-02-26 2019-08-09 百度国际科技(深圳)有限公司 语音交互方法及设备
CN111739514A (zh) * 2019-07-31 2020-10-02 北京京东尚科信息技术有限公司 一种语音识别方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1753083A (zh) * 2004-09-24 2006-03-29 中国科学院声学研究所 语音标记方法、系统及基于语音标记的语音识别方法和系统
CN1949756A (zh) * 2006-09-06 2007-04-18 华为技术有限公司 基于语音的人机通讯系统和方法
CN101018259A (zh) * 2006-02-08 2007-08-15 中国电信股份有限公司 电信综合信息系统及方法
CN102137085A (zh) * 2010-01-22 2011-07-27 谷歌公司 语音命令的多维消歧

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1753083A (zh) * 2004-09-24 2006-03-29 中国科学院声学研究所 语音标记方法、系统及基于语音标记的语音识别方法和系统
CN101018259A (zh) * 2006-02-08 2007-08-15 中国电信股份有限公司 电信综合信息系统及方法
CN1949756A (zh) * 2006-09-06 2007-04-18 华为技术有限公司 基于语音的人机通讯系统和方法
CN102137085A (zh) * 2010-01-22 2011-07-27 谷歌公司 语音命令的多维消歧

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015096503A1 (en) * 2013-12-24 2015-07-02 Tencent Technology (Shenzhen) Company Limited Method, device and system for associating and managing payment accounts
WO2015096429A1 (zh) * 2013-12-25 2015-07-02 中兴通讯股份有限公司 通话声音识别方法及装置
CN105120373B (zh) * 2015-09-06 2018-07-13 上海智臻智能网络科技股份有限公司 语音传输控制方法及系统
CN105206272A (zh) * 2015-09-06 2015-12-30 上海智臻智能网络科技股份有限公司 语音传输控制方法及系统
CN105120373A (zh) * 2015-09-06 2015-12-02 上海智臻智能网络科技股份有限公司 语音传输控制方法及系统
CN106682006A (zh) * 2015-11-06 2017-05-17 北京奇虎科技有限公司 关于通信内容的信息提示方法和装置
CN106682006B (zh) * 2015-11-06 2021-12-21 北京奇虎科技有限公司 关于通信内容的信息提示方法和装置
CN106713111B (zh) * 2015-11-17 2020-04-07 腾讯科技(深圳)有限公司 一种添加好友的处理方法、终端及服务器
CN106713111A (zh) * 2015-11-17 2017-05-24 腾讯科技(深圳)有限公司 一种添加好友的处理方法、终端及服务器
CN105895090A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 语音信号处理方法及装置
WO2017166649A1 (zh) * 2016-03-30 2017-10-05 乐视控股(北京)有限公司 语音信号处理方法及装置
CN106328145A (zh) * 2016-08-19 2017-01-11 北京云知声信息技术有限公司 语音修正方法及装置
CN106328145B (zh) * 2016-08-19 2019-10-11 北京云知声信息技术有限公司 语音修正方法及装置
CN107808667A (zh) * 2016-09-06 2018-03-16 丰田自动车株式会社 声音识别装置以及声音识别方法
CN107657471A (zh) * 2016-09-22 2018-02-02 腾讯科技(北京)有限公司 一种虚拟资源的展示方法、客户端及插件
US10950224B2 (en) 2016-09-22 2021-03-16 Tencent Technology (Shenzhen) Company Limited Method for presenting virtual resource, client, and plug-in
CN106686242A (zh) * 2016-12-30 2017-05-17 深圳天珑无线科技有限公司 联系人信息处理方法及装置
CN106875943A (zh) * 2017-01-22 2017-06-20 上海云信留客信息科技有限公司 一种用于大数据分析的语音识别系统
CN107179714A (zh) * 2017-05-17 2017-09-19 广东美的制冷设备有限公司 基于设备控制的时段识别方法和装置
CN107179714B (zh) * 2017-05-17 2020-06-05 广东美的制冷设备有限公司 基于设备控制的时段识别方法和装置
CN107357772A (zh) * 2017-07-04 2017-11-17 贵州小爱机器人科技有限公司 表单填写方法、装置和计算机设备
CN107451119A (zh) * 2017-07-26 2017-12-08 上海智臻智能网络科技股份有限公司 基于语音交互的语义识别方法及装置、存储介质、计算机设备
CN107562907A (zh) * 2017-09-11 2018-01-09 武汉科技大学 一种智能律师专家系统及案件应答装置
CN107562907B (zh) * 2017-09-11 2020-10-02 武汉科技大学 一种智能律师专家案件应答装置
CN107707745A (zh) * 2017-09-25 2018-02-16 百度在线网络技术(北京)有限公司 用于提取信息的方法和装置
CN108920125A (zh) * 2018-04-03 2018-11-30 北京小蓦机器人技术有限公司 一种用于确定语音识别结果的方法与设备
CN109741738A (zh) * 2018-12-10 2019-05-10 平安科技(深圳)有限公司 语音控制方法、装置、计算机设备及存储介质
CN110111782A (zh) * 2019-02-26 2019-08-09 百度国际科技(深圳)有限公司 语音交互方法及设备
CN110111782B (zh) * 2019-02-26 2022-04-12 阿波罗智联(北京)科技有限公司 语音交互方法及设备
CN111739514A (zh) * 2019-07-31 2020-10-02 北京京东尚科信息技术有限公司 一种语音识别方法、装置、设备及介质
CN111739514B (zh) * 2019-07-31 2023-11-14 北京京东尚科信息技术有限公司 一种语音识别方法、装置、设备及介质

Also Published As

Publication number Publication date
CN103377652B (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
CN103377652B (zh) 一种用于进行语音识别的方法、装置和设备
US9202247B2 (en) System and method utilizing voice search to locate a product in stores from a phone
CN103915095B (zh) 语音识别的方法、交互设备、服务器和系统
CN109074354B (zh) 展示候选项的方法和终端设备
US11934394B2 (en) Data query method supporting natural language, open platform, and user terminal
US20090304161A1 (en) system and method utilizing voice search to locate a product in stores from a phone
EP2675122A1 (en) Method and system for retrieving instant voice message, user equipment, and server
EP2579167A1 (en) Method for active information push and server therefor
CN103187053A (zh) 输入方法和电子设备
CN101681365A (zh) 用于分布式语音搜索的方法和装置
CN103384290A (zh) 具备定位导航功能的移动终端及其快捷定位导航的方法
CN106021510A (zh) 对于由移动设备的用户启动的查询进行处理的方法和系统
WO2009062424A1 (fr) Procédé et système de recherche
CN103577420A (zh) 一种用户信息动态查询方法及装置
CN104282301A (zh) 一种语音命令处理方法以及系统
CN103281446A (zh) 语音短信发送系统和方法
JP2002278977A (ja) 質問回答装置、質問回答方法及び質問回答プログラム
KR101594835B1 (ko) 음성인식 기능을 갖는 차량 및 헤드유닛과 이를 위한 음성 인식방법
CN105183881A (zh) 信息查询方法和装置
CN103327041A (zh) 一种获取用户内容的方法及系统
JP5595252B2 (ja) 連携支援装置、プログラム、連携支援方法、連携支援システム及び通信装置
KR100822170B1 (ko) 음성 인식 ars 서비스를 위한 데이터베이스 구축 방법및 시스템
CN110737662B (zh) 一种数据分析方法、装置、服务器及计算机存储介质
CN113051389A (zh) 知识推送方法及装置
CN101547407A (zh) 对移动设备启动的简历投递信号进行处理的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 201803 Shanghai Jiading District Jinsha Road, Lane 1555, No. 7, layer 398,

Applicant after: SHANGHAI ZHIZHEN INTELLIGENT NETWORK SCIENCE & TECHNOLOGY CO., LTD.

Address before: 201803 Shanghai Jiading District Jinsha Road, Lane 1555, No. 7, layer 398,

Applicant before: Shanghai Zhizhen Network Technology Co., Ltd.

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20131030

Assignee: Guizhou little love robot technology Co., Ltd.

Assignor: SHANGHAI ZHIZHEN INTELLIGENT NETWORK SCIENCE & TECHNOLOGY CO., LTD.

Contract record no.: 2017990000490

Denomination of invention: Method, device and equipment for carrying out voice recognition

Granted publication date: 20160413

License type: Common License

Record date: 20171215

EE01 Entry into force of recordation of patent licensing contract
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A method, device and equipment for speech recognition

Effective date of registration: 20220321

Granted publication date: 20160413

Pledgee: Agricultural Bank of China Limited Shanghai pilot Free Trade Zone New Area Branch

Pledgor: SHANGHAI XIAOI ROBOT TECHNOLOGY Co.,Ltd.

Registration number: Y2022980002902

PE01 Entry into force of the registration of the contract for pledge of patent right