具体实施方式
下面结合附图对本发明作进一步详细描述。
图1为本发明一个优选实施例的用于进行语音识别的方法流程图。根据本优选实施例的方法包括步骤S11、步骤S21、步骤S22、步骤S27、步骤S12、步骤S13和步骤S14。其中,本发明的方法主要通过用户设备来实现。优选地,本发明的方法通过网络设备和用户设备来实现。其中,所述用户设备包括但不限于PC机、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述用户设备和网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
需要说明的是,所述用户设备和网络设备仅为举例,其他现有的或今后可能出现的用户设备、网络设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
在步骤S11中,用户设备向网络设备发送待识别语音信息。
其中,用户设备可接收来自用户的待识别语音信息,并发送给网络设备。
例如,用户设备获取来自用户的待识别语音信息“给杜宇青打个电话”,并发送给网络设备。
接着,在步骤S21中,网络设备获取来自用户设备的待识别语音信息。
例如,网络设备接收来自用户设备的语音信息“给杜宇青打个电话”。
接着,在步骤S22中,网络设备对该待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括该待识别语音消息中至少一个语音片段的识别结果内容信息。
优选地,一个语音片段的识别结果内容信息包括但不限于以下至少一项:
1)该语音片段的文字信息;
例如,对该语音片段进行语音识别所得的汉字信息、英文单词信息等。
需要说明的是,当一个语音片段能够识别得到多个发音相同或相似的文字信息时,网络设备可由其中选择一个或多个文字信息作为识别结果内容信息或其一部分,或者,网络设备将所有识别得到的文字信息作为识别结果内容信息或其一部分。
2)该语音片段的拼音信息;
例如,对该语音片段“杜宇青”进行语音识别所得的拼音信息“duyuqing”等。
3)该语音片段的语音波形信息;
例如,网络设备由语音信息“给杜宇青打个电话”中提取出其无法识别的语音片段“杜宇青”的语音波形信息,作为识别结果内容信息或其一部分。
具体地,网络设备基于预确定的语音信息库,对待识别语音信息进行识别,并获得该待识别语音信息中至少一个语音片段的识别结果内容信息。
例如,网络设备基于预确定的语音消息库,对待识别语音消息“给杜宇青打个电话”进行识别,获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”。
优选地,网络设备对语音信息进行语音识别所得的识别结果信息中还包括至少一个语音片段的分类信息。其中,该分类信息用于标识语音片段的类型,例如,语音片段属于人名、地名、拨号类、邮件类等。
其中,网络设备可通过多种方式获得语音片段的分类信息。例如,当在语音信息库中查询到与语音片段相匹配的信息时,直接获取该信息的分类信息,作为语音片段的分类信息;又例如,网络设备通过对语音识别所得的文本信息进行语义分析,从而确定该文本信息对应的语音片段的分类信息等。
更优选地,该分类信息中包含用于标识其对应的语音片段的识别结果内容信息是否需要由进行用户设备进行本地匹配查询的标识信息,网络设备可根据所确定的语音片段的分类,确定所述标识信息。例如,预定分类“人名”、“地名”需要由进行用户设备进行本地匹配查询,则当网络设备确定语音片段的分类为“人名”或“地名”时,在分类信息中加入用于标识其对应的语音片段的识别结果内容信息需要由进行用户设备进行本地匹配查询的标识信息,当网络设备确定语音片段的分类为其他分类时,在分类信息中加入用于标识其对应的语音片段的识别结果内容信息不需要由进行用户设备进行本地匹配查询的标识信息,或者,网络设备不在分类信息中加入标识信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对待识别语音信息进行语音识别,获得包括其中至少一个语音片段的识别结果内容信息的识别结果信息的实现方式,均应包含在本发明的范围内。
接着,在步骤S27中,网络设备将识别结果信息发送给用户设备。
接着,在步骤S12中,用户设备接收网络设备反馈的、所述待识别语音信息的识别结果信息。
接着,在步骤S13中,用户设备根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,所述本地用户信息库包括存储于所述用户设备或该用户设备的外接存储设备中,且用于存储用户信息的信息库;优选地,该本地用户信息库可作为一个整体,存储所有的用户信息,或者,该本地用户信息库包括多个独立的用户信息库,如包括用户电话联系人信息库、用户MSN联系人信息库、用户常用地名信息库、用户常用餐厅名称信息库等。
其中,所述用户信息项包括用户的一项信息;例如,联系人姓名、联系人邮箱、联系人电话、用户常用地名、用户常用餐厅名称等。
具体地,用户设备根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式包括但不限于:
1)用户设备分别根据所有语音片段的识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所有语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
例如,在步骤S12中,用户设备获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”;则用户设备分别根据上述三个语音片段的识别结果内容信息,在本地用户信息库中进行匹配查询,并仅获得与语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”相匹配的用户信息项“联系人姓名:杜宇青”。
又例如,在步骤S12中,用户设备获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的语音波形信息以及语音片段“打个电话”的文字信息“打个电话”;则用户设备分别根据语音片段“给”和“打个电话”的识别结果内容信息,在本地用户信息库的、存储有文本信息的用户信息库中进行匹配查询,未获得相匹配的用户信息项,并且,用户设备根据语音片段“杜宇青”在本地用户信息库的、存储有语音信息的用户信息库中进行匹配查询,并确定与语音片段“杜宇青”的语音波形信息相匹配的用户信息项为“联系人姓名:杜宇青”。其中,本地用户信息库中的语音波形信息可来自用户,并且,该语音波形信息对应的文本信息,或与该语音波形信息相匹配的用户信息项可由用户设置。
2)用户设备由所有语音片段中选择部分语音片段,并根据所选择的语音片段的识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所选择的语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
例如,在步骤S12中,用户设备获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”;则用户设备基于通用词汇库,判断文字信息“给”和“打个电话”为通用词汇,无需对其执行本地匹配查询的操作,接着,用户设备根据其文字信息未被判断为通用词汇的语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”,在本地用户信息库中进行匹配查询,并仅获得与语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”相匹配的用户信息项“联系人姓名:杜宇青”。
3)用户设备根据识别结果内容信息,在与预确定的、待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。本实现方式将在后续优选方案中予以详述,在此不再赘述。
优选地,识别结果内容信息包括文字信息以及拼音信息,步骤S13进一步包括用户设备根据所述文字信息,在所述本地用户信息库中查询与之匹配的用户信息项,并当未能查询到所述匹配的用户信息项时,根据所述拼音信息,在所述本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的拼音信息相匹配的用户信息项的步骤。
例如,对于在步骤S12中获得的语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”,用户设备根据文字信息“杜玉清”在本地用户信息库中查询,且未能查询到相匹配的用户信息项;接着,用户设备根据拼音信息“duyuqing”在本地用户信息库中进行匹配查询,获得与拼音信息“duyuqing”相匹配的用户信息项“联系人姓名:杜宇青”。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的实现方式,例如,分别根据一个语音片段的文字信息、拼音信息和语音波形信息在本地用户信息库中进行查询,并当查询到多个分别与上述三项信息匹配的用户信息项时,由其中选择用户使用频率最高的用户信息项,或将该多个相匹配的用户信息项呈现给用户以供其选择等,均应包含在本发明的范围内。
接着,在步骤S14中,用户设备根据待使用所述识别结果信息的应用,对与识别结果内容信息相匹配的用户信息项执行相应操作。
其中,所述待使用所述识别结果信息的应用包括任何可能被用户设备确定为需要使用所述识别结果信息的应用。优选地,该待使用识别结果信息的应用包括但不限于:
1)用户设备中当前处于活动状态的应用;
例如,用户设备中当前已启动并处于活动状态的邮箱应用;又例如,用户设备中当前正在向另一用户设备拨号的通话应用等。
2)用户设备根据识别结果内容信息确定的待启动应用;
例如,用户设备中存储有预确定的命令词汇库,其中,该命令词汇库存储有常用命令词汇以及分别与各个常用命令词汇对应的应用,用户设备在步骤S12中获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”;则用户设备根据上述三个语音片段的文本信息,在预确定的命令词汇库中查询,并确定与文本信息“电话”对应的应用为通话应用,则用户设备将通话应用作为待使用所述识别结果信息的应用。
3)识别结果信息中还包括至少一个语音片段的分类信息,用户设备根据该分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用。本实现方式将在后续优选方案中予以详述,在此不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何可能被用户设备确定为需要使用所述识别结果信息的应用,均应包含在本发明所述待使用识别结果信息的应用的范围内。
具体地,用户设备能够通过多种方式,来根据待使用识别结果信息的应用,对与识别结果内容信息相匹配的用户信息项执行相应操作,。
例如,待使用识别结果信息的应用为通话应用,步骤S13中获得的用户信息项为“联系人姓名:杜宇青”;用户设备根据应用为通话应用,确定需要将联系人姓名呈现给用户,则用户设备将联系人姓名“杜宇青”呈现给用户。
又例如,待使用识别结果信息的应用为outlook邮箱,步骤S13中获得的用户信息项为“联系人姓名:杜宇青”;用户设备根据应用为outlook邮箱,确定其需要获取联系人对应的邮箱信息,并提供给outlook,则用户设备获取联系人“杜宇青”的邮箱信息“duyuqingxiaoi.com”,并将该邮箱信息提供给outlook邮箱,以供outlook邮箱执行其待执行的操作。
优选地,所述用户设备对与识别结果内容信息相匹配的用户信息项执行的相应操作包括但不限于以下至少一项:
1)将所述相匹配的用户信息项以与所述待使用识别结果信息的应用相关联的方式呈现给用户。
例如,相匹配的用户信息项包含联系人名称,待使用识别结果信息的应用为通话应用;则当通话应用在拨号时,用户设备将用户信息项中包含的联系人名称呈现给用户。
又例如,相匹配的用户信息项包含餐厅名称,待使用识别结果信息的应用为地图查询应用;则当地图查询应用查询获得餐厅具体位置时,用户设备将用户信息项中包含的餐厅名称呈现给用户。
2)用户设备获取与所述相匹配的用户信息项相关联的其他用户信息项,用以所述应用待执行的操作。
优选地,用户设备能够通过用户信息项的类型、用户信息项在用户设备中存在的存储关联关系等,确定与所述相匹配的用户信息项相关联的其他用户信息项。
例如,相匹配的用户信息项为“联系人姓名:杜宇青”,待使用识别结果信息的应用为outlook邮箱;则用户设备根据应用为outlook邮箱,获取与联系人姓名“杜宇青”存储在同一联系人资料册中的联系人邮箱“duyuqingxiaoi.com”,并将给联系人邮箱提供给outlook邮箱,用以其待执行的邮件发送操作。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据待使用所述识别结果信息的应用,对与识别结果内容信息相匹配的用户信息项执行相应操作的实现方式,均应包含在本发明的范围内。
作为本实施例的优选方案之一,识别结果信息还包括至少一个语音片段的分类信息,本发明还包括在步骤S13之前执行的步骤S15,步骤S13进一步包括步骤S13’。
在步骤S15中,用户设备根据识别结果信息中的分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用。
具体地,用户设备根据分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用的方式包括但不限于:
1)用户设备直接根据分类信息,确定待启动的应用。
例如,用户设备在步骤S12中获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇”、“人名”和“拨号”,则用户设备根据上述三个分类信息,在预确定的分类信息与应用的对应关系表中进行查询,获得与分类信息“拨号”对应的应用“通话应用”,作为待启动的应用。
2)用户设备根据分类信息,确定待启动的应用的应用类型,并根据应用类型,确定待启动的应用。
例如,用户设备在步骤S12中获得语音片段“给”、“杜宇青”和“发邮件”的分类信息分别为“常用词汇”、“人名”和“邮件”;则用户设备根据上述三个分类信息,在预确定的分类信息与应用类型的对应关系表中进行查询,获得与分类信息“邮件”对应的应用类型为邮箱;接着,用户设备选择该应用类型中默认的outlook邮箱,作为待启动的应用。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据识别结果信息中的分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用的实现方式,均应包含在本发明的范围内。
在步骤S13’中,用户设备根据识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,与所述待启动的应用相关联的本地用户信息库包括预确定的、与待启动应用存在关联关系的本地用户信息库。
例如,与通话应用相关联的本地用户信息库包括本地通讯录,与outlook邮箱应用相关联的本地用户信息库包括本地邮箱联系人信息,与地图查询应用相关联的本地用户信息库包括用户常用餐厅名称信息和用户常用地名信息等。
其中,本步骤中用户设备根据识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与步骤S13中用户设备根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
优选地,本发明在步骤S13之前还包括步骤S16,前述步骤S13’包括步骤S13”。
在步骤S16中,用户设备根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息。
具体地,用户设备根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的方式包括但不限于:
1)当分类信息中包含用于标识其对应的语音片段的识别结果内容信息是否需要进行所述匹配查询的标识信息时,用户设备直接根据该标识信息,确定至少一个语音片段中需要进行匹配查询的识别结果内容信息。
例如,标识信息“1”用于标识需要进行匹配查询,标识信息“0”用于标识无需进行匹配查询。用户设备在步骤S12中获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇;0”、“人名;1”和“拨号;0”,则用户设备直接根据语音片段“杜宇青”的分类信息中包含标识信息“1”,确定该语音片段的识别结果内容信息需要进行所述匹配查询。
又例如,预定包含标识信息“1”的分类信息对应的语音片段需要进行匹配查询,未包含标识信息“1”的分类信息对应的语音片段无需进行匹配查询。用户设备在步骤S12中获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇”、“人名;1”和“拨号”,则用户设备直接根据语音片段“杜宇青”的分类信息中包含标识信息“1”,确定该语音片段需要进行所述匹配查询。
2)用户设备根据分类信息,在预确定的、需要进行匹配查询的分类信息库中进行查询,以确定至少一个语音片段中需要进行匹配查询的识别结果内容信息。
例如,用户设备在步骤S12中获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇”、“人名”和“拨号”,则用户设备根据上述三个分类信息,在预确定的、需要进行匹配查询的分类信息库中进行查询,并查询得到分类信息“人名”,则用户设备确定分类信息“人名”对应的语音片段“杜宇青”的识别结果内容信息需要进行匹配查询。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的实现方式,均应包含在本发明的范围内。
在步骤S13”中,用户设备根据需要进行匹配查询的识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述需要进行匹配查询的识别结果内容信息相匹配的用户信息项。
其中,本步骤中根据需要进行匹配查询的识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述需要进行匹配查询的识别结果内容信息相匹配的用户信息项的方式,与步骤S13中用户设备根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
本发明使得用户设备能够根据本地用户信息库,对网络设备语音识别所得的信息进行本地纠错,提高了语音识别的准确率;此外,由于纠错操作是由用户设备执行的,故降低了网络设备的负担,并且由于用户通常直接在用户设备上更新其用户信息库,因此,基于本地用户信息库进行语音识别,能够保证纠错操作所基于的用户信息是最新的。
图2为本发明另一个优选实施例的用于进行语音识别的方法流程图。本实施例包括步骤S11、步骤S21、步骤S22、步骤S23、步骤S24、步骤S17和步骤S18。
在步骤S11中,用户设备向网络设备发送待识别语音消息。
接着,在步骤S21中,网络设备获取来自所述用户设备的待识别语音信息。
接着,在步骤S22中,网络设备对所述待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息。
其中,本步骤已在参照图1所示实施例中予以详述,在此不再赘述。
接着,在步骤S23中,网络设备根据所述识别结果内容信息,在使用所述用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,网络设备可根据来自用户设备的、所述用户的身份信息,确定使用所述用户设备的用户的网络用户信息库。优选地,所述用户的身份信息可根据用户设备提供的以下至少一项信息来确定:
1)用户设备的标识信息;
例如,用户设备的芯片序列号;用户设备系统序列号;用户设备的移动识别号码,如手机号等。
2)用户的注册信息;
例如,用户ID和密码等。
其中,用户的网络用户信息库可由用户设备同步至网络设备中,例如,当用户设备接入网络时,用户设备自动将本地用户信息库同步至网络设备中;或者,用户的网络用户信息库可由用户直接在网络设备中建立或更新,例如,用户设备通过网络设备提供的网络用户信息库创建或修改页面,来建立或更新其网络用户信息库等。
具体地,网络设备根据确定的用户身份,获取其网络用户信息库,并根据所述识别结果内容信息,在网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,本步骤中网络设备根据识别结果内容信息,在网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与步骤S13中用户设备根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
优选地,本步骤中,网络设备根据识别结果内容信息中的文字信息,在网络用户信息库中查询与之匹配的用户信息项;并当未能查询到所述匹配的用户信息项时,根据所述拼音信息,在所述在使用用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的拼音信息相匹配的用户信息项。
接着,在步骤S24中,网络设备将识别结果内容信息和用户信息项提供给所述用户设备。
接着,在步骤S17中,用户设备接收网络设备反馈的、待识别语音信息的识别结果信息和用户信息项。
接着,在步骤S18中,用户设备根据待使用识别结果内容信息的应用,对用户信息项执行相应操作。
其中,本步骤与步骤S14相同或相似,在此不再赘述。
其中,当相应操作包括获取与用户信息项相关联的其他用户信息项时,用户设备可通过其本地用户信息库,获取该相关联的其他用户信息项,或者,用户设备可向网络设备发送请求,以请求网络设备在网络用户信息库中获取该相关联的其他用户信息项,并提供给用户设备。
作为本实施例的优选方案之一,识别结果内容信息还包括至少一个语音片段的分类信息,本实施例的方法还包括步骤S25,步骤S23包括步骤S23’,步骤S24包括步骤S24’,步骤S17包括步骤S17’,步骤S18包括步骤S18’。
在步骤S25中,网络设备根据分类信息,确定所述用户设备中待使用所述识别结果信息的应用。
其中,本步骤中网络设备根据分类信息,确定所述用户设备中待使用所述识别结果信息的应用的方式,与步骤S15中用户设备根据分类信息,确定用户设备中待使用所述识别结果信息的应用的方式相同或相似,在此不再赘述。
在步骤S23’中,网络设备根据所述识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,本步骤中网络设备根据所述识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与步骤S23中网络设备根据所述识别结果内容信息,在使用所述用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
优选地,网络设备还可根据所确定的应用,由网络用户信息库中获取与所述相匹配的用户信息项相关联的其他用户信息项。
在步骤S24’中,网络设备将所述识别结果内容信息、所述用户信息项和所述应用的标识信息提供给所述用户设备。
优选地,网络设备将所述识别结果内容信息、所述用户信息项、与该用户信息项相关联的其他用户信息项和所述应用的标识信息提供给所述用户设备。
接着,在步骤S17’中,用户设备接收网络设备反馈的、识别结果内容信息、用户信息项和待使用所述识别结果信息的应用的标识信息。
优选地,用户设备接收所述识别结果内容信息、所述用户信息项、与该用户信息项相关联的其他用户信息项和所述应用的标识信息提供给所述用户设备。
接着,在步骤S18’中,用户设备根据标识信息,确定待使用识别结果内容信息的应用,并根据该应用,对用户信息项执行相应操作。
优选地,本实施例在步骤S23之前还包括步骤S26,步骤S23’包括步骤S23”。
在步骤S26中,网络设备根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息。
其中,本步骤中网络设备根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的方式,与步骤S16中用户设备根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的方式相同或相似,在此不再赘述。
在步骤S23”中,网络设备根据需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,本步骤中网络设备根据需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与步骤S13”中用户设备根据需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
本实施例使得网络设备能够根据网络用户信息库,对其识别获得的识别结果内容信息进行纠错,使其能够向用户提供个性化的识别结果。
图3为本发明一个优选实施例的用于进行语音识别的系统结构示意图。本实施例的系统包括用户设备和网络设备;其中,用户设备包括用于执行本发明的操作的识别装置,该识别装置包括发送装置11、接收装置12、第一匹配查询装置13和执行装置14。
用户设备中的发送装置11向网络设备发送待识别语音信息。
其中,发送装置11可接收来自用户的待识别语音信息,并发送给网络设备。
例如,发送装置11获取来自用户的待识别语音信息“给杜宇青打个电话”,并发送给网络设备。
接着,网络设备获取来自用户设备的待识别语音信息。
例如,网络设备接收来自用户设备的语音信息“给杜宇青打个电话”。
接着,网络设备对该待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括该待识别语音消息中至少一个语音片段的识别结果内容信息。
优选地,一个语音片段的识别结果内容信息包括但不限于以下至少一项:
1)该语音片段的文字信息;
例如,对该语音片段进行语音识别所得的汉字信息、英文单词信息等。
需要说明的是,当一个语音片段能够识别得到多个发音相同或相似的文字信息时,网络设备可由其中选择一个或多个文字信息作为识别结果内容信息或其一部分,或者,网络设备将所有识别得到的文字信息作为识别结果内容信息或其一部分。
2)该语音片段的拼音信息;
例如,对该语音片段“杜宇青”进行语音识别所得的拼音信息“duyuqing”等。
3)该语音片段的语音波形信息;
例如,网络设备由语音信息“给杜宇青打个电话”中提取出其无法识别的语音片段“杜宇青”的语音波形信息,作为识别结果内容信息或其一部分。
具体地,网络设备基于预确定的语音信息库,对待识别语音信息进行识别,并获得该待识别语音信息中至少一个语音片段的识别结果内容信息。
例如,网络设备基于预确定的语音消息库,对待识别语音消息“给杜宇青打个电话”进行识别,获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”。
优选地,网络设备对语音信息进行语音识别所得的识别结果信息中还包括至少一个语音片段的分类信息。其中,该分类信息用于标识语音片段的类型,例如,语音片段属于人名、地名、拨号类、邮件类等。
其中,网络设备可通过多种方式获得语音片段的分类信息。例如,当在语音信息库中查询到与语音片段相匹配的信息时,直接获取该信息的分类信息,作为语音片段的分类信息;又例如,网络设备通过对语音识别所得的文本信息进行语义分析,从而确定该文本信息对应的语音片段的分类信息等。
更优选地,该分类信息中包含用于标识其对应的语音片段的识别结果内容信息是否需要由进行用户设备进行本地匹配查询的标识信息,网络设备可根据所确定的语音片段的分类,确定所述标识信息。例如,预定分类“人名”、“地名”需要由进行用户设备进行本地匹配查询,则当网络设备确定语音片段的分类为“人名”或“地名”时,在分类信息中加入用于标识其对应的语音片段的识别结果内容信息需要由进行用户设备进行本地匹配查询的标识信息,当网络设备确定语音片段的分类为其他分类时,在分类信息中加入用于标识其对应的语音片段的识别结果内容信息不需要由进行用户设备进行本地匹配查询的标识信息,或者,网络设备不在分类信息中加入标识信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对待识别语音信息进行语音识别,获得包括其中至少一个语音片段的识别结果内容信息的识别结果信息的实现方式,均应包含在本发明的范围内。
接着,网络设备将识别结果信息发送给用户设备。
接着,用户设备中的接收装置12接收网络设备反馈的、所述待识别语音信息的识别结果信息。
接着,用户设备中的第一匹配查询装置13根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,所述本地用户信息库包括存储于所述用户设备或该用户设备的外接存储设备中,且用于存储用户信息的信息库;优选地,该本地用户信息库可作为一个整体,存储所有的用户信息,或者,该本地用户信息库包括多个独立的用户信息库,如包括用户电话联系人信息库、用户MSN联系人信息库、用户常用地名信息库、用户常用餐厅名称信息库等。
其中,所述用户信息项包括用户的一项信息;例如,联系人姓名、联系人邮箱、联系人电话、用户常用地名、用户常用餐厅名称等。
具体地,第一匹配查询装置13根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式包括但不限于:
1)第一匹配查询装置13分别根据所有语音片段的识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所有语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
例如,接收装置12获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”;则第一匹配查询装置13分别根据上述三个语音片段的识别结果内容信息,在本地用户信息库中进行匹配查询,并仅获得与语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”相匹配的用户信息项“联系人姓名:杜宇青”。
又例如,接收装置12获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的语音波形信息以及语音片段“打个电话”的文字信息“打个电话”;则第一匹配查询装置13分别根据语音片段“给”和“打个电话”的识别结果内容信息,在本地用户信息库的、存储有文本信息的用户信息库中进行匹配查询,未获得相匹配的用户信息项,并且,第一匹配查询装置13根据语音片段“杜宇青”在本地用户信息库的、存储有语音信息的用户信息库中进行匹配查询,并确定与语音片段“杜宇青”的语音波形信息相匹配的用户信息项为“联系人姓名:杜宇青”。其中,本地用户信息库中的语音波形信息可来自用户,并且,该语音波形信息对应的文本信息,或与该语音波形信息相匹配的用户信息项可由用户设置。
2)第一匹配查询装置13由所有语音片段中选择部分语音片段,并根据所选择的语音片段的识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所选择的语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
例如,接收装置12获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”;则第一匹配查询装置13基于通用词汇库,判断文字信息“给”和“打个电话”为通用词汇,无需对其执行本地匹配查询的操作,接着,第一匹配查询装置13根据其文字信息未被判断为通用词汇的语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”,在本地用户信息库中进行匹配查询,并仅获得与语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”相匹配的用户信息项“联系人姓名:杜宇青”。
3)第一匹配查询装置13根据识别结果内容信息,在与预确定的、待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。本实现方式将在后续优选方案中予以详述,在此不再赘述。
优选地,识别结果内容信息包括文字信息以及拼音信息,第一匹配查询装置13进一步包括第一文字匹配查询装置(图未示)和第一拼音匹配查询装置(图未示)。第一文字匹配查询装置根据所述文字信息,在所述本地用户信息库中查询与之匹配的用户信息项,并当第一文字匹配查询装置未能查询到所述匹配的用户信息项时,第一拼音匹配查询装置根据所述拼音信息,在所述本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的拼音信息相匹配的用户信息项。
例如,对于接收装置12获得的语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”,第一文字匹配查询装置根据文字信息“杜玉清”在本地用户信息库中查询,且未能查询到与该文字信息相匹配的用户信息项;接着,第一拼音匹配查询装置根据拼音信息“duyuqing”在本地用户信息库中进行匹配查询,获得与拼音信息“duyuqing”相匹配的用户信息项“联系人姓名:杜宇青”。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的实现方式,例如,分别根据一个语音片段的文字信息、拼音信息和语音波形信息在本地用户信息库中进行查询,并当查询到多个分别与上述三项信息匹配的用户信息项时,由其中选择用户使用频率最高的用户信息项,或将该多个相匹配的用户信息项呈现给用户以供其选择等,均应包含在本发明的范围内。
接着,用户设备中的执行装置14根据待使用所述识别结果信息的应用,对与识别结果内容信息相匹配的用户信息项执行相应操作。
其中,所述待使用所述识别结果信息的应用包括任何可能被用户设备确定为需要使用所述识别结果信息的应用。优选地,该待使用识别结果信息的应用包括但不限于:
1)用户设备中当前处于活动状态的应用;
例如,用户设备中当前已启动并处于活动状态的邮箱应用;又例如,用户设备中当前正在向另一用户设备拨号的通话应用等。
2)用户设备根据识别结果内容信息确定的待启动应用;
例如,用户设备中存储有预确定的命令词汇库,其中,该命令词汇库存储有常用命令词汇以及分别与各个常用命令词汇对应的应用,接收装置12获得语音片段“给”的文字信息“给”,语音片段“杜宇青”的文字信息“杜玉清”和拼音信息“duyuqing”以及语音片段“打个电话”的文字信息“打个电话”;则用户设备根据上述三个语音片段的文本信息,在预确定的命令词汇库中查询,并确定与文本信息“电话”对应的应用为通话应用,则用户设备将通话应用作为待使用所述识别结果信息的应用。
3)识别结果信息中还包括至少一个语音片段的分类信息,用户设备根据该分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用。本实现方式将在后续优选方案中予以详述,在此不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何可能被用户设备确定为需要使用所述识别结果信息的应用,均应包含在本发明所述待使用识别结果信息的应用的范围内。
具体地,执行装置14能够通过多种方式,来根据待使用识别结果信息的应用,对与识别结果内容信息相匹配的用户信息项执行相应操作,。
例如,待使用识别结果信息的应用为通话应用,第一匹配查询装置13获得的用户信息项为“联系人姓名:杜宇青”;执行装置14根据应用为通话应用,确定需要将联系人姓名呈现给用户,则执行装置14将联系人姓名“杜宇青”呈现给用户。
又例如,待使用识别结果信息的应用为outlook邮箱,第一匹配查询装置13获得的用户信息项为“联系人姓名:杜宇青”;执行装置14根据应用为outlook邮箱,确定其需要获取联系人对应的邮箱信息,并提供给outlook,则执行装置14获取联系人“杜宇青”的邮箱信息“duyuqingxiaoi.com”,并将该邮箱信息提供给outlook邮箱,以供outlook邮箱执行其待执行的操作。
优选地,执行装置14对与识别结果内容信息相匹配的用户信息项执行的相应操作包括但不限于以下至少一项:
1)执行装置14将所述相匹配的用户信息项以与所述待使用识别结果信息的应用相关联的方式呈现给用户。
例如,相匹配的用户信息项包含联系人名称,待使用识别结果信息的应用为通话应用;则当通话应用在拨号时,执行装置14将用户信息项中包含的联系人名称呈现给用户。
又例如,相匹配的用户信息项包含餐厅名称,待使用识别结果信息的应用为地图查询应用;则当地图查询应用查询获得餐厅具体位置时,执行装置14将用户信息项中包含的餐厅名称呈现给用户。
2)执行装置14获取与所述相匹配的用户信息项相关联的其他用户信息项,用以所述应用待执行的操作。
优选地,执行装置14能够通过用户信息项的类型、用户信息项在用户设备中存在的存储关联关系等,确定与所述相匹配的用户信息项相关联的其他用户信息项。
例如,相匹配的用户信息项为“联系人姓名:杜宇青”,待使用识别结果信息的应用为outlook邮箱;则执行装置14根据应用为outlook邮箱,获取与联系人姓名“杜宇青”存储在同一联系人资料册中的联系人邮箱“duyuqingxiaoi.com”,并将给联系人邮箱提供给outlook邮箱,用以其待执行的邮件发送操作。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据待使用所述识别结果信息的应用,对与识别结果内容信息相匹配的用户信息项执行相应操作的实现方式,均应包含在本发明的范围内。
作为本实施例的优选方案之一,识别结果信息还包括至少一个语音片段的分类信息,识别装置还包括第一应用确定装置(图未示),第一匹配查询装置进一步包括第一子匹配查询装置(图未示)。
第一应用确定装置根据识别结果信息中的分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用。
具体地,第一应用确定装置根据分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用的方式包括但不限于:
1)第一应用确定装置直接根据分类信息,确定待启动的应用。
例如,接收装置12获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇”、“人名”和“拨号”,则第一应用确定装置根据上述三个分类信息,在预确定的分类信息与应用的对应关系表中进行查询,获得与分类信息“拨号”对应的应用“通话应用”,作为待启动的应用。
2)第一应用确定装置根据分类信息,确定待启动的应用的应用类型,并根据应用类型,确定待启动的应用。
例如,接收装置12获得语音片段“给”、“杜宇青”和“发邮件”的分类信息分别为“常用词汇”、“人名”和“邮件”;则第一应用确定装置根据上述三个分类信息,在预确定的分类信息与应用类型的对应关系表中进行查询,获得与分类信息“邮件”对应的应用类型为邮箱;接着,第一应用确定装置选择该应用类型中默认的outlook邮箱,作为待启动的应用。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据识别结果信息中的分类信息,确定待启动的应用,作为待使用所述识别结果信息的应用的实现方式,均应包含在本发明的范围内。
第一子匹配查询装置根据识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,与所述待启动的应用相关联的本地用户信息库包括预确定的、与待启动应用存在关联关系的本地用户信息库。
例如,与通话应用相关联的本地用户信息库包括本地通讯录,与outlook邮箱应用相关联的本地用户信息库包括本地邮箱联系人信息,与地图查询应用相关联的本地用户信息库包括用户常用餐厅名称信息和用户常用地名信息等。
其中,第一子匹配查询装置根据识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与第一匹配查询装置根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
优选地,识别装置还包括第一匹配对象确定装置(图未示),前述第一字匹配查询装置包括第二子匹配查询装置(图未示)。
第一匹配对象确定装置根据分类信息,确定待识别语音消息的至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息。
具体地,第一匹配对象确定装置根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的方式包括但不限于:
1)当分类信息中包含用于标识其对应的语音片段的识别结果内容信息是否需要进行所述匹配查询的标识信息时,第一匹配对象确定装置直接根据该标识信息,确定至少一个语音片段中需要进行匹配查询的识别结果内容信息。
例如,标识信息“1”用于标识需要进行匹配查询,标识信息“0”用于标识无需进行匹配查询。接收装置12获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇;0”、“人名;1”和“拨号;0”,则第一匹配对象确定装置直接根据语音片段“杜宇青”的分类信息中包含标识信息“1”,确定该语音片段的识别结果内容信息需要进行所述匹配查询。
又例如,预定包含标识信息“1”的分类信息对应的语音片段需要进行匹配查询,未包含标识信息“1”的分类信息对应的语音片段无需进行匹配查询。接收装置12获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇”、“人名;1”和“拨号”,则第一匹配对象确定装置直接根据语音片段“杜宇青”的分类信息中包含标识信息“1”,确定该语音片段需要进行所述匹配查询。
2)第一匹配对象确定装置根据分类信息,在预确定的、需要进行匹配查询的分类信息库中进行查询,以确定至少一个语音片段中需要进行匹配查询的识别结果内容信息。
例如,接收装置12获得语音片段“给”、“杜宇青”和“打个电话”的分类信息分别为“常用词汇”、“人名”和“拨号”,则第一匹配对象确定装置根据上述三个分类信息,在预确定的、需要进行匹配查询的分类信息库中进行查询,并查询得到分类信息“人名”,则第一匹配对象确定装置确定分类信息“人名”对应的语音片段“杜宇青”的识别结果内容信息需要进行匹配查询。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的实现方式,均应包含在本发明的范围内。
第二子匹配查询装置根据需要进行匹配查询的识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述需要进行匹配查询的识别结果内容信息相匹配的用户信息项。
其中,第二子匹配查询装置根据需要进行匹配查询的识别结果内容信息,在与所述待启动的应用相关联的本地用户信息库中进行匹配查询,以获得与所述需要进行匹配查询的识别结果内容信息相匹配的用户信息项的方式,与第一匹配查询装置13根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
本发明使得用户设备能够根据本地用户信息库,对网络设备语音识别所得的信息进行本地纠错,提高了语音识别的准确率;此外,由于纠错操作是由用户设备执行的,故降低了网络设备的负担,并且由于用户通常直接在用户设备上更新其用户信息库,因此,基于本地用户信息库进行语音识别,能够保证纠错操作所基于的用户信息是最新的。
图4为本发明另一个优选实施例的用于进行语音识别的系统结构示意图。本实施例的系统包括用户设备和网络设备;其中,网络设备包括用于执行本发明操作的辅助装置,该辅助装置包括语音获取装置21、语音识别装置22、第二匹配查询装置23和提供装置24。
首先,用户设备向网络设备发送待识别语音消息。
接着,网络设备中的语音获取装置21获取来自所述用户设备的待识别语音信息。
接着,网络设备中的语音识别装置22对所述待识别语音信息进行语音识别,获得识别结果信息,其中,所述识别结果信息包括所述待识别语音信息中至少一个语音片段的识别结果内容信息。
其中,语音识别装置22对所述待识别语音信息进行语音识别,获得识别结果信息的方式,与参照图3所示实施例中网络设备对所述待识别语音信息进行语音识别,获得识别结果信息的方式相同或相似,在此不再赘述。
接着,网络设备中的第二匹配查询装置23根据所述识别结果内容信息,在使用所述用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,第二匹配查询装置23可根据来自用户设备的、所述用户的身份信息,确定使用所述用户设备的用户的网络用户信息库。优选地,所述用户的身份信息可根据用户设备提供的以下至少一项信息来确定:
1)用户设备的标识信息;
例如,用户设备的芯片序列号;用户设备系统序列号;用户设备的移动识别号码,如手机号等。
2)用户的注册信息;
例如,用户ID和密码等。
其中,用户的网络用户信息库可由用户设备同步至网络设备中,例如,当用户设备接入网络时,用户设备自动将本地用户信息库同步至网络设备中;或者,用户的网络用户信息库可由用户直接在网络设备中建立或更新,例如,用户设备通过网络设备提供的网络用户信息库创建或修改页面,来建立或更新其网络用户信息库等。
具体地,第二匹配查询装置23根据确定的用户身份,获取其网络用户信息库,并根据所述识别结果内容信息,在网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,第二匹配查询装置23根据识别结果内容信息,在网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与第一匹配查询装置13根据识别结果内容信息,在本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
优选地,第二匹配查询装置23进一步包括第二文字匹配查询装置(图未示)和第二拼音匹配查询装置(图未示)。第二文字匹配查询装置根据识别结果内容信息中的文字信息,在网络用户信息库中查询与之匹配的用户信息项;当未能查询到所述匹配的用户信息项时,第二拼音匹配查询装置根据所述拼音信息,在所述在使用用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的拼音信息相匹配的用户信息项。
接着,网络设备中的提供装置24将识别结果内容信息和用户信息项提供给所述用户设备。
接着,用户设备接收网络设备反馈的、待识别语音信息的识别结果信息和用户信息项。
接着,用户设备根据待使用识别结果内容信息的应用,对用户信息项执行相应操作。
其中,用户设备根据待使用识别结果内容信息的应用,对用户信息项执行相应操作的方式,与参照图3所示实施例中执行装置14根据待使用识别结果内容信息的应用,对用户信息项执行相应操作的方式相同或相似,在此不再赘述。
其中,当相应操作包括获取与用户信息项相关联的其他用户信息项时,用户设备可通过其本地用户信息库,获取该相关联的其他用户信息项,或者,用户设备可向网络设备发送请求,以请求网络设备在网络用户信息库中获取该相关联的其他用户信息项,并提供给用户设备。
作为本实施例的优选方案之一,识别结果内容信息还包括至少一个语音片段的分类信息,本实施例的辅助装置还包括第二应用确定装置(图未示),第二匹配查询装置23包括第三子匹配查询装置(图未示),提供装置24包括子提供装置(图未示)。
网络设备中的第二应用确定装置根据分类信息,确定所述用户设备中待使用所述识别结果信息的应用。
其中,第二应用确定装置根据分类信息,确定所述用户设备中待使用所述识别结果信息的应用的方式,与参照图3所示实施例中第一应用确定装置用户设备根据分类信息,确定用户设备中待使用所述识别结果信息的应用的方式相同或相似,在此不再赘述。
网络设备中的第三子匹配查询装置根据所述识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,第三子匹配查询装置根据所述识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与第二匹配查询装置23根据所述识别结果内容信息,在使用所述用户设备的用户的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
优选地,网络设备还可根据所确定的应用,由网络用户信息库中获取与所述相匹配的用户信息项相关联的其他用户信息项。
网络设备中的子提供装置将所述识别结果内容信息、所述用户信息项和所述应用的标识信息提供给所述用户设备。
优选地,子提供装置将所述识别结果内容信息、所述用户信息项、与该用户信息项相关联的其他用户信息项和所述应用的标识信息提供给所述用户设备。
接着,用户设备接收网络设备反馈的、识别结果内容信息、用户信息项和待使用所述识别结果信息的应用的标识信息。
优选地,用户设备接收所述识别结果内容信息、所述用户信息项、与该用户信息项相关联的其他用户信息项和所述应用的标识信息提供给所述用户设备。
接着,用户设备根据标识信息,确定待使用识别结果内容信息的应用,并根据该应用,对用户信息项执行相应操作。
优选地,辅助装置还包括第二匹配对象确定装置(图未示),第三子匹配查询装置包括第四子匹配查询装置(图未示)。
网络设备中的第二匹配对象确定装置根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息。
其中,第二匹配对象确定装置根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的方式,与参照图3所示实施例中第一匹配对象确定装置根据分类信息,确定所述至少一个语音片段的识别结果内容信息中需要进行所述匹配查询的识别结果内容信息的方式相同或相似,在此不再赘述。
网络设备中的第四子匹配查询装置根据需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项。
其中,第四子匹配查询装置根据需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的网络用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式,与参照图3所示实施例中第二子匹配查询装置根据需要进行匹配查询的识别结果内容信息,在使用所述用户设备的用户的、与所述应用相关联的本地用户信息库中进行匹配查询,以获得与所述至少一个语音片段中全部或部分语音片段的识别结果内容信息相匹配的用户信息项的方式相同或相似,在此不再赘述。
本实施例使得网络设备能够根据网络用户信息库,对其识别获得的识别结果内容信息进行纠错,使其能够向用户提供个性化的识别结果
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、加载于通用目的计算机中的软件程序或任何其他类似软件和/或硬件设备来实现。
本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个功能或步骤的电路等。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。