CN111210826B - 语音信息处理方法、装置、存储介质和智能终端 - Google Patents
语音信息处理方法、装置、存储介质和智能终端 Download PDFInfo
- Publication number
- CN111210826B CN111210826B CN201911363138.7A CN201911363138A CN111210826B CN 111210826 B CN111210826 B CN 111210826B CN 201911363138 A CN201911363138 A CN 201911363138A CN 111210826 B CN111210826 B CN 111210826B
- Authority
- CN
- China
- Prior art keywords
- uploading
- information
- voice information
- voice
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 32
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000004806 packaging method and process Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 14
- 230000003993 interaction Effects 0.000 claims description 13
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000005538 encapsulation Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000010408 sweeping Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请适用于语音信息处理技术领域,提供了一种语音信息处理方法、装置、存储介质和智能终端,包括:获取智能终端的属性信息以及所述智能终端发送的语音信息;对所述语音信息进行语音识别,确定所述语音信息对应的处理操作的操作类型;根据所述智能终端的属性信息和/或所述操作类型,确定所述语音信息的上传方式;基于确定的所述上传方式,将所述语音信息上传至云端服务器。本申请可释放本地服务器的空间资源,降低服务器的处理压力,提高服务器的执行效率。
Description
技术领域
本申请属于语音信息处理技术领域,尤其涉及一种语音信息处理方法、装置、存储介质和智能终端。
背景技术
近年来随着人工智能的进一步快速发展,机器人行业也迎来了快速崛起,语音录入系统作为机器人上传语音和下发指令的重要系统越来越受到重视,系统作为机器人或者其他终端语音上报和解析结果指令下发的关键系统愈来愈凸显重要性,客户端高频率高并发访问也给语音录入系统带来了较大的压力。
ASR(自动语音识别)技术作为服务识别用户语言不可或缺的组成部分,一直以来扮演者重要的角色。但随着用户个体数量的不断增多,发音标准性和音量高低都会影响到ASR能不能有较高的识别率。因此众多企业或者科研机构需要使用大量的语音文件来测试语音算法,遗憾的是目前可以获取到的标准语音渠道并不多,语音质量较低,加之无法满足多方言问题。因此,存储高质量完整流畅的标准语音就突显出较大必要性。
然而,随着采集的用户体量逐步增大,服务器存储空间不足引发的数据缺失时有发生,过多的向服务器存入文件会使得服务器的执行效率降低,实时上传至云端加大了服务器的处理压力,并且容易造成存入失败。
发明内容
本申请实施例提供了一种语音信息处理方法、装置、存储介质和智能终端,可以解决现有技术中,过多的向服务器存入文件会使得服务器的执行效率降低,实时上传至云端加大了服务器的处理压力,并且容易造成存入失败的问题。
第一方面,本申请实施例提供了一种语音信息处理方法,包括:
获取智能设备的属性信息以及所述智能设备发送的语音信息;
对所述语音信息进行语音识别,确定所述语音信息对应的处理操作的操作类型;
根据所述智能设备的属性信息和/或所述操作类型,确定所述语音信息的上传方式;
基于确定的所述上传方式,将所述语音信息上传至云端服务器。
在第一方面的一种可能的实现方式中,所述根据所述智能设备的属性信息,确定所述语音信息的上传方式的步骤,包括:
根据所述智能设备的属性信息,确定所述智能设备的属性信息对应的应用场景类型;
根据所述应用场景类型与预设的场景上传方式对照表,确定所述智能设备的应用场景类型对应的语音信息的上传方式。
在第一方面的一种可能的实现方式中,所述根据所述操作类型,确定所述语音信息的上传方式的步骤,包括:
对所述语音信息进行语音识别,根据所述语音识别的结果确定所述语音信息对应的处理操作的操作类型;
根据所述操作类型与预设的类型上传方式对照表,确定所述操作类型对应的上传方式。
在第一方面的一种可能的实现方式中,所述基于确定的所述上传方式,将所述语音信息上传至云端服务器的步骤,包括:
从所述语音信息中读取指定大小的语音字节信息,存入预先定义的消息队列,所述消息队列用于存放待上传的语音字节信息;
启动子线程,基于确定的所述上传方式,将所述消息队列中的所述语音字节信息上传至云端服务器。
在第一方面的一种可能的实现方式中,所述基于确定的所述上传方式,将所述语音信息上传至云端服务器的步骤,包括:
若确定所述语音信息的上传方式为追加上传,则获取所述追加上传的封装参数;
根据所述追加上传的封装参数,将所述语音信息封装后上传至云端服务器。
在第一方面的一种可能的实现方式中,所述基于确定的所述上传方式,将所述语音信息上传至云端服务器的步骤,包括:
若所述语音信息的上传方式为一次性上传,则确定所述语音信息是否携带结束标识;
若所述语音信息未携带结束标识,则将所述语音信息存入临时文件夹中;
若所述语音信息携带结束标识,则将所述语音信息存入所述临时文件夹,并获取一次性上传的封装参数;
根据所述一次性上传的封装参数,将所述临时文件夹中的语音信息打包封装后上传至云端服务器。
第二方面,本申请实施例提供了一种语音信息处理装置,包括:
信息获取单元,用于获取智能设备的属性信息以及所述智能设备发送的语音信息;
信息识别单元,用于对所述语音信息进行语音识别,确定所述语音信息对应的处理操作的操作类型;
上传方式确定单元,用于根据所述智能设备的属性信息和/或所述操作类型,确定所述语音信息的上传方式;
信息上传单元,用于基于确定的所述上传方式,将所述语音信息上传至云端服务器。
第三方面,本申请实施例提供了一种智能终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的语音信息处理方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的语音信息处理方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在智能终端上运行时,使得智能终端执行如上述第一方面所述的语音信息处理方法。
本申请实施例中,通过获取智能设备的属性信息以及所述智能设备发送的语音信息,对所述语音信息进行语音识别,确定所述语音信息对应的处理操作的操作类型,然后根据所述智能设备的属性信息和/或所述操作类型,确定所述语音信息的上传方式,再基于确定的所述上传方式,将所述语音信息上传至云端服务器,本申请不仅可释放本地服务器的空间资源,提高服务器的执行效率,还可根据灵活确定的上传方式将语音信息从本地的服务器上传至云端服务器,保证语音信息上传的完整性,同时可有效降低服务器的执行压力。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的语音信息处理方法的实现流程图;
图2是本申请实施例提供的语音信息处理方法S103的具体实现流程图;
图3是本申请实施例提供的语音信息处理方法步骤S104以追加上传方式上传的具体实现流程图;
图4是本申请实施例提供的语音信息处理方法步骤S104以一次性传方式上传的具体实现流程图;
图5是本申请实施例提供的语音信息处理装置的结构框图;
图5a是本申请另一实施例提供的语音信息处理装置的结构框图;
图5b是本申请实施例提供的信息上传单元的结构框图;
图6是本申请实施例提供的智能终端的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本申请实施例提供的语音信息处理方法可以应用于服务器、超级移动个人计算机(ultra-mobile personal computer,UMPC)等智能终端上,本申请实施例对智能终端的具体类型不作任何限制。
图1示出了本申请实施例提供的语音信息处理方法的实现流程,该方法流程包括步骤S101至S104。各步骤的具体实现原理如下:
S101:获取智能设备的属性信息以及所述智能设备发送的语音信息,
具有不同业务处理功能的智能设备,其属性信息也不一样,所述属性信息包括型号信息、设备标识信息等,所述智能设备的属性信息可用于确定智能设备的应用场景。本实施例中的执行端为服务器,所述智能设备可以为机器人,也可以为智能音箱。示例性地,在机器人与服务器建立通信连接时,获取所述机器人的型号信息。在本申请实施例中,服务器上运行有语音接入系统,用户唤醒智能设备,智能设备通过服务器上运行的语音接入系统发放的令牌与所述服务器建立通信。
具体地,用户通过在移动终端的APP上输入智能设备的属性信息,如机器人的属性信息,所述移动终端将所述智能设备的属性信息发送至服务器,并接收服务器基于所述移动终端发送的所述智能设备的属性信息反馈的验证码,并将所述验证码转送至所述智能设备,所述智能设备根据所述验证码,向所述服务器请求令牌,所述令牌用于智能设备与服务器之间建立通信,所述服务器根据所述智能设备的属性信息以及所述验证码生成令牌,并将所述令牌发送至所述智能设备,当所述智能设备获取令牌之后,基于所述令牌与所述服务器通信连接,所述智能设备实时将用户的语音信息发送至所述服务器,所述服务器实时获取智能设备发送的语音信息。
S102:对所述语音信息进行语音识别,确定所述语音信息对应的处理操作的操作类型。
在本申请实施例中,启动主线程对所述语音信息进行语音识别,根据语音识别的结果执行相应的处理操作,向所述智能设备反馈所述处理操作的结果信息,同时,确定所述语音信息对应的处理操作的操作类型。具体地,将语音信息对应的处理操作按交互次数分类,例如,单次交互类型、多轮交互类型,根据语音识别的结果确定相应的处理操作是一次即可完成还是需要多次获取语音信息执行多次处理操作。
S103:根据所述智能设备的型号信息和/或所述操作类型,确定所述语音信息的上传方式。
为提高信息上传的效率,并保证上传的信息的完整性,在本申请实施例中,可根据所述智能设备的属性信息和/或所述操作类型,确定所述语音信息的上传方式,所述语音信息的上传方式包括但不限于追加上传和一次性上传。一次性上传是指将多条语音信息一起打包上传。不同型号的机器人发送的语音信息可对应不同的上传方式,对应不同操作类型的语音信息,其上传至云端服务器的方式也可能不同。
作为本申请的一个实施例,所述属性信息包括型号信息,所述根据所述智能设备的属性信息,确定所述语音信息的上传方式的步骤,具体包括:
A1:根据所述智能设备的属性信息,确定所述智能设备的属性信息对应的应用场景类型。所述应用场景类型是指所述智能设备的业务功能,例如,根据所述机器人的型号信息,确定所述机器人为扫地机器人、儿童学习机器人或者陪伴式机器人。
A2:根据所述应用场景类型与预设的场景上传方式对照表,确定所述智能设备的应用场景类型对应的语音信息的上传方式。预设场景上传方式对照表表,所述预设的场景上传方式对照表表包括应用场景类型与语音信息的上传方式的对照关系,例如,若所述机器人为扫地机器人,该扫地机器人发送的语音信息对应的上传方式为追加上传;若所述机器人为儿童学习机器人,该儿童学习机器人发送的语音信息的上传方式为一次性上传。需说明的是,所述场景上传方式对照表表中包括不止一次性上传和追加上传两种上传方式,例如,还可以包括随机上传方式,即随机选择上传方式。
作为本申请的一个实施例,所述根据所述操作类型,确定所述语音信息的上传方式的步骤,具体包括:
B1:对所述语音信息进行语音识别,根据所述语音识别的结果确定所述语音信息对应的处理操作的操作类型。
B2:根据所述操作类型与预设的类型上传方式对照表,确定所述操作类型对应的上传方式。所述预设的类型上传方式对照表包括操作类型与上传方式的对照关系。例如,若所述语音信息对应的处理操作的操作类型为单次交互类型,则所述语音信息对应的上传方式为追加上传方式;若所述语音信息对应的处理操作的操作类型为多轮交互类型,则所述语音信息对应的上传方式为一次性上传方式。需说明的是,所述类型上传方式对照表中包括不止一次性上传和追加上传两种上传方式,例如,还可以包括随机上传方式,即随机选择上传方式。
作为本申请的一个实施例,如图2所示,本申请实施例提供的语音信息处理方法步骤S103的具体实现流程,具体包括:
C1:从所述语音信息中读取指定大小的语音字节信息,存入预先定义的消息队列,所述消息队列用于存放待上传的语音字节信息。在本实施例中,服务器实时获取智能设备上传的语音信息,并根据设定频率从所述语音信息中读取指定大小的语音字节信息,将读取的语音字节信息依次存入预先定义的消息队列。所述消息队列为预先设置的用于存放待上传的语音字节信息。
C2:启动子线程,基于确定的所述上传方式,将所述消息队列中的所述语音字节信息上传至云端服务器。具体地,启动设定数量的子线程消费所述消息队列,按确定的上传方式将所述消息队列中的所述语音字节信息上传至云端服务器。
在本申请实施例中,启动主线程对所述语音信息进行语音识别,根据语音识别的结果执行相应的处理操作,启动设定数量的子线程消费所述消息队列,基于确定的上传方式,将所述消息队列中的所述语音字节信息上传至云端服务器。通过子线程将语音信息上传至云端服务器,无论是否上传成功,皆不影响主线程处理语音信息及反馈处理结果,在高效处理语音信息的同时有效的将语音信息上传至云端服务器保存,提高了服务器的对语音信息的处理效率,引入消息队列完成语音信息的上传,既不会造成上传拥塞,同时也减轻了服务器压力。
可选地,若根据所述应用场景类型与预设的场景上传方式对照表,确定所述智能设备的应用场景类型对应的语音信息的上传方式为随机上传方式,则可根据所述操作类型与预设的类型上传方式对照表,确定所述操作类型对应的上传方式,以所述操作类型对应的上传方式确定为所述语音信息的上传方式。
S104:基于确定的所述上传方式,将所述语音信息上传至云端服务器。
在本申请实施例中,调用追加上传的方式、一次性上传的方式或者其他上传方式对应的API接口,将语音信息上传到云端服务器进行存储。需要说明的是,本申请实施例中的上传方式不限于追加上传和一次性上传。
作为本申请的一个实施例,图3示出了本申请实施例提供的语音信息处理方法步骤S104以追加上传方式上传的具体实现流程,详述如下:
D1:若确定所述语音信息的上传方式为追加上传,则获取所述追加上传的封装参数。具体地,不同上传方式的封装参数存在不同,所述封装参数中包括上传方式的标识。在确定所述语音信息的上传方式为追加上传时,根据语音信息携带的用户标识、智能设备标识以及追加上传方式标识,按预设规则生成针对所述语音信息的追加上传的封装参数。
D2:根据所述追加上传的封装参数,将所述语音信息封装后上传至云端服务器。
在本申请实施例中,将语音信息按对应的封装参数封装后再上传至云端服务器,由于封装参数中存在上传方式标识,可方便在云端服务器中确定存储的语音信息的上传方式。可选地,云端服务器可根据所述封装信息中的用户标识与智能设备标识,动态生成专属于所述语音信息的文件夹名称,服务器将所述智能设备在一定时间内以追加方式上传的语音信息上传至同一文件夹中进行保存。
作为本申请的一个实施例,图4示出了本申请实施例提供的语音信息处理方法步骤S104以一次性上传方式上传的具体实现流程,详述如下:
E1:若所述语音信息的上传方式为一次性上传,则确定所述语音信息是否携带结束标识。具体地,若确定所述语音信息为所述智能设备上传的第一段初始语音信息,则为所述语音生成初始标识;若确定所述语音信息为所述智能设备在当前交互阶段的最后一段语音信息,则生成所述语音信息的结束标识。在本申请实施例中,将本轮交互首次获取的语音信息确定为第一段语音信息,服务器每次固定读取指定长度的语音信息,当读取的语音信息的长度小于所述指定长度时,将所述语音信息确定为最后一段语音信息,或者,在预设时间内未检测到智能设备上传的语音信息,则确定用户已静音,将用户静音前所述智能设备上传的语音信息确定为最后一段语音信息。
E2:若所述语音信息未携带结束标识,则将所述语音信息存入临时文件夹中。若所述语音信息未携带结束标识,则判定用户还未录入完毕,继续获取所述智能设备上传的语音信息,所述智能设备上传的每一段语音信息都携带有信息编号,将所述语音信息按所述信息编号依次有序存入临时文件夹中。所述临时文件夹用于缓存语音信息。在一个实施例中,周期清理存储空间,将已打包上传的临时文件夹删除,释放存储空间。
E3:若所述语音信息携带结束标识,则将所述语音信息存入所述临时文件夹,并获取一次性上传的封装参数。具体地,在确定所述语音信息的上传方式为一次性上传时,根据语音信息携带的用户标识、智能设备标识以及一次性上传方式标识,按预设规则生成针对所述语音信息的一次性上传的封装参数。
E4:根据所述一次性上传的封装参数,将所述临时文件夹中的语音信息打包封装后上传至云端服务器。其中,服务器可根据所述语音信息携带的用户标识、智能设备标识以及一次性上传方式标识,动态生成所述临时文件夹的文件夹名称。
本申请实施例中,将原先保存在服务器本地的语音信息上传至云端服务器,释放了服务器的空间资源,可提高服务器的执行效率。
在本申请实施例中,通过获取智能设备的属性信息以及所述智能设备发送的语音信息,对所述语音信息进行语音识别,确定所述语音信息对应的处理操作的操作类型,然后根据所述智能设备的属性信息和/或所述操作类型,确定所述语音信息的上传方式,再基于确定的所述上传方式,将所述语音信息上传至云端服务器,本申请不仅可释放本地服务器的空间资源,提高服务器的执行效率,还可根据灵活确定的上传方式将语音信息从本地的服务器上传至云端服务器,保证语音信息上传的完整性,同时可有效降低服务器的执行压力。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文实施例所述的语音信息处理方法,图5示出了本申请实施例提供的语音信息处理装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。
参照图5,该语音信息处理装置包括:信息获取单元51,信息识别单元52,上传方式确定单元53,信息上传单元54,其中:
信息获取单元51,用于获取智能设备的属性信息以及所述智能设备发送的语音信息;
信息识别单元52,用于对所述语音信息进行语音识别,确定所述语音信息对应的处理操作的操作类型;
上传方式确定单元53,用于根据所述智能设备的属性信息和/或所述操作类型,确定所述语音信息的上传方式;
信息上传单元54,用于基于确定的所述上传方式,将所述语音信息上传至云端服务器。
可选地,如图5a所示,所述上传方式确定单元53包括:
场景类型确定模块531,用于根据所述智能设备的属性信息,确定所述智能设备的属性信息对应的应用场景类型;
第一方式确定模块532,用于根据所述应用场景类型与预设的场景上传方式对照表,确定所述智能设备的应用场景类型对应的语音信息的上传方式。
可选地,所述上传方式确定单元53包括:
操作类型确定模块,用于对所述语音信息进行语音识别,根据所述语音识别的结果确定所述语音信息对应的处理操作的操作类型;
第二方式确定模块,用于根据所述操作类型与预设的类型上传方式对照表,确定所述操作类型对应的上传方式。
可选地,所述上传方式确定单元53还包括:
第三方式确定模块,用于若根据所述应用场景类型与预设的场景上传方式对照表,确定所述智能设备的应用场景类型对应的语音信息的上传方式为随机上传方式,则可根据所述操作类型与预设的类型上传方式对照表,确定所述操作类型对应的上传方式。
可选地,所述信息上传单元54包括:
信息读取模块,用于从所述语音信息中读取指定大小的语音字节信息,存入预先定义的消息队列,所述消息队列用于存放待上传的语音字节信息;
信息上传模块,用于启动子线程,基于确定的所述上传方式,将所述消息队列中的所述语音字节信息上传至云端服务器。
可选地,所述信息上传单元54包括:
第一参数获取模块,用于若确定所述语音信息的上传方式为追加上传,则获取所述追加上传的封装参数;
第一上传模块,用于根据所述追加上传的封装参数,将所述语音信息封装后上传至云端服务器。
可选地,如图5b所示,所述信息上传单元54包括:
标识确定模块541,用于若所述语音信息的上传方式为一次性上传,则确定所述语音信息是否携带结束标识;
信息缓存模块542,用于若所述语音信息未携带结束标识,则将所述语音信息存入临时文件夹中;
第二参数获取模块543,用于若所述语音信息携带结束标识,则将所述语音信息存入所述临时文件夹,并获取一次性上传的封装参数;
第二上传模块544,用于根据所述一次性上传的封装参数,将所述临时文件夹中的语音信息打包封装后上传至云端服务器。
在本申请实施例中,通过获取智能设备的属性信息以及所述智能设备发送的语音信息,对所述语音信息进行语音识别,确定所述语音信息对应的处理操作的操作类型,然后根据所述智能设备的属性信息和/或所述操作类型,确定所述语音信息的上传方式,再基于确定的所述上传方式,将所述语音信息上传至云端服务器,本申请不仅可释放本地服务器的空间资源,提高服务器的执行效率,还可根据灵活确定的上传方式将语音信息从本地的服务器上传至云端服务器,保证语音信息上传的完整性,同时可有效降低服务器的执行压力。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如图1至图4表示的任意一种语音信息处理方法的步骤。
本申请实施例还提供一种智能终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如图1至图4表示的任意一种语音信息处理方法的步骤。
本申请实施例还提供一种计算机程序产品,当该计算机程序产品在服务器上运行时,使得服务器执行实现如图1至图4表示的任意一种语音信息处理方法的步骤。
图6是本申请一实施例提供的智能终端的示意图。如图6所示,该实施例的智能终端6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机可读指令62。所述处理器60执行所述计算机可读指令62时实现上述各个语音信息处理方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,所述处理器60执行所述计算机可读指令62时实现上述各装置实施例中各模块/单元的功能,例如图5所示单元51至54的功能。
示例性的,所述计算机可读指令62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令62在所述智能终端6中的执行过程。
所述智能终端6可以为服务器。所述智能终端6可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是智能终端6的示例,并不构成对智能终端6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述智能终端6还可以包括输入输出设备、网络接入设备、总线等。
所述处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述智能终端6的内部存储单元,例如智能终端6的硬盘或内存。所述存储器61也可以是所述智能终端6的外部存储设备,例如所述智能终端6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述智能终端6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机可读指令以及所述智能终端所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带语音信息处理装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种语音信息处理方法,其特征在于,包括:
获取智能设备的属性信息以及所述智能设备发送的语音信息;
对所述语音信息进行语音识别,确定所述语音信息对应的处理操作的操作类型,所述操作类型包括单次交互类型和多轮交互类型;
根据所述智能设备的属性信息和/或所述操作类型,确定所述语音信息的上传方式,所述上传方式包括追加上传、一次性上传和随机上传;
基于确定的所述上传方式,将所述语音信息上传至云端服务器。
2.根据权利要求1所述的语音信息处理方法,其特征在于,所述根据所述智能设备的属性信息,确定所述语音信息的上传方式的步骤,包括:
根据所述智能设备的属性信息,确定所述智能设备的属性信息对应的应用场景类型;
根据所述应用场景类型与预设的场景上传方式对照表,确定所述智能设备的应用场景类型对应的语音信息的上传方式。
3.根据权利要求1所述的语音信息处理方法,其特征在于,所述根据所述操作类型,确定所述语音信息的上传方式的步骤,包括:
对所述语音信息进行语音识别,根据所述语音识别的结果确定所述语音信息对应的处理操作的操作类型;
根据所述操作类型与预设的类型上传方式对照表,确定所述操作类型对应的上传方式。
4.根据权利要求1所述的语音信息处理方法,其特征在于,所述基于确定的所述上传方式,将所述语音信息上传至云端服务器的步骤,包括:
从所述语音信息中读取指定大小的语音字节信息,存入预先定义的消息队列,所述消息队列用于存放待上传的语音字节信息;
启动子线程,基于确定的所述上传方式,将所述消息队列中的所述语音字节信息上传至云端服务器。
5.根据权利要求1所述的语音信息处理方法,其特征在于,所述基于确定的所述上传方式,将所述语音信息上传至云端服务器的步骤,包括:
若确定所述语音信息的上传方式为追加上传,则获取所述追加上传的封装参数;
根据所述追加上传的封装参数,将所述语音信息封装后上传至云端服务器。
6.根据权利要求1所述的语音信息处理方法,其特征在于,所述基于确定的所述上传方式,将所述语音信息上传至云端服务器的步骤,包括:
若所述语音信息的上传方式为一次性上传,则确定所述语音信息是否携带结束标识;
若所述语音信息未携带结束标识,则将所述语音信息存入临时文件夹中;
若所述语音信息携带结束标识,则将所述语音信息存入所述临时文件夹,并获取一次性上传的封装参数;
根据所述一次性上传的封装参数,将所述临时文件夹中的语音信息打包封装后上传至云端服务器。
7.一种语音信息处理装置,其特征在于,包括:
信息获取单元,用于获取智能设备的属性信息以及所述智能设备发送的语音信息;
信息识别单元,用于对所述语音信息进行语音识别,确定所述语音信息对应的处理操作的操作类型,所述操作类型包括单次交互类型和多轮交互类型;
上传方式确定单元,用于根据所述智能设备的属性信息和/或所述操作类型,确定所述语音信息的上传方式,所述上传方式包括追加上传、一次性上传和随机上传;
信息上传单元,用于基于确定的所述上传方式,将所述语音信息上传至云端服务器。
8.根据权利要求7所述的语音信息处理装置,其特征在于,所述上传方式确定单元包括:
应用场景确定模块,用于根据所述智能设备的属性信息,确定所述智能设备的属性信息对应的应用场景类型;
第一方式确定模块,用于根据所述应用场景类型与预设的场景上传方式对照表,确定所述智能设备的应用场景类型对应的语音信息的上传方式。
9.一种智能终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的语音信息处理方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的语音信息处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911363138.7A CN111210826B (zh) | 2019-12-26 | 2019-12-26 | 语音信息处理方法、装置、存储介质和智能终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911363138.7A CN111210826B (zh) | 2019-12-26 | 2019-12-26 | 语音信息处理方法、装置、存储介质和智能终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111210826A CN111210826A (zh) | 2020-05-29 |
CN111210826B true CN111210826B (zh) | 2022-08-05 |
Family
ID=70786468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911363138.7A Active CN111210826B (zh) | 2019-12-26 | 2019-12-26 | 语音信息处理方法、装置、存储介质和智能终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111210826B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113782021B (zh) * | 2021-09-14 | 2023-10-24 | Vidaa(荷兰)国际控股有限公司 | 一种显示设备及提示音的播放方法 |
CN114157523B (zh) * | 2021-11-24 | 2022-10-11 | 珠海格力电器股份有限公司 | 数据上报方法、装置、智能家居设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012247679A (ja) * | 2011-05-30 | 2012-12-13 | Nippon Telegr & Teleph Corp <Ntt> | テキスト及び音声特徴量収集方法、そのシステム、プログラム |
CN103617797A (zh) * | 2013-12-09 | 2014-03-05 | 腾讯科技(深圳)有限公司 | 一种语音处理方法,及装置 |
JP2017107198A (ja) * | 2015-12-02 | 2017-06-15 | 悠之介 北 | 音声採取方法および音声移植方法 |
CN107342079A (zh) * | 2017-07-05 | 2017-11-10 | 谌勋 | 一种基于互联网的真实人声的采集系统 |
CN108010518A (zh) * | 2017-12-13 | 2018-05-08 | 腾讯科技(深圳)有限公司 | 一种语音交互设备的语音采集方法、系统及存储介质 |
CN108510290A (zh) * | 2018-03-12 | 2018-09-07 | 平安科技(深圳)有限公司 | 通话中客户信息修改方法、装置、计算机设备及存储介质 |
CN109192205A (zh) * | 2018-09-12 | 2019-01-11 | 深圳市酷搏创新科技有限公司 | 一种智能语音交互系统及其控制方法 |
CN109961781A (zh) * | 2017-12-22 | 2019-07-02 | 深圳市优必选科技有限公司 | 基于机器人的语音信息接收方法、系统及终端设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5803056B2 (ja) * | 2009-11-16 | 2015-11-04 | ヤマハ株式会社 | 音響処理システムおよび音響処理方法 |
KR101294553B1 (ko) * | 2011-10-13 | 2013-08-07 | 기아자동차주식회사 | 음원정보 관리 서비스 시스템 |
US10645490B2 (en) * | 2016-07-27 | 2020-05-05 | Sound Devices Llc | Network system for reliable reception of wireless audio |
JP7094486B2 (ja) * | 2017-12-27 | 2022-07-04 | トヨタ自動車株式会社 | 情報提供装置 |
-
2019
- 2019-12-26 CN CN201911363138.7A patent/CN111210826B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012247679A (ja) * | 2011-05-30 | 2012-12-13 | Nippon Telegr & Teleph Corp <Ntt> | テキスト及び音声特徴量収集方法、そのシステム、プログラム |
CN103617797A (zh) * | 2013-12-09 | 2014-03-05 | 腾讯科技(深圳)有限公司 | 一种语音处理方法,及装置 |
JP2017107198A (ja) * | 2015-12-02 | 2017-06-15 | 悠之介 北 | 音声採取方法および音声移植方法 |
CN107342079A (zh) * | 2017-07-05 | 2017-11-10 | 谌勋 | 一种基于互联网的真实人声的采集系统 |
CN108010518A (zh) * | 2017-12-13 | 2018-05-08 | 腾讯科技(深圳)有限公司 | 一种语音交互设备的语音采集方法、系统及存储介质 |
CN109961781A (zh) * | 2017-12-22 | 2019-07-02 | 深圳市优必选科技有限公司 | 基于机器人的语音信息接收方法、系统及终端设备 |
CN108510290A (zh) * | 2018-03-12 | 2018-09-07 | 平安科技(深圳)有限公司 | 通话中客户信息修改方法、装置、计算机设备及存储介质 |
CN109192205A (zh) * | 2018-09-12 | 2019-01-11 | 深圳市酷搏创新科技有限公司 | 一种智能语音交互系统及其控制方法 |
Non-Patent Citations (2)
Title |
---|
Yang Yongxia.FPGA-based High-speed Data Acquisition and Transmission of Voice Logging System.《Electronic Science and Technology 》.2011, * |
施荣荣.基于USB2.0接口语音采集系统的设计与实现.《中国优秀硕士学位论文全文数据库信息科技辑》.2007, * |
Also Published As
Publication number | Publication date |
---|---|
CN111210826A (zh) | 2020-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7112919B2 (ja) | スマート装置のタスク処理方法および装置 | |
CN110457256A (zh) | 数据存储方法、装置、计算机设备及存储介质 | |
CN108763268B (zh) | 一种三维模型的批处理方法与装置、存储介质 | |
CN102957622B (zh) | 一种数据处理的方法、装置及系统 | |
CN111210826B (zh) | 语音信息处理方法、装置、存储介质和智能终端 | |
CN113656503A (zh) | 数据同步方法、装置、系统及计算机可读存储介质 | |
CN111314794A (zh) | 一种流媒体播放地址生成方法 | |
CN111273891A (zh) | 基于规则引擎的业务决策方法、装置及终端设备 | |
CN105354293A (zh) | 一种移动终端上进行播放对象推送的辅助实现方法及装置 | |
CN112182046A (zh) | 一种信息推荐方法、装置、设备及介质 | |
CN109089174A (zh) | 一种多媒体数据流的处理方法及装置、计算机存储介质 | |
CN112182327B (zh) | 一种数据处理方法、装置、设备及介质 | |
CN113923268B (zh) | 一种针对多版本通信规约的解析方法、设备及存储介质 | |
CN111338716A (zh) | 基于规则引擎的数据处理方法、装置及终端设备 | |
CN110708363A (zh) | 一种文件传输方法、系统、电子设备及存储介质 | |
CN110769064A (zh) | 一种用于离线推送消息的系统、方法和设备 | |
CN107329832B (zh) | 一种数据接收方法及装置 | |
CN106648912B (zh) | 数据采集平台中数据处理的模块化方法及装置 | |
CN117041825A (zh) | 多音频输出方法、系统、计算机设备及介质 | |
CN111414339A (zh) | 一种文件的处理方法、系统、装置、设备及介质 | |
CN115454576B (zh) | 一种虚拟机进程管理方法、系统及电子设备 | |
CN111294613A (zh) | 一种视频处理方法、客户端、服务器 | |
CN113206997B (zh) | 一种多业务的录制音频数据的同时质检方法及装置 | |
CN112182047A (zh) | 一种信息推荐方法、装置、设备及介质 | |
CN110806874A (zh) | 一种直播间配置文件的解析方法、存储介质、电子设备及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231204 Address after: Room 601, 6th Floor, Building 13, No. 3 Jinghai Fifth Road, Beijing Economic and Technological Development Zone (Tongzhou), Tongzhou District, Beijing, 100176 Patentee after: Beijing Youbixuan Intelligent Robot Co.,Ltd. Address before: 518000 16th and 22nd Floors, C1 Building, Nanshan Zhiyuan, 1001 Xueyuan Avenue, Nanshan District, Shenzhen City, Guangdong Province Patentee before: Shenzhen UBTECH Technology Co.,Ltd. |
|
TR01 | Transfer of patent right |