[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN117198282A - 语音控制方法、装置、机器人及计算机可读存储介质 - Google Patents

语音控制方法、装置、机器人及计算机可读存储介质 Download PDF

Info

Publication number
CN117198282A
CN117198282A CN202210600545.0A CN202210600545A CN117198282A CN 117198282 A CN117198282 A CN 117198282A CN 202210600545 A CN202210600545 A CN 202210600545A CN 117198282 A CN117198282 A CN 117198282A
Authority
CN
China
Prior art keywords
voice
voice command
instruction
robot
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210600545.0A
Other languages
English (en)
Inventor
张吉延
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN202210600545.0A priority Critical patent/CN117198282A/zh
Publication of CN117198282A publication Critical patent/CN117198282A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Manipulator (AREA)

Abstract

本申请适用于机器人技术领域,提供了一种语音控制方法、装置、机器人及计算机可读存储介质。所述语音控制方法包括:在进入语音识别模式之后,针对用户发出的同一语音指令,获取电子设备识别的第一语音指令和所述机器人识别的第二语音指令;将所述第一语音指令和所述第二语音指令进行互相校验,得到目标语音指令;执行所述目标语音指令。通过本申请可实现对机器人的准确控制。

Description

语音控制方法、装置、机器人及计算机可读存储介质
技术领域
本申请属于机器人技术领域,尤其涉及一种语音控制方法、装置、机器人及计算机可读存储介质。
背景技术
随着机器人技术的发展,出现了各种各样的机器人,例如轮式机器人、履带式机器人、足式机器人等。用户可以通过语音控制这些机器人,但现有的语音控制方法无法实现对机器人的准确控制。
发明内容
本申请实施例提供了一种语音控制方法、装置、机器人及计算机可读存储介质,以实现对机器人的准确控制。
第一方面,本申请实施例提供了一种语音控制方法,应用于机器人,包括:
在进入语音识别模式之后,针对用户发出的同一语音指令,获取电子设备识别的第一语音指令和所述机器人识别的第二语音指令;
将所述第一语音指令和所述第二语音指令进行互相校验,得到目标语音指令;
执行所述目标语音指令。
在本申请实施例中,机器人在进入语音识别模式之后,针对用户发出的同一语音指令,可以获取电子设备识别的第一语音指令和机器人识别的第二语音指令,通过将第一语音指令和第二语音指令进行互相校验,可以解决第一语音指令或者第二语音指令识别不准的问题,提高目标语音指令的识别准确率,通过执行目标语音指令,可以实现对机器人的准确控制。
第二方面,本申请实施例提供了一种语音控制装置,应用于机器人,包括:
指令获取模块,用于在进入语音识别模式之后,针对用户发出的同一语音指令,获取电子设备识别的第一语音指令和所述机器人识别的第二语音指令;
指令校验模块,用于将所述第一语音指令和所述第二语音指令进行互相校验,得到目标语音指令;
目标执行模块,用于执行所述目标语音指令。
第三方面,本申请实施例提供了一种机器人,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的语音控制方法的步骤。
第四方面,本申请实施例提供了一种芯片,包括处理器,所述处理器用于读取并执行存储器中存储的计算机程序,以执行如上述第一方面所述的语音控制方法的步骤。
可选地,所述存储器与所述处理器通过电路或电线连接。
第五方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的语音控制方法的步骤。
第六方面,本申请实施例提供了一种计算机程序产品,当所述计算机程序产品在机器人上运行时,使得所述机器人执行如上述第一方面所述的语音控制方法的步骤。
可以理解地,上述提供的第二方面、第三方面、第四方面、第五方面和第六方面均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可以参考上文所提供的对应的方法中的有益效果,此处不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的语音控制系统的网络架构图;
图2是足式机器人的示例图;
图3是本申请一实施例提供的语音识别方法的实现流程示意图;
图4是本申请另一实施例提供的语音识别方法的实现流程示意图;
图5是机器人的工作流程示例图;
图6是本申请一实施例提供的语音控制装置的结构示意图;
图7是本申请一实施例提供的机器人的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
在说明本申请方案之前,为了便于读者理解,先对本方案中所涉及的名词进行解释说明。
现有的语音控制方法是机器人识别用户发出的语音指令,但如果机器人在运动过程中产生较大的噪音或者距离用户较远时,容易导致机器人无法识别到准确的语音指令,无法实现对机器人的准确控制。
为了较为准确地控制机器人,方案一是机器人停止当前正在执行的动作,直到接收到相应的语音指令,该方案需要机器人停止当前正在执行的动作,应用场景限制较大;方案二是在接收到语音指令时,控制机器人转向语音的声源方向,使得机器人处于容易接收到语音指令的姿态,该方案需要固定机器人的姿态,停止机器人当前正在执行的动作,应用场景限制较大。
在本申请实施例中,机器人在进入语音识别模式之后,针对用户发出的同一语音指令,可以获取电子设备识别的第一语音指令和机器人识别的第二语音指令,通过将第一语音指令和第二语音指令进行互相校验,可以解决第一语音指令或者第二语音指令识别不准的问题,提高目标语音指令的识别准确率,通过执行目标语音指令,可以实现对机器人的准确控制。并且,本申请实施例在机器人识别第二语音指令的过程中无需停止当前正在执行的动作,应用场景限制较小。
应理解,本实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
参见图1,是本申请一实施例提供的语音控制系统的网络架构图。如图1所示,该语音控制系统包括机器人和电子设备。
机器人与电子设备之间建立连接,以实现机器人与电子设备之间的语音指令传输。例如,电子设备可以通过蓝牙通讯与机器人建立连接。
上述机器人可以是任一类型的机器人,本申请对上述机器人的类型不做限定,例如上述机器人为双足、四足、六足等足式机器人。如图2是足式机器人的示例图,通过在足式机器人上安装语音采集装置(例如麦克风阵列),可以进行语音采集和语音识别,得到对应的语音指令。
上述电子设备可以是发出语音指令的用户持有的设备,例如耳机、智能眼镜、手机等。由于上述电子设备距离发出语音指令的用户较近,故通过上述电子设备可以较为准确地识别出用户发出的语音指令,将电子设备识别到的语音指令发送给机器人进行语音控制,能够实现机器人的远程语音控制,延长了语音控制的距离。当然,上述电子设备也可以是与机器人位于同一语音控制场景的设备,例如,语音控制场景为语音控制机器人在餐厅送餐的场景,发出语音指令的用户位于餐厅内,餐厅内设置有电子设备,电子设备能够与机器人建立连接,从而可识别用户发出的语音指令,并向机器人发送其所识别的语音指令。
在上述电子设备为耳机或者智能眼镜等设备时,由于耳机或者智能眼镜的数据处理性能有限,可以先与手机进行连接,通过手机进行语音识别,并将得到的语音指令反馈给耳机或者智能设备。
在机器人进入语音识别模式之后,如果用户发出语音指令,则电子设备和机器人均可以获取该语音指令,为了区分电子设备识别的语音指令和机器人识别的语音指令,将电子设备识别的语音指令称之为第一语音指令,将机器人识别的语音指令称之为第二语音指令,电子设备向机器人发送第一语音指令,机器人在接收到来自电子设备的第一语音指令之后,将第一语音指令和自身识别的第二语音指令进行互相校验,可以解决第一语音指令或者第二语音指令识别不准的问题,提高目标语音指令的识别准确率,通过执行目标语音指令,可以实现对机器人的准确控制。
参见图3,是本申请一实施例提供的语音识别方法的实现流程示意图,该语音识别方法应用于机器人。如图3所示,该语音识别方法可以包括以下步骤:
步骤301,在进入语音识别模式之后,针对用户发出的同一语音指令,获取电子设备识别的第一语音指令和机器人识别的第二语音指令。
机器人在进入语音识别模式之后,仍可以按照之前的指令进行动作,即继续执行当前正在执行的动作,并一直等待语音指令,在用户发出语音指令时,电子设备和机器人均对该语音指令进行识别,电子设备识别得到第一语音指令时向机器人发送第一语音指令,机器人识别得到第二语音指令。
例如,用户发出的语音指令为“前进”,电子设备和机器人均对该语音指令对应的语音信号进行采集,电子设备对采集到的语音信号进行识别得到的第一语音指令为“前进”,机器人对采集到的语音识别进行识别得到的第二语音指令为“进”。
步骤302,将第一语音指令和第二语音指令进行互相校验,得到目标语音指令。
通过将第一语音指令和第二语音指令进行互相校验,可以基于第一语音指令和第二语音指令共同判断用户发出的语音指令,解决第一语音指令或者第二语音指令识别不准的问题,提高目标语音指令的识别准确率。
例如,第一语音指令为“前进”,第二语音指令为“进”,通过将第一语音指令和第二语音指令进行互相校验,得到目标语音指令为“前进”。
在一可选实施例中,在将第一语音指令和第二语音指令进行互相校验之前,还包括:
将第一语音指令与N个预设指令进行匹配,N为大于零的整数;
和/或将第一语音指令与N个预设指令进行匹配;
将第一语音指令和第二语音指令进行互相校验,包括:
若第一语音指令与任一预设指令相匹配,和/或第二语音指令与任一预设指令相匹配,则将第一语音指令和第二语音指令进行互相校验。
其中,N个预设指令为有效指令,可以预先存储在机器人中。有效指令是指能够控制机器人的指令。例如,机器人中预先存储有“前进”、“后退”等两个有效指令,如果第一语音指令为“买菜”,那么确定第一语音指令与上述两个有效指令均不匹配,可以提示用户未识别到有效指令。
通过将第一语音指令与N个预设指令进行匹配,可以对第一语音指令进行初步筛选,筛选掉无效指令(即无法控制机器人的指令),保留有效指令,以与第二语音指令进行互相校验。
通过将第二语音指令与N个预设指令进行匹配,可以对第二语语音指令进行初步筛选,筛选掉无效指令(即无法控制机器人的指令),保留有效指令,以与第一语音指令进行互相校验。
第一语音指令与预设指令相匹配可以是指第一语音指令与预设指令的匹配度大于匹配度阈值。如果第一语音指令与预设指令的匹配度小于或者等于匹配度阈值,则确定第一语音指令与预设指令不匹配。
第二语音指令与预设指令相匹配可以是指第二语音指令与预设指令的匹配度大于匹配度阈值。如果第二语音指令与预设指令的匹配度小于或者等于匹配度阈值,则确定第二语音指令与预设指令不匹配。
上述可选实施例可以包括如下三种方案:
方案一:将第一语音指令与N个预设指令进行匹配;若第一语音指令与任一预设指令相匹配,则将第一语音指令和第二语音指令进行互相校验。
方案二:将第二语音指令与N个预设指令进行匹配;若第二语音指令与任一预设指令相匹配,则将第一语音指令和第二语音指令进行互相校验。
方案三:将第一语音指令与N个预设指令进行匹配,将第二语音指令与N个预设指令进行匹配;若第一语音指令与任一预设指令相匹配,且第二语音指令与任一预设指令相匹配,则将第一语音指令和第二语音指令进行互相校验。
通过上述三种方案均可以实现语音指令的初步筛选,筛选掉无效指令。
步骤303,执行目标语音指令。
其中,执行目标语音指令可以是指机器人执行目标语音指令对应的动作。例如,机器人当前正在执行的动作为“后退”,若目标语音指令为“前进”,则机器人停止“后退”,进行“前进”。
机器人在执行目标语音指令对应的动作时,还可以同时等待下一条语音指令,以继续对机器人进行语音控制。
为了进一步筛选掉无效指令,在得到目标语音指令,还可以将目标语音指令与N个预设指令进行匹配,以判断目标语音指令是否为有效指令,在目标语音指令为有效指令时执行步骤303,在目标语音指令不为有效指令(即目标语音指令为无效指令)时可以提示用户未识别到有效指令。
在本申请实施例中,机器人在进入语音识别模式之后,针对用户发出的同一语音指令,可以获取电子设备识别的第一语音指令和机器人识别的第二语音指令,通过将第一语音指令和第二语音指令进行互相校验,可以解决第一语音指令或者第二语音指令识别不准的问题,提高目标语音指令的识别准确率,通过执行目标语音指令,可以实现对机器人的准确控制。
参见图4,是本申请另一实施例提供的语音识别方法的实现流程示意图,该语音识别方法应用于机器人。如图4所示,该语音识别方法可以包括以下步骤:
步骤401,在进入语音识别模式之后,针对用户发出的同一语音指令,获取电子设备识别的第一语音指令和机器人识别的第二语音指令。
该步骤与步骤301相同,具体可参见步骤301的相关描述,在此不再赘述。
在一可选实施例中,进入语音识别模式,包括:
在接收到语音功能唤醒词之后,进入语音识别模式,并发出指示信号,指示信号指示进入语音识别模式。
用户可以向电子设备发送对机器人的语音功能唤醒词,电子设备在接收对机器人的语音功能唤醒词之后,向机器人发送语音功能唤醒词。其中,语音功能唤醒词可以是指唤醒机器人的语音控制功能的关键词。当然,用户也可以直接向机器人发送语音功能唤醒词。语音控制功能可以是指通过语音指令控制机器人的功能。
其中,用户可以通过语音、文字输入、点击功能按钮等方式发送语音功能唤醒词,在此不做限定。
上述指示信号可以是机器人上的指示灯发出的光信号,或者机器人发出的语音提示等,在此不做限定。
在一可选实施例中,在进入语音识别模式之后,若在预设时间内未获取到第一语音指令和/或第二语音指令,则退出语音识别模式。
其中,预设时间是预先设置的,用户可以根据实际需求进行修改。
通过设置预设时间可以避免机器人长时间等待语音指令,降低机器人功耗。
如果机器人退出语音识别模式,则不再识别语音指令,同时还可以向电子设备发送目标信息,以指示电子设备不再识别语音指令,机器人和电子设备再次接收到语音功能唤醒词之后才能再次进行语音指令识别。
在一可选实施例中,在进入语音识别模式之后,若获取到第一语音指令且未获取到第二语音指令,则执行第一语音指令;
或者,在进入语音识别模式之后,若获取到第二语音指令且未获取到第一语音指令,则执行第二语音指令。
如果电子设备和机器人中只有一个设备识别到语音指令,则可以直接执行识别到的语音指令,以实现对机器人的语音控制。
为了进一步筛选掉无效指令,在只获取到第一语音指令或者第二语音指令时,还可以将获取到的语音指令与N个预设指令进行匹配,以判断获取到的语音指令是否为有效指令,在获取到的语音指令为有效指令时执行该语音指令,在获取到的语音指令不为有效指令时可以提示用户未识别到有效指令。
例如,在发出语音指令的用户距离机器人较远时,机器人可能无法识别到用户发出的语音指令,此时可以执行电子设备识别到的第一语音指令,从而实现对机器人的远距离控制,延长了机器人的控制距离。
在电子设备与机器人之间的连接不稳定,或者电子设备无法识别到用户发出的语音指令时,机器人无法获取到电子设备识别的第一语音指令,可以通过执行自身识别到的第二语音指令,实现对机器人的语音控制。
步骤402,获取第一语音指令的权重和第二语音指令的权重。
第一语音指令的权重可以是指第一语音指令相对于机器人语音控制的重要程度。第二语音指令的权重可以是指第二语音指令相对于机器人语音控制的重要程度。
在一可选实施例中,获取第一语音指令的权重和第二语音指令的权重,包括:
若机器人处于静止模式,则确定第一语音指令的权重为第一权重,第二语音指令的权重为第二权重,且第一权重小于或者等于第二权重;
或者,若机器人处于运动模式,则确定第一语音指令的权重为第三权重,第二语音指令的权重为第四权重,且第三权重大于第四权重。
可以通过获取机器人的运动速度,判断机器人所处模式,如果运动速度小于或者等于速度阈值则确定机器人处于静止模式;如果运动速度大于速度阈值则确定机器人处于运动模式。其中,可以根据机器人在运动过程中产生的噪音设置速度阈值,从而实现速度阈值的自适应调整。例如,将机器人在运动过程中产生的噪音低于噪音阈值时的运动速度作为速度阈值。
如果机器人处于静止模式,则说明机器人未产生噪音或者产生的噪音较小,由于机器人的存储空间通常大于电子设备的存储空间,故相比于电子设备上集成的语音识别算法,机器人上可以集成识别准确率更高的语音识别算法,在此情况下,相比于电子设备,机器人可能更能够较为准确地识别用户发出的语音指令,故可以将第一权重设置为小于或者等于第二权重。例如第一权重为0.4,第二权重为0.6,或者第一权重和第二权重均为0.5。其中,上述语音识别算法可以是指识别语音指令的算法。
如果机器人处于运动模式,则说明机器人产生的噪音较大,容易对机器人的语音识别产生干扰,在此情况下机器人识别到的第二语音指令的准确率较低,故可以将第三权重设置为大于第四权重,主要依据电子设备识别的第一语音指令控制机器人。例如,第三权重为0.6,第四权重为0.4。
步骤403,基于第一语音指令的权重和第二语音指令的权重,将第一语音指令和所述第二语音指令进行互相校验,得到目标语音指令。
如果第一语音指令和第二语音指令相同,则可以直接将第一语音指令或者第二语音指令作为目标语音指令;如果第一语音指令和第二语音指令不相同,则可以执行步骤403。
基于权重将第一语音指令和第二语音指令进行互相校验可以是指:将第一语音指令中的字符与第二语音指令中的字符进行比较;可以将在第一语音指令和第二语音指令中均包含的字符作为目标语音指令中的字符;对于只在一个语音指令中包含的字符,由于语音指令的权重越大,说明该语音指令相对于机器人语音控制越重要,故如果包含该字符的语音指令的权重大于未包含该字符的语音指令的权重,则可以将该字符作为目标语音指令中的字符,如果包含该字符的语音指令的权重小于未包含该字符的语音指令的权重,则不将该字符作为目标语音指令中的字符,如果包含该字符的语音指令的权重等于未包含该字符的语音指令的权重,则可以将该字符作为目标语音指令中的字符,也可以不作为目标语音指令中的字符。
例如,用户发出的语音指令为“前进”,在机器人处于运动模式时,第一语音指令的权重大于第二语音指令的权重,第一语音指令为“前进”,第二语音指令为“进”,可以得到目标语音指令为“前进”。
步骤404,执行目标语音指令。
该步骤与步骤303相同,具体可参见步骤303的相关描述,在此不再赘述。
本实施例在上一实施例的基础上,通过获取第一语音指令的权重和第二语音指令的权重,可以基于上述权重对第一语音指令和第二语音指令进行互相校验,从而较为准确地选择出目标语音指令,实现对机器人的准确控制。
如图5所示是机器人的工作流程示例图。机器人接收到语音功能唤醒词之后,进入语音识别模式;在语音识别模式下,等待语音指令;判断在2min内是否接收到语音指令(该语音指令包括第一语音指令和第二语音指令);若未接收到则退出语音识别模式;若接收到语音指令则将第一语音指令与第二语音指令进行互相校验,得到目标语音指令,并判断目标语音指令是否为有效指令;若目标语音指令不为有效指令则继续执行当前正在执行的动作,并等待语音功能唤醒词;若目标语音指令为有效指令则执行目标语音指令对应的动作,并继续等待下一条语音指令,判断5min内是否接收到语音指令;若未接收到则退出语音识别模式;若接收到语音指令则返回执行将第一语音指令与第二语音指令进行互相校验的步骤和后续步骤。
参见图6,是本申请一实施例提供的语音控制装置的结构示意图,为了便于说明,仅示出了与本申请实施例相关的部分。
上述语音控制装置包括:
指令获取模块61,用于在进入语音识别模式之后,针对用户发出的同一语音指令,获取电子设备识别的第一语音指令和所述机器人识别的第二语音指令;
指令校验模块62,用于将所述第一语音指令和所述第二语音指令进行互相校验,得到目标语音指令;
目标执行模块63,用于执行所述目标语音指令。
可选地,上述语音控制装置还包括:
权重获取模块,用于获取所述第一语音指令的权重和所述第二语音指令的权重;
上述指令校验模块62具体用于:
基于所述第一语音指令的权重和所述第二语音指令的权重,将所述第一语音指令和所述第二语音指令进行互相校验。
可选地,上述权重获取模块具体用于:
若所述机器人处于静止模式,则确定所述第一语音指令的权重为第一权重,所述第二语音指令的权重为第二权重,且所述第一权重小于或者等于所述第二权重;
或者,若所述机器人处于运动模式,则确定所述第一语音指令的权重为第三权重,所述第二语音指令的权重为第四权重,且所述第三权重大于所述第四权重。
可选地,上述语音控制装置还包括:
指令匹配模块,用于将所述第一语音指令与N个预设指令进行匹配,N为大于零的整数;和/或将所述第二语音指令与所述N个预设指令进行匹配;
上述指令校验模块62具体用于:
若所述第一语音指令与任一所述预设指令相匹配,和/或所述第二语音指令与任一所述预设指令相匹配,则将所述第一语音指令和所述第二语音指令进行互相校验。
可选地,上述语音控制装置还包括:
模式进入模块,用于在接收到语音功能唤醒词之后,进入所述语音识别模式,并发出指示信号,所述指示信号指示进入所述语音识别模式。
可选地,上述语音控制装置还包括:
模式退出模块,用于在进入所述语音识别模式之后,若在预设时间内未获取到所述第一语音指令和/或所述第二语音指令,则退出所述语音识别模式。
可选地,上述语音控制装置还包括:
第一执行模块,用于在进入所述语音识别模式之后,若获取到所述第一语音指令且未获取到所述第二语音指令,则执行所述第一语音指令;
或者,第二执行模块,用于在进入所述语音识别模式之后,若获取到所述第二语音指令且未获取到所述第一语音指令,则执行所述第二语音指令。
本申请实施例提供的语音控制装置可以应用在前述方法实施例中,详情参见上述方法实施例的描述,在此不再赘述。
图7是本申请一实施例提供的机器人的结构示意图。如图7所示,该实施例的机器人7包括:一个或多个处理器70(图中仅示出一个)、存储器71以及存储在所述存储器71中并可在所述至少一个处理器70上运行的计算机程序72。所述处理器70执行所述计算机程序72时实现上述各个语音控制方法实施例中的步骤。
所述机器人7可包括,但不仅限于,处理器70、存储器71。本领域技术人员可以理解,图7仅仅是机器人7的示例,并不构成对机器人7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述机器人还可以包括输入输出设备、网络接入设备、总线等。
所称处理器70可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器71可以是所述机器人7的内部存储单元,例如机器人7的硬盘或内存。所述存储器71也可以是所述机器人7的外部存储设备,例如所述机器人7上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器71还可以既包括所述机器人7的内部存储单元也包括外部存储设备。所述存储器71用于存储所述计算机程序以及所述机器人所需的其他程序和数据。所述存储器71还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例还提供了一种计算机程序产品,当计算机程序产品在机器人上运行时,使得机器人执行时实现可实现上述各个方法实施例中的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/机器人和方法,可以通过其它的方式实现。例如,以上所描述的装置/机器人实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种语音控制方法,其特征在于,应用于机器人,包括:
在进入语音识别模式之后,针对用户发出的同一语音指令,获取电子设备识别的第一语音指令和所述机器人识别的第二语音指令;
将所述第一语音指令和所述第二语音指令进行互相校验,得到目标语音指令;
执行所述目标语音指令。
2.根据权利要求1所述的语音控制方法,其特征在于,在将所述第一语音指令和所述第二语音指令进行互相校验之前,还包括:
获取所述第一语音指令的权重和所述第二语音指令的权重;
所述将所述第一语音指令和所述第二语音指令进行互相校验,包括:
基于所述第一语音指令的权重和所述第二语音指令的权重,将所述第一语音指令和所述第二语音指令进行互相校验。
3.根据权利要求2所述的语音控制方法,其特征在于,所述获取所述第一语音指令的权重和所述第二语音指令的权重,包括:
若所述机器人处于静止模式,则确定所述第一语音指令的权重为第一权重,所述第二语音指令的权重为第二权重,且所述第一权重小于或者等于所述第二权重;
或者,若所述机器人处于运动模式,则确定所述第一语音指令的权重为第三权重,所述第二语音指令的权重为第四权重,且所述第三权重大于所述第四权重。
4.根据权利要求1至3任一项所述的语音控制方法,其特征在于,在将所述第一语音指令和所述第二语音指令进行互相校验之前,还包括:
将所述第一语音指令与N个预设指令进行匹配,N为大于零的整数;
和/或将所述第二语音指令与所述N个预设指令进行匹配;
所述将所述第一语音指令和所述第二语音指令进行互相校验,包括:
若所述第一语音指令与任一所述预设指令相匹配,和/或所述第二语音指令与任一所述预设指令相匹配,则将所述第一语音指令和所述第二语音指令进行互相校验。
5.根据权利要求1至3任一项所述的语音控制方法,其特征在于,进入语音识别模式,包括:
在接收到语音功能唤醒词之后,进入所述语音识别模式,并发出指示信号,所述指示信号指示进入所述语音识别模式。
6.根据权利要求1至3任一项所述的语音控制方法,其特征在于,还包括:
在进入所述语音识别模式之后,若在预设时间内未获取到所述第一语音指令和/或所述第二语音指令,则退出所述语音识别模式。
7.根据权利要求1至3任一项所述的语音控制方法,其特征在于,还包括:
在进入所述语音识别模式之后,若获取到所述第一语音指令且未获取到所述第二语音指令,则执行所述第一语音指令;
或者,在进入所述语音识别模式之后,若获取到所述第二语音指令且未获取到所述第一语音指令,则执行所述第二语音指令。
8.一种语音控制装置,其特征在于,应用于机器人,包括:
指令获取模块,用于在进入语音识别模式之后,针对用户发出的同一语音指令,获取电子设备识别的第一语音指令和所述机器人识别的第二语音指令;
指令校验模块,用于将所述第一语音指令和所述第二语音指令进行互相校验,得到目标语音指令;
目标执行模块,用于执行所述目标语音指令。
9.一种机器人,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的语音控制方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的语音控制方法的步骤。
CN202210600545.0A 2022-05-30 2022-05-30 语音控制方法、装置、机器人及计算机可读存储介质 Pending CN117198282A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210600545.0A CN117198282A (zh) 2022-05-30 2022-05-30 语音控制方法、装置、机器人及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210600545.0A CN117198282A (zh) 2022-05-30 2022-05-30 语音控制方法、装置、机器人及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN117198282A true CN117198282A (zh) 2023-12-08

Family

ID=88996596

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210600545.0A Pending CN117198282A (zh) 2022-05-30 2022-05-30 语音控制方法、装置、机器人及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN117198282A (zh)

Similar Documents

Publication Publication Date Title
CN105190746B (zh) 用于检测目标关键词的方法和设备
US10706852B2 (en) Confidence features for automated speech recognition arbitration
CN111599371B (zh) 语音增加方法、系统、装置及存储介质
CN105210146A (zh) 用于控制语音激活的方法和设备
CN111077496B (zh) 一种基于麦克风阵列的语音处理方法、装置及终端设备
CN109841214A (zh) 语音唤醒处理方法、装置和存储介质
CN112996020B (zh) 一种基于蓝牙的自动化测试方法、装置及蓝牙测试终端
CN111261151A (zh) 一种语音处理方法、装置、电子设备及存储介质
CN111737987A (zh) 意图识别方法、装置、设备及存储介质
CN109346074A (zh) 一种语音处理方法及系统
CN109961781B (zh) 基于机器人的语音信息接收方法、系统及终端设备
CN111060874A (zh) 一种声源定位方法、装置、存储介质及终端设备
CN109389978B (zh) 一种语音识别方法及装置
US10950221B2 (en) Keyword confirmation method and apparatus
CN110019377B (zh) 动态脱敏方法、装置、设备及介质
CN110060658A (zh) 一种车辆启动引导装置
CN113823282B (zh) 语音处理方法、系统和装置
EP1513135A1 (en) Speech recognizing method and device thereof
CN117198282A (zh) 语音控制方法、装置、机器人及计算机可读存储介质
CN112863496B (zh) 一种语音端点检测方法以及装置
CN111739515B (zh) 语音识别方法、设备、电子设备和服务器、相关系统
CN115798520A (zh) 语音检测的方法和装置、电子设备和存储介质
CN113747407B (zh) 适用于遮挡环境的蓝牙定位系统、方法、介质及设备
CN112822666B (zh) 一种通信方法、装置、电子设备及存储介质
CN109358755B (zh) 用于移动终端的手势检测方法、装置和移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination