[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN105702253A - 一种语音唤醒方法及装置 - Google Patents

一种语音唤醒方法及装置 Download PDF

Info

Publication number
CN105702253A
CN105702253A CN201610009102.9A CN201610009102A CN105702253A CN 105702253 A CN105702253 A CN 105702253A CN 201610009102 A CN201610009102 A CN 201610009102A CN 105702253 A CN105702253 A CN 105702253A
Authority
CN
China
Prior art keywords
speech data
terminal unit
confidence level
voice
confidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610009102.9A
Other languages
English (en)
Inventor
朱辉
田伟
李鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yunzhisheng Information Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201610009102.9A priority Critical patent/CN105702253A/zh
Publication of CN105702253A publication Critical patent/CN105702253A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种语音唤醒方法及装置,用于提高利用语音唤醒终端设备的准确度。所述方法包括:当终端设备接收到用户输入的包含预设唤醒词的第一语音数据时,对所述第一语音数据和预设语言模型进行匹配,获得所述第一语音数据的置信度;判断所述置信度是否小于预设置信度阈值;当所述置信度小于所述预设置信度阈值时,执行预设操作;当所述置信度大于或等于所述预设置信度阈值时,唤醒所述终端设备的语音控制功能。该技术方案使得用户利用语音唤醒终端设备失败时,终端设备能够通过执行预设操作来提高第一语音数据的置信度,从而提高用户利用语音唤醒终端设备的准确度以及用户的体验度。

Description

一种语音唤醒方法及装置
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音唤醒方法及装置。
背景技术
语音识别技术在近些年取得了显著的进步,该技术已进入工业、家电、智能家居等各个领域。语音唤醒即是语音识别技术的一种形式,其不直接接触硬件设备,通过语音即可将设备唤醒运行。一般情况下,大部分设备都是靠物理按键实现设备的唤醒或者运行。然而,这对于用户体验来说并不好。语音作为人们最自然的交流方式,通过语音唤醒这种非接触式的方式启动设备无疑是更友好的。
发明内容
本发明实施例提供一种语音唤醒方法及装置,用于提高利用语音唤醒终端设备的准确度。
一种语音唤醒方法,包括以下步骤:
当终端设备接收到用户输入的包含预设唤醒词的第一语音数据时,对所述第一语音数据和预设语言模型进行匹配,获得所述第一语音数据的置信度;
判断所述置信度是否小于预设置信度阈值;
当所述置信度小于所述预设置信度阈值时,执行预设操作;
当所述置信度大于或等于所述预设置信度阈值时,唤醒所述终端设备的语音控制功能。
本发明实施例的一些有益效果可以包括:
上述技术方案,通过确定包含预设唤醒词的第一语音数据的置信度,并在该置信度小于预设置信度阈值时执行预设操作,同时在该置信度大于或等于预设置信度阈值时唤醒终端设备的语音控制功能,使得用户利用语音唤醒终端设备失败时,终端设备能够通过执行预设操作来提高第一语音数据的置信度,从而提高用户利用语音唤醒终端设备的准确度以及用户的体验度。
在一个实施例中,所述执行预设操作之后,所述方法还包括:
输出第一提示信息,所述第一提示信息用于提示所述用户再次输入所述第一语音数据,直至接收到的所述第一语音数据的置信度大于或等于所述预设置信度阈值。
该实施例中,能够在执行预设操作之后提示用户再次输入语音数据,使得用户重新输入的语音数据的置信度能够达到预设置信度阈值,从而提高用户利用语音唤醒终端设备的准确度以及用户的体验度。
在一个实施例中,所述执行预设操作,包括:
判断所述终端设备当前是否正输出第二语音数据;
当所述终端设备当前正输出所述第二语音数据时,调低所述第二语音数据的音量值。
该实施例中,能够在终端设备当前正输出语音数据时调低该语音数据的音量值,从而使得用户输入的语音数据的置信度能够达到预设置信度阈值,提高用户利用语音唤醒终端设备的准确度以及用户的体验度。
在一个实施例中,所述执行预设操作,包括:
输出第二提示信息,所述第二提示信息用于提示所述用户提高所述第一语音数据的音量值。
该实施例中,通过提示用户提高输入语音数据的音量值,使得用户输入的语音数据的置信度能够达到预设置信度阈值,提高了用户利用语音唤醒终端设备的准确度以及用户的体验度。
在一个实施例中,所述执行预设操作,包括:
降低所述预设置信度阈值。
该实施例中,通过降低预设置信度阈值,使得用户输入的语音数据的置信度更容易达到预设置信度阈值,提高了用户利用语音唤醒终端设备的准确度以及用户的体验度。
一种语音唤醒装置,包括:
匹配模块,用于当终端设备接收到用户输入的包含预设唤醒词的第一语音数据时,对所述第一语音数据和预设语言模型进行匹配,获得所述第一语音数据的置信度;
判断模块,用于判断所述置信度是否小于预设置信度阈值;
执行模块,用于当所述置信度小于所述预设置信度阈值时,执行预设操作;
唤醒模块,用于当所述置信度大于或等于所述预设置信度阈值时,唤醒所述终端设备的语音控制功能。
在一个实施例中,所述装置还包括:
输出模块,用于所述执行预设操作之后,输出第一提示信息,所述第一提示信息用于提示所述用户再次输入所述第一语音数据,直至接收到的所述第一语音数据的置信度大于或等于所述预设置信度阈值。
在一个实施例中,所述执行模块包括:
判断子模块,用于判断所述终端设备当前是否正输出第二语音数据;
调低子模块,用于当所述终端设备当前正输出所述第二语音数据时,调低所述第二语音数据的音量值。
在一个实施例中,所述执行模块包括:
输出子模块,用于输出第二提示信息,所述第二提示信息用于提示所述用户提高所述第一语音数据的音量值。
在一个实施例中,所述执行模块包括:
降低子模块,用于降低所述预设置信度阈值。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种语音唤醒方法的流程图;
图2为本发明实施例中一种语音唤醒方法中步骤S13的流程图;
图3为本发明实施例中一种语音唤醒装置的框图;
图4为本发明实施例中一种语音唤醒装置的框图;
图5为本发明实施例中一种语音唤醒装置中执行模块的框图;
图6为本发明实施例中一种语音唤醒装置中执行模块的框图;
图7为本发明实施例中一种语音唤醒装置中执行模块的框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为本发明实施例中一种语音唤醒方法的流程图。该语音唤醒方法应用于终端设备中,该终端设备可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等任一具有语音控制功能的设备。如图1所示,该方法包括以下步骤S11-S14:
步骤S11,当终端设备接收到用户输入的包含预设唤醒词的第一语音数据时,对第一语音数据和预设语言模型进行匹配,获得第一语音数据的置信度。
其中,预设唤醒词为与终端设备的语音控制功能相关的词语,由用户预先设定。例如,如果终端设备的语音控制功能包括控制智能家居时,预设唤醒词可包括空调、电视、窗帘等与智能家居有关的词;再例如,如果终端设备的语音控制功能包括连接至云端服务器、并通过云端服务器搜索网络信息时,预设唤醒词可包括搜索、查询、天气、火车票等与网络服务相关的词。
在执行该步骤时,终端设备会首先对用户输入的语音数据进行识别,识别该语音数据中是否包含预设唤醒词,如果该语音数据中包含预设唤醒词,则继续执行步骤S11-S14,如果该语音数据中不包含预设唤醒词,说明用户没有唤醒终端设备的语音控制功能的意愿,此时终端设备不对用户输入的语音数据作任何反馈。
预设语言模型可以是通用语言模型。
步骤S12,判断置信度是否小于预设置信度阈值。
步骤S13,当置信度小于预设置信度阈值时,执行预设操作。
步骤S14,当置信度大于或等于预设置信度阈值时,唤醒终端设备的语音控制功能。
本发明实施例的一些有益效果可以包括:
上述技术方案,通过确定包含预设唤醒词的第一语音数据的置信度,并在该置信度小于预设置信度阈值时执行预设操作,同时在该置信度大于或等于预设置信度阈值时唤醒终端设备的语音控制功能,使得用户利用语音唤醒终端设备失败时,终端设备能够通过执行预设操作来提高第一语音数据的置信度,从而提高用户利用语音唤醒终端设备的准确度以及用户的体验度。
在一个实施例中,第一语音数据的置信度可通过第一语音数据的以下特征的至少一种来确定:
(1)语速;即单位字的时长。
(2)N-best特征。
(3)位置;即每个词在句子中所处的位置,包括句首、句中和句末。
(4)词长;即每个词包括的字符个数。
(5)时长;即每个词所持续的帧数。
(6)竞争词个数:混淆网络上两个相邻结点间的弧个数,即一段时间内有几个词在竞争。
(7)词的ngram语言模型得分。
(8)竞争词后验概率的差;即混淆网络上两个相邻结点间的两个后验概率最大的竞争词的后验概率的差。
(9)句长。
针对第一语音数据的以上特征,可通过基于预测特征分类的方法或者基于后验概率的方法来确定第一语音数据的置信度,由于该两种方法均为现有技术,因此不再赘述。
上述实施例中,置信度的取值位于0~1的范围之间,由于置信度是用来评估语音识别结果的可靠性的,因此置信度越高,说明语音识别结果越准确。预设置信度阈值的取值位于0~1的范围之间。
在一个实施例中,步骤S13之后,上述方法还包括以下步骤:
输出第一提示信息,该第一提示信息用于提示用户再次输入第一语音数据,直至接收到的第一语音数据的置信度大于或等于预设置信度阈值。
终端设备可通过语音输出的方式输出第一提示信息,例如语音输出“请再次输入语音内容”。用户再次输入第一语音数据时,终端设备根据执行预设操作之后的结果,再次对第一语音数据的置信度进行确定,直至第一语音数据的置信度大于或等于预设置信度阈值。
该实施例中,能够在执行预设操作之后提示用户再次输入语音数据,使得用户重新输入的语音数据的置信度能够达到预设置信度阈值,从而提高用户利用语音唤醒终端设备的成功率。
上述步骤S13中,终端设备可根据不同情况执行不同的预设操作。以下通过几个实施例来说明终端设备所执行的具体操作。
在一个实施例中,如图2所示,步骤S13包括以下步骤S21-S23:
步骤S21,判断终端设备当前是否正输出第二语音数据;如果终端设备当前正输出第二语音数据,则执行步骤S22;如果终端设备当前未输出第二语音数据,则执行步骤S23。
步骤S22,调低第二语音数据的音量值。
其中,音量值可通过分贝值来表征。终端设备可确定第一语音数据和第二语音数据中声音的分贝值。
对音量值的降低幅度可按照预设幅度来调低,例如,预设幅度为25分贝,终端设备正在播放音乐,且已确定该音乐的分贝值为60分贝,则按照预设幅度将音乐的分贝值降低25分贝,降低后的音乐的分贝值为35分贝。对音量值的降低幅度可按照第二语音数据的声音分贝值和第一语音数据的声音分贝值之间的差值来调低,例如,终端设备正在播放音乐,且已确定该音乐(即第二语音数据)的分贝值为60分贝,而用户输入的第一语音数据的声音分贝值为40分贝,则可将音乐的分贝值降低至40分贝以下,以使第一语音数据的声音分贝值高于音乐的分贝值,从而增加对第一语音数据的识别的准确率,提高第一语音数据的置信度。
步骤S23,输出提示信息;该提示信息用于提示用户提高第一语音数据的音量值。
终端设备可通过语音输出的方式输出该提示信息,例如,终端设备语音输出“您的声音过小,请大声说话”。
该实施例中,能够在终端设备当前正输出语音数据时调低该语音数据的音量值,并在终端设备当前未输出第二语音数据时提示用户降低音量,从而使得用户输入的语音数据的置信度能够达到预设置信度阈值,提高了用户利用语音唤醒终端设备的准确度以及用户的体验度。
在一个实施例中,执行步骤S13时,无论终端设备当前是否正输出语音数据,都可直接输出提示信息,以提示用户提高第一语音数据的音量值。
在一个实施例中,步骤S13还可实施为以下步骤:降低预设置信度阈值。
该实施例中,通过降低预设置信度阈值,使得用户输入的语音数据的置信度更容易达到预设置信度阈值,尤其是在终端设备当前正输出第二语音数据的情况下,第二语音数据使得用户输入的第一语音数据受到干扰,不容易被识别成功,因此降低预设置信度阈值可使得终端设备对第一语音数据识别的成功率增大,从而提高了用户利用语音唤醒终端设备的准确度以及用户的体验度。
图3为本发明实施例中一种语音唤醒装置的框图。如图3所示,该装置包括:
匹配模块31,用于当终端设备接收到用户输入的包含预设唤醒词的第一语音数据时,对第一语音数据和预设语言模型进行匹配,获得第一语音数据的置信度;
判断模块32,用于判断置信度是否小于预设置信度阈值;
执行模块33,用于当置信度小于预设置信度阈值时,执行预设操作;
唤醒模块34,用于当置信度大于或等于预设置信度阈值时,唤醒终端设备的语音控制功能。
在一个实施例中,如图4所示,上述装置还包括:
输出模块35,用于执行预设操作之后,输出第一提示信息,第一提示信息用于提示用户再次输入第一语音数据,直至接收到的第一语音数据的置信度大于或等于预设置信度阈值。
在一个实施例中,如图5所示,执行模块33包括:
判断子模块331,用于判断终端设备当前是否正输出第二语音数据;
调低子模块332,用于当终端设备当前正输出第二语音数据时,调低第二语音数据的音量值。
在一个实施例中,如图6所示,执行模块33包括:
输出子模块333,用于输出第二提示信息,第二提示信息用于提示用户提高第一语音数据的音量值。
在一个实施例中,如图7所示,执行模块33包括:
降低子模块334,用于降低预设置信度阈值。
本发明实施例的一些有益效果可以包括:
上述装置,通过确定包含预设唤醒词的第一语音数据的置信度,并在该置信度小于预设置信度阈值时执行预设操作,同时在该置信度大于或等于预设置信度阈值时唤醒终端设备的语音控制功能,使得用户利用语音唤醒终端设备失败时,终端设备能够通过执行预设操作来提高第一语音数据的置信度,从而提高用户利用语音唤醒终端设备的准确度以及用户的体验度。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种语音唤醒方法,其特征在于,包括:
当终端设备接收到用户输入的包含预设唤醒词的第一语音数据时,对所述第一语音数据和预设语言模型进行匹配,获得所述第一语音数据的置信度;
判断所述置信度是否小于预设置信度阈值;
当所述置信度小于所述预设置信度阈值时,执行预设操作;
当所述置信度大于或等于所述预设置信度阈值时,唤醒所述终端设备的语音控制功能。
2.根据权利要求1所述的方法,其特征在于,所述执行预设操作之后,所述方法还包括:
输出第一提示信息,所述第一提示信息用于提示所述用户再次输入所述第一语音数据,直至接收到的所述第一语音数据的置信度大于或等于所述预设置信度阈值。
3.根据权利要求1所述的方法,其特征在于,所述执行预设操作,包括:
判断所述终端设备当前是否正输出第二语音数据;
当所述终端设备当前正输出所述第二语音数据时,调低所述第二语音数据的音量值。
4.根据权利要求1或3所述的方法,其特征在于,所述执行预设操作,包括:
输出第二提示信息,所述第二提示信息用于提示所述用户提高所述第一语音数据的音量值。
5.根据权利要求1所述的方法,其特征在于,所述执行预设操作,包括:
降低所述预设置信度阈值。
6.一种语音唤醒装置,其特征在于,包括:
匹配模块,用于当终端设备接收到用户输入的包含预设唤醒词的第一语音数据时,对所述第一语音数据和预设语言模型进行匹配,获得所述第一语音数据的置信度;
判断模块,用于判断所述置信度是否小于预设置信度阈值;
执行模块,用于当所述置信度小于所述预设置信度阈值时,执行预设操作;
唤醒模块,用于当所述置信度大于或等于所述预设置信度阈值时,唤醒所述终端设备的语音控制功能。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
输出模块,用于所述执行预设操作之后,输出第一提示信息,所述第一提示信息用于提示所述用户再次输入所述第一语音数据,直至接收到的所述第一语音数据的置信度大于或等于所述预设置信度阈值。
8.根据权利要求6所述的装置,其特征在于,所述执行模块包括:
判断子模块,用于判断所述终端设备当前是否正输出第二语音数据;
调低子模块,用于当所述终端设备当前正输出所述第二语音数据时,调低所述第二语音数据的音量值。
9.根据权利要求6或8所述的装置,其特征在于,所述执行模块包括:
输出子模块,用于输出第二提示信息,所述第二提示信息用于提示所述用户提高所述第一语音数据的音量值。
10.根据权利要求6所述的装置,其特征在于,所述执行模块包括:
降低子模块,用于降低所述预设置信度阈值。
CN201610009102.9A 2016-01-07 2016-01-07 一种语音唤醒方法及装置 Pending CN105702253A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610009102.9A CN105702253A (zh) 2016-01-07 2016-01-07 一种语音唤醒方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610009102.9A CN105702253A (zh) 2016-01-07 2016-01-07 一种语音唤醒方法及装置

Publications (1)

Publication Number Publication Date
CN105702253A true CN105702253A (zh) 2016-06-22

Family

ID=56226088

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610009102.9A Pending CN105702253A (zh) 2016-01-07 2016-01-07 一种语音唤醒方法及装置

Country Status (1)

Country Link
CN (1) CN105702253A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106782536A (zh) * 2016-12-26 2017-05-31 北京云知声信息技术有限公司 一种语音唤醒方法及装置
CN106910496A (zh) * 2017-02-28 2017-06-30 广东美的制冷设备有限公司 智能家电控制方法和装置
CN107704275A (zh) * 2017-09-04 2018-02-16 百度在线网络技术(北京)有限公司 智能设备唤醒方法、装置、服务器及智能设备
CN107742516A (zh) * 2017-09-29 2018-02-27 上海与德通讯技术有限公司 智能识别方法、机器人及计算机可读存储介质
CN108064007A (zh) * 2017-11-07 2018-05-22 苏宁云商集团股份有限公司 用于智能音箱的增强人声识别的方法及微控制器和智能音箱
CN108320733A (zh) * 2017-12-18 2018-07-24 上海科大讯飞信息科技有限公司 语音数据处理方法及装置、存储介质、电子设备
CN108377414A (zh) * 2018-02-08 2018-08-07 海尔优家智能科技(北京)有限公司 一种调节音量的方法、装置、存储介质及电子设备
CN108615526A (zh) * 2018-05-08 2018-10-02 腾讯科技(深圳)有限公司 语音信号中关键词的检测方法、装置、终端及存储介质
CN108833688A (zh) * 2018-05-30 2018-11-16 Oppo广东移动通信有限公司 位置提醒方法、装置、存储介质及电子设备
CN109661856A (zh) * 2016-08-25 2019-04-19 昕诺飞控股有限公司 光照控制
CN109672775A (zh) * 2017-10-16 2019-04-23 腾讯科技(北京)有限公司 调节唤醒灵敏度的方法、装置及终端
CN109841221A (zh) * 2018-12-14 2019-06-04 深圳壹账通智能科技有限公司 基于语音识别的参数调节方法、装置及健身设备
CN110148405A (zh) * 2019-04-10 2019-08-20 北京梧桐车联科技有限责任公司 语音指令处理方法及装置、电子设备及存储介质
CN111081251A (zh) * 2019-11-27 2020-04-28 云知声智能科技股份有限公司 语音唤醒方法及装置
CN111124512A (zh) * 2019-12-10 2020-05-08 珠海格力电器股份有限公司 智能设备的唤醒方法、装置、设备和介质
CN111630413A (zh) * 2018-06-05 2020-09-04 谷歌有限责任公司 基于置信度的应用特定的用户交互
CN111816178A (zh) * 2020-07-07 2020-10-23 云知声智能科技股份有限公司 语音设备的控制方法、装置和设备
CN113228170A (zh) * 2019-12-05 2021-08-06 海信视像科技股份有限公司 信息处理装置及非易失性存储介质
CN113539257A (zh) * 2021-06-15 2021-10-22 复旦大学附属肿瘤医院 一种语音唤醒方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08234787A (ja) * 1995-03-01 1996-09-13 Hitachi Zosen Corp 再スタート用機能付音声認識装置
WO2000070440A1 (en) * 1999-05-17 2000-11-23 Microsoft Corporation Automatic speech recognition system signalling and controlling
US20060074651A1 (en) * 2004-09-22 2006-04-06 General Motors Corporation Adaptive confidence thresholds in telematics system speech recognition
CN102915753A (zh) * 2012-10-23 2013-02-06 华为终端有限公司 一种电子设备的智能控制音量的方法及实现装置
CN102999161A (zh) * 2012-11-13 2013-03-27 安徽科大讯飞信息科技股份有限公司 一种语音唤醒模块的实现方法及应用
CN103139351A (zh) * 2011-11-24 2013-06-05 联想(北京)有限公司 音量控制方法、装置及通信终端
CN103578468A (zh) * 2012-08-01 2014-02-12 联想(北京)有限公司 一种语音识别中置信度阈值的调整方法及电子设备
CN103916511A (zh) * 2013-01-08 2014-07-09 联想(北京)有限公司 信息处理的方法及电子设备
CN104424073A (zh) * 2013-08-21 2015-03-18 联想(北京)有限公司 一种信息处理的方法及电子设备
US20150154953A1 (en) * 2013-12-02 2015-06-04 Spansion Llc Generation of wake-up words

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08234787A (ja) * 1995-03-01 1996-09-13 Hitachi Zosen Corp 再スタート用機能付音声認識装置
WO2000070440A1 (en) * 1999-05-17 2000-11-23 Microsoft Corporation Automatic speech recognition system signalling and controlling
US20060074651A1 (en) * 2004-09-22 2006-04-06 General Motors Corporation Adaptive confidence thresholds in telematics system speech recognition
CN103139351A (zh) * 2011-11-24 2013-06-05 联想(北京)有限公司 音量控制方法、装置及通信终端
CN103578468A (zh) * 2012-08-01 2014-02-12 联想(北京)有限公司 一种语音识别中置信度阈值的调整方法及电子设备
CN102915753A (zh) * 2012-10-23 2013-02-06 华为终端有限公司 一种电子设备的智能控制音量的方法及实现装置
CN102999161A (zh) * 2012-11-13 2013-03-27 安徽科大讯飞信息科技股份有限公司 一种语音唤醒模块的实现方法及应用
CN103916511A (zh) * 2013-01-08 2014-07-09 联想(北京)有限公司 信息处理的方法及电子设备
CN104424073A (zh) * 2013-08-21 2015-03-18 联想(北京)有限公司 一种信息处理的方法及电子设备
US20150154953A1 (en) * 2013-12-02 2015-06-04 Spansion Llc Generation of wake-up words

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109661856A (zh) * 2016-08-25 2019-04-19 昕诺飞控股有限公司 光照控制
CN106782536A (zh) * 2016-12-26 2017-05-31 北京云知声信息技术有限公司 一种语音唤醒方法及装置
CN106910496A (zh) * 2017-02-28 2017-06-30 广东美的制冷设备有限公司 智能家电控制方法和装置
WO2018157542A1 (zh) * 2017-02-28 2018-09-07 广东美的制冷设备有限公司 智能家电控制方法和装置
CN107704275A (zh) * 2017-09-04 2018-02-16 百度在线网络技术(北京)有限公司 智能设备唤醒方法、装置、服务器及智能设备
CN107742516A (zh) * 2017-09-29 2018-02-27 上海与德通讯技术有限公司 智能识别方法、机器人及计算机可读存储介质
CN107742516B (zh) * 2017-09-29 2020-11-17 上海望潮数据科技有限公司 智能识别方法、机器人及计算机可读存储介质
CN109672775B (zh) * 2017-10-16 2021-10-29 腾讯科技(北京)有限公司 调节唤醒灵敏度的方法、装置及终端
CN109672775A (zh) * 2017-10-16 2019-04-23 腾讯科技(北京)有限公司 调节唤醒灵敏度的方法、装置及终端
CN108064007A (zh) * 2017-11-07 2018-05-22 苏宁云商集团股份有限公司 用于智能音箱的增强人声识别的方法及微控制器和智能音箱
CN108320733A (zh) * 2017-12-18 2018-07-24 上海科大讯飞信息科技有限公司 语音数据处理方法及装置、存储介质、电子设备
CN108377414A (zh) * 2018-02-08 2018-08-07 海尔优家智能科技(北京)有限公司 一种调节音量的方法、装置、存储介质及电子设备
CN108615526A (zh) * 2018-05-08 2018-10-02 腾讯科技(深圳)有限公司 语音信号中关键词的检测方法、装置、终端及存储介质
US11341957B2 (en) 2018-05-08 2022-05-24 Tencent Technology (Shenzhen) Company Limited Method for detecting keyword in speech signal, terminal, and storage medium
CN108833688A (zh) * 2018-05-30 2018-11-16 Oppo广东移动通信有限公司 位置提醒方法、装置、存储介质及电子设备
CN108833688B (zh) * 2018-05-30 2020-03-10 Oppo广东移动通信有限公司 位置提醒方法、装置、存储介质及电子设备
CN111630413B (zh) * 2018-06-05 2024-04-16 谷歌有限责任公司 基于置信度的应用特定的用户交互
CN111630413A (zh) * 2018-06-05 2020-09-04 谷歌有限责任公司 基于置信度的应用特定的用户交互
CN109841221A (zh) * 2018-12-14 2019-06-04 深圳壹账通智能科技有限公司 基于语音识别的参数调节方法、装置及健身设备
CN110148405B (zh) * 2019-04-10 2021-07-13 北京梧桐车联科技有限责任公司 语音指令处理方法及装置、电子设备及存储介质
CN110148405A (zh) * 2019-04-10 2019-08-20 北京梧桐车联科技有限责任公司 语音指令处理方法及装置、电子设备及存储介质
CN111081251B (zh) * 2019-11-27 2022-03-04 云知声智能科技股份有限公司 语音唤醒方法及装置
CN111081251A (zh) * 2019-11-27 2020-04-28 云知声智能科技股份有限公司 语音唤醒方法及装置
CN113228170A (zh) * 2019-12-05 2021-08-06 海信视像科技股份有限公司 信息处理装置及非易失性存储介质
CN111124512A (zh) * 2019-12-10 2020-05-08 珠海格力电器股份有限公司 智能设备的唤醒方法、装置、设备和介质
CN111816178A (zh) * 2020-07-07 2020-10-23 云知声智能科技股份有限公司 语音设备的控制方法、装置和设备
CN113539257A (zh) * 2021-06-15 2021-10-22 复旦大学附属肿瘤医院 一种语音唤醒方法及装置

Similar Documents

Publication Publication Date Title
CN105702253A (zh) 一种语音唤醒方法及装置
CN105654949B (zh) 一种语音唤醒方法及装置
CN108831469B (zh) 语音命令定制方法、装置和设备及计算机存储介质
CN106782536B (zh) 一种语音唤醒方法及装置
US9583102B2 (en) Method of controlling interactive system, method of controlling server, server, and interactive device
CN108694940B (zh) 一种语音识别方法、装置及电子设备
CN102568478B (zh) 一种基于语音识别的视频播放控制方法和系统
CN102842306B (zh) 语音控制方法及装置、语音响应方法及装置
KR102411619B1 (ko) 전자 장치 및 그 제어 방법
US20170069317A1 (en) Voice recognition apparatus, driving method thereof, and non-transitory computer-readable recording medium
US11062708B2 (en) Method and apparatus for dialoguing based on a mood of a user
CN109979474B (zh) 语音设备及其用户语速修正方法、装置和存储介质
CN110751948A (zh) 一种语音识别方法、装置、存储介质及语音设备
CN109545213A (zh) 设备控制方法、装置、存储介质及空调
CN111178081B (zh) 语义识别的方法、服务器、电子设备及计算机存储介质
CN110570855A (zh) 通过对话机制控制智能家居设备的系统、方法及装置
CN109360551B (zh) 一种语音识别方法及装置
CN105825848A (zh) 一种语音识别方法、装置及终端
CN113205809A (zh) 语音唤醒方法和装置
CN109859752A (zh) 一种语音控制方法、装置、存储介质及语音联控系统
CN108932947B (zh) 语音控制方法及家电设备
US20220399013A1 (en) Response method, terminal, and storage medium
CN111933135A (zh) 终端控制方法、装置、智能终端及计算机可读存储介质
CN103941868A (zh) 语音控制准确率调整方法和系统
CN111292749B (zh) 智能语音平台的会话控制方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160622

RJ01 Rejection of invention patent application after publication