CN110660390B - 智能设备唤醒方法、智能设备及计算机可读存储介质 - Google Patents
智能设备唤醒方法、智能设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110660390B CN110660390B CN201910877529.4A CN201910877529A CN110660390B CN 110660390 B CN110660390 B CN 110660390B CN 201910877529 A CN201910877529 A CN 201910877529A CN 110660390 B CN110660390 B CN 110660390B
- Authority
- CN
- China
- Prior art keywords
- volume
- gear
- delay time
- awakening
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 230000004044 response Effects 0.000 claims abstract description 60
- 238000012545 processing Methods 0.000 claims abstract description 38
- 230000002618 waking effect Effects 0.000 claims description 20
- 230000015654 memory Effects 0.000 claims description 19
- 230000003111 delayed effect Effects 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000013461 design Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/02—Power saving arrangements
- H04W52/0209—Power saving arrangements in terminal devices
- H04W52/0225—Power saving arrangements in terminal devices using monitoring of external events, e.g. the presence of a signal
- H04W52/0229—Power saving arrangements in terminal devices using monitoring of external events, e.g. the presence of a signal where the received signal is a wanted signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3209—Monitoring remote activity, e.g. over telephone lines or network connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3215—Monitoring of peripheral devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3231—Monitoring the presence, absence or movement of users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/325—Power saving in peripheral device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3287—Power saving characterised by the action undertaken by switching off individual functional units in the computer system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/4401—Bootstrapping
- G06F9/4418—Suspend and resume; Hibernate and awake
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72454—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Environmental & Geological Engineering (AREA)
- Computer Security & Cryptography (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请公开了智能设备唤醒方法、智能设备及计算机可读存储介质,涉及智能设备的唤醒技术。具体实现方案为:获取用户发送的唤醒语音;在确定当前唤醒模式为群组唤醒模式时,识别获取所述唤醒语音对应的音量信息;并根据所述音量信息,确定唤醒延迟时间;在确定所述唤醒延迟时间与群组内其他智能设备对应的唤醒延迟时间不相同,且所述唤醒延迟时间内没有获取到所述群组内其他智能设备发送的应答信息时,在所述唤醒延迟时间结束时,执行唤醒处理,并播放应答信息。从而能够保证每次用户发出唤醒语音时,只有一个智能设备进行响应,避免了多个智能设备同时响应的问题,提高用户体验。
Description
技术领域
本申请涉及数据处理领域,尤其涉及一种智能设备的唤醒技术。
背景技术
随着科技的发展,越来越多的智能设备逐渐走进用户的生活。智能设备上可以搭载人工智能操作系统,因此,其可以响应与用户的唤醒,并执行用户发送的控制指令,与用户进行交互。
为了方便用户对智能设备的控制,智能音箱可以获取用户发出的语音信号,当语音信号为预设的唤醒指令时,则根据该语音信号发送应答信息。
目前,一个区域内可能同时设置有多个智能设备,当多个智能设备之间的距离较小,且设置有相同的唤醒指令时,当用户发出一个唤醒指令,预设区域内的多个智能设备可能同时响应该唤醒指令。而多个智能设备一同响应唤醒指令时,一方面会造成多个智能设备在执行指令过程中相互影响,另一方面,会造成用户体验较差。
发明内容
本申请提供一种智能设备唤醒方法、智能设备及计算机可读存储介质,用于解决现有的智能设备唤醒方法,当用户发出一个唤醒指令,预设区域内的多个智能设备可能同时响应该唤醒指令的技术问题。
第一方面,本申请实施例提供一种智能设备唤醒方法,包括:
获取用户发送的唤醒语音;
在确定当前唤醒模式为群组唤醒模式时,识别获取所述唤醒语音对应的音量信息;并根据所述音量信息,确定唤醒延迟时间;
在确定所述唤醒延迟时间与群组内其他智能设备对应的唤醒延迟时间不相同,且所述唤醒延迟时间内没有获取到所述群组内其他智能设备发送的应答信息时,在所述唤醒延迟时间结束时,执行唤醒处理,并播放应答信息。
本实施例提供的智能设备唤醒方法,通过根据音量信息确定相应唤醒延迟时间,根据唤醒延迟时间确定是否对唤醒语音进行响应,从而能够保证每次用户发出唤醒语音时,只有一个智能设备进行响应,避免了多个智能设备同时响应的问题,提高用户体验。此外,本实施例提供的智能设备唤醒方法,距离用户较近的智能设备响应用户的唤醒语音的速度快,距离用户较远的智能设备响应用户的唤醒语音的速度较慢,较为符合人类对话习惯,提高用户体验。
在一种可能的设计中,还包括:
获取终端设备发送的音量档位生成请求;所述音量档位生成请求包括:群组标识,所述群组标识下智能设备的数量信息,以及所述群组标识下其他智能设备的标识;
根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的音量信息;
根据所述其他智能设备的标识对应的音量信息,以及所述群组标识下智能设备的数量信息,生成第一音量和档位的对应关系。
本实施例提供的智能设备唤醒方法,通过获取终端设备发送的音量档位生成请求,根据该音量档位生成请求获取其他智能设备的标识对应的音量信息,根据其他智能设备的标识对应的音量信息生成第一音量和档位的对应关系,从而能够快速地对用户发出的唤醒语音对应的档位进行确定,进而为避免多个智能设备同时响应提供了基础。
在一种可能的设计中,还包括:
识别获取所述唤醒语音对应的音纹信息;
则所述根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的音量信息,包括:
根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的智能设备中与所述音纹信息对应的音量信息;
则所述方法还包括:
根据所述其他智能设备的标识对应的智能设备中与所述音纹信息对应的音量信息,以及所述群组标识下智能设备的数量信息,生成第二音量和档位的对应关系。
本实施例提供的智能设备唤醒方法,通过识别获取唤醒语音对应的音纹信息,根据音量档位生成请求,分别获取其他智能设备的标识对应的智能设备中与音纹信息对应的音量信息。根据其他智能设备的标识对应的智能设备中与音纹信息对应的音量信息,以及群组标识下智能设备的数量信息,生成第二音量和档位的对应关系。从而能够快速地对用户发出的唤醒语音对应的档位进行确定,进而为避免多个智能设备同时响应提供了基础。
在一种可能的设计中,还包括:
将所述第一音量和档位的对应关系或者第二音量和档位的对应关系发送给所述其他智能设备的标识对应的智能设备,以使所述其他智能设备根据所述第一音量和档位的对应关系或者第二音量和档位的对应关系,进行更新处理。
本实施例提供的智能设备唤醒方法,通过在生成第一音量和档位的对应关系或者第二音量和档位的对应关系之后,将第一音量和档位的对应关系或者第二音量和档位的对应关系发送至其他智能设备的标识对应的智能设备,从而群组内的其他智能设备均能够根据该第一音量和档位的对应关系或者第二音量和档位的对应关系实现对唤醒延迟时间的确定,进而能够实现在获取到用户发送的唤醒语音时,只有一个智能设备进行响应,提高用户体验。
在一种可能的设计中,所述根据所述音量信息,确定唤醒延迟时间,包括:
根据所述音量信息,查询所述第一音量和档位的对应关系,获取与所述音量信息对应的档位;
根据所述档位,确定所述唤醒延迟时间。
本实施例提供的智能设备唤醒方法,通过根据第一音量和档位的对应关系确定音量信息对应的档位,并根据档位确定唤醒延迟时间,从而能够快速准确地实现唤醒延迟时间的确定,为避免多个智能设备同时响应提供了基础。
在一种可能的设计中,还包括:
根据所述音纹信息,获取与所述音纹信息对应的第二音量和档位的对应关系;
根据所述音量信息,查询所述第二音量和档位的对应关系,获取与所述音量信息对应的档位;
根据所述档位,确定所述唤醒延迟时间。
本实施例提供的智能设备唤醒方法,通过根据音纹信息获取第二音量和档位对应的关系,根据第二音量和档位的对应关系确定音量信息对应的档位,并根据档位确定唤醒延迟时间,从而能够快速准确地实现唤醒延迟时间的确定,为避免多个智能设备同时响应提供了基础。
在一种可能的设计中,所述根据所述档位,确定所述唤醒延迟时间,包括:
根据所述档位,采用公式:
T=档位*(K+D)
获取所述唤醒延迟时间T;
其中,K表示设备内语音处理延迟时长,D表示语音传播时长。
本实施例提供的智能设备唤醒方法,通过上述公式以及档位,能够快速准确地确定用户当前发出的唤醒语音的唤醒延迟时间。
在一种可能的设计中,若根据所述音量信息,查询所述第一音量和档位的对应关系或者所述第二音量和档位的对应关系,未获取到与所述音量对应的档位,则所述方法还包括:
若确定所述音量小于最小音量,则将所述唤醒延迟时间设置为所述最小音量对应的档位对应的唤醒延迟时间与预设延迟时长之和;
或者,
若确定所述音量大于最大音量,则将所述唤醒延迟时间设置为所述最大音量对应的档位对应的唤醒延迟时间;
其中,所述最小音量为所述第一音量和档位的对应关系或者第二音量和档位的对应关系中音量数值范围内最小的音量;
所述最大音量为所述第一音量和档位的对应关系或者第二音量和档位的对应关系中音量数值范围内最大的音量。
本实施例提供的智能设备唤醒方法,通过在获取到的唤醒语音大于最大音量或者小于最小音量时,对唤醒延迟时间进行调节,从而能够保证第一音量和档位的对应关系或者所述第二音量和档位的对应关系能够兼容全部的音量信息,无论用户声音高或低,都能够对用户的唤醒语音进行响应,提高用户体验。
在一种可能的设计中,还包括:
在确定所述唤醒延迟时间与群组内其他智能设备中的至少一个智能设备对应的唤醒延迟时间相同时,分别判断本地优先级级别是否高于所述至少一个智能设备,若均高于,则确定所述唤醒延迟时间内是否获取到所述群组内其他智能设备发送的应答信息;
若低于所述至少一个智能设备,则结束延迟应答操作。
本实施例提供的智能设备唤醒方法,通过在确定唤醒延迟时间与群组内其他智能设备中的至少一个智能设备对应的唤醒延迟时间相同时,根据预设的优先级确定是否响应唤醒语音,从而能够精准地保证每次接收到用户的唤醒语音时,仅有一个智能设备进行响应,提高用户体验。
第二方面,本申请实施例提供一种智能设备,包括:
唤醒语音获取模块,用于获取用户发送的唤醒语音;
唤醒延迟时间确定模块,用于在确定当前唤醒模式为群组唤醒模式时,识别获取所述唤醒语音对应的音量信息;并根据所述音量信息,确定唤醒延迟时间;
应答模块,用于在确定所述唤醒延迟时间与群组内其他智能设备对应的唤醒延迟时间不相同,且所述唤醒延迟时间内没有获取到所述群组内其他智能设备发送的应答信息时,在所述唤醒延迟时间结束时,执行唤醒处理,并播放应答信息。
在一种可能的设计中,所述装置还包括:
音量档位生成请求获取模块,用于获取终端设备发送的音量档位生成请求;所述音量档位生成请求包括:群组标识,所述群组标识下智能设备的数量信息,以及所述群组标识下其他智能设备的标识;
音量信息获取模块,用于根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的音量信息;
第一对应关系生成模块,用于根据所述其他智能设备的标识对应的音量信息,以及所述群组标识下智能设备的数量信息,生成第一音量和档位的对应关系。
在一种可能的设计中,所述装置还包括:
音纹识别模块,用于识别获取所述唤醒语音对应的音纹信息;
则音量信息获取模块包括:
音量获取单元,用于根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的智能设备中与所述音纹信息对应的音量信息;
则所述装置还包括:
第二对应关系生成模块,用于根据所述其他智能设备的标识对应的智能设备中与所述音纹信息对应的音量信息,以及所述群组标识下智能设备的数量信息,生成第二音量和档位的对应关系。
在一种可能的设计中,所述装置还包括:
更新模块,用于将所述第一音量和档位的对应关系或者第二音量和档位的对应关系发送给所述其他智能设备的标识对应的智能设备,以使所述其他智能设备根据所述第一音量和档位的对应关系或者第二音量和档位的对应关系,进行更新处理。
在一种可能的设计中,所述唤醒延迟时间确定模块包括:
第一档位获取单元,用于根据所述音量信息,查询所述第一音量和档位的对应关系,获取与所述音量信息对应的档位;
唤醒延迟时间确定单元,用于根据所述档位,确定所述唤醒延迟时间。
在一种可能的设计中,所述装置还包括:
对应关系获取单元,用于根据所述音纹信息,获取与所述音纹信息对应的第二音量和档位的对应关系;
第二档位获取单元,用于根据所述音量信息,查询所述第二音量和档位的对应关系,获取与所述音量信息对应的档位;
唤醒延迟时间确定单元,用于根据所述档位,确定所述唤醒延迟时间。
在一种可能的设计中,所述唤醒延迟时间确定单元具体用于:
根据所述档位,采用公式:
T=档位*(K+D)
获取所述唤醒延迟时间T;
其中,K表示设备内语音处理延迟时长,D表示语音传播时长。
在一种可能的设计中,若根据所述音量信息,查询所述第一音量和档位的对应关系或者所述第二音量和档位的对应关系,未获取到与所述音量对应的档位,则所述装置还包括:
第一调整模块,用于若确定所述音量小于最小音量,则将所述唤醒延迟时间设置为所述最小音量对应的档位对应的唤醒延迟时间与预设延迟时长之和;
或者,
第二调整模块,用于若确定所述音量大于最大音量,则将所述唤醒延迟时间设置为所述最大音量对应的档位对应的唤醒延迟时间;
其中,所述最小音量为所述第一音量和档位的对应关系或者第二音量和档位的对应关系中音量数值范围内最小的音量;
所述最大音量为所述第一音量和档位的对应关系或者第二音量和档位的对应关系中音量数值范围内最大的音量。
在一种可能的设计中,所述装置还包括:
优先级判断模块,用于在确定所述唤醒延迟时间与群组内其他智能设备中的至少一个智能设备对应的唤醒延迟时间相同时,分别判断本地优先级级别是否高于所述至少一个智能设备,若均高于,则确定所述唤醒延迟时间内是否获取到所述群组内其他智能设备发送的应答信息;
处理模块,用于若低于所述至少一个智能设备,则结束延迟应答操作。
第三方面,本申请实施例提供一种智能设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的智能设备唤醒方法。
第四方面,本申请实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行第一方面所述的智能设备唤醒方法。
本实施例提供的智能设备唤醒方法、智能设备及计算机可读存储介质,通过根据音量信息确定相应唤醒延迟时间,根据唤醒延迟时间确定是否对唤醒语音进行响应,从而能够保证每次用户发出唤醒语音时,只有一个智能设备进行响应,避免了多个智能设备同时响应的问题,提高用户体验。此外,本实施例提供的智能设备唤醒方法,距离用户较近的智能设备响应用户的唤醒语音的速度快,距离用户较远的智能设备响应用户的唤醒语音的速度较慢,较为符合人类对话习惯,提高用户体验。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请所基于的系统架构图;
图2为本申请实施例一提供的智能设备唤醒方法的流程示意图;
图3为本申请实施例提供的群组唤醒模式交互界面图;
图4为本申请实施例提供的智能设备唤醒场景示意图;
图5为本申请实施例二提供的智能设备唤醒方法的流程示意图;
图6为本申请实施例提供的又一系统架构图;
图7为本申请实施例三提供的智能设备唤醒方法的流程图;
图8为本申请实施例四提供的智能设备的结构示意图;
图9为本申请实施例五提供的智能设备的结构示意图;
图10为本申请实施例六提供的智能设备唤醒方法的流程示意图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
为了解决现有的智能设备唤醒方法,当用户发出一个唤醒指令,预设区域内的多个智能设备可能同时响应该唤醒指令的技术问题,本申请提供了一种智能设备唤醒方法、智能设备及计算机可读存储介质。
需要说明的是,本申请提供的智能设备唤醒方法、智能设备及计算机可读存储介质能够应用在对任意一种智能设备唤醒的场景中。
图1为本申请所基于的系统架构图,如图1所示,本申请所基于的系统架构图至少包括多个智能设备1以及终端设备2,其中,多个智能设备1分别于终端设备2通信连接。其中,智能设备1包括但不限于智能音箱、智能扫地机器人、智能学习机器人等;终端设备2则可例如台式电脑、平板电脑等。
图2为本申请实施例一提供的智能设备唤醒方法的流程示意图,如图2所示,所述方法包括:
步骤101、获取用户发送的唤醒语音。
本实施例的执行主体为智能设备。实际应用中,用户可以根据自身需求为智能设备设置标准唤醒语音,从而实现对智能设备的语音唤醒。举例来说,用户可以将标准唤醒语音设置为“你好,智能设备”。在用户需要对智能设备进行唤醒时,只需说出“你好,智能设备”,智能设备在接收到该唤醒语音时,即可以对该唤醒语音进行响应,例如,智能设备可以发出应答信息“在呢”,并进行唤醒处理,以进一步接收用户对该智能设备的进一步指示。为了实现对用户唤醒语音的响应,智能设备可以实时监听用户发出的语音,并将监听到的语音与预设的唤醒语音进行比对,若该语音与预设的唤醒语音一致,则表征获取到的语音为唤醒语音。
步骤102、在确定当前唤醒模式为群组唤醒模式时,识别获取所述唤醒语音对应的音量信息;并根据所述音量信息,确定唤醒延迟时间。
在本实施方式中,当同一区域内,同时设置有多个具有相同的唤醒语音的智能设备时,为了避免多个智能设备可能同时对该相同唤醒语音进行响应,智能设备在原有“一呼即应”的唤醒模式(即,默认唤醒模式)的基础上,还可以增加群组唤醒模式,以使得智能设备可以根据自身处于的环境(是同一个区域内仅有自身一个设备,还是同一区域内不仅限于自己一个设备),调整本地的唤醒模式。
举例来说,图3为本申请实施例提供的群组唤醒模式设置的示意图,如图3所示,智能设备调整本地的唤醒模式的一种实现方式为:以用户居住的家庭住宅为例,当智能设备位于家庭住宅内,并与用户的终端设备建立连接之后,该终端设备可以在其对应的APP上添加该智能设备,并获取该智能设备的位置信息。当终端设备确定存在该地址信息的智能设备的数量为2个时,建立与该地址信息对应的群组,该群组下包括这2个智能设备的标识。或者,当终端设备确定存在该地址对应的群组时,将该智能设备标识加入到该群组中。随后,终端设备将该群组的标识携带在群组通知消息中发送给该群组下智能终端的标识对应的智能终端,则智能终端根据该群组通知消息,将当前唤醒模式由默认唤醒模式切换至群组唤醒模式。
基于此,在智能设备获取到唤醒语音后,先确定当前唤醒模式,若确定当前唤醒模式为默认唤醒模式,则直接执行唤醒处理,并播放应答信息。或者,若确定当前唤醒模式为群组唤醒模式,则获知该设备处于同一区域内存在多个智能设备的场景下,则是否执行唤醒和应答处理,取决于其相较于发出唤醒语音的声源位置的距离,而距离的变化可以由智能设备接收到的唤醒语音的音量有所不同而体现,因此,智能设备可以基于识别获取到的唤醒语音对应的音量信息,来确定与之对应的唤醒延迟时间。
需要说明的是,可以采用任意一种音量计算方法实现对唤醒语音对应的音量信息的计算,本申请对此不做限制。另外,根据该音量信息确定该唤醒语音对应的唤醒延迟时间的方式可以包括但不限于如下几种:
可以预先设置音量信息与唤醒延迟时间的对应关系,在获取到唤醒语音对应的音量信息之后,根据该对应关系确定唤醒语音对应的唤醒延迟时间;或者,
可以根据预先设置有音量档位对应关系,确定音量信息对应的档位,根据该档位确定唤醒语音对应的唤醒延迟时间。
需要说明的是,音量信息越小,则对应的唤醒延迟时间越长,相应地,音量信息越大,则对应的唤醒延迟时间越短。也即距离发出唤醒语音的声源位置较近的智能设备响应用户的唤醒语音的速度快,距离用户较远的智能设备响应用户的唤醒语音的速度较慢,较为符合人类对话习惯,提高用户体验。
步骤103、在确定所述唤醒延迟时间与群组内其他智能设备对应的唤醒延迟时间不相同,且所述唤醒延迟时间内没有获取到所述群组内其他智能设备发送的应答信息时,在所述唤醒延迟时间结束时,执行唤醒处理,并播放应答信息。
在本实施方式中,确定唤醒语音对应的唤醒延迟时间之后,为了避免至少两个智能设备可能距发出唤醒语音的声源位置的距离相同而导致同时进行应答和唤醒,需要先判断其确定的唤醒延迟时间是否与群组内其他智能设备的唤醒延迟时间相同。
举例来说,判断群组内智能设备的唤醒延迟时间是否相同的实现方式包括但不限于如下几种:
一种方式为,智能设备可以将该唤醒延迟时间和智能设备的标识发送给处于相同群组下的其他智能设备,同理,该智能设备也可以接收处于相同群组下的其他智能设备发送的唤醒延迟时间和智能设备的标识。则该智能设备可以判断其确定的唤醒延迟时间是否与群组内其他智能设备的唤醒延迟时间是否相同。
另一种方式为,智能设备可以将该唤醒延迟时间、智能设备的标识,以及其对应的群组的标识发送给终端设备。终端设备在接收到该群组的标识对应的群组内的智能设备各自发送的唤醒延迟时间后,对该唤醒延迟时间进行判断,若存在唤醒延迟时间相同,且相同的唤醒延迟时间是接收到的所有唤醒延迟时间中最小的唤醒延迟时间时,可以进一步判断具有相同唤醒延迟时间对应的智能终端设备的标识的优先级,并向优先级较低的智能终端设备发送唤醒延迟时间相同的通知消息,则接收到唤醒延迟时间相同的通知消息的智能终端设备,确定其唤醒延迟时间与群组内其他智能设备的唤醒延迟时间相同。
反之,若终端设备判断唤醒延迟时间均不相同,或者存在唤醒延迟时间相同、但唤醒延迟时间并不是接收到的唤醒延迟时间中最小的唤醒延迟时间等时,则不发送唤醒延迟时间相同的通知消息,则智能设备在唤醒延迟时间结束时未收到唤醒延迟时间相同的通知消息,则确定其唤醒延迟时间与群组内其他智能设备的唤醒延迟时间不相同;又或者,终端设备向各个智能设备发送唤醒延迟时间不相同的通知消息,则接收到唤醒延迟时间不相同的通知消息的只能终端设备,确定其唤醒延迟时间与群组内其他智能设备的唤醒延迟时间不相同。
在确定了唤醒延迟时间与群组内其他智能设备的唤醒延迟时间不相同时,即在其唤醒延迟时间内,监听是否接收到其他智能设备发送的应答信息,若是在唤醒延迟时间内没有监听到其他智能设备发送的应答消息,则说明距发出唤醒语音的声源位置的距离最近,此时,可以执行唤醒处理,并生成和播放应答信息。
同理,对于其他智能设备,在其对应的唤醒延迟时间内监听到该智能设备发出的应答信息之后,则停止等待唤醒操作,并转为继续监听唤醒语音。
综上,举例来说,图4为本申请实施例提供的智能设备唤醒场景示意图,如图4所示,同一个区域内存在多个智能设备,且该些智能设备与一个终端设备连接,以实现通过该终端设备建立该些智能设备的群组,并是得群组下每个智能设备的唤醒模式切换为群组唤醒模式。当一个用户发出“你好,智能设备”的唤醒语音时,该唤醒语音被该群组下的多个智能设备所监听获取到。智能设备在群组唤醒模式下,获取该唤醒语音的音量信息,并基于该音量信息确定唤醒延迟时间,基于图4可知,距用户发出“你好,智能设备”的唤醒语音的距离最近的智能设备,其确定的唤醒延迟时间,相较于群组内其他智能设备的唤醒延迟时间最短,则优先在唤醒延迟时间结束时发出“在呢”的应答信息,并执行唤醒处理。同时,对于其他智能设备,在其对应的唤醒延迟时间内监听到该“在呢”的应答信息,则停止等待唤醒操作,并转为继续监听唤醒语音。
本实施例提供的智能设备唤醒方法,在获取到用户发送的唤醒语音后,根据当前唤醒模式为群组唤醒模式时,根据唤醒语音对应的音量信息来确定相应唤醒延迟时间,并在该唤醒延迟时间与群组内其他智能设备的唤醒延迟时间不相同,且该唤醒延迟时间内没有接收到其他智能设备发送的应答信息,则基于该唤醒语音进行相应地响应,从而能够保证在同一区域内存在多个智能设备,且唤醒语音为相同语音时,每次用户发出唤醒语音时,只有一个智能设备进行响应,避免了多个智能设备同时响应而造成的相互干扰的问题,提高同一区域内多个智能设备唤醒的灵活性,以及有效性。另外,唤醒延迟时间的确定一方面是为了避免多个智能设备同时响应,另一方面,使得距离用户较近的智能设备响应用户的唤醒语音的速度快,距离用户较远的智能设备响应用户的唤醒语音的速度较慢,更为符合人类对话习惯,进而在避免多个智能设备同时响应的同时,还进一步提高了用户体验。
图5为本申请实施例二提供的智能设备唤醒方法的流程示意图,在上述任一实施例的基础上,如图5所示,所述方法还包括:
步骤201、获取终端设备发送的音量档位生成请求;所述音量档位生成请求包括:群组标识,所述群组标识下智能设备的数量信息,以及所述群组标识下其他智能设备的标识;
步骤202、根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的音量信息;
步骤203、根据所述其他智能设备的标识对应的音量信息,以及所述群组标识下智能设备的数量信息,生成第一音量和档位的对应关系。
唤醒延迟时间的确定可以如实施例一中所述的根据音量信息和唤醒延迟时间的对应关系;或者根据音量和档位的对应关系。在本实施例中,根据音量和档位的对应关系来确定唤醒延迟时间的一种具体实现方式为:如图1所示,智能设备可以与终端设备通信连接,因此,能够与终端设备进行信息交互。为了实现在每次用户发出唤醒语音时,只有一个智能设备进行响应,在其智能设备加入群组,并切换唤醒模式为群组唤醒模式下,还可以进一步设置音量和档位的对应关系以来确定唤醒延迟时间。
具体地,智能设备可以接收终端设备发送的音量档位生成请求,由于一个终端设备可以分别对多个区域内的智能设备进行控制,因此,一个终端设备可以基于不同区域设置多个群组,为了实现对指定智能设备的精准控制,该音量档位生成请求包括:群组标识,群组标识下智能设备的数量信息,以及群组标识下其他智能设备的标识。
进一步地,对于新加入群组的智能设备,可以根据该音量档位生成请求,分别获取其他智能设备的标识对应的音量信息,其中,该音量信息可以为其他智能设备历史接收到的唤醒语音的音量信息。在获取到其他智能设备的标识对应的音量信息之后,智能设备可以根据其他智能设备的标识对应的音量信息以及群组标识下智能设备的数量信息,生成第一音量和档位的对应关系。
而对于已在群组内的智能设备,可以接收该第一音量和档位的对应关系,以更新内部原有的音量和档位对应的关系。
另外,智能设备获取群组内其他智能设备的标识对应的音量信息的实现方式可以包括但不限于如下几种:智能设备可以与其他智能设备直接进行信息交互,获取其他智能设备的标识对应的音量信息;此外,其他智能设备也可以将自身对应的音量信息发送至终端设备,相应地,智能设备可以从终端设备中获取其他智能设备的标识对应的音量信息;另外,其他智能设备也可以将自身对应的音量信息发送至服务器,相应地,智能设备可以从服务器中获取其他智能设备的标识对应的音量信息。
举例来说,图6为本申请实施例提供的又一系统架构图,如图6所示,智能设备1还可以进一步与数据服务器3(例如智能设备对应的服务平台)通信连接,并将已获取到的唤醒语音对应的音量信息发送至数据服务器3中进行存储,相应地,智能设备1在设置音量和档位的对应关系时,可以直接从数据服务器3中获取其他智能设备的标识对应的音量信息。其中,数据服务器3则可为云端服务器或服务器集群,其内存储有大量的数据。
再者,智能设备在获取到其他智能设备的标识对应的音量信息之后,可以根据预设的排序规则对其他智能设备的标识对应的音量信息进行排序。其中,该排序规则可以为按照音量信息由大到小的顺序排列,也可以为按照音量信息由小到大的顺序进行排列。将排序后的音量信息均匀地分为与群组标识下智能设备的数量信息对应的子类别。
举例来说,若当前群组内有四个智能设备,新加入的智能设备从其他智能设备中获取到20条音量信息,则可以将音量信息排序后分为四个子类别,每个子类别中包括五条音量信息。针对每个子类别,计算该子类别中音量信息对应的音量均值,获得与群组标识下智能设备的数量信息对应的音量均值。按照预设的档位设置规则为各音量均值设置对应的档位信息,获得音量档位对应关系。具体地,该预设的档位设置规则可以将最大的音量均值设置一档位;可选地,也可以将最小的音量均值设置一档位。
需要说明的是,档位可以对应其音量均值,还可以对应以音量均值为中心上下预设幅度的一段音量范围。
进一步地,在获取到第一音量和档位关系之后,可以根据该第一音量和档位关系实现对唤醒延迟时间的确定,在上述任一实施例的基础上,步骤102具体包括:
根据所述音量信息,查询所述第一音量和档位的对应关系,获取与所述音量信息对应的档位;
根据所述档位,确定所述唤醒延迟时间。
在本实施例中,获取到用户的唤醒语音,并确定该唤醒语音对应的音量信息之后,可以根据该音量信息查询第一音量和档位的对应关系,确定音量信息对应的档位。以每一档位对应一段音量范围举例来说,第一档位可以为80-100db,第二档位可以为60-79db,第三档位可以为40-59db,第四档位可以为20-39db,第五档位可以为0-19db,若确定用户的唤醒语音对应的音量信息为56db,那么可以根据第一音量和档位的对应关系快速地确定该音量信息对应的档位为第三档位。
另外,在确定音量信息对应的档位之后,可以根据该档位和唤醒延迟时间的对应关系,来确定档位对应的唤醒延迟时间。或者,根据所述档位,采用公式:
T=档位*(K+D)
获取所述唤醒延迟时间T;
其中,K表示设备内语音处理延迟时长,D表示语音传播时长。
举例来说,该智能设备内语音处理延迟时长K具体可以为185ms,该语音传播时长D具体可以为15ms,当音量信息对应的档位为2档时,唤醒延迟时间T=2*(185+15)=400ms;当音量信息对应的档位为3档时,唤醒延迟时间T=3*(185+15)=600ms。
其中,不同智能设备以及不同的应用场景下语音处理延迟时长K与语音传播时长D可能有所不同,本发明在此不做限制。
在本实施例中,可以进一步根据群组内其他智能设备历史采集的到的唤醒语音对应的音量信息,以及智能设备的数量,来确定音量和档位的对应关系,并以此确定唤醒延迟时间,由于考虑到了该群组内其他智能设备在群组所在区域内接收唤醒语音的远近而对应的音量的不同,以及考虑到群组内智能设备的数量,从而使得唤醒延迟时间的确定符合该群组所对应的该区域内用户音量的变化范围,进而使得唤醒延迟时间的确定更为准确。
图7为本申请实施例三提供的智能设备唤醒方法的流程图,在上述任一实施例的基础上,如图7所示,所述方法还包括:
步骤301、识别获取所述唤醒语音对应的音纹信息;
则步骤202包括:
步骤302、根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的智能设备中与所述音纹信息对应的音量信息;
则所述方法还包括:
步骤303、根据所述其他智能设备的标识对应的智能设备中与所述音纹信息对应的音量信息,以及所述群组标识下智能设备的数量信息,生成第二音量和档位的对应关系。
在本实施例中,各智能设备可能有多个用户同时使用,而不同的用户,其音量变化范围也有所不同,例如:女性和儿童的语音的音量范围,一般不同于男性的语音的音量范围,其音量范围中高音部分相较于男性较多。基于此,为了能够进一步准确的确定唤醒延迟时间,对于其唤醒延迟时间确定的音量和档位的对应关系的建立还要进一步考虑不同的用户。具体地,可以通过音纹信息进行用户分类,针对每个类别设置不同的音量档位对应关系。
更为具体地,可以识别获取唤醒语音对应的音纹信息,根据音量档位生成请求,分别获取其他智能设备的标识对应的智能设备中与音纹信息对应的音量信息。根据其他智能设备的标识对应的智能设备中与音纹信息对应的音量信息,以及群组标识下智能设备的数量信息,生成第二音量和档位的对应关系。
举例来说,可以根据预设的排序规则对其他智能设备的标识对应的音量信息进行排序。其中,该排序规则可以为按照音量信息由大到小的顺序排列,也可以为按照音量信息由小到大的顺序进行排列。将排序后的音量信息均匀地分为与群组标识下智能设备的数量信息对应的子类别。举例来说,若当前具有四个智能设备,具有20条音量信息,则可以将音量信息分为四个子类别,每个子类别中包括五条音量信息。针对每个子类别,计算该子类别中音量信息对应的音量均值,获得与群组标识下智能设备的数量信息对应的音量均值。按照预设的档位设置规则为各音量均值设置对应的档位信息,获得音量档位对应关系。具体地,该预设的档位设置规则可以为将最大的音量均值设置一档位;可选地,也可以为将最小的音量均值设置一档位。
进一步地,在生成与各音纹信息对应的第二音量和档位关系之后,可以根据该第二音量和档位关系实现对唤醒延迟时间的确定,在上述任一实施例的基础上,步骤102具体包括:
根据所述音纹信息,获取与所述音纹信息对应的第二音量和档位的对应关系;
根据所述音量信息,查询所述第二音量和档位的对应关系,获取与所述音量信息对应的档位;
根据所述档位,确定所述唤醒延迟时间。
在本实施例中,获取到用户的唤醒语音时,首先需要确定该唤醒语音对应的音纹信息,获取与该音纹信息对应的第二音量和档位的对应关系,确定该唤醒语音对应的音量信息,根据该音量信息查询第二音量和档位的对应关系,确定音量信息对应的档位。需要说明的是,每一档位可以对应一段音量范围,也可以对应一个固定的音量信息。确定音量信息对应的档位之后,可以根据该档位确定唤醒延迟时间。
另外,在确定音量信息对应的档位之后,可以根据该档位和唤醒延迟时间的对应关系,来确定档位对应的唤醒延迟时间。或者,根据所述档位,采用公式:
T=档位*(K+D)
获取所述唤醒延迟时间T;
其中,K表示设备内语音处理延迟时长,D表示语音传播时长。
举例来说,该智能设备内语音处理延迟时长K具体可以为185ms,该语音传播时长D具体可以为15ms,当音量信息对应的档位为2档时,唤醒延迟时间T=2*(185+15)=400ms;当音量信息对应的档位为3档时,唤醒延迟时间T=3*(185+15)=600ms。
其中,不同智能设备以及不同的应用场景下语音处理延迟时长K与语音传播时长D可能有所不同,本发明在此不做限制。
在本实施例中,不仅根据音纹,还可以根据群组内其他智能设备历史采集的到的唤醒语音对应的音量,以及智能设备的数量,来确定音量和档位的对应关系,并以此确定唤醒延迟时间,由于不仅考虑了用户音量范围的变化的不同,还考虑到了该群组内其他智能设备在接收唤醒语音的远近而对应的音量的不同,以及考虑到群组内智能设备的数量,从而使得唤醒延迟时间的确定符合该群组所对应的该区域内不同用户音量的变化范围,进而使得唤醒延迟时间的确定更为精准。
进一步地,在上述任一实施例的基础上,所述方法还包括:
将所述第一音量和档位的对应关系或者第二音量和档位的对应关系发送给所述其他智能设备的标识对应的智能设备,以使所述其他智能设备根据所述第一音量和档位的对应关系或者第二音量和档位的对应关系,进行更新处理。
在本实施例中,在生成第一音量和档位的对应关系或者第二音量和档位的对应关系之后,为了使群组中各智能设备都能够根据该第一音量和档位的对应关系或者第二音量和档位的对应关系实现唤醒延迟时间的确定,可以将第一音量和档位的对应关系或者第二音量和档位的对应关系发送至其他智能设备的标识对应的智能设备。相应地,其他智能设备的标识对应的智能设备在接收到该第一音量和档位的对应关系或者第二音量和档位的对应关系之后,可以根据接收到的该第一音量和档位的对应关系或者第二音量和档位的对应关系对当前存储的音量和档位的对应关系进行更新操作。需要说明的是,智能设备可以直接与群组内的其他智能设备进行信息交互,将该第一音量和档位的对应关系或者第二音量和档位的对应关系发送给其他智能设备,也可以将该第一音量和档位的对应关系或者第二音量和档位的对应关系发送至终端设备,从而其他智能设备可以从终端设备中获取该第一音量和档位的对应关系或者第二音量和档位的对应关系。
本实施例提供的智能设备唤醒方法,通过在生成第一音量和档位的对应关系或者第二音量和档位的对应关系之后,将第一音量和档位的对应关系或者第二音量和档位的对应关系发送至其他智能设备的标识对应的智能设备,从而群组内的其他智能设备均能够根据该第一音量和档位的对应关系或者第二音量和档位的对应关系实现对唤醒延迟时间的确定,进而能够实现在获取到用户发送的唤醒语音时,只有一个智能设备进行响应,提高用户体验。
需要说明的是,上述第一音量和档位的对应关系或者所述第二音量和档位的对应关系可以由智能设备自行生成,也可以由终端设备获取各智能设备对应的音量信息后生成,并发送至各智能设备,本申请对此不做限制。
进一步地,在上述任一实施例的基础上,若根据所述音量信息,查询所述第一音量和档位的对应关系或者所述第二音量和档位的对应关系,未获取到与所述音量对应的档位,则所述方法还包括:
若确定所述音量小于最小音量,则将所述唤醒延迟时间设置为所述最小音量对应的档位对应的唤醒延迟时间与预设延迟时长之和;
或者,
若确定所述音量大于最大音量,则将所述唤醒延迟时间设置为所述最大音量对应的档位对应的唤醒延迟时间;
其中,所述最小音量为所述第一音量和档位的对应关系或者第二音量和档位的对应关系中音量数值范围内最小的音量;
所述最大音量为所述第一音量和档位的对应关系或者第二音量和档位的对应关系中音量数值范围内最大的音量。
在本实施例中,可能会存在如下场景,使得用户发出的唤醒语音对应的音量信息超过了对应关系中最大音量,或者小于对应关系中最小音量,例如:早上在刚起床时,唤醒语音的音量可能比较大,相应地,晚上入睡前,唤醒语音的音量可能较小;或者,若当前有多人聊天的场景下,唤醒语音的音量可能会比较大,而当前只有两个人聊天的场景下,唤醒语音的音量可能较小。又或者,用户由于感冒等造成发音问题等。
基于此,针对上述场景,为了能够使得智能设备获取唤醒延迟时间,以满足在同一区域内多个智能设备存在的情况下,只有且必须有一个智能设备应答,该智能设备还需要执行如下操作:
在确定音量小于最小音量时,将唤醒延迟时间设置为最小音量对应的档位对应的唤醒延迟时间与预设延迟时长之和。
在确定音量大于最大音量时,则将所述唤醒延迟时间设置为所述最大音量对应的档位对应的唤醒延迟时间。
基于该唤醒延迟时间,是否进行应答响应的操作同前述实施例,此处不再赘述。
另外,可选地,在在确定音量大于最大音量时,则将所述唤醒延迟时间设置为所述最大音量对应的档位对应的唤醒延迟时间的同时,还可以进一步设置优先标签,则当该智能设备获取到其他智能设备的唤醒延迟时间时,若存在与之相同的唤醒延迟时间,且仅有该智能设备本身具有优先标签,则可以向与之相同的唤醒延迟时间对应的智能设备发送唤醒延迟时间相同的通知消息,以使得接收唤醒延迟时间相同的通知消息的智能设备停止唤醒操作,并继续监听唤醒语音。或者,智能设备可以将该智能设备的标识、唤醒延迟时间以及优先标签发送给终端设备,由终端设备对接收到的唤醒延迟时间进行判断,并在判断出相同的唤醒延迟时间时,进一步基于优先标签判断哪个智能设备继续保持唤醒延迟时间等待唤醒处理,哪个智能设备停止应答处理。
需要说明的是,该预设唤醒延迟时间可以为用户根据实际需求进行设置,也可以为系统默认经验值,本申请对此不做限制。
本实施例提供的智能设备唤醒方法,通过在获取到的唤醒语音大于最大音量或者小于最小音量时,对唤醒延迟时间进行调节,从而能够保证第一音量和档位的对应关系或者所述第二音量和档位的对应关系能够兼容全部的音量信息,无论用户声音高或低,都能够对用户的唤醒语音进行响应,提高用户体验。
进一步地,在上述任一实施例的基础上,所述方法还包括:
在确定所述唤醒延迟时间与群组内其他智能设备中的至少一个智能设备对应的唤醒延迟时间相同时,分别判断本地优先级级别是否高于所述至少一个智能设备,若均高于,则确定所述唤醒延迟时间内是否获取到所述群组内其他智能设备发送的应答信息;
若低于所述至少一个智能设备,则结束延迟应答操作。
在本实施例中,当用户距离至少一个智能设备的距离相同时,可能至少一个智能设备接收到的唤醒语音的音量信息相同,相应地,对应的唤醒延迟时间也相同;或者,当前唤醒语音对应的音量信息大于第一音量和档位的对应关系或者所述第二音量和档位的对应关系中音量数值范围内最大的音量,将唤醒延迟时间设置为最大音量对应的档位对应的唤醒延迟时间时,也可能会导致至少一个智能设备的接收到的唤醒语音的音量信息相同,相应地,对应的唤醒延迟时间也相同。此时,为了保证在获取到用户唤醒语音时,仅有一个智能设备进行响应,可以分别判断本地优先级级别是否高于至少一个智能设备,若均高于,则确定唤醒延迟时间内是否获取到群组内其他智能设备发送的应答信息,若未获取到其他智能设备的应答信息,则可以响应该唤醒指令发送应答信息;相应地,若低于至少一个智能设备,则结束延迟应答操作,此时,若在唤醒延迟时间内未获取到其他智能设备的应答信息,则优先级较高的智能设备可以响应该唤醒指令发送应答信息。
作为一种可以实施的方式,优先级的设置可以如前述一个实施例中优先标签的设置方式。另外,优先级的设置还可以是:终端设备基于群组内智能设备使用的次数,不同用户偏向于使用哪个智能设备等,来自动对该群组内的智能设备的优先级进行划分。再者,优先级的设置还可以是:基于用户的优先级指示,来对群组内的智能设置的优先级进行划分。
进一步,终端设备还可以将其智能设备对应的优先级级别标识发送给群组内对应的智能设备。智能设备可以保存各自的优先级。则,当智能设备获取唤醒延迟时间后,在获取到其他智能设备的唤醒延迟时间和优先级后,判断有与自身唤醒延迟时间相同的智能设备,则可以进一步比较两者的优先级,优先级高的继续进行延迟应答处理,并向优先级别低的智能设备发送唤醒延迟时间相同的通知消息,以使接收到唤醒延迟时间相同的通知消息的智能设备停止应答处理。因此实现了通过优先级的方式,更为精准,以及更为满足用户使用习惯需求地保证每次接收到用户的唤醒语音时,仅有一个智能设备进行响应。
图8为本申请实施例四提供的智能设备的结构示意图,如图8所示,所述智能设备40包括:唤醒语音获取模块41、唤醒延迟时间确定模块42和应答模块43。其中,唤醒语音获取模块41,用于获取用户发送的唤醒语音;唤醒延迟时间确定模块42,用于在确定当前唤醒模式为群组唤醒模式时,识别获取所述唤醒语音对应的音量信息;并根据所述音量信息,确定唤醒延迟时间;应答模块43,用于在确定所述唤醒延迟时间与群组内其他智能设备对应的唤醒延迟时间不相同,且所述唤醒延迟时间内没有获取到所述群组内其他智能设备发送的应答信息时,在所述唤醒延迟时间结束时,执行唤醒处理,并播放应答信息。
本实施例中的智能设备可以执行上述实施例一所示的方法,其实现方式和技术效果相类似,此处不在赘述。
进一步地,在上述实施例四的基础上,所述装置还包括:
音量档位生成请求获取模块,用于获取终端设备发送的音量档位生成请求;所述音量档位生成请求包括:群组标识,所述群组标识下智能设备的数量信息,以及所述群组标识下其他智能设备的标识;
音量信息获取模块,用于根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的音量信息;
第一对应关系生成模块,用于根据所述其他智能设备的标识对应的音量信息,以及所述群组标识下智能设备的数量信息,生成第一音量和档位的对应关系。
本实施例中的智能设备可以执行上述实施例二所示的方法,其实现方式和技术效果相类似,此处不在赘述。
进一步地,在上述实施例四的基础上,所述装置还包括:
音纹识别模块,用于识别获取所述唤醒语音对应的音纹信息;
则音量信息获取模块包括:
音量获取单元,用于根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的智能设备中与所述音纹信息对应的音量信息;
则所述装置还包括:
第二对应关系生成模块,用于根据所述其他智能设备的标识对应的智能设备中与所述音纹信息对应的音量信息,以及所述群组标识下智能设备的数量信息,生成第二音量和档位的对应关系。
本实施例中的智能设备可以执行上述实施例三所示的方法,其实现方式和技术效果相类似,此处不在赘述。
进一步地,在上述任一实施例的基础上,所述装置还包括:
更新模块,用于将所述第一音量和档位的对应关系或者第二音量和档位的对应关系发送给所述其他智能设备的标识对应的智能设备,以使所述其他智能设备根据所述第一音量和档位的对应关系或者第二音量和档位的对应关系,进行更新处理。
进一步地,在上述任一实施例的基础上,所述唤醒延迟时间确定模块42包括:
第一档位获取单元,用于根据所述音量信息,查询所述第一音量和档位的对应关系,获取与所述音量信息对应的档位;
唤醒延迟时间确定单元,用于根据所述档位,确定所述唤醒延迟时间。
进一步地,在上述任一实施例的基础上,所述装置还包括:
对应关系获取单元,用于根据所述音纹信息,获取与所述音纹信息对应的第二音量和档位的对应关系;
第二档位获取单元,用于根据所述音量信息,查询所述第二音量和档位的对应关系,获取与所述音量信息对应的档位;
唤醒延迟时间确定单元,用于根据所述档位,确定所述唤醒延迟时间。
进一步地,在上述任一实施例的基础上,所述唤醒延迟时间确定单元具体用于:
根据所述档位,采用公式:
T=档位*(K+D)
获取所述唤醒延迟时间T;
其中,K表示设备内语音处理延迟时长,D表示语音传播时长。
进一步地,在上述任一实施例的基础上,若根据所述音量信息,查询所述第一音量和档位的对应关系或者所述第二音量和档位的对应关系,未获取到与所述音量对应的档位,则所述装置还包括:
第一调整模块,用于若确定所述音量小于最小音量,则将所述唤醒延迟时间设置为所述最小音量对应的档位对应的唤醒延迟时间与预设延迟时长之和;
或者,
第二调整模块,用于若确定所述音量大于最大音量,则将所述唤醒延迟时间设置为所述最大音量对应的档位对应的唤醒延迟时间;
其中,所述最小音量为所述第一音量和档位的对应关系或者第二音量和档位的对应关系中音量数值范围内最小的音量;
所述最大音量为所述第一音量和档位的对应关系或者第二音量和档位的对应关系中音量数值范围内最大的音量。
进一步地,在上述任一实施例的基础上,所述装置还包括:
优先级判断模块,用于在确定所述唤醒延迟时间与群组内其他智能设备中的至少一个智能设备对应的唤醒延迟时间相同时,分别判断本地优先级级别是否高于所述至少一个智能设备,若均高于,则确定所述唤醒延迟时间内是否获取到所述群组内其他智能设备发送的应答信息;
处理模块,用于若低于所述至少一个智能设备,则结束延迟应答操作。
根据本申请的实施例,本申请还提供了一种智能设备和一种可读存储介质。
如图9所示,是根据本申请实施例的智能设备唤醒方法的智能设备的框图。智能设备旨在表示各种形式的能够进行人机交互的设备,例如智能音箱、智能机器人等。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图9所示,该智能设备包括:一个或多个处理器901、存储器902,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在智能设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个智能设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。
存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的智能设备唤醒方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的智能设备唤醒方法。
存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的智能设备唤醒方法对应的程序指令/模块(例如,附图8所示的唤醒语音获取模块41、延迟时间确定模块42和应答模块43)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的智能设备唤醒方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据智能设备的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至智能设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
智能设备唤醒方法的智能设备还可以包括:输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。
输入装置903可接收输入的数字或字符信息,以及产生与智能设备唤醒方法智能设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
图10为本发明实施例六提供的智能设备唤醒方法的流程示意图,如图10所示,所述方法包括:
步骤601、获取用户发送的唤醒语音;
步骤602、获取所述唤醒语音对应的音量信息;并根据所述音量信息,确定唤醒延迟时间;
步骤603、根据所述唤醒延迟时间,执行唤醒处理,并播放应答信息。
本实施例提供的智能设备唤醒方法、智能设备及计算机可读存储介质,通过根据音量信息确定相应唤醒延迟时间,根据唤醒延迟时间确定是否对唤醒语音进行响应,从而能够保证每次用户发出唤醒语音时,只有一个智能设备进行响应,避免了多个智能设备同时响应的问题,提高用户体验。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (20)
1.一种智能设备唤醒方法,其特征在于,包括:
获取用户发送的唤醒语音;
在确定当前唤醒模式为群组唤醒模式时,识别获取所述唤醒语音对应的音量信息;并根据预先设置的音量档位对应关系和所述音量信息,确定所述音量信息对应的档位,根据所述档位,确定所述唤醒语音对应的唤醒延迟时间;
在确定所述唤醒延迟时间与群组内其他智能设备对应的唤醒延迟时间不相同,且所述唤醒延迟时间内没有获取到所述群组内其他智能设备发送的应答信息时,在所述唤醒延迟时间结束时,执行唤醒处理,并播放应答信息。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取终端设备发送的音量档位生成请求;所述音量档位生成请求包括:群组标识,所述群组标识下智能设备的数量信息,以及所述群组标识下其他智能设备的标识;
根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的音量信息;
根据所述其他智能设备的标识对应的音量信息,以及所述群组标识下智能设备的数量信息,生成第一音量和档位的对应关系。
3.根据权利要求2所述的方法,其特征在于,还包括:
识别获取所述唤醒语音对应的音纹信息;
则所述根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的音量信息,包括:
根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的智能设备中与所述音纹信息对应的音量信息;
则所述方法还包括:
根据所述其他智能设备的标识对应的智能设备中与所述音纹信息对应的音量信息,以及所述群组标识下智能设备的数量信息,生成第二音量和档位的对应关系。
4.根据权利要求2或3所述的方法,其特征在于,还包括:
将所述第一音量和档位的对应关系或者第二音量和档位的对应关系发送给所述其他智能设备的标识对应的智能设备,以使所述其他智能设备根据所述第一音量和档位的对应关系或者第二音量和档位的对应关系,进行更新处理。
5.根据权利要求2所述的方法,其特征在于,所述根据预先设置的音量档位对应关系和所述音量信息,确定所述音量信息对应的档位,根据所述档位,确定所述唤醒语音对应的唤醒延迟时间,包括:
根据所述音量信息,查询所述第一音量和档位的对应关系,获取与所述音量信息对应的档位;
根据所述档位,确定所述唤醒延迟时间。
6.根据权利要求3所述的方法,其特征在于,所述根据预先设置的音量档位对应关系和所述音量信息,确定所述音量信息对应的档位,根据所述档位,确定所述唤醒语音对应的唤醒延迟时间,包括:
根据所述音纹信息,获取与所述音纹信息对应的第二音量和档位的对应关系;
根据所述音量信息,查询所述第二音量和档位的对应关系,获取与所述音量信息对应的档位;
根据所述档位,确定所述唤醒延迟时间。
7.根据权利要求5或6所述的方法,其特征在于,所述根据所述档位,确定所述唤醒延迟时间,包括:
根据所述档位,采用公式:
T=档位*(K+D)
获取所述唤醒延迟时间T;
其中,K表示设备内语音处理延迟时长,D表示语音传播时长。
8.根据权利要求5或6所述的方法,其特征在于,若根据所述音量信息,查询所述第一音量和档位的对应关系或者第二音量和档位的对应关系,未获取到与所述音量对应的档位,则所述方法还包括:
若确定所述音量小于最小音量,则将所述唤醒延迟时间设置为所述最小音量对应的档位对应的唤醒延迟时间与预设延迟时长之和;
或者,
若确定所述音量大于最大音量,则将所述唤醒延迟时间设置为所述最大音量对应的档位对应的唤醒延迟时间;
其中,所述最小音量为所述第一音量和档位的对应关系或者第二音量和档位的对应关系中音量数值范围内最小的音量;
所述最大音量为所述第一音量和档位的对应关系或者第二音量和档位的对应关系中音量数值范围内最大的音量。
9.根据权利要求1所述的方法,其特征在于,还包括:
在确定所述唤醒延迟时间与群组内其他智能设备中的至少一个智能设备对应的唤醒延迟时间相同时,分别判断本地优先级级别是否高于所述至少一个智能设备,若均高于,则确定所述唤醒延迟时间内是否获取到所述群组内其他智能设备发送的应答信息;
若低于所述至少一个智能设备,则结束延迟应答操作。
10.一种智能设备,其特征在于,包括:
唤醒语音获取模块,用于获取用户发送的唤醒语音;
唤醒延迟时间确定模块,用于在确定当前唤醒模式为群组唤醒模式时,识别获取所述唤醒语音对应的音量信息;并根据预先设置的音量档位对应关系和所述音量信息,确定所述音量信息对应的档位,根据所述档位,确定所述唤醒语音对应的唤醒延迟时间;
应答模块,用于在确定所述唤醒延迟时间与群组内其他智能设备对应的唤醒延迟时间不相同,且所述唤醒延迟时间内没有获取到所述群组内其他智能设备发送的应答信息时,在所述唤醒延迟时间结束时,执行唤醒处理,并播放应答信息。
11.根据权利要求10所述的智能设备,其特征在于,所述智能设备还包括:
音量档位生成请求获取模块,用于获取终端设备发送的音量档位生成请求;所述音量档位生成请求包括:群组标识,所述群组标识下智能设备的数量信息,以及所述群组标识下其他智能设备的标识;
音量信息获取模块,用于根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的音量信息;
第一对应关系生成模块,用于根据所述其他智能设备的标识对应的音量信息,以及所述群组标识下智能设备的数量信息,生成第一音量和档位的对应关系。
12.根据权利要求11所述的智能设备,其特征在于,所述智能设备还包括:
音纹识别模块,用于识别获取所述唤醒语音对应的音纹信息;
则音量信息获取模块包括:
音量获取单元,用于根据所述音量档位生成请求,分别获取所述其他智能设备的标识对应的智能设备中与所述音纹信息对应的音量信息;
则所述智能设备还包括:
第二对应关系生成模块,用于根据所述其他智能设备的标识对应的智能设备中与所述音纹信息对应的音量信息,以及所述群组标识下智能设备的数量信息,生成第二音量和档位的对应关系。
13.根据权利要求11或12所述的智能设备,其特征在于,所述智能设备还包括:
更新模块,用于将所述第一音量和档位的对应关系或者第二音量和档位的对应关系发送给所述其他智能设备的标识对应的智能设备,以使所述其他智能设备根据所述第一音量和档位的对应关系或者第二音量和档位的对应关系,进行更新处理。
14.根据权利要求11所述的智能设备,其特征在于,所述唤醒延迟时间确定模块包括:
第一档位获取单元,用于根据所述音量信息,查询所述第一音量和档位的对应关系,获取与所述音量信息对应的档位;
唤醒延迟时间确定单元,用于根据所述档位,确定所述唤醒延迟时间。
15.根据权利要求12所述的智能设备,其特征在于,所述唤醒延迟时间确定模块包括:
对应关系获取单元,用于根据所述音纹信息,获取与所述音纹信息对应的第二音量和档位的对应关系;
第二档位获取单元,用于根据所述音量信息,查询所述第二音量和档位的对应关系,获取与所述音量信息对应的档位;
唤醒延迟时间确定单元,用于根据所述档位,确定所述唤醒延迟时间。
16.根据权利要求14或15所述的智能设备,其特征在于,所述唤醒延迟时间确定单元具体用于:
根据所述档位,采用公式:
T=档位*(K+D)
获取所述唤醒延迟时间T;
其中,K表示设备内语音处理延迟时长,D表示语音传播时长。
17.根据权利要求14或15所述的智能设备,其特征在于,若根据所述音量信息,查询所述第一音量和档位的对应关系或者第二音量和档位的对应关系,未获取到与所述音量对应的档位,则所述智能设备还包括:
第一调整模块,用于若确定所述音量小于最小音量,则将所述唤醒延迟时间设置为所述最小音量对应的档位对应的唤醒延迟时间与预设延迟时长之和;
或者,
第二调整模块,用于若确定所述音量大于最大音量,则将所述唤醒延迟时间设置为所述最大音量对应的档位对应的唤醒延迟时间;
其中,所述最小音量为所述第一音量和档位的对应关系或者第二音量和档位的对应关系中音量数值范围内最小的音量;
所述最大音量为所述第一音量和档位的对应关系或者第二音量和档位的对应关系中音量数值范围内最大的音量。
18.一种智能设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的智能设备唤醒方法。
19.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的智能设备唤醒方法。
20.一种智能设备唤醒方法,其特征在于,包括:
获取用户发送的唤醒语音;
获取所述唤醒语音对应的音量信息;并根据预先设置的音量档位对应关系和所述音量信息,确定所述音量信息对应的档位,根据所述档位,确定所述唤醒语音对应的唤醒延迟时间;
在确定所述唤醒延迟时间与群组内其他智能设备对应的唤醒延迟时间不相同,且所述唤醒延迟时间内没有获取到所述群组内其他智能设备发送的应答信息时,在所述唤醒延迟时间结束时,执行唤醒处理,并播放应答信息。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910877529.4A CN110660390B (zh) | 2019-09-17 | 2019-09-17 | 智能设备唤醒方法、智能设备及计算机可读存储介质 |
JP2020028535A JP6965384B2 (ja) | 2019-09-17 | 2020-02-21 | スマート機器ウェイクアップ方法、スマート機器、及びコンピュータ可読記憶媒体 |
US16/838,218 US11330521B2 (en) | 2019-09-17 | 2020-04-02 | Method for waking up intelligent device in group wake-up mode, intelligent device and computer-readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910877529.4A CN110660390B (zh) | 2019-09-17 | 2019-09-17 | 智能设备唤醒方法、智能设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110660390A CN110660390A (zh) | 2020-01-07 |
CN110660390B true CN110660390B (zh) | 2022-05-03 |
Family
ID=69037242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910877529.4A Active CN110660390B (zh) | 2019-09-17 | 2019-09-17 | 智能设备唤醒方法、智能设备及计算机可读存储介质 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11330521B2 (zh) |
JP (1) | JP6965384B2 (zh) |
CN (1) | CN110660390B (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112732340B (zh) * | 2019-10-14 | 2022-03-15 | 思必驰科技股份有限公司 | 人机对话处理方法及装置 |
CN111276139B (zh) * | 2020-01-07 | 2023-09-19 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法及装置 |
CN111917616A (zh) * | 2020-06-30 | 2020-11-10 | 星络智能科技有限公司 | 语音唤醒控制方法、设备、系统、计算机设备及存储介质 |
CN111916079A (zh) * | 2020-08-03 | 2020-11-10 | 深圳创维-Rgb电子有限公司 | 一种电子设备的语音响应方法、系统、设备和存储介质 |
CN112133302B (zh) * | 2020-08-26 | 2024-05-07 | 北京小米松果电子有限公司 | 预唤醒终端的方法、装置及存储介质 |
CN112017640B (zh) * | 2020-09-17 | 2024-03-26 | 北京小米松果电子有限公司 | 唤醒决策方法、装置、电子设备及存储介质 |
CN112260787B (zh) * | 2020-10-09 | 2024-03-01 | 北京小米松果电子有限公司 | 设备时延调整方法及装置、电子设备及存储介质 |
CN112241249A (zh) * | 2020-10-21 | 2021-01-19 | 北京小米松果电子有限公司 | 确定唤醒时延的方法、装置、存储介质及终端设备 |
CN112968783B (zh) * | 2021-01-20 | 2022-08-05 | 广州技象科技有限公司 | 基于发送数据的低功耗处理方法及装置 |
CN113160814B (zh) * | 2021-04-09 | 2022-09-09 | 深圳市腾远智拓电子有限公司 | 一种基于fpga的无线组网传输系统 |
CN113450791B (zh) * | 2021-04-28 | 2023-08-04 | 珠海格力电器股份有限公司 | 一种语音设备控制方法、装置、存储介质及语音设备 |
CN113314115B (zh) * | 2021-05-28 | 2024-08-23 | 深圳创维-Rgb电子有限公司 | 终端设备的语音处理方法、终端设备及可读存储介质 |
CN113506570A (zh) * | 2021-06-11 | 2021-10-15 | 杭州控客信息技术有限公司 | 全屋智能系统中语音设备就近唤醒方法 |
CN113593548B (zh) * | 2021-06-29 | 2023-12-19 | 青岛海尔科技有限公司 | 智能设备的唤醒方法和装置、存储介质及电子装置 |
EP4409571A1 (en) * | 2021-09-30 | 2024-08-07 | Sonos Inc. | Conflict management for wake-word detection processes |
CN113891440B (zh) * | 2021-10-21 | 2024-04-09 | 北京小米移动软件有限公司 | 设备应答控制方法、设备应答控制装置及存储介质 |
CN114296812A (zh) * | 2021-12-31 | 2022-04-08 | 杭州萤石软件有限公司 | 设备唤醒方法、装置、设备及存储介质 |
CN116546439B (zh) * | 2022-01-26 | 2024-01-30 | 汉朔科技股份有限公司 | 电子货架标签快速唤醒并发送群组消息的方法及系统 |
CN114553625B (zh) * | 2022-02-17 | 2024-03-22 | 青岛海尔科技有限公司 | 响应设备的确定方法和装置、存储介质及电子装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3007165B1 (en) * | 2013-05-31 | 2018-08-01 | Yamaha Corporation | Technology for responding to remarks using speech synthesis |
CA2932638C (en) * | 2013-12-19 | 2021-06-08 | The Procter & Gamble Company | Sanitary tissue products |
US9424841B2 (en) * | 2014-10-09 | 2016-08-23 | Google Inc. | Hotword detection on multiple devices |
US9318107B1 (en) * | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
CN106328132A (zh) * | 2016-08-15 | 2017-01-11 | 歌尔股份有限公司 | 一种智能设备的语音交互控制方法和装置 |
US9972320B2 (en) * | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
KR20180085931A (ko) * | 2017-01-20 | 2018-07-30 | 삼성전자주식회사 | 음성 입력 처리 방법 및 이를 지원하는 전자 장치 |
KR102392297B1 (ko) * | 2017-04-24 | 2022-05-02 | 엘지전자 주식회사 | 전자기기 |
CN109429314A (zh) * | 2017-08-25 | 2019-03-05 | 华为技术有限公司 | 无线网络中wur终端的唤醒方法及装置 |
CN107919119A (zh) * | 2017-11-16 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 多设备交互协同的方法、装置、设备及计算机可读介质 |
US10923101B2 (en) * | 2017-12-26 | 2021-02-16 | International Business Machines Corporation | Pausing synthesized speech output from a voice-controlled device |
CN108966077A (zh) * | 2018-06-19 | 2018-12-07 | 四川斐讯信息技术有限公司 | 一种音箱音量的控制方法及系统 |
KR20200015267A (ko) * | 2018-08-03 | 2020-02-12 | 삼성전자주식회사 | 음성 인식을 수행할 전자 장치를 결정하는 전자 장치 및 전자 장치의 동작 방법 |
CN109391528A (zh) * | 2018-08-31 | 2019-02-26 | 百度在线网络技术(北京)有限公司 | 语音智能设备的唤醒方法、装置、设备及存储介质 |
US10909983B1 (en) * | 2018-09-18 | 2021-02-02 | Amazon Technologies, Inc. | Target-device resolution |
CN109920416A (zh) * | 2019-01-29 | 2019-06-21 | 珠海格力电器股份有限公司 | 一种语音控制方法、装置、存储介质及控制系统 |
-
2019
- 2019-09-17 CN CN201910877529.4A patent/CN110660390B/zh active Active
-
2020
- 2020-02-21 JP JP2020028535A patent/JP6965384B2/ja active Active
- 2020-04-02 US US16/838,218 patent/US11330521B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN110660390A (zh) | 2020-01-07 |
JP2021047393A (ja) | 2021-03-25 |
JP6965384B2 (ja) | 2021-11-10 |
US11330521B2 (en) | 2022-05-10 |
US20210084589A1 (en) | 2021-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110660390B (zh) | 智能设备唤醒方法、智能设备及计算机可读存储介质 | |
CN111276139B (zh) | 语音唤醒方法及装置 | |
CN105122353A (zh) | 用于虚拟个人助理系统的自然人-计算机交互 | |
CN111192591A (zh) | 智能设备的唤醒方法、装置、智能音箱及存储介质 | |
CN110501918B (zh) | 智能家电控制方法、装置、电子设备和存储介质 | |
CN111688580B (zh) | 智能后视镜进行拾音的方法以及装置 | |
CN112530419B (zh) | 语音识别控制方法、装置、电子设备和可读存储介质 | |
CN112836072B (zh) | 信息展示方法及装置、电子设备和介质 | |
CN111261159A (zh) | 信息指示的方法及装置 | |
CN111883127A (zh) | 用于处理语音的方法和装置 | |
CN112466296A (zh) | 语音交互的处理方法、装置、电子设备及存储介质 | |
CN111443801A (zh) | 人机交互方法、装置、设备及存储介质 | |
CN112581945A (zh) | 语音控制方法、装置、电子设备和可读存储介质 | |
CN112652304B (zh) | 智能设备的语音交互方法、装置和电子设备 | |
CN112382292A (zh) | 基于语音的控制方法和装置 | |
KR20210037501A (ko) | 스마트 기기를 제어하는 방법, 장치, 기기 및 매체 | |
CN111986682A (zh) | 语音交互方法、装置、设备以及存储介质 | |
CN114647703A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN111652344A (zh) | 用于呈现信息的方法和装置 | |
CN112037794A (zh) | 语音交互方法、装置、设备以及存储介质 | |
CN112329907A (zh) | 对话处理方法、装置、电子设备和存储介质 | |
CN111627441A (zh) | 电子设备的控制方法、装置、设备和存储介质 | |
CN112579032A (zh) | 智能设备引导的方法及装置 | |
CN111880875B (zh) | 多媒体播放的控制方法、装置、设备、存储介质和系统 | |
CN112037786B (zh) | 语音交互方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210514 Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing Applicant after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd. Applicant after: Shanghai Xiaodu Technology Co.,Ltd. Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |