KR102429260B1 - 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치 - Google Patents
음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치 Download PDFInfo
- Publication number
- KR102429260B1 KR102429260B1 KR1020150142427A KR20150142427A KR102429260B1 KR 102429260 B1 KR102429260 B1 KR 102429260B1 KR 1020150142427 A KR1020150142427 A KR 1020150142427A KR 20150142427 A KR20150142427 A KR 20150142427A KR 102429260 B1 KR102429260 B1 KR 102429260B1
- Authority
- KR
- South Korea
- Prior art keywords
- control command
- command
- control
- voice
- agent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 89
- 238000000034 method Methods 0.000 title claims description 18
- 238000004891 communication Methods 0.000 claims description 27
- 238000005516 engineering process Methods 0.000 claims description 11
- 238000003672 processing method Methods 0.000 claims description 5
- 230000010354 integration Effects 0.000 description 19
- 230000003993 interaction Effects 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/2821—Avoiding conflicts related to the use of home appliances
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
- Selective Calling Equipment (AREA)
Abstract
Description
도 2a 내지 도 2d는 도 1의 명령 실행부(120)의 실시예들을 도시한 블록도이다.
도 3a 내지 도 3b는 일 실시예에 따른 제어 명령 처리 방법의 흐름도이다.
도 4는 다른 실시예에 따른 제어 명령 처리 방법의 흐름도이다.
도 5 내지 도 10은 제어 명령 처리 기술이 적용된 네트워크 제어 시스템의 실시예들을 도시한 것이다.
120: 명령 실행부 121: 명령 통합부
122: 최종 명령 결정부 1,2,3,4,5,6: 네트워크 제어 시스템
500: 에이전트 장치 510: 음성 에이전트
520: 통신부 600: 제어 명령 처리 장치
610: 명령 태깅부 620: 명령 실행부
700: 제어 장치 710: 제어 명령 수신부
720: 제어부 800: 전자 장치
810: 통신부 820: 동작 수행부
Claims (24)
- 음성 에이전트(Voice Agent) 기반의 전자 장치의 제어 명령을 처리하는 장치에 있어서,
통신모듈; 및
프로세서를 포함하고, 상기 프로세서는:
상기 통신모듈을 통하여 복수의 음성 에이전트들 각각으로부터 복수의 제어 명령을 수신하고,
상기 복수의 제어 명령 각각에 추가 정보를 태깅하며,
상기 복수의 제어 명령 각각에 태깅된 상기 추가 정보를 기초로, 상기 복수의 제어 명령을 하나 이상의 클러스터를 통해 하나의 제어 명령으로 통합하고,
상기 하나의 제어 명령을 상기 통신모듈을 통하여 상기 전자 장치로 제공하도록 설정된, 제어 명령 처리 장치. - 제1항에 있어서,
상기 복수의 제어 명령은 사용자가 입력한 음성 그 자체이거나, 상기 사용자가 입력한 음성을 음성 인식 기술을 통해 변환한 텍스트 형태인 제어 명령 처리 장치. - 제1항에 있어서,
상기 추가 정보는
사용자가 상기 복수의 제어 명령에 관한 음성을 발화한 시간, 상기 복수의 음성 에이전트로부터 상기 복수의 제어 명령을 수신한 시간, 상기 복수의 제어 명령에 관한 음성의 인식 정확도, 상기 음성의 신호의 세기, 상기 복수의 제어 명령의 길이, 상기 복수의 제어 명령에서 추출된 해시값, 특성값, 상기 사용자의 정보, 상기 복수의 음성 에이전트 장치의 정보 및, 상기 전자 장치의 정보 중의 하나 이상을 포함하는 제어 명령 처리 장치. - 삭제
- 제1항에 있어서,
상기 프로세서는
상기 복수의 제어 명령 상호 간의 유사도를 산출하고, 산출된 유사도 및 상기 태깅된 정보를 기초로 상기 복수의 제어 명령을 하나 이상의 클러스터로 통합하도록 설정된, 제어 명령 처리 장치. - 제1항에 있어서,
상기 프로세서는
상기 하나 이상의 클러스터 각각에 대하여, 클러스터의 중심(centroid)에 해당하는 제어 명령을 상기 하나의 제어 명령으로 결정하도록 설정된, 제어 명령 처리 장치. - 제1항에 있어서,
상기 프로세서는
상기 하나 이상의 클러스터에 중복 명령이 존재하면, 사용자에게 중복 명령의 처리에 관한 질의를 수행하고,
상기 질의 수행 결과를 기초로 상기 하나의 제어 명령을 결정하도록 설정된, 제어 명령 처리 장치. - 제1항에 있어서,
상기 프로세서는
상기 복수의 음성 에이전트 중에서 사용자와 인터랙션을 수행할 음성 에이전트를 선정하도록 설정된, 제어 명령 처리 장치. - 음성 에이전트(Voice Agent) 기반의 전자 장치의 제어 명령을 처리하는 방법에 있어서,
통신모듈을 통하여 복수의 음성 에이전트들 각각으로부터 복수의 제어 명령을 수신하는 단계;
상기 복수의 제어 명령 각각에 추가 정보를 태깅하는 단계;
상기 복수의 제어 명령 각각에 태깅된 추가 정보를 기초로, 상기 복수의 제어 명령을 하나 이상의 클러스터를 통해 하나의 제어 명령으로 통합하는 단계; 및
상기 하나의 제어 명령을 상기 통신모듈을 통하여 상기 전자 장치로 제공하는 단계를 포함하는 제어 명령 처리 방법. - 삭제
- 제9항에 있어서,
상기 하나의 제어 명령으로 통합하는 단계는
상기 복수의 제어 명령 상호 간의 유사도를 산출하는 단계를 포함하고, 상기 산출된 유사도 및 상기 추가 정보를 기초로 통합하는 제어 명령 처리 방법. - 제9항에 있어서,
상기 하나의 제어 명령으로 통합하는 단계는
상기 하나 이상의 클러스터 각각에 대하여, 클러스터의 중심(centroid)에 해당하는 명령을 상기 하나의 제어 명령으로 결정하는 제어 명령 처리 방법. - 제9항에 있어서,
상기 하나의 제어 명령으로 통합하는 단계는
상기 하나 이상의 클러스터에 중복 명령이 존재하면, 사용자에게 중복 명령의 처리에 관한 질의를 수행하고,
상기 질의 수행 결과를 기초로 상기 하나의 제어 명령을 결정하는 제어 명령 처리 방법. - 제9항에 있어서,
상기 하나의 제어 명령으로 통합하는 단계는
상기 복수의 음성 에이전트 중에서 사용자와 인터랙션을 수행할 음성 에이전트를 선정하는 단계를 더 포함하는 제어 명령 처리 방법. - 음성 에이전트(Voice Agent) 기반의 전자 장치의 제어 명령을 처리하는 장치에 있어서,
통신모듈; 및
프로세서를 포함하고, 상기 프로세서는:
상기 통신모듈을 통하여 음성 에이전트로부터 상기 전자 장치의 제어 명령을 수신하고,
상기 수신한 제어 명령에 추가 정보를 태깅하며,
상기 수신한 제어 명령에 태깅된 추가 정보를 기초로 상기 수신한 제어 명령과 상기 전자 장치에 대해 기 실행중인 제어 명령이 서로 충돌하는지 여부를 판단하고,
상기 수신한 제어 명령과 상기 기 실행중인 제어 명령이 충돌하는 경우, 상기 수신한 제어 명령의 제공을 유예하도록 결정하고,
상기 수신한 제어 명령과 상기 기 실행중인 제어 명령이 충돌하지 않는 경우, 상기 수신한 제어 명령을 상기 통신모듈을 통하여 상기 전자 장치로 제공하도록 설정된, 제어 명령 처리 장치. - 삭제
- 제15항에 있어서,
전자 장치별로 기 실행중인 제어 명령을 저장하는 명령 DB를 더 포함하고,
상기 프로세서는
상기 명령 DB로부터 상기 전자 장치에 대하여 기 실행중인 제어 명령을 검출하는 제어 명령 처리 장치. - 제15항에 있어서,
상기 프로세서는
상기 판단의 결과 상기 수신한 제어 명령과 상기 기 실행중인 제어 명령이 충돌하는 경우, 사용자에게 충돌된 명령의 처리에 관한 질의를 수행하고,
상기 질의 수행 결과를 기초로 상기 수신한 제어 명령의 제공을 유예하거나 또는 상기 수신한 제어 명령을 상기 통신 모듈을 통하여 상기 전자 장치로 제공하도록 설정된 제어 명령 처리 장치. - 제15항에 있어서,
음성 에이전트 선정을 위한 정책을 저장하는 정책 DB를 더 포함하고,
상기 프로세서는
상기 정책 DB를 참고하여 사용자와 인터랙션을 수행할 음성 에이전트를 선정하도록 설정된 제어 명령 처리 장치. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150142427A KR102429260B1 (ko) | 2015-10-12 | 2015-10-12 | 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치 |
US15/270,382 US10607605B2 (en) | 2015-10-12 | 2016-09-20 | Apparatus and method for processing control command based on voice agent, and agent device |
CN201610874212.1A CN106571141B (zh) | 2015-10-12 | 2016-09-30 | 处理基于语音代理的控制命令的设备和方法及代理器装置 |
EP16193347.8A EP3157007B1 (en) | 2015-10-12 | 2016-10-11 | Processing of control commands for an electronic device |
JP2016199885A JP2017076393A (ja) | 2015-10-12 | 2016-10-11 | 音声エージェントに基づく制御命令処理装置及び方法、並びにエージェント装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150142427A KR102429260B1 (ko) | 2015-10-12 | 2015-10-12 | 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170043055A KR20170043055A (ko) | 2017-04-20 |
KR102429260B1 true KR102429260B1 (ko) | 2022-08-05 |
Family
ID=57189780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150142427A Active KR102429260B1 (ko) | 2015-10-12 | 2015-10-12 | 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10607605B2 (ko) |
EP (1) | EP3157007B1 (ko) |
JP (1) | JP2017076393A (ko) |
KR (1) | KR102429260B1 (ko) |
CN (1) | CN106571141B (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2025023436A1 (ko) * | 2023-07-21 | 2025-01-30 | 삼성전자주식회사 | 인공지능 에이전트를 포함하는 전자 장치 및 인공지능 에이전트의 동작 방법 |
Families Citing this family (106)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10273678B2 (en) | 2014-12-19 | 2019-04-30 | Simpson Strong-Tie Company, Inc. | Column cap |
US10074364B1 (en) * | 2016-02-02 | 2018-09-11 | Amazon Technologies, Inc. | Sound profile generation based on speech recognition results exceeding a threshold |
US9965247B2 (en) | 2016-02-22 | 2018-05-08 | Sonos, Inc. | Voice controlled media playback system based on user profile |
US10095470B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Audio response playback |
US10097939B2 (en) | 2016-02-22 | 2018-10-09 | Sonos, Inc. | Compensation for speaker nonlinearities |
US10264030B2 (en) | 2016-02-22 | 2019-04-16 | Sonos, Inc. | Networked microphone device control |
US9947316B2 (en) | 2016-02-22 | 2018-04-17 | Sonos, Inc. | Voice control of a media playback system |
US9826306B2 (en) | 2016-02-22 | 2017-11-21 | Sonos, Inc. | Default playback device designation |
US9811314B2 (en) | 2016-02-22 | 2017-11-07 | Sonos, Inc. | Metadata exchange involving a networked playback system and a networked microphone system |
US9978390B2 (en) | 2016-06-09 | 2018-05-22 | Sonos, Inc. | Dynamic player selection for audio signal processing |
US10152969B2 (en) | 2016-07-15 | 2018-12-11 | Sonos, Inc. | Voice detection by multiple devices |
US10134399B2 (en) | 2016-07-15 | 2018-11-20 | Sonos, Inc. | Contextualization of voice inputs |
US10115400B2 (en) | 2016-08-05 | 2018-10-30 | Sonos, Inc. | Multiple voice services |
US9693164B1 (en) | 2016-08-05 | 2017-06-27 | Sonos, Inc. | Determining direction of networked microphone device relative to audio playback device |
US9794720B1 (en) | 2016-09-22 | 2017-10-17 | Sonos, Inc. | Acoustic position measurement |
US9942678B1 (en) | 2016-09-27 | 2018-04-10 | Sonos, Inc. | Audio playback settings for voice interaction |
US9743204B1 (en) | 2016-09-30 | 2017-08-22 | Sonos, Inc. | Multi-orientation playback device microphones |
US10181323B2 (en) | 2016-10-19 | 2019-01-15 | Sonos, Inc. | Arbitration-based voice recognition |
KR20180060328A (ko) | 2016-11-28 | 2018-06-07 | 삼성전자주식회사 | 멀티 모달 입력을 처리하는 전자 장치, 멀티 모달 입력을 처리하는 방법 및 멀티 모달 입력을 처리하는 서버 |
US11183181B2 (en) | 2017-03-27 | 2021-11-23 | Sonos, Inc. | Systems and methods of multiple voice services |
JP2018167339A (ja) * | 2017-03-29 | 2018-11-01 | 富士通株式会社 | 発話制御プログラム、情報処理装置及び発話制御方法 |
US10552204B2 (en) * | 2017-07-07 | 2020-02-04 | Google Llc | Invoking an automated assistant to perform multiple tasks through an individual command |
US10475449B2 (en) | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US20190065608A1 (en) * | 2017-08-29 | 2019-02-28 | Lenovo (Singapore) Pte. Ltd. | Query input received at more than one device |
US10048930B1 (en) | 2017-09-08 | 2018-08-14 | Sonos, Inc. | Dynamic computation of system response volume |
US10531157B1 (en) * | 2017-09-21 | 2020-01-07 | Amazon Technologies, Inc. | Presentation and management of audio and visual content across devices |
US10446165B2 (en) | 2017-09-27 | 2019-10-15 | Sonos, Inc. | Robust short-time fourier transform acoustic echo cancellation during audio playback |
US10482868B2 (en) | 2017-09-28 | 2019-11-19 | Sonos, Inc. | Multi-channel acoustic echo cancellation |
US10621981B2 (en) | 2017-09-28 | 2020-04-14 | Sonos, Inc. | Tone interference cancellation |
US10051366B1 (en) | 2017-09-28 | 2018-08-14 | Sonos, Inc. | Three-dimensional beam forming with a microphone array |
US10466962B2 (en) | 2017-09-29 | 2019-11-05 | Sonos, Inc. | Media playback system with voice assistance |
CN107808669B (zh) * | 2017-09-30 | 2021-07-06 | 深圳市艾特智能科技有限公司 | 语音控制方法、智能家居系统、存储介质和计算机设备 |
TWI661319B (zh) * | 2017-11-30 | 2019-06-01 | 財團法人資訊工業策進會 | 根據文本產生控制指令之裝置、方法及其電腦程式產品 |
US10880650B2 (en) | 2017-12-10 | 2020-12-29 | Sonos, Inc. | Network microphone devices with automatic do not disturb actuation capabilities |
US10818290B2 (en) | 2017-12-11 | 2020-10-27 | Sonos, Inc. | Home graph |
CN108257596B (zh) * | 2017-12-22 | 2021-07-23 | 北京小蓦机器人技术有限公司 | 一种用于提供目标呈现信息的方法与设备 |
CN108231075A (zh) * | 2017-12-29 | 2018-06-29 | 北京视觉世界科技有限公司 | 清洁设备的控制方法、装置、设备和存储介质 |
TWI651966B (zh) * | 2017-12-29 | 2019-02-21 | 瑞軒科技股份有限公司 | 影音控制系統 |
US11343614B2 (en) | 2018-01-31 | 2022-05-24 | Sonos, Inc. | Device designation of playback and network microphone device arrangements |
KR102515023B1 (ko) | 2018-02-23 | 2023-03-29 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
US10600408B1 (en) * | 2018-03-23 | 2020-03-24 | Amazon Technologies, Inc. | Content output management based on speech quality |
US11175880B2 (en) | 2018-05-10 | 2021-11-16 | Sonos, Inc. | Systems and methods for voice-assisted media content selection |
US10847178B2 (en) | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US10959029B2 (en) | 2018-05-25 | 2021-03-23 | Sonos, Inc. | Determining and adapting to changes in microphone performance of playback devices |
US10681460B2 (en) | 2018-06-28 | 2020-06-09 | Sonos, Inc. | Systems and methods for associating playback devices with voice assistant services |
US11076035B2 (en) | 2018-08-28 | 2021-07-27 | Sonos, Inc. | Do not disturb feature for audio notifications |
US10461710B1 (en) | 2018-08-28 | 2019-10-29 | Sonos, Inc. | Media playback system with maximum volume setting |
CN109088802A (zh) * | 2018-09-13 | 2018-12-25 | 天津西青区瑞博生物科技有限公司 | 一种基于安卓控制平台的语音识别家居机器人 |
CN110910868B (zh) * | 2018-09-14 | 2022-09-20 | 上海子光信息科技有限公司 | 自扩展的语音控制系统 |
US10587430B1 (en) | 2018-09-14 | 2020-03-10 | Sonos, Inc. | Networked devices, systems, and methods for associating playback devices based on sound codes |
US10878811B2 (en) | 2018-09-14 | 2020-12-29 | Sonos, Inc. | Networked devices, systems, and methods for intelligently deactivating wake-word engines |
US11315553B2 (en) * | 2018-09-20 | 2022-04-26 | Samsung Electronics Co., Ltd. | Electronic device and method for providing or obtaining data for training thereof |
US11024331B2 (en) | 2018-09-21 | 2021-06-01 | Sonos, Inc. | Voice detection optimization using sound metadata |
US10811015B2 (en) | 2018-09-25 | 2020-10-20 | Sonos, Inc. | Voice detection optimization based on selected voice assistant service |
CN110956961A (zh) * | 2018-09-27 | 2020-04-03 | 中强光电股份有限公司 | 智能语音系统及利用智能语音系统控制投影机的方法 |
US11100923B2 (en) | 2018-09-28 | 2021-08-24 | Sonos, Inc. | Systems and methods for selective wake word detection using neural network models |
US10692518B2 (en) | 2018-09-29 | 2020-06-23 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection via multiple network microphone devices |
JP7028130B2 (ja) * | 2018-10-04 | 2022-03-02 | トヨタ自動車株式会社 | エージェント装置 |
US11899519B2 (en) | 2018-10-23 | 2024-02-13 | Sonos, Inc. | Multiple stage network microphone device with reduced power consumption and processing load |
US20200143235A1 (en) * | 2018-11-01 | 2020-05-07 | Honda Motor Co., Ltd. | System and method for providing smart objects virtual communication |
EP3654249A1 (en) | 2018-11-15 | 2020-05-20 | Snips | Dilated convolutions and gating for efficient keyword spotting |
US10944588B2 (en) | 2018-11-29 | 2021-03-09 | International Business Machines Corporation | Resolving conflicting commands received by an electronic device |
US11183183B2 (en) | 2018-12-07 | 2021-11-23 | Sonos, Inc. | Systems and methods of operating media playback systems having multiple voice assistant services |
US11132989B2 (en) | 2018-12-13 | 2021-09-28 | Sonos, Inc. | Networked microphone devices, systems, and methods of localized arbitration |
US10602268B1 (en) | 2018-12-20 | 2020-03-24 | Sonos, Inc. | Optimization of network microphone devices using noise classification |
CN109697981B (zh) * | 2019-01-02 | 2021-03-09 | 百度在线网络技术(北京)有限公司 | 一种语音交互方法、装置、设备及存储介质 |
CN111508483B (zh) * | 2019-01-31 | 2023-04-18 | 北京小米智能科技有限公司 | 设备控制方法及装置 |
US10867604B2 (en) | 2019-02-08 | 2020-12-15 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing |
US11315556B2 (en) | 2019-02-08 | 2022-04-26 | Sonos, Inc. | Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification |
WO2020175802A1 (en) | 2019-02-27 | 2020-09-03 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
EP3709194A1 (en) | 2019-03-15 | 2020-09-16 | Spotify AB | Ensemble-based data comparison |
US11120794B2 (en) | 2019-05-03 | 2021-09-14 | Sonos, Inc. | Voice assistant persistence across multiple network microphone devices |
CN112051743A (zh) * | 2019-06-06 | 2020-12-08 | 北京三星通信技术研究有限公司 | 设备控制方法、冲突处理方法、相应的装置及电子设备 |
KR102252526B1 (ko) | 2019-06-07 | 2021-05-14 | 부산대학교 산학협력단 | 경량 IoT 장치를 위한 지능형 음성 서비스 지원 장치 및 방법 |
US11200894B2 (en) | 2019-06-12 | 2021-12-14 | Sonos, Inc. | Network microphone device with command keyword eventing |
US10586540B1 (en) | 2019-06-12 | 2020-03-10 | Sonos, Inc. | Network microphone device with command keyword conditioning |
US11361756B2 (en) | 2019-06-12 | 2022-06-14 | Sonos, Inc. | Conditional wake word eventing based on environment |
US11138969B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US11138975B2 (en) | 2019-07-31 | 2021-10-05 | Sonos, Inc. | Locally distributed keyword detection |
US10871943B1 (en) | 2019-07-31 | 2020-12-22 | Sonos, Inc. | Noise classification for event detection |
KR102280690B1 (ko) * | 2019-08-15 | 2021-07-22 | 엘지전자 주식회사 | 지능적 음성 출력 방법, 음성 출력 장치 및 지능형 컴퓨팅 디바이스 |
US11094319B2 (en) | 2019-08-30 | 2021-08-17 | Spotify Ab | Systems and methods for generating a cleaned version of ambient sound |
EP4037328A4 (en) | 2019-09-27 | 2023-08-30 | LG Electronics Inc. | DISPLAY DEVICE AND ARTIFICIAL INTELLIGENCE SYSTEM |
WO2021075774A1 (en) * | 2019-10-16 | 2021-04-22 | Samsung Electronics Co., Ltd. | Method for controlling iot device and electronic device therefor |
US11189286B2 (en) | 2019-10-22 | 2021-11-30 | Sonos, Inc. | VAS toggle based on device orientation |
US11200900B2 (en) | 2019-12-20 | 2021-12-14 | Sonos, Inc. | Offline voice control |
US11562740B2 (en) | 2020-01-07 | 2023-01-24 | Sonos, Inc. | Voice verification for media playback |
US11556307B2 (en) | 2020-01-31 | 2023-01-17 | Sonos, Inc. | Local voice data processing |
US11308958B2 (en) | 2020-02-07 | 2022-04-19 | Sonos, Inc. | Localized wakeword verification |
US11308959B2 (en) | 2020-02-11 | 2022-04-19 | Spotify Ab | Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices |
US11328722B2 (en) * | 2020-02-11 | 2022-05-10 | Spotify Ab | Systems and methods for generating a singular voice audio stream |
JP7318587B2 (ja) * | 2020-05-18 | 2023-08-01 | トヨタ自動車株式会社 | エージェント制御装置 |
US11482224B2 (en) | 2020-05-20 | 2022-10-25 | Sonos, Inc. | Command keywords with input detection windowing |
US11727919B2 (en) | 2020-05-20 | 2023-08-15 | Sonos, Inc. | Memory allocation for keyword spotting engines |
US11308962B2 (en) * | 2020-05-20 | 2022-04-19 | Sonos, Inc. | Input detection windowing |
US11698771B2 (en) | 2020-08-25 | 2023-07-11 | Sonos, Inc. | Vocal guidance engines for playback devices |
US12283269B2 (en) | 2020-10-16 | 2025-04-22 | Sonos, Inc. | Intent inference in audiovisual communication sessions |
US11984123B2 (en) | 2020-11-12 | 2024-05-14 | Sonos, Inc. | Network device interaction by range |
US20220180865A1 (en) * | 2020-12-03 | 2022-06-09 | International Business Machines Corporation | Runtime topic change analyses in spoken dialog contexts |
US11551700B2 (en) | 2021-01-25 | 2023-01-10 | Sonos, Inc. | Systems and methods for power-efficient keyword detection |
CN114055464B (zh) * | 2021-09-30 | 2024-01-19 | 深圳市航盛电子股份有限公司 | 一种智能调度机械手工作的执行系统及其工作方法 |
US12322390B2 (en) | 2021-09-30 | 2025-06-03 | Sonos, Inc. | Conflict management for wake-word detection processes |
CN118303040A (zh) | 2021-09-30 | 2024-07-05 | 搜诺思公司 | 启用和禁用麦克风和语音助手 |
US12327065B2 (en) | 2021-12-01 | 2025-06-10 | International Business Machines Corporation | Resolving conflicting commands using hierarchy |
US12327549B2 (en) | 2022-02-09 | 2025-06-10 | Sonos, Inc. | Gatekeeping for voice intent processing |
CN115240668B (zh) * | 2022-07-06 | 2023-06-02 | 广东开放大学(广东理工职业学院) | 语音交互家居控制方法及机器人 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3357629B2 (ja) | 1999-04-26 | 2002-12-16 | 旭化成株式会社 | 設備制御システム |
JP3838029B2 (ja) | 2000-12-18 | 2006-10-25 | セイコーエプソン株式会社 | 音声認識を用いた機器制御方法および音声認識を用いた機器制御システム |
US20030167167A1 (en) * | 2002-02-26 | 2003-09-04 | Li Gong | Intelligent personal assistants |
US7480619B1 (en) | 2003-03-04 | 2009-01-20 | The Board Of Trustees Of The Leland Stanford Junior University | Integration manager and natural interaction processor |
US20050131677A1 (en) * | 2003-12-12 | 2005-06-16 | Assadollahi Ramin O. | Dialog driven personal information manager |
US7634406B2 (en) * | 2004-12-10 | 2009-12-15 | Microsoft Corporation | System and method for identifying semantic intent from acoustic information |
US20060293767A1 (en) * | 2005-06-28 | 2006-12-28 | Eischeid Todd M | Policy based automation rule selection control system |
JP2006227634A (ja) | 2006-03-29 | 2006-08-31 | Seiko Epson Corp | 音声認識を用いた機器制御方法および音声認識を用いた機器制御システムならびに音声認識を用いた機器制御プログラムを記録した記録媒体 |
US20110060587A1 (en) | 2007-03-07 | 2011-03-10 | Phillips Michael S | Command and control utilizing ancillary information in a mobile voice-to-speech application |
US8788589B2 (en) * | 2007-10-12 | 2014-07-22 | Watchitoo, Inc. | System and method for coordinating simultaneous edits of shared digital data |
CN101272418B (zh) * | 2008-03-25 | 2012-07-18 | 宇龙计算机通信科技(深圳)有限公司 | 一种远程控制通信终端的方法和通信终端 |
US8458168B2 (en) * | 2009-03-27 | 2013-06-04 | Microsoft Corporation | Anticipating interests of an online user |
KR101072709B1 (ko) | 2009-06-15 | 2011-10-11 | 브이 앤드 씨 컴퍼니 리미티드 | 영역 우선 음성인식 홈네트워크 시스템 |
CN101834799B (zh) * | 2010-05-06 | 2012-12-19 | 工业和信息化部电信传输研究所 | 移动iptv的服务器选择方法、客户端、服务器和系统 |
EP2498250B1 (en) * | 2011-03-07 | 2021-05-05 | Accenture Global Services Limited | Client and server system for natural language-based control of a digital network of devices |
JP2012244238A (ja) | 2011-05-16 | 2012-12-10 | Funai Electric Co Ltd | 音声画像装置 |
CN102427465B (zh) * | 2011-08-18 | 2015-05-13 | 青岛海信电器股份有限公司 | 语音服务代理方法及装置、通过代理集成语音应用的系统 |
US20130073286A1 (en) | 2011-09-20 | 2013-03-21 | Apple Inc. | Consolidating Speech Recognition Results |
US8340975B1 (en) * | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
US20130238326A1 (en) * | 2012-03-08 | 2013-09-12 | Lg Electronics Inc. | Apparatus and method for multiple device voice control |
US9064491B2 (en) * | 2012-05-29 | 2015-06-23 | Nuance Communications, Inc. | Methods and apparatus for performing transformation techniques for data clustering and/or classification |
CN102945029B (zh) | 2012-10-31 | 2014-12-10 | 鸿富锦精密工业(深圳)有限公司 | 智能网关、智能家居系统及家电设备的智能控制方法 |
US9607046B2 (en) * | 2012-12-14 | 2017-03-28 | Microsoft Technology Licensing, Llc | Probability-based state modification for query dialogues |
US9361885B2 (en) * | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9064001B2 (en) * | 2013-03-15 | 2015-06-23 | Nuance Communications, Inc. | Method and apparatus for a frequently-asked questions portal workflow |
WO2014190496A1 (en) | 2013-05-28 | 2014-12-04 | Thomson Licensing | Method and system for identifying location associated with voice command to control home appliance |
KR102387567B1 (ko) * | 2015-01-19 | 2022-04-18 | 삼성전자주식회사 | 음성 인식 방법 및 음성 인식 장치 |
US9704488B2 (en) * | 2015-03-20 | 2017-07-11 | Microsoft Technology Licensing, Llc | Communicating metadata that identifies a current speaker |
-
2015
- 2015-10-12 KR KR1020150142427A patent/KR102429260B1/ko active Active
-
2016
- 2016-09-20 US US15/270,382 patent/US10607605B2/en active Active
- 2016-09-30 CN CN201610874212.1A patent/CN106571141B/zh active Active
- 2016-10-11 EP EP16193347.8A patent/EP3157007B1/en active Active
- 2016-10-11 JP JP2016199885A patent/JP2017076393A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2025023436A1 (ko) * | 2023-07-21 | 2025-01-30 | 삼성전자주식회사 | 인공지능 에이전트를 포함하는 전자 장치 및 인공지능 에이전트의 동작 방법 |
Also Published As
Publication number | Publication date |
---|---|
EP3157007A1 (en) | 2017-04-19 |
US10607605B2 (en) | 2020-03-31 |
JP2017076393A (ja) | 2017-04-20 |
CN106571141B (zh) | 2021-12-28 |
CN106571141A (zh) | 2017-04-19 |
US20170103755A1 (en) | 2017-04-13 |
KR20170043055A (ko) | 2017-04-20 |
EP3157007B1 (en) | 2019-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102429260B1 (ko) | 음성 에이전트 기반의 제어 명령 처리 장치 및 방법과, 에이전트 장치 | |
US11900930B2 (en) | Method and apparatus for managing voice-based interaction in Internet of things network system | |
US10354014B2 (en) | Virtual assistant system | |
US11100929B2 (en) | Voice assistant devices | |
KR102095514B1 (ko) | 디바이스 토폴로지에 기초한 음성 명령 프로세싱 | |
US9825773B2 (en) | Device control by speech commands with microphone and camera to acquire line-of-sight information | |
KR102424260B1 (ko) | Iot 기반 알림을 생성 및 클라이언트 디바이스(들)의 자동화된 어시스턴트 클라이언트(들)에 의해 iot 기반 알림을 자동 렌더링하게 하는 명령(들)의 제공 | |
KR102417682B1 (ko) | 음성 인식을 이용한 닉네임 관리 장치 및 방법 | |
US10432419B1 (en) | Voice control using multi-media rooms | |
KR102453603B1 (ko) | 전자 장치 및 그 제어 방법 | |
US20200184963A1 (en) | Virtual assistant augmentation system | |
KR20190099586A (ko) | 전자 장치, 전자 장치의 제어방법 및 서버 | |
KR20140037519A (ko) | 자연어 기반의 명령어 인식을 통해 가전기기를 원격 제어하는 제어 단말 및 그 방법 | |
KR20180096483A (ko) | 전자 장치, 이의 제어 방법 및 비일시적인 컴퓨터 판독가능 기록매체 | |
US20190130898A1 (en) | Wake-up-word detection | |
KR20190026521A (ko) | 인공지능 홈 어플라이언스 및 음성 인식 서버 시스템의 동작 방법 | |
KR102396147B1 (ko) | 음성 명령을 이용한 동작을 수행하는 전자 장치 및 전자 장치의 동작 방법 | |
JP6719434B2 (ja) | 機器制御装置、機器制御方法及び機器制御システム | |
US20220230634A1 (en) | Systems and methods for voice exchange beacon devices | |
KR102153134B1 (ko) | 근거리 무선 데이터 통신을 이용한 화재 경보 방법, 장치 및 시스템 | |
KR102685531B1 (ko) | Em 신호의 특징을 등록하여 외부 장치를 식별하는 방법 및 상기 방법을 적용한 전자 장치 | |
CN112306615A (zh) | 基于人工智能的交互方法、装置、电子设备以及存储介质 | |
KR20160037058A (ko) | 빅데이터 분석 기반의 개인화 서비스 지원 장치 및 방법 | |
KR20200079602A (ko) | 사용자별 맞춤형 서비스 제공 IoT 시스템 | |
KR102304342B1 (ko) | 음성 인식 방법 및 이에 사용되는 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20151012 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20201012 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20151012 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220114 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20220715 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220801 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20220802 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |