KR102623272B1 - 전자 장치 및 이의 제어 방법 - Google Patents
전자 장치 및 이의 제어 방법 Download PDFInfo
- Publication number
- KR102623272B1 KR102623272B1 KR1020160132331A KR20160132331A KR102623272B1 KR 102623272 B1 KR102623272 B1 KR 102623272B1 KR 1020160132331 A KR1020160132331 A KR 1020160132331A KR 20160132331 A KR20160132331 A KR 20160132331A KR 102623272 B1 KR102623272 B1 KR 102623272B1
- Authority
- KR
- South Korea
- Prior art keywords
- digital signal
- voice
- word
- user
- wakeup word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 20
- 230000005236 sound signal Effects 0.000 claims abstract description 39
- 238000001514 detection method Methods 0.000 claims description 41
- 230000003213 activating effect Effects 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 230000015654 memory Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000036760 body temperature Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- User Interface Of Digital Computer (AREA)
- Telephone Function (AREA)
- Extrusion Moulding Of Plastics Or The Like (AREA)
- Crystals, And After-Treatments Of Crystals (AREA)
Abstract
Description
도 2는 본 발명의 일 실시 예에 따른, 전자 장치의 구성을 간략히 도시한 블럭도이다.
도 3은 본 발명의 일 실시 예에 따른, 음성 인식 어플리케이션이 웨이크업 워드를 판단하는 방법을 설명하기 위한 흐름도이다.
도 4는 본 발명의 일 실시 예에 따른, 음성 명령 인식 모드를 활성화하는 방법을 설명하기 위한 흐름도이다.
도 5는 본 발명의 일 실시 예에 따른, 웨이크업 워드를 이용하여 음성 명령 인식 모드를 활성화하는 동작을 설명하기 위한 도면이다.
도 6a 및 6b는 본 발명의 일 실시 예에 따른, 새로운 웨이크업 워드를 등록 및 편집하기 위한 사용자 인터페이스를 설명하기 위한 도면이다.
도 7은 본 발명의 일 실시 예에 따른, 사용자 감지 센서가 구비된 전자 장치 및 사용자 감지 센서를 이용하여 음성 명령 인식 모드를 활성화하는 동작을 설명하기 위한 도면이다.
220 : 프로세서 230 : 스토리지
710 : 사용자 감지 센서
Claims (20)
- 음성 명령 인식 모드로 진입하기 위한 웨이크업 워드(wakeup word) 및 상기 웨이크업 워드의 적어도 하나의 유사어를 저장하는 스토리지;
센서; 및
상기 센서를 통해 감지된 사운드 신호를 디지털 신호로 변환하고,
상기 디지털 신호가 수신되면 상기 디지털 신호의 특성 값이 기설정된 임계 레벨 이상인지 식별하고,
상기 디지털 신호의 특성 값이 상기 기설정된 임계 레벨 이상이면 상기 디지털 신호에 대한 음성 인식을 수행하고,
상기 디지털 신호에 포함된 음성의 키워드와 상기 웨이크업 워드 간 제1 유사도를 식별하고,
상기 음성의 키워드와 상기 적어도 하나의 유사어 간 제2 유사도를 식별하고,
상기 제1 유사도가 상기 제2 유사도보다 높은 것으로 판단되면, 상기 음성 명령 인식 모드를 활성화하는 적어도 하나의 프로세서;를 포함하며,
상기 디지털 신호의 특성 값은, 상기 디지털 신호의 평균 주파수 및 평균 데시벨에 기초하여 식별되는, 전자 장치. - 제1항에 있어서
상기 디지털 신호의 특성 값은,
상기 사운드 신호의 길이에 기초하여 추가적으로 식별되며,
상기 기설정된 임계 레벨은, 상기 디지털 신호가 음성을 포함하는지 여부를 판단하기 위해 설정된 레벨인, 전자 장치. - 삭제
- 제1항에 있어서,
상기 적어도 하나의 프로세서는,
노이즈 필터링(noise filtering) 및 에코 캔슬링(echo canceling)을 수행하기 위한 잡음 추출 알고리즘을 저장하며,
상기 잡음 추출 알고리즘을 이용하여 상기 디지털 신호의 잡음을 추출하고,
상기 잡음이 추출된 디지털 신호의 특성 값이 상기 기설정된 임계 레벨 이상인지 식별하는, 전자 장치. - 제1항에 있어서,
디스플레이;를 더 포함하고,
상기 적어도 하나의 프로세서는,
상기 웨이크업 워드의 등록 및 편집 중 적어도 하나를 위한 UI를 상기 디스플레이를 통해 제공하고,
상기 UI를 통해 입력된 텍스트를 상기 웨이크업 워드로 저장하는, 전자 장치. - 제5항에 있어서,
상기 적어도 하나의 프로세서는,
웨이크업 워드가 업데이트되면, 사용자의 발화 히스토리 및 외부 데이터 서버 중 적어도 하나에 기초하여 상기 업데이트된 웨이크업 워드의 유사어를 자동으로 생성하여 저장하는, 전자 장치. - 제1항에 있어서,
사용자를 감지하는 센서;를 더 포함하고,
상기 적어도 하나의 프로세서는,
상기 센서로부터 수신된 감지 결과에 기초하여 상기 사용자가 감지된 것으로 판단되면 상기 디지털 신호가 음성을 포함하는 것으로 식별하고,
상기 디지털 신호에 포함된 음성의 키워드가 상기 웨이크업 워드와 일치하면 상기 음성 명령 인식 모드를 활성화하는, 전자 장치. - 제7항에 있어서,
상기 적어도 하나의 프로세서는,
상기 센서로부터 수신된 감지 결과에 기초하여, 상기 사용자의 감지 여부에 기초하여 상기 기설정된 임계 레벨을 조정하는, 전자 장치. - 음성 명령 인식 모드로 진입하기 위한 웨이크업 워드(wakeup word) 및 상기 웨이크업 워드의 적어도 하나의 유사어를 포함하는 전자 장치의 제어 방법에 있어서,
사운드 신호를 감지하는 단계;
상기 감지된 사운드 신호를 디지털 신호로 변환하는 단계; 및
상기 디지털 신호가 수신되면 상기 디지털 신호의 특성 값이 기설정된 임계 레벨 이상인지 식별하는 단계;
상기 디지털 신호의 특성 값이 상기 기설정된 임계 레벨 이상이면 상기 디지털 신호에 대한 음성 인식을 수행하는 단계;
상기 디지털 신호에 포함된 음성의 키워드와 상기 웨이크업 워드 간 제1 유사도를 식별하는 단계;
상기 음성의 키워드와 상기 적어도 하나의 유사어 간 제2 유사도를 식별하는 단계; 및
상기 제1 유사도가 상기 제2 유사도보다 높은 것으로 판단되면, 상기 음성 명령 인식 모드를 활성화하는 단계;를 포함하며,
상기 디지털 신호의 특성 값은, 상기 디지털 신호의 평균 주파수 및 평균 데시벨에 기초하여 식별되는, 제어 방법. - 제9항에 있어서
상기 디지털 신호의 특성 값은,
상기 사운드 신호의 길이에 기초하여 추가적으로 식별되며,
상기 기설정된 임계 레벨은, 상기 디지털 신호가 음성을 포함하는지 여부를 판단하기 위해 설정된 레벨인, 제어 방법. - 삭제
- 제9항에 있어서,
상기 기설정된 임계 레벨 이상인지 식별하는 단계는,
노이즈 필터링(noise filtering) 및 에코 캔슬링(echo canceling)을 수행하기 위한 잡음 추출 알고리즘을 저장하는 단계;
상기 잡음 추출 알고리즘을 이용하여 상기 디지털 신호의 잡음을 추출하는 단계; 및
상기 잡음이 추출된 디지털 신호의 특성 값이 상기 기설정된 임계 레벨 이상인지 식별하는 단계;를 포함하는, 제어 방법. - ◈청구항 13은(는) 설정등록료 납부시 포기되었습니다.◈제9항에 있어서,
상기 웨이크업 워드의 등록 및 편집 중 적어도 하나를 위한 UI를 제공하는 단계; 및
상기 UI를 통해 입력된 텍스트를 상기 웨이크업 워드로 저장하는 단계;를 더 포함하는, 제어 방법. - ◈청구항 14은(는) 설정등록료 납부시 포기되었습니다.◈제9항에 있어서,
웨이크업 워드가 업데이트되면, 사용자의 발화 히스토리 및 외부 데이터 서버 중 적어도 하나에 기초하여 상기 업데이트된 웨이크업 워드의 유사어를 자동으로 생성하여 저장하는 단계;를 더 포함하는, 제어 방법. - ◈청구항 15은(는) 설정등록료 납부시 포기되었습니다.◈제9항에 있어서,
상기 음성 명령 인식 모드를 활성화하는 단계는,
센서로부터 수신된 감지 결과에 기초하여 사용자가 감지된 것으로 판단되면 상기 디지털 신호가 음성을 포함하는 것으로 판단하고, 상기 디지털 신호에 포함된 음성의 키워드가 상기 웨이크업 워드와 일치하면 상기 음성 명령 인식 모드를 활성화하는, 제어 방법. - ◈청구항 16은(는) 설정등록료 납부시 포기되었습니다.◈제15항에 있어서,
상기 수신된 감지 결과에 기초하여, 상기 사용자의 감지 여부에 기초하여 상기 기설정된 임계 레벨을 조정하는 단계;를 더 포함하는, 제어 방법. - ◈청구항 17은(는) 설정등록료 납부시 포기되었습니다.◈음성 명령 인식 모드로 진입하기 위한 웨이크업 워드(wakeup word) 및 상기 웨이크업 워드의 적어도 하나의 유사어를 포함하는 스토리지;
센서; 및
상기 센서를 통해 감지된 사운드 신호를 디지털 신호로 변환하며,
상기 디지털 신호가 수신되면 상기 디지털 신호의 특성 값이 기설정된 임계 레벨 이상인지 식별하고,
상기 특성 값이 상기 기설정된 임계 레벨 이상이면, 상기 디지털 신호에 대한 음성 인식을 수행하고,
상기 디지털 신호에 포함된 음성의 키워드와 상기 웨이크업 워드 간 제1 유사도 및, 상기 음성의 키워드와 상기 웨이크업 워드의 유사어 간 제2 유사도를 식별하고,
상기 제1 유사도가 상기 제2 유사도보다 높은 것으로 판단되면 상기 음성 명령 인식 모드를 활성화하는 프로세서;를 포함하며,
상기 디지털 신호의 특성 값은, 상기 디지털 신호의 평균 주파수 및 평균 데시벨에 기초하여 식별되는, 전자 장치. - 삭제
- ◈청구항 19은(는) 설정등록료 납부시 포기되었습니다.◈제17항에 있어서,
디스플레이;를 더 포함하고,
상기 적어도 하나의 프로세서는,
상기 웨이크업 워드의 유사어를 등록 및 편집 중 적어도 하나를 위한 UI를 상기 디스플레이를 통해 제공하고, 상기 UI를 통해 입력된 텍스트를 상기 웨이크업 워드의 유사어로 저장하는, 전자 장치. - ◈청구항 20은(는) 설정등록료 납부시 포기되었습니다.◈제17항에 있어서,
상기 적어도 하나의 프로세서는,
사용자의 발화 히스토리 및 외부 데이터 서버로부터 수신된 데이터 중 적어도 하나에 기초하여 상기 웨이크업 워드의 유사어를 자동으로 생성하여 저장하는, 전자 장치.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160132331A KR102623272B1 (ko) | 2016-10-12 | 2016-10-12 | 전자 장치 및 이의 제어 방법 |
PCT/KR2017/011202 WO2018070780A1 (en) | 2016-10-12 | 2017-10-11 | Electronic device and method for controlling the same |
US15/782,228 US10418027B2 (en) | 2016-10-12 | 2017-10-12 | Electronic device and method for controlling the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160132331A KR102623272B1 (ko) | 2016-10-12 | 2016-10-12 | 전자 장치 및 이의 제어 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180040426A KR20180040426A (ko) | 2018-04-20 |
KR102623272B1 true KR102623272B1 (ko) | 2024-01-11 |
Family
ID=61830019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160132331A Active KR102623272B1 (ko) | 2016-10-12 | 2016-10-12 | 전자 장치 및 이의 제어 방법 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10418027B2 (ko) |
KR (1) | KR102623272B1 (ko) |
WO (1) | WO2018070780A1 (ko) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102591413B1 (ko) * | 2016-11-16 | 2023-10-19 | 엘지전자 주식회사 | 이동단말기 및 그 제어방법 |
US10079015B1 (en) * | 2016-12-06 | 2018-09-18 | Amazon Technologies, Inc. | Multi-layer keyword detection |
CN108509225B (zh) * | 2018-03-28 | 2021-07-16 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN109697244A (zh) * | 2018-11-01 | 2019-04-30 | 百度在线网络技术(北京)有限公司 | 信息处理方法、装置及存储介质 |
US10971160B2 (en) * | 2018-11-13 | 2021-04-06 | Comcast Cable Communications, Llc | Methods and systems for determining a wake word |
KR20200063521A (ko) * | 2018-11-28 | 2020-06-05 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
CN109461456B (zh) * | 2018-12-03 | 2022-03-22 | 云知声智能科技股份有限公司 | 一种提升语音唤醒成功率的方法 |
KR102760468B1 (ko) * | 2019-01-03 | 2025-02-03 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
CN109753665B (zh) * | 2019-01-30 | 2020-10-16 | 北京声智科技有限公司 | 唤醒模型的更新方法及装置 |
CN109920418B (zh) * | 2019-02-20 | 2021-06-22 | 北京小米移动软件有限公司 | 调整唤醒灵敏度的方法及装置 |
KR20200141860A (ko) | 2019-06-11 | 2020-12-21 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
CN112102821B (zh) * | 2019-06-18 | 2024-01-12 | 北京京东尚科信息技术有限公司 | 应用于电子设备的数据处理方法、装置、系统、介质 |
KR102629796B1 (ko) * | 2019-10-15 | 2024-01-26 | 삼성전자 주식회사 | 음성 인식의 향상을 지원하는 전자 장치 |
JP2021071797A (ja) * | 2019-10-29 | 2021-05-06 | 富士通クライアントコンピューティング株式会社 | 表示装置および情報処理装置 |
CN111554289A (zh) * | 2020-04-27 | 2020-08-18 | 河北雄安中税盟科技股份有限公司 | 一种智能语音交互方法与存储介质 |
US12068003B2 (en) * | 2020-11-20 | 2024-08-20 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
KR20220071591A (ko) * | 2020-11-24 | 2022-05-31 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
KR20220099003A (ko) | 2021-01-05 | 2022-07-12 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
KR20220111574A (ko) * | 2021-02-02 | 2022-08-09 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
KR102492574B1 (ko) * | 2022-07-15 | 2023-01-27 | 오더퀸 주식회사 | 약한지도학습 기반 챗봇을 이용한 대화형 키오스크 주문 서비스 제공 시스템 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100482313B1 (ko) * | 1996-12-30 | 2005-07-21 | 엘지전자 주식회사 | 이중유사도비교를통한음성인식방법 |
US6188986B1 (en) * | 1998-01-02 | 2001-02-13 | Vos Systems, Inc. | Voice activated switch method and apparatus |
KR101317339B1 (ko) | 2009-12-18 | 2013-10-11 | 한국전자통신연구원 | 엔베스트 인식 단어 계산량 감소를 위한 2단계 발화검증 구조를 갖는 음성인식 장치 및 방법 |
KR101229108B1 (ko) | 2009-12-21 | 2013-02-01 | 한국전자통신연구원 | 단어별 신뢰도 문턱값에 기반한 발화 검증 장치 및 그 방법 |
KR101255141B1 (ko) | 2011-08-11 | 2013-04-22 | 주식회사 씨에스 | 거절율을 확보하고 오인식을 줄이는 실시간 음성 인식 방법 |
US20140006825A1 (en) * | 2012-06-30 | 2014-01-02 | David Shenhav | Systems and methods to wake up a device from a power conservation state |
US9275637B1 (en) * | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
US9842489B2 (en) * | 2013-02-14 | 2017-12-12 | Google Llc | Waking other devices for additional data |
JP6276513B2 (ja) | 2013-04-12 | 2018-02-07 | 株式会社レイトロン | 音声認識装置および音声認識プログラム |
US20140358552A1 (en) * | 2013-05-31 | 2014-12-04 | Cirrus Logic, Inc. | Low-power voice gate for device wake-up |
US20150015495A1 (en) * | 2013-07-12 | 2015-01-15 | International Business Machines Corporation | Dynamic mobile display geometry to accommodate grip occlusion |
US9305554B2 (en) * | 2013-07-17 | 2016-04-05 | Samsung Electronics Co., Ltd. | Multi-level speech recognition |
US9373321B2 (en) * | 2013-12-02 | 2016-06-21 | Cypress Semiconductor Corporation | Generation of wake-up words |
KR20150065521A (ko) | 2013-12-05 | 2015-06-15 | 주식회사 케이티 | 발화된 음성의 음성 인식 실패 개선을 위한 방법 및 이를 위한 음성인식 제어장치 |
US9263042B1 (en) * | 2014-07-25 | 2016-02-16 | Google Inc. | Providing pre-computed hotword models |
US20160055847A1 (en) * | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
US9354687B2 (en) * | 2014-09-11 | 2016-05-31 | Nuance Communications, Inc. | Methods and apparatus for unsupervised wakeup with time-correlated acoustic events |
US10789041B2 (en) * | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9775113B2 (en) * | 2014-12-11 | 2017-09-26 | Mediatek Inc. | Voice wakeup detecting device with digital microphone and associated method |
KR102346302B1 (ko) * | 2015-02-16 | 2022-01-03 | 삼성전자 주식회사 | 전자 장치 및 음성 인식 기능 운용 방법 |
KR102585228B1 (ko) * | 2015-03-13 | 2023-10-05 | 삼성전자주식회사 | 음성 인식 시스템 및 방법 |
US9792907B2 (en) * | 2015-11-24 | 2017-10-17 | Intel IP Corporation | Low resource key phrase detection for wake on voice |
US10024711B1 (en) * | 2017-07-25 | 2018-07-17 | BlueOwl, LLC | Systems and methods for assessing audio levels in user environments |
-
2016
- 2016-10-12 KR KR1020160132331A patent/KR102623272B1/ko active Active
-
2017
- 2017-10-11 WO PCT/KR2017/011202 patent/WO2018070780A1/en active Application Filing
- 2017-10-12 US US15/782,228 patent/US10418027B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
Also Published As
Publication number | Publication date |
---|---|
US20180102125A1 (en) | 2018-04-12 |
US10418027B2 (en) | 2019-09-17 |
KR20180040426A (ko) | 2018-04-20 |
WO2018070780A1 (en) | 2018-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102623272B1 (ko) | 전자 장치 및 이의 제어 방법 | |
US10777193B2 (en) | System and device for selecting speech recognition model | |
US12170088B2 (en) | Electronic device and controlling method thereof | |
US10504511B2 (en) | Customizable wake-up voice commands | |
US9508342B2 (en) | Initiating actions based on partial hotwords | |
CN105741836B (zh) | 声音识别装置以及声音识别方法 | |
US9837068B2 (en) | Sound sample verification for generating sound detection model | |
KR102628211B1 (ko) | 전자 장치 및 그 제어 방법 | |
KR20170080672A (ko) | 키 문구 사용자 인식의 증강 | |
TW201543467A (zh) | 語音輸入方法、裝置和系統 | |
KR20180018146A (ko) | 음성 인식이 가능한 디스플레이 장치 및 방법 | |
US11423880B2 (en) | Method for updating a speech recognition model, electronic device and storage medium | |
US11437022B2 (en) | Performing speaker change detection and speaker recognition on a trigger phrase | |
KR102692775B1 (ko) | 전자 장치 및 그의 제어 방법 | |
KR20210098250A (ko) | 전자 장치 및 이의 제어 방법 | |
KR102622350B1 (ko) | 전자 장치 및 그 제어 방법 | |
WO2019097217A1 (en) | Audio processing | |
CN117882132A (zh) | 电子设备及其控制方法 | |
KR20230127783A (ko) | 사용자의 음성 입력을 처리하는 방법 및 이를 위한 장치 | |
KR102393774B1 (ko) | 음성 인식 장치 및 그 제어방법 | |
KR20230118165A (ko) | 핫워드 속성에 기초한 자동화된 스피치 인식 파라미터적응시키기 | |
KR102124396B1 (ko) | 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법 | |
KR20210109722A (ko) | 사용자의 발화 상태에 기초하여 제어 정보를 생성하는 디바이스 및 그 제어 방법 | |
KR20200053290A (ko) | 전자 장치 및 그 제어 방법 | |
KR20100081129A (ko) | 무인원격로봇용 음성인식 프로그램을 기록한 기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20161012 |
|
PG1501 | Laying open of application | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20211008 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20161012 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230614 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20231010 |
|
PG1601 | Publication of registration |