KR102332565B1 - 음성 인식 힌트 적용 장치 및 방법 - Google Patents
음성 인식 힌트 적용 장치 및 방법 Download PDFInfo
- Publication number
- KR102332565B1 KR102332565B1 KR1020200005347A KR20200005347A KR102332565B1 KR 102332565 B1 KR102332565 B1 KR 102332565B1 KR 1020200005347 A KR1020200005347 A KR 1020200005347A KR 20200005347 A KR20200005347 A KR 20200005347A KR 102332565 B1 KR102332565 B1 KR 102332565B1
- Authority
- KR
- South Korea
- Prior art keywords
- hint
- noun
- language model
- value
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 35
- 238000012545 processing Methods 0.000 claims abstract description 24
- 238000009795 derivation Methods 0.000 claims abstract description 17
- 230000003287 optical effect Effects 0.000 description 8
- 239000000284 extract Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 229910052709 silver Inorganic materials 0.000 description 3
- 239000004332 silver Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 본 발명의 실시예에 따른 단어를 형태소에 따라 구분하는 예를 설명하기 위한 도면이다.
도 3은 본 발명의 실시예에 따른 음성 인식 힌트 적용 방법을 설명하기 위한 흐름도이다.
도 4는 본 발명의 실시예에 따른 음성 인식 힌트 적용 방법을 실행시키는 컴퓨팅 환경을 도시한 도면이다.
200: 수치 도출부
300: 힌트 적용부
400: 저장부
Claims (10)
- 음성 인식 힌트 적용 장치에 있어서,
소정의 목표치 이상의 학습이 완료된 언어 모델을 저장하는 저장부;
텍스트가 입력되면, 텍스트에 포함된 복수의 명사를 추출하는 형태소처리부;
추출된 복수의 명사 각각에 대해 상기 언어 모델에서의 펄플렉서티(perplexity) 수치를 도출하는 수치도출부; 및
상기 펄플렉서티 수치가 기 설정된 수치 이상인 명사를 힌트 리스트에 자동 등록하고, 상기 등록된 명사에 대해 음성 인식 힌트를 적용하는 힌트적용부;를 포함하되,
상기 힌트적용부는
상기 자동 등록된 명사가 고유명사와 동일하더라도 상기 언어 모델을 고려하여 음성 인식 힌트를 적용하는 것을 특징으로 하는
음성 인식 힌트 적용 장치. - 제1항에 있어서,
상기 수치도출부는
상기 언어 모델이 상기 복수의 명사 각각을
인식하는 성능을 수치화하여
상기 펄플렉서티(perplexity) 수치로 출력하는 것을 특징으로 하는
음성 인식 힌트 적용 장치. - 제2항에 있어서,
상기 펄플렉서티(perplexity) 수치는
상기 언어 모델이 상기 복수의 명사 각각에 대한 인식을 위해 선택할 수 있는 경우의 수인 것을 특징으로 하는
음성 인식 힌트 적용 장치. - 제3항에 있어서,
어느 하나의 명사에 대한 상기 펄플렉서티(perplexity) 수치는
상기 언어 모델이 상기 어느 하나의 명사에 대한 인식을 위해 선택할 수 있는 경우의 수가 많을수록 높은 것을 특징으로 하는
음성 인식 힌트 적용 장치. - 제3항에 있어서,
어느 하나의 명사에 대한 상기 펄플렉서티(perplexity) 수치는
상기 언어 모델이 상기 어느 하나의 명사의 인식을 오류로 선택할 확률이 높을수록 높은 것을 특징으로 하는
음성 인식 힌트 적용 장치. - 음성 인식 힌트 적용 방법에 있어서,
텍스트가 입력되면, 형태소처리부가 텍스트에 포함된 복수의 명사를 추출하는 단계;
수치도출부가 소정의 목표치 이상의 학습이 완료된 언어 모델에서 상기 추출된 복수의 명사 각각에 대한 펄플렉서티(perplexity) 수치를 도출하는 단계; 및
힌트적용부가 상기 펄플렉서티 수치가 기 설정된 수치 이상인 명사를 힌트 리스트에 자동 등록하고, 상기 등록된 명사에 대해 음성 인식 힌트를 적용하는 단계;를 포함하되,
상기 음성 인식 힌트를 적용하는 단계는
상기 자동 등록된 명사가 고유명사와 동일하더라도 상기 언어 모델을 고려하여 음성 인식 힌트를 적용하는 것을 특징으로 하는
음성 인식 힌트 적용 방법. - 제6항에 있어서,
상기 펄플렉서티(perplexity) 수치를 도출하는 단계는
상기 수치도출부가 상기 언어 모델이 상기 복수의 명사 각각을 인식하는 성능을 수치화하여 상기 펄플렉서티 수치로 도출하는 것을 특징으로 하는
음성 인식 힌트 적용 방법. - 제7항에 있어서,
상기 펄플렉서티(perplexity) 수치는
상기 언어 모델이 상기 복수의 명사 각각에 대한 인식을 위해 선택할 수 있는 경우의 수인 것을 특징으로 하는
음성 인식 힌트 적용 방법. - 제8항에 있어서,
어느 하나의 명사에 대한 상기 펄플렉서티(perplexity) 수치는
상기 언어 모델이 상기 어느 하나의 명사에 대한 인식을 위해 선택할 수 있는 경우의 수가 많을수록 높은 것을 특징으로 하는
음성 인식 힌트 적용 방법. - 제8항에 있어서,
어느 하나의 명사에 대한 상기 펄플렉서티(perplexity) 수치는
상기 언어 모델이 상기 어느 하나의 명사의 인식을 오류로 선택할 확률이 높을수록 높은 것을 특징으로 하는
음성 인식 힌트 적용 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20190166824 | 2019-12-13 | ||
KR1020190166824 | 2019-12-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210075815A KR20210075815A (ko) | 2021-06-23 |
KR102332565B1 true KR102332565B1 (ko) | 2021-11-29 |
Family
ID=76599508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200005347A Active KR102332565B1 (ko) | 2019-12-13 | 2020-01-15 | 음성 인식 힌트 적용 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102332565B1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004258531A (ja) * | 2003-02-27 | 2004-09-16 | Nippon Telegr & Teleph Corp <Ntt> | 認識誤り訂正方法、装置、およびプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2820872B1 (fr) * | 2001-02-13 | 2003-05-16 | Thomson Multimedia Sa | Procede, module, dispositif et serveur de reconnaissance vocale |
KR20040055288A (ko) | 2002-12-20 | 2004-06-26 | 한국전자통신연구원 | 한국어 음성합성기의 운율모듈을 위한 어절의 태깅 방법 |
-
2020
- 2020-01-15 KR KR1020200005347A patent/KR102332565B1/ko active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004258531A (ja) * | 2003-02-27 | 2004-09-16 | Nippon Telegr & Teleph Corp <Ntt> | 認識誤り訂正方法、装置、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20210075815A (ko) | 2021-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12315624B2 (en) | Generating structured text content using speech recognition models | |
US10176804B2 (en) | Analyzing textual data | |
CN110428823B (zh) | 口语理解装置和使用该装置的口语理解方法 | |
US9805718B2 (en) | Clarifying natural language input using targeted questions | |
US8700404B1 (en) | System and method for using semantic and syntactic graphs for utterance classification | |
US7617093B2 (en) | Authoring speech grammars | |
US9971765B2 (en) | Revising language model scores based on semantic class hypotheses | |
TWI437449B (zh) | 多重模式輸入方法及輸入方法編輯器系統 | |
US9348809B1 (en) | Modifying a tokenizer based on pseudo data for natural language processing | |
EP1290676A2 (en) | Creating a unified task dependent language models with information retrieval techniques | |
CN106407211A (zh) | 对实体词的语义关系进行分类的方法和装置 | |
CN113158656B (zh) | 讽刺内容识别方法、装置、电子设备以及存储介质 | |
CN110335608B (zh) | 声纹验证方法、装置、设备及存储介质 | |
JP7549429B2 (ja) | データ入力に対する音声認識及び訓練 | |
RU2441287C2 (ru) | Универсальные орфографические мнемосхемы | |
Ali | Multi-dialect Arabic broadcast speech recognition | |
US10380998B2 (en) | Voice and textual interface for closed-domain environment | |
CN115620726A (zh) | 语音文本生成方法、语音文本生成模型的训练方法、装置 | |
KR102332565B1 (ko) | 음성 인식 힌트 적용 장치 및 방법 | |
Kumolalo et al. | Development of a syllabicator for Yorùbá language | |
KR102383043B1 (ko) | 생략 복원 학습 방법과 인식 방법 및 이를 수행하기 위한 장치 | |
JP2020030379A (ja) | 認識結果補正装置、認識結果補正方法、およびプログラム | |
US20250103800A1 (en) | Detecting Computer-Generated Hallucinations using Progressive Scope-of-Analysis Enlargement | |
CN116341561B (zh) | 一种语音样本数据生成方法、装置、设备和存储介质 | |
Magistry | Design of an Input Method for Taiwanese Hokkien using Unsupervized Word Segmentation for Language Modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20200115 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210526 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20211112 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20211124 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20211124 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20241119 Start annual number: 4 End annual number: 4 |