KR20220069219A - 문장 재구축 및 대비 손실을 적용한 기능 대화 필터 시스템 및 그 방법 - Google Patents
문장 재구축 및 대비 손실을 적용한 기능 대화 필터 시스템 및 그 방법 Download PDFInfo
- Publication number
- KR20220069219A KR20220069219A KR1020200156124A KR20200156124A KR20220069219A KR 20220069219 A KR20220069219 A KR 20220069219A KR 1020200156124 A KR1020200156124 A KR 1020200156124A KR 20200156124 A KR20200156124 A KR 20200156124A KR 20220069219 A KR20220069219 A KR 20220069219A
- Authority
- KR
- South Korea
- Prior art keywords
- domain
- vector
- input
- sentence
- language
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000013598 vector Substances 0.000 claims abstract description 160
- 230000006870 function Effects 0.000 claims abstract description 12
- 230000008569 process Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000002889 sympathetic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3347—Query execution using vector based model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G06Q50/30—
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Human Computer Interaction (AREA)
- Business, Economics & Management (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Machine Translation (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
도 2는 본 발명의 실시예에 따른 기능 대화 필터 시스템에서 입력 문장을 판별하는 프로세스를 도시한 것이다.
도 3은 본 발명의 실시예에 따른 기능 대화 필터 시스템을 이용하여 특정 도메인에 따라 문장을 판별하는 예를 설명하기 위해 도시한 것이다.
도 4는 본 발명의 실시예에 따른 기능 대화 필터 방법의 동작 흐름도를 도시한 것이다.
Claims (12)
- 입력 문장을 수신하는 수신부; 및
입력을 벡터로 변환하는 언어 모델에 의해 처리되는 상기 입력 문장에 대한 언어 벡터와, 상기 언어 벡터 중에서 도메인 내 입력 벡터를 수신하는 오토 인코더에 의해 복원되는 복원 벡터를 비교하여 상기 입력 문장에 대한 도메인 내(In-Domain) 또는 도메인 외(Out-of-Domain)의 문장으로 판별하는 문장 판별부
를 포함하는 기능 대화 필터 시스템. - 제1항에 있어서,
상기 문장 판별부는
문장을 벡터로 변환하는 상기 언어 모델과 상기 언어 모델을 통해 처리된 상기 언어 벡터를 축소 및 복원하는 상기 오토 인코더가 결합된 것을 특징으로 하는, 기능 대화 필터 시스템. - 제2항에 있어서,
상기 문장 판별부는
상기 언어 모델로 처리한 상기 언어 벡터와 상기 오토 인코더로 복원한 상기 복원 벡터를 비교하며, 상기 언어 벡터 및 상기 복원 벡터가 기 설정된 수치값 이상을 나타내면 상기 입력 문장을 도메인 외의 문장으로 판별하고, 그렇지 않으면 도메인 내 문장으로 판별하는, 기능 대화 필터 시스템. - 제1항에 있어서,
상기 언어 벡터 중에서 상기 도메인 내 입력 벡터 만을 추출하여 상기 오토 인코더를 학습시키는 제어부
를 더 포함하는 기능 대화 필터 시스템. - 제4항에 있어서,
상기 제어부는
상기 언어 벡터를 축소 후, 상기 복원 벡터로 복원하는 상기 오토 인코더의 재구축 손실과 대비 손실을 통해 훈련시키며,
상기 오토 인코더는
상기 도메인 내 입력 벡터로만 학습되어 상기 도메인 내 입력 벡터만 복원하는 것을 특징으로 하는, 기능 대화 필터 시스템. - 제4항에 있어서,
상기 제어부는
상기 언어 모델이 도메인 내 입력과 도메인 외 입력을 분류하여 처리하도록 하기 위해 대비 학습(contrastive task)을 수행하는 것을 특징으로 하는, 기능 대화 필터 시스템. - 제6항에 있어서,
상기 제어부는
상기 언어 벡터 중에서 상기 도메인 내 입력 벡터 및 도메인 외 입력 벡터를 이용하여 같은 군집 또는 다른 군집을 학습시키는 대비 학습 알고리즘을 수행하는, 기능 대화 필터 시스템. - 입력 문장을 수신하는 단계; 및
입력을 벡터로 변환하는 언어 모델에 의해 처리되는 상기 입력 문장에 대한 언어 벡터와, 상기 언어 벡터 중에서 도메인 내 입력 벡터를 수신하는 오토 인코더에 의해 복원되는 복원 벡터를 비교하여 상기 입력 문장에 대한 도메인 내(In-Domain) 또는 도메인 외(Out-of-Domain)의 문장으로 판별하는 단계
를 포함하는 기능 대화 필터 방법. - 제8항에 있어서,
상기 판별하는 단계는
상기 언어 모델로 처리한 상기 언어 벡터와 상기 오토 인코더로 복원한 상기 복원 벡터를 비교하며, 상기 언어 벡터 및 상기 복원 벡터가 기 설정된 수치값 이상을 나타내면 상기 입력 문장을 도메인 외의 문장으로 판별하고, 그렇지 않으면 도메인 내 문장으로 판별하는, 기능 대화 필터 방법. - 제8항에 있어서,
상기 언어 벡터 중에서 상기 도메인 내 입력 벡터 만을 추출하여 상기 오토 인코더를 학습시키는 단계
를 더 포함하는 기능 대화 필터 방법. - 제10항에 있어서,
상기 학습시키는 단계는
상기 언어 모델이 도메인 내 입력과 도메인 외 입력을 분류하여 처리하도록 하기 위해 대비 학습(contrastive task)을 수행하는 것을 특징으로 하는, 기능 대화 필터 방법. - 제11항에 있어서,
상기 학습시키는 단계는
상기 언어 벡터 중에서 상기 도메인 내 입력 벡터 및 도메인 외 입력 벡터를 이용하여 같은 군집 또는 다른 군집을 학습시키는 대비 학습 알고리즘을 수행하는, 기능 대화 필터 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200156124A KR102438969B1 (ko) | 2020-11-20 | 2020-11-20 | 문장 재구축 및 대비 손실을 적용한 기능 대화 필터 시스템 및 그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200156124A KR102438969B1 (ko) | 2020-11-20 | 2020-11-20 | 문장 재구축 및 대비 손실을 적용한 기능 대화 필터 시스템 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220069219A true KR20220069219A (ko) | 2022-05-27 |
KR102438969B1 KR102438969B1 (ko) | 2022-09-01 |
Family
ID=81791332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200156124A KR102438969B1 (ko) | 2020-11-20 | 2020-11-20 | 문장 재구축 및 대비 손실을 적용한 기능 대화 필터 시스템 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102438969B1 (ko) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140054494A (ko) | 2012-10-26 | 2014-05-09 | 심심이(주) | 대화 서비스 제공 방법 및 장치 |
US20180165554A1 (en) * | 2016-12-09 | 2018-06-14 | The Research Foundation For The State University Of New York | Semisupervised autoencoder for sentiment analysis |
KR20190019748A (ko) * | 2017-08-18 | 2019-02-27 | 삼성전자주식회사 | 자연어 생성 방법 및 장치 |
-
2020
- 2020-11-20 KR KR1020200156124A patent/KR102438969B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140054494A (ko) | 2012-10-26 | 2014-05-09 | 심심이(주) | 대화 서비스 제공 방법 및 장치 |
US20180165554A1 (en) * | 2016-12-09 | 2018-06-14 | The Research Foundation For The State University Of New York | Semisupervised autoencoder for sentiment analysis |
KR20190019748A (ko) * | 2017-08-18 | 2019-02-27 | 삼성전자주식회사 | 자연어 생성 방법 및 장치 |
Non-Patent Citations (2)
Title |
---|
Mikio Nakano et al., A Two-Stage Domain Selection Framework for Extensible Multi-Domain Spoken Dialogue Systems, Proceedings of the SIGDIAL 2011, pages 18-29, 2011. 1부.* * |
Seonghan Ryu et al., Neural sentence embedding using only in-domain sentences for out-of-domain sentence detection in dialog systems, 2018.07.27. <https://arxiv.org/abs/1807.11567v1> 1부.* * |
Also Published As
Publication number | Publication date |
---|---|
KR102438969B1 (ko) | 2022-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11455981B2 (en) | Method, apparatus, and system for conflict detection and resolution for competing intent classifiers in modular conversation system | |
US11735176B2 (en) | Speaker diarization using speaker embedding(s) and trained generative model | |
WO2022121251A1 (zh) | 文本处理模型训练方法、装置、计算机设备和存储介质 | |
US20210019375A1 (en) | Computing system including virtual agent bot providing semantic topic model-based response | |
US11120802B2 (en) | Diarization driven by the ASR based segmentation | |
US20210089909A1 (en) | High fidelity speech synthesis with adversarial networks | |
US10468031B2 (en) | Diarization driven by meta-information identified in discussion content | |
US10891954B2 (en) | Methods and systems for managing voice response systems based on signals from external devices | |
KR20190074508A (ko) | 챗봇을 위한 대화 모델의 데이터 크라우드소싱 방법 | |
CN114765025A (zh) | 语音识别模型的生成方法、识别方法、装置、介质及设备 | |
TWI818427B (zh) | 使用基於文本的說話者變更檢測的說話者劃分糾正方法及系統 | |
US12027162B2 (en) | Noisy student teacher training for robust keyword spotting | |
JP7182584B2 (ja) | スピーチ理解における解析異常の情報を出力するための方法 | |
CN116913278B (zh) | 语音处理方法、装置、设备和存储介质 | |
KR102438969B1 (ko) | 문장 재구축 및 대비 손실을 적용한 기능 대화 필터 시스템 및 그 방법 | |
JP7426919B2 (ja) | 画像から因果関係語を推定するプログラム、装置及び方法 | |
US11417336B2 (en) | Methods and systems of generating a customized response based on a context | |
KR102372642B1 (ko) | 자동 응답 생성 방법 및 장치 | |
KR20220075638A (ko) | 비윤리 상황에서 사용자 특성정보 기반 챗봇 대응 제어 방법 및 그를 위한 장치 | |
US12119003B2 (en) | Methods and systems for combined voice and signaling | |
US12141540B2 (en) | Message mapping and combination for intent classification | |
US20250029612A1 (en) | Guiding transcript generation using detected section types as part of automatic speech recognition | |
CN118410162A (zh) | 摘要提取方法、装置、设备、介质及程序产品 | |
CN119130670A (zh) | 用户意图识别方法、装置、终端设备以及介质 | |
CN116010607A (zh) | 文本聚类方法、装置、计算机系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20201120 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220318 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20220823 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220829 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20220829 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |