KR102258906B1 - 구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법 및 그 장치 - Google Patents
구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법 및 그 장치 Download PDFInfo
- Publication number
- KR102258906B1 KR102258906B1 KR1020190086169A KR20190086169A KR102258906B1 KR 102258906 B1 KR102258906 B1 KR 102258906B1 KR 1020190086169 A KR1020190086169 A KR 1020190086169A KR 20190086169 A KR20190086169 A KR 20190086169A KR 102258906 B1 KR102258906 B1 KR 102258906B1
- Authority
- KR
- South Korea
- Prior art keywords
- sentence
- sign language
- spoken
- neural network
- artificial neural
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Machine Translation (AREA)
Abstract
본 발명은 주의 기반 인공신경망 기계 번역 모델을 사용하여 구어에서 수어로 번역하는 인공신경망 기계 번역 방법 및 그 장치에 관한 것으로, 구어 문장에서 언어학적 자질들을 추출하는 단계, 상기 구어 문장 및 상기 언어학적 자질들을 병렬 임베딩하여 하나의 벡터로 결합하는 단계 및 상기 결합된 벡터에 의한 벡터화된 문장을 인공신경망 번역 모델에 입력하여 수어 단어 시퀀스를 출력하는 단계를 포함한다.
Description
본 발명은 구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법 및 그 장치에 관한 것으로, 보다 상세하게는 주의 기반 인공신경망 기계 번역 모델을 사용하여 구어에서 수어로 번역하는 기술에 관한 것이다.
인공신경망 기반의 번역 기술은 최근 매우 빠르게 성장하고 있다. 이는 매년 더 자연스러운 표현을 생성해내고, 그에 따라 번역 품질 또한 상승하고 있다.
번역 기술 중 구어(spoken language) 간 번역에서는 인공신경망 기반의 기계 번역 연구가 매우 활발히 되고 있으나, 구어에서 수어(sign language), 또는 그 반대 방향의 번역은 아직 진행된 연구가 부족하다. 특히, 한국어에서 한국수어로의 인공신경망 기반 기계 번역 기술 도입 사례는 보고된 바 없다.
더욱이, 수어는 공간 언어(spatial language)의 특성을 가지어, 손 뿐만 아니라 얼굴(눈, 눈썹, 입, 응시 방향 등)과 상체와 같은 비수지 부분(non-manual parts)으로도 표현되는 다중채널 언어(multi-channel language)이므로, 이러한 특성으로 인해 구어 - 수어 간 번역에는 특징적인 어려움이 존재하였다.
본 발명의 목적은 구어에서 수어로 번역하는 과정에서 인공신경망 기반의 번역 기술을 적용하며, 주의 기반 인공신경망 번역 기술을 사용하는 예시 방법을 제공하고자 한다.
또한, 본 발명의 목적은 구어에서 수어로의 번역을 위해 구어 문장의 언어학적 분석 결과를 인공신경망 기계 번역 모델의 추가적인 입력 값으로 제공하여 보다 정확도 높은 결과를 제공하고자 한다.
본 발명의 실시예에 따른 구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법에 있어서, 구어 문장에서 언어학적 자질들을 추출하는 단계, 상기 구어 문장 및 상기 언어학적 자질들을 병렬 임베딩하여 하나의 벡터로 결합하는 단계 및 상기 결합된 벡터에 의한 벡터화된 문장을 인공신경망 번역 모델에 입력하여 수어 단어 시퀀스를 출력하는 단계를 포함한다.
또한, 본 발명의 실시예에 따른 구어에서 수어로의 기계 번역 방법은 구어 및 수어 병렬 말뭉치를 사용하여 주의 기반 상기 인공신경망 번역 모델을 학습시키는 단계를 더 포함할 수 있다.
상기 언어학적 자질들을 추출하는 단계는 상기 구어 문장을 형태소, 문장 유형, 문장 태, 문장 시제 및 부정 표현으로 분석하여 상기 언어학적 자질들을 추출할 수 있다.
상기 하나의 벡터로 결합하는 단계는 상기 구어 문장과 그에 대응하는 상기 언어학적 자질들을 병렬 인코딩하며, 인코딩된 벡터들을 하나의 벡터로 결합하여 상기 벡터화된 문장을 획득할 수 있다.
상기 하나의 벡터로 결합하는 단계는 상기 구어 문장의 단어(형태소)와 형태소 분석 결과, 문장 유형 결과, 문장 태 분석 결과, 문장 시제 분석 결과 및 부정 표현 분석 결과의 6개의 값을 병렬적으로 임베딩하며, 상기 6개의 임베딩 값을 결합하여 상기 벡터화된 문장을 획득할 수 있다.
상기 수어 단어 시퀀스를 출력하는 단계는 상기 인공신경망 번역 모델에 입력된 상기 벡터화된 문장을 인코더에 전달하며, 전달된 값을 주의 층에 의해 문맥 정보로 변환하여 디코더의 출력으로 사용할 수 있다.
상기 수어 단어 시퀀스를 출력하는 단계는 상기 디코더의 출력 값으로 수지 정보와 비수지 정보를 포함하는 상기 수어 단어 시퀀스를 출력할 수 있다.
상기 인공신경망 번역 모델을 학습시키는 단계는 상기 구어 문장과 이에 대응하는 상기 수어 단어 시퀀스의 쌍을 나타내는 상기 구어 및 수어 병렬 말뭉치를 사용하여 상기 인공신경망 번역 모델을 학습시킬 수 있다.
본 발명의 실시예에 따른 구어에서 수어로의 주의 기반 인공신경망 기계 번역 장치에 있어서, 구어 문장에서 언어학적 자질들을 추출하는 추출부, 상기 구어 문장 및 상기 언어학적 자질들을 병렬 임베딩하여 하나의 벡터로 결합하는 결합부 및 상기 결합된 벡터에 의한 벡터화된 문장을 인공신경망 번역 모델에 입력하여 수어 단어 시퀀스를 출력하는 출력부를 포함한다.
또한, 본 발명의 실시예에 따른 구어에서 수어로의 기계 번역 장치는 구어 및 수어 병렬 말뭉치를 사용하여 주의 기반 상기 인공신경망 번역 모델을 학습시키는 학습부를 더 포함할 수 있다.
상기 추출부는 상기 구어 문장을 형태소, 문장 유형, 문장 태, 문장 시제 및 부정 표현으로 분석하여 상기 언어학적 자질들을 추출할 수 있다.
상기 결합부는 상기 구어 문장과 그에 대응하는 상기 언어학적 자질들을 병렬 인코딩하며, 인코딩된 벡터들을 하나의 벡터로 결합하여 상기 벡터화된 문장을 획득할 수 있다.
상기 결합부는 상기 구어 문장의 단어(형태소)와 형태소 분석 결과, 문장 유형 결과, 문장 태 분석 결과, 문장 시제 분석 결과 및 부정 표현 분석 결과의 6개의 값을 병렬적으로 임베딩하며, 상기 6개의 임베딩 값을 결합하여 상기 벡터화된 문장을 획득할 수 있다.
상기 출력부는 상기 인공신경망 번역 모델에 입력된 상기 벡터화된 문장을 인코더에 전달하며, 전달된 값을 주의 층에 의해 문맥 정보로 변환하여 디코더의 출력으로 사용할 수 있다.
상기 출력부는 상기 디코더의 출력 값으로 수지 정보와 비수지 정보를 포함하는 상기 수어 단어 시퀀스를 출력할 수 있다.
상기 학습부는 상기 구어 문장과 이에 대응하는 상기 수어 단어 시퀀스의 쌍을 나타내는 상기 구어 및 수어 병렬 말뭉치를 사용하여 상기 인공신경망 번역 모델을 학습시킬 수 있다.
본 발명의 실시예에 따르면, 구어에서 수어로의 번역 결과를 주의 기반 인공신경망 기계 번역 기술을 통해 제공할 수 있다. 이에 따라, 본 발명은 기존에 제공되는 수어로의 번역보다 좀 더 자연스럽고 높은 정확도의 번역 결과를 제공할 수 있다.
또한, 본 발명의 실시예에 따르면, 구어 문장의 언어학적 분석결과를 자질로 제공함으로써, 수어에서 문법적인 정보를 담고 있는 비수지 표현을 예측하는데 도움을 줄 수 있다.
또한, 본 발명의 실시예에 따르면, 한국어 및 한국수어에 한정되지 않는 방법이며, 다른 국가의 구어 - 수어에 알맞은 언어학적 분석방법을 통해 동일한 결과를 제공할 수 있다.
도 1은 본 발명의 실시예에 따른 구어에서 수어로의 기계 번역 방법의 동작 흐름도를 도시한 것이다.
도 2는 본 발명의 실시예에 따른 구어 문장에서 언어학적 자질들을 추출하는 프로세스를 도시한 것이다.
도 3은 본 발명의 실시예에 따른 언어학적 자질들을 병렬적으로 임베딩하여 결합하는 프로세스를 도시한 것이다.
도 4는 본 발명의 실시예에 따른 벡터화된 문장으로부터 수어 단어 시퀀스를 출력하는 프로세스를 도시한 것이다.
도 5는 본 발명의 실시예에 따른 구어 및 수어 병렬 말뭉치를 사용하여 인공신경망 번역 모델을 학습시키는 프로세스를 도시한 것이다.
도 6은 본 발명의 실시예에 따른 구어에서 수어로의 기계 번역 장치의 세부 구성을 블록도로 도시한 것이다.
도 2는 본 발명의 실시예에 따른 구어 문장에서 언어학적 자질들을 추출하는 프로세스를 도시한 것이다.
도 3은 본 발명의 실시예에 따른 언어학적 자질들을 병렬적으로 임베딩하여 결합하는 프로세스를 도시한 것이다.
도 4는 본 발명의 실시예에 따른 벡터화된 문장으로부터 수어 단어 시퀀스를 출력하는 프로세스를 도시한 것이다.
도 5는 본 발명의 실시예에 따른 구어 및 수어 병렬 말뭉치를 사용하여 인공신경망 번역 모델을 학습시키는 프로세스를 도시한 것이다.
도 6은 본 발명의 실시예에 따른 구어에서 수어로의 기계 번역 장치의 세부 구성을 블록도로 도시한 것이다.
이하, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 또한, 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
또한, 본 명세서에서 사용되는 용어(terminology)들은 본 발명의 바람직한 실시예를 적절히 표현하기 위해 사용된 용어들로서, 이는 시청자, 운용자의 의도 또는 본 발명이 속하는 분야의 관례 등에 따라 달라질 수 있다. 따라서, 본 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 실시예에 따른 구어에서 수어로의 기계 번역 방법의 동작 흐름도를 도시한 것이다.
도 1의 단계는 도 6에 도시된 본 발명의 실시예에 따른 구어에서 수어로의 기계 번역 장치에 의해 수행된다.
도 1을 참조하면, 단계 110에서, 구어 문장에서 언어학적 자질들을 추출한다. 이하의 본 발명에서는 한국어에서 한국수어로의 기계 번역 과정을 설명하였으나, 한국어 및 한국수어에 한정되지 않는 방법이며, 다른 언어의 구어 - 수어에 알맞게 적용 가능하다.
단계 110은 구어 문장을 형태소, 문장 유형, 문장 태, 문장 시제 및 부정 표현으로 분석하여 언어학적 자질들을 추출할 수 있다. 예를 들면, 단계 110은 한국어 문장에 해당하는 언어학적 분석 결과를 토대로, 형태소, 문장 유형, 문장 태, 문장 시제 및 부정 표현의 언어학적 자질들로 추출할 수 있다.
단계 120에서, 구어 문장 및 언어학적 자질들을 병렬 임베딩하여 하나의 벡터로 결합한다.
단계 120은 구어 문장과 그에 대응하는 언어학적 자질들을 병렬 인코딩하며, 인코딩된 벡터들을 하나의 벡터로 결합하여 벡터화된 문장을 획득할 수 있다.
예를 들면, 단계 110에서 추출된 언어학적 자질들과 한국어 문장은 단계 120에서 인공신경망 번역 모델의 입력 값으로 제공하기 위해 병렬적으로 임베딩을 한 후, 하나의 벡터로 결합되어 단어(또는 형태소) 당 하나의 벡터로 표기될 수 있다. 보다 구체적으로, 단계 120은 한국어 문장의 단어(형태소)와 언어학적 자질들을 나타내는 형태소 분석 결과, 문장 유형 결과, 문장 태 분석 결과, 문장 시제 분석 결과 및 부정 표현 분석 결과의 6개의 값을 병렬적으로 임베딩하며, 6개의 임베딩 값을 결합하여 벡터화된 문장 또는 벡터화된 한국어 문장을 획득할 수 있다.
여기서, 상기 인공신경망 번역 모델은 기계 번역(machine translation)으로, 본 발명의 구어에서 수어로의 번역을 수행할 수 있다.
단계 130에서, 결합된 벡터에 의한 벡터화된 문장을 인공신경망 번역 모델에 입력하여 수어 단어 시퀀스를 출력한다.
예를 들면, 단계 130은 벡터화된 한국어 문장을 인공신경망 번역 모델에 입력값으로 사용하여 한국어 문장에 대응되는 한국수어 단어 시퀀스를 출력할 수 있다. 보다 구체적으로, 단계 130은 인공신경망 번역 모델에 입력된 벡터화된 문장을 인코더에 전달하며, 전달된 값을 주의 층에 의해 문맥 정보로 변환하여 디코더의 출력으로 사용할 수 있다. 이에, 단계 130은 디코더의 출력 값으로 수지 정보와 비수지 정보를 포함하는 수어 단어 시퀀스를 출력할 수 있다.
또한, 도 1에 도시된 바와 같이 본 발명의 실시예에 따른 구어에서 수어로의 기계 번역 방법은 단계 140을 더 포함할 수 있다.
단계 140은 구어 및 수어 병렬 말뭉치를 사용하여 주의 기반 인공신경망 번역 모델을 학습시킬 수 있다.
예를 들면, 단계 140은 한국어 문장과 이에 대응하는 한국수어 단어 시퀀스의 쌍을 나타내는 구어 및 수어 병렬 말뭉치를 사용하여 인공신경망 번역 모델을 학습시킬 수 있다.
도 2는 본 발명의 실시예에 따른 구어 문장에서 언어학적 자질들을 추출하는 프로세스를 도시한 것이다.
도 2를 참조하면, 본 발명의 실시예에 따른 구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법 및 그 장치는 한국어 문장에서 언어학적 자질들을 추출하는 추출 프로세스(220)를 수행할 수 있다.
예를 들면, 한국어 문장(210)이 다음과 같이 “나는 수어책을 발간했습니다.”로 제공되는 경우, 본 발명은 추출 프로세스(220)를 통해 형태소 분석(221), 문장 유형 분석(222), 문장 태 분석(223), 문장 시제 분석(224) 및 부정 표현 분석(225)의 총 다섯 가지 종류의 분석 단계를 수행하여 한국어 문장(210)에 대한 언어학적 자질들을 추출할 수 있다.
본 발명에서 형태소 분석 결과(231)를 사용하는 주 목적으로는 한국어 문장(210)의 구조를 파악하기 위함이며, 이를 통해 주어, 목적어, 대명사 등을 파악할 수 있다. 이를 활용하면 한국수어 표현 중 수향(손바닥의 방향 또는 손의 방향)이나 얼굴 방향을 파악하는데 도움이 된다.
그 외에도, 형태소 분석 결과(231)는 문장 유형 분석(222), 문장 태 분석(223), 문장 시제 분석(224) 및 부정 표현 분석(225)에도 보조적으로 사용될 수 있다.
문장 유형 분석 결과(232)는 주로 평서문, 의문문, 명령문, 청유문 및 감탄문의 5가지 형으로 구분될 수 있는데, 이를 활용하면 수어의 문장 구조나 비수지 표현을 포함한 수어 단어를 예측할 수 있다. 예를 들어, 의문문의 경우에는 수어 단어 ‘무엇’과 함께 입을 ‘O’ 모양으로 벌리고, 눈썹은 올리는 비수지 표현이 함께 제공될 수 있다. 나아가, 명령문의 경우에는 눈 부릅 뜸, 입술 다묾, 강경한 얼굴 표정 등을 통합하여 나타낼 수 있으며, 청유문의 경우에는 간절한 얼굴 표정, 눈빛, 고개 움직임 등을 통합하여 나타낼 수 있고, 감탄문의 경우에는 얼굴에 감정 표현으로 나타낼 수 있다.
문장 태 분석 결과(233)는 능동 또는 피동으로 나뉘는데, 이 경우 수향에 영향을 줄 수 있다.
문장 시제 분석 결과(234)는 수어 단어 ‘끝’이라는 단어가 문장 끝에 붙거나, 얼굴을 상하로 끄덕이는 비수지 동작을 나타낼 수 있다.
부정 표현 사용 여부(235)는 비수지 표현으로 자주 나타나는데, 고개 좌우로 움직임, 눈의 움직임, 입술의 움직임 등을 통합하여 나타낼 수 있다.
도 3은 본 발명의 실시예에 따른 언어학적 자질들을 병렬적으로 임베딩하여 결합하는 프로세스를 도시한 것이다.
도 3을 참조하면, 본 발명의 실시예에 따른 구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법 및 그 장치는 한국어 문장과 추출된 언어학적 자질들을 병렬적으로 임베딩하여 결합하는 예시 프로세스(300)를 수행할 수 있다.
예를 들면, 한국어 문장(210)을 단위 단어 또는 형태소 단위로 나눈 것을 X={x1, x2, … , xn}이라고 하며, 여기서 n은 문장 내 단어 또는 형태소의 개수이다. xi는 추출 프로세스(220)에 의해 추출된 한국어 문장(210)의 언어학적 자질들과 함께 병렬 임베딩층(310)으로 전달되며, 병렬 임베딩층(310)에서 한국어 단어(형태소)와 형태소 분석 결과, 문장 유형 결과, 문장 태 분석 결과, 문장 시제 분석 결과 및 부정 표현 분석 결과의 총 6개의 언어학적 자질들 값이 병렬적으로 임베딩될 수 있다.
이 때, 6개의 임베딩 값은 임베딩 결합층(320)으로 전달되고, 하기의 [수학식 1]과 같이 정의될 수 있다.
[수학식 1]
여기서 fki는 i번째 단어(형태소)의 k번째 언어학적 자질을 나타내며, vi는 i번째 벡터화된 한국어 단어를 나타낸다. 이에, 본 발명은 벡터화된 한국어 단어 vi를 연속으로 이어 벡터화된 한국어 문장(330)을 획득할 수 있다.
도 4는 본 발명의 실시예에 따른 벡터화된 문장으로부터 수어 단어 시퀀스를 출력하는 프로세스를 도시한 것이다.
도 4를 참조하면, 본 발명의 실시예에 따른 구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법 및 그 장치는 인공신경망 번역 모델을 사용하여 벡터화된 한국어 문장으로부터 한국수어 단어 시퀀스를 추출하는 출력 프로세스(400)를 수행할 수 있다.
예를 들면, 벡터화된 한국어 문장(330)이 인공신경망 번역 모델 내 입력으로 주어지면, 인코더(410)에 먼저 전달되고, 모든 전달된 값은 주의 층(430)에 의해 문맥 정보로 변환되며, 이를 디코더(420)의 출력(440)을 예상하는데 사용할 수 있다. 도 4에서 s는 출력 직전의 최종 은닉 층(hidden layer)을 나타내며, 이 출력 값은 다음 단어를 예측하는데 사용된다.
최종 출력 시퀀스 Y={y1, y2, … , yn}는 수어 단어 시퀀스(440)일 수 있다. 이 때 수어 단어는 글로스(gloss)라는 수어 단어의 표제어로 정의되며, 수어 글로스는 주로 수지 정보를 나타내는데 사용되지만 비수지 정보를 포함해서 표기될 수도 있다.
본 발명은 최종 출력 값(440)을 수지 정보와 비수지 정보를 포함하는 수어 글로스의 시퀀스로 정의하며, 한국수어 단어 시퀀스를 출력할 수 있다.
도 4의 인공신경망 번역 모델에서 RNN으로 사용된 셀은 통상적인 표기이며, 이는 GRU, LSTM 또는 Bi-LSTM로 표기 및 대체될 수 있다.
도 5는 본 발명의 실시예에 따른 구어 및 수어 병렬 말뭉치를 사용하여 인공신경망 번역 모델을 학습시키는 프로세스를 도시한 것이다.
도 5를 참조하면, 본 발명의 실시예에 따른 구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법 및 그 장치는 한국어 및 한국수어 병렬 말뭉치를 사용하여 주의 기반 인공신경망 번역 모델을 학습시키는 학습 프로세스를 수행할 수 있다.
본 발명은 인공신경망 번역 모델을 학습시키기 위해 한국어 문장(522)과 이에 대응하는 한국수어 단어 시퀀스(521) 쌍으로 이루어진 한국어 - 한국수어 병렬 말뭉치(510)를 사용한다.
이 때, 한국어 문장(522)은 도 2 내지 도 4의 프로세스를 통해 동일한 과정(530, 540)이 수행되며, 추출 프로세스(220), 예시 프로세스(300) 및 출력 프로세스(400)를 통해 획득된 벡터화된 한국어 단어와 한국수어 단어 시퀀스(521)를 각각 인코더 및 디코더에 전달하여 주의 기반 인공신경망 기계 번역 모델을 학습시킬 수 있다(550).
학습이 완료되면, 본 발명은 도 1에 도시된 알고리즘과 같이 인공신경망 번역 모델을 사용할 수 있다.
도 6은 본 발명의 실시예에 따른 구어에서 수어로의 기계 번역 장치의 세부 구성을 블록도로 도시한 것이다.
도 6을 참조하면, 본 발명의 실시예에 따른 구어에서 수어로의 기계 번역 장치는 주의 기반 인공신경망 기계 번역 모델을 사용하여 구어에서 수어로 번역한다.
이를 위해, 본 발명의 실시예에 따른 구어에서 수어로의 기계 번역 장치(600)는 추출부(610), 결합부(620) 및 출력부(630)를 포함하며, 학습부(640)를 더 포함할 수 있다.
추출부(610)는 구어 문장에서 언어학적 자질들을 추출한다.
추출부(610)는 구어 문장을 형태소, 문장 유형, 문장 태, 문장 시제 및 부정 표현으로 분석하여 언어학적 자질들을 추출할 수 있다. 예를 들면, 추출부(610)는 한국어 문장에 해당하는 언어학적 분석 결과를 토대로, 형태소, 문장 유형, 문장 태, 문장 시제 및 부정 표현의 언어학적 자질들로 추출할 수 있다.
결합부(620)는 구어 문장 및 언어학적 자질들을 병렬 임베딩하여 하나의 벡터로 결합한다.
결합부(620)는 구어 문장과 그에 대응하는 언어학적 자질들을 병렬 인코딩하며, 인코딩된 벡터들을 하나의 벡터로 결합하여 벡터화된 문장을 획득할 수 있다.
예를 들면, 추출부(610)에서 추출된 언어학적 자질들과 한국어 문장은 결합부(620)에서 인공신경망 번역 모델의 입력값으로 제공하기 위해 병렬적으로 임베딩을 한 후, 하나의 벡터로 결합되어 단어(또는 형태소) 당 하나의 벡터로 표기될 수 있다. 보다 구체적으로, 결합부(620)는 한국어 문장의 단어(형태소)와 언어학적 자질들을 나타내는 형태소 분석 결과, 문장 유형 결과, 문장 태 분석 결과, 문장 시제 분석 결과 및 부정 표현 분석 결과의 6개의 값을 병렬적으로 임베딩하며, 6개의 임베딩 값을 결합하여 벡터화된 문장 또는 벡터화된 한국어 문장을 획득할 수 있다.
출력부(630)는 결합된 벡터에 의한 벡터화된 문장을 인공신경망 번역 모델에 입력하여 수어 단어 시퀀스를 출력한다.
예를 들면, 출력부(630)는 벡터화된 한국어 문장을 인공신경망 번역 모델에 입력값으로 사용하여 한국어 문장에 대응되는 한국수어 단어 시퀀스를 출력할 수 있다. 보다 구체적으로, 출력부(630)는 인공신경망 번역 모델에 입력된 벡터화된 문장을 인코더에 전달하며, 전달된 값을 주의 층에 의해 문맥 정보로 변환하여 디코더의 출력으로 사용할 수 있다. 이에, 출력부(630)는 디코더의 출력 값으로 수지 정보와 비수지 정보를 포함하는 수어 단어 시퀀스를 출력할 수 있다.
학습부(640)는 구어 및 수어 병렬 말뭉치를 사용하여 주의 기반 인공신경망 번역 모델을 학습시킬 수 있다.
예를 들면, 학습부(640)는 구어 문장과 이에 대응하는 수어 단어 시퀀스의 쌍을 나타내는 구어 및 수어 병렬 말뭉치를 사용하여 인공신경망 번역 모델을 학습시킬 수 있다.
비록, 도 6의 장치에서 그 설명이 생략되었더라도, 본 발명에 따른 장치는 상기 도 1 내지 도 5에서 설명한 모든 내용을 포함할 수 있다는 것은 이 기술 분야에 종사하는 당업자에게 있어서 자명하다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
Claims (16)
- 구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법에 있어서,
구어 문장에서 형태소, 문장 유형, 문장 태, 문장 시제 및 부정 표현으로 분석하여 언어학적 자질들을 추출하는 단계;
상기 구어 문장 및 상기 언어학적 자질들을 병렬 임베딩하여 하나의 벡터로 결합하는 단계; 및
상기 결합된 벡터에 의한 벡터화된 문장을 인공신경망 번역 모델에 입력하여 수어 단어 시퀀스를 출력하는 단계를 포함하되,
구어 및 수어 병렬 말뭉치를 사용하여 주의 기반 상기 인공신경망 번역 모델을 학습시키는 단계를 더 포함하며,
상기 하나의 벡터로 결합하는 단계는
상기 구어 문장의 단어(형태소)와 형태소 분석 결과, 문장 유형 결과, 문장 태 분석 결과, 문장 시제 분석 결과 및 부정 표현 분석 결과의 6개의 값을 병렬적으로 임베딩하며, 상기 6개의 임베딩 값을 결합하여 상기 벡터화된 문장을 획득하고,
상기 수어 단어 시퀀스를 출력하는 단계는
상기 인공신경망 번역 모델에 입력된 상기 벡터화된 문장을 인코더에 전달하며, 전달된 값을 주의 층에 의해 문맥 정보로 변환하여 디코더의 출력으로 사용하는, 구어에서 수어로의 기계 번역 방법. - 삭제
- 삭제
- 제1항에 있어서,
상기 하나의 벡터로 결합하는 단계는
상기 구어 문장과 그에 대응하는 상기 언어학적 자질들을 병렬 인코딩하며, 인코딩된 벡터들을 하나의 벡터로 결합하여 상기 벡터화된 문장을 획득하는, 구어에서 수어로의 기계 번역 방법. - 삭제
- 삭제
- 제1항에 있어서,
상기 수어 단어 시퀀스를 출력하는 단계는
상기 디코더의 출력 값으로 수지 정보와 비수지 정보를 포함하는 상기 수어 단어 시퀀스를 출력하는, 구어에서 수어로의 기계 번역 방법. - 제1항에 있어서,
상기 인공신경망 번역 모델을 학습시키는 단계는
상기 구어 문장과 이에 대응하는 상기 수어 단어 시퀀스의 쌍을 나타내는 상기 구어 및 수어 병렬 말뭉치를 사용하여 상기 인공신경망 번역 모델을 학습시키는 것을 특징으로 하는, 구어에서 수어로의 기계 번역 방법. - 구어에서 수어로의 주의 기반 인공신경망 기계 번역 장치에 있어서,
구어 문장에서 형태소, 문장 유형, 문장 태, 문장 시제 및 부정 표현으로 분석하여 언어학적 자질들을 추출하는 추출부;
상기 구어 문장 및 상기 언어학적 자질들을 병렬 임베딩하여 하나의 벡터로 결합하는 결합부; 및
상기 결합된 벡터에 의한 벡터화된 문장을 인공신경망 번역 모델에 입력하여 수어 단어 시퀀스를 출력하는 출력부를 포함하되,
구어 및 수어 병렬 말뭉치를 사용하여 주의 기반 상기 인공신경망 번역 모델을 학습시키는 학습부를 더 포함하며,
상기 결합부는
상기 구어 문장의 단어(형태소)와 형태소 분석 결과, 문장 유형 결과, 문장 태 분석 결과, 문장 시제 분석 결과 및 부정 표현 분석 결과의 6개의 값을 병렬적으로 임베딩하며, 상기 6개의 임베딩 값을 결합하여 상기 벡터화된 문장을 획득하고,
상기 출력부는
상기 인공신경망 번역 모델에 입력된 상기 벡터화된 문장을 인코더에 전달하며, 전달된 값을 주의 층에 의해 문맥 정보로 변환하여 디코더의 출력으로 사용하는, 구어에서 수어로의 기계 번역 장치. - 삭제
- 삭제
- 제9항에 있어서,
상기 결합부는
상기 구어 문장과 그에 대응하는 상기 언어학적 자질들을 병렬 인코딩하며, 인코딩된 벡터들을 하나의 벡터로 결합하여 상기 벡터화된 문장을 획득하는, 구어에서 수어로의 기계 번역 장치. - 삭제
- 삭제
- 제9항에 있어서,
상기 출력부는
상기 디코더의 출력 값으로 수지 정보와 비수지 정보를 포함하는 상기 수어 단어 시퀀스를 출력하는, 구어에서 수어로의 기계 번역 장치. - 제9항에 있어서,
상기 학습부는
상기 구어 문장과 이에 대응하는 상기 수어 단어 시퀀스의 쌍을 나타내는 상기 구어 및 수어 병렬 말뭉치를 사용하여 상기 인공신경망 번역 모델을 학습시키는 것을 특징으로 하는, 구어에서 수어로의 기계 번역 장치.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20190057760 | 2019-05-17 | ||
KR1020190057760 | 2019-05-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200132619A KR20200132619A (ko) | 2020-11-25 |
KR102258906B1 true KR102258906B1 (ko) | 2021-06-01 |
Family
ID=73645231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190086169A KR102258906B1 (ko) | 2019-05-17 | 2019-07-17 | 구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법 및 그 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102258906B1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102370993B1 (ko) * | 2021-05-25 | 2022-03-07 | 주식회사 디블렌트 | 신경망 기반의 실시간 수어 통역 및 대화를 지원하는 인공지능 시스템 |
KR102713671B1 (ko) * | 2021-06-29 | 2024-10-07 | 한국전자기술연구원 | 글로스 단위 수어 통번역 데이터 자동 증강 방법 및 시스템 |
CN113780059B (zh) * | 2021-07-24 | 2024-07-19 | 上海大学 | 一种基于多特征点的连续手语识别方法 |
CN114840670A (zh) * | 2022-04-28 | 2022-08-02 | 北京智谱华章科技有限公司 | 一种中文文本到手语词序列的翻译方法及装置 |
KR102571899B1 (ko) * | 2022-10-20 | 2023-08-30 | 주식회사 인피닉 | 수어 텍스트 번역 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 |
KR102571902B1 (ko) * | 2023-03-09 | 2023-08-30 | 주식회사 인피닉 | 트랜스포머를 이용한 수어 글로스 번역 방법 및 이를 실행하기 위하여 기록매체에 기록된 컴퓨터 프로그램 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102061044B1 (ko) | 2013-04-30 | 2020-01-02 | 삼성전자 주식회사 | 수화 번역 및 화면 해설 서비스 방법 및 시스템 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102342066B1 (ko) * | 2017-06-21 | 2021-12-22 | 삼성전자주식회사 | 뉴럴 네트워크 모델을 이용한 기계 번역 방법, 장치 및 그 장치를 학습시키기 위한 방법 |
KR102069692B1 (ko) * | 2017-10-26 | 2020-01-23 | 한국전자통신연구원 | 신경망 기계번역 방법 및 장치 |
-
2019
- 2019-07-17 KR KR1020190086169A patent/KR102258906B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102061044B1 (ko) | 2013-04-30 | 2020-01-02 | 삼성전자 주식회사 | 수화 번역 및 화면 해설 서비스 방법 및 시스템 |
Non-Patent Citations (1)
Title |
---|
조정란 외, ‘수화번역시스템을 위한 인공신경망의 응용’, 한국컴퓨터정보학회 논문지 24(2), 2019.02.* |
Also Published As
Publication number | Publication date |
---|---|
KR20200132619A (ko) | 2020-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102258906B1 (ko) | 구어에서 수어로의 주의 기반 인공신경망 기계 번역 방법 및 그 장치 | |
KR102382499B1 (ko) | 번역 방법, 타깃 정보 결정 방법, 관련 장치 및 저장 매체 | |
JP2023509031A (ja) | マルチモーダル機械学習に基づく翻訳方法、装置、機器及びコンピュータプログラム | |
KR102589637B1 (ko) | 기계 번역 방법 및 장치 | |
WO2020215551A1 (zh) | 合成中文语音的方法、装置、设备及存储介质 | |
CN112487182A (zh) | 文本处理模型的训练方法、文本处理方法及装置 | |
CN106227721B (zh) | 汉语韵律层级结构预测系统 | |
CN107967262A (zh) | 一种神经网络蒙汉机器翻译方法 | |
KR102315830B1 (ko) | 반지도 학습 기반 단어 단위 감정 임베딩과 lstm 모델을 이용한 대화 내에서 발화의 감정 분류 방법 | |
CN110196967A (zh) | 基于深度转换架构的序列标注方法和装置 | |
JP6946842B2 (ja) | モデル学習装置、変換装置、方法、及びプログラム | |
CN111951781A (zh) | 一种基于图到序列的中文韵律边界预测的方法 | |
CN111144140A (zh) | 基于零次学习的中泰双语语料生成方法及装置 | |
KR20210044559A (ko) | 출력 토큰 결정 방법 및 장치 | |
CN113129862B (zh) | 一种基于world-tacotron的语音合成方法、系统及服务器 | |
CN115719072A (zh) | 一种基于掩码机制的篇章级神经机器翻译方法及系统 | |
CN113823259B (zh) | 将文本数据转换为音素序列的方法及设备 | |
CN118194238B (zh) | 一种多语种多模态情感识别方法、系统及设备 | |
KR102674639B1 (ko) | 신경망 모델 기반 암호문을 복호화하기 위한 전자 장치 및 전자 장치의 제어 방법 | |
KR20240100864A (ko) | 멀티모달 데이터 융합 기반의 감정인식 시스템 및 방법 | |
CN112989845B (zh) | 一种基于路由算法的篇章级神经机器翻译方法及系统 | |
CN113051939A (zh) | 基于G-Transformer的机器翻译方法研究 | |
CN111241233B (zh) | 基于关键动词特征全密度传递的服务机器人指令解析方法 | |
CN114694633A (zh) | 语音合成方法、装置、设备及存储介质 | |
KR20180118906A (ko) | 형태소 분석 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |