JP7511614B2 - Synapperモデルユニットを用いた自然語処理システム及び方法 - Google Patents
Synapperモデルユニットを用いた自然語処理システム及び方法 Download PDFInfo
- Publication number
- JP7511614B2 JP7511614B2 JP2022157480A JP2022157480A JP7511614B2 JP 7511614 B2 JP7511614 B2 JP 7511614B2 JP 2022157480 A JP2022157480 A JP 2022157480A JP 2022157480 A JP2022157480 A JP 2022157480A JP 7511614 B2 JP7511614 B2 JP 7511614B2
- Authority
- JP
- Japan
- Prior art keywords
- synapper
- data
- code
- natural language
- language processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 55
- 238000003058 natural language processing Methods 0.000 title claims description 47
- 238000012545 processing Methods 0.000 claims description 50
- 230000001537 neural effect Effects 0.000 claims description 40
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 17
- 238000013519 translation Methods 0.000 description 12
- 230000014616 translation Effects 0.000 description 12
- 241000282412 Homo Species 0.000 description 6
- 210000004556 brain Anatomy 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000007664 blowing Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Machine Translation (AREA)
- Devices For Executing Special Programs (AREA)
Description
110 入力装置
120 アナログ-デジタル変換器(ADC)
160 第1コード変換器(WNC:Word-to-NCC Converter)
170 第2コード変換器(NWC:NCC-to-Word Converter)
180 デジタル-アナログ変換器(DAC)
190 出力装置
200 言語処理装置(LPU)
210 制御装置
220 レジスタ
230 Synapperモデルユニット(SMU)
240 キャッシュメモリ
310 テキストランダムアクセスメモリ(TRAM)
320 フラッシュメモリ
Claims (5)
- コンピュータが実行する自然語処理方法であって、
自然語で書かれたり発音されたテキストを受け取り、これを単語で構成された文章に変換する前処理段階;
前記前処理段階を通じて前記単語で構成された文章内の各単語を、第1コード変換器(WNC)を通じて、2進数の神経概念コード(NCC)に変換する第1変換段階;
前記第1変換段階を通じて変換された前記神経概念コードを言語処理装置のSynapperモデルに入力する段階;
前記言語処理装置の前記Synapperモデルを通じて認識された前記神経概念コードを解釈し、解釈されたデータを出力する解釈及び出力段階;
前記言語処理装置で解釈されて出力されたデータの前記神経概念コードを、第2コード変換器(NWC)を通じて単語データに変換する第2変換段階;及び
前記第2変換段階を通じて変換された前記単語データを、前記解釈されたデータとして出力する解釈データ出力段階;を含み、
前記解釈及び出力段階における前記神経概念コードの解釈では、前記神経概念コードの10進数表現で最初の2桁を2進数で表した数字を用いて前記文章の構文構造が決定される、自然語処理方法。 - 前記解釈及び出力段階では、
レジスタセットで、前記神経概念コード(NCC)の前記最初の2桁が示す品詞を、前記Synapperモデルで用いられる前記品詞に関する規則を通じて分析し、前記文章の前記構文構造を決定する、請求項1に記載の自然語処理方法。 - 前記解釈及び出力段階では、
前記構文構造が決定された前記文章内の各単語の前記神経概念コード(NCC)を、前記解釈されたデータとして出力する、請求項1に記載の自然語処理方法。 - 前記解釈及び出力段階では、
キャッシュメモリは、前記Synapperモデルを通じて解釈されたデータを、出力を生成するために臨時に格納する、請求項1に記載の自然語処理方法。 - 自然語で書かれた文章を入力する入力装置;
前記入力装置に入力されたアナログデータをデジタルデータに変換するアナログ-デジタル変換器(ADC);
前記デジタルデータに変換されたデータを、2進数の神経概念コードに変換する第1コード変換器(WNC);
前記第1コード変換器(WNC)を通じて入力される前記神経概念コードをSynapperモデルを通じて解釈して出力する言語処理装置;
前記言語処理装置から出力された前記神経概念コードを、解釈された単語データに変換する第2コード変換器(NWC);
前記第2コード変換器(NWC)を通じて変換された前記単語データであるデジタルデータをアナログデータに変換するデジタル-アナログ変換器(DAC);及び
前記デジタル-アナログ変換器(DAC)を通じて変換されたデータを、解釈された自然語で出力する出力装置;を含み、
前記言語処理装置による前記神経概念コードの解釈では、前記神経概念コードの10進数表現で最初の2桁を2進数で表した数字を用いて前記文章の構文構造が決定される、Synapperモデルユニットを用いた自然語処理システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2022-0096224 | 2022-08-02 | ||
KR1020220096224A KR20240018229A (ko) | 2022-08-02 | 2022-08-02 | 시내퍼 모델을 이용한 자연어 처리 시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2024021023A JP2024021023A (ja) | 2024-02-15 |
JP7511614B2 true JP7511614B2 (ja) | 2024-07-05 |
Family
ID=83546721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022157480A Active JP7511614B2 (ja) | 2022-08-02 | 2022-09-30 | Synapperモデルユニットを用いた自然語処理システム及び方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11636275B1 (ja) |
EP (1) | EP4318300A1 (ja) |
JP (1) | JP7511614B2 (ja) |
KR (2) | KR20240018229A (ja) |
CN (1) | CN117494696A (ja) |
CA (1) | CA3197945A1 (ja) |
TW (1) | TWI822370B (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004295884A (ja) | 2003-03-25 | 2004-10-21 | Microsoft Corp | 自然言語生成システムの文章実現における順序付けのための構成素構造の言語的な情報に基づく統計モデル |
US20130013291A1 (en) | 2011-07-06 | 2013-01-10 | Invertix Corporation | Systems and methods for sentence comparison and sentence-based search |
JP2018018286A (ja) | 2016-07-27 | 2018-02-01 | 富士通株式会社 | 符号化プログラム、符号化装置、符号化方法、及び検索方法 |
US20200243076A1 (en) | 2019-01-27 | 2020-07-30 | Min Ku Kim | Multi-Dimensional Parsing Method and System for Natural Language Processing |
JP2020161111A (ja) | 2019-03-27 | 2020-10-01 | ワールド ヴァーテックス カンパニー リミテッド | 神経網基盤機械翻訳およびマスコーパス(Math Corpus)を利用した数学問題概念類型予測サービス提供方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4914590A (en) * | 1988-05-18 | 1990-04-03 | Emhart Industries, Inc. | Natural language understanding system |
AUPR956901A0 (en) * | 2001-12-17 | 2002-01-24 | Jayaratne, Neville | Real time translator |
US7433893B2 (en) * | 2004-03-08 | 2008-10-07 | Marpex Inc. | Method and system for compression indexing and efficient proximity search of text data |
JP5309480B2 (ja) * | 2007-06-14 | 2013-10-09 | 沖電気工業株式会社 | 文字列入力装置、文字列入力方法およびプログラム |
US20100121630A1 (en) * | 2008-11-07 | 2010-05-13 | Lingupedia Investments S. A R. L. | Language processing systems and methods |
CN108287858B (zh) * | 2017-03-02 | 2021-08-10 | 腾讯科技(深圳)有限公司 | 自然语言的语义提取方法及装置 |
TWI660340B (zh) * | 2017-11-03 | 2019-05-21 | 財團法人資訊工業策進會 | 聲控方法及系統 |
CN111368923B (zh) * | 2020-03-05 | 2023-12-19 | 上海商汤智能科技有限公司 | 神经网络训练方法及装置、电子设备和存储介质 |
US11544457B2 (en) * | 2020-03-25 | 2023-01-03 | Adobe Inc. | Machine learning based abbreviation expansion |
US20220050967A1 (en) * | 2020-08-11 | 2022-02-17 | Adobe Inc. | Extracting definitions from documents utilizing definition-labeling-dependent machine learning background |
TWI769520B (zh) * | 2020-09-07 | 2022-07-01 | 和碩聯合科技股份有限公司 | 多國語言語音辨識及翻譯方法與相關的系統 |
TWM607509U (zh) * | 2020-09-25 | 2021-02-11 | 國泰人壽保險股份有限公司 | 語音服務系統 |
KR102427934B1 (ko) | 2020-10-15 | 2022-08-02 | 한동대학교 산학협력단 | 신경망 기반의 고유명사 기호화를 이용한 번역 방법 및 그 시스템 |
US11837221B2 (en) * | 2021-02-26 | 2023-12-05 | Rovi Guides, Inc. | Age-sensitive automatic speech recognition |
US11119985B1 (en) * | 2021-03-19 | 2021-09-14 | Atlassian Pty Ltd. | Apparatuses, methods, and computer program products for the programmatic documentation of extrinsic event based data objects in a collaborative documentation service |
-
2022
- 2022-08-02 KR KR1020220096224A patent/KR20240018229A/ko not_active IP Right Cessation
- 2022-09-29 TW TW111137024A patent/TWI822370B/zh active
- 2022-09-30 EP EP22199147.4A patent/EP4318300A1/en active Pending
- 2022-09-30 JP JP2022157480A patent/JP7511614B2/ja active Active
- 2022-11-10 US US17/984,711 patent/US11636275B1/en active Active
-
2023
- 2023-04-26 CA CA3197945A patent/CA3197945A1/en active Pending
- 2023-05-19 CN CN202310573593.XA patent/CN117494696A/zh active Pending
- 2023-11-03 KR KR1020230151022A patent/KR20240018401A/ko not_active Application Discontinuation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004295884A (ja) | 2003-03-25 | 2004-10-21 | Microsoft Corp | 自然言語生成システムの文章実現における順序付けのための構成素構造の言語的な情報に基づく統計モデル |
US20130013291A1 (en) | 2011-07-06 | 2013-01-10 | Invertix Corporation | Systems and methods for sentence comparison and sentence-based search |
JP2018018286A (ja) | 2016-07-27 | 2018-02-01 | 富士通株式会社 | 符号化プログラム、符号化装置、符号化方法、及び検索方法 |
US20200243076A1 (en) | 2019-01-27 | 2020-07-30 | Min Ku Kim | Multi-Dimensional Parsing Method and System for Natural Language Processing |
JP2020161111A (ja) | 2019-03-27 | 2020-10-01 | ワールド ヴァーテックス カンパニー リミテッド | 神経網基盤機械翻訳およびマスコーパス(Math Corpus)を利用した数学問題概念類型予測サービス提供方法 |
Also Published As
Publication number | Publication date |
---|---|
TW202407576A (zh) | 2024-02-16 |
CN117494696A (zh) | 2024-02-02 |
KR20240018401A (ko) | 2024-02-13 |
KR20240018229A (ko) | 2024-02-13 |
EP4318300A1 (en) | 2024-02-07 |
JP2024021023A (ja) | 2024-02-15 |
US11636275B1 (en) | 2023-04-25 |
TWI822370B (zh) | 2023-11-11 |
CA3197945A1 (en) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kalyan et al. | Ammus: A survey of transformer-based pretrained models in natural language processing | |
JP7072585B2 (ja) | 文脈固有の単語ベクトルを用いた自然言語処理 | |
Zhang et al. | A simple and effective neural model for joint word segmentation and POS tagging | |
Zhang et al. | SG-Net: Syntax guided transformer for language representation | |
US12045569B2 (en) | Graph-based cross-lingual zero-shot transfer | |
US12050870B2 (en) | Cross-lingual zero-shot transfer via semantic and synthetic representation learning | |
Chennoufi et al. | Morphological, syntactic and diacritics rules for automatic diacritization of Arabic sentences | |
Wang et al. | Automatic paper writing based on a RNN and the TextRank algorithm | |
Yang et al. | Improving tree-based neural machine translation with dynamic lexicalized dependency encoding | |
Ballesteros et al. | Greedy transition-based dependency parsing with stack lstms | |
Li et al. | Empowering Large Language Models for Textual Data Augmentation | |
US11544468B2 (en) | Document text extraction to field-specific computer executable operations | |
JP7511614B2 (ja) | Synapperモデルユニットを用いた自然語処理システム及び方法 | |
Han et al. | Lexicalized neural unsupervised dependency parsing | |
Lee et al. | Ensemble multi-channel neural networks for scientific language editing evaluation | |
Nawar et al. | Fast and robust arabic error correction system | |
CN115809658A (zh) | 平行语料的生成方法及装置和无监督同义转写方法及装置 | |
Arwidarasti et al. | Converting an Indonesian constituency treebank to the Penn treebank format | |
Haertel et al. | Automatic diacritization for low-resource languages using a hybrid word and consonant CMM | |
WO2014030258A1 (ja) | 形態素解析装置、テキスト分析方法、及びそのプログラム | |
Rahman et al. | Dense word representation utilization in Indonesian dependency parsing | |
Kumar et al. | Efficient text normalization via hybrid bi-directional lstm | |
do Carmo | Chasing the Complexity of Threads from the Translation Process that Hide in Translation Data | |
de Paula Barros Baêta et al. | Top-Down Parsing Error Correction Applied to Part of Speech Tagging | |
Chan | Automatic linguistic resolution: framework and applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240528 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240625 |