JP2021524623A - 質問応答としてのマルチタスク学習 - Google Patents
質問応答としてのマルチタスク学習 Download PDFInfo
- Publication number
- JP2021524623A JP2021524623A JP2020564520A JP2020564520A JP2021524623A JP 2021524623 A JP2021524623 A JP 2021524623A JP 2020564520 A JP2020564520 A JP 2020564520A JP 2020564520 A JP2020564520 A JP 2020564520A JP 2021524623 A JP2021524623 A JP 2021524623A
- Authority
- JP
- Japan
- Prior art keywords
- word
- question
- context
- distribution
- decoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009826 distribution Methods 0.000 claims abstract description 49
- 238000003058 natural language processing Methods 0.000 claims abstract description 15
- 239000002131 composite material Substances 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims description 116
- 238000000034 method Methods 0.000 claims description 60
- 238000013519 translation Methods 0.000 claims description 22
- 238000000605 extraction Methods 0.000 claims description 15
- 238000002372 labelling Methods 0.000 claims description 15
- 230000006403 short-term memory Effects 0.000 claims description 6
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 230000007787 long-term memory Effects 0.000 claims 1
- 238000013459 approach Methods 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 21
- 238000010606 normalization Methods 0.000 description 10
- 230000015654 memory Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 238000012546 transfer Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 5
- 230000008451 emotion Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- BYHQTRFJOGIQAO-GOSISDBHSA-N 3-(4-bromophenyl)-8-[(2R)-2-hydroxypropyl]-1-[(3-methoxyphenyl)methyl]-1,3,8-triazaspiro[4.5]decan-2-one Chemical compound C[C@H](CN1CCC2(CC1)CN(C(=O)N2CC3=CC(=CC=C3)OC)C4=CC=C(C=C4)Br)O BYHQTRFJOGIQAO-GOSISDBHSA-N 0.000 description 1
- WNEODWDFDXWOLU-QHCPKHFHSA-N 3-[3-(hydroxymethyl)-4-[1-methyl-5-[[5-[(2s)-2-methyl-4-(oxetan-3-yl)piperazin-1-yl]pyridin-2-yl]amino]-6-oxopyridin-3-yl]pyridin-2-yl]-7,7-dimethyl-1,2,6,8-tetrahydrocyclopenta[3,4]pyrrolo[3,5-b]pyrazin-4-one Chemical compound C([C@@H](N(CC1)C=2C=NC(NC=3C(N(C)C=C(C=3)C=3C(=C(N4C(C5=CC=6CC(C)(C)CC=6N5CC4)=O)N=CC=3)CO)=O)=CC=2)C)N1C1COC1 WNEODWDFDXWOLU-QHCPKHFHSA-N 0.000 description 1
- CYJRNFFLTBEQSQ-UHFFFAOYSA-N 8-(3-methyl-1-benzothiophen-5-yl)-N-(4-methylsulfonylpyridin-3-yl)quinoxalin-6-amine Chemical compound CS(=O)(=O)C1=C(C=NC=C1)NC=1C=C2N=CC=NC2=C(C=1)C=1C=CC2=C(C(=CS2)C)C=1 CYJRNFFLTBEQSQ-UHFFFAOYSA-N 0.000 description 1
- 101000805606 Deinagkistrodon acutus Zinc metalloproteinase-disintegrin-like acurhagin Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
- G06F16/90332—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B7/00—Electrically-operated teaching apparatus or devices working with questions and answers
- G09B7/02—Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Machine Translation (AREA)
Abstract
Description
[外1]
の要素として符号化される。いくつかの例において、各ワードの符号化は、文字n−gram符号化に基づき、ここで、各ワードが
[外2]
の要素として符号化される。いくつかの例において、各ワードの符号化はGloVe符号化と文字のn−gram符号化の連結に基づく。いくつかの例において、ワードに対してGloVeおよび/または文字n−gram符号化がないとき(例えば、ワードが英語でないとき)に、ランダム符号化は、GloVe符号化と同じ平均および標準偏差(例えば、平均ゼロおよび標準偏差0.4)を有する正規分布から選択され、そのランダム符号化がそれぞれのワードの各出現に対して一貫して使用される。いくつかの例において、ワードに対してGloVeおよび/または文字n−gram符号化が存在しないとき(例えば、ワードが英語でないとき)に、ゼロの値が使用される。いくつかの例において、訓練中に、正解は、式1にも示されるように、同様に符号化され、ここで、nは、正解におけるワードまたはトークンの数に対応する。
[外3]
および
[外4]
の連結としてhiとしての各時間ステップiにおいて出力を生成し、ここで、xは、biLSTM330への入力であり、LSTMは、長短期記憶ネットワークに対応する。いくつかの例において、BiLSTM330は、入力に対して0.2のドロップアウトを使用する。
[外5]
および
[外6]
にある。
[外7]
および
[外8]
を得る。
[外9]
、キー
[外10]
、および値
[外11]
を受信する。q、k、およびvの各々は、式10に従って、それぞれの重みWQ410、WK420、およびWV430に従う。重みWQ410、WK420、およびWV430は、逆伝播を使用して訓練中に変更される。
[外12]
、および前の反復からの中間状態ht−1を使用して、現在の反復の中間状態htを生成する。いくつかの例において、LSTM640は、入力に対して0.2のドロップアウトを使用する。
[外13]
および質問表現
[外14]
を生成し、ここで、W4およびW5は、訓練可能な重みであり、tanhは、双曲線正接伝達関数である。いくつかの例において、コンテキストおよび質問アテンションネットワーク650は、式21内に訓練可能なバイアスb4およびb5を任意選択で含めてもよい。いくつかの例において、他の非線形伝達関数が式21と共に使用され得る。
[外15]
にあるように、各分布における欠落エントリを0に設定することによって、コンテキスト、質問、および生成語彙におけるトークンの結合に対して分布pc、pq、およびpvを拡張する。
[外16]
に設定される。いくつかの例において、学習速度は、k−1/2で減衰される前の最初の800回の反復で、0から2.5x10−3まで直線的に増加され、ここで、kは反復カウントである。いくつかの例において、逆伝播に使用される勾配は、1.0にクリップされてもよい。
Claims (20)
- 自然言語処理のためのシステムであって、
コンテキストからの第1のワードと質問からの第2のワードを並列して符号化するための多層符号化器と、
符号化された前記コンテキストおよび符号化された前記質問を復号するための多層復号器と、
前記復号器からの出力に基づいて、前記コンテキストからの前記第1のワード、前記質問からの前記第2のワード、および語彙の第3のワードに対する分布を生成するためのポインタ生成器と、
スイッチであって、
前記コンテキストからの前記第1のワードに対する前記分布、前記質問からの前記第2のワードに対する前記分布、および前記語彙の前記第3のワードに対する前記分布の重みを生成し、
前記コンテキストからの前記第1のワードに対する前記分布、前記質問からの前記第2のワードに対する前記分布、および前記語彙の前記第3のワードに対する前記分布の前記重みに基づいて、複合分布を生成し、
前記複合分布を使用して、答えに含めるワードを選択するためのスイッチと、を含む、システム。 - 前記コンテキストおよび前記質問は、質問応答、機械翻訳、文書要約、データベースクエリ生成、感情分析、自然言語推論、意味役割ラベル付け、関係抽出、目標指向対話、および代名詞解決から選択される自然言語処理タスクタイプに対応する、請求項1に記載のシステム。
- 前記多層符号化器は、
前記コンテキスト内の前記第1のワードと前記質問内の前記第2のワードとの間のコアテンションを決定するためのコアテンションネットワークと、
前記コアテンションネットワークからの出力を圧縮するための並列双方向長短期記憶と、を含む、請求項1または2に記載のシステム。 - 前記多層符号化器は、
前記コンテキストにわたるアテンションと前記質問にわたるアテンションを並列して生成するための並列セルフアテンション符号化器と、
生成された前記アテンションに基づいて、前記コンテキストおよび前記質問の最終符号化を並列して生成するための並列双方向長短期記憶と、を含む、請求項1〜3のいずれか一項に記載のシステム。 - 前記多層符号化器は、
前記コンテキストからの前記第1のワードと前記質問からの前記第2のワードを並列して符号化するための並列符号化層と、
前記コンテキストからの前記第1のワードと前記質問からの前記第2のワードの前記符号化を並列して投影するための並列線形ネットワークと、
前記符号化の前記投影をさらに符号化するための双方向長短期記憶と、を含む、請求項1〜4のいずれか一項に記載のシステム。 - 前記多層復号器は、
前記答えの中間バージョンを符号化し埋め込むための符号化および埋め込み層と、
前記答えの符号化および埋め込まれた前記中間バージョンと前記コンテキストの最終符号化との間のアテンションを生成するためのセルフアテンション復号器と、
前記セルフアテンション復号器の出力から中間復号器状態を生成するための長短期記憶と、
前記コンテキストの最終符号化、前記質問の最終符号化、および前記中間復号器状態に基づいて、コンテキストおよび質問復号器状態を生成するためのコンテキストおよび質問アテンションネットワークと、を含む、請求項1〜5のいずれか一項に記載のシステム。 - 前記システムは、前記システムが処理するように設計されたタスクタイプの完全セットに対して訓練される前に、タスクタイプのサブセットに対して訓練される、請求項1〜6のいずれか一項に記載のシステム。
- 前記タスクタイプの前記サブセットは、カリキュラム戦略に従って選択される、請求項7に記載のシステム。
- 前記タスクタイプの前記サブセットは、反カリキュラム戦略に従って選択される、請求項7に記載のシステム。
- 自然言語処理のための方法であって、
多層符号化器を使用して、コンテキストからの第1のワードと質問からの第2のワードを並列して符号化することと、
多層復号器を使用して、符号化された前記コンテキストおよび符号化された前記質問を復号することと、
前記復号器からの出力に基づいて、前記コンテキストからの前記第1のワード、前記質問からの前記第2のワード、および語彙の第3のワードに対する分布を生成することと、
前記コンテキストからの前記第1のワードに対する前記分布、前記質問からの前記第2のワードに対する前記分布、および前記語彙の前記第3のワードに対する前記分布の重みを生成することと、
前記コンテキストからの前記第1のワードに対する前記分布、前記質問からの前記第2のワードに対する前記分布、および前記語彙の前記第3のワードに対する前記分布の前記重みに基づいて、複合分布を生成することと、
前記複合分布を使用して、答えに含めるワードを選択することと、を含む、方法。 - 前記コンテキストおよび前記質問は、質問応答、機械翻訳、文書要約、データベースクエリ生成、感情分析、自然言語推論、意味役割ラベル付け、関係抽出、目標指向対話、および代名詞解決から選択される自然言語処理タスクタイプに対応する、請求項10に記載の方法。
- 前記コンテキスト内の前記第1のワードと前記質問内の前記第2のワードとの間のコアテンションを決定することをさらに含む、請求項10または11に記載の方法。
- 前記コンテキストにわたるアテンションと前記質問にわたるアテンションを並列して生成することと、
前記アテンションに基づいて、前記コンテキストおよび前記質問の最終符号化を並列して生成することと、をさらに含む、請求項10〜12のいずれか一項に記載の方法。 - 前記コンテキストからの前記第1のワードと前記質問からの前記第2のワードを並列して符号化することと、
前記コンテキストからの前記第1のワードと前記質問からの前記第2のワードの前記符号化を並列して投影することと、
前記符号化の前記投影をさらに符号化することと、をさらに含む、請求項10〜13のいずれか一項に記載の方法。 - 前記答えの中間バージョンを符号化し埋め込むことと、
前記答えの符号化および埋め込まれた前記中間バージョンと前記コンテキストの最終符号化との間のアテンションを生成することと、
生成された前記出力から中間復号器状態を生成することと、
前記コンテキストの最終符号化、前記質問の最終符号化、および前記中間復号器状態に基づいて、コンテキストおよび質問復号器状態を生成することと、をさらに含む、請求項10〜14のいずれか一項に記載の方法。 - 前記多層符号化器および前記多層復号器をタスクタイプの完全セットに対して訓練する前に、前記多層符号化器および前記多層復号器をタスクタイプのサブセットに対して訓練することをさらに含む、請求項10〜15のいずれか一項に記載の方法。
- 前記タスクタイプのサブセットは、カリキュラム戦略に従って選択される、請求項16に記載の方法。
- 前記タスクタイプのサブセットは、反カリキュラム戦略に従って選択される、請求項16に記載の方法。
- コンピュータデバイスに関連付けられた1つ以上のプロセッサによって実行されるときに、前記1つ以上のプロセッサが方法を行うように適合された実行可能コードを含む非一時的な機械可読媒体であって、前記方法は、
多層符号化器を使用して、コンテキストからの第1のワードと質問からの第2のワードを並列して符号化することと、
多層復号器を使用して、符号化された前記コンテキストおよび符号化された前記質問を復号することと、
前記復号器からの出力に基づいて、前記コンテキストからの前記第1のワード、前記質問からの前記第2のワード、および語彙の第3のワードに対する分布を生成することと、
前記コンテキストからの前記第1のワードに対する前記分布、前記質問からの前記第2のワードに対する前記分布、および前記語彙の前記第3のワードに対する前記分布の重みを生成することと、
前記コンテキストからの前記第1のワードに対する前記分布、前記質問からの前記第2のワードに対する前記分布、および前記語彙の前記第3のワードに対する前記分布の前記重みに基づいて、複合分布を生成することと、
前記複合分布を使用して、答えに含めるワードを選択することと、を含む、非一時的な機械可読媒体。 - 前記コンテキストおよび前記質問は、質問応答、機械翻訳、文書要約、データベースクエリ生成、感情分析、自然言語推論、意味役割ラベル付け、関係抽出、目標指向対話、および代名詞解決から選択される自然言語処理タスクタイプに対応する、請求項19に記載の非一時的な機械可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862673606P | 2018-05-18 | 2018-05-18 | |
US62/673,606 | 2018-05-18 | ||
US16/006,691 | 2018-06-12 | ||
US16/006,691 US11600194B2 (en) | 2018-05-18 | 2018-06-12 | Multitask learning as question answering |
PCT/US2019/032207 WO2019222206A1 (en) | 2018-05-18 | 2019-05-14 | Multitask learning as question answering |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021524623A true JP2021524623A (ja) | 2021-09-13 |
JPWO2019222206A5 JPWO2019222206A5 (ja) | 2022-05-19 |
JP7408574B2 JP7408574B2 (ja) | 2024-01-05 |
Family
ID=68532658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020564520A Active JP7408574B2 (ja) | 2018-05-18 | 2019-05-14 | 質問応答としてのマルチタスク学習 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11600194B2 (ja) |
EP (1) | EP3794469A1 (ja) |
JP (1) | JP7408574B2 (ja) |
CA (1) | CA3097224A1 (ja) |
WO (1) | WO2019222206A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7547653B2 (ja) | 2021-05-21 | 2024-09-09 | グーグル エルエルシー | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
Families Citing this family (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10817650B2 (en) | 2017-05-19 | 2020-10-27 | Salesforce.Com, Inc. | Natural language processing using context specific word vectors |
WO2020015840A1 (en) * | 2018-07-20 | 2020-01-23 | Nokia Technologies Oy | Learning in communication systems by updating of parameters in a receiving algorithm |
US10929392B1 (en) * | 2018-11-16 | 2021-02-23 | Amazon Technologies, Inc. | Artificial intelligence system for automated generation of realistic question and answer pairs |
US11423068B2 (en) * | 2018-11-27 | 2022-08-23 | Google Llc | Canonicalizing search queries to natural language questions |
WO2020118422A1 (en) * | 2018-12-11 | 2020-06-18 | Sinitic Inc. | System and method for structuring chat history using machine-learning-based natural language processing |
US11822897B2 (en) | 2018-12-11 | 2023-11-21 | Salesforce.Com, Inc. | Systems and methods for structured text translation with tag alignment |
US10963652B2 (en) | 2018-12-11 | 2021-03-30 | Salesforce.Com, Inc. | Structured text translation |
US11423221B2 (en) * | 2018-12-31 | 2022-08-23 | Entigenlogic Llc | Generating a query response utilizing a knowledge database |
US20220374461A1 (en) * | 2018-12-31 | 2022-11-24 | Entigenlogic Llc | Generating a subjective query response utilizing a knowledge database |
US10909180B2 (en) * | 2019-01-11 | 2021-02-02 | International Business Machines Corporation | Dynamic query processing and document retrieval |
JP7358748B2 (ja) * | 2019-03-01 | 2023-10-11 | 富士通株式会社 | 学習方法、抽出方法、学習プログラムおよび情報処理装置 |
US11003867B2 (en) | 2019-03-04 | 2021-05-11 | Salesforce.Com, Inc. | Cross-lingual regularization for multilingual generalization |
EP3973469A1 (en) * | 2019-08-02 | 2022-03-30 | Google LLC | Systems and methods for generating and providing suggested actions |
KR20210043995A (ko) * | 2019-10-14 | 2021-04-22 | 삼성전자주식회사 | 모델 학습 방법 및 장치, 및 시퀀스 인식 방법 |
US11347708B2 (en) | 2019-11-11 | 2022-05-31 | Salesforce.Com, Inc. | System and method for unsupervised density based table structure identification |
US11537899B2 (en) | 2019-11-18 | 2022-12-27 | Salesforce.Com, Inc. | Systems and methods for out-of-distribution classification |
US11922303B2 (en) | 2019-11-18 | 2024-03-05 | Salesforce, Inc. | Systems and methods for distilled BERT-based training model for text classification |
US11487999B2 (en) | 2019-12-09 | 2022-11-01 | Salesforce.Com, Inc. | Spatial-temporal reasoning through pretrained language models for video-grounded dialogues |
US11573957B2 (en) | 2019-12-09 | 2023-02-07 | Salesforce.Com, Inc. | Natural language processing engine for translating questions into executable database queries |
US11256754B2 (en) | 2019-12-09 | 2022-02-22 | Salesforce.Com, Inc. | Systems and methods for generating natural language processing training samples with inflectional perturbations |
US11640505B2 (en) | 2019-12-09 | 2023-05-02 | Salesforce.Com, Inc. | Systems and methods for explicit memory tracker with coarse-to-fine reasoning in conversational machine reading |
US12086539B2 (en) | 2019-12-09 | 2024-09-10 | Salesforce, Inc. | System and method for natural language processing using neural network with cross-task training |
US11416688B2 (en) | 2019-12-09 | 2022-08-16 | Salesforce.Com, Inc. | Learning dialogue state tracking with limited labeled data |
US11669745B2 (en) | 2020-01-13 | 2023-06-06 | Salesforce.Com, Inc. | Proposal learning for semi-supervised object detection |
CN111291550B (zh) * | 2020-01-17 | 2021-09-03 | 北方工业大学 | 一种中文实体提取方法及装置 |
CN111310449B (zh) | 2020-01-23 | 2021-01-26 | 北京百度网讯科技有限公司 | 基于语义表示的文本生成方法和装置 |
US11562147B2 (en) | 2020-01-23 | 2023-01-24 | Salesforce.Com, Inc. | Unified vision and dialogue transformer with BERT |
US11948665B2 (en) | 2020-02-06 | 2024-04-02 | Salesforce, Inc. | Systems and methods for language modeling of protein engineering |
CN111324717B (zh) * | 2020-02-24 | 2023-06-27 | 武汉大学 | 一种面向开放域问答的基于机器阅读理解的答案获取方法及系统 |
US11921711B2 (en) * | 2020-03-06 | 2024-03-05 | Alibaba Group Holding Limited | Trained sequence-to-sequence conversion of database queries |
US11263476B2 (en) | 2020-03-19 | 2022-03-01 | Salesforce.Com, Inc. | Unsupervised representation learning with contrastive prototypes |
US11328731B2 (en) | 2020-04-08 | 2022-05-10 | Salesforce.Com, Inc. | Phone-based sub-word units for end-to-end speech recognition |
CN111651992A (zh) * | 2020-04-24 | 2020-09-11 | 平安科技(深圳)有限公司 | 命名实体标注方法、装置、计算机设备和存储介质 |
US11669699B2 (en) | 2020-05-31 | 2023-06-06 | Saleforce.com, inc. | Systems and methods for composed variational natural language generation |
US20210374345A1 (en) * | 2020-06-01 | 2021-12-02 | Google Llc | Processing large-scale textual inputs using neural networks |
US11720559B2 (en) | 2020-06-02 | 2023-08-08 | Salesforce.Com, Inc. | Bridging textual and tabular data for cross domain text-to-query language semantic parsing with a pre-trained transformer language encoder and anchor text |
US11875233B2 (en) * | 2020-07-10 | 2024-01-16 | Microsoft Technology Licensing, Llc | Automatic recognition of entities related to cloud incidents |
US11625436B2 (en) | 2020-08-14 | 2023-04-11 | Salesforce.Com, Inc. | Systems and methods for query autocompletion |
US11934952B2 (en) | 2020-08-21 | 2024-03-19 | Salesforce, Inc. | Systems and methods for natural language processing using joint energy-based models |
US11934781B2 (en) | 2020-08-28 | 2024-03-19 | Salesforce, Inc. | Systems and methods for controllable text summarization |
US11995111B2 (en) * | 2020-11-13 | 2024-05-28 | Tencent America LLC | Efficient and compact text matching system for sentence pairs |
US11829442B2 (en) | 2020-11-16 | 2023-11-28 | Salesforce.Com, Inc. | Methods and systems for efficient batch active learning of a deep neural network |
CN112271001B (zh) * | 2020-11-17 | 2022-08-16 | 中山大学 | 一种应用异构图神经网络的医疗咨询对话系统及方法 |
CN113033189B (zh) * | 2021-04-08 | 2022-07-12 | 北京理工大学 | 一种基于注意力分散的长短期记忆网络的语义编码方法 |
CN113901210B (zh) * | 2021-09-15 | 2022-12-13 | 昆明理工大学 | 利用局部多头注意力机制融合词-音节对的泰文和缅甸文词性标注方法 |
CN114139532B (zh) * | 2022-01-30 | 2022-04-19 | 北京语言大学 | 一种基于多任务框架进行简单释义生成的方法与系统 |
US20230259544A1 (en) * | 2022-02-16 | 2023-08-17 | Adobe Inc. | Training a model for performing abstractive text summarization |
US20230289836A1 (en) * | 2022-03-11 | 2023-09-14 | Tredence Inc. | Multi-channel feedback analytics for presentation generation |
CN114925708B (zh) * | 2022-05-24 | 2024-08-09 | 昆明理工大学 | 融合无监督依存句法的泰汉神经机器翻译方法 |
CN114861730B (zh) * | 2022-05-25 | 2023-04-07 | 电子科技大学 | 基于多任务学习的干扰认知方法 |
CN115017286B (zh) * | 2022-06-09 | 2023-04-07 | 北京邮电大学 | 基于检索的多轮对话系统和方法 |
CN115392260B (zh) * | 2022-10-31 | 2023-04-07 | 暨南大学 | 一种面向特定目标的社交媒体推文情感分析方法 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011033460A1 (en) * | 2009-09-17 | 2011-03-24 | Time To Know Establishment | Device, system, and method of educational content generation |
US8977041B2 (en) * | 2012-08-22 | 2015-03-10 | Canon Kabushiki Kaisha | Systems and methods for creating a visual vocabulary |
US11113598B2 (en) | 2015-06-01 | 2021-09-07 | Salesforce.Com, Inc. | Dynamic memory network |
US20160350653A1 (en) | 2015-06-01 | 2016-12-01 | Salesforce.Com, Inc. | Dynamic Memory Network |
US20170032280A1 (en) | 2015-07-27 | 2017-02-02 | Salesforce.Com, Inc. | Engagement estimator |
US20170140240A1 (en) | 2015-07-27 | 2017-05-18 | Salesforce.Com, Inc. | Neural network combined image and text evaluator and classifier |
CN110688891B (zh) | 2015-08-15 | 2024-05-31 | 硕动力公司 | 采用3d批归一化的三维(3d)卷积 |
US10431205B2 (en) * | 2016-04-27 | 2019-10-01 | Conduent Business Services, Llc | Dialog device with dialog support generated using a mixture of language models combined using a recurrent neural network |
US10281885B1 (en) * | 2016-05-20 | 2019-05-07 | Google Llc | Recurrent neural networks for online sequence generation |
US20180082184A1 (en) * | 2016-09-19 | 2018-03-22 | TCL Research America Inc. | Context-aware chatbot system and method |
US10565493B2 (en) | 2016-09-22 | 2020-02-18 | Salesforce.Com, Inc. | Pointer sentinel mixture architecture |
US11093813B2 (en) * | 2016-10-20 | 2021-08-17 | Google Llc | Answer to question neural networks |
US11042796B2 (en) | 2016-11-03 | 2021-06-22 | Salesforce.Com, Inc. | Training a joint many-task neural network model using successive regularization |
US11087199B2 (en) * | 2016-11-03 | 2021-08-10 | Nec Corporation | Context-aware attention-based neural network for interactive question answering |
US11080595B2 (en) | 2016-11-04 | 2021-08-03 | Salesforce.Com, Inc. | Quasi-recurrent neural network based encoder-decoder model |
US10963782B2 (en) | 2016-11-04 | 2021-03-30 | Salesforce.Com, Inc. | Dynamic coattention network for question answering |
US10540967B2 (en) * | 2016-11-14 | 2020-01-21 | Xerox Corporation | Machine reading method for dialog state tracking |
US10654380B2 (en) * | 2016-11-18 | 2020-05-19 | Microsoft Technology Licensing, Llc | Query rewriting and interactive inquiry framework |
US10565305B2 (en) | 2016-11-18 | 2020-02-18 | Salesforce.Com, Inc. | Adaptive attention model for image captioning |
US10936947B1 (en) * | 2017-01-26 | 2021-03-02 | Amazon Technologies, Inc. | Recurrent neural network-based artificial intelligence system for time series predictions |
US20180247549A1 (en) * | 2017-02-21 | 2018-08-30 | Scriyb LLC | Deep academic learning intelligence and deep neural language network system and interfaces |
US20180329884A1 (en) * | 2017-05-12 | 2018-11-15 | Rsvp Technologies Inc. | Neural contextual conversation learning |
US10380259B2 (en) * | 2017-05-22 | 2019-08-13 | International Business Machines Corporation | Deep embedding for natural language content based on semantic dependencies |
US11200269B2 (en) * | 2017-06-15 | 2021-12-14 | Microsoft Technology Licensing, Llc | Method and system for highlighting answer phrases |
US11243944B2 (en) * | 2017-06-29 | 2022-02-08 | Futurewei Technologies, Inc. | Dynamic semantic networks for language understanding and question answering |
US10585991B2 (en) * | 2017-06-29 | 2020-03-10 | Microsoft Technology Licensing, Llc | Virtual assistant for generating personalized responses within a communication session |
US10902738B2 (en) * | 2017-08-03 | 2021-01-26 | Microsoft Technology Licensing, Llc | Neural models for key phrase detection and question generation |
US11106975B2 (en) * | 2017-10-20 | 2021-08-31 | Asapp, Inc. | Fast neural network implementations by increasing parallelism of cell computations |
WO2019079922A1 (zh) * | 2017-10-23 | 2019-05-02 | 腾讯科技(深圳)有限公司 | 会话信息处理方法及其装置、存储介质 |
US10754851B2 (en) * | 2017-12-22 | 2020-08-25 | Adobe Inc. | Question answering for data visualizations |
US11250038B2 (en) * | 2018-01-21 | 2022-02-15 | Microsoft Technology Licensing, Llc. | Question and answer pair generation using machine learning |
US11501076B2 (en) * | 2018-02-09 | 2022-11-15 | Salesforce.Com, Inc. | Multitask learning as question answering |
US20190287012A1 (en) * | 2018-03-16 | 2019-09-19 | Microsoft Technology Licensing, Llc | Encoder-decoder network with intercommunicating encoder agents |
WO2019211250A1 (en) * | 2018-04-30 | 2019-11-07 | Koninklijke Philips N.V. | Visual question answering using on-image annotations |
-
2018
- 2018-06-12 US US16/006,691 patent/US11600194B2/en active Active
-
2019
- 2019-05-14 EP EP19726296.7A patent/EP3794469A1/en active Pending
- 2019-05-14 JP JP2020564520A patent/JP7408574B2/ja active Active
- 2019-05-14 CA CA3097224A patent/CA3097224A1/en active Pending
- 2019-05-14 WO PCT/US2019/032207 patent/WO2019222206A1/en active Application Filing
Non-Patent Citations (1)
Title |
---|
西田 京介、他4名: "情報検索とのマルチタスク学習による大規模機械読解", 言語処理学会第24回年次大会 発表論文集 [ONLINE], JPN6023025020, 5 March 2018 (2018-03-05), JP, pages 963 - 966, ISSN: 0005086966 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7547653B2 (ja) | 2021-05-21 | 2024-09-09 | グーグル エルエルシー | 文脈テキスト生成のサービスにおいて中間テキスト分析を生成する機械学習済み言語モデル |
Also Published As
Publication number | Publication date |
---|---|
WO2019222206A1 (en) | 2019-11-21 |
CA3097224A1 (en) | 2019-11-21 |
US20190355270A1 (en) | 2019-11-21 |
US11600194B2 (en) | 2023-03-07 |
EP3794469A1 (en) | 2021-03-24 |
JP7408574B2 (ja) | 2024-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7408574B2 (ja) | 質問応答としてのマルチタスク学習 | |
JP7285895B2 (ja) | 質問応答としてのマルチタスク学習 | |
US11409945B2 (en) | Natural language processing using context-specific word vectors | |
Kamath et al. | Deep learning for NLP and speech recognition | |
JP6722789B2 (ja) | インタラクティブ言語習得のシステム、及び方法 | |
Henaff et al. | Tracking the world state with recurrent entity networks | |
CN111198937B (zh) | 对话生成及装置、计算机可读存储介质、电子设备 | |
CN109952580B (zh) | 基于准循环神经网络的编码器-解码器模型 | |
Rocktäschel et al. | Reasoning about entailment with neural attention | |
US20210089588A1 (en) | System and Method for Automatic Task-Oriented Dialog System | |
Tang et al. | Modelling student behavior using granular large scale action data from a MOOC | |
CN111814489A (zh) | 口语语义理解方法及系统 | |
Wakchaure et al. | A scheme of answer selection in community question answering using machine learning techniques | |
KR20230055021A (ko) | Nested 와 Overlapped Named Entity 인식을 위한 피라미드 Layered 어텐션 모델 | |
Li et al. | Seq-CNN: A lightweight and efficient neural network for sentimental analysis of text | |
Aishwarya et al. | Stacked Attention based Textbook Visual Question Answering with BERT | |
Gong | [Retracted] Analysis and Application of the Business English Translation Query and Decision Model with Big Data Corpus | |
Wang | Multimodal spoken unit discovery with paired and unpaired modalities | |
Rodriguez | Models and Applications | |
Choudhary | Utilizing External and Internal Knowledge for Engaging Open-Domain Dialogue Response Generation | |
Tripathi et al. | Check for updates Bidirectional Transformer Based Multi-Task Learning for Natural Language Understanding | |
CN116340487A (zh) | 对话行为的识别方法、装置、电子设备及存储介质 | |
CN118974739A (zh) | 具有并行注意力层和前馈层的注意力神经网络 | |
Anderling et al. | Dialogue modeling using recurrent neural networks | |
Dinarelli et al. | Effective Spoken Language Labeling with Deep Recurrent Neural Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220511 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220511 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230620 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7408574 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |