CN112966530A - 一种机器翻译领域自适应方法、系统、介质、计算机设备 - Google Patents
一种机器翻译领域自适应方法、系统、介质、计算机设备 Download PDFInfo
- Publication number
- CN112966530A CN112966530A CN202110375078.1A CN202110375078A CN112966530A CN 112966530 A CN112966530 A CN 112966530A CN 202110375078 A CN202110375078 A CN 202110375078A CN 112966530 A CN112966530 A CN 112966530A
- Authority
- CN
- China
- Prior art keywords
- domain
- field
- machine translation
- model
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 85
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012549 training Methods 0.000 claims abstract description 93
- 230000003044 adaptive effect Effects 0.000 claims abstract description 23
- 230000003416 augmentation Effects 0.000 claims abstract description 13
- 238000012360 testing method Methods 0.000 claims description 12
- 238000011161 development Methods 0.000 claims description 11
- 230000003190 augmentative effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 2
- 238000013528 artificial neural network Methods 0.000 abstract description 8
- 238000005070 sampling Methods 0.000 abstract description 2
- 239000000463 material Substances 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/49—Data-driven translation using very large corpora, e.g. the web
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明属于机器翻译技术领域,公开了一种机器翻译领域自适应方法、系统、介质、计算机设备,包括:通过半监督增广语料,基于不同的领域语料的数量和质量进行领域模型的适应性训练,并利用训练好的领域模型进行机器翻译。本发明针对领域机器翻译的实际应用中的主要问题,提出了一套较为完整的解决方案,可以有效利用用户提供的领域语料,提供一个较好的领域机器翻译模型。本发明针对领域语料较少的情况,使用半监督的方法构建领域语料;根据用户的需求,选择不同的训练方式,通过上采样的方式,得到较好的领域神经网络机器翻译模型;避免了使用增量训练的方式使得领域模型出现过拟合,无法覆盖大部分用户的使用场景,又能快速构建领域模型。
Description
技术领域
本发明属于机器翻译技术领域,尤其涉及一种机器翻译领域自适应方法、系统、介质、计算机设备。
背景技术
目前,机器翻译是利用计算机算法自动地将一种源语言句子翻译成为另一种目标语言句子的过程。机器翻译是人工智能的一个研究方向,具有十分重要的科研价值和实用价值。伴随着全球化进程的不断深化和互联网的迅速发展,机器翻译技术在国内外政治、经济、社会、文化交流等方面发挥着越来越重要的作用。
随着神经网络机器翻译的可用性大大提高,用户对机器翻译的需求随之提升。一般用户没有专业的需求,也无需十分高的准确率,使用通用领域的机器翻译即可满足需求。但一般的通用领域机器翻译无法满足专业领域用户的需求,而专业领域用户对于机器翻译的需求却是较大的,对于翻译的准确率以及专业性的要求较高。
目前领域的神经网络机器翻译系统在学术界已有比较多的讨论,但是对于工业界级别的领域神经网络机器翻译应用来说,还有很多有待解决的问题。学术界的论文可以针对测试集进行相应的优化,并且最重要的一点,领域测试集也仅仅是几千句,并不能代表用户所有场景中所需翻译的句子。因此,在实际应用中,领域机器翻译模型往往会让用户产生不好用的感受。
从零开始训练一个神经网络模型需要花费较多的时间在语料处理和模型训练上。但实际应用中,用户往往会不断产生新的领域语料,却不可能每次都从零开始训练一个模型,这对快速进行领域自适应提出了要求。
此外,用户的语料也较少,往往很难覆盖所有的使用场景,质量也很难有所保证。对于如何使用用户提供的语料,并进行个性化定制,是一个难题。
通过上述分析,现有技术存在的问题及缺陷为:现有的机器翻译系统或方法无法应用于专业领域,同时无法进行领域自适应;且现有的机器翻译方法或系统翻译不精准,用户感受不佳。解决以上问题及缺陷的难度为:由于可供使用的领域语料较少甚至没有,而神经网络机器翻译模型需要大量的数据驱动,少量的数据无法训练得到一个可用的领域机器翻译模型,甚至进行训练。
解决以上问题及缺陷的意义为:通过本发明,根据用户的需求以及不同的情况,可在合理情况下训练一个可用的领域机器翻译模型,解决了领域语料缺乏的情况下无法训练领域神经网络机器翻译模型的问题。
发明内容
针对现有技术存在的问题,本发明提供了一种机器翻译领域自适应方法、系统、介质、计算机设备。
本发明是这样实现的,一种机器翻译领域自适应方法,所述机器翻译领域自适应方法包括:通过半监督增广语料,基于不同的领域语料的数量和质量进行领域模型的适应性训练,并利用训练好的领域模型进行机器翻译。
进一步,所述机器翻译领域自适应方法包括以下步骤:
步骤一,使用半监督方法生产伪平行领域语料,对语料进行增广;
步骤二,构建领域模型,并判断时间是否充裕,若时间充裕,则对构建的领域模型进行全量训练;若时间不充裕,则对构建的领域模型进行增量训练;
步骤三,利用训练好的领域模型进行领域自适应的机器翻译。
进一步,所述使用半监督方法生产伪平行领域语料包括:
搜集领域内的单语,利用反方向的机器翻译模型进行翻译,将翻译得到的译文与原文构成领域伪平行语料。
进一步,步骤二中,所述对构建的领域模型进行全量训练包括:
(1)进行训练集预处理;以通用测试集作为开发集,对构建的领域模型进行训练;
(2)以领域测试集为开发集,使用相同的训练集,对构建的领域模型进行二次训练。
进一步,步骤(1)中,所述进行训练集预处理包括:对领域语料进行上采样,令通用语料与领域语料数量之比为5:1至10:1。
进一步,步骤二中,所述对构建的领域模型进行增量训练包括:判断领域语料的状况,并基于判断结果,利用领域内的语料训练构建的领域模型。
进一步,所述基于判断结果,利用领域内的语料训练构建的领域模型包括:
若领域语料较多并且质量较好:则直接基于原有通用模型,使用领域语料进行领域模型的增量训练;
若领域语料较少或者质量较低:则混合领域语料和通用语料,通过上采样,通用语料与领域语料之比为5:1;基于通用模型进行增量训练。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:通过半监督增广语料,基于不同的领域语料的数量和质量进行领域模型的适应性训练,并利用训练好的领域模型进行机器翻译。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:通过半监督增广语料,基于不同的领域语料的数量和质量进行领域模型的适应性训练,并利用训练好的领域模型进行机器翻译。
本发明的另一目的在于提供一种实施所述机器翻译领域自适应方法的机器翻译领域自适应系统,所述机器翻译领域自适应系统包括:
语料增广模块,用于使用半监督方法生产伪平行领域语料,对语料进行增广;
模型构建模块,用于构建领域模型;
训练模块,用于基于不同的领域语料的数量和质量进行领域模型的增量或全量训练;
翻译模块,用于利用训练好的领域模型进行领域自适应的机器翻译。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明可在不同领域语料的数量和质量的情况下,选择合适的训练方式。领域语料数量较少的情况,可通过半监督的方式,快速增广领域语料。训练时,全量训练可较好质量的提供领域模型。而在短时间内,需要快速进行领域模型训练:语料质量和数量都不错的情况下,可使用领域语料直接进行的增量训练;而在语料质量不佳或者数量较少的情况下,可混合领域和通用语料,通过上采样,提高领域语料比重,然后进行增量训练。
本发明针对领域机器翻译的实际应用中的主要问题,提出了一套较为完整的解决方案,可以有效利用用户提供的领域语料,提供一个较好的领域机器翻译模型。
本发明在领域语料较少时,选择半监督的方法构建领域语料。而根据用户的需求,选择不同的训练方式,通过上采样的方式,最终得到较好的领域神经网络机器翻译模型。避免了使用增量训练的方式使得领域模型出现过拟合,无法覆盖大部分用户的使用场景,又能快速构建领域模型。
本发明应用在金融领域机器翻译引擎中,效果如表1所示,对比通用领域的模型效果明显。
表1金融领域BLEU值
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的机器翻译领域自适应方法原理图。
图2是本发明实施例提供的机器翻译领域自适应方法流程图。
图3是本发明实施例提供的机器翻译领域自适应系统结构示意图;
图中:1、语料增广模块;2、模型构建模块;3、训练模块;4、翻译模块。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种机器翻译领域自适应方法、系统、介质、计算机设备,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的机器翻译领域自适应方法包括:通过半监督增广语料,基于不同的领域语料的数量和质量进行领域模型的适应性训练,并利用训练好的领域模型进行机器翻译。
如图2所示,本发明实施例提供的机器翻译领域自适应方法包括以下步骤:
S101,使用半监督方法生产伪平行领域语料,对语料进行增广;
S102,构建领域模型,并判断时间是否充裕,若时间充裕,则对构建的领域模型进行全量训练;若时间不充裕,则对构建的领域模型进行增量训练;
S103,利用训练好的领域模型进行领域自适应的机器翻译。
本发明实施例提供的使用半监督方法生产伪平行领域语料包括:
搜集领域内的单语,利用反方向的机器翻译模型进行翻译,将翻译得到的译文与原文构成领域伪平行语料。
步骤S102中,本发明实施例提供的对构建的领域模型进行全量训练包括:
(1)进行训练集预处理;以通用测试集作为开发集,对构建的领域模型进行训练;
(2)以领域测试集为开发集,使用相同的训练集,对构建的领域模型进行二次训练。
步骤(1)中,本发明实施例提供的进行训练集预处理包括:对领域语料进行上采样,令通用语料与领域语料数量之比为5:1至10:1。
步骤S102中,本发明实施例提供的对构建的领域模型进行增量训练包括:
判断领域语料的状况,并基于判断结果,利用领域内的语料训练构建的领域模型。
本发明实施例提供的基于判断结果,利用领域内的语料训练构建的领域模型包括:
若领域语料较多并且质量较好:则直接基于原有通用模型,使用领域语料进行领域模型的增量训练;
若领域语料较少或者质量较低:则混合领域语料和通用语料,通过上采样,通用语料与领域语料之比为5:1;基于通用模型进行增量训练。
如图3所示,本发明实施例提供的机器翻译领域自适应系统包括:
语料增广模块1,用于使用半监督方法生产伪平行领域语料,对语料进行增广;
模型构建模块2,用于构建领域模型;
训练模块3,用于基于不同的领域语料的数量和质量进行领域模型的增量或全量训练;
翻译模块4,用于利用训练好的领域模型进行领域自适应的机器翻译。
下面结合具体实施例对本发明的技术效果作进一步描述。
实施例1:
本发明提供了一种基于神经网络的领域机器翻译自适应的方法和系统。如图1所示为整个流程。
1. 针对语料数量问题,本发明使用半监督的方法,生产伪平行领域语料:
由于双语的领域内语料较少,尤其是某些小语种,并且质量也难以保证,因此搜集领域内的单语更能保证语料的数量和质量。然后使用相反方向的机器翻译模型进行翻译,得到的译文与原文构成了领域伪平行语料。
2. 关于如何快速构建领域模型:
a) 全量训练
根据领域语料的数量和质量,领域语料通过上采样,使得通用语料与领域语料数量之比在5:1至10:1左右。领域语料质量越高,占有比重越大。基本步骤如下:
i.在不改变模型结构的情况下,以通用测试集作为开发集,训练直至停止。
ii. 再以领域测试集为开发集,使用相同的训练集,训练模型直至停止。
b) 增量训练
在有限的时间下,希望快速得到领域的模型,可进行增量训练。增量训练是基于原有模型(一般就是通用模型),使用领域内的语料继续训练模型。
i.对于领域语料较多并且质量较好:直接基于原有通用模型,使用领域语料进行增量训练。
ii. 对于领域语料较少或者质量较低:混合领域语料和通用语料,通过上采样,使得通用语料与领域语料之比为5:1左右。然后基于通用模型进行增量训练。
以上领域机翻的训练方法,可在不同领域语料的数量和质量的情况下,选择合适的训练方式。领域语料数量较少的情况,可通过半监督的方式,快速增广领域语料。训练时,全量训练可较好质量的提供领域模型。而在短时间内,需要快速进行领域模型训练:语料质量和数量都不错的情况下,可使用领域语料直接进行的增量训练;而在语料质量不佳或者数量较少的情况下,可混合领域和通用语料,通过上采样,提高领域语料比重,然后进行增量训练。
实施例2:
训练一个英到中方向的领域模型。
1. 半监督增广领域语料:
搜集中文领域内的单语,经过清洗后,使用中到英通用机器翻译模型翻译中文至英文,清洗得到的译文后构成英到中领域内伪双语语料。
2. 训练领域模型:
a) 如果时间允许,则进行全量训练
根据领域语料的数量和质量,领域语料通过上采样,使得通用语料与领域语料数量之比在5:1至10:1左右。领域语料质量越高,占有比重越大。基本步骤如下:
i.在不改变模型结构的情况下,以通用测试集作为开发集,训练直至停止。
ii. 再以领域测试集为开发集,使用相同的训练集,训练模型直至停止。
b) 如果时间紧张,则进行增量训练
在有限的时间下,希望快速得到领域的模型,可进行增量训练。增量训练是基于原有模型(一般就是通用模型),使用领域内的语料继续训练模型。
i.对于领域语料较多并且质量较好:直接基于原有通用模型,使用领域语料进行增量训练。
ii. 对于领域语料较少或者质量较低:混合领域语料和通用语料,通过上采样,使得通用语料与领域语料之比为5:1左右。然后基于通用模型进行增量训练。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种机器翻译领域自适应方法,其特征在于,所述机器翻译领域自适应方法通过半监督增广语料,基于不同的领域语料的数量和质量进行领域模型的适应性训练,并利用训练好的领域模型进行机器翻译;
所述机器翻译领域自适应方法包括以下步骤:
步骤一,使用半监督方法生产伪平行领域语料,对语料进行增广;
步骤二,构建领域模型,对构建的领域模型进行全量训练;若时间不充裕,则对构建的领域模型进行增量训练;
步骤三,利用训练好的领域模型进行领域自适应的机器翻译。
2.如权利要求1所述的机器翻译领域自适应方法,其特征在于,所述使用半监督方法生产伪平行领域语料包括:搜集领域内的单语,利用反方向的机器翻译模型进行翻译,将翻译得到的译文与原文构成领域伪平行语料。
3.如权利要求1所述的机器翻译领域自适应方法,其特征在于,步骤二中,所述对构建的领域模型进行全量训练包括:
(1)进行训练集预处理;以通用测试集作为开发集,对构建的领域模型进行训练;
(2)以领域测试集为开发集,使用相同的训练集,对构建的领域模型进行二次训练。
4.如权利要求3所述的机器翻译领域自适应方法,其特征在于,步骤(1)中,所述进行训练集预处理包括:对领域语料进行上采样,令通用语料与领域语料数量之比为5:1至10:1。
5.如权利要求1所述的机器翻译领域自适应方法,其特征在于,步骤二中,所述对构建的领域模型进行增量训练包括:判断领域语料的状况,并基于判断结果,利用领域内的语料训练构建的领域模型。
6.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:通过半监督增广语料,基于不同的领域语料的数量和质量进行领域模型的适应性训练,并利用训练好的领域模型进行机器翻译;具体包括以下步骤:
步骤一,使用半监督方法生产伪平行领域语料,对语料进行增广;
步骤二,构建领域模型,对构建的领域模型进行全量训练;若时间不充裕,则对构建的领域模型进行增量训练;
步骤三,利用训练好的领域模型进行领域自适应的机器翻译。
7.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:通过半监督增广语料,基于不同的领域语料的数量和质量进行领域模型的适应性训练,并利用训练好的领域模型进行机器翻译;具体包括以下步骤:
步骤一,使用半监督方法生产伪平行领域语料,对语料进行增广;
步骤二,构建领域模型,对构建的领域模型进行全量训练;若时间不充裕,则对构建的领域模型进行增量训练;
步骤三,利用训练好的领域模型进行领域自适应的机器翻译。
8.一种实施权利要求1-5任意一项所述机器翻译领域自适应方法的机器翻译领域自适应系统,其特征在于,所述机器翻译领域自适应系统包括:
语料增广模块,用于使用半监督方法生产伪平行领域语料,对语料进行增广;
模型构建模块,用于构建领域模型;
训练模块,用于基于不同的领域语料的数量和质量进行领域模型的增量或全量训练;
翻译模块,用于利用训练好的领域模型进行领域自适应的机器翻译。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110375078.1A CN112966530B (zh) | 2021-04-08 | 2021-04-08 | 一种机器翻译领域自适应方法、系统、介质、计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110375078.1A CN112966530B (zh) | 2021-04-08 | 2021-04-08 | 一种机器翻译领域自适应方法、系统、介质、计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112966530A true CN112966530A (zh) | 2021-06-15 |
CN112966530B CN112966530B (zh) | 2022-07-22 |
Family
ID=76281494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110375078.1A Active CN112966530B (zh) | 2021-04-08 | 2021-04-08 | 一种机器翻译领域自适应方法、系统、介质、计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112966530B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115099248A (zh) * | 2022-06-29 | 2022-09-23 | 新译信息科技(北京)有限公司 | 翻译方法、装置及计算机可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038159A (zh) * | 2017-03-09 | 2017-08-11 | 清华大学 | 一种基于无监督领域自适应的神经网络机器翻译方法 |
CN109190768A (zh) * | 2018-08-09 | 2019-01-11 | 北京中关村科金技术有限公司 | 一种数据增强语料在神经网络中训练方法 |
CN110263349A (zh) * | 2019-03-08 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 语料评估模型训练方法、装置、存储介质和计算机设备 |
CN110728154A (zh) * | 2019-08-28 | 2020-01-24 | 云知声智能科技股份有限公司 | 一种半监督式通用神经机器翻译模型的构建方法 |
CN110889295A (zh) * | 2019-09-12 | 2020-03-17 | 华为技术有限公司 | 机器翻译模型、伪专业平行语料的确定方法、系统及设备 |
CN111414770A (zh) * | 2020-02-24 | 2020-07-14 | 内蒙古工业大学 | 一种基于协同训练的半监督蒙汉神经机器翻译方法 |
CN111859995A (zh) * | 2020-06-16 | 2020-10-30 | 北京百度网讯科技有限公司 | 机器翻译模型的训练方法、装置、电子设备及存储介质 |
US10878201B1 (en) * | 2017-07-27 | 2020-12-29 | Lilt, Inc. | Apparatus and method for an adaptive neural machine translation system |
-
2021
- 2021-04-08 CN CN202110375078.1A patent/CN112966530B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038159A (zh) * | 2017-03-09 | 2017-08-11 | 清华大学 | 一种基于无监督领域自适应的神经网络机器翻译方法 |
US10878201B1 (en) * | 2017-07-27 | 2020-12-29 | Lilt, Inc. | Apparatus and method for an adaptive neural machine translation system |
CN109190768A (zh) * | 2018-08-09 | 2019-01-11 | 北京中关村科金技术有限公司 | 一种数据增强语料在神经网络中训练方法 |
CN110263349A (zh) * | 2019-03-08 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 语料评估模型训练方法、装置、存储介质和计算机设备 |
CN110728154A (zh) * | 2019-08-28 | 2020-01-24 | 云知声智能科技股份有限公司 | 一种半监督式通用神经机器翻译模型的构建方法 |
CN110889295A (zh) * | 2019-09-12 | 2020-03-17 | 华为技术有限公司 | 机器翻译模型、伪专业平行语料的确定方法、系统及设备 |
CN111414770A (zh) * | 2020-02-24 | 2020-07-14 | 内蒙古工业大学 | 一种基于协同训练的半监督蒙汉神经机器翻译方法 |
CN111859995A (zh) * | 2020-06-16 | 2020-10-30 | 北京百度网讯科技有限公司 | 机器翻译模型的训练方法、装置、电子设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115099248A (zh) * | 2022-06-29 | 2022-09-23 | 新译信息科技(北京)有限公司 | 翻译方法、装置及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112966530B (zh) | 2022-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20250021889A1 (en) | Implicit bridging of machine learning tasks | |
Kenny | Human and machine translation | |
US20130185049A1 (en) | Predicting Pronouns for Pro-Drop Style Languages for Natural Language Translation | |
WO2020242567A1 (en) | Cross-lingual task training | |
CN116187282B (zh) | 文本复述模型的训练方法、文本复述方法及装置 | |
CN114298031A (zh) | 文本处理方法、计算机设备及存储介质 | |
CN116595999B (zh) | 一种机器翻译模型训练方法和装置 | |
Mo | Design and Implementation of an Interactive English Translation System Based on the Information‐Assisted Processing Function of the Internet of Things | |
CN112966530B (zh) | 一种机器翻译领域自适应方法、系统、介质、计算机设备 | |
Wang | The development of translation technology in the era of big data | |
CN110287498A (zh) | 层次化翻译方法、装置及存储介质 | |
Jooste et al. | Philipp Koehn: Neural Machine Translation: Cambridge University Press, 30 Jun 2020, www. cambridge. org/9781108497329, DOI: 10.1017/9781108608480 | |
Ahmed | A review of existing Machine Translation Approaches, their Challenges and Evaluation Metrics | |
Zhu et al. | Improving low-resource named entity recognition via label-aware data augmentation and curriculum denoising | |
CN118939859A (zh) | 基于两种级别的可适应参数生成跨语言跨模态检索方法 | |
Khusainov et al. | The influence of different methods on the quality of the Russian-Tatar neural machine translation | |
CN117111952A (zh) | 基于生成式人工智能的代码补全方法和装置、介质 | |
Miao et al. | Towards unifying pre-trained language models for semantic text exchange | |
Shen et al. | Optimization of English learning mode under the influence of artificial intelligence translation | |
Yang et al. | Intelligent extraction of reservoir dispatching information integrating large language model and structured prompts | |
Bu et al. | Prompt-based data labeling method for aspect based sentiment analysis | |
Jia et al. | Research on the Role of Artificial Intelligence in the Core of Intelligent Translation Systems | |
Yang et al. | Analysis of AI MT based on fuzzy algorithm | |
Fibikh et al. | Application of modern machine translation systems in teaching foreign languages | |
Wang et al. | Arg-T5: A Multi-perspective Argument Generation Method Based on Debate Topic |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |