CN113924573A - 翻译装置 - Google Patents
翻译装置 Download PDFInfo
- Publication number
- CN113924573A CN113924573A CN202080041464.0A CN202080041464A CN113924573A CN 113924573 A CN113924573 A CN 113924573A CN 202080041464 A CN202080041464 A CN 202080041464A CN 113924573 A CN113924573 A CN 113924573A
- Authority
- CN
- China
- Prior art keywords
- word
- translation
- sentence
- replacement
- translated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 339
- 238000004891 communication Methods 0.000 claims abstract description 50
- 238000006467 substitution reaction Methods 0.000 abstract description 14
- 230000014616 translation Effects 0.000 description 306
- 238000000034 method Methods 0.000 description 54
- 230000008569 process Effects 0.000 description 46
- 238000012545 processing Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000011084 recovery Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
翻译装置(1)取得第1语言中的输入句,与执行机器翻译的外部装置(42)进行通信,输出表示输入句的翻译结果的翻译句,该翻译装置(1)具备:存储部(20),存储将置换对象的用词和译词建立对应来包含的第1辞典信息(31)以及包含代替用词的第2辞典信息(32);控制部(22),将输入句中所含的置换对象的用词置换成代替用词,来生成置换句;和通信部(18),将置换句输出至外部装置,从外部装置取得置换句的翻译结果。代替用词由特定的字符串构成。控制部在从通信部取得的置换句的翻译结果中探测该特定的字符串(S25),将探测到的字符串置换成置换对象的用词的译词,来生成翻译句(S26)。
Description
技术领域
本公开涉及将用一种语言输入的文章翻译成其他语言的翻译装置。
背景技术
专利文献1公开了将由用户输入的英语的文本翻译成日语的文本的电子辞典装置。在事先登记的登记单词包含在所输入的英语的文本中的情况下,该电子辞典装置在作为翻译结果的日语的文本内将与登记单词对应的译词置换成英语并进行显示。即,针对登记单词,以英语的状态显示,针对登记单词以外的部分,以翻译成日语的状态进行显示。例如,在将“cheap”作为登记单词来登记的情况下,作为“This is a cheap bag.”的翻译结果,输出“これは、cheapかばんです。”。进而,专利文献1的电子辞典装置对应于翻译/决定键的按下,以带下划线的方式显示英语以及日语的文本中的登记单词及其译词。由此,用户能进行针对登记单词的外语学习。
现有技术文献
专利文献
专利文献1:JP专利第4929632号公报
发明内容
发明要解决的课题
本公开提供能使用从第1语言向第2语言的机器翻译容易地得到表示输入句的翻译结果的翻译句的翻译装置。
用于解决课题的手段
本公开的一方式所涉及的翻译装置取得第1语言中的输入句,与执行从第1语言向第2语言的机器翻译的外部装置进行通信,并输出表示输入句的翻译结果的翻译句。翻译装置具备存储部、控制部和通信部。存储部存储将第1语言的置换对象的用词和第2语言针对置换对象的用词的译词建立对应来包含的第1辞典信息、以及包含取代置换对象的用词而使用的至少1个代替用词的第2辞典信息。控制部将输入句中所含的置换对象的用词置换成代替用词,来生成表示置换结果的置换句。通信部将置换句输出至外部装置,从外部装置取得第2语言中的置换句的翻译结果。代替用词由特定的字符串构成。控制部在从通信部取得的置换句的翻译结果中探测该特定的字符串,将探测到的字符串置换成第1辞典信息中与置换对象的用词建立对应的译词,来生成翻译句。
本公开的其他方式所涉及的翻译装置取得第1语言中的输入句,与执行从第1语言向第2语言的机器翻译的外部装置进行通信,并输出表示输入句的翻译结果的翻译句。翻译装置具备存储部、控制部和通信部。存储部存储将第1语言的置换对象的用词和第2语言针对置换对象的用词的译词建立对应来包含的第1辞典信息、以及将在第1语言中取代置换对象的用词而使用的多个代替用词和第2语言针对各代替用词的译词建立对应来包含的第2辞典信息。控制部将输入句中所含的置换对象的用词置换成代替用词,来生成表示置换结果的置换句。通信部将置换句输出至外部装置,从外部装置取得第2语言中的置换句的翻译结果。控制部在从通信部取得的置换句的翻译结果中判断是否存在代替用词的译词。控制部在判断为不存在代替用词的译词的情况下,使用第2辞典信息中不同于与该译词建立对应的代替用词的代替用词再次生成置换句,并输出至通信部。控制部在判断为存在代替用词的译词的情况下,将该译词置换成第1辞典信息中与置换对象的用词建立对应的译词,来生成翻译句。
这些概括且特定的方式可以通过系统、方法、计算机程序以及它们的组合来实现。
发明效果
根据本公开所涉及的翻译装置,能使用从第1语言向第2语言的机器翻译容易地得到表示输入句的翻译结果的翻译句。
附图说明
图1是用于说明本公开所涉及的翻译引擎和词汇置换/复原处理的图。
图2是表示本公开的实施方式1中的翻译装置的外观的图。
图3是表示实施方式1中的翻译系统的结构的框图。
图4是表示实施方式1中的登记词辞典的一例的图。
图5是表示实施方式1中的代替词辞典的一例的图。
图6是表示实施方式1中的置换信息的一例的图。
图7是用于说明翻译系统中的翻译装置的动作的流程图。
图8是例示实施方式1中的词汇置换/复原处理的流程图。
图9是用于说明实施方式1中的词汇置换/复原处理的图。
图10是表示实施方式2中的代替词辞典的一例的图。
图11是例示实施方式2中的词汇置换/复原处理的流程图。
图12是表示实施方式2中的置换信息的一例的图。
图13是表示实施方式2中的代替词辞典的变形例的图。
具体实施方式
以下适当参考附图来详细说明本公开的实施方式。但有时会省略必要以上详细的说明。例如,有时会省略已经广为人知的事项的详细说明、对实质上相同的结构的重复说明。这是为了避免以下的说明变得不必要地冗长,使本领域技术人员的理解容易。
另外,发明者为了本领域技术人员充分理解本公开而提供了附图以及以下的说明,但意图并不在于通过这些来限定记载于权利要求书的主题。
(实现本公开的想法)
在说明本公开的实施方式时,首先使用图1来说明本申请发明者实现本公开的想法。
图1是用于说明本公开所涉及的翻译引擎5和词汇置换/复原处理的图。翻译引擎5具备管理各种语言中的用词的对译的翻译辞典5a以及对文章中的词素进行解析的词素解析部5b等,执行从各种第1语言向第2语言的机器翻译。词汇置换/复原处理是关于特定的词汇运用词汇置换/复原技术来生成翻译句的翻译处理。在翻译引擎5中,设想存在未登记于翻译辞典5a等中的用词即未知词的情况。针对能在这样的情况下运用的词汇置换/复原处理,以下使用第1语言为日语且第2语言为英语的示例来进行说明。
在图1中,例示如下情况:设为翻译对象的输入句在日语中是“手荷物力ウンターはこちらです。”这样的文章J1且输入句的文章J1中所含的“手荷物力ウンター”这样的用词J11是未知词。作为未知词,例如设想作为仅在与特定的职业种类相关的场景下使用的专业用词且是不一般的用词。
词汇置换/复原处理例如由进行基于翻译引擎5的机器翻译的前处理的置换部2a和进行后处理的复原部2b实现。置换部2a例如将在输入句的文章J1中是未知词的用词J11作为置换对象,进行向取代未知词而使用的用词即代替用词的置换。
作为代替用词,能使用如下的用词:认为其比未知词更一般,另一方面,认为难以包含在设想为各种输入句的文章中。由此,期待避免与输入句所包含的用词相混同,从而难以出现误译。在本例中,将日语中“あさぎりの湯”这样的用词J21用于代替用词。置换部2a将包含用词J21的“あさぎりの湯はこちらです。”这样的文章J2作为置换结果的置换句输出至翻译引擎5。
在图1的示例中,翻译引擎5执行针对上述的文章J2的机器翻译的处理,作为处理结果的文章E2,输出“Spa of Asagiri is here.”。该文章E2包含“Spa ofAsagiri”,来作为取代未知词的用词J21的译词E21。复原部2b根据该文章E2这样的置换句的机器翻译的结果,来进行用于在提示为输入句的翻译结果的翻译句中将未知词复原的处理。
在图1中,例示复原部2b的处理成功的情况。复原部2b对上述的文章E2进行处理,作为针对输入句的文章J1的翻译句,输出“Baggage counter is here.”这样的文章E1。在该文章E1中,将上述文章E2中的代替用词的译词E21替换成由于在输入句中是未知词而设为置换部2a的置换对象的用词J11的译词E11即“Baggage counter”。
如本例那样,复原部2b只要能在置换句的机器翻译结果的文章E2中将代替用词的译词E21再置换成译词E11那样的未知词,就能得到适当复原了未知词的翻译句。这时,未知词的复原后的译词E11能与翻译引擎5的处理相独立地预先与置换对象的用词J11建立对应,在复原部2b以及置换部2a侧进行设定。
但考虑到如下情况:代替用词的译词E21对应于翻译引擎5的内部处理而变动,其会与在复原部2b侧预先设想的译词不同。此外,还设想如下情况:由于在翻译引擎5中的处理时,词素解析部5b不能适当地识别代替用词的词素,因此在机器翻译结果中会出现不良状况。出于这样的各种观点,在基于现有的词汇置换/复原技术的翻译处理中,难以避免未知词的复原失败的事态,难以精度良好地得到翻译句来表示输入句的翻译结果,这样的问题点通过本申请发明者的锐意研究而变得明确。
因此,本申请发明者对上述的问题点反复锐意研讨,研究出一种翻译装置,通过词汇置换/复原处理以及代替用词的改善,能容易地得到表示例如包含翻译引擎5的未知词的输入句的翻译结果的翻译句。以下说明本公开所涉及的翻译装置的实施方式。
(实施方式1)
以下使用附图来说明实施方式1。在实施方式1中,说明将未由翻译引擎5翻译的特定的字符串用作代替用词的翻译装置。
1.结构
图2是表示实施方式1所涉及的翻译装置1的外观的图。图2所示的翻译装置1例如是平板型的翻译装置,对语言不同的2位用户的会话进行翻译。以下,在本实施方式中,设想以下情况来进行说明:翻译装置1对说日语的主人(host)(例如指路者)和说英语的客人(guest)(例如旅行者)面对面进行的会话进行翻译。
翻译装置1具备麦克风10、扬声器12、显示器14和触控面板16。麦克风10以及扬声器12例如配置在翻译装置1的侧面的开口附近。显示器14以及触控面板16配置在翻译装置1的主面。在显示器14的长边方向的一侧(例如主人侧)的区域配置发声图标14h以及显示区域15h。在显示器14的长边方向的另一侧(例如客人侧)的区域显示发声图标14g以及显示区域15g。对各发声图标14h、14g进行用户的触摸操作。
发声图标14h是用于在主人进行发声时,即在作为翻译源将日语的发声输入到翻译装置1时,由主人本人指定主人的发声的开始时间点以及结束时间点的操作图标。发声图标14g是用于在客人进行发声时,即在作为翻译源而输入英语的发声时,由客人本人指定客人的发声的开始时间点以及结束时间点的操作图标。显示区域15h、15g是用于将声音识别结果以及翻译结果等显示为字符串的区域。
图3是表示实施方式1所涉及的翻译系统100的结构的框图。翻译系统100具有图2所示的翻译装置1、声音识别服务器41、翻译服务器42、以及声音合成服务器43。翻译装置1经由因特网那样的通信网络4与声音识别服务器41、翻译服务器42以及声音合成服务器43分别进行数据通信。
声音识别服务器41是如下那样的服务器:从翻译装置1经由通信网络4接收声音数据,对接收到的声音数据进行声音识别,生成由识别结果的字符串构成的声音识别数据即发声句的文本数据。另外,声音识别服务器41是本实施方式中的翻译装置1的外部的声音识别装置的一例。
翻译服务器42是搭载有翻译引擎5的服务器。翻译服务器42从翻译装置1经由通信网络4接收声音识别数据,对接收到的声音识别数据执行基于翻译引擎5的机器翻译,生成表示机器翻译的结果的文本数据即翻译数据。翻译服务器42是具有从第1语言向第2语言的翻译功能的外部装置的一例。
声音合成服务器43是如下那样的服务器:从翻译装置1经由通信网络4接收翻译数据,对接收到的翻译数据进行声音合成来生成声音信号。
翻译装置1除了麦克风10、扬声器12、显示器14和触控面板16以外,还具备通信部18、存储部20和控制部22。
麦克风10是将物理的声音变换成声音数据的装置。具体地,麦克风10将从外部输入的声音变换成模拟电信号的声音信号,进而通过AD变换器将声音信号变换成数字的声音数据。麦克风10是输入发声等声音的声音输入部的一例。
通信部18是遵循Bluetooth(注册商标)、Wi-Fi(注册商标)、3G、LTE(注册商标)、IEEE802.11等通信方式经由通信网络4与声音识别服务器41、翻译服务器42以及声音合成服务器43进行数据通信的通信模块。
存储部20是由闪速存储器、铁电体存储器、HDD、SSD、RAM以及它们的组合等构成的记录介质。存储部20存放麦克风10的声音数据、声音识别数据以及翻译数据。此外,存储部20存放为了控制部22而使用的各种程序。
在本实施方式中,存储部20存放登记词辞典31、代替词辞典32以及置换信息33。登记词辞典31是对在词汇置换/复原处理中设为置换对象的特定的用词进行登记的辞典信息的一例。代替词辞典32是包含翻译时取代置换对象而使用的代替用词的辞典信息的一例。置换信息33是表示置换前的用词和置换后的用词的对应建立的信息。关于登记词辞典31、代替词辞典32以及置换信息33的数据结构,之后叙述。
控制部22由CPU、MPU等构成,通过执行存放于存储部20的各种程序来控制翻译装置1的整体动作。控制部22例如作为功能性的结构而包含置换部2a以及复原部2b。在本实施方式中,控制部22的功能通过硬件与软件的协作来实现,但也可以仅由为了实现给定的功能而专用设计的硬件电路来实现。即,控制部22不仅能由CPU、MPU构成,还能由DSP、FPGA、ASIC等构成。
扬声器12是将电信号变换成声音的装置。扬声器12输出基于来自控制部22的声音信号(电信号)的声音。扬声器12是将翻译结果等的声音输出至外部的输出部的一例。
显示器14是显示图像的装置,由液晶显示设备或有机EL显示设备构成。显示器14在显示区域15h、15g显示来自控制部22的声音识别数据、翻译数据以及逆翻译数据所表示的图像。显示器14是将声音识别数据以及翻译数据等对主人以及客人进行显示输出的输出部的一例。此外,显示器14显示上述的发声图标14h、14g。
触控面板16是用户进行操作的操作部,接受来自用户的指示。触控面板16与显示器14重叠配置。
1-1.关于数据结构
参考图4~图6来说明存放于本实施方式的翻译装置1的登记词辞典31、代替词辞典32以及置换信息33的数据结构。
图4表示登记词辞典31的一例。在登记词辞典31中登记有在词汇置换/复原处理中设为置换对象的特定的用词。在本实施方式中,设想登记于翻译装置1的登记词辞典31的用词对翻译引擎5来说是未知词。这样的置换对象的用词例如包含各种固有名词。
登记词辞典31中所含的用词包含单词以及语句。登记词辞典31包含按照多种语言的对译来记载的用词。在图4中示出该多种语言是日语以及英语的示例,但并不特别限于此,能采用各种自然语言。以下,在登记词辞典31内的按照多种语言的对译来记载的用词当中,将以翻译源的语言记载的用词称作“登记用词”,将以翻译目标的语言记载的用词称作“登记用词的译词”。
登记词辞典31例如按表示登记用词的类别的每个类来设置。类将用词进行分类,是用词所表示的对象的类目。类例如包含地名以及食物。登记词辞典31也可以与登记用词建立关联地包含附加信息。例如,若类是“地名”,则附加信息就是表示登记用词所表示的场所的照片、访问手段的信息。
登记于登记词辞典31的用词不一定限于未知词,例如也可以是设想为在基于翻译引擎5的机器翻译中难以如所期望的那样进行翻译的用词。此外,也可以并不特别考虑翻译引擎5中有无登记,将仅在特定的领域使用的专业用词、仅在一部分场所或地域使用的用词登记在登记词辞典31中。由此,能经由词汇置换/复原处理在翻译句中使遵循登记词辞典31中的对译的登记用词的译词译出。
图5表示本实施方式中的代替词辞典32的一例。代替词辞典32包含在翻译时取代登记用词而使用的代替用词。本实施方式的代替词辞典32如图5所示那样,将由特殊的字符串构成的代替用词即代替字符串例如按类来区别地进行管理。
在本实施方式中,代替字符串例如如图5所示的字符串W1那样,包含排头的记号m0、末尾的记号m1和在排头以及末尾的记号m0、m1之间排列的字符部分w10。
代替字符串中的排头以及末尾的记号m0、m1例如被设定成“+”等预先规定的记号。例如根据“+”的记号m0、m1,在包含代替字符串的文章的词素解析等中,能容易地区分代替字符串的内外。各记号m0、m1例如设定为相互相同的记号,但也可以不是相同的记号。各记号m0、m1例如可以设定为各种括号记号。
代替字符串中的字符部分w10例如如字符串W1所示那样,将多个相互同种的字符排列而构成。字符部分w10的多个字符例如被设定成不具有意义,即,该字符的排列不会成为有意义的单词等。由此,在翻译引擎5中的机器翻译的处理前后,能容易地使代替字符串不改变。作为代替字符串,能设定为设想在翻译引擎5中的机器翻译的处理前后不发生变化的特定的字符串。
此外,字符部分w10的字符种类例如设定成在翻译源的语言中发生频度比较低的字符种类。例如在翻译源是日语的情况下,通过将字符部分w10设定为拉丁字母,从而与汉字等相比,发生频度降低。代替词辞典32可以按各种语言的每一种来管理不同的代替字符串,例如可以将设为翻译源的语言和相同语言中发生频度低的字符种类的代替字符串建立对应。
图6表示置换信息33的一例。置换信息33在后述的词汇置换/复原处理的执行时生成,例如在该处理中暂时存储于存储部20。置换信息33将置换前的用词和置换后的用词建立对应地包含。置换前的用词在词汇置换/复原处理中是置换对象的登记用词,置换后的用词是针对置换对象的登记用词的代替用词。
2.动作
以下说明以上那样构成的翻译系统100以及翻译装置1的动作。
2-1.整体动作
参考图7来说明翻译系统100以及翻译装置1的整体动作。在本实施方式中,翻译引擎5搭载于翻译服务器42。翻译装置1对翻译服务器42发送发声句的文本数据,从翻译服务器42取得表示翻译结果的翻译句的文本数据。
图7是用于说明翻译系统100中的翻译装置1的流程图。图7的流程图所示的各处理由翻译装置1的控制部22执行。
首先,翻译装置1的控制部22经由麦克风10取得与发声者的发声的声音相应的声音数据(S1)。
控制部22通过声音识别处理取得发声句(S2)。具体地,控制部22首先将取得的声音数据经由通信网络4发送到声音识别服务器41。声音识别服务器41对接收到的声音数据进行声音识别,生成发声句的文本数据。翻译装置1从声音识别服务器41经由通信网络4接收发声句的文本数据。
接下来,控制部22在取得的发声句内检索登记词辞典31中所含的登记用词(S3)。然后,控制部22判断在发声句内是否存在登记用词(S4)。
若在发声句内不存在登记用词(S4“否”),则控制部22就进行不是词汇置换/复原处理的通常的翻译处理(S5~S6)。通常的翻译处理是在并不特别使用置换部2a以及复原部2b的情况下取得针对发声句的翻译句的处理。
具体地,翻译装置1的控制部22首先将发声句的文本数据经由通信网络4发送到翻译服务器42(S5)。翻译服务器42在翻译引擎5中执行针对发声句的机器翻译,生成机器翻译的结果的文本数据。翻译服务器42将生成的文本数据经由通信网络4发送到翻译装置1。翻译装置1从翻译服务器42经由通信网络4接收翻译结果的文本数据,来作为翻译句(S6)。
另一方面,若在发声句内存在登记用词(S4“是”),则控制部22进行本实施方式所涉及的词汇置换/复原处理(S7)。根据本实施方式所涉及的词汇置换/复原处理,通过使用代替字符串,能使翻译句的精度良好。关于词汇置换/复原处理的详细情况,之后叙述。
控制部22例如控制显示器14,以便显示步骤S6、S7的翻译结果(S8)。例如,显示器14如图2例示的那样,在主人侧的显示区域15h显示发声句,并且在客人侧的显示区域15g显示翻译句。另外,发声句的显示和翻译句的显示可以同时进行,也可以按顺序进行。例如,控制部22可以在从翻译服务器42接收到翻译句的文本前先显示发声句。
翻译装置1的控制部22例如通过翻译结果的显示(S8)来结束图7的流程图所示的动作。
根据以上的翻译系统100以及翻译装置1的动作,在翻译装置1中,能通过发声来接受作为输入句的一例的发声句的输入,并且能提示利用了基于翻译引擎5的机器翻译的针对发声句的翻译结果的翻译句。
翻译装置1可以在进行翻译句的显示(S8)的基础上,或取而代之地,以声音来输出翻译句。在该情况下,翻译装置1的控制部22将步骤S6、S7中得到的翻译句的文本数据经由通信网络4发送到声音合成服务器43。声音合成服务器43基于从翻译装置1接收到的翻译句的文本数据,来进行声音合成而生成声音信号,并经由通信网络4对翻译装置1发送声音信号。控制部22基于从声音合成服务器43接收到的声音信号,从扬声器12输出表示翻译结果的声音。
2-2.词汇置换/复原处理
使用图8~图9来说明本实施方式中的词汇置换/复原处理(S7)的详细情况。
图8是例示本实施方式中的词汇置换/复原处理的流程图。图9是用于说明本实施方式中的词汇置换/复原处理的图。
在以下的说明中,设想如下场面的一例来进行说明:翻译系统100将主人所发出的日语的发声翻译成英语,将该翻译结果传达给客人。具体如图9所示那样,使用如下的示例来进行说明:输入句的一例的发声句是包含日语的用词J11来作为未知词的“手荷物力ウンタ一前に自販機があります。”这样的文章J10。在本例中,翻译装置1的控制部22基于发声句中的用词J11而在图7的步骤S4中前进到“是”,在步骤S7中执行图8的处理。
首先,翻译装置1的控制部22作为置换部2a起作用,将发声句中的登记用词置换成设为代替用词的特定的字符串(S21)。作为置换部2a的控制部22参考存储部20中的登记词辞典31以及代替词辞典32,来进行步骤S21的处理。
例如,如图4所示那样,在登记词辞典31中,将图9的示例的作为未知词的用词J11预先登记为属于类“地名”。在步骤S21中,控制部22基于类“地名”,从例如图5所示的代替词辞典32中选择作为属于相同的类的代替字符串之一的“+LDMVA+”这样的字符串W1,来作为代替用词。然后,控制部22将输入句的文章J10中的用词J11置换成所选择的代替用词,作为置换句,如图9所示那样生成“+LDMVA+前に自販機があります。”这样的文章J20。
控制部22将置换前后的用词建立对应,作为置换信息33来进行记录(S22)。作为图9的示例的置换信息33,例如如图6所示那样,将设为置换对象的用词J11作为置换前的用词进行记录,将选择为代替用词的字符串W1作为置换后的用词进行记录。
控制部22经由通信部18将针对发声句的置换结果的置换句发送到翻译服务器42(S23)。在本例中,作为置换句,发送表示包含代替用词的字符串W1的文章J20的文本数据。
翻译服务器42对接收到的置换句的文本数据执行基于翻译引擎5的机器翻译的处理,生成表示机器翻译的结果的文本数据。在图9的示例中,作为针对置换句的文章J20的机器翻译的结果,生成“There is a vending machine in front of+LDMVA+.”这样的文章E20。翻译服务器42将表示置换句的翻译结果的文章的文本数据经由通信网络4发送到翻译装置1。翻译装置1的控制部22从翻译服务器42经由通信部18接收置换句的翻译结果(S24)。
接下来,控制部22作为复原部2b起作用,在接收到的翻译结果中探测代替用词的字符串(S25),生成将发声句的翻译结果复原的翻译句(S26)。在图9的示例中,作为针对文章J10的翻译句,从上述的文章E20复原“Baggage counter is here.”这样的文章E1。
具体地,作为复原部2b的控制部22首先根据图6所示的置换信息33来确定置换后的代替用词的字符串W1,在置换句的翻译结果的文章E20中检索字符串W1(S25)。进而,控制部22根据置换信息33确定置换前的登记用词是用词J11。控制部22从登记词辞典31读出与用词J11对应的“Baggage counter”,来作为译词E11,将文章E20中的“+LDMVA+”置换成译词E11。由此,生成上述的文章E20那样的翻译句(S26)。
控制部22若生成翻译句(S26),就结束图7的步骤S7的处理,前进到步骤S8。
根据以上的处理,在词汇置换/复原处理中,作为针对未知词的代替用词,例如使用“+LDMVA+”这样的特殊的字符串W1(S21)。这样的特殊的字符串W1在翻译引擎5中不翻译,即,在翻译服务器42中的机器翻译的处理前后没有变更。因此,控制部22通过从机器翻译的结果进行与代替用词相同的字符串W1的再置换,能容易地使作为以翻译目标的语言来复原未知词的复原部2b的处理(S25~S26)成功,能精度良好地得到翻译句。
通过将上述那样的特定的字符串W1用作代替用词,在例如翻译服务器42中的机器翻译的处理时(S23~S24),能容易地避免词素解析的误识别。
例如在将图1的示例的用词J21用作代替用词的情况下,一般的词素解析部5b如图9所示那样,在针对发声句的文章J10的置换后的文章J22中,将汉字等同种的字符所排列的部分合起来识别成一个词素的可能性高。因此,根据文章J22中的用词J21前后的内容的不同,难以避免以下不良状况:进行将用词J21的内外错误地进行划分这样的词素解析,在文章J22的机器翻译结果中不出现用词J21的译词这样的不良状况。
针对于此,根据用作本实施方式的代替用词的特定的字符串W1,通过字符串W1的排头以及末尾的记号“+”,能在词素解析中提高划分代替用词和外部的可能性。此外,通过在排头以及末尾的记号间排列同种的字符,可提高将代替用词内部合起来进行识别的可能性。由此,能易于避免词素解析的误识别。这时,在翻译服务器42的词素解析部5b中,也可以不特别地在用于词素解析的辞典等中登记字符串W1。
进而,通过将作为本实施方式的代替用词的字符串W1设定成在日语等翻译源的语言中并不特别具有意义,从而在翻译服务器42中的机器翻译的处理时,能易于避免变更为与字符串W1不同的字符串的译词的事态。由此,能在翻译装置1中容易地探测复原部2b的处理对象,从而能容易地使翻译句中的未知词的复原成功。
另外,在翻译服务器42中,例如也可以在翻译辞典5a中登记代替用词的字符串W1的类。例如,能以字符串W1是“地名”的含义为前提,使包含该字符串W1的文章J20整体的翻译精度良好。这样的向翻译辞典5a的登记与对词素解析部5b的登记分开进行,能减少向翻译服务器42的登记负担。
3.总结
如以上那样,在本实施方式中,翻译装置1取得第1语言(例如日语)中的输入句(例如发声句),与翻译服务器43进行通信,输出表示文章J10等输入句的翻译结果的文章E10等翻译句。翻译服务器43是执行从第1语言向第2语言(例如英语)的机器翻译的外部装置的一例。翻译装置1具备存储部20、控制部22和通信部18。存储部20存储作为第1辞典信息的一例的登记词辞典31以及作为第2辞典信息的一例的代替词辞典32。登记词辞典31将第1语言的置换对象的用词即登记用词和第2语言针对登记用词的译词建立对应来包含。代替词辞典32包含取代置换对象的用词而使用的至少1个代替用词。控制部22将输入句中所含的置换对象的用词置换成代替用词,如文章J20那样生成表示置换结果的置换句(S21)。通信部18将置换句输出至翻译服务器42(S23),从翻译服务器42如文章E20那样取得第2语言中的置换句的翻译结果(S24)。代替用词例如如字符串W1那样由特定的字符串构成。控制部22在从通信部18取得的置换句的翻译结果中探测该特定的字符串(S25),将探测到的字符串置换成登记词辞典31中与置换对象的登记用词(例如用词J11)建立对应的译词(例如译词E11),来生成翻译句(S26)。
根据以上的翻译装置1,利用用作代替用词的特定的字符串在翻译服务器4中不被翻译这一点,在置换句的翻译结果中探测该字符串(S25),将翻译句复原(S26)。由此,易于避免使用了可被翻译服务器4的翻译引擎5翻译的代替用词的情况那样的复原的失败,易于得到适当地表示输入句的翻译结果的翻译句。
在本实施方式中,用作代替用词的代替字符串包含:分别配置于该字符串的排头和末尾的给定的记号m0、m1;以及在排头的记号m0与末尾的记号m1之间排列的相互同种的多个字符的字符部分w10。
根据这样的代替字符串,不被翻译引擎5翻译的可能性比较高,易于在翻译引擎5的处理后维持与处理前相同的字符串。作为代替字符串,例如通过使用在第1语言中发生频度低的字符种类,能更加提高该字符串不被翻译的可能性,更易于得到适当的翻译句。
在本实施方式中,置换对象的用词例如包含固有名词。置换对象的用词例如能设定成设想为在翻译服务器4中未登记的未知词的用词。由此,即使在输入句中包含未知词,也能精度良好地得到翻译句。
在本实施方式中,代替词辞典32例如可以按表示用词的类别的每个类对代替用词进行分类。在该情况下,控制部22使用被分类成与输入句中所含的置换对象的用词相同的类的代替用词来生成置换句(S21)。通过与类相应的代替用词来谋求翻译句的精度提升。
在本实施方式中,翻译装置1也可以进一步具备作为输入发声的声音输入部的一例的麦克风10。通信部18也可以将发声的声音数据输出至作为外部的声音识别装置的一例的声音识别服务器41,从声音识别服务器41取得针对声音数据的识别结果的输入句(S2)。根据这样的翻译装置1,易于得到针对用户的发声的适当的翻译句。
(实施方式2)
以下使用图10~图12来说明实施方式2。在实施方式2中,对使用图1说明的问题点提供与实施方式1不同的解决方案。
以下适当省略与实施方式1所涉及的翻译装置1以及翻译系统100同样的结构、动作的说明,来说明本实施方式所涉及的翻译装置1以及翻译系统100。
在本实施方式中说明如下翻译装置1,该翻译装置1若在词汇置换/复原处理中取得翻译引擎5的机器翻译结果,就判断是否包含代替用词的译词,根据判断结果来替换代替用词并重复相同的处理。
图10表示实施方式2中的代替词辞典32A的一例。本实施方式的翻译装置1使用包含单词以及语句且设想例如在翻译引擎5中被精度良好地翻译的用词,来作为代替用词。
在本实施方式的代替词辞典32A中,用作代替用词的用词按照与登记词辞典31相同的多种语言(例如日语以及英语)的对译来记载。在本实施方式的词汇置换/复原处理中,将在代替词辞典32A中以多种语言当中的翻译源的语言记载的用词作为“代替用词”用在置换句中,将以翻译目标的语言记载的用词作为“代替用词的译词”用在翻译句中。
代替词辞典32A例如在与实施方式1同样的各类中包含多个代替用词和其译词。此外,本实施方式的代替词辞典32A例如如图10所示那样对代替用词间的优先顺位进行管理。优先顺位表示在本实施方式的词汇置换/复原处理中用作代替用词时优先的顺序。在本例中,在相同的类的代替用词之间设定优先顺位。具有优先顺位“1”的用词成为最高的优先顺位的代替用词。
图11是例示实施方式2中的词汇置换/复原处理的流程图。本实施方式的翻译装置1在与实施方式1同样的动作的执行时,在图7的步骤S7中取代图8的流程图而执行本流程图例示的处理。
首先,翻译装置1的控制部22在本实施方式的代替词辞典32A中从优先顺位高的代替用词起按顺序选择1个代替用词(S21a)。控制部22使用所选择的代替用词,与实施方式1同样地进行作为置换部2a以及复原部2b的处理(S21b~S25a)。在图12示出本实施方式中的置换信息33A的一例。
图12例示了在步骤S21a中在与置换前的用词J11相同的类的代替词辞典32A中选择优先顺位最高的用词J23的情况下的步骤S22的置换信息33A。在该情况下,控制部22将发声句中的用词J11置换成所选择的用词J23,来生成置换句(S21b)。用词J23那样的代替用词在翻译服务器42中的机器翻译的处理时例如被从日语翻译成英语。
控制部22若从翻译服务器42接收到置换句的翻译结果(S24),就参考置换信息33A以及代替词辞典32A,在接收到的置换句的翻译结果的文章中探测代替用词的译词(S25a)。具体地,控制部22将置换信息33A中的置换后的用词J23的译词E23从代替词辞典32A中读出,在机器翻译的结果的文章中检索译词E23。
在上述那样的情况下,考虑在翻译服务器42中的置换句的翻译结果的文章中不含预先设想的代替用词的译词E23的情况。控制部22基于步骤S25a的探测结果,判断在从翻译服务器42接收到的置换句的翻译结果的文章中是否存在代替用词的译词(S25b)。
控制部22若判断为在置换句的翻译结果中不存在代替用词的译词(S25b“否”),就参考代替词辞典32A,判断是否存在代替用词的下位候补(S25c)。代替用词的下位候补是在代替词辞典32A中在与置换句中使用的代替用词相同的类中具有比该代替用词更下位的优先顺位的代替用词。
在存在代替用词的下位候补的情况下(S25c“是”),控制部22在代替用词的下位候补中选择具有最高的优先顺位的代替用词(S21a),再次进行步骤S21b以后的处理。由此,按照优先顺位从高到低的顺序,使用代替用词来重复生成置换句,并发送到翻译服务器42(S23)。翻译引擎5依次执行接收到的置换句的机器翻译。
控制部22若判断为在置换句的翻译结果中存在代替用词的译词(S25b“是”),就将代替用词的译词置换成登记用词的译词,并与实施方式1同样地生成翻译句(S26)。之后,控制部22结束图7的步骤S7,前进到步骤S8。
根据以上的处理,在将代替用词包含在内来生成置换句时,在翻译引擎5的置换句的翻译结果中未包含对该代替用词设想的译词的情况下(S25b“否”),使用其他代替用词来再次进行置换句的生成等(S21a~S24)。只要在针对基于这样的不同的代替用词的多个置换句的机器翻译的结果的任一者中包含所设想的代替用词的译词(S25b“是”),就能得到将未知词复原的翻译句(S26)。此外,能易于避免使用户看到在未知词的复原失败的情况下取代未知词而包含与代替用词的译词E23类似的译词的文章。如此地,能使翻译句的精度良好。
另外,在置换句的翻译结果中不存在代替用词的译词这样的判断(S25b“否”)发生重复而不再有代替用词的下位候补的情况下(S25c“否”),控制部22例如不进行步骤S26的处理,结束图7的步骤S7。
在上述的情况下,在紧接着的步骤S8中,控制部22例如可以使最后接收到的置换句的翻译结果作为翻译句显示于显示器14。例如,在代替词辞典32A中,作为优先顺位最下位的代替用词,预先登记认为即使显示了翻译结果也不会招致主人等用户的不快感的用词。由此,即使显示了未知词的复原最终失败的文章,也能难以产生用户的不快感。此外,也可以取代上述翻译句的显示,或在此基础上,控制部22使各种错误显示进行显不。
如以上那样,在本实施方式中,翻译装置1取得第1语言中的输入句,与执行从第1语言向第2语言的机器翻译的翻译服务器43等进行通信,输出表示输入句的翻译结果的翻译句。翻译装置1具备存储部20、控制部22和通信部18。存储部20存储作为第1辞典信息的一例的登记词辞典31以及作为第2辞典信息的一例的代替词辞典32A。本实施方式的代替词辞典32A将第1语言中取代置换对象的用词而使用的多个代替用词和第2语言针对各代替用词的译词建立对应来包含。控制部22判断在从通信部18取得的置换句的翻译结果中是否存在代替用词的译词(S25b)。控制部22在判断为不存在代替用词的译词的情况下(S25b“否”),使用代替词辞典32A中不同于与该译词建立对应的代替用词的代替用词,再次生成置换句并输出至通信部18(S25c~S23)。控制部22在判断为存在代替用词的译词的情况下(S25b“是”),将该译词置换成登记词辞典31中与置换对象的用词建立对应的译词,来生成翻译句(S26)。
根据以上的翻译装置1,在包含代替用词的置换句的翻译结果中不存在代替词辞典32A中对应的代替用词的译词的情况下(S25b“否”),使用其他代替用词再次进行置换句的机器翻译。如此地,通过使用多次置换句,与仅1次置换句的情况相比,翻译句的复原最终失败的可能性降低,能易于得到适当地表示输入句的翻译结果的翻译句。此外,能易于避免使用户看到未知词的复原失败的文章的事态。
在本实施方式中,代替词辞典32A可以对多个代替用词中的优先顺位进行管理。控制部22在多个代替用词中从优先顺位高的代替用词起按顺序使用于置换句(S21a)。例如,通过将置换句的翻译结果中包含译词的可能性高的代替用词的优先顺位设定得高,能使翻译句的复原效率良好地成功。
(其他实施方式)
如以上那样,作为本申请中公开的技术的例示,说明了实施方式1~2。但本公开中的技术并不限定于此,还能适用于适当进行了变更、置换、附加、省略等的实施方式中。此外,还能组合上述各实施方式中说明的各构成要素,生成新的实施方式。因此,以下例示其他实施方式。
在上述的实施方式2中的词汇置换/复原处理(图11)中,可以使用实施方式1中的特定的字符串。使用图13来说明这样的变形例。
图13例示本变形例中的代替词辞典32B。例如可以在与实施方式2同样的代替词辞典32B中登记实施方式1的代替字符串。在图13的示例中,在代替词辞典32B中包含字符串W1作为代替用词。在本例的代替词辞典32B中,在日语以及英语这样的各语言中记载有相同的字符串W1。
根据上述的代替词辞典32B,控制部22例如在图11的步骤S21b中参考日语等翻译源的语言的记载,将字符串W1用作代替用词。此外,在步骤S25a中,参考英语等翻译目标的语言的记载,将相同的字符串W1用作代替用词的译词。如此地,能同样地使用特殊的字符串W1和其他代替用词,来进行词汇置换/复原处理。
如以上那样,在本变形例中,代替词辞典32B中的多个代替用词可以包含由特定的字符串构成的代替用词。代替词辞典32B可以包含与该字符串相同的字符串,来作为由特定的字符串构成的代替用词的译词。
此外,也可以使用实施方式1的代替词辞典32来进行与实施方式2同样的词汇置换/复原处理。例如在图5的代替词辞典32中,能将代替字符串间的优先顺位设定成按每个类登记的升序。
根据上述的代替词辞典32,在与图11同样的处理时,控制部22在步骤S25a、S25b中,取代代替用词的译词而与图8的步骤S25同样地探测有无代替字符串。这时,若探测到不存在代替字符串(S25b“否”),就使用由不同的字符串构成的其他代替字符串来重复进行置换句的生成(S21a~S25c),能提升翻译句的精度。
如以上那样,在本变形例中,代替词辞典32可以包含由相互不同的字符串构成的多个代替用词。控制部22若在从通信部18取得的置换句的翻译结果中探测到不存在使用于置换句的字符串(S25b“否”),就使用与该字符串的代替用词不同的代替用词再次生成置换句,并输出至通信部18(S25c~S23)。
上述的各实施方式的翻译装置1也可以还具有逆翻译功能,该逆翻译功能使将发声的语言(例如日语)翻译成其他语言(例如英语)而得到的翻译结果即翻译句翻译成原本的语言(例如日语)。在该情况下,翻译装置1将进行了置换的状态的翻译句发送到翻译服务器4,从翻译服务器4取得逆翻译句。
在上述的各实施方式中,由声音识别服务器41进行声音识别,由翻译服务器42进行翻译,由声音合成服务器5进行声音合成,但本公开并不限定于此。可以在翻译装置1内进行声音识别、翻译以及声音合成中的至少一个处理。例如,也可以在翻译装置1(终端)搭载与声音识别服务器41、翻译服务器42以及声音合成服务器43相同的全部功能,仅由翻译装置1进行与翻译关联的全部处理。在该情况下,翻译装置1也可以不具有与通信网络4连接的通信部18。例如,在控制部22中,作为翻译服务器4的功能的、与翻译引擎5进行信息的交接的功能可以构成针对翻译引擎5的通信部。
在上述的各实施方式中,示出日语与英语之间的翻译的示例。但设为翻译处理的对象的语言并不限定于日语和英语,也可以是其他语言,例如可以是中文、德语、法语、西班牙语、韩语、泰语、越南语、印度尼西亚语等。
在上述的各实施方式中,翻译装置1将用麦克风10输入的发声句作为输入句进行翻译,但也可以对以发声以外的方式输入的输入句进行翻译。例如,翻译装置1可以对用键盘、鼠标等输入的输入句进行翻译。即,本公开的翻译装置1在对各种输入句的文章进行翻译时,将文章中的置换对象的用词置换成代替用词来进行翻译。然后,将翻译句中所含的代替用词的译词复原成针对通过代替用词进行了置换的置换对象的用词的译词,并显示翻译句。
如此地,作为本公开中的技术的例示,说明了实施方式。为此,提供了附图以及详细的说明。
因此,在附图以及详细的说明中记载的构成要素中,不仅包含为了解决课题所必须的构成要素,还能为了例示上述技术而包含并非为了解决课题所必须的构成要素。因此,不应因为这些非必须的构成要素记载于附图、详细的说明中就直接认定这些非必须的构成要素是必须的。
此外,上述的实施方式由于用于例示本公开中的技术,因此能在专利权利要求书或其均等的范围内进行各种变更、置换、附加、省略等。
工业可利用性
本公开能适用于用于在各种场面进行各种语言间的翻译的翻译装置。
Claims (9)
1.一种翻译装置,取得第1语言中的输入句,与执行从所述第1语言向第2语言的机器翻译的外部装置进行通信,并输出表示所述输入句的翻译结果的翻译句,
所述翻译装置具备:
存储部,存储将所述第1语言的置换对象的用词和所述第2语言针对所述置换对象的用词的译词建立对应来包含的第1辞典信息、以及包含取代所述置换对象的用词而使用的至少1个代替用词的第2辞典信息;
控制部,将所述输入句中所含的所述置换对象的用词置换成所述代替用词,来生成表示置换结果的置换句;和
通信部,将所述置换句输出至所述外部装置,从所述外部装置取得所述第2语言中的所述置换句的翻译结果,
所述代替用词由特定的字符串构成,
所述控制部在从所述通信部取得的置换句的翻译结果中探测该特定的字符串,将探测到的字符串置换成所述第1辞典信息中与所述置换对象的用词建立对应的译词,来生成所述翻译句。
2.根据权利要求1所述的翻译装置,其中,
所述特定的字符串包含:
分别配置于该字符串的排头和末尾的给定的记号;和
在所述排头的记号与所述末尾的记号之间排列的相互同种的多个字符。
3.根据权利要求1或2所述的翻译装置,其中,
所述第2辞典信息包含由相互不同的字符串构成的多个代替用词,
所述控制部若在从所述通信部取得的置换句的翻译结果中探测到不存在使用于所述置换句的字符串,就使用与该字符串的代替用词不同的代替用词再次生成所述置换句,并输出至所述通信部。
4.一种翻译装置,取得第1语言中的输入句,与执行从所述第1语言向第2语言的机器翻译的外部装置进行通信,并输出表示所述输入句的翻译结果的翻译句,
所述翻译装置具备:
存储部,存储将所述第1语言的置换对象的用词和所述第2语言针对所述置换对象的用词的译词建立对应来包含的第1辞典信息、以及将在所述第1语言中取代所述置换对象的用词而使用的多个代替用词和所述第2语言针对各代替用词的译词建立对应来包含的第2辞典信息;
控制部,将所述输入句中所含的所述置换对象的用词置换成所述代替用词,来生成表示置换结果的置换句;和
通信部,将所述置换句输出至所述外部装置,从所述外部装置取得所述第2语言中的所述置换句的翻译结果,
所述控制部判断在从所述通信部取得的置换句的翻译结果中是否存在所述代替用词的译词,在判断为不存在所述代替用词的译词的情况下,使用所述第2辞典信息中不同于与该译词建立对应的代替用词的代替用词再次生成所述置换句,并输出至所述通信部,在判断为存在所述代替用词的译词的情况下,将该译词置换成所述第1辞典信息中与所述置换对象的用词建立对应的译词,来生成所述翻译句。
5.根据权利要求4所述的翻译装置,其中,
所述多个代替用词包含由特定的字符串构成的代替用词,
作为由所述特定的字符串构成的代替用词的译词,所述第2辞典信息包含与该字符串相同的字符串。
6.根据权利要求3~5中任一项所述的翻译装置,其中,
所述第2辞典信息管理所述多个代替用词中的优先顺位,
所述控制部在所述多个代替用词中从所述优先顺位高的代替用词起按顺序使用于所述置换句。
7.根据权利要求1~6中任一项所述的翻译装置,其中,
所述置换对象的用词包含固有名词。
8.根据权利要求1~7中任一项所述的翻译装置,其中,
所述第2辞典信息按表示用词的类别的每个类将所述代替用词分类,
所述控制部使用被分类成与所述输入句中所含的置换对象的用词相同的类的代替用词,来生成所述置换句。
9.根据权利要求1~8中任一项所述的翻译装置,其中,
所述翻译装置还具备输入发声的声音输入部,
所述通信部将所述发声的声音数据输出至外部的声音识别装置,从所述声音识别装置取得针对所述声音数据的所述输入句。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019104680 | 2019-06-04 | ||
JP2019-104680 | 2019-06-04 | ||
PCT/JP2020/017824 WO2020246175A1 (ja) | 2019-06-04 | 2020-04-24 | 翻訳装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113924573A true CN113924573A (zh) | 2022-01-11 |
Family
ID=73652202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080041464.0A Pending CN113924573A (zh) | 2019-06-04 | 2020-04-24 | 翻译装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11995416B2 (zh) |
JP (1) | JP7526942B2 (zh) |
CN (1) | CN113924573A (zh) |
WO (1) | WO2020246175A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113505159B (zh) * | 2021-07-16 | 2023-04-25 | 马上消费金融股份有限公司 | 数据检测方法、装置及设备 |
US12056457B2 (en) * | 2022-03-22 | 2024-08-06 | Charles University, Faculty Of Mathematics And Physics | Computer-implemented method of real time speech translation and a computer system for carrying out the method |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS4929632B1 (zh) | 1970-12-30 | 1974-08-06 | ||
JP4929632B2 (ja) | 2005-07-08 | 2012-05-09 | カシオ計算機株式会社 | 表示制御装置及びプログラム |
JP2014078132A (ja) * | 2012-10-10 | 2014-05-01 | Toshiba Corp | 機械翻訳装置、方法およびプログラム |
JP5973986B2 (ja) * | 2013-12-24 | 2016-08-23 | 日本電信電話株式会社 | 翻訳システム、方法、及びプログラム |
JP2017151553A (ja) | 2016-02-22 | 2017-08-31 | 富士通株式会社 | 機械翻訳装置、機械翻訳方法、及びプログラム |
CN107870901B (zh) * | 2016-09-27 | 2023-05-12 | 松下知识产权经营株式会社 | 从翻译源原文生成相似文的方法、记录介质、装置以及系统 |
JP7199061B2 (ja) * | 2017-04-27 | 2023-01-05 | パナソニックIpマネジメント株式会社 | 翻訳装置 |
EP3657361A4 (en) * | 2017-07-20 | 2020-07-22 | Panasonic Intellectual Property Management Co., Ltd. | TRANSLATION DEVICE, TRANSLATION METHOD AND PROGRAM |
KR102516364B1 (ko) * | 2018-02-12 | 2023-03-31 | 삼성전자주식회사 | 기계 번역 방법 및 장치 |
-
2020
- 2020-04-24 JP JP2021524710A patent/JP7526942B2/ja active Active
- 2020-04-24 WO PCT/JP2020/017824 patent/WO2020246175A1/ja active Application Filing
- 2020-04-24 CN CN202080041464.0A patent/CN113924573A/zh active Pending
-
2021
- 2021-12-02 US US17/540,581 patent/US11995416B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JPWO2020246175A1 (zh) | 2020-12-10 |
US11995416B2 (en) | 2024-05-28 |
JP7526942B2 (ja) | 2024-08-02 |
US20220092277A1 (en) | 2022-03-24 |
WO2020246175A1 (ja) | 2020-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
US8504350B2 (en) | User-interactive automatic translation device and method for mobile device | |
TWI443551B (zh) | 用於輸入方法編輯器之方法及系統,及電腦程式產品 | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
US9471568B2 (en) | Speech translation apparatus, speech translation method, and non-transitory computer readable medium thereof | |
US8756058B2 (en) | Speech recognition system, speech recognition result output method, and speech recognition result output program | |
CN113642316B (zh) | 中文文本纠错方法、装置、电子设备及存储介质 | |
CN1742273A (zh) | 多模态语音-语音语言翻译和显示 | |
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
US11227116B2 (en) | Translation device, translation method, and program | |
JPWO2018055983A1 (ja) | 翻訳装置、翻訳システム、および評価サーバ | |
US20200043493A1 (en) | Translation device | |
US11995416B2 (en) | Translation device | |
US11694028B2 (en) | Data generation apparatus and data generation method that generate recognition text from speech data | |
JP7117629B2 (ja) | 翻訳装置 | |
JP5208795B2 (ja) | 通訳装置、方法、及びプログラム | |
KR101777141B1 (ko) | 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법 | |
KR20200051170A (ko) | 입력 문자에 대한 오타 보정 처리가 가능한 터치스크린이 구비된 전자 단말 장치 및 그 동작 방법 | |
WO2023166651A1 (ja) | 情報処理装置及び情報処理プログラム | |
JP2018195248A (ja) | 翻訳表示装置、コンピュータ端末及び翻訳表示方法 | |
JP2021085996A (ja) | 音声認識システム、音声認識方法 | |
JP2015170093A (ja) | 未知語抽出装置及び未知語抽出方法 | |
KR101447388B1 (ko) | 로마자 표기법을 따르는 한글 입력 방법에서의 제안어 자동 생성 방법 | |
KR20180057923A (ko) | 자동 통번역 시스템용 사용자 데이터베이스 구축 시스템, 이를 이용한 자동 통번역 시스템 및 그 방법 | |
JP2004127195A (ja) | 数字キーを用いた中国語入力方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20220111 |
|
WD01 | Invention patent application deemed withdrawn after publication |