JP6076285B2 - Translation apparatus, translation method, and translation program - Google Patents
Translation apparatus, translation method, and translation program Download PDFInfo
- Publication number
- JP6076285B2 JP6076285B2 JP2014062001A JP2014062001A JP6076285B2 JP 6076285 B2 JP6076285 B2 JP 6076285B2 JP 2014062001 A JP2014062001 A JP 2014062001A JP 2014062001 A JP2014062001 A JP 2014062001A JP 6076285 B2 JP6076285 B2 JP 6076285B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- reading
- program
- dictionary
- kana
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
この発明は、例えば、地図上に記載される文字情報であるいわゆる地図注記などのように、大量に存在する名詞句の羅列データの翻訳を行うための装置、方法、プログラムに関する。 The present invention relates to an apparatus, a method, and a program for translating enumeration data of a large number of noun phrases such as so-called map notes that are character information described on a map.
従来から機械翻訳装置に関する種々の発明がなされている。例えば、後に記す特許文献1には、固有名詞を翻訳する場合であっても、固有名詞辞書を適切に整備しておくことにより正確に翻訳することができることが記載されている。また、同文献には、固有名詞辞書に登録された各固有名詞に対する捕捉語を記憶保持する捕捉語辞書をも用いることにより、固有名詞がどのようなものかについても翻訳結果に含めるようにすることが記載されている。これにより、翻訳結果をより理解し易いものとすることができるという点で効果がある。 Conventionally, various inventions relating to machine translation devices have been made. For example, Patent Document 1 described later describes that even when a proper noun is translated, it can be accurately translated by properly preparing a proper noun dictionary. In addition, the same document also includes a captured word dictionary that stores captured words for each proper noun registered in the proper noun dictionary, so that the proper result is included in the translation result. It is described. This is advantageous in that the translation result can be made easier to understand.
従来の機械翻訳装置の場合、翻訳のために種々の辞書が必要になっている。上述した特許文献1に記載の発明でも固有名詞などの翻訳辞書に加えて捕捉語辞書も必要なっている。翻訳のために辞書を検索する処理にはある程度時間がかかるために、大量の固有名詞などの名詞句の羅列の翻訳を行う場合には時間が掛かる。例えば、大量の名詞句の羅列の翻訳行う場合の例として、地図注記の翻訳を行う場合について考える。 In the case of a conventional machine translation device, various dictionaries are required for translation. The invention described in Patent Document 1 described above also requires a captured word dictionary in addition to a translation dictionary such as proper nouns. Since it takes a certain amount of time to search the dictionary for translation, it takes time to translate a list of noun phrases such as a large number of proper nouns. For example, consider the case of translating map notes as an example of translating a large number of noun phrases.
地図には、例えば、市街図、道路図、広域図、地方図、全国図といった種々のものがあり、さらに同じ種類の地図でも縮尺の異なる複数の地図が存在する。このように、種類や縮尺の異なる全ての地図を対象にした場合、地図注記は数千万件も存在する。そして、数字、アルファベット、アイコンのみにより構成される地図注記などの翻訳が必要ないものは除外し、重複する地図注記は1つに集約したとしても、翻訳対象となる地図注記は数百万件も存在する。 There are various maps such as city maps, road maps, regional maps, regional maps, and national maps, and there are a plurality of maps of different scales even with the same type of map. Thus, when all types of maps of different types and scales are targeted, there are tens of millions of map notes. And even if map annotations consisting only of numbers, alphabets, and icons are excluded, those that do not need to be translated are excluded, and even if multiple overlapping map notes are consolidated into one, millions of map notes are subject to translation. Exists.
この数百万件の地図注記を、従来の辞書を参照する方式で多言語に機械翻訳する場合には、数週間を要しているのが現状である。また、地図注記は、地図上の地物が無くなったり、新たにできたりした場合には、必ず変わるため、所定のタイミングで現地調査をして更新し、翻訳し直す必要がある。 It takes several weeks to machine-translate these millions of map notes into multiple languages using a conventional dictionary reference method. In addition, map notes always change when features on the map are lost or newly created, so it is necessary to conduct a field survey at a predetermined timing to update and re-translate.
このように、地図注記は、翻訳を繰り返す必要があるため、できるだけ高速に翻訳したいとする要求が従来からある。このことは地図注記だけでなく、住所リスト、電話帳リスト、顧客リストなどに記載された、例えば、地名、名称、名前、住所といった多数の名詞句の羅列を翻訳する場合にも同様に生じている課題である。 As described above, since map annotation needs to be repeatedly translated, there is a conventional request to translate as fast as possible. This also occurs when translating a large number of noun phrases such as place names, names, names, addresses, etc., not only in map notes but also in address lists, phone book lists, customer lists, etc. It is a problem.
以上のことに鑑み、この発明は、大量に存在する名詞句の羅列データを、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できるようにすることを目的とする。 In view of the above, an object of the present invention is to make it possible to translate a large amount of noun phrase enumeration data much faster and more accurately than conventional machine translation devices.
上記課題を解決するため、請求項1に記載の発明の翻訳装置は、
文字列とその読み仮名とを対応付けた読み仮名辞書と、
前記読み読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第1のプログラム作成手段と、
読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書と、
前記翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第2のプログラム作成手段と、
前記第1のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与手段と、
前記第2のプログラム作成手段で作成された翻訳プログラムを実行し、前記読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する翻訳手段と
を備えることを特徴とする。
In order to solve the above problem, a translation device according to claim 1 is provided:
A phonetic dictionary that associates strings with their phonetic kana,
First program creating means for converting a content of the reading-reading kana dictionary into program logic and creating a reading-kana adding program for adding a reading kana to an input character string;
A translation dictionary associating a reading kana with a character string of a predetermined language corresponding to the reading kana,
Second program creating means for converting the contents of the translation dictionary into program logic and creating a translation program for translating the input reading pseudonym into a predetermined language;
A reading pseudonym giving unit that executes the reading pseudonym giving program created by the first program creation unit and gives a reading pseudonym to a character string to be translated;
A translation unit configured to execute the translation program created by the second program creation unit and translate the reading pseudonym given by the reading pseudonym granting unit into a target language.
この請求項1に記載の発明の翻訳装置によれば、読み仮名辞書は、第1のプログラム作成手段によって、その内容がプログラムロジックに変換され、入力さえた文字列に対してその読み仮名を付与する読み仮名付与プログラムとなる。同様に、翻訳辞書は、第2のプログラム作成手段によって、その内容がプログラムロジックに変換され、読み仮名を所定の言語に翻訳する翻訳プログラムとなる。 According to the translation device of the first aspect of the present invention, the reading kana dictionary is converted into the program logic by the first program creating means, and the reading kana is given to the inputted character string. It becomes a reading pseudonym grant program. Similarly, the translation dictionary is converted into a program logic by the second program creation means, and becomes a translation program for translating reading kana into a predetermined language.
当該翻訳装置では、読み仮名変換手段が、第1のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する。当該読み仮名付与プログラムは、読み仮名辞書の内容がそのままプログラムロジックとされたものなので、外部の読み仮名辞書を参照する必要は全く無い。 In the translation apparatus, the reading-kana conversion unit executes the reading-kana adding program created by the first program creating unit, and gives a reading-kana to the character string to be translated. Since the contents of the reading kana dictionary are directly used as the program logic, the reading kana giving program does not need to refer to an external reading kana dictionary at all.
当該翻訳装置では、翻訳手段が、第2のプログラム作成手段で作成された翻訳プログラムを実行し、読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する。当該翻訳プログラムは、翻訳辞書の内容がそのままプログラムロジックとされたものなので、外部の翻訳辞書を参照する必要は全く無い。 In the translation apparatus, the translation means executes the translation program created by the second program creation means, and translates the reading kana given by the reading kana giving means into the target language. In the translation program, the contents of the translation dictionary are directly used as program logic, so there is no need to refer to an external translation dictionary.
このように、当該翻訳装置では、翻訳対象の文字列に読み仮名を付与する場合にも、また、付与された読み仮名を目的とする言語に翻訳する場合にも、外部の辞書を全く参照しないため、極めて高速に翻訳を行える。従って、翻訳対象の文字列が多数存在していても、超高速に翻訳が行える。 In this way, the translation device does not refer to an external dictionary at all when adding a reading kana to a character string to be translated or when translating a given reading kana into a target language. Therefore, translation can be performed at extremely high speed. Therefore, even if there are many character strings to be translated, translation can be performed at a very high speed.
この発明によれば、例えば、地図注記などの大量に存在する名詞句の羅列を、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できる。 According to the present invention, for example, a large number of noun phrases such as map notes can be translated significantly faster and more accurately than conventional machine translation devices.
以下、図を参照しながら、この発明の装置、方法、プログラムの一実施の形態について説明する。この発明は、地図注記、電話帳リスト、顧客リストなどに記載された地名、名称、名前、住所といった、大量に存在する名詞句の羅列データについて翻訳を行う場合に適用可能なものである。「名詞句」との文言は、物体、物質、人物、場所など具体的な対象を示す語句を意味する。この明細書において、翻訳対象となる「名詞句の羅列」の具体例として、地図注記、電話帳リスト、顧客リストなどに記載された、例えば、地名、名称、名前、住所といったものを想定している。 Hereinafter, embodiments of the apparatus, method, and program of the present invention will be described with reference to the drawings. The present invention can be applied to translation of enumerated data of a large number of noun phrases such as place names, names, names, and addresses described in map notes, telephone directory lists, customer lists, and the like. The term “noun phrase” means a phrase indicating a specific object such as an object, a substance, a person, or a place. In this specification, as a specific example of “a list of noun phrases” to be translated, for example, a place name, a name, a name, an address described in a map note, a phone book list, a customer list, etc. Yes.
以下においては、地図注記の翻訳を行う場合を例にして具体的に説明する。地図注記は、上述もしたように大量に存在し、頻繁に更新されるため、その更新の都度、翻訳し直さなければならないものであること。また、近年おいては、外国から日本を訪れる観光客やビジネスマンも増えてきており、最新の地図の地図注記を所定の外国語に翻訳して表した外国語対応の最新の地図を迅速に提供することが望まれていること。しかも、外国語は、中国語(簡体)、中国語(繁体)、英語、韓国語などというように、複数の言語に対応することが求められることなどの事情がある。 In the following, a specific description will be given by taking as an example the case of translating a map note. Map annotations exist in large quantities as described above, and are frequently updated. Therefore, map annotations must be re-translated each time they are updated. In recent years, the number of tourists and business people visiting Japan from abroad has increased, and the latest maps for foreign languages, which are translated from the map annotations of the latest maps into the specified foreign languages, can be quickly displayed. What you want to provide. In addition, foreign languages are required to support a plurality of languages such as Chinese (simplified), Chinese (traditional), English, and Korean.
このような背景の下、以下に説明する実施の形態の装置、方法、プログラムは、大量に存在する地図注記を、従来の機械翻訳装置に比べて、飛躍的に速く、しかも適切に、且つ、複数の言語に翻訳することを実現している。 Under such a background, the apparatus, method, and program according to the embodiments described below are capable of converting a large amount of map annotations significantly faster and more appropriately than a conventional machine translation apparatus, and It has been translated into multiple languages.
[ビッグデータ翻訳装置の構成例]
まず、この実施の形態のビッグデータ翻訳装置(以下、単に翻訳装置と記載する。)の構成例と動作の概要について説明する。図1は、この実施の形態の翻訳装置の構成例と動作の概要を説明するためのブロック図である。図1に示す翻訳装置において、制御部101は、当該翻訳装置の各部を制御する機能を、記憶装置102は情報記憶保持機能を実現し、操作部103は、ユーザーインターフェース機能を実現する。
[Configuration example of big data translation device]
First, a configuration example and an outline of operation of a big data translation apparatus (hereinafter simply referred to as a translation apparatus) of this embodiment will be described. FIG. 1 is a block diagram for explaining a configuration example and an outline of operation of the translation apparatus according to this embodiment. In the translation apparatus shown in FIG. 1, the
読み仮名辞書群111は、固有名詞読み仮名辞書、一般名詞読み仮名辞書、接頭語読み仮名辞書、接尾語読み仮名辞書、カタカナ語読み仮名辞書などの複数の読み仮名辞書を備え、日本語の地図注記データに対する読み仮名を提供する。なお、図示していないが、接頭語読み仮名辞書は、固有名詞接頭語読み仮名辞書、一般名詞接頭語読み仮名辞書、カタカナ語接頭語読み仮名辞書がある。同様に、接尾語読み仮名辞書は、固有名詞接尾語読み仮名辞書、一般名詞接尾語読み仮名辞書、カタカナ語接尾語読み仮名辞書がある。
The reading kana
また、固有名詞読み仮名辞書、一般名詞読み仮名辞書、カタカナ語読み仮名辞書のそれぞれは、部分一致により漢字の読み仮名の検索が可能なものである。また、各接頭語読み仮名辞書は、接頭語の読み仮名を提供するものであるので、前方一致により漢字の読み仮名の検索が可能なものである。また、各接尾語読み仮名辞書は、接尾語の読み仮名を提供するものであるので、後方一致により漢字の読み仮名の検索が可能なものである。 Each of the proper noun reading kana dictionary, the general noun reading kana dictionary, and the katakana reading kana dictionary is capable of searching for kanji reading kana by partial matching. Each prefix reading kana dictionary provides the reading kana of the prefix, so that it is possible to search for kanji reading kana by forward matching. Each suffix reading kana dictionary provides the reading kana of the suffix, so that the kanji reading kana can be searched by backward matching.
読み仮名付与プログラム作成部(第1のプログラム作成手段)112は、読み仮名辞書群111の各読み仮名辞書の内容をプログラムロジックに変換し、地図注記データに対して読み仮名を付与する読み仮名付与プログラムを作成する。読み仮名付与プログラム作成部112により作成された読み仮名付与プログラムは、読み仮名付与プログラム格納部113に格納される。読み仮名付与プログラム格納部113は、例えば、記憶装置102の所定の格納領域に形成される。
The reading kana giving program creation unit (first program creating means) 112 converts the contents of each reading kana dictionary in the reading
図2は、読み仮名辞書群111の内の固有名詞読み仮名辞書の一例を示す図である。図3は、図2に示した固有名詞読み仮名辞書の一例から読み仮名付与プログラム作成部112により作成され、読み仮名付与プログラム格納部113に格納される読み仮名付与プログラムの一例を示す図である。
FIG. 2 is a diagram illustrating an example of the proper noun reading kana dictionary in the reading
図2に示すように、読み仮名辞書は、エリアコード、属性番号、固有名詞及びその読み仮名からなる。エリアコードは、所定のエリアを一意に特定する情報である。エリアコードで特定される所定のエリアとしては、例えば都道府県がある。もちろん、都道府県よりも細分化したエリアとすることも可能である。属性番号は、地図注記として用いられる固有名詞がどのような属性のものかを示すものであり、例えば、地名、教育機関、公共機関、山岳、河川など100以上の属性(レイヤ)に分類されている。 As shown in FIG. 2, the reading kana dictionary includes an area code, an attribute number, a proper noun, and its reading kana. The area code is information that uniquely identifies a predetermined area. As the predetermined area specified by the area code, for example, there is a prefecture. Of course, it is possible to make the area more detailed than the prefecture. The attribute number indicates what kind of attribute the proper noun used as the map annotation is, and for example, it is classified into 100 or more attributes (layers) such as place names, educational institutions, public institutions, mountains, rivers, etc. Yes.
また、図2において、固有名詞は、地図注記として用いられる固有名詞であり、読み仮名は、対応する固有名詞の読み仮名である。図2に示した固有名詞読み仮名辞書の一例は、愛知県(エリアコード=23)の、地名(属性番号=138)の一部を示すものである。なお、ここでは、固有名詞読み仮名辞書の例を示したが、その他の一般名詞読み仮名辞書、接頭語読み仮名辞書、接尾語読み仮名辞書、カタカナ語読み仮名辞書も基本的に図2に示した固有名詞読み仮名辞書と同様の構成を有する。 Moreover, in FIG. 2, a proper noun is a proper noun used as a map note, and a reading kana is a reading kana of a corresponding proper noun. An example of the proper noun reading kana dictionary shown in FIG. 2 shows a part of a place name (attribute number = 138) in Aichi Prefecture (area code = 23). In addition, although the example of the proper noun reading kana dictionary was shown here, the other general noun reading kana dictionary, the prefix reading kana dictionary, the suffix reading kana dictionary, and the katakana reading kana dictionary are basically shown in FIG. It has the same configuration as the proper noun reading kana dictionary.
図2に示した固有名詞読み仮名辞書を、読み仮名付与プログラム作成部112によりプログラムロジックに変換すると、図3に示す読み仮名付与プログラムが得られる。図3に示した読み仮名付与プログラムは、プログラミング言語としてPerl(パール)によって記述されたものである。図3に示す読み仮名付与プログラムは、エリアコードと属性番号が一致し、且つ、地図注記(この例では固有名詞である地名)が一致したら、地図注記と読み仮名を出力するものである。
When the proper noun reading kana dictionary shown in FIG. 2 is converted into program logic by the reading kana giving
読み仮名付与プログラム作成部112は、具体例を示せば、図2に示した固有名詞読み仮名辞書から、図3に示した読み仮名付与プログラムを作成するものである。この実施の形態においては、最長一致法により地図注記の読み仮名を特定する。このため、読み仮名付与プログラム作成部112は、読み仮名辞書の内容を、名詞句(図2、図3に示した例では固有名詞)を長いもの順に並び変えたプログラムを作成している。図3に示した読み仮名付与プログラムを見れば分かるように、読み仮名辞書の内容がそのままプログラムロジックとなっているので、外部の辞書を参照する必要の全く無いプログラムとなっている。
If a specific example is shown, the reading kana giving
実際には、読み仮名辞書群111は、上述したように複数の読み仮名辞書を備えているため、読み仮名付与プログラム作成部112により作成される読み仮名付与プログラムは、各読み仮名辞書に対応したプログラムロジック部を有する。より具体的には、読み仮名付与プログラムは、初期処理部、ユーザー辞書提供部、固有名詞接尾語辞書(後方一致)ロジック部、固有名詞接頭語辞書(前方一致)ロジック部、固有名詞辞書(部分一致)ロジック部、一般名詞接尾語辞書(後方一致)ロジック部、一般名詞接頭語辞書(前方一致)ロジック部、一般有名詞辞書(部分一致)ロジック部、カタカナ語一般名詞接尾語辞書(後方一致)ロジック部、カタカナ語一般名詞接頭語辞書(前方一致)ロジック部、カタカナ語一般有名詞辞書(部分一致)ロジック部、例外処理部、終了処理部の各部からなる。
Actually, since the reading-
読み仮名付与プログラム作成部112は、上記の各ロジック部の作成(生成)時には、(1)処理対象の読み仮名辞書から同じエリアコードと属性番号の辞書データ(エリアコード、属性番号、名詞句、読み仮名)を抽出する。そして、(2)読み仮名付与プログラム作成部112は、抽出した辞書データを名詞句の文字数の多いもの順に並べ変える。最長一致により読み仮名の抽出を可能にするためである。当該(1)、(2)の処理を処理対象の辞書から同じエリアコードと属性番号の辞書データが無くなるまで繰り返し、無くなれば、次のエリアコードと属性番号を有する辞書データの処理に移る。
At the time of creation (generation) of each of the logic units described above, the reading-kana giving program creating unit 112 (1) dictionary data (area code, attribute number, noun phrase, (Reading Kana) is extracted. Then, (2) the reading pseudonym assignment
このようにして、処理対処の全ての辞書データについて処理が完了すると、当該処理対処の読み仮名辞書に対応するロジック部が作成(生成)できる。そして、読み仮名辞書群111の各読み仮名辞書について、プログラムロジックを作成することにより、前方一致、後方一致、部分一致で用いられる各読み仮名辞書を最長一致法で読み仮名を抽出する読み仮名付与プログラムロジックに変換できる。
In this way, when processing is completed for all dictionary data for processing, a logic unit corresponding to the reading-kana dictionary for the processing can be created (generated). Then, by creating a program logic for each reading-kana dictionary in the reading-
言語別翻訳辞書群121は、この実施の形態では、日本語の地図注記データの読み仮名を、目的とする外国語に翻訳するための言語別の翻訳辞書を備える。この実施の形態では、中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に対応するため、4言語の翻訳辞書を備える。更に、各言語の翻訳辞書は、大きく分けると、一般名詞に関する辞書やカタカナ語に関する辞書を備える。一般名詞に関する辞書は、一般名詞接尾語辞書、一般名詞接頭語辞書、一般名詞辞書からなる。カタカナ語に関する辞書は、カタカナ語固有名詞接尾語辞書、カタカナ語固有名詞接頭語辞書、カタカナ語固有一般名詞辞書、カタカナ語一般名詞接尾語辞書、カタカナ語一般名詞接頭語辞書、カタカナ語一般名詞辞書からなる。
In this embodiment, the language-specific
また、一般名詞辞書、カタカナ語固有名詞辞書、カタカナ語一般名詞辞書のそれぞれは、部分一致により読み仮名などに対応する翻訳データ(翻訳語句)の検索が可能なものである。また、各接頭語辞書は、接頭語に対応する翻訳データを提供するものであるので、前方一致により接頭語の翻訳データの検索が可能なものである。また、各接尾語辞書は、接尾語の翻訳データを提供するものであるので、後方一致により接尾語の翻訳データの検索が可能なものである。 Each of the general noun dictionary, the katakana proper noun dictionary, and the katakana general noun dictionary is capable of searching translation data (translation word / phrase) corresponding to a reading kana by partial matching. Each prefix dictionary provides translation data corresponding to the prefix, so that the prefix translation data can be searched by forward matching. Since each suffix dictionary provides suffix translation data, the suffix translation data can be searched by backward matching.
言語別翻訳辞書群121が有する翻訳辞書もまた、図2に示した読み仮名辞書の場合と同様に、エリアコード、属性番号を備える。翻訳辞書の場合、図2における「固有名詞」が「読み仮名」などとなり、図2における「読み仮名」が「所定の言語の文字列(翻訳データ)」となるものである。
The translation dictionary included in the language-specific
言語別翻訳プログラム作成部(第2のプログラム作成手段)122は、言語別翻訳辞書群121の各翻訳辞書の内容をプログラムロジックに変換し、地図注記データの読み仮名などを、所定の言語に変換する言語別翻訳プログラムを作成する。言語別翻訳プログラム作成部122により作成された言語別翻訳プログラムは、言語別翻訳プログラム格納部123に格納される。言語別翻訳プログラム格納部123、例えば、記憶装置102の所定の格納領域に形成される。
The language-specific translation program creation unit (second program creation means) 122 converts the contents of each translation dictionary in the language-specific
言語別翻訳プログラム作成部122により作成される言語別翻訳プログラムのプログラムロジック自体は、図3に示した読み仮名変換プログラムと同様のものである。すなわち、言語別翻訳プログラム作成部122により作成される言語別翻訳プログラムは、エリアコードと属性番号が一致し、且つ、読み仮名など(この例では地図注記の読み仮名など)が一致したら、当該読み仮名などと対応する所定の言語の文字列(翻訳データ)を出力するものである。
The program logic of the language-specific translation program created by the language-specific translation
実際には、言語別翻訳辞書群121は、上述したように複数の翻訳辞書を備えているため、言語別翻訳プログラム作成部122により作成される言語別翻訳プログラムは、各翻訳辞書に対応したプログラムロジック部を有する。より具体的には、言語別翻訳プログラムは、初期処理部、ユーザー辞書提供部、一般名詞接尾語辞書(後方一致)ロジック部、一般名詞接頭語辞書(前方一致)ロジック部、一般名詞辞書(部分一致)ロジック部、カタカナ語固有名詞接尾語辞書(後方一致)ロジック部、カタカナ語固有名詞接頭語辞書(前方一致)ロジック部、カタカナ語固有有名詞辞書(部分一致)ロジック部、カタカナ語一般名詞接尾語辞書(後方一致)ロジック部、カタカナ語一般名詞接頭語辞書(前方一致)ロジック部、カタカナ語一般有名詞辞書(部分一致)ロジック部、例外処理部、終了処理部などの各部からなる。
Actually, since the language-specific
言語別翻訳プログラム作成部122は、上記の各ロジック部の作成(生成)時には、(A)処理対象の翻訳辞書から同じエリアコードと属性番号の辞書データ(エリアコード、属性番号、名詞句、翻訳データ)を抽出する。そして、(B)言語別翻訳プログラム作成部122は、抽出した辞書データを名詞句の文字数の多いもの順に並べ変える。最長一致により翻訳データの抽出を可能にするためである。当該(A)、(B)の処理を処理対象の辞書から同じエリアコードと属性番号の辞書データが無くなるまで繰り返し、無くなれば、次のエリアコードと属性番号を有する辞書データの処理に移る。
When creating (generating) each logic unit described above, the language-specific translation program creating unit 122 (A) dictionary data of the same area code and attribute number (area code, attribute number, noun phrase, translation) from the translation dictionary to be processed Data). Then, (B) the language-specific translation
このようにして、処理対処の全ての辞書データについて処理が完了すると、当該処理対処の翻訳辞書に対応するロジック部が作成(生成)できる。そして、言語別翻訳辞書群121の各翻訳辞書について、プログラムロジックを作成することにより、前方一致、後方一致、部分一致で用いられる各翻訳辞書を最長一致法で読み仮名を抽出する言語別翻訳プログラムロジックに変換できる。
In this way, when processing is completed for all dictionary data to be processed, a logic unit corresponding to the translation dictionary to be processed can be created (generated). Then, by creating a program logic for each translation dictionary in the language-specific
翻訳対象データファイル(図1では、翻訳対象データFと記載。)131は、翻訳対象となる多数の地図注記データを保持する。具体的に、翻訳対象データファイル131には、「エリアコード、属性番号、地図注記データ」からなる翻訳対象データが多数保持されている。この翻訳対象データファイル131には、例えば、図示しない外部インターフェイスなどを通じて外部機器から提供された翻訳対象データなどが格納される。 A translation target data file (described as translation target data F in FIG. 1) 131 holds a large number of map note data to be translated. Specifically, the translation target data file 131 holds a large number of translation target data composed of “area code, attribute number, map annotation data”. The translation target data file 131 stores, for example, translation target data provided from an external device through an external interface (not shown).
読み仮名付与プログラム実行部132は、読み仮名付与プログラム作成部112により作成され、読み仮名付与プログラム格納部113に格納されている読み仮名付与プログラムを読み出して実行する。これにより、翻訳対象データファイル131に格納されている翻訳対象データの地図注記データに対して、実行された読み仮名付与プログラムにより読み仮名が付与される。
The reading pseudonym assignment
このようにして、翻訳対象データに対して読み仮名が付与されて形成された読み仮名データは、読み仮名データファイル(図1では、読み仮名データFと記載。)133に記録される。当該読み仮名データは、「エリアコード、属性番号、地図注記データ、対応する読み仮名」からなるものである。読み仮名データファイル133は、ハードディスクなどの大容量記録媒体に作成される。 In this way, the reading kana data formed by adding the reading kana to the translation target data is recorded in the reading kana data file (described as reading kana data F in FIG. 1) 133. The reading kana data consists of “area code, attribute number, map note data, corresponding reading kana”. The reading kana data file 133 is created on a large-capacity recording medium such as a hard disk.
言語別翻訳プログラム実行部134は、言語別翻訳プログラム作成部122により作成され、言語別翻訳プログラム格納部123に格納されている言語別翻訳プログラムを読み出して実行する。これにより、読み仮名データファイル133に格納されている各読み仮名データの読み仮名が、実行された言語別翻訳プログラムにより所定の言語に翻訳され、読み仮名データに対して、翻訳データが付加された言語別翻訳データが形成される。
The language-specific translation
言語別翻訳プログラム実行部134により実行された言語別翻訳プログラムにより作成された言語別翻訳データは、言語別翻訳データファイル135に記録される。当該言語別翻訳データは、「エリアコード、属性情報、地図注記データ、対応する読み仮名、所定の言語の文字列(翻訳データ)」からなるものである。言語別翻訳データファイル135は、ハードディスクなどの大容量記録媒体に作成される。
The language-specific translation data created by the language-specific translation program executed by the language-specific translation
このように、この実施の形態の翻訳装置は、読み仮名辞書をプログラムロジックに変換して、読み仮名付与プログラムを作成し、この読み仮名付与プログラムを用いて、翻訳対象の地図注記データに対して読み仮名を付与する。また、この実施の形態の翻訳装置は、言語別の翻訳辞書をプログラムロジックに変換して、言語別翻訳プログラムを作成し、この言語別翻訳プログラムを用いて、地図注記データに対して付与された読み仮名を目的とする言語に翻訳する。 Thus, the translation apparatus of this embodiment converts the reading kana dictionary into program logic, creates a reading kana giving program, and uses this reading kana giving program to map note data to be translated. Give a reading. In addition, the translation device of this embodiment converts a language-specific translation dictionary into program logic, creates a language-specific translation program, and uses this language-specific translation program to give to map annotation data Translate the reading to the target language.
このように、使用される種々の辞書は、プログラムロジックに変換され、プログラムとして機能するので、種々の辞書を参照することが無く、プログラムを通じて、地図注記に対して読み仮名を付与し、この読み仮名が所定の言語に翻訳される構成になっている。これにより、外部の辞書を参照しないので、大量の地図注記を高速に目的とする言語に翻訳できる。 In this way, the various dictionaries used are converted into program logic and function as a program. Therefore, the reading dictionary is assigned to the map annotation through the program without referring to the various dictionaries. The kana is translated into a predetermined language. Thereby, since an external dictionary is not referred to, a large amount of map notes can be translated into a target language at high speed.
[翻訳装置の動作の具体例]
次に、図1を用いて説明したこの実施の形態の翻訳装置における翻訳処理の具体例について説明する。この実施の形態の翻訳装置は、大量の地図注記を超高速に翻訳できるものであるが、その処理内容を簡単に説明するため、1件分の入力データがどのように処理されるのかを具体的に説明する。
[Specific example of translation device operation]
Next, a specific example of translation processing in the translation apparatus of this embodiment described with reference to FIG. 1 will be described. The translation device of this embodiment is capable of translating a large amount of map notes at an ultra-high speed, but in order to explain the processing contents in a simple manner, it is necessary to specifically describe how one input data is processed. I will explain it.
図4は、図1に示した翻訳装置において、エリアコードが「23(愛知県)」で、属性番号が「138(地名)」で、地図注記が「小碓通」である入力データを処理する場合の例を説明するための図である。図4に示すように、「23(エリアコード),138(属性番号),小碓通(地図注記)」である入力データが翻訳対象データファイル131に用意されている(ステップS1)。 FIG. 4 shows a case where the translation apparatus shown in FIG. 1 processes input data with an area code “23 (Aichi Prefecture)”, an attribute number “138 (place name)”, and a map note “Kominato”. It is a figure for demonstrating the example of. As shown in FIG. 4, input data “23 (area code), 138 (attribute number), Kosugetsu (map note)” is prepared in the translation object data file 131 (step S1).
そして、読み仮名辞書がプログラムロジックに変換されて形成された読み仮名付与プログラムを、読み仮名付与プログラム実行部132が実行する(ステップS2)。当該読み仮名付与プログラムは、翻訳対象データファイル131の当該入力データを読み出して、当該入力データ中の地図注記データに対応する読み仮名を付与した読み仮名データを形成し、これを読み仮名データファイル133に記録する(ステップS3)。
Then, the reading kana giving
ステップS3で読み仮名データファイル133に記録される読み仮名データは、図4のステップS3に示したように、入力データに対して、更に読み仮名「こうす どおり」が付与されたものである。この読み仮名データは、どの言語に翻訳する場合にも共通に用いられる。すなわち、読み仮名データファイル133の読み仮名データは、各言語の翻訳プログラムによって共通に用いられる。 The reading kana data recorded in the reading kana data file 133 in step S3 is obtained by further adding the reading kana “Kodosori” to the input data as shown in step S3 of FIG. This kana data is commonly used when translating into any language. That is, the reading kana data in the reading kana data file 133 is commonly used by the translation programs of the respective languages.
次に、言語別翻訳辞書がプログラムロジックに変換されて形成された言語別翻訳プログラムを、言語別翻訳プログラム実行部134が実行する(ステップS4)。当該言語別翻訳プログラムは、読み仮名データファイル133の当該読み仮名データを読み出して、当該読み仮名データ中の読み仮名に対応する所定の言語の文字列(翻訳データ)を付与した言語別翻訳データを形成し、これを言語別翻訳データファイル135に記録する(ステップS5)。 Next, the language-specific translation program formed by converting the language-specific translation dictionary into the program logic is executed by the language-specific translation program execution unit 134 (step S4). The language-specific translation program reads the kana data in the reading kana data file 133 and reads the language-specific translation data to which a character string (translation data) of a predetermined language corresponding to the reading kana in the reading kana data is given. This is formed and recorded in the language-specific translation data file 135 (step S5).
ステップS5で言語別翻訳データファイル135に記録される翻訳データは、図4のステップS5に示したように、読み仮名データに対して、更に各言語の翻訳データが付与されたものである。この実施の形態においては、中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に翻訳されるため、各言語の翻訳プログラムにより、図4のステップS5に示したように、4言語のそれぞれの言語別の翻訳データが形成される。 The translation data recorded in the language-specific translation data file 135 in step S5 is obtained by further adding translation data of each language to the reading kana data as shown in step S5 of FIG. In this embodiment, since it is translated into four languages of Chinese (simplified), Chinese (traditional), English, and Korean, as shown in step S5 of FIG. Translation data for each of the four languages is formed.
これに対して、図5は、従来の翻訳装置における翻訳処理の概要を説明するための図である。図5に示すように、従来の翻訳装置では、図4に示した例と同様の入力データを翻訳する場合、言語別翻訳プログラムが、まず、翻訳対象の文字列(この例の場合には地図注記)を形態素解析などの手法を用いて意味のある文字列単位に分解する。そして、この分解した各文字列(あるいは文字)を、翻訳辞書を用いて翻訳する。 On the other hand, FIG. 5 is a diagram for explaining an outline of translation processing in a conventional translation apparatus. As shown in FIG. 5, in the conventional translation apparatus, when the input data similar to the example shown in FIG. 4 is translated, the language-specific translation program first converts the character string to be translated (in this example, the map Note) is decomposed into meaningful character string units using techniques such as morphological analysis. Then, each decomposed character string (or character) is translated using a translation dictionary.
この従来の翻訳装置の場合には、形態素解析の段階や翻訳処理の段階で種々の辞書(データベース)を参照する必要がある。このように種々に辞書にアクセスする分の時間は、翻訳処理に掛かる時間の多くの部分を占めており、翻訳処理は時間の掛かるものとなっていた。 In the case of this conventional translation apparatus, it is necessary to refer to various dictionaries (databases) at the stage of morphological analysis and the stage of translation processing. As described above, the time required to access the dictionary in various ways occupies a large part of the time required for the translation process, and the translation process takes time.
しかし、図4と図5とを比較しても分かるように、この出願の翻訳装置の場合には、外部の辞書(データベース)を全く参照しないため、翻訳処理の高速化が実現できる。また、地図注記に読み仮名を付与することで、正しい読み仮名に応じた翻訳が可能となる。また、地図注記データに対して読み仮名が付与されて形成された読み仮名データは、各言語の翻訳プログラムで共通に使用される。このため、各言語の翻訳プログラムにおいて、地図注記に読み仮名を付与する処理は行わなくてもよい。 However, as can be seen from a comparison between FIG. 4 and FIG. 5, in the translation apparatus of this application, since an external dictionary (database) is not referred to at all, the translation process can be speeded up. Moreover, by assigning a reading kana to a map note, translation according to the correct reading kana becomes possible. Further, the reading kana data formed by adding the reading kana to the map annotation data is commonly used in the translation programs of the respective languages. For this reason, in the translation program of each language, it is not necessary to perform the process of giving a reading pseudonym to a map note.
[実施の形態の翻訳装置で行われる処理のまとめ]
この実施の形態の翻訳装置で行われる処理は、読み仮名付与プログラムと言語別翻訳プログラムを作成する事前準備処理と、作成された読み仮名付与プログラムと言語別翻訳プログラムを用いて地図注記を翻訳する翻訳処理とに大きく分けることができる。事前準備処理は、基になる読み仮名辞書や言語別翻訳辞書が変更されない限り、繰り返し行う必要は無い。また、この実施の形態の翻訳装置において行われる翻訳処理は、まず、地図注記データに対して読み仮名を付与して読み仮名データを形成する処理と、形成された読み仮名データの読み仮名を翻訳する処理とに分けられる。以下においては、この実施の形態の翻訳装置で行われる、事前準備処理と翻訳処理のそれぞれについて、具体的に説明する。
[Summary of Processing Performed by Translation Device of Embodiment]
The processing performed by the translation apparatus of this embodiment is a preparatory process for creating a reading pseudonym assignment program and a language-specific translation program, and a map annotation is translated using the created reading pseudonym assignment program and language-specific translation program. It can be broadly divided into translation processing. The pre-preparation process does not need to be repeated unless the base reading kana dictionary or language-specific translation dictionary is changed. In addition, the translation processing performed in the translation apparatus of this embodiment is performed by first assigning reading kana to map annotation data to form reading kana data, and translating the reading kana of the formed reading kana data. It is divided into processing to do. In the following, each of the preliminary preparation process and the translation process performed by the translation apparatus of this embodiment will be described in detail.
[事前準備処理]
図6は、この実施の形態の翻訳装置で行われる事前準備処理を説明するためのフローチャートである。事前準備処理は、図6に示すように、まず、読み仮名付与プログラム作成部112が、読み仮名辞書群111の各読み仮名辞書のぞれぞれの内容をプログラムロジックに変換して、読み仮名付与プログラムを作成する(ステップS21)。ステップS21の処理では、前方一致、後方一致、部分一致で使用される読み仮名辞書のそれぞれが、最長一致法で読み仮名を置換するプログラムロジックに変換される。
[Preparation process]
FIG. 6 is a flowchart for explaining pre-preparation processing performed in the translation apparatus of this embodiment. As shown in FIG. 6, in the preparatory process, first, the reading kana giving
次に、言語別翻訳プログラム作成部122が、言語別翻訳辞書群121の各翻訳辞書の内容をプログラムロジックに変換して、言語別翻訳プログラムを作成する(ステップS22)。ステップS22の処理でも、前方一致、後方一致、部分一致で使用される翻訳辞書のそれぞれが、最長一致法で対象翻訳言語に置換するプログラムロジックに変換される。
Next, the language-specific translation
これら2つの処理を通じて、読み仮名付与プログラム格納部113には読み仮名付与プログラムが格納され、言語別翻訳プログラム格納部123には、各言語別の翻訳プログラムが格納され、地図注記の翻訳処理の準備が整えられる。なお、言語別翻訳プログラム格納部123には、言語別の複数の翻訳プログラムが格納されることになる。
Through these two processes, the reading pseudonym assignment
このように、図6に示した処理を通じて、翻訳処理前の事前準備ができる。そして、上述もしたように、図6に示す事前準備は、読み仮名辞書群111の読み仮名辞書に変更が生じたり、言語別翻訳辞書群121の翻訳辞書に変更が生じたりした場合に実行すればよい。もちろん、読み仮名辞書群111の読み仮名辞書だけに変更が生じた場合には、図6に示したステップS21の処理だけを行えばよい。また、言語別翻訳辞書群121の翻訳辞書だけに変更が生じた場合には、図6に示したステップS22の処理だけを行えばよい。
In this way, advance preparation before translation processing can be performed through the processing shown in FIG. Then, as described above, the advance preparation shown in FIG. 6 is executed when a change occurs in the reading kana dictionary of the reading
[翻訳処理]
図7は、この実施の形態の翻訳装置で行われる翻訳処理を説明するフローチャートである。当該翻訳処理は、図7に示すように、読み仮名付与処理(図7(A))と、言語別翻訳処理(図7(B))からなる。読み仮名付与処理(図7(A))は、読み仮名付与プログラム実行部132において実行される読み仮名付与プログラムによる処理である。言語別翻訳処理(図7(B))は、言語別翻訳プログラム実行部134において実行される言語別翻訳プログラムによる処理である。
[Translation processing]
FIG. 7 is a flowchart for explaining a translation process performed by the translation apparatus of this embodiment. As shown in FIG. 7, the translation process includes a reading pseudonym assignment process (FIG. 7A) and a language-specific translation process (FIG. 7B). The reading pseudonym assignment process (FIG. 7A) is a process performed by the reading pseudonym assignment program executed by the reading pseudonym assignment
当該翻訳処理では、まず、読み仮名付与プログラム実行部132が読み仮名付与プログラムを実行し、翻訳対象データファイル131をインプットファイルとし、読み仮名データファイル133をアウトプットファイルとして、図7(A)に示す読み仮名付与処理を行う。当該読み仮名付与処理において、読み仮名付与プログラム実行部132は、翻訳対象データファイル131から翻訳対象データを順次に読み出す(ステップS31)。読み仮名付与プログラム実行部132は、翻訳対象データが読み出せたか否か(全ての翻訳対象データの読み出しが終了したか否か)を判別する(ステップS32)。
In the translation process, first, the reading pseudonym assignment
ステップS32の判別処理において、翻訳対象データが読み出せたと判別したとする。この場合、読み仮名付与プログラム実行部132は、その読み出した翻訳対象データの地図注記データに対して読み仮名を付与して読み仮名データを形成し、これを読み仮名データファイル133に書き込む処理を行う(ステップS33)。この後、ステップS31からの処理を繰り返す。
Assume that it is determined in the determination process of step S32 that the data to be translated has been read. In this case, the reading pseudonym assignment
ステップS32の判別処理において、全ての翻訳対処データの読み出しが終了したと判別したときには、図7(A)に示す読み仮名付与処理を終了する。 If it is determined in step S32 that the reading of all translation handling data has been completed, the reading pseudonym assignment process shown in FIG.
当該読み仮名付与プログラムによる読み仮名付与処理が終了すると、言語別翻訳プログラム実行部134が言語別翻訳プログラムを実行し、読み仮名データファイル133をインプットファイルとし、言語別翻訳データファイル135をアウトプットファイルとして、図7(B)に示す言語別翻訳処理を行う。当該言語別翻訳処理において、言語別翻訳プログラム実行部134は、読み仮名データファイル133から読み仮名データを順次に読み出す(ステップS41)。言語別翻訳プログラム実行部134は、読み仮名データが読み出せたか否か(全ての読み仮名データの読み出しが終了したか否か)を判別する(ステップS42)。
When the reading pseudonym assignment process by the reading pseudonym assignment program is completed, the language-specific translation
ステップS42の判別処理において、読み仮名データが読み出せたと判別したとする。この場合、言語別翻訳プログラム実行部134は、その読み出した読み仮名データの読み仮名に対する所定の言語の文字列(翻訳データ)を付与して言語別翻訳データを形成し、これを言語別翻訳データファイル135に書き込む処理を行う(ステップS43)。この後、ステップS41からの処理を繰り返す。
Assume that it is determined in the determination process of step S42 that the reading kana data has been read. In this case, the language-specific translation
ステップS42の判別処理において、読み仮名データが読み出せなかった(全ての読み仮名データの読み出しが終了した)と判別したときには、図7(B)に示す言語別翻訳与処理を終了する。なお、この図7(B)に示す処理は、言語別の翻訳プログラムによって言語別に行われる処理である。 If it is determined in the determination process of step S42 that the reading kana data cannot be read (the reading of all reading kana data has been completed), the language-specific translation processing shown in FIG. The process shown in FIG. 7B is a process performed for each language by a language-specific translation program.
このように、読み仮名付与処理(図7(A))と言語別翻訳処理(図7(B))の処理を通じて翻訳処理が行われる。そして、読み仮名付与処理と言語別翻訳処理のいずれにおいても、インプットファイルとアウトプットファイルが存在するだけで、参照データベースは一切存在しない。すなわち、読み仮名辞書や翻訳辞書は、プログラムロジックに変換されて、それぞれ、読み仮名付与プログラム、言語別翻訳プログラムとされている。このため、地図注記に対する読み仮名の付与は、読み仮名付与プログラムの中だけで完結するように処理され、付与された読み仮名の所定の言語への翻訳は、言語別翻訳プログラムの中だけで完結するように処理される
このようにして、この実施の形態の翻訳装置では、大量の地図注記を極めて高速に翻訳することを実現している。
As described above, the translation process is performed through the reading pseudonym assignment process (FIG. 7A) and the language-specific translation process (FIG. 7B). In both of the reading pseudonym assignment process and the language-specific translation process, only the input file and the output file exist, and no reference database exists. That is, the reading kana dictionary and the translation dictionary are converted into program logic, which are a reading kana giving program and a language-specific translation program, respectively. For this reason, the assignment of a reading kana to a map note is processed so as to be completed only in the reading kana giving program, and the translation of the given reading kana to a predetermined language is completed only in the language-specific translation program. In this way, the translation apparatus according to this embodiment realizes extremely high-speed translation of a large number of map annotations.
[実施の形態の効果]
上述した実施の形態の翻訳装置によれば、大量に存在する地図注記を、従来の機械翻訳装置に比べて飛躍的に速く、且つ、正確に翻訳できる。
[Effect of the embodiment]
According to the translation apparatus of the embodiment described above, a large amount of map notes can be translated significantly faster and more accurately than conventional machine translation apparatuses.
また、地図注記について読み仮名を付与し、この付与した読み仮名を翻訳する構成としているので、実際の読み方に即した翻訳ができる。不自然な翻訳となることが無い。 Moreover, since the reading kana is given to the map note, and the given reading kana is translated, the translation according to the actual reading can be performed. There is no unnatural translation.
また、読み仮名が付与されて形成された読み仮名データは、各言語の翻訳プログラムで共通に使用できる。つまり、地図注記を複数の言語に翻訳する場合であっても、各言語の翻訳プログラムなどで重複して読み仮名データを形成する処理を行わなくても済む。 Moreover, the reading kana data formed by adding the reading kana can be commonly used in the translation programs of the respective languages. That is, even when the map note is translated into a plurality of languages, it is not necessary to perform the process of forming the reading kana data redundantly by the translation program of each language.
そして、数百万件の地図注記を翻訳する場合、従来は翻訳に数週間かかっていたが、これを数時間に短縮することができた。各言語の翻訳プログラムによる処理は、それぞれ数十分の処理時間を実現している。 And when translating millions of map notes, it used to take weeks to translate, but it could be reduced to hours. Each language processing program realizes several tens of minutes of processing time.
[変形例など]
なお、上述した実施の形態では、地図注記データを中国語(簡体)、中国語(繁体)、英語、韓国語の4言語に翻訳するものとして説明したが、これに限るものではない。この他の種々の言語に翻訳することももちろんできる。翻訳対象の言語の組み合わせは種々の組み合わせとすることができる。もちろん、単一の言語に翻訳する場合にも対応できる。
[Modifications]
In the above-described embodiment, the map annotation data is described as being translated into four languages of Chinese (simplified), Chinese (traditional), English, and Korean. However, the present invention is not limited to this. Of course, it can be translated into other various languages. The combination of languages to be translated can be various combinations. Of course, it is also possible to translate into a single language.
また、上述した実施の形態では、地図注記データを翻訳する場合を例にして説明したが、これに限るものではない。例えば、電話帳リスト、顧客リスト、住所リストといった多数の名前、住所などの名詞句の羅列が含まれるものの当該多数の名詞句の羅列を翻訳する場合に、この発明を適用できる。 In the above-described embodiment, the case where the map annotation data is translated has been described as an example. However, the present invention is not limited to this. For example, the present invention can be applied to a case where a large number of noun phrases such as a phone book list, a customer list, and an address list are included, but a large number of noun phrases are translated.
また、上述した実施の形態では、読み仮名に対して翻訳を行うものとして説明した。しかし、これに限るものではない。例えば、ひらがな、カタカナ、漢字、アルファベット、数字、記号からなる翻訳対象そのものと作成した読み仮名とを比較しながら、より適切に翻訳を行うようにすることができる。 Further, in the above-described embodiment, it has been described that translation is performed on a reading pseudonym. However, it is not limited to this. For example, it is possible to perform translation more appropriately while comparing the translation target itself made up of hiragana, katakana, kanji, alphabet, numbers, and symbols with the created kana.
[その他]
上述した実施の形態の説明からも分かるように、請求項に記載した翻訳装置の読み仮名辞書は、実施の形態の翻訳装置の読み仮名辞書群の各読み仮名辞書に対応し、また、請求項に記載した翻訳装置の翻訳辞書は、実施の形態の翻訳装置の言語別翻訳辞書群の各翻訳辞書に対応している。また、請求項に記載した翻訳装置の第1のプログラム作成手段は、実施の形態の翻訳装置の読み仮名付与プログラム作成部112に対応し、請求項に記載した翻訳装置の第2のプログラム作成手段は、この実施の形態の翻訳装置の言語別翻訳プログラム作成部122に対応している。
[Others]
As can be understood from the above description of the embodiment, the reading device's reading kana dictionary corresponds to each reading device dictionary in the reading device dictionary group of the translation device according to the embodiment. The translation dictionary of the translation device described in the above corresponds to each translation dictionary in the language-specific translation dictionary group of the translation device of the embodiment. The first program creation means of the translation device recited in the claims corresponds to the reading pseudonym assignment
また、請求項に記載した翻訳装置の読み仮名付与手段は、この実施の形態の翻訳装置の読み仮名付与プログラム実行部132に対応し、また、請求項に記載した翻訳装置の翻訳手段は、この実施の形態の翻訳装置の言語別翻訳プログラム実行部134に対応している。
Further, the reading device of the translation device described in the claims corresponds to the reading device of the translation device of the translation device of this embodiment, and the translation device of the translation device described in the claim This corresponds to the language-specific translation
また、図5、図6を用いて説明した翻訳処理は、この発明の翻訳方法の一実施の形態が適用されたものであり、図5、図6を用いて説明した翻訳処理を実行するプログラムは、この発明の翻訳プログラムの一実施の形態が適用されたものである。また、図1に示した読み仮名付与プログラム作成部112、言語別翻訳プログラム作成部122、読み仮名付与プログラム実行部132、言語別翻訳プログラム実行部134の各機能は、制御部101で実行されるプログラムにより、制御部101の機能として実現することもできる。
Moreover, the translation processing explained using FIG. 5 and FIG. 6 is one to which an embodiment of the translation method of the present invention is applied, and a program for executing the translation processing explained using FIG. 5 and FIG. Is applied with an embodiment of the translation program of the present invention. The functions of the reading-kana assignment
101…制御部、102…記憶装置、103…操作部、111…読み仮名辞書群、112…読み仮名付与プログラム作成部、113…読み仮名付与プログラム格納部、121…言語別翻訳辞書群、122…言語別翻訳プログラム作成部、123…言語別翻訳プログラム格納部、131…翻訳対象データファイル、132…読み仮名付与プログラム実行部、133…読み仮名データファイル、134…言語別翻訳プログラム実行部、135…言語別翻訳データファイル
DESCRIPTION OF
Claims (7)
前記読み読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第1のプログラム作成手段と、
読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書と、
前記翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第2のプログラム作成手段と、
前記第1のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与手段と、
前記第2のプログラム作成手段で作成された翻訳プログラムを実行し、前記読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する翻訳手段と
を備えることを特徴とする翻訳装置。 A phonetic dictionary that associates strings with their phonetic kana,
First program creating means for converting a content of the reading-reading kana dictionary into program logic and creating a reading-kana adding program for adding a reading kana to an input character string;
A translation dictionary associating a reading kana with a character string of a predetermined language corresponding to the reading kana,
Second program creating means for converting the contents of the translation dictionary into program logic and creating a translation program for translating the input reading pseudonym into a predetermined language;
A reading pseudonym giving unit that executes the reading pseudonym giving program created by the first program creation unit and gives a reading pseudonym to a character string to be translated;
A translation apparatus comprising: a translation unit that executes the translation program created by the second program creation unit and translates the reading pseudonym assigned by the reading pseudonym granting unit into a target language.
前記第2のプログラム作成手段は、所定の翻訳条件に合致するプログラムロジックに変換できるものであることを特徴とする翻訳装置。 The translation device according to claim 1,
The translation apparatus characterized in that the second program creation means can convert the program logic into a program logic that matches a predetermined translation condition.
前記読み仮名辞書と前記翻訳辞書とは、検索語の一致方式が、前方一致、後方一致、部分一致で異なる複数の辞書からなることを特徴とする翻訳装置。 A translation device according to claim 1 or 2, wherein
2. The translation apparatus according to claim 1, wherein the reading kana dictionary and the translation dictionary are made up of a plurality of dictionaries in which search word matching methods are different depending on forward matching, backward matching, and partial matching.
前記第1のプログラム作成手段は、前方一致、後方一致、部分一致で使用される前記読み仮名辞書のそれぞれを、最長一致法で読み仮名を置換するプログラムロジックに変換するものであり、
前記第2のプログラム作成手段は、前方一致、後方一致、部分一致で使用される前記翻訳辞書のそれぞれを、最長一致法で対象翻訳言語に置換するプログラムロジックに変換するものであることを特徴とする翻訳装置。 The translation device according to claim 3,
The first program creation means converts each of the reading kana dictionary used for forward matching, backward matching, and partial matching into a program logic for replacing the reading kana by the longest matching method,
The second program creation means converts each of the translation dictionaries used for forward matching, backward matching, and partial matching into a program logic that replaces the target translation language with the longest matching method. Translation device to do.
前記翻訳対象の文字列は、場所に関するものであり、前記読み仮名変換辞書には、各文字列に対応して、その文字列が属する地域を示すエリア情報と、その文字列の属性を示す属性情報とが付加されており、
前記第1のプログラム作成手段は、前記エリア情報と前記属性情報とを含めて、前記読み読み仮名変換辞書の内容をプログラムロジックに変換することを特徴とする翻訳装置。 A translation device according to any one of claims 1, 2, 3, or 4,
The character string to be translated is related to a place, and in the reading kana conversion dictionary, corresponding to each character string, area information indicating a region to which the character string belongs and an attribute indicating an attribute of the character string Information is added,
The translation apparatus characterized in that the first program creation means converts the contents of the reading-reading kana conversion dictionary into program logic including the area information and the attribute information.
第2のプログラム作成手段が、読み仮名とその読み仮名に対応する所定の言語の文字列とを対応付けた翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第2のプログラム作成工程と、
前記第1のプログラム作成工程において作成した前記読み仮名付与プログラムを、読み仮名付与手段が実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与工程と、
前記第2のプログラム作成工程において作成した翻訳プログラムを、翻訳手段が実行し、前記読み仮名付与工程で付与した読み仮名を目的とする言語に翻訳する翻訳工程と
を有することを特徴とする翻訳方法。 The first program creating means converts the contents of a reading kana dictionary in which a character string and its reading kana are associated with each other into program logic, and creates a reading kana adding program for adding a reading kana to the input character string. 1 program creation process;
The second program creation means converts the contents of the translation dictionary in which the reading kana and the character string of the predetermined language corresponding to the reading kana are associated with each other into program logic, and translates the input reading kana into the predetermined language A second program creation step for creating a translation program to be performed;
The reading pseudonym assigning step executed by the reading pseudonym assigning unit to give the reading pseudonym to the character string to be translated;
A translation method comprising: a translation step executed by a translation unit for translating the translation program created in the second program creation step and translating the reading pseudonym assigned in the reading pseudonym assignment step into a target language .
前記読み読み仮名辞書の内容をプログラムロジックに変換し、入力された文字列に読み仮名を付与する読み仮名付与プログラムを作成する第1のプログラム作成手段と、
前記翻訳辞書の内容をプログラムロジックに変換し、入力された読み仮名を所定の言語に翻訳する翻訳プログラムを作成する第2のプログラム作成手段と、
前記第1のプログラム作成手段で作成された前記読み仮名付与プログラムを実行し、翻訳対象の文字列に読み仮名を付与する読み仮名付与手段と、
前記第2のプログラム作成手段で作成された翻訳プログラムを実行し、前記読み仮名付与手段で付与された読み仮名を目的とする言語に翻訳する翻訳手段と
して機能させることを特徴とする翻訳プログラム。 A computer mounted on an information processing apparatus comprising a reading kana dictionary that associates a character string with its reading kana, and a translation dictionary that associates the reading kana with a character string of a predetermined language corresponding to the reading kana The
First program creating means for converting a content of the reading-reading kana dictionary into program logic and creating a reading-kana adding program for adding a reading kana to an input character string;
Second program creating means for converting the contents of the translation dictionary into program logic and creating a translation program for translating the input reading pseudonym into a predetermined language;
A reading pseudonym giving unit that executes the reading pseudonym giving program created by the first program creation unit and gives a reading pseudonym to a character string to be translated;
A translation program that executes the translation program created by the second program creation means and functions as a translation means for translating the reading pseudonym given by the reading pseudonym giving means into a target language .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014062001A JP6076285B2 (en) | 2014-03-25 | 2014-03-25 | Translation apparatus, translation method, and translation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014062001A JP6076285B2 (en) | 2014-03-25 | 2014-03-25 | Translation apparatus, translation method, and translation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015184998A JP2015184998A (en) | 2015-10-22 |
JP6076285B2 true JP6076285B2 (en) | 2017-02-08 |
Family
ID=54351429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014062001A Expired - Fee Related JP6076285B2 (en) | 2014-03-25 | 2014-03-25 | Translation apparatus, translation method, and translation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6076285B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6312243B2 (en) * | 2014-03-28 | 2018-04-18 | 株式会社ゼンリンデータコム | Translation apparatus, translation method, and translation program |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6170663A (en) * | 1984-09-14 | 1986-04-11 | Toshiba Corp | Address translating device |
JP4298771B2 (en) * | 2007-09-19 | 2009-07-22 | 株式会社東芝 | Machine translation apparatus and program |
JP5529092B2 (en) * | 2011-09-14 | 2014-06-25 | 株式会社ゼンリンデータコム | Note data translation apparatus, note data translation method, and note data translation program |
JP6319542B2 (en) * | 2012-06-12 | 2018-05-09 | 有限会社新英プラナーズ | Japanese input system with kanji-kana conversion function |
JP2015176541A (en) * | 2014-03-18 | 2015-10-05 | 株式会社ゼンリンデータコム | Translation device, translation method and translation program |
-
2014
- 2014-03-25 JP JP2014062001A patent/JP6076285B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015184998A (en) | 2015-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9262403B2 (en) | Dynamic generation of auto-suggest dictionary for natural language translation | |
US7979268B2 (en) | String matching method and system and computer-readable recording medium storing the string matching method | |
JP2013065284A (en) | Method for removing ambiguity of multiple readings in language conversion | |
CN105573990A (en) | Foreign language sentence creation support apparatus and method | |
JP2021099771A (en) | Method for translation, device, electronic apparatus, readable storage medium, and computer program | |
JP6076285B2 (en) | Translation apparatus, translation method, and translation program | |
JP2018067264A (en) | Data search program, data search device, and data search method | |
TW561360B (en) | Method and system for case conversion | |
JP2015095182A (en) | Character string processing device, method, and program | |
JP6805206B2 (en) | Search word suggestion device, expression information creation method, and expression information creation program | |
CN106896935A (en) | Input method | |
JP2015176541A (en) | Translation device, translation method and translation program | |
JP6312243B2 (en) | Translation apparatus, translation method, and translation program | |
JP2022002034A (en) | Extraction method, extraction program, and extraction device | |
JP2008210229A (en) | Device, method and program for retrieving intellectual property information | |
Fassbender | Dictionary of basic indexing terminology: latest developments and future plans | |
JP4415768B2 (en) | Address table generation support method, apparatus and program | |
JP2004334690A (en) | Character data inputting/outputting device and method, character data inputting/outputting program, and computer-readable recording medium | |
JP6203083B2 (en) | Unknown word extraction device and unknown word extraction method | |
JP7200474B2 (en) | CONVERSION AID DEVICE, CONVERSION AID SYSTEM, CONVERSION AID METHOD, AND COMPUTER PROGRAM | |
Batjargal et al. | Providing universal access to Japanese humanities digital libraries: an approach to federated searching system using automatic metadata mapping | |
JP2015185115A (en) | Translation device, translation method and translation program | |
Kimura | A modification of the FRAD model for personal names in non-Roman languages | |
JP2018147205A (en) | Information processing device and information processing program | |
JP2015185116A (en) | Translation device, translation method and translation program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160328 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161228 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6076285 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |