JP5364617B2 - 日本語仮想辞書 - Google Patents
日本語仮想辞書 Download PDFInfo
- Publication number
- JP5364617B2 JP5364617B2 JP2010042126A JP2010042126A JP5364617B2 JP 5364617 B2 JP5364617 B2 JP 5364617B2 JP 2010042126 A JP2010042126 A JP 2010042126A JP 2010042126 A JP2010042126 A JP 2010042126A JP 5364617 B2 JP5364617 B2 JP 5364617B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- character
- hiragana
- words
- katakana
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
- Character Discrimination (AREA)
Description
入力: inthehouse
出力1: INTHEHOUSE
出力2: i NTHEHOUSE
出力3: in THEHOUSE
出力4: int HEHOUSE
出力5: inth EHOUSE
出力6: inthe HOUSE − (正しい候補)
出力7: intheh OUSE
出力8: intheho USE
出力9: inthehou SE
出力10: inthehous E
出力11: inthehouse
上で説明したように、この変換方法では、ユーザが、入力テキストの訂正される部分を選択した後に多数の候補が生成される。それは、その候補中に正しい選択肢が含まれる場合であっても、最終的な選択での混乱につながる可能性がある。もう1つの変換方法では、接尾辞を認識できるアナライザが用いられる。このアナライザは、末尾からの範囲を、それ以上接尾辞を見つけられなくなるまで分析する。しかし、普通の方法では、正確な結果を達成するために、ユーザが対話する必要があり、これによって、潜在的に効率が低い。
A−Ka−Ma−I POS:名詞、優先順位:100
A−Ka−Ma−I POS:動詞として働くことができる名詞、優先順位:100
A−Ka−Ma−I POS:形容詞、優先順位:100
他の実装が可能である。
コスト値1=f1+f2+f3+c1+c2
である。同様に、第2の選択は、
コスト値2=fa+f3+ca
のコスト値を有する。一実施形態では、コスト値は、意味論的要因または文法的要因を含む。評価ユニット303によって、2つの選択のコスト値が評価され、最小のコスト値、この例ではコスト値2を有する選択が変換の最終出力として選択される。
Claims (2)
- 入力ユニットと、
形態素解析エンジン(MAE)と、
各々が日本語平仮名の文字列に対応する通常単語を複数記憶してなる通常辞書と、
平仮名文字列をカタカナ文字列に直変換することのできる仮想辞書と、
辞書管理モジュールと、
規則の組と、
出力ユニットとを含むシステムにおいて、平仮名文字列をターゲット文字列に変換する方法であって、
前記入力ユニットによって受信された平仮名入力に応答して、前記形態素解析エンジン(MAE)により前記平仮名入力を複数の部分列に分割するステップと、
前記平仮名入力の前記複数の部分列に基づいて前記仮想辞書を介して複数の可能な片仮名単語を前記辞書管理モジュールによって自動的に生成するステップであって、前記可能な片仮名単語の各々は前記仮想辞書を介しての前記部分列の1つの直変換に対応するものである、前記生成するステップと、
前記生成された可能な片仮名単語と前記通常辞書に記憶されている前記日本語文字の1つまたは複数の通常単語とを使用して、前記形態素解析エンジン(MAE)により前記規則の組に従って候補文字列のリストを生成するステップであって、前記1つまたは複数の通常単語の各々は前記平仮名入力の前記部分列の1つに対応する、前記生成するステップと、
前記生成された候補文字列のリストを形態素解析エンジン(MAE)によって解析し、各々の候補文字列の優先順位を、当該候補文字列に関連付けられたコスト値に基づいて決定するステップであって、前記当該候補文字列は1つまたは複数の文字セットの結合であり、個々の文字セットは前記可能な片仮名単語と前記日本語文字の1つまたは複数の通常単語の1つに対応するものであるところ、前記優先順位を決定するために用いる当該候補文字列の前記コスト値は、前記文字セットの使用頻度と文字セット間の接続コストとに基づいて決定されるものである、前記優先順位を決定するステップと、
前記形態素解析エンジン(MAE)による前記解析に応答して最も高い優先順位値を有する前記候補文字列の1つを選択するステップと、そして
前記平仮名入力を表現するために、前記候補文字列の前記1つを含む変換されたテキストを前記出力ユニットによって出力するステップと
を含む方法。 - 平仮名文字列をターゲット文字列に変換するための装置であって、
平仮名入力を受信するための入力ユニットと、
各々が日本語平仮名の文字列に対応する通常単語を複数記憶してなる通常辞書と、
平仮名文字列をカタカナ文字列に直変換することのできる仮想辞書と、
出力ユニットと、
前記入力ユニット、通常辞書及び仮想辞書に結合された形態素解析エンジン(MAE)とを備え、
前記形態素解析エンジン(MAE)が、
前記仮想辞書に指令して、前記平仮名入力の部分列に基づいて、各々が前記部分列の1つの直変換に対応する片仮名単語である複数の可能な片仮名単語を自動的に生成することと、
前記生成された可能な片仮名単語と前記通常辞書に記憶された前記日本語文字の前記1つまたは複数の通常単語とを使用して、前記形態素解析エンジン(MAE)により前記規則の組に従って候補文字列のリストを生成するステップであって、前記1つまたは複数の通常単語は前記平仮名入力の前記部分列の1つに対応するものである、前記候補文字列のリストを生成することと、
前記生成された候補文字列のリストを形態素解析エンジン(MAE)によって解析し、各々の候補文字列の優先順位を、当該候補文字列に関連付けられたコスト値に基づいて決定し、ここで、前記当該候補文字列が1つまたは複数の文字セットの結合であり、個々の文字セットが前記可能な片仮名単語と前記日本語文字の1つまたは複数の通常単語の内の1つに対応するものであるところ、前記優先順位を決定するために用いる当該候補文字列の前記コスト値は、前記文字セットの使用頻度と文字セット間の接続コストとに基づいて決定されるものであるようにして、前記優先順位を決定することと、
前記解析に応答して最も高い優先順位値を有する前記候補文字列の1つを選択することと、そして
前記平仮名入力を表現するために、前記候補文字列の前記1つを含む変換されたテキストを、前記出力ユニットに出力すること、を実行することを特徴とする装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/965,333 US7136803B2 (en) | 2001-09-25 | 2001-09-25 | Japanese virtual dictionary |
US09/965,333 | 2001-09-25 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003531361A Division JP2005538428A (ja) | 2001-09-25 | 2002-09-18 | 日本語仮想辞書 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013147026A Division JP5535379B2 (ja) | 2001-09-25 | 2013-07-12 | 日本語仮想辞書 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010165369A JP2010165369A (ja) | 2010-07-29 |
JP5364617B2 true JP5364617B2 (ja) | 2013-12-11 |
Family
ID=25509820
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003531361A Pending JP2005538428A (ja) | 2001-09-25 | 2002-09-18 | 日本語仮想辞書 |
JP2007104626A Expired - Fee Related JP4286299B2 (ja) | 2001-09-25 | 2007-04-12 | 日本語仮想辞書 |
JP2008101299A Pending JP2008204476A (ja) | 2001-09-25 | 2008-04-09 | 日本語仮想辞書 |
JP2010042126A Expired - Fee Related JP5364617B2 (ja) | 2001-09-25 | 2010-02-26 | 日本語仮想辞書 |
JP2013147026A Expired - Fee Related JP5535379B2 (ja) | 2001-09-25 | 2013-07-12 | 日本語仮想辞書 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003531361A Pending JP2005538428A (ja) | 2001-09-25 | 2002-09-18 | 日本語仮想辞書 |
JP2007104626A Expired - Fee Related JP4286299B2 (ja) | 2001-09-25 | 2007-04-12 | 日本語仮想辞書 |
JP2008101299A Pending JP2008204476A (ja) | 2001-09-25 | 2008-04-09 | 日本語仮想辞書 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013147026A Expired - Fee Related JP5535379B2 (ja) | 2001-09-25 | 2013-07-12 | 日本語仮想辞書 |
Country Status (5)
Country | Link |
---|---|
US (2) | US7136803B2 (ja) |
JP (5) | JP2005538428A (ja) |
AU (1) | AU2002339951A1 (ja) |
TW (1) | TWI223165B (ja) |
WO (1) | WO2003027895A2 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7403888B1 (en) * | 1999-11-05 | 2008-07-22 | Microsoft Corporation | Language input user interface |
US7136803B2 (en) * | 2001-09-25 | 2006-11-14 | Apple Computer, Inc. | Japanese virtual dictionary |
US8200865B2 (en) * | 2003-09-11 | 2012-06-12 | Eatoni Ergonomics, Inc. | Efficient method and apparatus for text entry based on trigger sequences |
JP2007133033A (ja) * | 2005-11-08 | 2007-05-31 | Nec Corp | 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム |
US7899664B2 (en) * | 2006-05-22 | 2011-03-01 | Sharp Kabushiki Kaisha | Information processing apparatus, computer, information processing system, information processing method, and program for receiving a character string and returning conversion candidates |
JP5309480B2 (ja) * | 2007-06-14 | 2013-10-09 | 沖電気工業株式会社 | 文字列入力装置、文字列入力方法およびプログラム |
JP4226049B1 (ja) | 2007-08-27 | 2009-02-18 | 日本インスツルメンツ株式会社 | 炭化水素を主成分とする試料中の水銀を測定する水銀測定装置 |
US8275601B2 (en) * | 2008-05-11 | 2012-09-25 | Research In Motion Limited | Mobile electronic device and associated method enabling transliteration of a text input |
JP2010055235A (ja) * | 2008-08-27 | 2010-03-11 | Fujitsu Ltd | 翻訳支援プログラム、及び該システム |
JP2010282507A (ja) * | 2009-06-05 | 2010-12-16 | Casio Computer Co Ltd | 辞書機能を備えた電子機器およびプログラム |
US7721222B1 (en) | 2009-06-10 | 2010-05-18 | Cheman Shaik | Dynamic language text generation system and method |
US9471560B2 (en) * | 2011-06-03 | 2016-10-18 | Apple Inc. | Autocorrecting language input for virtual keyboards |
US8386926B1 (en) * | 2011-10-06 | 2013-02-26 | Google Inc. | Network-based custom dictionary, auto-correction and text entry preferences |
JP5611270B2 (ja) * | 2012-05-08 | 2014-10-22 | ヤフー株式会社 | 単語分割装置、及び単語分割方法 |
JP6742692B2 (ja) * | 2015-01-30 | 2020-08-19 | 富士通株式会社 | 符号化プログラムおよび伸長プログラム |
JP6677415B2 (ja) * | 2016-03-03 | 2020-04-08 | 富士通コネクテッドテクノロジーズ株式会社 | 文字入力装置及び文字入力プログラム |
US10628522B2 (en) * | 2016-06-27 | 2020-04-21 | International Business Machines Corporation | Creating rules and dictionaries in a cyclical pattern matching process |
KR20200029162A (ko) | 2018-09-10 | 2020-03-18 | (주)시스템배관 | 탄성 재질의 탄성 공간링을 이용한 내진용 배관 연결장치 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59168533A (ja) * | 1983-03-16 | 1984-09-22 | Fujitsu Ltd | 文字列変換方式 |
JPS61120276A (ja) * | 1984-11-16 | 1986-06-07 | Sanyo Electric Co Ltd | 片仮名・平仮名変換装置及び変換方法 |
JPS6231467A (ja) | 1985-08-01 | 1987-02-10 | Toshiba Corp | 文章作成装置 |
JPH0193861A (ja) | 1987-10-05 | 1989-04-12 | Brother Ind Ltd | 日本語処理機能を備えた電子翻訳機 |
JP2836159B2 (ja) * | 1990-01-30 | 1998-12-14 | 株式会社日立製作所 | 同時通訳向き音声認識システムおよびその音声認識方法 |
JPH0594431A (ja) | 1991-10-02 | 1993-04-16 | Sharp Corp | 仮名変換装置 |
JPH05113968A (ja) * | 1991-10-23 | 1993-05-07 | Nec Corp | 日本語入力装置 |
US5432948A (en) * | 1993-04-26 | 1995-07-11 | Taligent, Inc. | Object-oriented rule-based text input transliteration system |
JPH07129562A (ja) * | 1993-10-28 | 1995-05-19 | Toshiba Corp | 文書作成装置およびその方法 |
US5675817A (en) * | 1994-12-05 | 1997-10-07 | Motorola, Inc. | Language translating pager and method therefor |
JPH08287060A (ja) * | 1995-04-19 | 1996-11-01 | Canon Inc | 文字処理装置および文字処理方法 |
JP3728789B2 (ja) * | 1996-02-19 | 2005-12-21 | オムロン株式会社 | 日本語文解析装置および日本語文解析方法 |
JP3895797B2 (ja) * | 1996-02-22 | 2007-03-22 | 株式会社東芝 | 変換候補生成方法 |
US5963893A (en) * | 1996-06-28 | 1999-10-05 | Microsoft Corporation | Identification of words in Japanese text by a computer system |
US5999950A (en) | 1997-08-11 | 1999-12-07 | Webtv Networks, Inc. | Japanese text input method using a keyboard with only base kana characters |
JPH1166061A (ja) * | 1997-08-22 | 1999-03-09 | Sharp Corp | 情報処理装置および情報処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP3272288B2 (ja) * | 1997-12-24 | 2002-04-08 | 日本アイ・ビー・エム株式会社 | 機械翻訳装置および機械翻訳方法 |
US6401060B1 (en) * | 1998-06-25 | 2002-06-04 | Microsoft Corporation | Method for typographical detection and replacement in Japanese text |
US6707571B1 (en) * | 1998-08-28 | 2004-03-16 | Seiko Epson Corporation | Character printing method and device as well as image forming method and device |
JP2000122768A (ja) * | 1998-10-14 | 2000-04-28 | Microsoft Corp | 文字入力装置、方法および記録媒体 |
JP4302326B2 (ja) * | 1998-11-30 | 2009-07-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | テキストの自動区分 |
US6275789B1 (en) * | 1998-12-18 | 2001-08-14 | Leo Moser | Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language |
US6556984B1 (en) * | 1999-01-19 | 2003-04-29 | International Business Machines Corporation | Hierarchical string matching using multi-path dynamic programming |
US6278969B1 (en) * | 1999-08-18 | 2001-08-21 | International Business Machines Corp. | Method and system for improving machine translation accuracy using translation memory |
JP2001101185A (ja) * | 1999-09-24 | 2001-04-13 | Internatl Business Mach Corp <Ibm> | 辞書の自動切り換えが可能な機械翻訳方法および装置並びにそのような機械翻訳方法を実行するためのプログラムを記憶したプログラム記憶媒体 |
US6986104B2 (en) * | 2000-06-26 | 2006-01-10 | Silver Creek Systems, Inc. | Method and apparatus for normalizing and converting structured content |
US20040205671A1 (en) * | 2000-09-13 | 2004-10-14 | Tatsuya Sukehiro | Natural-language processing system |
US7136803B2 (en) * | 2001-09-25 | 2006-11-14 | Apple Computer, Inc. | Japanese virtual dictionary |
-
2001
- 2001-09-25 US US09/965,333 patent/US7136803B2/en not_active Expired - Lifetime
-
2002
- 2002-09-18 AU AU2002339951A patent/AU2002339951A1/en not_active Abandoned
- 2002-09-18 JP JP2003531361A patent/JP2005538428A/ja active Pending
- 2002-09-18 WO PCT/US2002/029768 patent/WO2003027895A2/en active Application Filing
- 2002-09-24 TW TW091121867A patent/TWI223165B/zh not_active IP Right Cessation
-
2006
- 2006-11-13 US US11/598,869 patent/US7630880B2/en not_active Expired - Lifetime
-
2007
- 2007-04-12 JP JP2007104626A patent/JP4286299B2/ja not_active Expired - Fee Related
-
2008
- 2008-04-09 JP JP2008101299A patent/JP2008204476A/ja active Pending
-
2010
- 2010-02-26 JP JP2010042126A patent/JP5364617B2/ja not_active Expired - Fee Related
-
2013
- 2013-07-12 JP JP2013147026A patent/JP5535379B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008204476A (ja) | 2008-09-04 |
US20030061031A1 (en) | 2003-03-27 |
AU2002339951A1 (en) | 2003-04-07 |
US7136803B2 (en) | 2006-11-14 |
WO2003027895A2 (en) | 2003-04-03 |
JP4286299B2 (ja) | 2009-06-24 |
US7630880B2 (en) | 2009-12-08 |
JP2005538428A (ja) | 2005-12-15 |
JP5535379B2 (ja) | 2014-07-02 |
JP2010165369A (ja) | 2010-07-29 |
JP2013242895A (ja) | 2013-12-05 |
WO2003027895A3 (en) | 2003-10-23 |
JP2007220138A (ja) | 2007-08-30 |
US20070061131A1 (en) | 2007-03-15 |
TWI223165B (en) | 2004-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5364617B2 (ja) | 日本語仮想辞書 | |
US8005662B2 (en) | Translation method, translation output method and storage medium, program, and computer used therewith | |
US6760695B1 (en) | Automated natural language processing | |
US5893133A (en) | Keyboard for a system and method for processing Chinese language text | |
US6014615A (en) | System and method for processing morphological and syntactical analyses of inputted Chinese language phrases | |
US20050216253A1 (en) | System and method for reverse transliteration using statistical alignment | |
US20070021956A1 (en) | Method and apparatus for generating ideographic representations of letter based names | |
JPH0724056B2 (ja) | コンピュータによる形態論的テキスト解析方法 | |
US7328404B2 (en) | Method for predicting the readings of japanese ideographs | |
WO1997040453A1 (en) | Automated natural language processing | |
JPH11238051A (ja) | 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体 | |
Waller et al. | A predictive Blissymbolic to English translation system | |
JP2004118461A (ja) | 言語モデルのトレーニング方法、かな漢字変換方法、言語モデルのトレーニング装置、かな漢字変換装置、コンピュータプログラムおよびコンピュータ読み取り可能な記録媒体 | |
EP1221082B1 (en) | Use of english phonetics to write non-roman characters | |
Tanaka‐Ishii et al. | From phoneme to morpheme—another verification in English and Chinese using corpora— | |
JPH06149791A (ja) | 漢字文章入力装置 | |
JP2009223704A (ja) | 翻訳装置及び翻訳プログラム | |
WO2006051647A1 (ja) | テキストデータ構造、テキストデータ処理方法 | |
JPH07210571A (ja) | 単語検索処理装置及び単語検索処理方法 | |
Asahiah et al. | A survey of approaches to diacritic restoration | |
JPH03225462A (ja) | ローマ字漢字変換装置 | |
Bernard | Machine translation: Success or failure using MT in an IT research and development environment | |
JP2003242145A (ja) | 言語処理プログラム、言語処理装置、その方法および記録媒体 | |
JPH08241315A (ja) | 文書処理装置の単語登録機構 | |
JPH09319746A (ja) | 文書解析方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20100701 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100709 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120713 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121015 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130312 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130712 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130722 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130819 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130909 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |