JP6221275B2 - Character input program and character input device - Google Patents
Character input program and character input device Download PDFInfo
- Publication number
- JP6221275B2 JP6221275B2 JP2013053273A JP2013053273A JP6221275B2 JP 6221275 B2 JP6221275 B2 JP 6221275B2 JP 2013053273 A JP2013053273 A JP 2013053273A JP 2013053273 A JP2013053273 A JP 2013053273A JP 6221275 B2 JP6221275 B2 JP 6221275B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- input
- attribute information
- candidate
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は、操作部および表示部が接続されたコンピュータを、操作部から入力された読み文字列を所定の表記文字列に変換して、変換後の文字列をコンピュータで起動中のアプリケーションへの入力文字列として確定する文字入力システムとして機能させるためのプログラム、およびこのプログラムが適用された文字入力装置に関する。 The present invention converts a read character string input from an operation unit into a predetermined notation character string, and converts the converted character string to an application running on the computer. The present invention relates to a program for functioning as a character input system that is determined as an input character string, and a character input device to which the program is applied.
携帯電話などの小型の情報端末装置に組み込まれる日本語入力システムには、変換操作に応じて読み文字列を表記文字列に変換する機能のほか、キー操作に応じて読み文字列が変更される都度、その時点での読み文字列に前方一致する候補の文字列を抽出する機能(以下、「予測変換機能」という。)や、文字列の確定に応じてその確定文字列に続いて入力される可能性がある文字列を予測して表示する機能(以下、「繋がり予測機能」という。)などが設けられている。 Japanese input systems built into small information terminal devices such as mobile phones have a function to convert a reading character string into a written character string according to a conversion operation, and a reading character string is changed according to a key operation. Each time, a function that extracts a candidate character string that matches the reading character string at the current time (hereinafter referred to as a “predictive conversion function”) or a character string that is input following the confirmed character string. For example, a function for predicting and displaying a character string that is likely to be displayed (hereinafter referred to as “connection prediction function”).
繋がり予測機能に関して、特許文献1には、繋がり元の文字列(特許文献1では「予測元文字列」)と繋がり先の文字列(特許文献1では「繋がり予測語」)とを対応づけた予測辞書を直前に確定された語により検索して、確定された語を予測元文字列とする繋がり予測語を候補として抽出することが記載されている。 Regarding the connection prediction function, Patent Document 1 associates a connection source character string (“Prediction Source Character String” in Patent Document 1) with a connection destination character string (“Connection Prediction Word” in Patent Document 1). It is described that a prediction dictionary is searched for a word that has been confirmed immediately before, and a linked prediction word having the determined word as a prediction source character string is extracted as a candidate.
また予測変換に関して、特許文献2には、入力状況に適した属性を表す複数種の属性がそれぞれ所定数の辞書データに対応づけられた構成の変換用辞書を設定し、読み文字の入力が開始された時点や候補が確定された時点での入力状況を判別すると共に、上記の変換用辞書から候補を抽出して表示する際に、判別されている入力状況が対応づけられている候補が上位に表示されるように優先度を嵩上げすることが記載されている。
Regarding predictive conversion,
従来の繋がり予測処理では、繋がり元の文字列と繋がり先の文字列との組み合わせが登録された辞書を対象にした検索により、直前に確定された文字列に対する繋がり先の文字列を抽出する。しかしながら、ユーザが目的とする候補が呼び出される確率は高いとは言えない。特に、「が」「の」「を」などの格助詞は、様々な語句と結びつけて使用されるため、各種語句に共通する繋がり元の語句を登録する程度のことしかできず、ユーザが目的とする語句が呼び出される可能性を高めるのは困難である。 In the conventional connection prediction process, a connection destination character string with respect to a character string determined immediately before is extracted by a search for a dictionary in which a combination of a connection source character string and a connection destination character string is registered. However, it cannot be said that there is a high probability that a candidate intended by the user is called. In particular, case particles such as “GA”, “NO”, “NO”, etc. are used in connection with various words and phrases, so the user can only register the original words and phrases that are common to various words. It is difficult to increase the possibility that the phrase will be called.
特許文献1に記載された発明では、名詞と格助詞との組み合わせを繋がり元の文字列として繋がり先の文字列を対応づけた構成の辞書が設定されており、このような構成の辞書によれば、上記の問題を解決できるようにも思われる。しかし、実際に目的とする語句が呼び出される確度を高めるには、多数の名詞と格助詞との組み合わせに対してそれぞれ繋がり先文字列を登録しなければならない。そうなると、辞書ファイルの容量が膨大になり、現実的ではない。 In the invention described in Patent Literature 1, a dictionary having a configuration in which a combination of a noun and a case particle is connected as a source character string and a destination character string is associated is set. It seems that the above problem can be solved. However, in order to increase the accuracy with which the target word is actually called, it is necessary to register the connection destination character strings for the combinations of a large number of nouns and case particles. If so, the capacity of the dictionary file becomes enormous, which is not realistic.
たとえば、特許文献1の図3には、「服の」という語句に対して「色」「値段」「価格」という繋がり予測語を対応づけているが、「服」の下位概念にあたる語句(「セーター」「シャツ」など)についても、同様の繋がり予測語を対応づける必要がある。また、「色」「値段」「価格」というような語句は、「服」の分野に限らず、様々な物品に対して使用されるから、それらの物品を表す多数の名詞にも同様の繋がり予測語を対応づける必要がある。 For example, FIG. 3 of Patent Document 1 associates the word “clothes” with the predicted words “color”, “price”, and “price”. For sweaters, shirts, etc.), it is necessary to associate similar connection prediction words. In addition, phrases such as “color”, “price”, and “price” are used not only in the field of “clothes” but also in various items, and thus are connected to a large number of nouns representing these items. It is necessary to associate predicted words.
また、予測変換や仮名漢字変換においても、一般に、辞書部に保存されている各語句の優先度や過去の入力履歴に基づき候補の表示順序が決定されるため、ユーザが意図する語句が呼び出されずに文字入力に手間がかかる場合がある。 Also in predictive conversion and kana-kanji conversion, the display order of candidates is generally determined based on the priority of each word stored in the dictionary and the past input history, so that the word intended by the user is not called. It may take time to input characters.
本発明は上記の問題に着目してなされたもので、ユーザが意図する語句が候補として呼び出される可能性を高めることを第1の課題とする。
さらに本発明は、繋がり予測処理のために、前後に連ねて使用される可能性がある語句の組み合わせに両者の繋がり関係を示す情報を紐付けておく場合に、辞書部のデータ容量を増大させることなく、候補の抽出の確度を高めることを第2の課題とする。
The present invention has been made paying attention to the above problem, and a first problem is to increase the possibility that a word intended by a user is called as a candidate.
Furthermore, the present invention increases the data capacity of the dictionary unit when information indicating the relationship between the two is linked to a combination of words that may be used in a row for the connection prediction process. The second problem is to improve the accuracy of candidate extraction without any problem.
本発明によるプログラムにより構成される文字入力システムには、複数の語句毎の読み文字列と表記文字列との組み合わせが登録された辞書部と、操作部から読み文字列の入力を受け付ける読み文字列入力手段と、入力された読み文字列または確定された文字列により辞書部を検索して所定数の表記文字列を入力候補として抽出する候補抽出手段と、候補抽出手段により抽出された入力候補の文字列を表示部に表示する候補表示手段と、操作部における候補の選択操作に応じて選択された候補の文字列を起動中のアプリケーションへの入力文字列として確定する確定手段とを具備する。 In a character input system constituted by a program according to the present invention, a dictionary part in which a combination of a read character string and a notation character string for each of a plurality of words is registered, and a read character string that receives input of a read character string from an operation part Input means, candidate extraction means for searching the dictionary part by the input reading character string or the confirmed character string and extracting a predetermined number of written character strings as input candidates, and input candidates extracted by the candidate extraction means Candidate display means for displaying a character string on the display section, and confirmation means for confirming a candidate character string selected in accordance with a candidate selection operation in the operation section as an input character string to the running application.
このプログラムにより設定された辞書部には、複数の名詞がそれぞれの上位概念に基づき複数のカテゴリに分類されると共に、分類された各名詞および各カテゴリに関連する各種の語句にそれぞれ分類されたカテゴリまたは関連するカテゴリを示す属性情報が紐付けられて登録される。また、候補抽出手段は、前記属性情報が紐付けられた名詞を含む文字列が入力文字列として設定されたことに応じて当該名詞の属性情報を一時的に保存する属性情報保存手段を具備すると共に、この手段に属性情報が保存されている状態下での辞書部に対する検索において、当該保存されている属性情報に紐付けられている語句を優先して抽出する。 In the dictionary part set by this program, a plurality of nouns are classified into a plurality of categories based on their superordinate concepts, and categories classified into various classified nouns and various words and phrases related to each category. Alternatively, attribute information indicating a related category is associated and registered. The candidate extracting means includes attribute information storage means for temporarily storing the attribute information of the noun in response to the character string including the noun associated with the attribute information being set as the input character string. At the same time, in the search for the dictionary portion in a state where the attribute information is stored in this means, the word / phrase associated with the stored attribute information is preferentially extracted.
上記構成のとおり、本発明では、各種名詞が上位概念に基づき複数のカテゴリに分類され、それぞれ所属するカテゴリを示す属性情報に紐付けられて辞書部に登録される。また、各カテゴリに関連する各種の語句もそれぞれ関連するカテゴリを示す属性情報に紐付けられて辞書部に登録される。属性情報が紐付けられた名詞を含む文字列が入力文字列として設定されると、その属性情報が属性情報保存手段に保存され、その後の辞書部に対する検索では、保存されている属性情報に紐付けられている語句が優先的に抽出される。 As described above, in the present invention, various nouns are classified into a plurality of categories based on the superordinate concept, and are registered in the dictionary unit in association with attribute information indicating the category to which each noun belongs. Various words related to each category are also associated with attribute information indicating the related category and registered in the dictionary unit. When a character string including a noun associated with attribute information is set as an input character string, the attribute information is stored in the attribute information storage means, and in subsequent searches for the dictionary part, the string information is stored in the stored attribute information. The attached phrases are preferentially extracted.
したがって、各カテゴリに関連する語句を十分にピックアップして属性情報を設定しておけば、同じカテゴリに分類されたどの名詞にも、それらに共通する属性情報に基づき同様の関連語を呼び出すことが可能になる。また、繋がり予測のために語句間の繋がり関係を示す情報を辞書部に登録する場合にも、個々の語句の組み合わせ毎に繋がり関係を示す情報を設定する必要がなくなり、辞書部のデータ容量が膨大化するおそれがない。 Therefore, if you sufficiently pick up the words and phrases related to each category and set the attribute information, any nouns classified in the same category can call similar related words based on the attribute information common to them. It becomes possible. In addition, when registering information indicating a connection relationship between words for connection prediction in the dictionary unit, it is not necessary to set information indicating the connection relationship for each combination of words, and the data capacity of the dictionary unit is reduced. There is no fear of enlarging.
また、候補の抽出処理においては、属性情報保存手段に属性情報が保存されている間であれば、その保存の元となった名詞を含む文字列に直接に連なる関係にない語句であっても、当該名詞と同じ属性情報が紐付けられている語句が優先して抽出されるので、ユーザが意図する語句が候補として呼び出される可能性が高められる。 In addition, in the candidate extraction process, even if the attribute information is stored in the attribute information storage unit, even if the phrase is not directly related to the character string including the noun that is the source of the storage, Since the phrase that is associated with the same attribute information as the noun is extracted with priority, the possibility that the phrase intended by the user is called as a candidate is increased.
上記の文字入力システムでは、辞書部に、前後に連ねて入力される可能性がある語句の間の繋がり関係を示す情報を含め、候補抽出手段に、確定手段により直前に確定された文字列により辞書部を検索してその確定文字列に繋がりを持つ語句の表記文字列を次の入力候補として抽出する繋がり予測処理を実施する機能を設けることができる。この機能を持つ一実施形態の候補抽出手段は、属性情報保存手段に属性情報が保存されている状態下で繋がり予測処理を実施する場合には、前記直前に確定した文字列に繋がりを持つ語句の中の前記履歴情報保存手段に保存されている属性情報に紐付けられている語句の表記文字列を優先して抽出する。
この実施形態によれば、名詞を含む一連のテキストが入力される間にその名詞に直接または間接的に繋がる語句として、当該名詞のカテゴリに関連する語句を上位の候補として呼び出すことが可能になる。
In the above character input system, the dictionary unit includes information indicating a connection relationship between words that may be input before and after, and the candidate extraction unit includes the character string determined immediately before by the determination unit. It is possible to provide a function of performing a connection prediction process of searching the dictionary part and extracting a notation character string of a phrase having a connection to the confirmed character string as the next input candidate. The candidate extraction unit of the embodiment having this function, when performing the connection prediction process in a state where the attribute information is stored in the attribute information storage unit, the phrase having a connection to the character string determined immediately before The notation character string associated with the attribute information stored in the history information storage means is preferentially extracted.
According to this embodiment, as a phrase directly or indirectly connected to a noun while a series of text including the noun is input, it is possible to call a phrase related to the category of the noun as an upper candidate. .
他の実施形態における候補抽出手段は、読み文字列入力手段が複数の文節に対応する長さの読み文字列の入力を受け付けたことに応じて、当該読み文字列を文節毎に区切って辞書部を検索し、各文節に対して抽出した表記文字列を連ねた文字列を変換候補に設定する連文節変換機能を具備する。さらに、この連文節変換機能を実行する前記候補抽出手段は、読み文字列内のいずれかの文節に対する検索により属性情報に紐付けられた名詞を含む表記文字列が候補として抽出されたときは、その属性情報を前記属性情報保存手段に保存すると共に、当該文節より後の文節に対する検索において前記保存された属性情報に紐付けられている語句を優先して抽出する。 In another embodiment, the candidate extraction unit includes a dictionary unit that divides the reading character string into phrases and divides the reading character string into phrases according to the input of the reading character string having a length corresponding to a plurality of phrases. And a continuous phrase conversion function for setting a character string obtained by connecting the extracted character strings extracted for each phrase as a conversion candidate. Further, the candidate extracting means for executing the continuous phrase conversion function, when a notation character string including a noun linked to attribute information is extracted as a candidate by searching for any phrase in the reading character string, The attribute information is stored in the attribute information storage means, and the phrase linked to the stored attribute information is preferentially extracted in the search for the clause after the clause.
上記の実施形態によれば、属性情報が紐付けられた名詞を含む文字列を対象にした連文節変換において、名詞より後に位置する語句の変換にかかる確度を高めることができる。 According to the above embodiment, in continuous phrase conversion for a character string including a noun associated with attribute information, the accuracy of conversion of a phrase located after the noun can be increased.
上記実施形態の候補抽出手段には、操作部における操作に応じて読み文字列入力手段が入力する読み文字列が変化する都度、その変化後の読み文字列に適合する語句の表記文字列を抽出する第1の変換手段(前出した予測変換に相当する。)と、操作部における変換操作に応じてその時点で入力されている読み文字列に適合する語句を抽出する第2の変換手段(日本語入力では仮名漢字変換に相当する。)とを設けることができる。前出の連文節変換機能は、これら2種類の変換手段の双方に設けることが可能であるが、少なくとも第2の変換手段に当該連文節変換機能を設ければよい。 In the candidate extraction means of the above embodiment, each time the reading character string input by the reading character string input means changes according to the operation in the operation unit, the notation character string of the phrase that matches the changed reading character string is extracted. First conversion means (corresponding to the above-described predictive conversion), and second conversion means for extracting words that match the reading character string input at that time in accordance with the conversion operation in the operation unit ( For Japanese input, it corresponds to Kana-Kanji conversion). The above-mentioned continuous phrase conversion function can be provided in both of these two types of conversion means, but at least the second conversion means may be provided with the continuous phrase conversion function.
さらに各実施形態を含む本発明の候補抽出手段には、属性情報保存手段に保存されている属性情報に紐付けられている語句の表記文字列が確定手段により入力文字列として確定されたことに応じて属性情報保存手段に保存されている属性情報を消去する機能を設けることができる。この機能によれば、名詞を含む文字列が入力文字列として設定された後に、その名詞に関連する語句が候補として呼び出され、ユーザに選択されて確定されたことにより、保存されていた属性情報が消去されるので、あるカテゴリに関連する文の入力が終了した後に、別のカテゴリに関する文が入力される場合に、前回のカテゴリに関連する語句が候補として抽出されるのを防ぐことができる。 Further, in the candidate extraction means of the present invention including each embodiment, the notation character string of the phrase linked to the attribute information stored in the attribute information storage means is confirmed as the input character string by the confirmation means. Accordingly, a function for deleting the attribute information stored in the attribute information storage means can be provided. According to this function, after a character string including a noun is set as an input character string, the attribute information that has been saved is obtained when a word related to the noun is called as a candidate, selected by the user, and confirmed. Is deleted, it is possible to prevent a word related to the previous category from being extracted as a candidate when a sentence related to another category is input after input of a sentence related to a certain category is completed. .
本発明によるプログラムには、辞書部を構成する全データを含めることができるが、これに限らず、既存の辞書部や候補抽出手段を、本発明が適用された状態に更新するための情報のみを含めてもよい。 The program according to the present invention can include all data constituting the dictionary part, but is not limited to this, only information for updating the existing dictionary part and candidate extracting means to a state where the present invention is applied. May be included.
本発明によるプログラムが組み込まれたコンピュータは、接続されている操作部および表示部と共に文字入力装置を構成する。この文字入力装置は、スマートフォンを含む携帯電話、タブレット端末などの携帯情報端末装置のほか、ATMやファクシミリ装置など、文字入力の環境が悪い情報処理装置全般に広く適用することができる。 A computer in which a program according to the present invention is incorporated constitutes a character input device together with a connected operation unit and display unit. This character input device can be widely applied to not only portable information terminal devices such as mobile phones including smartphones and tablet terminals, but also general information processing devices such as ATMs and facsimile devices that have a poor character input environment.
本発明によれば、各種名詞の上位概念に基づき設定された複数のカテゴリ毎に、そのカテゴリに所属または関連する語句に当該カテゴリを示す属性情報を紐付けて辞書部に登録し、名詞を含む文字列が確定されたり、仮名漢字変換処理において仮確定されたことに応じて、以後の辞書部に対する検索において、その名詞のカテゴリに関連する語句が候補として優先して抽出されるようにしたので、ユーザが意図する語句が候補表示画面の上位に呼び出される可能性が大幅に高まり、文字入力の効率を向上させることができる。 According to the present invention, for each of a plurality of categories set based on the superordinate concept of various nouns, the attribute information indicating the category is associated with a word belonging to or related to the category and registered in the dictionary unit, and the noun is included. When a character string is confirmed or is temporarily confirmed in the kana-kanji conversion process, a phrase related to the category of the noun is preferentially extracted as a candidate in a subsequent search for the dictionary part. The possibility that a word intended by the user is called up at the top of the candidate display screen is greatly increased, and the efficiency of character input can be improved.
また、繋がり予測処理のために、前後に連ねて入力される可能性がある語句の組み合わせに両者の繋がり関係を示す情報を紐付けておく場合にも、同じカテゴリに属する複数の語句に対して共通の情報を紐付けることができるので、辞書部のデータ容量を増大させることなく、繋がり予測処理による候補抽出の確度を高めることができる。 In addition, for connection prediction processing, even when information indicating the connection relationship between the two is combined with a combination of words that may be input before and after, a plurality of words belonging to the same category Since common information can be associated, the accuracy of candidate extraction by the connection prediction process can be increased without increasing the data capacity of the dictionary unit.
図1は、本発明が適用された文字入力装置の構成例を示す。
この実施例の文字入力装置100は、スマートフォンに組み込まれて起動中のアプリケーションが管理するファイルへの仮名漢字文字列の入力を行うもので、タッチパネルディスプレイ2と文字入力システム(IME)1とを主要な構成とする。
FIG. 1 shows a configuration example of a character input device to which the present invention is applied.
A
タッチパネルディスプレイ2は、スマートフォンの筐体3(図4〜図7を参照。)の前面に配備される。文字入力システム1は、筐体3内の図示しない制御部に組み込まれたソフトウェアであって、キーボード処理部11,表示処理部12,読み文字列組立処理部13,候補抽出部14,確定処理部15,変換用辞書16,繋がり予測辞書17,属性メモリ18などが含まれる。
The
キーボード処理部11は、タッチパネルディスプレイ2に、複数の文字キー21を含むソフトウェアキーボード20(図4〜図7を参照。)を表示して、このキーボード20に対する操作を受け付ける。文字キー21が操作されると、その操作内容はキーボード処理部11から読み文字列組立処理部13に渡されて、読み文字列組立処理部13において操作に応じた読み文字列が組み立てられる。
The
候補抽出部14は、読み文字列による予測変換機能および仮名漢字変換機能と、確定文字列から次の入力文字列を予測する繋がり予測機能とを具備する。
予測変換では、読み文字列組立処理部13により組み立てられる読み文字列が変化する都度、その変化後の読み文字列に前方一致する語句の表記文字列を変換用辞書16から抽出する。仮名漢字変換では、ソフトウェアキーボード20内の変換キー22(図4〜図7を参照。)が操作されたことに応じて、その時点における読み文字列に適合する語句の表記文字列を変換用辞書16から抽出する。
The
In the predictive conversion, every time the reading character string assembled by the reading character string assembling
表示された候補に対する選択操作またはキーボード20の確定キー23の操作が行われると、確定処理部15によって、選択された候補または確定操作の対象文字列が入力文字列として確定される。この確定に応じて候補抽出部14は、確定処理部15により確定された文字列により繋がり予測辞書17を検索して、確定文字列に繋がる関係が設定された語句の表記文字列を抽出する繋がり予測を実施する。
When the selection operation for the displayed candidate or the operation of the
表示処理部12は、システム1の起動に応じてタッチパネルディスプレイ2に文字入力画面を立ち上げ、読み文字列組立処理部13により組み立てられた読み文字列や候補抽出部14により抽出された候補を表示する。また確定処理部14により入力文字列が確定されると、表示処理部12でも、その入力文字列を確定状態で表示する。
The
変換用辞書16には、予測変換や仮名漢字変換のために、多数の語句毎の読み文字列と表記文字列との組み合わせが登録される。また、繋がり予測辞書17には、前後に連ねて入力される可能性がある2つの語句の組み合わせが多数登録される。
さらに、候補の抽出確度を高めるために、この実施例の変換用辞書16では、複数の名詞がそれぞれの上位概念に基づいて複数のカテゴリに分類されると共に、各カテゴリに関連する名詞以外の各種の語句もそれぞれ関連するカテゴリに分類される。なお、語句によっては、複数のカテゴリに割り振られる場合もある。
In the
Further, in order to improve the extraction accuracy of candidates, in the
変換用辞書16および繋がり予測辞書17は、それぞれ1または複数の辞書ファイルにより構成することができる。また、これらの辞書16,17を1つの辞書に統合した構成の辞書にすることも可能である。
Each of the
図2は、変換用辞書16の辞書データの構成例を名詞の辞書データに限定して示す。この実施例では、[場所][乗り物][食べ物][飲み物][メディア1][メディア2][衣類]という7種類のカテゴリを設定して、各カテゴリに適した概念の名詞に対し、それぞれそのカテゴリに属することを示す属性情報(具体的にはカテゴリの名称)を設定している。
なお、[メディア1]は映像や音楽などの動的な情報を提供するもので、[メディア2]は印刷物などの静的な情報を提供するものである。
FIG. 2 shows a configuration example of the dictionary data of the
[Media 1] provides dynamic information such as video and music, and [Media 2] provides static information such as printed matter.
図2に示す変換用辞書16の辞書データには、平仮名による読み文字列と、仮名漢字による表記文字列と、属性情報とが含まれる。名詞以外の品詞についても、図2に示すのと同様の構成の辞書データが設定される。登録される語句の中には、図2の「フランクフルト」や「ネット」のように複数のカテゴリに属する語句がある一方で、いずれのカテゴリーにも所属していないために属性情報が設定されていない語句(主として助詞などの付属語)も存在する。
また、図2には示していないが、属性情報の有無に関わらず、変換用辞書16の辞書データには、品詞情報、システム設計者により設定された優先度、実際の確定状況に応じて候補抽出部14により更新される使用頻度情報などが含まれる。
The dictionary data of the
Although not shown in FIG. 2, regardless of the presence or absence of attribute information, the dictionary data of the
なお、この実施例の変換用辞書16では、動詞や形容詞などの活用語については終止形のみが登録される。予測変換や仮名漢字変換では、変換用辞書16内の活用語に対しては、読み文字列の語頭が一致したことに応じて終止形を抽出し、必要に応じてその終止形から各種活用形を導き出して候補に加えるようにしている(後述する図7を参照。)。
Note that in the
図3は、繋がり予測辞書17の辞書データの構成例を示す。なお、図3では、繋がり元の語句を格助詞のみとしているが、その他の語句についても同様の構成の辞書データが登録される。 FIG. 3 shows a configuration example of the dictionary data of the connection prediction dictionary 17. In FIG. 3, only the case particles are used as the connection source words, but dictionary data having the same configuration is registered for other words.
この例の繋がり予測辞書17では、連続して入力される可能性が高い関係にある語句の組み合わせについて、繋がり元の語句の表記文字列に繋がり先の語句の読み文字列および表記文字列を対応づけた構成の辞書データが登録される。さらに繋がり先の語句が前出の7種類のカテゴリのいずれかに所属する場合には、その所属カテゴリを示す属性情報が辞書データに含められる。つまり、変換用辞書16に属性情報が登録されている語句が繋がり先の語句となる場合には、繋がり予測辞書17の当該繋がり先語句を含む辞書データにも同一の属性情報が登録されることになる。また、変換用辞書16において属性情報が設定されていない語句が繋がり先の語句となる場合には、繋がり予測辞書17の辞書データにも属性情報は設定されない。
In the connection prediction dictionary 17 in this example, for a combination of words that are highly likely to be input consecutively, the read character string and the written character string of the connected word are associated with the written character string of the connected word. Registered dictionary data is registered. Further, when the connected word / phrase belongs to one of the above-mentioned seven categories, attribute information indicating the belonging category is included in the dictionary data. That is, when a word whose attribute information is registered in the
さらに繋がり予測辞書17の各辞書データにも、標準的な優先度や使用頻度情報などが含まれる。以下では、標準的な優先度と使用頻度情報とを総合した度数を「優先度」と呼ぶことにする。 Further, each dictionary data of the connection prediction dictionary 17 includes standard priority and usage frequency information. Hereinafter, the frequency obtained by combining standard priority and usage frequency information will be referred to as “priority”.
図2に示すように、この実施例では、名詞は、その語句が示す概念の上位概念に相当するカテゴリに分類される。また図3に示すように、各カテゴリの名詞に直接または間接的に連なって入力される可能性がある語句は、その関連するカテゴリに分類される。 As shown in FIG. 2, in this embodiment, nouns are classified into categories corresponding to the superordinate concept of the concept indicated by the phrase. Also, as shown in FIG. 3, words that may be input directly or indirectly connected to nouns in each category are classified into the related categories.
図2では、7種類のカテゴリの中の[衣類]に属する名詞の辞書データが位置する範囲を太枠で囲んで示すと共に、その中で以下の具体例に使用する「ふく/服」の辞書データを網点パターンにより示している。また図3では、[衣類]に属する語句が繋がり先として設定されている辞書データを網点パターンにより示している。 In FIG. 2, the range where the dictionary data of the noun belonging to [clothing] among the seven categories is located is surrounded by a thick frame, and the “fuku / clothing” dictionary used in the following specific examples therein Data is shown as a halftone dot pattern. In FIG. 3, dictionary data in which words and phrases belonging to [clothing] are set as connection destinations is shown by a halftone dot pattern.
図4〜図7は、[衣類]の中の「服」を含む文章が入力される場合の文字入力画面における候補表示の変遷の事例を示す。いずれの事例でも、文字入力画面は、上中下の三段に分割され、上段に文字入力欄24が、中段に候補表示欄25が、下段にソフトウェアキーボード20がそれぞれ設定される。ソフトウェアキーボード20には、文字キー21や変換キー22や確定キー23を含む計16個のキーが含まれる。
4 to 7 show examples of transition of candidate display on the character input screen when a sentence including “clothes” in [clothing] is input. In any case, the character input screen is divided into upper, middle, and lower three levels, the
図4は、「ふくを」という読み文字列が入力されて、これが「服を」に変換された場合の文字入力画面の変遷を示す。図4(1)は、読み文字列「ふくを」の入力が完了した直後の画面であって、候補表示欄25には予測変換により抽出された複数の候補が表示されている。図4(2)は、候補リストの中の「服を」が選択された後の画面であって、候補リストで選択された「服を」が文字入力欄24に確定表示されると共に、候補表示欄25の候補リストが、確定文字列に対する繋がり予測によって抽出された候補を表示するものに更新されている。
FIG. 4 shows the transition of the character input screen when the reading character string “Fukuo” is input and converted into “clothing”. FIG. 4A is a screen immediately after the input of the reading character string “Fukuo” is completed, and a plurality of candidates extracted by predictive conversion are displayed in the
なお、この例のように、名詞と格助詞との組み合わせから成る文字列が確定された場合の繋がり予測では、末尾の格助詞により繋がり予測辞書17が検索される。すなわち、図4(2)の候補表示欄25には、「服を」の「を」に繋がる語句による候補が表示されているが、これらのうちの第6位までの語句「着る」「買う」「もらう」「あげる」「借りる」「貸す」には、図3に示すように、「を」の前の「服」と同じ[衣類]の属性情報が設定されている(図3参照)。
As in this example, in the connection prediction when a character string composed of a combination of a noun and a case particle is determined, the connection prediction dictionary 17 is searched with the last case particle. That is, in the
図5は、図4(1)(2)と同様の流れにより、「ふくを」という読み文字列が「服を」に変換された後に、「たくさん」という読み文字列が入力された場合の文字入力画面の変遷を示す。紙面の都合とにより、図5では、図4(1)に相当する図を省略して、「服を」が確定された時点の画面(図5(1))から示す。 FIG. 5 shows a case where the reading character string “Many” is inputted after the reading character string “Fukuo” is converted into “Clothing” by the same flow as FIG. 4 (1) and (2). Shows the transition of the character input screen. Due to space limitations, FIG. 5 omits the figure corresponding to FIG. 4 (1) and shows the screen from the point in time when “clothes” is confirmed (FIG. 5 (1)).
先にも述べたように、「服を」が確定したことによって、候補表示欄25には、[衣類]の属性情報が設定された語句が上位に配置された候補リストが表示される(図5(1))。しかし、図5の事例では、表示された候補は選択されずに、読み文字が入力され、その入力に伴う予測変換によって候補表示欄25の表示が更新されている。
As described above, when “clothes” is confirmed, the
図5(2)は、「たくさん」という読み文字列が入力された時点での表示例を示す。候補表示欄25には、「たくさん」という読みを持つ語句が表示されているのみで、[衣類]に関わる語句は示されていない。
図5(3)は、上記の候補リストの中から「たくさん」が選択されて繋がり予測処理が実施された時点での表示例を示す。この実施例では、「を」に対する繋がり先の語句として登録された各語句が「たくさん」の繋がり先としても登録されていたため、「たくさん」の選択に応じた繋がり予測によって、再び[衣類]の属性情報を有する語句が上位に位置する候補リストが表示されている。
FIG. 5B shows a display example at the time when a reading character string “many” is inputted. In the
FIG. 5 (3) shows a display example when “many” is selected from the above candidate list and the connection prediction process is performed. In this embodiment, since each word / phrase registered as a connection destination word / phrase for “O” is also registered as a connection destination of “many”, the prediction of connection according to the selection of “many” again causes [clothing] A candidate list in which words having attribute information are positioned higher is displayed.
図6でも、図5と同様に、「ふくを」という読み文字列が「服を」に変換された後に読み文字列が入力された場合の文字入力画面の変遷を示す。この場合にも、読み文字列の「ふくを」に対する予測変換により抽出された候補の中の「服を」が選択され、その選択に応じて実施された繋がり予測によって、候補表示欄25の表示が、[衣類]の属性情報が設定されている語句が上位に配置された候補リストに更新される(図6(1)(2))。
6 also shows the transition of the character input screen when the reading character string is input after the reading character string “Fukuo” is converted to “clothes”, as in FIG. 5. Also in this case, “clothes” is selected from the candidates extracted by the predictive conversion for the reading character string “Fukuo”, and the display of the
図6の事例では、次に、「か」という読み文字が入力されている(図6(3))。この入力により予測変換が行われて、候補表示欄25の表示は、読み文字「か」に前方一致する語句による候補リストに更新されているが、このリストでは、[衣類]の属性情報が設定されている「買う」「借りる」「貸す」、ならびにこれらの活用形による文字列が上位を占めている。
In the example of FIG. 6, next, the reading character “ka” is inputted (FIG. 6 (3)). Predictive conversion is performed by this input, and the display in the
図7は、「ふくをきる」という読み文字列が入力された後に、変換キー22の操作に応じて仮名漢字変換が実施された場合の文字入力画面の変遷を示す。
図7(1)は、変換キー22が操作される直前の画面の例であって、候補表示欄25には、予測変換により抽出された平仮名文字列の「ふくをきる」と片仮名文字列の「フクヲキル」とが表示されている。
FIG. 7 shows the transition of the character input screen in the case where kana-kanji conversion is performed in accordance with the operation of the
FIG. 7A is an example of a screen immediately before the
図7(2)は、変換キー22の操作後の画面の例である。この実施例では、連文節変換により読み文字列が「ふくを」と「きる」とに分解されて変換され、文節毎の第1候補の文字列が結合された結果、仮名漢字文字列の「服を/着る」が文字入力欄24に未確定状態で表示されている。また、この未確定文字列の「服を」に変換用のカーソルが設定されると共に、候補表示欄25に第1文節に対する各種変換候補が表示される。
FIG. 7B is an example of the screen after the
図4〜図7の事例では、いずれも「服」という名詞が入力されているが、この「服」を[衣類]に属する他の名詞(「シャツ」「ジャケット」など)に置き換え、その他は各事例と同様の入力作業を行った場合にも、名詞を含む読み文字列に対する変換結果以外の候補表示は、各事例と同様になる。 In the examples of FIGS. 4 to 7, the noun “clothes” is entered, but this “clothes” is replaced with other nouns belonging to [clothing] (such as “shirt” and “jacket”). Even when an input operation similar to that in each case is performed, candidate displays other than the conversion result for the reading character string including the noun are the same as those in each case.
以上の事例に示したように、この実施例の文字入力システム1では、属性情報が設定されている名詞が確定されたことに応じて、以後の変換処理や繋がり予測処理において、確定された名詞と同じ属性情報が設定された語句を優先的に抽出する。この優先抽出のために、この実施例では、確定された名詞の属性情報を、同じ属性情報が設定された語句が確定されるまで属性メモリ18に保存するようにしている。
As shown in the above examples, in the character input system 1 of this embodiment, in response to the determination of the noun for which attribute information is set, the noun determined in the subsequent conversion process and connection prediction process. Preferentially extract words with the same attribute information as. For this priority extraction, in this embodiment, the attribute information of the confirmed noun is stored in the
上記の優先抽出によれば、ユーザが目的とする語句が上位に表示される可能性が大幅に高められるので、文字入力にかかる労力を軽減して入力作業の効率を向上させることができる。
また、繋がり予測辞書17では、同じカテゴリ内の複数の語句への繋がり先として機能する語句に対し、当該カテゴリを示す属性情報を設定することによって各繋がり元の語句への対応づけが一括で行われるので、データ容量を増大させることなく、入力の利便性を高めることができる。
According to the above priority extraction, the possibility that the user's target word is displayed at the top is greatly increased, so that the labor required for character input can be reduced and the efficiency of the input work can be improved.
Further, in the connection prediction dictionary 17, by setting attribute information indicating the category for words that function as a connection destination to a plurality of words / phrases in the same category, the connection prediction dictionary 17 collectively associates the words / phrases with each connection source. Therefore, the convenience of input can be improved without increasing the data capacity.
さらに、図5の事例に示すように、この実施例では、名詞と格助詞との組み合わせによる文字列に直接に繋がる語句に限らず、他の語句を介して繋がる語句についても、確定された名詞と同じ属性情報が設定されている候補があれば、その候補が優先して抽出される。仮名漢字変換においても、属性情報が設定された名詞を含む文節と名詞と同じ属性情報が設定された語句を含む文節との間に他の文節が位置する構成の文字列への変換を、精度良く実施することができる。 Furthermore, as shown in the example of FIG. 5, in this example, not only words that are directly connected to a character string by a combination of a noun and a case particle, but also words that are connected through other words are confirmed nouns. If there is a candidate for which the same attribute information is set, that candidate is extracted with priority. Even in Kana-Kanji conversion, conversion to a character string with a structure in which other clauses are located between a clause containing a noun for which attribute information is set and a clause containing a phrase for which the same attribute information as the noun is set is accurate. Can be implemented well.
図8は、上記文字入力システム1において実施される一連の処理の流れを示す。
文字入力画面が立ち上げられて読み文字の入力が開始されると、その入力に応じた読み文字列が組み立てられ(ステップS1)、その読み文字列による予測変換処理(詳細は図10に示す。)が実施され(ステップS2)、予測変換により抽出された候補が表示される(ステップS3)。さらに読み文字の入力が続くと、ステップS4が「YES」となってステップS1に戻る。
以後も、読み文字列の入力が続く間は、ステップS1〜S4の処理が繰り返される。
FIG. 8 shows a flow of a series of processes performed in the character input system 1.
When the character input screen is launched and input of reading characters is started, a reading character string corresponding to the input is assembled (step S1), and predictive conversion processing based on the reading character string (details are shown in FIG. 10). ) Is executed (step S2), and candidates extracted by the predictive conversion are displayed (step S3). If the input of reading characters continues, step S4 becomes “YES” and the process returns to step S1.
Thereafter, while the input of the reading character string continues, the processes of steps S1 to S4 are repeated.
所定の時点で変換キー22が操作されると、ステップS5が「YES」となってステップS6に進み、その時点における読み文字列を用いた仮名漢字変換処理(詳細は図11に示す。)が実施される。仮名漢字変換処理で抽出された候補もステップS3の処理により表示される。
When the
予測変換または仮名漢字変換により抽出された候補が選択されるか、またはキーボード20の確定キー23が操作されると、ステップS7が「YES」となってステップS8に進み、選択操作の対象の文字列または文字入力欄24に表示中の文字列が確定される。
When a candidate extracted by predictive conversion or kana-kanji conversion is selected, or when the
文字列の確定後は、ステップS11において、確定された文字列に対する繋がり予測処理(詳細は図9に示す。)が実施された後に、抽出された候補が表示される(ステップS3)。本実施例では、この繋がり予測処理の前に、確定された語句の属性情報をチェックする(ステップS9)。ここで、属性メモリ18に保存中の属性情報を有する語句が確定されている場合(ステップS9が「YES」)には、ステップS10において属性メモリ18をリセットしてから繋がり予測処理に進む。保存中の属性情報を有していない語句が確定された場合には、ステップS10をスキップして繋がり予測処理に進む。
繋がり予測処理により抽出された候補が選択された場合にも、ステップS7の「YES」判定に応じてステップS8以下の処理が実施される。
After the character string is confirmed, in step S11, after the connection prediction process (details are shown in FIG. 9) for the confirmed character string is performed, the extracted candidates are displayed (step S3). In this embodiment, before the connection prediction process, the attribute information of the confirmed phrase is checked (step S9). Here, when the phrase having the attribute information being stored in the
Even when the candidate extracted by the connection prediction process is selected, the processes in and after step S8 are performed according to the “YES” determination in step S7.
以下、図9,図10,図11を順に参照して、繋がり予測処理、予測変換処理、仮名漢字変換処理のそれぞれを詳細に説明する。 Hereinafter, the connection prediction process, the prediction conversion process, and the kana-kanji conversion process will be described in detail with reference to FIGS. 9, 10, and 11 in order.
まず図9に示す繋がり予測処理では、直前に確定された語句に名詞が含まれるか否かをチェックし(ステップS101)、名詞が含まれない場合(ステップS101が「NO」)には、属性メモリ18に属性情報が保存されているかどうかをチェックする(ステップS102)。また、確定された語句に名詞が含まれる場合(ステップS101が「YES」)には、その名詞に属性情報が設定されているかどうかをチェックする(ステップS104)。 First, in the connection prediction process shown in FIG. 9, it is checked whether or not a noun is included in the word / phrase determined immediately before (step S101). If no noun is included (step S101 is “NO”), an attribute is determined. It is checked whether attribute information is stored in the memory 18 (step S102). If the determined word includes a noun (step S101: “YES”), it is checked whether attribute information is set for the noun (step S104).
図4〜図6の事例のように、属性情報が設定されている名詞を含む語句が確定した場合には、ステップS101およびステップS104が順に「YES」となってステップS105に進み、確定した名詞の属性情報が属性メモリ18に保存される。なお、ここでの保存は上書き保存となるので、既に属性メモリ18に属性情報が格納されている場合には、その情報は消去される。
When the phrase including the noun for which attribute information is set is confirmed as in the examples of FIGS. 4 to 6, step S101 and step S104 are sequentially “YES” and the process proceeds to step S105, where the confirmed noun Is stored in the
属性情報の保存が終了すると、ステップS103に進み、確定した語句(その語句の末尾に助詞が位置する場合には、助詞を示す文字のみ)により繋がり予測辞書17を検索して、確定した語句に繋がる語句(すなわち確定した語句を繋がり元とする辞書データ内の繋がり先の語句)を保存中の属性情報を有するものから優先して抽出する。 When the storage of the attribute information is completed, the process proceeds to step S103, and the connection prediction dictionary 17 is searched by the confirmed phrase (if the particle is located at the end of the phrase, only the letter indicating the particle), and the confirmed phrase is The connected words (that is, the connected words / phrases in the dictionary data based on the fixed words / phrases) are extracted preferentially from those having the attribute information being stored.
確定した語句には名詞が含まれないが、属性メモリ18に属性情報が保存されている場合(ステップS101が「NO」でステップS102が「YES」)にも、ステップS103に進み、同様に、確定した語句に繋がる語句を保存中の属性情報を有するものから優先して抽出する。 Even if the confirmed phrase does not include a noun, but attribute information is stored in the attribute memory 18 (step S101 is “NO” and step S102 is “YES”), the process proceeds to step S103. A phrase connected to the confirmed phrase is extracted with priority from those having attribute information being stored.
なお、ステップS103においては、保存中の属性情報を有する語句のほか、属性情報が設定されていない語句で優先度が高いものが抽出される。したがって、保存中の属性情報を有する語句が見つからなかった場合には、当該属性情報とは関係のない語句のみが抽出される。 In step S103, in addition to words having attribute information being saved, words having high priority among words / phrases for which attribute information is not set are extracted. Therefore, when a phrase having attribute information being stored is not found, only a phrase that is not related to the attribute information is extracted.
確定した語句に名詞が含まれず、属性情報も保存されていない場合(ステップS101およびS102が共に「NO」)や、確定した語句に名詞が含まれてはいるが、その名詞に属性情報が設定されていない場合(ステップS101が「YES」でステップS104が「NO」)には、ステップS106に進む。ステップS106では、属性情報の有無や種別に関わらずに、確定した語句に繋がる語句を優先度の高いものから順に抽出する。 If no words are included in the confirmed word and no attribute information is stored (both steps S101 and S102 are “NO”), the noun is included in the fixed word, but attribute information is set for the noun. If not (step S101 is “YES” and step S104 is “NO”), the process proceeds to step S106. In step S106, the words and phrases connected to the confirmed words and phrases are extracted in descending order of priority regardless of the presence / absence or type of attribute information.
上記の処理によれば、図4の事例のように、名詞を含む語句が確定した直後にその名詞と同じ属性情報を有する語句を候補として呼び出すことができるほか、図5の事例のように、名詞を含む語句が確定した後に、その名詞とは異なる属性情報を有する語句や属性情報を持たない語句の確定を経て、名詞と同じ属性情報を有する語句の候補を呼び出すこともできる。 According to the above processing, as shown in the example of FIG. 4, immediately after the phrase including the noun is confirmed, the phrase having the same attribute information as the noun can be called as a candidate. After a phrase including a noun is determined, a phrase having attribute information different from that of the noun or a phrase having no attribute information is determined, and a phrase candidate having the same attribute information as the noun can be called.
つぎに、図10を参照する。
予測変換処理でも、まず属性メモリ18における情報の保存の有無をチェックする(ステップS201)。属性情報が保存されている場合(ステップS201が「YES」)には、ステップS202に進み、読み文字列により変換用辞書16を検索して、当該読み文字列に前方一致する語句を、保存中の属性情報を有するものから優先して抽出する。
Reference is now made to FIG.
Even in the predictive conversion process, first, it is checked whether information is stored in the attribute memory 18 (step S201). If the attribute information is stored (“YES” in step S201), the process proceeds to step S202, the
属性メモリ18に属性情報が保存されていない場合(ステップS201が「NO」)には、ステップS203に進み、属性情報の有無や種別に関わらずに、読み文字列に前方一致する語句を、読み文字列への一致度および優先度の高い順に抽出する。 If the attribute information is not stored in the attribute memory 18 ("NO" in step S201), the process proceeds to step S203, and a word that matches the reading character string in front is read regardless of the presence or type of attribute information. Extracted in descending order of match and priority to character string.
なお、ステップS202においても、保存中の属性情報を有する語句が所定数以下または存在しない場合には、属性情報が設定されていない語句で読み文字列に前方一致するものを、優先度の高い順に抽出する。 Even in step S202, if there are a predetermined number or less of words / phrases having attribute information being stored, words that have no attribute information set and that match the reading character string in front are sorted in descending order of priority. Extract.
また、ステップS202,S203ともに、読み文字列との前方一致検索により動詞や形容詞などの活用語の終止形を抽出した場合には、その一致の範囲を維持して終止形の語尾を変化させることにより、複数の変換候補の文字列を生成する。図6(3)に示した候補リストは、この機能が適用されたステップS202によって呼び出されたものである。 In both steps S202 and S203, when the final form of a usage word such as a verb or adjective is extracted by a forward matching search with the reading character string, the final form of the final form is changed while maintaining the range of the matching. Thus, a plurality of conversion candidate character strings are generated. The candidate list shown in FIG. 6 (3) is called in step S202 to which this function is applied.
つぎに、図11を参照して、連文節変換が行われることを前提として仮名漢字変換処理の詳細手順を説明する。
まず最初のステップS301では、あらかじめ登録されているルールに基づき、読み文字列を複数の文節に切り分けた後、先頭の文節に対する候補を抽出する処理に進む。
Next, with reference to FIG. 11, a detailed procedure of kana-kanji conversion processing will be described on the assumption that continuous phrase conversion is performed.
First, in step S301, after the reading character string is cut into a plurality of phrases based on rules registered in advance, the process proceeds to a process of extracting candidates for the first phrase.
この候補抽出処理では、属性メモリ18における属性情報の保存の有無をチェックし(ステップS302)、属性情報が保存されている場合(ステップS302が「YES」)には、変換用辞書16から、先頭の文節に適合する語句を、保存中の属性情報を有するものから優先して抽出する。一方、属性メモリ18に属性情報が保存されていない場合(ステップS311が「YES」)には、先頭の文節に適合する語句を優先度の高い順に抽出する。
In this candidate extraction process, it is checked whether or not the attribute information is stored in the attribute memory 18 (step S302). If the attribute information is stored (step S302 is “YES”), the
なお、ステップS303,S304、および後記するステップS310,S311における「先頭の文節に適合する語句」とは、通常は、読み文字列が一致する語句を意味するが、動詞や形容詞などの語尾が変化する語句については、先頭の文節に対して語幹部分の読み文字列が一致する語句も「先頭の文節に適合する語句」に入れる。後者の語句については、先頭の文節の読み文字列に対する一致範囲を残して語尾を変化させることにより、読み文字列が一致する候補を生成する。 Note that “words that match the first phrase” in steps S303 and S304 and later-described steps S310 and S311 usually mean words that match the reading character string, but the endings of verbs and adjectives change. As for the phrase to be used, the phrase whose reading character string in the stem portion matches the first phrase is also included in the “term that matches the first phrase”. For the latter phrase, candidates for matching the reading character string are generated by changing the endings while leaving the matching range for the reading character string of the first phrase.
先頭の文節に対する候補抽出処理では、抽出された候補の中の第1候補が仮確定される。ステップ305では、この第1候補に属性情報を有する名詞が含まれるかどうかをチェックする。属性情報を有する名詞が含まれる場合には、ステップS306において、その属性情報を属性メモリ18に保存する。
In the candidate extraction process for the first phrase, the first candidate among the extracted candidates is provisionally determined. In step 305, it is checked whether or not a noun having attribute information is included in the first candidate. If a noun having attribute information is included, the attribute information is stored in the
以下、第2文節以下の各文節に順に着目して、着目中の文節に対する候補抽出処理を実施する(ステップS307〜S313)。この場合にも、属性メモリ18における属性情報の有無をチェックし(ステップS309)、属性情報が保存されている場合には、着目中の文節に適合する語句を、保存中の属性情報を有するものから優先して抽出し(ステップS309が「YES」でステップS310を実施。)、属性が保存されていない場合には、属性情報の有無や種別に関わらずに、着目中の文節に適合する語句を優先度の高い順に抽出する(ステップS309が「NO」でステップS311を実施。)。
Hereinafter, candidate extraction processing for the currently focused phrase is performed by paying attention to each phrase below the second phrase (steps S307 to S313). Also in this case, the presence or absence of attribute information in the
また、第2文節以下に対する処理でも、属性情報が設定された名詞を含む文字列が第1候補として抽出された場合(ステップS312が「YES」)には、ステップS313において属性メモリ18に属性情報を保存する。
Also, in the process for the second phrase and below, if a character string including a noun for which attribute information is set is extracted as the first candidate (“YES” in step S312), the attribute information is stored in the
なお、ステップS313および先のステップS306においても、既に属性メモリ18に他の属性情報が保存されている場合には、上書き保存により前の属性情報が消去される。またステップS303やS310では、保存中の属性情報を有する語句のほか、属性情報が設定されていない語句が所定数抽出される。
Note that also in step S313 and the previous step S306, when other attribute information is already stored in the
全ての文節に対する処理が終了すると、ステップS307が「NO」となってステップS314に進み、文節毎の第1候補を連結することにより変換後の文字列を仮確定し、しかる後に処理を終了する。 When the processing for all the phrases is completed, step S307 becomes “NO”, and the process proceeds to step S314. By concatenating the first candidates for each phrase, the converted character string is provisionally determined, and then the process is terminated. .
上記の仮名漢字変換処理によれば、属性情報を有する名詞を含む連文節が変換対象となる場合でも、当該名詞より後の文節に対して、名詞と同じ属性情報を有する語句を第1候補として抽出することができる。よって、図7に示した事例のように属性情報を有する名詞が先頭の文節に位置する場合に限らず、2番目以降の文節に属性情報を有する名詞が位置する文字列(たとえば「かわいい/服を/着る」)や、名詞と同じ属性情報を持つ語句が名詞から離れた構成の文字列(たとえば「服を/たくさん/買った」)を変換対象とする場合でも、一連の読み文字列からの一括変換が可能である。 According to the kana-kanji conversion process described above, even when a continuous phrase including a noun having attribute information is to be converted, a phrase having the same attribute information as the noun is extracted as the first candidate for the phrase after the noun. can do. Therefore, not only in the case where the noun having attribute information is located in the first phrase as in the example shown in FIG. 7, the character string (for example, “Cute / Clothing” in which the noun having attribute information is located in the second and subsequent phrases is used. ) /, And even if a word string with the same attribute information as the noun is separated from the noun (for example, “clothes / many / bought”), Can be batch converted.
図11には示していないが、上記の仮名漢字変換の終了後に、一部の文節に対する変換結果を修正する操作が行われ、それに伴い、後続の文節が再度変換される場合もある。その場合にも、図11に準じた手順による処理を実施することができる。 Although not shown in FIG. 11, after the above-described kana-kanji conversion is completed, an operation for correcting the conversion result for some phrases is performed, and the subsequent phrases may be converted again accordingly. Even in that case, the processing according to the procedure according to FIG. 11 can be performed.
また、長い読み文字列が入力された場合の予測変換処理においても、図11と同様の手法による連文節変換を実施することができる。 Also, in the predictive conversion process when a long reading character string is input, continuous phrase conversion can be performed by the same method as in FIG.
上記したように、本実施例による文字入力システム1では、属性情報を有する名詞が確定または仮確定されたことに応じてその属性情報を属性メモリ18に保存し、以後の候補抽出処理において、保存されている属性情報を有する語句を優先して抽出する。
保存された属性情報は、当該属性情報が設定されている語句がユーザにより選択されて確定されたことに応じて消去されるほか、属性情報を有する別の名詞が抽出されてその属性情報が保存されたとき(図9のステップS105,図11のステップS306,S313)にも消去される。したがって、あるカテゴリに関する話題を示す文が入力された後に別のカテゴリに話題が移った場合に、前の話題に関する概念の語句が抽出されるのを防ぐことができ、ユーザが必要とする語句をより高い確度で候補として呼び出すことが可能になる。
As described above, in the character input system 1 according to this embodiment, the attribute information is stored in the
The stored attribute information is deleted in response to the user selecting and confirming the word / phrase in which the attribute information is set, and another noun having the attribute information is extracted and stored. Is deleted (step S105 in FIG. 9, steps S306 and S313 in FIG. 11). Therefore, when a topic moves to another category after a sentence indicating a topic related to a certain category is input, it is possible to prevent a concept word related to the previous topic from being extracted and It becomes possible to call as a candidate with higher accuracy.
上記の文字入力システム1は、出荷前の情報端末装置にシステム全体を構成するプログラムを組み込むことにより設定されるほか、既存の文字入力システムを有する情報端末装置にも、候補抽出部14,変換用辞書16,繋がり予測辞書17などのアップデート用のプログラムを組み込むことによって設定することができる。
The character input system 1 is set by incorporating a program that constitutes the entire system into an information terminal device before shipment. In addition, the
また、このプログラムは、スマートフォンやタブレット端末などのタッチパネルディスプレイを備えた情報端末装置に限らず、従来型の携帯電話のような機械式の操作部を有する情報端末装置にも導入可能である。 Moreover, this program can be introduced not only in an information terminal device having a touch panel display such as a smartphone or a tablet terminal but also in an information terminal device having a mechanical operation unit such as a conventional mobile phone.
1 文字入力システム
2 タッチパネルディスプレイ
11 キーボード処理部
12 表示処理部
13 読み文字列組立処理部
14 候補抽出部
15 確定処理部
16 変換用辞書
17 繋がり予測辞書
18 属性メモリ
20 ソフトウェアキーボード
24 文字入力欄
25 候補表示欄
100 文字入力装置
DESCRIPTION OF SYMBOLS 1
Claims (6)
複数の名詞がそれぞれの上位概念に基づき複数のカテゴリに分類されると共に、分類された各名詞および各カテゴリに関連する各種の語句にそれぞれ分類されたカテゴリまたは関連するカテゴリを示す属性情報が紐付けられて登録された構成の前記辞書部を前記コンピュータに設定するためのプログラムが含まれており、
前記候補抽出手段は、前記属性情報が紐付けられた名詞を含む文字列が入力文字列として設定されたことに応じて当該名詞の属性情報を一時的に保存する属性情報保存手段を具備すると共に、この手段に属性情報が保存されている状態下での辞書部に対する検索において、当該保存されている属性情報に紐付けられている語句を優先して抽出し、
前記候補表示手段が前記候補抽出手段によって抽出された語句を表示している状態で、前記読み文字列入力手段が読み文字列の入力を受け付けた場合、前記候補抽出手段は、前記候補表示手段が表示している語句のうち、前記読み文字列入力手段が受け付けた前記読み文字列に前方一致する語句を抽出するとともに、当該抽出した語句に終止形の活用語が含まれている場合、当該活用語の終止形以外の活用形に係る語句を入力候補に加えることを特徴とする文字入力用のプログラム。 A computer to which an operation unit and a display unit are connected, a dictionary unit in which a combination of a read character string and a written character string for each of a plurality of phrases is registered, and a read character string input that receives input of the read character string from the operation unit Means, candidate extraction means for searching the dictionary portion with the input reading character string or the confirmed character string, and extracting a predetermined number of written character strings as input candidates, and the input candidates extracted by the candidate extraction means A candidate display means for displaying the character string on the display unit, and confirming the candidate character string selected according to the candidate selection operation on the operation unit as an input character string to the application running on the computer A program for functioning as a character input system comprising:
Multiple nouns are classified into multiple categories based on their superordinate concepts, and attribute information indicating categories or related categories is associated with each classified noun and various words related to each category. A program for setting the dictionary portion of the registered configuration in the computer is included,
The candidate extracting unit includes an attribute information storage unit that temporarily stores the attribute information of the noun in response to a character string including the noun associated with the attribute information being set as an input character string. in the search for a dictionary unit under a state where the attribute information is stored in this unit, extracting phrases that are linked to the attribute information that is the stored priority,
In the state where the candidate display means displays the words extracted by the candidate extraction means, when the reading character string input means accepts input of a reading character string, the candidate extraction means Among the displayed words and phrases, the words that match forward with the reading character string received by the reading character string input means are extracted, and if the extracted word or phrase includes a closing use word, the use A program for character input, characterized in that a phrase related to a utilization form other than the word end form is added to an input candidate .
前記候補抽出手段は、前記確定手段により直前に確定された文字列により前記辞書部を検索してその確定文字列に繋がりを持つ語句の表記文字列を次の入力候補として抽出する繋がり予測処理を実施する機能を具備し、前記属性情報保存手段に属性情報が保存されている状態下で前記繋がり予測処理を実施する場合には、前記直前に確定した文字列に繋がりを持つ語句の中の前記属性情報保存手段に保存されている属性情報に紐付けられている語句の表記文字列を優先して抽出する、請求項1に記載された文字入力用のプログラム。The candidate extraction unit searches for the dictionary part using the character string that was determined immediately before by the determination unit, and performs a connection prediction process that extracts a notation character string of a phrase that is connected to the determined character string as the next input candidate. In the case where the connection prediction process is performed in a state in which attribute information is stored in the attribute information storage unit, the function in the attribute information storage unit, the word in the phrase having a connection to the character string determined immediately before The program for character input according to claim 1, wherein the notation character string associated with the attribute information stored in the attribute information storage unit is preferentially extracted.
前記連文節変換を実施する前記候補抽出手段は、読み文字列内のいずれかの文節に対する検索により前記属性情報に紐付けられた名詞を含む表記文字列が候補として抽出されたとき、その属性情報を前記属性情報保存手段に保存すると共に、当該文節より後の文節に対する検索において前記保存された属性情報に紐付けられている語句を優先して抽出する、請求項1または2に記載された文字入力用のプログラム。 The candidate extraction unit searches the dictionary unit by dividing the reading character string into phrases in response to the input of the reading character string having a length corresponding to a plurality of phrases. And a continuous phrase conversion function for setting, as a conversion candidate, a character string obtained by connecting the extracted character strings extracted for each phrase,
The candidate extracting means for performing the continuous phrase conversion, when a notation character string including a noun linked to the attribute information is extracted as a candidate by searching for any phrase in the reading character string, the attribute information is while stored in the attribute information storage unit, the extracted preferentially phrase tied to the stored attribute information in the search for clauses after the phrase, character input according to claim 1 or 2 Program.
請求項1〜4のいずれかに記載された文字入力用のプログラム。 The candidate extracting means includes the attribute information storage means in response to a notation character string of a phrase linked to attribute information stored in the attribute information storage means being confirmed as an input character string by the confirmation means. Delete attribute information stored in
The program for character input described in any one of Claims 1-4 .
前記辞書部では、複数の名詞がそれぞれの上位概念に基づき複数のカテゴリに分類されると共に、分類された各名詞および各カテゴリに関連する各種の語句にそれぞれ分類されたカテゴリまたは関連するカテゴリを示す属性情報が紐付けられて登録され、
前記候補抽出手段は、前記属性情報が紐付けられた名詞を含む文字列が入力文字列として設定されたことに応じて当該名詞の属性情報を一時的に保存する属性情報保存手段を具備すると共に、この手段に属性情報が保存されている状態下での辞書部に対する検索において、当該保存されている属性情報に紐付けられている語句を優先して抽出し、
前記候補表示手段が前記候補抽出手段によって抽出された語句を表示している状態で、前記読み文字列入力手段が読み文字列の入力を受け付けた場合、前記候補抽出手段は、前記候補表示手段が表示している語句のうち、前記読み文字列入力手段が受け付けた前記読み文字列に前方一致する語句を抽出するとともに、当該抽出した語句に終止形の活用語が含まれている場合、当該活用語の終止形以外の活用形に係る語句を入力候補に加えることを特徴とする文字入力装置。 A casing having an operation unit and a display unit, and a control unit incorporated in the casing, and a combination of reading character strings and notation character strings for each of a plurality of words / phrases are registered in the control unit. A dictionary part, a reading character string input means for accepting input of a reading character string from the operation part, and searching the dictionary part by the inputted reading character string or a confirmed character string and inputting a predetermined number of written character strings Candidate extraction means for extracting as candidates, candidate display means for displaying the character strings of the input candidates extracted by the candidate extraction means on the display section, and candidates selected according to the candidate selection operation in the operation section A character input device provided with a confirmation means for confirming a character string as an input character string,
In the dictionary unit, a plurality of nouns are classified into a plurality of categories based on the respective superordinate concepts, and each classified noun and various categories related to each category are respectively classified into categories or related categories. Attribute information is linked and registered,
The candidate extracting unit includes an attribute information storage unit that temporarily stores the attribute information of the noun in response to a character string including the noun associated with the attribute information being set as an input character string. in the search for a dictionary unit under a state where the attribute information is stored in this unit, extracting phrases that are linked to the attribute information that is the stored priority,
In the state where the candidate display means displays the words extracted by the candidate extraction means, when the reading character string input means accepts input of a reading character string, the candidate extraction means Among the displayed words and phrases, the words that match forward with the reading character string received by the reading character string input means are extracted, and if the extracted word or phrase includes a closing use word, the use A character input device characterized by adding a phrase related to a utilization form other than a word termination form to an input candidate .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013053273A JP6221275B2 (en) | 2013-03-15 | 2013-03-15 | Character input program and character input device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013053273A JP6221275B2 (en) | 2013-03-15 | 2013-03-15 | Character input program and character input device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014178953A JP2014178953A (en) | 2014-09-25 |
JP6221275B2 true JP6221275B2 (en) | 2017-11-01 |
Family
ID=51698818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013053273A Active JP6221275B2 (en) | 2013-03-15 | 2013-03-15 | Character input program and character input device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6221275B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6459640B2 (en) | 2015-03-03 | 2019-01-30 | オムロン株式会社 | Program and information processing apparatus for character input system |
WO2018190128A1 (en) * | 2017-04-11 | 2018-10-18 | ソニー株式会社 | Information processing device and information processing method |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04256162A (en) * | 1991-02-08 | 1992-09-10 | Sharp Corp | Word processor with learning function |
JPH09128387A (en) * | 1995-11-01 | 1997-05-16 | Toshiba Corp | Method for predicting input character and device using the same |
JP2000187661A (en) * | 1998-12-22 | 2000-07-04 | Sharp Corp | Character string inputting device and its method and recording medium for recording character string input program |
JP3867775B2 (en) * | 2001-11-01 | 2007-01-10 | 日本電気株式会社 | Sentence creation device by word input |
JP5481095B2 (en) * | 2009-05-12 | 2014-04-23 | 株式会社エヌ・ティ・ティ・データ | Character string input device, character string input method, and program |
-
2013
- 2013-03-15 JP JP2013053273A patent/JP6221275B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014178953A (en) | 2014-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10809914B2 (en) | System and method for inputting text into electronic devices | |
US9026428B2 (en) | Text/character input system, such as for use with touch screens on mobile phones | |
EP2286350B1 (en) | Systems and methods for an automated personalized dictionary generator for portable devices | |
US9460066B2 (en) | Systems and methods for character correction in communication devices | |
US7477165B2 (en) | Handheld electronic device and method for learning contextual data during disambiguation of text input | |
US20170076181A1 (en) | Converting text strings into number strings, such as via a touchscreen input | |
KR20130122584A (en) | Techniques for assisting a user in the textual input of names of entities to a user device in multiple different languages | |
JP6031764B2 (en) | CHARACTER INPUT PROGRAM, INFORMATION PROCESSING DEVICE, AND CHARACTER INPUT OPERATION SETTING METHOD | |
US20140067731A1 (en) | Multi-dimensional information entry prediction | |
US8612210B2 (en) | Handheld electronic device and method for employing contextual data for disambiguation of text input | |
KR101130206B1 (en) | Method, apparatus and computer program product for providing an input order independent character input mechanism | |
JP6221275B2 (en) | Character input program and character input device | |
US20130073572A1 (en) | Method of learning character segments from received text, and associated handheld electronic device | |
CN117313675A (en) | Text modification method, apparatus, computer device and computer readable storage medium | |
JP2009140152A (en) | Character input device and character-character type selection method | |
JPH07334499A (en) | Input device for character string | |
JP4487614B2 (en) | Information display control device and program | |
JP6048601B2 (en) | Information display device, program, and word information display method | |
JP2008117310A (en) | Dictionary retrieval device and dictionary retrieval processing program | |
JP5573257B2 (en) | Character input program and communication terminal device | |
JP2013134730A (en) | Character-inputting program and information processor | |
JP5891706B2 (en) | Information display device and program | |
KR20190084865A (en) | Sentence prediction input system | |
CN109597497B (en) | Information prediction method, device and equipment | |
US20080189327A1 (en) | Handheld Electronic Device and Associated Method for Obtaining New Language Objects for Use by a Disambiguation Routine on the Device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151106 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20160603 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6221275 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |