JP2004118741A - Curtailed word formation supporting device and curtailed word formation supporting program - Google Patents
Curtailed word formation supporting device and curtailed word formation supporting program Download PDFInfo
- Publication number
- JP2004118741A JP2004118741A JP2002284332A JP2002284332A JP2004118741A JP 2004118741 A JP2004118741 A JP 2004118741A JP 2002284332 A JP2002284332 A JP 2002284332A JP 2002284332 A JP2002284332 A JP 2002284332A JP 2004118741 A JP2004118741 A JP 2004118741A
- Authority
- JP
- Japan
- Prior art keywords
- word
- candidate
- abbreviation
- abbreviated
- shortened
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、電子カタログ辞書の作成に当り、上記の電子カタログ辞書に含まれる語句に関する短縮語の作成を支援するための短縮語作成支援装置および短縮語作成支援プログラムに関する。
【0002】
【従来の技術】
コンピュータネットワークを用いて製品の情報を提供するようにしたシステムとして、電子カタログシステムがある。そして、インターネット上で製品情報を電子的に提供するための電子カタログシステムを構築するための国際規格として、“ISO13548(Parts Library)”が制定されている。この“ISO13548”では電子カタログを、辞書とコンテンツで構成し、これらを統一したデータ構造を与えることで、製品情報の共有・再利用を目指している。
【0003】
“ISO13548”で定義している辞書では、概念階層としてツリー上に表現された製品分類と、その製品分類の属する技術属性(諸元項目)とが主要な構成要素となっている。そして製品分類や諸元項目を定義するための名称には、短縮名称が対応付けられる。
【0004】
短縮名称は、製品分類や諸元項目を定義するための名称の全てについて広くコンセンサスが得られているような語句が存在している訳では無いので、辞書の作成作業においてその作業者が適切な短縮名称を考えなければならなかった。
【0005】
なお、製品分類の短縮名称を生成する方法としては、特許文献1のものが知られている。
【0006】
また、一般的な文字データの短縮方法として、略語辞書を用いた変換し文字数制限内に収める方法(例えば特許文献2を参照)や、略語生成規則による生成手法(例えば特許文献3を参照)などが知られている。
【0007】
【特許文献1】
特開2000−11178号公報
【0008】
【特許文献2】
特開2002−7104号公報
【0009】
【特許文献3】
特開平11−25117号公報
【0010】
【発明が解決しようとする課題】
以上のように従来は、短縮名称の作成を辞書作成の作業者が行っていたため、そのために多くの工数を必要としていた。
【0011】
特許文献1の技術を用いれば、辞書作成の作業者の負担を軽減することが可能である。しかしながら、特許文献1の技術は、短縮名称の作成は製品分類における概念階層の情報に基づいているため、そのような情報を有しない諸元項目の短縮名称を生成することはできなかった。
【0012】
また、特許文献2の技術は、予め登録されている略称データヘの文字列置換による手法であるため、該当する略称データがない場合は、都度略称データを入力していくことが必要となり、電子カタログの辞書開発においては十分な効果をあげることが困難である。
【0013】
また、特許文献3の技術は、文字列の分割、文字切り出し規則および切り出した文字の結合により略語を生成する手法であるが、個人が文章を効率的に検索するための手法であり、文字切り出し規則の表現力に柔軟性が不足している。このため、不特定多数が使用する標準的な短縮名称として、元の名称の意味を想像できるような短縮名称を生成することが困難であるため、電子カタログの辞書としての短縮名称の作成には適さない手法である。
【0014】
そこで本発明はこのような事情を考慮してなされたものであり、その目的とするところは、辞書の情報として不特定多数が使用するのに適し、広くコンセンサスを得ることが可能な短縮語を容易に作成することを可能とすることにある。
【0015】
【課題を解決するための手段】
以上の目的を達成するために本発明は、短縮語作成の対象となる語句に関して電子カタログ辞書に示された情報に基づきそれぞれ異なる方法で前記短縮語としての候補文字列を生成する複数の候補生成手段を備え、短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報と予め定められたルールとに基づいて前記複数の候補生成手段のうちの少なくとも1つを選択手段により選択し、この選択された候補生成手段により生成された候補文字列を前記短縮語の候補として候補選定手段が選定することとした。
【0016】
このような手段を講じたことにより、それぞれ異なる方法で前記短縮語としての候補文字列を生成する複数の候補生成手段のうちの少なくとも1つが、短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報と予め定められたルールとに基づいて有効とされ、その有効とされた候補生成手段により生成された候補文字列が短縮語の候補として選定される。従って、複数の方法が適宜使用されて短縮語の候補文字列の生成が行われる。
【0017】
【発明の実施の形態】
以下、図面を参照して本発明の一実施形態につき説明する。
【0018】
図1は本実施形態に係る電子カタログ辞書作成装置のブロック図である。なおこの電子カタログ辞書作成装置は、IS01584標準の辞書データの定義において、IS01584標準の要件である短縮名称(SHORTNAME)の作成を支援するものであり。
【0019】
この図1に示すように電子カタログ辞書作成装置は、プロセッサ1、メインメモリ2、ハードディスク装置3、CD−ROMドライブ4、キーボード/マウス5およびディスプレイ6を有している。そしてこれらの各部は、バス7を介して互いに接続されている。
【0020】
プロセッサ1は、ハードディスク装置3に格納されているプログラムに従ってソフトウェア処理を実行することで各種の制御処理を行う。
【0021】
メインメモリ2は、プロセッサ1が実際に使用するソフトウェアやその他のデータを一時的に記憶しておく。
【0022】
ハードディスク装置3は、プロセッサ1が使用するオペレーティングシステム用のプログラムを格納する。ハードディスク装置3は、オペレーティングシステム用のプログラムの他に、アプリケーションプログラムやドライバプログラム、あるいはその他の任意のデータを格納する。またハードディスク装置3には、短縮名称作成支援プログラム3aが格納される。短縮名称作成支援プログラム3aは、電子カタログ辞書に登録するための短縮名称の作成支援のための後述する処理をプロセッサ1に実行させる。
【0023】
CD−ROMドライブ4は、CD−ROMメディアMからのデータの読み出しを行う。
【0024】
キーボード/マウス5は、ユーザによる各種の指示入力を受け付ける。
【0025】
ディスプレイ6は、ユーザに対する各種の情報通知のための画像表示を行う。
【0026】
ところで電子カタログ辞書作成装置としては、例えば汎用のパーソナルコンピュータが用いられる。従って、当初は短縮名称作成支援プログラム3aはインストールされていない。そこで、当該情報処理システムの導入作業の一環として、CD−ROMメディアMに格納されている短縮名称作成支援プログラム3aをハードディスク装置3へとインストールする。
【0027】
ここで短縮名称作成支援プログラム3aは、プロセッサ1を図2に示すような各処理部として動作させる。
【0028】
図2はプロセッサ1が短縮名称作成支援プログラム3aに基づいて実現する処理部の関係を示すブロック図である。なお図2には併せて、各処理部が参照するためにメインメモリ2およびハードディスク装置3に格納される各種のデータも示している。
【0029】
この図2に示すようにプロセッサ1は、辞書データ読込み部11、短縮名称生成パタン判定部12、生成処理制御部13、基本略語置換処理部14、略称生成処理部15、他定義選択処理部16および短縮名称登録部17のそれぞれとして動作する。また辞書データ21、生成パタン判定ルール22、制約条件設定データ23、略称候補生成条件データ24、基本略語データ25、形態素解析用辞書26、略称生成ルール設定データ27および略称候補リスト28がそれぞれ用意される。
【0030】
辞書データ読込み部11は、辞書データ21から短縮名称の作成の対象となる辞書要素を読み込む。
【0031】
短縮名称生成パタン判定部12は、上記読み込まれた辞書要素に含まれる情報と生成パタン判定ルール22とに基づいて実行すべき処理内容のリストを決定する。なお、ここで決定する処理内容リストは、基本略語置換処理部14、略称生成処理部15および他定義選択処理部16のうちで略称候補の生成のために使用するべきものを示す。
【0032】
生成処理制御部13は、基本略語置換処理部14、略称生成処理部15および他定義選択処理部16のうちで上記処理内容リストに示された処理部に略称候補の作成処理を実行させる。生成処理制御部13は、制約条件設定データ23に示された条件に合致する略称候補を作成するべく基本略語置換処理部14、略称生成処理部15および他定義選択処理部16を制御する。
【0033】
基本略語置換処理部14は、略称の元となる文字列を略称候補生成条件データ24に示された条件下で基本略語データ25により置換することにより略称候補を生成する。基本略語置換処理部14は、生成した略称候補を略称候補リスト28に追加する。
【0034】
略称生成処理部15は、略称の元となる文字列の構文を形態素解析用辞書26を参照して解析し、この解析結果と略称生成ルール設定データに示されたルールとに基づいて略称候補を生成する。略称生成処理部15は、生成した略称候補を略称候補リスト28に追加する。
【0035】
他定義選択処理部16は、略称の元となる文字列とは異なる言語で同一の対象を示した語句に対して定められた略称を略称候補として選択する。他定義選択処理部16は、生成した略称候補を略称候補リスト28に追加する。
【0036】
短縮名称登録部17は、略称候補リスト28に記憶されている略称候補のうちから略称を確定し、これを辞書データ21に登録する。
【0037】
次に以上のように構成された電子カタログ辞書作成装置の動作につき説明する。
図3は本実施形態におけるプロセッサ1による全体の処理アルゴリズムを示すフローチャートである。
プロセッサ1はまず辞書データ読込み部11の機能としてステップST1−1において、辞書データ21から短縮名称の作成の対象となる辞書要素Eを読み込む。
【0038】
図4は辞書データ21のデータ構造を示す図である。
本実施形態では辞書データ21は表形式データとして表現しており、1つの辞書要素を1つの行として表現されている。辞書要素は、CODEフィールド21a、PREFNAME.ENフィールド21b、PREFNAME.JAフィールド21c、SHORTNAME.ENフィールド21d、SHORTNAME.JAフィールド21eおよびData Typeフィールド21fの各フィールドを含んでいる。なお、辞書要素の各フィールドはIS01584で規定された要件から構成されるが、図4では本発明の説明のために必要な部分を抜粋して示している。CODEフィールド21aには、辞書要素の識別子であるCODEが示される。PREFNAME.ENフィールド21bには、英語の名称を記述するPREFNAME.ENが示される。PREFNAME.JAフィールド21cには、日本語の名称を記述するPREFNAME.JAが示される。SHORTNAME.ENフィールド21dには、英語の略称を記述するSHORTNAME.ENが示される。SHORTNAME.JAフィールド21eには、日本語の略称を記述するSHORTNAME.JAが示される。Data Typeフィールド21fには、辞書要素の書式を規定するData Typeが示される。
【0039】
例えば図4における行R1では、CODEが「EEE001」である辞書要素のPREFNAME.ENが「Maximum Operational Rated Voltage」であり、PREFNAME.ENが「最大定格使用電圧」であることを示す。またSHORTNAME.ENおよびSHORTNAME.JAがいずれも未登録であることを示す。さらにData Typeが「Real」すなわち実数型であることを示す。
【0040】
続いてプロセッサ1は短縮名称生成パタン判定部12の機能としてステップST1−2において、上記辞書要素Eに含まれる情報と生成パタン判定ルール22とに基づいて短縮名称生成パタンを判定し、さらに実行すべき処理内容のリストを決定する。
【0041】
図5は生成パタン判定ルール22のデータ構造を示す図である。
生成パタン判定ルール22は、判定条件フィールド22aおよび生成処理フィールド22bより構成されている。判定条件フィールド22aには、生成の処理となる辞書要素に関する判定条件が記述されている。ここでは判定条件は、処理対象となる辞書要素のSHORTNAME.ENフィールド21dのデータの有無、SHORTNAME.JAフィールド21eのデータの有無、ならびにData Typeフィールド21fの値により構成されている。生成処理フィールド22bには、各判定条件に合致する辞書要素に関して適用する処理の内容を示している。
【0042】
例えば図5における行R2では、
(SHORTNAME.JA=なし)∧(SHORTNAME.EN=なし)∧(DataType=(Real∨Integer))
なる条件が成立する辞書要素の処理に関しては、SHORTNAME.ENの生成には略語置換処理(PreferredName.EN)および略称生成処理(PreferredName.EN)を適用し、またSHORTNAME.JAの生成には他定義選択処理(SHORTNAME.EN)を適用するというルールが記述されている。
【0043】
こののちにプロセッサ1は生成処理制御部13の機能として、ステップST1−4にて第1ループ処理を開始する。第1ループ処理を開始するとプロセッサ1はステップST1−5において、上記リストアップされた処理内容に応じて、制約条件設定データ23から制約条件を読み込み、処理内容を判定する。
【0044】
図6は制約条件設定データ23のデータ構造を示す図である。制約条件設定データは、生成対象フィールド23a、最大文字列長フィールド23bおよび使用可能文字フィールド23cを含んでいる。生成対象フィールド23aは、生成の対象となるフィードを示す。最大文字列長フィールド23bは、生成する短縮名称の最大文字列の長さを示す。使用可能文字フィールド23cは、使用可能な文字の種類を示す。使用可能文字フィールド23cには、予め複数の文字種類に関するフラグが用意されていて、該当するフラグが「Y」である文字種類が使用可能であることを示す。なお本実施形態では、制約としてIEC61360に規定されている制約条件が記述されている。
【0045】
こののちにプロセッサ1はステップST1−6において、略語置換処理が上記リストアップされた処理内容に含まれているか否かを確認し、もし含まれているならばステップST1−7において基本略語置換処理を実行する。
【0046】
図7は基本略語置換処理における処理アルゴリズムを示すフローチャートである。なおこの基本略語置換処理は、プロセッサ1が基本略語置換処理部14の機能として実行する。
【0047】
基本略語置換処理においてプロセッサ1はまずステップST2−1において、処理対象となっている辞書要素Eから当該処理内容に含まれる処理対象に記述されたフィールドに相当する文字列Xを読込む。
【0048】
次にプロセッサ1はステップST2−2において、略称候補生成条件データ24を読込む。次にプロセッサ1はステップST2−3において、上記読込んだ略称候補生成条件データ24に基づいて文字列Xの部分文字列のうちで基本略語データ25に記述されている単語と一致するものを検索する。
【0049】
図8は略称候補生成条件データ24のデータ構造を示す図である。本実施形態では略称候補生成条件データ24は、マッチング方法フィールド24aおよび仕切り文字フィールド24bとを含む。マッチング方法フィールド24aには、文字列Xと基本略語データ25に格納された単語とのマッチング方法の指定情報が示される。具体的には、使用可能なマッチング方法の一覧と、それらのマッチング方法の使用の可否を示すフラグとが用意されていて、フラグが「Y」とされているマッチング方法が使用するべきものとなる。図8の例では、「左最長一致」なるマッチング方法が使用するべきマッチング方法として指定されていることを示す。そこでステップST2−3においてはプロセッサ1は、このように指定されているマッチング方法にて検索を行う。
【0050】
図9は基本略語データ25のデータ構造を示す図である。基本略語データ25は、単語フィールド25aと略語フィールド25bとを含んでいる。単語フィールド25aは、検索のための見出しとなる単語を示す。略語フィールド25bは、対応する単語フィールド25aに示された単語に対応する略語を示す。なお、基本略語データ25としては、既存の規格等を利用すればよく、技術属性の文字シンボルの規格であるIEC60027、IEC60747、IEC60748等を略語のフィールドに格納してもよく、これにより基本略語データ25を広くコンセンサスを得られるものとすることができる。
【0051】
そしてプロセッサ1はステップST2−4において、一致する単語が見つかったか否かを確認する。
【0052】
もし、一致する単語が見つかった場合にプロセッサ1はステップST2−5において、文字列Xから検索された部分文字列を、それに一致した単語に対する略語に略称候補生成条件データ24で指定された仕切り文字を加えたもので置換した文字列で置換してなる文字列X’を生成する。
【0053】
図8に示すように略称候補生成条件データ24には、使用可能な仕切り文字の一覧と、それらの仕切り文字の使用の可否を示すフラグとが用意されていて、フラグが「Y」とされている仕切り文字が使用するべきものとなる。図8の例では、「−」なる文字が仕切り文字として指定されていることを示す。
【0054】
続いてプロセッサ1はステップST2−6において、上記の文字列X’が制約条件設定データ23た示す制約を満たしているか否かを確認する。そして制約を満たしていることを確認した場合にプロセッサ1はステップST2−7において、文字列X’を略称候補リスト28に加える。このように略称候補を略称候補リスト28に加えた場合、あるいは制約を満たしていないことをステップST2−6にて確認した場合にプロセッサ1は、ステップST2−8において文字列X’を文字列Xとし、この上でステップST2−3以降の処理を繰り返す。
【0055】
さて、一致する単語が見つからなかったことをステップST2−4にて確認した場合にはプロセッサ1はステップST2−9において、文字列Xが制約条件設定データ23が示す制約を満たしているか否かを確認する。そして制約を満たしていることを確認した場合にプロセッサ1はステップST2−10において、文字列Xを略称候補として略称候補リスト28に加える。このように略称候補を略称候補リスト28に加えた場合、あるいは制約を満たしていないことをステップST2−9にて確認した場合にプロセッサ1は基本略語置換処理を終了する。
【0056】
このように基本略語置換処理を終了したならばプロセッサ1は、図3におけるステップST1−8において、ステップST1−3にてリストアップされた処理内容に略称生成処理が含まれているか否かを確認する。なお、リストアップされた処理内容に略語置換処理が含まれていないことをステップST1−6にて確認した場合にプロセッサ1は、ステップST1−7における基本略語置換処理を行うことなしに上記ステップST1−8における確認を行う。そして、略称生成処理が含まれていることを確認したならばプロセッサ1はステップST1−9において、略称生成処理を実行する。
【0057】
図10は略称生成処理における処理アルゴリズムを示すフローチャートである。なおこの略称生成処理は、プロセッサ1が略称生成処理部15の機能として実行する。
【0058】
プロセッサ1はまずステップST3−1において、ユーザからの入力に応じて略称生成ルールを設定し、略称生成ルール設定データ27として格納する。
【0059】
図11は略称生成ルール設定データ27のデータ構造を示す図である。略称生成ルール設定データ27は、単語の省略方法の設定情報27aおよび文字連結を行う際の仕切り文字の設定情報27bで構成されている。
【0060】
省略方法は、主語を対象とする場合と修飾語を対象とする場合とで別々の設定が可能となっており、それぞれに関して適用可能な処理方法の一覧と、それらの処理方法の使用の可否を示すフラグとが用意されていて、フラグが「Y」とされている処理方法が使用するべきものとなる。
【0061】
なお本実施形態では、以下の4つ省略方法を具備している。
【0062】
▲1▼各形態素の先頭からn文字までを抽出。
【0063】
▲2▼各形態素の先頭からn文字に末尾の文字を連結したものを抽出。
【0064】
▲3▼各形態素の母音(先頭は除く)を省略したものを抽出。
【0065】
▲4▼形態素全体を抽出(=無処理)。
【0066】
また仕切り文字は、修飾語−主語間の場合と修飾語間の場合とで別々の設定が可能となっており、それぞれに関して適用可能な仕切り文字の一覧と、それらの仕切り文字の使用の可否を示すフラグとが用意されていて、フラグが「Y」とされている仕切り文字が使用するべきものとなる。
【0067】
そこでプロセッサ1はステップST3−1では、いずれの省略方法および仕切り文字を使用するかのユーザ指定を受け付けて、該当するフラグを「Y」とするのである。なお省略方法に関しては、複数の処理を指定することを許容する。例えば、主語にあたる形態素に関しては▲1▼と▲4▼の処理を選択し、かつ修飾語にあたる形態素に関しては▲2▼と▲3▼の処理を選択することができる。また、仕切り文字についても、主語−修飾語間と修飾語間とで仕切り文字をそれぞれユーザが指定することができる。これらにより、より柔軟な略語生成を可能とすることができる。
【0068】
次にプロセッサ1はステップST3−2において、辞書要素Eから当該処理内容に含まれる処理対象に記述されたフィールドに相当する文字列Yを読込む。そしてプロセッサ1はステップST3−3において、形態素解析用辞書26に基づき文字列Yの構文解析を行い、形態素毎に分割した文字列リストL1を生成する。形態素解析については単語の切り出しと単語間の関係解析を行い、文の中の主語にあたる名詞と当該名詞を修飾する修飾語の集合に分けることができれば、既存の構文解析の技術を用いることで実現が可能である。
【0069】
図12は形態素解析用辞書26のデータ構造を示す図である。形態素解析用辞書は単語を記述した文字列のフィールド26a、単語の品詞のフィールド26b、ならびに意味素性のフィールド26cで構成されている。
【0070】
続いてプロセッサ1はステップST3−4にて第1ループ処理を開始する。第1ループ処理を開始するとプロセッサ1はステップST3−5において、上記の文字列リストL1の各要素E1について、略称生成ルール設定データ27により示された略称生成ルールを実行してE1の略称の集合(E2,E3,…En)を生成する。そしてプロセッサ1は、上記の集合(E2,E3,…En)にE1を加えた集合(E1,E2,E3,…En)を要素とするリストL2を生成する。こののち、プロセッサ1はステップST3−6において、文字リストL1の全ての要素についてリストL2の生成が終了したか否かの確認を行い、ここで終了を確認できるまでステップST3−4乃至ステップST3−7の第1ループを繰り返し実行する。
【0071】
全てのリストL2の生成が終了したことをステップST3−6にて確認したならば、プロセッサ1はステップST3−8において、リストL2の要素、すなわち各形態素と生成された1つ以上の略称のリスト同士の可能な組み合わせを要素とする集合uを生成する。
【0072】
次にプロセッサ1はステップST3−9にて第2ループ処理を開始する。第2ループ処理を開始するとプロセッサ1はステップST3−10において、集合uの各要素について、略称生成ルール設定データ27で指定された仕切り文字を介した連結文字列Y’を生成する。さらにプロセッサ1はステップST3−11において、連結文字Y’について制約条件設定データ23の制約を満たしているか否かを確認し、制約を満たしているならば連結文字Y’を略称候補として略称候補リスト28に加える。このように略称候補を略称候補リスト28に加えた場合、あるいは制約を満たしていないことをステップST3−11にて確認した場合にプロセッサ1はステップST3−13において、集合Uの全ての要素についての連結文字列Y’の生成が終了したか否かの確認を行い、ここで終了を確認できるまでステップST3−9乃至ステップST3−14の第2ループを繰り返し実行する。
【0073】
そして集合Uの全ての要素についての連結文字列Y’の生成が終了したことをステップST3−13にて確認したならば、プロセッサ1は略称生成処理を終了する。
【0074】
このように略称生成処理を終了したならばプロセッサ1は、図3におけるステップST1−10において、ステップST1−3にてリストアップされた処理内容に他定義選択処理が含まれているか否かを確認する。なお、リストアップされた処理内容に略称生成処理が含まれていないことをステップST1−8にて確認した場合にプロセッサ1は、ステップST1−9における略称生成処理を行うことなしに上記ステップST1−10における確認を行う。そして、他定義選択処理が含まれていることを確認したならばプロセッサ1はステップST1−11において、他定義選択処理を実行する。
【0075】
図13は他定義選択処理における処理アルゴリズムを示すフローチャートである。なおこの他定義選択処理は、プロセッサ1が他定義選択処理部16の機能として実行する。
【0076】
プロセッサ1はまずステップST4−1において、辞書要素Eから当該処理内容に含まれる処理対象に記述されたフィールドに相当する文字列Sを読込む。次にプロセッサ1はステップST4−2において、上記の文字列Sについて制約条件設定データ23の制約を満たしているか否かを確認し、制約を満たしている場合は文字列Sを略称候補として略称候補リスト28に加える。これにより、例えば日本語の短縮名称として英語の短縮名称を候補に加えるなどのように、ある言語に関して定められた短縮名称を他の言語の短縮名称の候補とすることが可能になる。
【0077】
このように略称候補を略称候補リスト28に加えた場合、あるいは制約を満たしていないことをステップST4−2にて確認した場合にプロセッサ1は、他定義選択処理を終了する。
【0078】
このように他定義選択処理を終了したならばプロセッサ1は、図3におけるステップST1−12において、短縮名称登録処理を実行する。なお、リストアップされた処理内容に他定義選択処理が含まれていないことをステップST1−10にて確認した場合にプロセッサ1は、ステップST1−11における他定義選択処理を行うことなしに上記ステップST1−12に移行し、短縮名称登録処理を実行する。
【0079】
図14は短縮名称登録処理の処理アルゴリズムを示すフローチャートである。なおこの短縮名称登録処理は、プロセッサ1が短縮名称登録部17の機能として実行する。
【0080】
プロセッサ1はまずステップST5−1において、略称候補リスト28を読込む。続いてプロセッサ1はステップST5−2において、略称候補リスト28の表示形態の設定がユーザにより入力されるのを受け付ける。ここで入力を受け付ける設定は、例えば表示順や最大表示数などである。表示順は、アルファベット順、アイウエオ順、あるいは文字列長順などが想定される。また、最大表示数は、候補数が多い場合の表示数の上限である。
【0081】
次にプロセッサ1はステップST5−3において、上記の入力された設定に応じた表示形態で略称候補リスト28の情報を表示する。この上でプロセッサ1はステップST5−4において、表示されたリストの中から略称を選択するか否かのユーザに指定を受け付け、表示されたリストからの選択が指定されたならばステップST5−5において、ユーザ指定に基づいて略称候補リストから略称を1つ選択する。
【0082】
しかし、表示されたリストからの選択がユーザにより拒否されたならば、プロセッサ1はステップST5−6において、略称を手入力するか否かのユーザ指示を受け付け、手入力が指定されたならばステップST5−7において、ユーザによる略称の入力を受け付ける。
【0083】
このようにユーザによる略称の入力を受け付けた後、あるいはステップST5−5にてリストからの略称の指定を受け付けた後にプロセッサ1はステップST5−8において、上記指定された略称を短縮名称として確定し、この短縮名称を生成の対象として指定されていた辞書要素Eの該当出力先に書き込む。そしてプロセッサ1は、これをもって短縮名称登録処理を終了する。
【0084】
なお、ステップST5−6にて手入力がユーザにより拒否された場合には、プロセッサ1は所定をステップST5−2に戻し、表示形態の再設定を受け付けた上で以降の処理を繰り返す。
【0085】
こののち、プロセッサ1はステップST1−13において、ステップST1−3にて生成した処理内容リストの要素のすべてに関する処理が終了したか否かの確認を行い、ここで終了を確認できるまでステップST1−4乃至ステップST1−14の第1ループを繰り返し実行する。
全ての要素に関する処理が終了したことをステップST1−13にて確認したならば、プロセッサ1はこの図3の処理を終了する。
【0086】
以下、具体例を挙げて、上記の処理により略称登録がなされる様子について説明する。
ここでは、図4における行R1の要素を処理対象とする場合を考える。この処理対象となる要素は、SHORTNAME.ENおよびSHORTNAME.JPがいずれも未設定であり、かつData Typeが「Real」であるから、図5における生成パタン判定ルール22では行R2が判定条件に合致することとなる。そこでこの要素に対しては、SHORTNAME.ENに関しては略語置換処理(PreferredName.EN)および略称生成処理(PreferredName.EN)が、またSHORTNAME.JAに関しては他定義選択処理(SHORTNAME.EN)がそれぞれ適用されることになる。また略語置換処理(PreferredName.EN)および略称生成処理(PreferredName.EN)に用いられる原データは、「Maximum Operational Rated Voltage」となる。
【0087】
図15は略語置換処理により略称候補が生成される様子を示す図である。
図15に示すように、文字列「Maximum Operational Rated Voltage」が部分的に徐々に基本略語により置換されて行き、ここでは「Max−Op−V_r」なる文字列が略称候補として略称候補リスト28に追加される。
【0088】
図16は略称生成処理により略称候補が生成される様子を示す図である。
図16に示すように、文字リストL1、リストL2および集合Uがそれぞれ生成され、これらから、「Man−Opl−Rated Vol」や「Man−Opl−Ratd Vol」などの5つの文字列が新たに略称候補として生成され、略称候補リスト28に追加される。
【0089】
図17は略称候補リスト28からSHORTNAME.ENが決定される様子を示す図である。
略語置換処理および略称生成処理により生成された図17(a)に示すような合計6つの略称候補のうちから、ユーザ指定により図17(b)に示すように「Max−Op−V_r」なる候補がSHORTNAME.ENとして確定される。
【0090】
図18は他定義選択処理の様子を示す図である。
図18(a)に示すように、SHORTNAME.JAに関する他定義選択処理は、SHORTNAME.ENをそのまま略称候補として略称候補リスト28に加えることが定義されている。そこで図18(b)に示すように、上述のようにSHORTNAME.ENとして確定された「Max−Op−V_r」なる語句を略称候補として略称候補リスト28に加える。そして、ユーザによる選択を経て、図18(c)に示すように「Max−Op−V_r」なる候補がSHORTNAME.JAとして確定される。
【0091】
このようにして確定されたSHORTNAME.ENおよびSHORTNAME.JAがそれぞれ図19に示すように辞書データ21に追加され、辞書データ21が更新される。
【0092】
以上のように本実施形態によれば、それぞれ異なる方法で略称候補の生成を行う基本略語置換処理部14、略称生成処理部15および他定義選択処理部16を備えて、作成するべき短縮名称がSHORTNAME.ENおよびSHORTNAME.JAのいずれであるか、ならびに短縮名称の作成の元となる名称のデータタイプに基づいて適切な処理部を選択し、この処理部により略称候補の生成を行うようにしているので、電子カタログの辞書として不特定多数が使用するのに適し、広くコンセンサスをとることが容易な標準的な短縮名称の候補を提供することが可能となる。
【0093】
さらに本実施形態によれば、略称候補のうちからユーザにより指定されたものを短縮名称として確定するようにしているから、作成された短縮名称を例えば本実施形態のように辞書データ21の更新処理などに容易に使用することが可能である。そして本実施形態のように辞書データ21の更新処理を自動的に行うことにより、辞書データ21の作成処理を非常に効率良く行うことを可能とすることができる。
【0094】
また本実施形態によれば、他定義選択処理部16を備えていることにより、ある言語に関して他の言語に基づく短縮名称を採用することが可能であり、多言語化されている辞書データ21に対応して適正な短縮名称の作成を行うことが可能である。
【0095】
なお、本発明は上記実施形態に限定されるものではない。例えば略称生成処理部15で使用する形態素解析としては、日本語の短縮名称を生成する場合で形態素の正確な分析が困難である場合に対応する英語の定義からの単語切り出し情報を利用することで、より正確な形態素分析を行うことなどの他言語情報を利用する新たな形態素解析技術を用いることもできる。
【0096】
また、基本略語置換処理部14、略称生成処理部15および他定義選択処理部16の全てを必ずしも備える必要は無いし、これらの処理部とは異なる方法で略称候補を生成する処理部を備えるようにしても良い。
【0097】
また、短縮名称の確定は、例えば略称候補の中で文字数が最も少ないものとするなどのように、予め定めた条件に従って自動的に行うようにしても良い。
【0098】
また、文字列のコード化や、ソフトウェア開発における関数名の生成などのように電子カタログにおける短縮名称以外の短縮語の作成にも広く適用が可能である。
【0099】
また、短縮名称作成支援プログラム3aは、CD−ROMメディアMからインストールするには限らず、フロッピディスク(R)や、その他の種類の記憶媒体からインストールするようにしても良いし、あるいはインターネットなどのネットワークを介してインストールするようにしても良い。
【0100】
このほか、本発明の要旨を逸脱しない範囲で種々の変形実施が可能である。
【0101】
【発明の効果】
本発明によれば、それぞれ異なる方法で前記短縮語としての候補文字列を生成する複数の候補生成手段のうちの少なくとも1つを、短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報と予め定められたルールとに基づいて有効とし、その有効とした候補生成手段により生成された候補文字列を短縮語の候補として選定することとしたので、複数の方法が適宜使用されて短縮語の候補文字列の生成が行われることとなり、辞書の情報として不特定多数が使用するのに適し、広くコンセンサスを得ることが可能な短縮語を容易に作成することを可能とすることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る電子カタログ辞書作成装置のブロック図。
【図2】図1中の短縮名称作成支援プログラム3aに基づきソフトウェア処理によりプロセッサ1により実現される処理系統の構成を示すブロック図。
【図3】図1中のプロセッサ1による全体の処理アルゴリズムを示すフローチャート。
【図4】図2中の辞書データ21のデータ構造を示す図。
【図5】図2中の生成パタン判定ルール22のデータ構造を示す図。
【図6】図2中の制約条件設定データ23のデータ構造を示す図。
【図7】基本略語置換処理における処理アルゴリズムを示すフローチャート。
【図8】図2中の略称候補生成条件データ24のデータ構造を示す図。
【図9】図2中の基本略語データ25のデータ構造を示す図。
【図10】略称生成処理における処理アルゴリズムを示すフローチャート。
【図11】略称生成ルール設定データ27のデータ構造を示す図。
【図12】形態素解析用辞書26のデータ構造を示す図。
【図13】他定義選択処理における処理アルゴリズムを示すフローチャート。
【図14】短縮名称登録処理の処理アルゴリズムを示すフローチャート。
【図15】略語置換処理により略称候補が生成される様子を示す図。
【図16】略称生成処理により略称候補が生成される様子を示す図。
【図17】略称候補リストからSHORTNAME.ENが決定される様子を示す図。
【図18】他定義選択処理の様子を示す図。
【図19】確定されたSHORTNAME.ENおよびSHORTNAME.JAにより更新された辞書データの一例を示す図。
【符号の説明】
1…プロセッサ
2…メインメモリ
3…ハードディスク装置
3a…短縮名称作成支援プログラム
4…CD−ROMドライブ
5…キーボード/マウス
6…ディスプレイ
7…バス
11…辞書データ読込み部
12…短縮名称生成パタン判定部
13…生成処理制御部
14…基本略語置換処理部
15…略称生成処理部
16…他定義選択処理部
17…短縮名称登録部
21…辞書データ
22…生成パタン判定ルール
23…制約条件設定データ
24…略称候補生成条件データ
25…基本略語データ
26…形態素解析用辞書
27…略称生成ルール設定データ
28…略称候補リスト
M…CD−ROMメディア[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an abbreviated word creation support device and an abbreviated word creation support program for supporting creation of abbreviated words related to phrases included in the electronic catalog dictionary when creating an electronic catalog dictionary.
[0002]
[Prior art]
An electronic catalog system is a system for providing product information using a computer network. "ISO 13548 (Parts Library)" has been established as an international standard for constructing an electronic catalog system for electronically providing product information on the Internet. In this "ISO 13548", an electronic catalog is composed of a dictionary and contents, and a uniform data structure is provided for sharing and reuse of product information.
[0003]
In the dictionary defined by “ISO13548”, the main components are a product category represented on a tree as a concept hierarchy and a technical attribute (specification item) to which the product category belongs. Short names are associated with names for defining product categories and specification items.
[0004]
Since short names do not include words that have gained widespread consensus on all of the names used to define product categories and specifications, it is important that the workers have appropriate I had to consider short names.
[0005]
As a method of generating a short name of a product classification, the method of
[0006]
In addition, as a general method of shortening character data, a method of converting a character using an abbreviation dictionary to keep the number of characters within a limit (for example, see Patent Literature 2), a generation method using an abbreviation generation rule (for example, see Patent Literature 3) It has been known.
[0007]
[Patent Document 1]
JP 2000-11178 A
[0008]
[Patent Document 2]
JP-A-2002-7104
[0009]
[Patent Document 3]
JP-A-11-25117
[0010]
[Problems to be solved by the invention]
As described above, in the related art, a dictionary creation operator has performed the creation of abbreviated names, which required a large number of man-hours.
[0011]
By using the technique of
[0012]
Further, the technique disclosed in
[0013]
Further, the technique of
[0014]
Therefore, the present invention has been made in view of such circumstances, and the purpose of the present invention is to provide abbreviations that are suitable for use by an unspecified number of people as information in a dictionary and that can obtain a broad consensus. It is to enable easy creation.
[0015]
[Means for Solving the Problems]
In order to achieve the above object, the present invention provides a method for generating a plurality of candidate words, each of which generates a candidate character string as a shortened word by a different method based on information indicated in an electronic catalog dictionary with respect to a phrase to be abbreviated. Means for selecting at least one of the plurality of candidate generating means by a selecting means based on information indicated in the electronic catalog dictionary and a predetermined rule with respect to a phrase to be abbreviated for word creation. The candidate selecting unit selects the candidate character string generated by the selected candidate generating unit as the shortened word candidate.
[0016]
By adopting such means, at least one of the plurality of candidate generating means for generating the candidate character string as the shortened word in a different manner is different from the electronic catalog dictionary with respect to the phrase for which the shortened word is to be created. And the candidate character string generated by the validated candidate generating means is selected as a candidate for a shortened word. Therefore, a plurality of methods are appropriately used to generate abbreviated word candidate character strings.
[0017]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
[0018]
FIG. 1 is a block diagram of an electronic catalog dictionary creation device according to the present embodiment. The electronic catalog dictionary creation device supports creation of a short name (SHORTNAME), which is a requirement of the IS01584 standard, in the definition of dictionary data of the IS01584 standard.
[0019]
As shown in FIG. 1, the electronic catalog dictionary creation device has a
[0020]
The
[0021]
The
[0022]
The
[0023]
The CD-
[0024]
The keyboard / mouse 5 receives various instruction inputs from the user.
[0025]
The
[0026]
A general-purpose personal computer, for example, is used as the electronic catalog dictionary creation device. Therefore, initially, the short name creation support program 3a is not installed. Therefore, as a part of the introduction work of the information processing system, the short name creation support program 3a stored in the CD-ROM medium M is installed in the
[0027]
Here, the short name creation support program 3a causes the
[0028]
FIG. 2 is a block diagram showing a relationship between processing units realized by the
[0029]
As shown in FIG. 2, the
[0030]
The dictionary data reading unit 11 reads a dictionary element for which a short name is to be created from the
[0031]
The short name generation
[0032]
The generation
[0033]
The basic abbreviation
[0034]
The abbreviation
[0035]
The other definition
[0036]
The short
[0037]
Next, the operation of the electronic catalog dictionary creating apparatus configured as described above will be described.
FIG. 3 is a flowchart showing an overall processing algorithm by the
In step ST1-1, the
[0038]
FIG. 4 is a diagram showing the data structure of the
In the present embodiment, the
[0039]
For example, in the row R1 in FIG. 4, the dictionary element PREFNAME. EN is “Maximum Operational Rated Voltage”, and PREFNAME. Indicates that EN is "maximum rated working voltage". Also, SHORTNAME. EN and SHORTNAME. Indicates that no JA has been registered. Furthermore, it indicates that Data Type is “Real”, that is, a real number type.
[0040]
Subsequently, in step ST1-2, the
[0041]
FIG. 5 is a diagram showing a data structure of the generation
The generation
[0042]
For example, in row R2 in FIG.
(SHORTNAME.JA = none) ∧ (SHORTNAME.EN = none) ∧ (DataType = (Real∨Integer))
Regarding the processing of the dictionary element satisfying the condition of “SHORTNAME. The abbreviation substitution processing (PreferredName.EN) and the abbreviation generation processing (PreferredName.EN) are applied to the generation of EN. A rule is described in which another definition selection processing (SHORTNAME.EN) is applied to the generation of JA.
[0043]
After that, the
[0044]
FIG. 6 is a diagram showing the data structure of the constraint
[0045]
Thereafter, in step ST1-6, the
[0046]
FIG. 7 is a flowchart showing a processing algorithm in the basic abbreviation replacement processing. The basic abbreviation replacement processing is executed by the
[0047]
In the basic abbreviation replacement process, the
[0048]
Next, in step ST2-2, the
[0049]
FIG. 8 is a diagram showing the data structure of the abbreviation candidate
[0050]
FIG. 9 is a diagram showing the data structure of the
[0051]
Then, in step ST2-4, the
[0052]
If a matching word is found, in step ST2-5, the
[0053]
As shown in FIG. 8, the abbreviation candidate
[0054]
Subsequently, in step ST2-6, the
[0055]
When it is confirmed in step ST2-4 that no matching word is found, the
[0056]
When the basic abbreviation replacement processing is completed in this way, the
[0057]
FIG. 10 is a flowchart showing a processing algorithm in the abbreviation generation processing. Note that this abbreviation generation processing is executed by the
[0058]
First, in step ST3-1, the
[0059]
FIG. 11 is a diagram showing the data structure of the abbreviation generation
[0060]
Omission methods can be set separately for the subject and the qualifier, and a list of applicable processing methods and the availability of these processing methods can be set for each. And a flag indicating “Y” is to be used.
[0061]
In this embodiment, the following four omission methods are provided.
[0062]
(1) Extract n characters from the beginning of each morpheme.
[0063]
{Circle around (2)} Extracting the last n characters connected to the last n characters of each morpheme.
[0064]
(3) Extract the vowels (excluding the head) of each morpheme that are omitted.
[0065]
(4) Extract the entire morpheme (= no processing).
[0066]
Separate characters can be set separately for the case between the qualifier and the subject and between the qualifiers. A list of applicable partition characters for each of them and the availability of those And a flag indicating the flag is set to "Y".
[0067]
Therefore, in step ST3-1, the
[0068]
Next, in step ST3-2, the
[0069]
FIG. 12 is a diagram showing a data structure of the
[0070]
Subsequently, the
[0071]
When it is confirmed in step ST3-6 that the generation of all the lists L2 has been completed, the
[0072]
Next, the
[0073]
If it is confirmed in step ST3-13 that the generation of the concatenated character string Y 'has been completed for all the elements of the set U, the
[0074]
When the abbreviation generation processing is completed in this way, the
[0075]
FIG. 13 is a flowchart showing a processing algorithm in the other definition selection processing. The other definition selection process is executed by the
[0076]
First, in step ST4-1, the
[0077]
When the abbreviation candidate is added to the
[0078]
After completing the other definition selection process, the
[0079]
FIG. 14 is a flowchart showing the processing algorithm of the short name registration processing. This short name registration process is executed by the
[0080]
The
[0081]
Next, in step ST5-3, the
[0082]
However, if the selection from the displayed list is rejected by the user, in step ST5-6, the
[0083]
After receiving the input of the abbreviation by the user or receiving the designation of the abbreviation from the list in step ST5-5, the
[0084]
If manual input is rejected by the user in step ST5-6, the
[0085]
Thereafter, in step ST1-13, the
If it is confirmed in step ST1-13 that the processing for all elements has been completed, the
[0086]
Hereinafter, the manner in which abbreviations are registered by the above processing will be described with reference to specific examples.
Here, a case is considered where the element in row R1 in FIG. 4 is to be processed. The element to be processed is SHORTNAME. EN and SHORTNAME. Since no JP has been set and Data Type is “Real”, the row R2 matches the determination condition in the generation
[0087]
FIG. 15 is a diagram illustrating a state in which abbreviation candidates are generated by the abbreviation substitution process.
As shown in FIG. 15, the character string “Maximum Operational Rated Voltage” is partially and gradually replaced by a basic abbreviation. Here, the character string “Max-Op-V_r” is included in the
[0088]
FIG. 16 is a diagram illustrating a manner in which abbreviation candidates are generated by the abbreviation generation process.
As shown in FIG. 16, a character list L1, a list L2, and a set U are respectively generated, and five character strings such as “Man-Opl-Rated Vol” and “Man-Opl-Ratd Vol” are newly generated from these. An abbreviation candidate is generated and added to the
[0089]
FIG. 17 shows a short
Among the total of six abbreviation candidates as shown in FIG. 17A generated by the abbreviation substitution process and the abbreviation generation process, the candidate “Max-Op-V_r” as shown in FIG. Is SHORTNAME. It is determined as EN.
[0090]
FIG. 18 is a diagram showing a state of the other definition selecting process.
As shown in FIG. 18A, SHORTNAME. The other definition selection process for JA is SHORTNAME. It is defined that EN is directly added to the
[0091]
The SHORTNAME. EN and SHORTNAME. JA is added to the
[0092]
As described above, according to the present embodiment, the basic abbreviation
[0093]
Further, according to the present embodiment, the abbreviation candidate specified by the user is determined as the abbreviated name, so that the created abbreviated name is updated in the
[0094]
Further, according to the present embodiment, the provision of the other definition
[0095]
Note that the present invention is not limited to the above embodiment. For example, the morpheme analysis used by the abbreviation
[0096]
Further, it is not always necessary to include all of the basic abbreviation
[0097]
Further, the abbreviation name may be automatically determined in accordance with a predetermined condition, for example, by setting the number of characters to be the smallest among the abbreviation candidates.
[0098]
Further, the present invention can be widely applied to the creation of abbreviated words other than the abbreviated names in an electronic catalog, such as encoding a character string or generating a function name in software development.
[0099]
Further, the short name creation support program 3a is not limited to be installed from the CD-ROM medium M, but may be installed from a floppy disk (R) or another type of storage medium, or may be installed on the Internet or the like. You may make it install via a network.
[0100]
In addition, various modifications can be made without departing from the spirit of the present invention.
[0101]
【The invention's effect】
According to the present invention, at least one of the plurality of candidate generating means for generating the candidate character string as the shortened word by a different method is indicated in the electronic catalog dictionary with respect to the phrase for which the shortened word is to be created. Of the candidate character string generated by the valid candidate generating means as a candidate for a shortened word, a plurality of methods are appropriately used. Generation of abbreviated word candidate character strings will be performed, and it is possible to easily create abbreviated words that are suitable for use by unspecified majority as dictionary information and that can obtain a wide consensus. it can.
[Brief description of the drawings]
FIG. 1 is a block diagram of an electronic catalog dictionary creation device according to an embodiment of the present invention.
FIG. 2 is a block diagram showing a configuration of a processing system realized by a
FIG. 3 is a flowchart showing an overall processing algorithm by a
FIG. 4 is a view showing a data structure of
FIG. 5 is a diagram showing a data structure of a generation
FIG. 6 is a diagram showing a data structure of constraint
FIG. 7 is a flowchart illustrating a processing algorithm in a basic abbreviation replacement process.
FIG. 8 is a diagram showing a data structure of abbreviation candidate
FIG. 9 is a diagram showing a data structure of
FIG. 10 is a flowchart illustrating a processing algorithm in abbreviated name generation processing.
FIG. 11 is a diagram showing a data structure of abbreviation generation
FIG. 12 is a diagram showing a data structure of a
FIG. 13 is a flowchart showing a processing algorithm in another definition selection processing.
FIG. 14 is a flowchart illustrating a processing algorithm of a short name registration process.
FIG. 15 is a diagram showing a state in which abbreviation candidates are generated by the abbreviation substitution process.
FIG. 16 is a diagram illustrating a manner in which abbreviation candidates are generated by abbreviation generation processing.
FIG. 17 shows an example of a short name candidate list. The figure which shows a mode that EN is determined.
FIG. 18 is a diagram showing a state of another definition selecting process.
FIG. 19: Confirmed SHORTNAME. EN and SHORTNAME. The figure which shows an example of the dictionary data updated by JA.
[Explanation of symbols]
1. Processor
2 ... Main memory
3 ... Hard disk drive
3a: Short name creation support program
4: CD-ROM drive
5. Keyboard / mouse
6. Display
7 ... Bus
11: Dictionary data reading unit
12: Short name generation pattern judgment unit
13: generation processing control unit
14 Basic abbreviation replacement processing unit
15: Abbreviation generation processing unit
16 Other definition selection processing unit
17… Short name registration section
21 ... Dictionary data
22 ... Generation pattern judgment rule
23… Constraint condition setting data
24 ... Abbreviated name candidate generation condition data
25 Basic abbreviation data
26 ... Dictionary for morphological analysis
27 ... Abbreviation generation rule setting data
28 ... Abbreviated name candidate list
M: CD-ROM media
Claims (10)
短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報に基づきそれぞれ異なる方法で前記短縮語としての候補文字列を生成する複数の候補生成手段と、
短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報と予め定められたルールとに基づいて前記複数の候補生成手段のうちの少なくとも1つを選択する選択手段と、
この選択手段により選択された候補生成手段により生成された候補文字列を前記短縮語の候補として選定する候補選定手段とを具備したことを特徴とする短縮語作成支援装置。In a shortened word creation support device that supports creation of shortened words related to phrases included in an electronic catalog dictionary,
A plurality of candidate generating means for generating a candidate character string as the shortened word in a different manner based on information indicated in the electronic catalog dictionary with respect to a phrase to be shortened,
Selecting means for selecting at least one of the plurality of candidate generating means based on information indicated in the electronic catalog dictionary and a predetermined rule with respect to a phrase to be abbreviated,
An abbreviation word creation support device, comprising: candidate selection means for selecting a candidate character string generated by the candidate generation means selected by the selection means as a candidate for the shortened word.
かつ前記候補生成手段としては、短縮語作成の対象となる語句に対応する他言語に対して定められた短縮語を前記候補文字列とするものを含むことを特徴とする請求項1乃至請求項6のいずれかに記載の短縮語作成支援装置。The electronic catalog dictionary is multilingualized,
4. The method according to claim 1, wherein the candidate generating unit includes a unit that uses a shortened word defined for another language corresponding to a phrase to be abbreviated as the candidate character string. 6. The shortened word creation support device according to any one of 6.
短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報に基づきそれぞれ異なる方法で前記短縮語としての候補文字列を生成する複数の候補生成手段と、
短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報と予め定められたルールとに基づいて前記複数の候補生成手段のうちの少なくとも1つを選択する選択手段と、
この選択手段により選択された候補生成手段により生成された候補文字列の全てを前記短縮語の候補として選定する候補選定手段としてそれぞれ機能させる短縮語作成支援プログラム。What causes the computer to perform processing for supporting the creation of abbreviated words related to phrases included in the electronic catalog dictionary, the computer,
A plurality of candidate generating means for generating a candidate character string as the shortened word in a different manner based on information indicated in the electronic catalog dictionary with respect to a phrase to be shortened,
Selecting means for selecting at least one of the plurality of candidate generating means based on information indicated in the electronic catalog dictionary and a predetermined rule with respect to a phrase to be abbreviated,
A shortened word creation support program that functions as candidate selecting means for selecting all of the candidate character strings generated by the candidate generating means selected by the selecting means as candidates for the shortened word.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002284332A JP3898615B2 (en) | 2002-09-27 | 2002-09-27 | Abbreviated word creation support device and abbreviated word creation support program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002284332A JP3898615B2 (en) | 2002-09-27 | 2002-09-27 | Abbreviated word creation support device and abbreviated word creation support program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004118741A true JP2004118741A (en) | 2004-04-15 |
JP3898615B2 JP3898615B2 (en) | 2007-03-28 |
Family
ID=32277926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002284332A Expired - Fee Related JP3898615B2 (en) | 2002-09-27 | 2002-09-27 | Abbreviated word creation support device and abbreviated word creation support program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3898615B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006185424A (en) * | 2004-11-30 | 2006-07-13 | Ricoh Co Ltd | Information processing apparatus, method and program for setting image processing function and recording medium |
JP2007148674A (en) * | 2005-11-25 | 2007-06-14 | Konica Minolta Business Technologies Inc | Information display method |
JP2009169513A (en) * | 2008-01-11 | 2009-07-30 | Toshiba Corp | Device, method and program for estimating nickname |
JP2012018682A (en) * | 2006-12-18 | 2012-01-26 | Mitsubishi Electric Corp | Shortened character string display device |
-
2002
- 2002-09-27 JP JP2002284332A patent/JP3898615B2/en not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006185424A (en) * | 2004-11-30 | 2006-07-13 | Ricoh Co Ltd | Information processing apparatus, method and program for setting image processing function and recording medium |
JP2007148674A (en) * | 2005-11-25 | 2007-06-14 | Konica Minolta Business Technologies Inc | Information display method |
JP2012018682A (en) * | 2006-12-18 | 2012-01-26 | Mitsubishi Electric Corp | Shortened character string display device |
JP2009169513A (en) * | 2008-01-11 | 2009-07-30 | Toshiba Corp | Device, method and program for estimating nickname |
Also Published As
Publication number | Publication date |
---|---|
JP3898615B2 (en) | 2007-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6345243B1 (en) | System, method, and product for dynamically propagating translations in a translation-memory system | |
JP2008083952A (en) | Dictionary creation support system, method and program | |
JP3372532B2 (en) | Computer-readable recording medium for emotion information extraction method and emotion information extraction program | |
JP3871832B2 (en) | Data processing program automatic generation system and method, and computer-readable recording medium | |
JP4160548B2 (en) | Document summary creation system, method, and program | |
US7478092B2 (en) | Key term extraction | |
JP4001283B2 (en) | Morphological analyzer and natural language processor | |
JP4856573B2 (en) | Summary sentence generation device and summary sentence generation program | |
JP3898615B2 (en) | Abbreviated word creation support device and abbreviated word creation support program | |
JP5447368B2 (en) | NEW CASE GENERATION DEVICE, NEW CASE GENERATION METHOD, AND NEW CASE GENERATION PROGRAM | |
JP2010003104A (en) | Development support apparatus, method, and program | |
JP2005063030A (en) | Method for expressing concept, method and device for creating expression of concept, program for implementing this method, and recording medium for recording this program | |
JP2005025555A (en) | Thesaurus construction system, thesaurus construction method, program for executing the method, and storage medium with the program stored thereon | |
JP4341077B2 (en) | Document processing apparatus, document processing method, and document processing program | |
JP7083473B2 (en) | Input support device | |
CN1322417C (en) | Multilingual software installation system and method, medium and multilingual software installation product | |
JP2009230705A (en) | Template preparation device, device and method for preparing document data, and program | |
JP4399154B2 (en) | Translation apparatus and translation program | |
JP2010217972A (en) | Structured document generation device and structured document generation program | |
JP6657920B2 (en) | Document verification support device, document verification support method, and document verification support program | |
JP6267971B2 (en) | Source code analysis support device, source code analysis support method | |
CN116226397A (en) | Knowledge extraction method, system, equipment and storage medium | |
JP5367099B2 (en) | Difference location extraction apparatus and program | |
JP2006127397A (en) | Required specification extraction method linked with architecture construction | |
JPH05342258A (en) | Natural language processing system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051003 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051011 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061221 |
|
LAPS | Cancellation because of no payment of annual fees |