[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2004118741A - Curtailed word formation supporting device and curtailed word formation supporting program - Google Patents

Curtailed word formation supporting device and curtailed word formation supporting program Download PDF

Info

Publication number
JP2004118741A
JP2004118741A JP2002284332A JP2002284332A JP2004118741A JP 2004118741 A JP2004118741 A JP 2004118741A JP 2002284332 A JP2002284332 A JP 2002284332A JP 2002284332 A JP2002284332 A JP 2002284332A JP 2004118741 A JP2004118741 A JP 2004118741A
Authority
JP
Japan
Prior art keywords
word
candidate
abbreviation
abbreviated
shortened
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002284332A
Other languages
Japanese (ja)
Other versions
JP3898615B2 (en
Inventor
Satoshi Ito
伊藤 聡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002284332A priority Critical patent/JP3898615B2/en
Publication of JP2004118741A publication Critical patent/JP2004118741A/en
Application granted granted Critical
Publication of JP3898615B2 publication Critical patent/JP3898615B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a curtailed word formation supporting device and a program therefor suitable to be used by a number of unspecified people as dictionary information and capable of forming a curtailed word easily which can get consensus comprehensively. <P>SOLUTION: The curtailed word formation supporting device and the program therefor include a basic abbreviation substitution processing part 14, an abbreviated name formation processing part 15, and the other definition selection processing part 16 whereby the formation of a candidate for an abbreviated name is performed for one word using a different method. A curtailed name forming pattern determination part 12 selects at least one of the processing parts 14, 15 and 16 on the basis of data shown concerning the word etc. to be processed in dictionary data 21 read by a dictionary data reading part 11 and a forming pattern determination rule 22. A formation processing part 13 conducts the formation of an abbreviated name candidate using the selected processing part, and the abbreviated name candidate formed by the processing part(s) is used as the candidate for the curtailed word. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、電子カタログ辞書の作成に当り、上記の電子カタログ辞書に含まれる語句に関する短縮語の作成を支援するための短縮語作成支援装置および短縮語作成支援プログラムに関する。
【0002】
【従来の技術】
コンピュータネットワークを用いて製品の情報を提供するようにしたシステムとして、電子カタログシステムがある。そして、インターネット上で製品情報を電子的に提供するための電子カタログシステムを構築するための国際規格として、“ISO13548(Parts Library)”が制定されている。この“ISO13548”では電子カタログを、辞書とコンテンツで構成し、これらを統一したデータ構造を与えることで、製品情報の共有・再利用を目指している。
【0003】
“ISO13548”で定義している辞書では、概念階層としてツリー上に表現された製品分類と、その製品分類の属する技術属性(諸元項目)とが主要な構成要素となっている。そして製品分類や諸元項目を定義するための名称には、短縮名称が対応付けられる。
【0004】
短縮名称は、製品分類や諸元項目を定義するための名称の全てについて広くコンセンサスが得られているような語句が存在している訳では無いので、辞書の作成作業においてその作業者が適切な短縮名称を考えなければならなかった。
【0005】
なお、製品分類の短縮名称を生成する方法としては、特許文献1のものが知られている。
【0006】
また、一般的な文字データの短縮方法として、略語辞書を用いた変換し文字数制限内に収める方法(例えば特許文献2を参照)や、略語生成規則による生成手法(例えば特許文献3を参照)などが知られている。
【0007】
【特許文献1】
特開2000−11178号公報
【0008】
【特許文献2】
特開2002−7104号公報
【0009】
【特許文献3】
特開平11−25117号公報
【0010】
【発明が解決しようとする課題】
以上のように従来は、短縮名称の作成を辞書作成の作業者が行っていたため、そのために多くの工数を必要としていた。
【0011】
特許文献1の技術を用いれば、辞書作成の作業者の負担を軽減することが可能である。しかしながら、特許文献1の技術は、短縮名称の作成は製品分類における概念階層の情報に基づいているため、そのような情報を有しない諸元項目の短縮名称を生成することはできなかった。
【0012】
また、特許文献2の技術は、予め登録されている略称データヘの文字列置換による手法であるため、該当する略称データがない場合は、都度略称データを入力していくことが必要となり、電子カタログの辞書開発においては十分な効果をあげることが困難である。
【0013】
また、特許文献3の技術は、文字列の分割、文字切り出し規則および切り出した文字の結合により略語を生成する手法であるが、個人が文章を効率的に検索するための手法であり、文字切り出し規則の表現力に柔軟性が不足している。このため、不特定多数が使用する標準的な短縮名称として、元の名称の意味を想像できるような短縮名称を生成することが困難であるため、電子カタログの辞書としての短縮名称の作成には適さない手法である。
【0014】
そこで本発明はこのような事情を考慮してなされたものであり、その目的とするところは、辞書の情報として不特定多数が使用するのに適し、広くコンセンサスを得ることが可能な短縮語を容易に作成することを可能とすることにある。
【0015】
【課題を解決するための手段】
以上の目的を達成するために本発明は、短縮語作成の対象となる語句に関して電子カタログ辞書に示された情報に基づきそれぞれ異なる方法で前記短縮語としての候補文字列を生成する複数の候補生成手段を備え、短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報と予め定められたルールとに基づいて前記複数の候補生成手段のうちの少なくとも1つを選択手段により選択し、この選択された候補生成手段により生成された候補文字列を前記短縮語の候補として候補選定手段が選定することとした。
【0016】
このような手段を講じたことにより、それぞれ異なる方法で前記短縮語としての候補文字列を生成する複数の候補生成手段のうちの少なくとも1つが、短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報と予め定められたルールとに基づいて有効とされ、その有効とされた候補生成手段により生成された候補文字列が短縮語の候補として選定される。従って、複数の方法が適宜使用されて短縮語の候補文字列の生成が行われる。
【0017】
【発明の実施の形態】
以下、図面を参照して本発明の一実施形態につき説明する。
【0018】
図1は本実施形態に係る電子カタログ辞書作成装置のブロック図である。なおこの電子カタログ辞書作成装置は、IS01584標準の辞書データの定義において、IS01584標準の要件である短縮名称(SHORTNAME)の作成を支援するものであり。
【0019】
この図1に示すように電子カタログ辞書作成装置は、プロセッサ1、メインメモリ2、ハードディスク装置3、CD−ROMドライブ4、キーボード/マウス5およびディスプレイ6を有している。そしてこれらの各部は、バス7を介して互いに接続されている。
【0020】
プロセッサ1は、ハードディスク装置3に格納されているプログラムに従ってソフトウェア処理を実行することで各種の制御処理を行う。
【0021】
メインメモリ2は、プロセッサ1が実際に使用するソフトウェアやその他のデータを一時的に記憶しておく。
【0022】
ハードディスク装置3は、プロセッサ1が使用するオペレーティングシステム用のプログラムを格納する。ハードディスク装置3は、オペレーティングシステム用のプログラムの他に、アプリケーションプログラムやドライバプログラム、あるいはその他の任意のデータを格納する。またハードディスク装置3には、短縮名称作成支援プログラム3aが格納される。短縮名称作成支援プログラム3aは、電子カタログ辞書に登録するための短縮名称の作成支援のための後述する処理をプロセッサ1に実行させる。
【0023】
CD−ROMドライブ4は、CD−ROMメディアMからのデータの読み出しを行う。
【0024】
キーボード/マウス5は、ユーザによる各種の指示入力を受け付ける。
【0025】
ディスプレイ6は、ユーザに対する各種の情報通知のための画像表示を行う。
【0026】
ところで電子カタログ辞書作成装置としては、例えば汎用のパーソナルコンピュータが用いられる。従って、当初は短縮名称作成支援プログラム3aはインストールされていない。そこで、当該情報処理システムの導入作業の一環として、CD−ROMメディアMに格納されている短縮名称作成支援プログラム3aをハードディスク装置3へとインストールする。
【0027】
ここで短縮名称作成支援プログラム3aは、プロセッサ1を図2に示すような各処理部として動作させる。
【0028】
図2はプロセッサ1が短縮名称作成支援プログラム3aに基づいて実現する処理部の関係を示すブロック図である。なお図2には併せて、各処理部が参照するためにメインメモリ2およびハードディスク装置3に格納される各種のデータも示している。
【0029】
この図2に示すようにプロセッサ1は、辞書データ読込み部11、短縮名称生成パタン判定部12、生成処理制御部13、基本略語置換処理部14、略称生成処理部15、他定義選択処理部16および短縮名称登録部17のそれぞれとして動作する。また辞書データ21、生成パタン判定ルール22、制約条件設定データ23、略称候補生成条件データ24、基本略語データ25、形態素解析用辞書26、略称生成ルール設定データ27および略称候補リスト28がそれぞれ用意される。
【0030】
辞書データ読込み部11は、辞書データ21から短縮名称の作成の対象となる辞書要素を読み込む。
【0031】
短縮名称生成パタン判定部12は、上記読み込まれた辞書要素に含まれる情報と生成パタン判定ルール22とに基づいて実行すべき処理内容のリストを決定する。なお、ここで決定する処理内容リストは、基本略語置換処理部14、略称生成処理部15および他定義選択処理部16のうちで略称候補の生成のために使用するべきものを示す。
【0032】
生成処理制御部13は、基本略語置換処理部14、略称生成処理部15および他定義選択処理部16のうちで上記処理内容リストに示された処理部に略称候補の作成処理を実行させる。生成処理制御部13は、制約条件設定データ23に示された条件に合致する略称候補を作成するべく基本略語置換処理部14、略称生成処理部15および他定義選択処理部16を制御する。
【0033】
基本略語置換処理部14は、略称の元となる文字列を略称候補生成条件データ24に示された条件下で基本略語データ25により置換することにより略称候補を生成する。基本略語置換処理部14は、生成した略称候補を略称候補リスト28に追加する。
【0034】
略称生成処理部15は、略称の元となる文字列の構文を形態素解析用辞書26を参照して解析し、この解析結果と略称生成ルール設定データに示されたルールとに基づいて略称候補を生成する。略称生成処理部15は、生成した略称候補を略称候補リスト28に追加する。
【0035】
他定義選択処理部16は、略称の元となる文字列とは異なる言語で同一の対象を示した語句に対して定められた略称を略称候補として選択する。他定義選択処理部16は、生成した略称候補を略称候補リスト28に追加する。
【0036】
短縮名称登録部17は、略称候補リスト28に記憶されている略称候補のうちから略称を確定し、これを辞書データ21に登録する。
【0037】
次に以上のように構成された電子カタログ辞書作成装置の動作につき説明する。
図3は本実施形態におけるプロセッサ1による全体の処理アルゴリズムを示すフローチャートである。
プロセッサ1はまず辞書データ読込み部11の機能としてステップST1−1において、辞書データ21から短縮名称の作成の対象となる辞書要素Eを読み込む。
【0038】
図4は辞書データ21のデータ構造を示す図である。
本実施形態では辞書データ21は表形式データとして表現しており、1つの辞書要素を1つの行として表現されている。辞書要素は、CODEフィールド21a、PREFNAME.ENフィールド21b、PREFNAME.JAフィールド21c、SHORTNAME.ENフィールド21d、SHORTNAME.JAフィールド21eおよびData Typeフィールド21fの各フィールドを含んでいる。なお、辞書要素の各フィールドはIS01584で規定された要件から構成されるが、図4では本発明の説明のために必要な部分を抜粋して示している。CODEフィールド21aには、辞書要素の識別子であるCODEが示される。PREFNAME.ENフィールド21bには、英語の名称を記述するPREFNAME.ENが示される。PREFNAME.JAフィールド21cには、日本語の名称を記述するPREFNAME.JAが示される。SHORTNAME.ENフィールド21dには、英語の略称を記述するSHORTNAME.ENが示される。SHORTNAME.JAフィールド21eには、日本語の略称を記述するSHORTNAME.JAが示される。Data Typeフィールド21fには、辞書要素の書式を規定するData Typeが示される。
【0039】
例えば図4における行R1では、CODEが「EEE001」である辞書要素のPREFNAME.ENが「Maximum Operational Rated Voltage」であり、PREFNAME.ENが「最大定格使用電圧」であることを示す。またSHORTNAME.ENおよびSHORTNAME.JAがいずれも未登録であることを示す。さらにData Typeが「Real」すなわち実数型であることを示す。
【0040】
続いてプロセッサ1は短縮名称生成パタン判定部12の機能としてステップST1−2において、上記辞書要素Eに含まれる情報と生成パタン判定ルール22とに基づいて短縮名称生成パタンを判定し、さらに実行すべき処理内容のリストを決定する。
【0041】
図5は生成パタン判定ルール22のデータ構造を示す図である。
生成パタン判定ルール22は、判定条件フィールド22aおよび生成処理フィールド22bより構成されている。判定条件フィールド22aには、生成の処理となる辞書要素に関する判定条件が記述されている。ここでは判定条件は、処理対象となる辞書要素のSHORTNAME.ENフィールド21dのデータの有無、SHORTNAME.JAフィールド21eのデータの有無、ならびにData Typeフィールド21fの値により構成されている。生成処理フィールド22bには、各判定条件に合致する辞書要素に関して適用する処理の内容を示している。
【0042】
例えば図5における行R2では、
(SHORTNAME.JA=なし)∧(SHORTNAME.EN=なし)∧(DataType=(Real∨Integer))
なる条件が成立する辞書要素の処理に関しては、SHORTNAME.ENの生成には略語置換処理(PreferredName.EN)および略称生成処理(PreferredName.EN)を適用し、またSHORTNAME.JAの生成には他定義選択処理(SHORTNAME.EN)を適用するというルールが記述されている。
【0043】
こののちにプロセッサ1は生成処理制御部13の機能として、ステップST1−4にて第1ループ処理を開始する。第1ループ処理を開始するとプロセッサ1はステップST1−5において、上記リストアップされた処理内容に応じて、制約条件設定データ23から制約条件を読み込み、処理内容を判定する。
【0044】
図6は制約条件設定データ23のデータ構造を示す図である。制約条件設定データは、生成対象フィールド23a、最大文字列長フィールド23bおよび使用可能文字フィールド23cを含んでいる。生成対象フィールド23aは、生成の対象となるフィードを示す。最大文字列長フィールド23bは、生成する短縮名称の最大文字列の長さを示す。使用可能文字フィールド23cは、使用可能な文字の種類を示す。使用可能文字フィールド23cには、予め複数の文字種類に関するフラグが用意されていて、該当するフラグが「Y」である文字種類が使用可能であることを示す。なお本実施形態では、制約としてIEC61360に規定されている制約条件が記述されている。
【0045】
こののちにプロセッサ1はステップST1−6において、略語置換処理が上記リストアップされた処理内容に含まれているか否かを確認し、もし含まれているならばステップST1−7において基本略語置換処理を実行する。
【0046】
図7は基本略語置換処理における処理アルゴリズムを示すフローチャートである。なおこの基本略語置換処理は、プロセッサ1が基本略語置換処理部14の機能として実行する。
【0047】
基本略語置換処理においてプロセッサ1はまずステップST2−1において、処理対象となっている辞書要素Eから当該処理内容に含まれる処理対象に記述されたフィールドに相当する文字列Xを読込む。
【0048】
次にプロセッサ1はステップST2−2において、略称候補生成条件データ24を読込む。次にプロセッサ1はステップST2−3において、上記読込んだ略称候補生成条件データ24に基づいて文字列Xの部分文字列のうちで基本略語データ25に記述されている単語と一致するものを検索する。
【0049】
図8は略称候補生成条件データ24のデータ構造を示す図である。本実施形態では略称候補生成条件データ24は、マッチング方法フィールド24aおよび仕切り文字フィールド24bとを含む。マッチング方法フィールド24aには、文字列Xと基本略語データ25に格納された単語とのマッチング方法の指定情報が示される。具体的には、使用可能なマッチング方法の一覧と、それらのマッチング方法の使用の可否を示すフラグとが用意されていて、フラグが「Y」とされているマッチング方法が使用するべきものとなる。図8の例では、「左最長一致」なるマッチング方法が使用するべきマッチング方法として指定されていることを示す。そこでステップST2−3においてはプロセッサ1は、このように指定されているマッチング方法にて検索を行う。
【0050】
図9は基本略語データ25のデータ構造を示す図である。基本略語データ25は、単語フィールド25aと略語フィールド25bとを含んでいる。単語フィールド25aは、検索のための見出しとなる単語を示す。略語フィールド25bは、対応する単語フィールド25aに示された単語に対応する略語を示す。なお、基本略語データ25としては、既存の規格等を利用すればよく、技術属性の文字シンボルの規格であるIEC60027、IEC60747、IEC60748等を略語のフィールドに格納してもよく、これにより基本略語データ25を広くコンセンサスを得られるものとすることができる。
【0051】
そしてプロセッサ1はステップST2−4において、一致する単語が見つかったか否かを確認する。
【0052】
もし、一致する単語が見つかった場合にプロセッサ1はステップST2−5において、文字列Xから検索された部分文字列を、それに一致した単語に対する略語に略称候補生成条件データ24で指定された仕切り文字を加えたもので置換した文字列で置換してなる文字列X’を生成する。
【0053】
図8に示すように略称候補生成条件データ24には、使用可能な仕切り文字の一覧と、それらの仕切り文字の使用の可否を示すフラグとが用意されていて、フラグが「Y」とされている仕切り文字が使用するべきものとなる。図8の例では、「−」なる文字が仕切り文字として指定されていることを示す。
【0054】
続いてプロセッサ1はステップST2−6において、上記の文字列X’が制約条件設定データ23た示す制約を満たしているか否かを確認する。そして制約を満たしていることを確認した場合にプロセッサ1はステップST2−7において、文字列X’を略称候補リスト28に加える。このように略称候補を略称候補リスト28に加えた場合、あるいは制約を満たしていないことをステップST2−6にて確認した場合にプロセッサ1は、ステップST2−8において文字列X’を文字列Xとし、この上でステップST2−3以降の処理を繰り返す。
【0055】
さて、一致する単語が見つからなかったことをステップST2−4にて確認した場合にはプロセッサ1はステップST2−9において、文字列Xが制約条件設定データ23が示す制約を満たしているか否かを確認する。そして制約を満たしていることを確認した場合にプロセッサ1はステップST2−10において、文字列Xを略称候補として略称候補リスト28に加える。このように略称候補を略称候補リスト28に加えた場合、あるいは制約を満たしていないことをステップST2−9にて確認した場合にプロセッサ1は基本略語置換処理を終了する。
【0056】
このように基本略語置換処理を終了したならばプロセッサ1は、図3におけるステップST1−8において、ステップST1−3にてリストアップされた処理内容に略称生成処理が含まれているか否かを確認する。なお、リストアップされた処理内容に略語置換処理が含まれていないことをステップST1−6にて確認した場合にプロセッサ1は、ステップST1−7における基本略語置換処理を行うことなしに上記ステップST1−8における確認を行う。そして、略称生成処理が含まれていることを確認したならばプロセッサ1はステップST1−9において、略称生成処理を実行する。
【0057】
図10は略称生成処理における処理アルゴリズムを示すフローチャートである。なおこの略称生成処理は、プロセッサ1が略称生成処理部15の機能として実行する。
【0058】
プロセッサ1はまずステップST3−1において、ユーザからの入力に応じて略称生成ルールを設定し、略称生成ルール設定データ27として格納する。
【0059】
図11は略称生成ルール設定データ27のデータ構造を示す図である。略称生成ルール設定データ27は、単語の省略方法の設定情報27aおよび文字連結を行う際の仕切り文字の設定情報27bで構成されている。
【0060】
省略方法は、主語を対象とする場合と修飾語を対象とする場合とで別々の設定が可能となっており、それぞれに関して適用可能な処理方法の一覧と、それらの処理方法の使用の可否を示すフラグとが用意されていて、フラグが「Y」とされている処理方法が使用するべきものとなる。
【0061】
なお本実施形態では、以下の4つ省略方法を具備している。
【0062】
▲1▼各形態素の先頭からn文字までを抽出。
【0063】
▲2▼各形態素の先頭からn文字に末尾の文字を連結したものを抽出。
【0064】
▲3▼各形態素の母音(先頭は除く)を省略したものを抽出。
【0065】
▲4▼形態素全体を抽出(=無処理)。
【0066】
また仕切り文字は、修飾語−主語間の場合と修飾語間の場合とで別々の設定が可能となっており、それぞれに関して適用可能な仕切り文字の一覧と、それらの仕切り文字の使用の可否を示すフラグとが用意されていて、フラグが「Y」とされている仕切り文字が使用するべきものとなる。
【0067】
そこでプロセッサ1はステップST3−1では、いずれの省略方法および仕切り文字を使用するかのユーザ指定を受け付けて、該当するフラグを「Y」とするのである。なお省略方法に関しては、複数の処理を指定することを許容する。例えば、主語にあたる形態素に関しては▲1▼と▲4▼の処理を選択し、かつ修飾語にあたる形態素に関しては▲2▼と▲3▼の処理を選択することができる。また、仕切り文字についても、主語−修飾語間と修飾語間とで仕切り文字をそれぞれユーザが指定することができる。これらにより、より柔軟な略語生成を可能とすることができる。
【0068】
次にプロセッサ1はステップST3−2において、辞書要素Eから当該処理内容に含まれる処理対象に記述されたフィールドに相当する文字列Yを読込む。そしてプロセッサ1はステップST3−3において、形態素解析用辞書26に基づき文字列Yの構文解析を行い、形態素毎に分割した文字列リストL1を生成する。形態素解析については単語の切り出しと単語間の関係解析を行い、文の中の主語にあたる名詞と当該名詞を修飾する修飾語の集合に分けることができれば、既存の構文解析の技術を用いることで実現が可能である。
【0069】
図12は形態素解析用辞書26のデータ構造を示す図である。形態素解析用辞書は単語を記述した文字列のフィールド26a、単語の品詞のフィールド26b、ならびに意味素性のフィールド26cで構成されている。
【0070】
続いてプロセッサ1はステップST3−4にて第1ループ処理を開始する。第1ループ処理を開始するとプロセッサ1はステップST3−5において、上記の文字列リストL1の各要素E1について、略称生成ルール設定データ27により示された略称生成ルールを実行してE1の略称の集合(E2,E3,…En)を生成する。そしてプロセッサ1は、上記の集合(E2,E3,…En)にE1を加えた集合(E1,E2,E3,…En)を要素とするリストL2を生成する。こののち、プロセッサ1はステップST3−6において、文字リストL1の全ての要素についてリストL2の生成が終了したか否かの確認を行い、ここで終了を確認できるまでステップST3−4乃至ステップST3−7の第1ループを繰り返し実行する。
【0071】
全てのリストL2の生成が終了したことをステップST3−6にて確認したならば、プロセッサ1はステップST3−8において、リストL2の要素、すなわち各形態素と生成された1つ以上の略称のリスト同士の可能な組み合わせを要素とする集合uを生成する。
【0072】
次にプロセッサ1はステップST3−9にて第2ループ処理を開始する。第2ループ処理を開始するとプロセッサ1はステップST3−10において、集合uの各要素について、略称生成ルール設定データ27で指定された仕切り文字を介した連結文字列Y’を生成する。さらにプロセッサ1はステップST3−11において、連結文字Y’について制約条件設定データ23の制約を満たしているか否かを確認し、制約を満たしているならば連結文字Y’を略称候補として略称候補リスト28に加える。このように略称候補を略称候補リスト28に加えた場合、あるいは制約を満たしていないことをステップST3−11にて確認した場合にプロセッサ1はステップST3−13において、集合Uの全ての要素についての連結文字列Y’の生成が終了したか否かの確認を行い、ここで終了を確認できるまでステップST3−9乃至ステップST3−14の第2ループを繰り返し実行する。
【0073】
そして集合Uの全ての要素についての連結文字列Y’の生成が終了したことをステップST3−13にて確認したならば、プロセッサ1は略称生成処理を終了する。
【0074】
このように略称生成処理を終了したならばプロセッサ1は、図3におけるステップST1−10において、ステップST1−3にてリストアップされた処理内容に他定義選択処理が含まれているか否かを確認する。なお、リストアップされた処理内容に略称生成処理が含まれていないことをステップST1−8にて確認した場合にプロセッサ1は、ステップST1−9における略称生成処理を行うことなしに上記ステップST1−10における確認を行う。そして、他定義選択処理が含まれていることを確認したならばプロセッサ1はステップST1−11において、他定義選択処理を実行する。
【0075】
図13は他定義選択処理における処理アルゴリズムを示すフローチャートである。なおこの他定義選択処理は、プロセッサ1が他定義選択処理部16の機能として実行する。
【0076】
プロセッサ1はまずステップST4−1において、辞書要素Eから当該処理内容に含まれる処理対象に記述されたフィールドに相当する文字列Sを読込む。次にプロセッサ1はステップST4−2において、上記の文字列Sについて制約条件設定データ23の制約を満たしているか否かを確認し、制約を満たしている場合は文字列Sを略称候補として略称候補リスト28に加える。これにより、例えば日本語の短縮名称として英語の短縮名称を候補に加えるなどのように、ある言語に関して定められた短縮名称を他の言語の短縮名称の候補とすることが可能になる。
【0077】
このように略称候補を略称候補リスト28に加えた場合、あるいは制約を満たしていないことをステップST4−2にて確認した場合にプロセッサ1は、他定義選択処理を終了する。
【0078】
このように他定義選択処理を終了したならばプロセッサ1は、図3におけるステップST1−12において、短縮名称登録処理を実行する。なお、リストアップされた処理内容に他定義選択処理が含まれていないことをステップST1−10にて確認した場合にプロセッサ1は、ステップST1−11における他定義選択処理を行うことなしに上記ステップST1−12に移行し、短縮名称登録処理を実行する。
【0079】
図14は短縮名称登録処理の処理アルゴリズムを示すフローチャートである。なおこの短縮名称登録処理は、プロセッサ1が短縮名称登録部17の機能として実行する。
【0080】
プロセッサ1はまずステップST5−1において、略称候補リスト28を読込む。続いてプロセッサ1はステップST5−2において、略称候補リスト28の表示形態の設定がユーザにより入力されるのを受け付ける。ここで入力を受け付ける設定は、例えば表示順や最大表示数などである。表示順は、アルファベット順、アイウエオ順、あるいは文字列長順などが想定される。また、最大表示数は、候補数が多い場合の表示数の上限である。
【0081】
次にプロセッサ1はステップST5−3において、上記の入力された設定に応じた表示形態で略称候補リスト28の情報を表示する。この上でプロセッサ1はステップST5−4において、表示されたリストの中から略称を選択するか否かのユーザに指定を受け付け、表示されたリストからの選択が指定されたならばステップST5−5において、ユーザ指定に基づいて略称候補リストから略称を1つ選択する。
【0082】
しかし、表示されたリストからの選択がユーザにより拒否されたならば、プロセッサ1はステップST5−6において、略称を手入力するか否かのユーザ指示を受け付け、手入力が指定されたならばステップST5−7において、ユーザによる略称の入力を受け付ける。
【0083】
このようにユーザによる略称の入力を受け付けた後、あるいはステップST5−5にてリストからの略称の指定を受け付けた後にプロセッサ1はステップST5−8において、上記指定された略称を短縮名称として確定し、この短縮名称を生成の対象として指定されていた辞書要素Eの該当出力先に書き込む。そしてプロセッサ1は、これをもって短縮名称登録処理を終了する。
【0084】
なお、ステップST5−6にて手入力がユーザにより拒否された場合には、プロセッサ1は所定をステップST5−2に戻し、表示形態の再設定を受け付けた上で以降の処理を繰り返す。
【0085】
こののち、プロセッサ1はステップST1−13において、ステップST1−3にて生成した処理内容リストの要素のすべてに関する処理が終了したか否かの確認を行い、ここで終了を確認できるまでステップST1−4乃至ステップST1−14の第1ループを繰り返し実行する。
全ての要素に関する処理が終了したことをステップST1−13にて確認したならば、プロセッサ1はこの図3の処理を終了する。
【0086】
以下、具体例を挙げて、上記の処理により略称登録がなされる様子について説明する。
ここでは、図4における行R1の要素を処理対象とする場合を考える。この処理対象となる要素は、SHORTNAME.ENおよびSHORTNAME.JPがいずれも未設定であり、かつData Typeが「Real」であるから、図5における生成パタン判定ルール22では行R2が判定条件に合致することとなる。そこでこの要素に対しては、SHORTNAME.ENに関しては略語置換処理(PreferredName.EN)および略称生成処理(PreferredName.EN)が、またSHORTNAME.JAに関しては他定義選択処理(SHORTNAME.EN)がそれぞれ適用されることになる。また略語置換処理(PreferredName.EN)および略称生成処理(PreferredName.EN)に用いられる原データは、「Maximum Operational Rated Voltage」となる。
【0087】
図15は略語置換処理により略称候補が生成される様子を示す図である。
図15に示すように、文字列「Maximum Operational Rated Voltage」が部分的に徐々に基本略語により置換されて行き、ここでは「Max−Op−V_r」なる文字列が略称候補として略称候補リスト28に追加される。
【0088】
図16は略称生成処理により略称候補が生成される様子を示す図である。
図16に示すように、文字リストL1、リストL2および集合Uがそれぞれ生成され、これらから、「Man−Opl−Rated Vol」や「Man−Opl−Ratd Vol」などの5つの文字列が新たに略称候補として生成され、略称候補リスト28に追加される。
【0089】
図17は略称候補リスト28からSHORTNAME.ENが決定される様子を示す図である。
略語置換処理および略称生成処理により生成された図17(a)に示すような合計6つの略称候補のうちから、ユーザ指定により図17(b)に示すように「Max−Op−V_r」なる候補がSHORTNAME.ENとして確定される。
【0090】
図18は他定義選択処理の様子を示す図である。
図18(a)に示すように、SHORTNAME.JAに関する他定義選択処理は、SHORTNAME.ENをそのまま略称候補として略称候補リスト28に加えることが定義されている。そこで図18(b)に示すように、上述のようにSHORTNAME.ENとして確定された「Max−Op−V_r」なる語句を略称候補として略称候補リスト28に加える。そして、ユーザによる選択を経て、図18(c)に示すように「Max−Op−V_r」なる候補がSHORTNAME.JAとして確定される。
【0091】
このようにして確定されたSHORTNAME.ENおよびSHORTNAME.JAがそれぞれ図19に示すように辞書データ21に追加され、辞書データ21が更新される。
【0092】
以上のように本実施形態によれば、それぞれ異なる方法で略称候補の生成を行う基本略語置換処理部14、略称生成処理部15および他定義選択処理部16を備えて、作成するべき短縮名称がSHORTNAME.ENおよびSHORTNAME.JAのいずれであるか、ならびに短縮名称の作成の元となる名称のデータタイプに基づいて適切な処理部を選択し、この処理部により略称候補の生成を行うようにしているので、電子カタログの辞書として不特定多数が使用するのに適し、広くコンセンサスをとることが容易な標準的な短縮名称の候補を提供することが可能となる。
【0093】
さらに本実施形態によれば、略称候補のうちからユーザにより指定されたものを短縮名称として確定するようにしているから、作成された短縮名称を例えば本実施形態のように辞書データ21の更新処理などに容易に使用することが可能である。そして本実施形態のように辞書データ21の更新処理を自動的に行うことにより、辞書データ21の作成処理を非常に効率良く行うことを可能とすることができる。
【0094】
また本実施形態によれば、他定義選択処理部16を備えていることにより、ある言語に関して他の言語に基づく短縮名称を採用することが可能であり、多言語化されている辞書データ21に対応して適正な短縮名称の作成を行うことが可能である。
【0095】
なお、本発明は上記実施形態に限定されるものではない。例えば略称生成処理部15で使用する形態素解析としては、日本語の短縮名称を生成する場合で形態素の正確な分析が困難である場合に対応する英語の定義からの単語切り出し情報を利用することで、より正確な形態素分析を行うことなどの他言語情報を利用する新たな形態素解析技術を用いることもできる。
【0096】
また、基本略語置換処理部14、略称生成処理部15および他定義選択処理部16の全てを必ずしも備える必要は無いし、これらの処理部とは異なる方法で略称候補を生成する処理部を備えるようにしても良い。
【0097】
また、短縮名称の確定は、例えば略称候補の中で文字数が最も少ないものとするなどのように、予め定めた条件に従って自動的に行うようにしても良い。
【0098】
また、文字列のコード化や、ソフトウェア開発における関数名の生成などのように電子カタログにおける短縮名称以外の短縮語の作成にも広く適用が可能である。
【0099】
また、短縮名称作成支援プログラム3aは、CD−ROMメディアMからインストールするには限らず、フロッピディスク(R)や、その他の種類の記憶媒体からインストールするようにしても良いし、あるいはインターネットなどのネットワークを介してインストールするようにしても良い。
【0100】
このほか、本発明の要旨を逸脱しない範囲で種々の変形実施が可能である。
【0101】
【発明の効果】
本発明によれば、それぞれ異なる方法で前記短縮語としての候補文字列を生成する複数の候補生成手段のうちの少なくとも1つを、短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報と予め定められたルールとに基づいて有効とし、その有効とした候補生成手段により生成された候補文字列を短縮語の候補として選定することとしたので、複数の方法が適宜使用されて短縮語の候補文字列の生成が行われることとなり、辞書の情報として不特定多数が使用するのに適し、広くコンセンサスを得ることが可能な短縮語を容易に作成することを可能とすることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る電子カタログ辞書作成装置のブロック図。
【図2】図1中の短縮名称作成支援プログラム3aに基づきソフトウェア処理によりプロセッサ1により実現される処理系統の構成を示すブロック図。
【図3】図1中のプロセッサ1による全体の処理アルゴリズムを示すフローチャート。
【図4】図2中の辞書データ21のデータ構造を示す図。
【図5】図2中の生成パタン判定ルール22のデータ構造を示す図。
【図6】図2中の制約条件設定データ23のデータ構造を示す図。
【図7】基本略語置換処理における処理アルゴリズムを示すフローチャート。
【図8】図2中の略称候補生成条件データ24のデータ構造を示す図。
【図9】図2中の基本略語データ25のデータ構造を示す図。
【図10】略称生成処理における処理アルゴリズムを示すフローチャート。
【図11】略称生成ルール設定データ27のデータ構造を示す図。
【図12】形態素解析用辞書26のデータ構造を示す図。
【図13】他定義選択処理における処理アルゴリズムを示すフローチャート。
【図14】短縮名称登録処理の処理アルゴリズムを示すフローチャート。
【図15】略語置換処理により略称候補が生成される様子を示す図。
【図16】略称生成処理により略称候補が生成される様子を示す図。
【図17】略称候補リストからSHORTNAME.ENが決定される様子を示す図。
【図18】他定義選択処理の様子を示す図。
【図19】確定されたSHORTNAME.ENおよびSHORTNAME.JAにより更新された辞書データの一例を示す図。
【符号の説明】
1…プロセッサ
2…メインメモリ
3…ハードディスク装置
3a…短縮名称作成支援プログラム
4…CD−ROMドライブ
5…キーボード/マウス
6…ディスプレイ
7…バス
11…辞書データ読込み部
12…短縮名称生成パタン判定部
13…生成処理制御部
14…基本略語置換処理部
15…略称生成処理部
16…他定義選択処理部
17…短縮名称登録部
21…辞書データ
22…生成パタン判定ルール
23…制約条件設定データ
24…略称候補生成条件データ
25…基本略語データ
26…形態素解析用辞書
27…略称生成ルール設定データ
28…略称候補リスト
M…CD−ROMメディア
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an abbreviated word creation support device and an abbreviated word creation support program for supporting creation of abbreviated words related to phrases included in the electronic catalog dictionary when creating an electronic catalog dictionary.
[0002]
[Prior art]
An electronic catalog system is a system for providing product information using a computer network. "ISO 13548 (Parts Library)" has been established as an international standard for constructing an electronic catalog system for electronically providing product information on the Internet. In this "ISO 13548", an electronic catalog is composed of a dictionary and contents, and a uniform data structure is provided for sharing and reuse of product information.
[0003]
In the dictionary defined by “ISO13548”, the main components are a product category represented on a tree as a concept hierarchy and a technical attribute (specification item) to which the product category belongs. Short names are associated with names for defining product categories and specification items.
[0004]
Since short names do not include words that have gained widespread consensus on all of the names used to define product categories and specifications, it is important that the workers have appropriate I had to consider short names.
[0005]
As a method of generating a short name of a product classification, the method of Patent Document 1 is known.
[0006]
In addition, as a general method of shortening character data, a method of converting a character using an abbreviation dictionary to keep the number of characters within a limit (for example, see Patent Literature 2), a generation method using an abbreviation generation rule (for example, see Patent Literature 3) It has been known.
[0007]
[Patent Document 1]
JP 2000-11178 A
[0008]
[Patent Document 2]
JP-A-2002-7104
[0009]
[Patent Document 3]
JP-A-11-25117
[0010]
[Problems to be solved by the invention]
As described above, in the related art, a dictionary creation operator has performed the creation of abbreviated names, which required a large number of man-hours.
[0011]
By using the technique of Patent Document 1, it is possible to reduce the burden on the dictionary creation worker. However, in the technique of Patent Document 1, since the creation of the abbreviated name is based on the information of the concept hierarchy in the product classification, it is not possible to generate the abbreviated name of the specification item having no such information.
[0012]
Further, the technique disclosed in Patent Document 2 is a method in which a character string is replaced with previously registered abbreviation data. If there is no corresponding abbreviation data, it is necessary to input the abbreviation data each time. It is difficult to achieve a sufficient effect in the development of a dictionary.
[0013]
Further, the technique of Patent Document 3 is a method of generating an abbreviation by dividing a character string, combining characters, and combining the extracted characters. However, this is a method for an individual to efficiently search a sentence. Lack of flexibility in the expressiveness of the rules. For this reason, it is difficult to generate a short name that can imagine the meaning of the original name as a standard short name used by an unspecified majority. This is not a suitable technique.
[0014]
Therefore, the present invention has been made in view of such circumstances, and the purpose of the present invention is to provide abbreviations that are suitable for use by an unspecified number of people as information in a dictionary and that can obtain a broad consensus. It is to enable easy creation.
[0015]
[Means for Solving the Problems]
In order to achieve the above object, the present invention provides a method for generating a plurality of candidate words, each of which generates a candidate character string as a shortened word by a different method based on information indicated in an electronic catalog dictionary with respect to a phrase to be abbreviated. Means for selecting at least one of the plurality of candidate generating means by a selecting means based on information indicated in the electronic catalog dictionary and a predetermined rule with respect to a phrase to be abbreviated for word creation. The candidate selecting unit selects the candidate character string generated by the selected candidate generating unit as the shortened word candidate.
[0016]
By adopting such means, at least one of the plurality of candidate generating means for generating the candidate character string as the shortened word in a different manner is different from the electronic catalog dictionary with respect to the phrase for which the shortened word is to be created. And the candidate character string generated by the validated candidate generating means is selected as a candidate for a shortened word. Therefore, a plurality of methods are appropriately used to generate abbreviated word candidate character strings.
[0017]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
[0018]
FIG. 1 is a block diagram of an electronic catalog dictionary creation device according to the present embodiment. The electronic catalog dictionary creation device supports creation of a short name (SHORTNAME), which is a requirement of the IS01584 standard, in the definition of dictionary data of the IS01584 standard.
[0019]
As shown in FIG. 1, the electronic catalog dictionary creation device has a processor 1, a main memory 2, a hard disk device 3, a CD-ROM drive 4, a keyboard / mouse 5, and a display 6. These components are connected to each other via a bus 7.
[0020]
The processor 1 performs various control processes by executing software processing according to a program stored in the hard disk device 3.
[0021]
The main memory 2 temporarily stores software actually used by the processor 1 and other data.
[0022]
The hard disk device 3 stores a program for an operating system used by the processor 1. The hard disk device 3 stores an application program, a driver program, or any other data in addition to an operating system program. The hard disk drive 3 stores a short name creation support program 3a. The abbreviated name creation support program 3a causes the processor 1 to execute processing to be described later for creating abbreviated names for registration in the electronic catalog dictionary.
[0023]
The CD-ROM drive 4 reads data from the CD-ROM medium M.
[0024]
The keyboard / mouse 5 receives various instruction inputs from the user.
[0025]
The display 6 displays images for notifying various information to the user.
[0026]
A general-purpose personal computer, for example, is used as the electronic catalog dictionary creation device. Therefore, initially, the short name creation support program 3a is not installed. Therefore, as a part of the introduction work of the information processing system, the short name creation support program 3a stored in the CD-ROM medium M is installed in the hard disk device 3.
[0027]
Here, the short name creation support program 3a causes the processor 1 to operate as each processing unit as shown in FIG.
[0028]
FIG. 2 is a block diagram showing a relationship between processing units realized by the processor 1 based on the short name creation support program 3a. FIG. 2 also shows various data stored in the main memory 2 and the hard disk device 3 for reference by each processing unit.
[0029]
As shown in FIG. 2, the processor 1 includes a dictionary data reading unit 11, a short name generation pattern determining unit 12, a generation processing control unit 13, a basic abbreviation substitution processing unit 14, an abbreviation generation processing unit 15, and another definition selection processing unit 16. And it operates as each of the short name registration unit 17. Also, dictionary data 21, generation pattern determination rules 22, constraint condition setting data 23, abbreviation candidate generation condition data 24, basic abbreviation data 25, morphological analysis dictionary 26, abbreviation generation rule setting data 27, and abbreviation candidate list 28 are prepared. You.
[0030]
The dictionary data reading unit 11 reads a dictionary element for which a short name is to be created from the dictionary data 21.
[0031]
The short name generation pattern determination unit 12 determines a list of processing contents to be executed based on the information included in the read dictionary element and the generation pattern determination rule 22. The processing content list determined here indicates one of the basic abbreviation replacement processing unit 14, the abbreviation generation processing unit 15, and the other definition selection processing unit 16 that should be used for generating abbreviation candidates.
[0032]
The generation processing control unit 13 causes the processing unit shown in the processing content list among the basic abbreviation substitution processing unit 14, the abbreviation generation processing unit 15, and the other definition selection processing unit 16 to execute the abbreviation candidate creation processing. The generation processing control unit 13 controls the basic abbreviation substitution processing unit 14, the abbreviation generation processing unit 15, and the other definition selection processing unit 16 so as to generate an abbreviation candidate that matches the condition indicated in the constraint condition setting data 23.
[0033]
The basic abbreviation replacement processing unit 14 generates abbreviation candidates by replacing the character string that is the basis of the abbreviation with the basic abbreviation data 25 under the conditions indicated in the abbreviation candidate generation condition data 24. The basic abbreviation substitution processing unit 14 adds the generated abbreviation candidate to the abbreviation candidate list 28.
[0034]
The abbreviation generation processing unit 15 analyzes the syntax of the character string that is the source of the abbreviation with reference to the morphological analysis dictionary 26, and identifies abbreviation candidates based on the analysis result and the rules indicated in the abbreviation generation rule setting data. Generate. The abbreviation generation processing unit 15 adds the generated abbreviation candidate to the abbreviation candidate list 28.
[0035]
The other definition selection processing unit 16 selects, as abbreviation candidates, an abbreviation determined for a phrase indicating the same object in a language different from the character string that is the base of the abbreviation. The other definition selection processing unit 16 adds the generated abbreviation candidate to the abbreviation candidate list 28.
[0036]
The short name registration unit 17 determines an abbreviation from the abbreviation candidates stored in the abbreviation candidate list 28, and registers the abbreviation in the dictionary data 21.
[0037]
Next, the operation of the electronic catalog dictionary creating apparatus configured as described above will be described.
FIG. 3 is a flowchart showing an overall processing algorithm by the processor 1 in the present embodiment.
In step ST1-1, the processor 1 first reads a dictionary element E for which a short name is to be created from the dictionary data 21 as a function of the dictionary data reading unit 11.
[0038]
FIG. 4 is a diagram showing the data structure of the dictionary data 21.
In the present embodiment, the dictionary data 21 is expressed as tabular data, and one dictionary element is expressed as one row. The dictionary element is a CODE field 21a, PREFNAME. EN field 21b, PREFNAME. JA field 21c, SHORTNAME. EN field 21d, SHORTNAME. Each field includes a JA field 21e and a Data Type field 21f. Note that each field of the dictionary element is composed of the requirements specified in IS01584, but FIG. 4 shows a portion necessary for the description of the present invention. The CODE field 21a indicates CODE, which is an identifier of a dictionary element. PREFNAME. In the EN field 21b, a PREFNAME. EN is indicated. PREFNAME. In the JA field 21c, a PREFNAME. JA is indicated. SHORTNAME. In the EN field 21d, SHORTNAME. EN is indicated. SHORTNAME. In the JA field 21e, SHORTNAME. JA is indicated. The Data Type field 21f indicates a Data Type that defines the format of the dictionary element.
[0039]
For example, in the row R1 in FIG. 4, the dictionary element PREFNAME. EN is “Maximum Operational Rated Voltage”, and PREFNAME. Indicates that EN is "maximum rated working voltage". Also, SHORTNAME. EN and SHORTNAME. Indicates that no JA has been registered. Furthermore, it indicates that Data Type is “Real”, that is, a real number type.
[0040]
Subsequently, in step ST1-2, the processor 1 determines the short name generation pattern based on the information included in the dictionary element E and the generation pattern determination rule 22 as a function of the short name generation pattern determination unit 12, and further executes the short name generation pattern. Determine the list of processing contents to be performed.
[0041]
FIG. 5 is a diagram showing a data structure of the generation pattern determination rule 22.
The generation pattern determination rule 22 includes a determination condition field 22a and a generation processing field 22b. The judgment condition field 22a describes a judgment condition regarding a dictionary element to be generated. Here, the determination condition is SHORTNAME. Of the dictionary element to be processed. The presence or absence of data in the EN field 21d, SHORTNAME. It consists of the presence / absence of data in the JA field 21e and the value of the Data Type field 21f. The generation processing field 22b indicates the contents of processing applied to dictionary elements that match each determination condition.
[0042]
For example, in row R2 in FIG.
(SHORTNAME.JA = none) ∧ (SHORTNAME.EN = none) ∧ (DataType = (Real∨Integer))
Regarding the processing of the dictionary element satisfying the condition of “SHORTNAME. The abbreviation substitution processing (PreferredName.EN) and the abbreviation generation processing (PreferredName.EN) are applied to the generation of EN. A rule is described in which another definition selection processing (SHORTNAME.EN) is applied to the generation of JA.
[0043]
After that, the processor 1 starts the first loop processing in step ST1-4 as a function of the generation processing control unit 13. When the first loop process is started, in step ST1-5, the processor 1 reads a constraint condition from the constraint condition setting data 23 according to the process content listed above, and determines the process content.
[0044]
FIG. 6 is a diagram showing the data structure of the constraint condition setting data 23. The constraint condition setting data includes a generation target field 23a, a maximum character string length field 23b, and an available character field 23c. The generation target field 23a indicates a feed to be generated. The maximum character string length field 23b indicates the maximum character string length of the generated short name. The usable character field 23c indicates a type of usable character. In the usable character field 23c, flags relating to a plurality of character types are prepared in advance, and indicate that a character type whose corresponding flag is "Y" is available. In the present embodiment, a constraint defined in IEC61360 is described as a constraint.
[0045]
Thereafter, in step ST1-6, the processor 1 checks whether or not the abbreviation replacement processing is included in the above-listed processing contents, and if it is included, in step ST1-7, the basic abbreviation replacement processing is performed. Execute
[0046]
FIG. 7 is a flowchart showing a processing algorithm in the basic abbreviation replacement processing. The basic abbreviation replacement processing is executed by the processor 1 as a function of the basic abbreviation replacement processing unit 14.
[0047]
In the basic abbreviation replacement process, the processor 1 first reads a character string X corresponding to a field described in a processing target included in the processing content from a dictionary element E to be processed in step ST2-1.
[0048]
Next, in step ST2-2, the processor 1 reads the abbreviation candidate generation condition data 24. Next, in step ST2-3, the processor 1 searches the partial character strings of the character string X for a word that matches the word described in the basic abbreviation data 25 based on the read abbreviation candidate generation condition data 24. I do.
[0049]
FIG. 8 is a diagram showing the data structure of the abbreviation candidate generation condition data 24. In the present embodiment, the abbreviation candidate generation condition data 24 includes a matching method field 24a and a partition character field 24b. The matching method field 24a indicates designation information of a matching method between the character string X and the word stored in the basic abbreviation data 25. Specifically, a list of available matching methods and a flag indicating whether or not the matching methods can be used are prepared, and the matching method with the flag “Y” should be used. . In the example of FIG. 8, it is indicated that the matching method “longest match on the left” is specified as the matching method to be used. Therefore, in step ST2-3, the processor 1 performs a search using the matching method specified as described above.
[0050]
FIG. 9 is a diagram showing the data structure of the basic abbreviation data 25. The basic abbreviation data 25 includes a word field 25a and an abbreviation field 25b. The word field 25a indicates a word serving as a headline for a search. The abbreviation field 25b indicates an abbreviation corresponding to the word indicated in the corresponding word field 25a. As the basic abbreviation data 25, an existing standard or the like may be used, and IEC60027, IEC60747, IEC60748 or the like, which is the standard of the character symbol of the technical attribute, may be stored in the abbreviation field. 25 can broadly obtain consensus.
[0051]
Then, in step ST2-4, the processor 1 checks whether a matching word is found.
[0052]
If a matching word is found, in step ST2-5, the processor 1 converts the partial character string searched from the character string X into an abbreviation for the matching word as a partitioning character specified in the abbreviation candidate generation condition data 24. To generate a character string X 'replaced with a character string replaced with the character string X'.
[0053]
As shown in FIG. 8, the abbreviation candidate generation condition data 24 includes a list of usable partition characters and a flag indicating whether or not the partition characters can be used. The flag is set to “Y”. Is the one that should be used. The example in FIG. 8 indicates that the character “-” is specified as a partition character.
[0054]
Subsequently, in step ST2-6, the processor 1 checks whether or not the character string X 'satisfies the constraint indicated by the constraint condition setting data 23. When it is confirmed that the constraint is satisfied, the processor 1 adds the character string X ′ to the abbreviation candidate list 28 in step ST2-7. When the abbreviated name candidate is added to the abbreviated name candidate list 28 or when it is confirmed in step ST2-6 that the constraint is not satisfied, the processor 1 converts the character string X 'into the character string X in step ST2-8. Then, the processes after step ST2-3 are repeated.
[0055]
When it is confirmed in step ST2-4 that no matching word is found, the processor 1 determines in step ST2-9 whether the character string X satisfies the constraint indicated by the constraint condition setting data 23. Confirm. Then, when it is confirmed that the constraint is satisfied, the processor 1 adds the character string X to the abbreviation candidate list 28 as an abbreviation candidate in step ST2-10. When the abbreviation candidate is added to the abbreviation candidate list 28 as described above, or when it is confirmed in step ST2-9 that the constraint is not satisfied, the processor 1 ends the basic abbreviation substitution process.
[0056]
When the basic abbreviation replacement processing is completed in this way, the processor 1 checks in step ST1-8 in FIG. 3 whether the processing contents listed in step ST1-3 include the abbreviation generation processing. I do. If it is confirmed in step ST1-6 that the listed processing contents do not include the abbreviation replacement processing, the processor 1 proceeds to step ST1-7 without performing the basic abbreviation replacement processing in step ST1-7. Check at -8. Then, if it is confirmed that the abbreviation generation process is included, the processor 1 executes the abbreviation generation process in step ST1-9.
[0057]
FIG. 10 is a flowchart showing a processing algorithm in the abbreviation generation processing. Note that this abbreviation generation processing is executed by the processor 1 as a function of the abbreviation generation processing unit 15.
[0058]
First, in step ST3-1, the processor 1 sets the abbreviation generation rule according to the input from the user, and stores it as the abbreviation generation rule setting data 27.
[0059]
FIG. 11 is a diagram showing the data structure of the abbreviation generation rule setting data 27. The abbreviation generation rule setting data 27 includes setting information 27a of a method of omitting a word and setting information 27b of a partition character when performing character concatenation.
[0060]
Omission methods can be set separately for the subject and the qualifier, and a list of applicable processing methods and the availability of these processing methods can be set for each. And a flag indicating “Y” is to be used.
[0061]
In this embodiment, the following four omission methods are provided.
[0062]
(1) Extract n characters from the beginning of each morpheme.
[0063]
{Circle around (2)} Extracting the last n characters connected to the last n characters of each morpheme.
[0064]
(3) Extract the vowels (excluding the head) of each morpheme that are omitted.
[0065]
(4) Extract the entire morpheme (= no processing).
[0066]
Separate characters can be set separately for the case between the qualifier and the subject and between the qualifiers. A list of applicable partition characters for each of them and the availability of those And a flag indicating the flag is set to "Y".
[0067]
Therefore, in step ST3-1, the processor 1 accepts a user specification of which omission method and partitioning character to use, and sets the corresponding flag to "Y". Regarding the omission method, it is allowed to specify a plurality of processes. For example, the processing of (1) and (4) can be selected for the morpheme corresponding to the subject, and the processing of (2) and (3) can be selected for the morpheme corresponding to the modifier. As for the partitioning character, the user can specify the partitioning character between the subject and the modifier and between the modifiers. Thus, more flexible abbreviation generation can be performed.
[0068]
Next, in step ST3-2, the processor 1 reads, from the dictionary element E, a character string Y corresponding to a field described as a processing target included in the processing content. Then, in step ST3-3, the processor 1 analyzes the syntax of the character string Y based on the morphological analysis dictionary 26, and generates a character string list L1 divided for each morpheme. For morphological analysis, we extract words and analyze the relationship between words, and if we can divide them into a set of nouns that are the subject of a sentence and a set of modifiers that modify the nouns, we can achieve this by using existing parsing technology Is possible.
[0069]
FIG. 12 is a diagram showing a data structure of the morphological analysis dictionary 26. The morphological analysis dictionary includes a character string field 26a describing a word, a word part of speech field 26b, and a semantic feature field 26c.
[0070]
Subsequently, the processor 1 starts a first loop process in step ST3-4. When the first loop process is started, in step ST3-5, the processor 1 executes the abbreviation generation rule indicated by the abbreviation generation rule setting data 27 for each of the elements E1 of the character string list L1 and sets a set of abbreviations of E1. (E2, E3,... En) are generated. Then, the processor 1 generates a list L2 having a set (E1, E2, E3,... En) obtained by adding E1 to the set (E2, E3,... En). After that, in step ST3-6, the processor 1 checks whether or not the generation of the list L2 has been completed for all the elements of the character list L1. Until the end can be confirmed, the processor 1 checks in steps ST3-4 to ST3-3. 7 is repeatedly executed.
[0071]
When it is confirmed in step ST3-6 that the generation of all the lists L2 has been completed, the processor 1 determines in step ST3-8 the elements of the list L2, ie, a list of each morpheme and one or more generated abbreviations. A set u is generated, which includes elements that are possible combinations of each other.
[0072]
Next, the processor 1 starts a second loop process in step ST3-9. When the second loop process is started, in step ST3-10, the processor 1 generates a concatenated character string Y 'via the partition character specified by the abbreviation generation rule setting data 27 for each element of the set u. Further, in step ST3-11, the processor 1 confirms whether or not the concatenated character Y 'satisfies the constraint of the constraint condition setting data 23. If the constraint is satisfied, the concatenated character Y' is regarded as an abbreviated candidate list. Add to 28. When the abbreviated name candidate is added to the abbreviated name candidate list 28 or when it is confirmed in step ST3-11 that the constraint is not satisfied, the processor 1 determines in step ST3-13 about all the elements of the set U. It is determined whether or not the generation of the concatenated character string Y 'has been completed, and the second loop of steps ST3-9 to ST3-14 is repeatedly executed until the completion is confirmed.
[0073]
If it is confirmed in step ST3-13 that the generation of the concatenated character string Y 'has been completed for all the elements of the set U, the processor 1 ends the abbreviation generation processing.
[0074]
When the abbreviation generation processing is completed in this way, the processor 1 checks in step ST1-10 in FIG. 3 whether or not the processing content listed in step ST1-3 includes another definition selection processing. I do. If it is confirmed in step ST1-8 that the listed processing contents do not include the abbreviation generation processing, the processor 1 proceeds to step ST1-9 without performing the abbreviation generation processing in step ST1-9. Confirmation at 10 is performed. Then, if it is confirmed that the other definition selection process is included, the processor 1 executes another definition selection process in step ST1-11.
[0075]
FIG. 13 is a flowchart showing a processing algorithm in the other definition selection processing. The other definition selection process is executed by the processor 1 as a function of the other definition selection processing unit 16.
[0076]
First, in step ST4-1, the processor 1 reads a character string S corresponding to a field described as a processing target included in the processing content from the dictionary element E. Next, in step ST4-2, the processor 1 checks whether or not the character string S satisfies the constraint of the constraint condition setting data 23. If the constraint is satisfied, the processor 1 sets the character string S as an abbreviated candidate. Add to list 28. This makes it possible to use a short name defined for a certain language as a candidate for a short name in another language, such as adding an English short name to a candidate as a Japanese short name.
[0077]
When the abbreviation candidate is added to the abbreviation candidate list 28 in this way, or when it is confirmed in step ST4-2 that the constraint is not satisfied, the processor 1 ends the other definition selection process.
[0078]
After completing the other definition selection process, the processor 1 executes the short name registration process in step ST1-12 in FIG. When it is confirmed in step ST1-10 that the other process is not included in the listed processing contents, the processor 1 proceeds to step ST1-11 without performing the other definition selecting process. The process proceeds to ST1-12 to execute abbreviated name registration processing.
[0079]
FIG. 14 is a flowchart showing the processing algorithm of the short name registration processing. This short name registration process is executed by the processor 1 as a function of the short name registration unit 17.
[0080]
The processor 1 first reads the abbreviation candidate list 28 in step ST5-1. Subsequently, in step ST5-2, the processor 1 accepts that the setting of the display form of the abbreviation candidate list 28 is input by the user. Here, the setting for accepting the input is, for example, the display order, the maximum display number, and the like. The display order is assumed to be alphabetical order, eyewear order, character string length order, or the like. The maximum display number is an upper limit of the display number when the number of candidates is large.
[0081]
Next, in step ST5-3, the processor 1 displays the information of the abbreviated name candidate list 28 in a display form according to the input setting. Then, in step ST5-4, the processor 1 accepts the user's designation as to whether or not to select an abbreviation from the displayed list. If the selection from the displayed list is designated, the processor 1 proceeds to step ST5-5. In, one abbreviation is selected from the abbreviation candidate list based on the user's designation.
[0082]
However, if the selection from the displayed list is rejected by the user, in step ST5-6, the processor 1 receives a user instruction as to whether or not to manually input the abbreviation. In ST5-7, the input of the abbreviation by the user is accepted.
[0083]
After receiving the input of the abbreviation by the user or receiving the designation of the abbreviation from the list in step ST5-5, the processor 1 determines the specified abbreviation as the short name in step ST5-8. Then, the short name is written to the corresponding output destination of the dictionary element E specified as the target of generation. Then, the processor 1 ends the short name registration processing.
[0084]
If manual input is rejected by the user in step ST5-6, the processor 1 returns the process to step ST5-2, accepts resetting of the display mode, and repeats the subsequent processing.
[0085]
Thereafter, in step ST1-13, the processor 1 checks whether or not the processing regarding all the elements of the processing content list generated in step ST1-3 has been completed. The first loop from step 4 to step ST1-14 is repeatedly executed.
If it is confirmed in step ST1-13 that the processing for all elements has been completed, the processor 1 ends the processing in FIG.
[0086]
Hereinafter, the manner in which abbreviations are registered by the above processing will be described with reference to specific examples.
Here, a case is considered where the element in row R1 in FIG. 4 is to be processed. The element to be processed is SHORTNAME. EN and SHORTNAME. Since no JP has been set and Data Type is “Real”, the row R2 matches the determination condition in the generation pattern determination rule 22 in FIG. Therefore, for this element, SHORTNAME. For EN, abbreviation substitution processing (PreferredName.EN) and abbreviation generation processing (PreferredName.EN) are performed, and SHORTNAME.EN is also executed. For JA, the other definition selection processing (SHORTNAME.EN) is applied. The original data used in the abbreviation replacement process (PreferredName.EN) and the abbreviation generation process (PreferredName.EN) is “Maximum Operational Rated Voltage”.
[0087]
FIG. 15 is a diagram illustrating a state in which abbreviation candidates are generated by the abbreviation substitution process.
As shown in FIG. 15, the character string “Maximum Operational Rated Voltage” is partially and gradually replaced by a basic abbreviation. Here, the character string “Max-Op-V_r” is included in the abbreviation candidate list 28 as the abbreviation candidate. Will be added.
[0088]
FIG. 16 is a diagram illustrating a manner in which abbreviation candidates are generated by the abbreviation generation process.
As shown in FIG. 16, a character list L1, a list L2, and a set U are respectively generated, and five character strings such as “Man-Opl-Rated Vol” and “Man-Opl-Ratd Vol” are newly generated from these. An abbreviation candidate is generated and added to the abbreviation candidate list 28.
[0089]
FIG. 17 shows a short name candidate list 28 showing SHORTNAME. It is a figure showing signs that EN is determined.
Among the total of six abbreviation candidates as shown in FIG. 17A generated by the abbreviation substitution process and the abbreviation generation process, the candidate “Max-Op-V_r” as shown in FIG. Is SHORTNAME. It is determined as EN.
[0090]
FIG. 18 is a diagram showing a state of the other definition selecting process.
As shown in FIG. 18A, SHORTNAME. The other definition selection process for JA is SHORTNAME. It is defined that EN is directly added to the abbreviation candidate list 28 as an abbreviation candidate. Therefore, as shown in FIG. 18B, SHORTNAME. The phrase “Max-Op-V_r” determined as EN is added to the abbreviation candidate list 28 as an abbreviation candidate. After selection by the user, as shown in FIG. 18C, a candidate “Max-Op-V_r” is displayed as SHORTNAME. It is determined as JA.
[0091]
The SHORTNAME. EN and SHORTNAME. JA is added to the dictionary data 21 as shown in FIG. 19, and the dictionary data 21 is updated.
[0092]
As described above, according to the present embodiment, the basic abbreviation replacement processing unit 14, the abbreviation generation processing unit 15, and the other definition selection processing unit 16 that generate the abbreviation candidates by different methods are provided. SHORTNAME. EN and SHORTNAME. JA, and an appropriate processing unit is selected based on the data type of the name from which the short name is created, and abbreviated name candidates are generated by this processing unit. This makes it possible to provide standard short name candidates that are suitable for use by an unspecified number of dictionaries and that can be widely consented.
[0093]
Further, according to the present embodiment, the abbreviation candidate specified by the user is determined as the abbreviated name, so that the created abbreviated name is updated in the dictionary data 21 as in the present embodiment, for example. It can be easily used for example. By automatically performing the update process of the dictionary data 21 as in the present embodiment, it is possible to perform the process of creating the dictionary data 21 very efficiently.
[0094]
Further, according to the present embodiment, the provision of the other definition selection processing unit 16 makes it possible to employ abbreviated names based on other languages for a certain language. Correspondingly, it is possible to create an appropriate abbreviated name.
[0095]
Note that the present invention is not limited to the above embodiment. For example, the morpheme analysis used by the abbreviation generation processing unit 15 is to use word segmentation information from the English definition corresponding to the case where it is difficult to accurately analyze morphemes when generating abbreviated Japanese names. It is also possible to use a new morphological analysis technique utilizing other language information, such as performing more accurate morphological analysis.
[0096]
Further, it is not always necessary to include all of the basic abbreviation replacement processing unit 14, the abbreviation generation processing unit 15, and the other definition selection processing unit 16, and a processing unit that generates abbreviation candidates by a method different from these processing units may be provided. You may do it.
[0097]
Further, the abbreviation name may be automatically determined in accordance with a predetermined condition, for example, by setting the number of characters to be the smallest among the abbreviation candidates.
[0098]
Further, the present invention can be widely applied to the creation of abbreviated words other than the abbreviated names in an electronic catalog, such as encoding a character string or generating a function name in software development.
[0099]
Further, the short name creation support program 3a is not limited to be installed from the CD-ROM medium M, but may be installed from a floppy disk (R) or another type of storage medium, or may be installed on the Internet or the like. You may make it install via a network.
[0100]
In addition, various modifications can be made without departing from the spirit of the present invention.
[0101]
【The invention's effect】
According to the present invention, at least one of the plurality of candidate generating means for generating the candidate character string as the shortened word by a different method is indicated in the electronic catalog dictionary with respect to the phrase for which the shortened word is to be created. Of the candidate character string generated by the valid candidate generating means as a candidate for a shortened word, a plurality of methods are appropriately used. Generation of abbreviated word candidate character strings will be performed, and it is possible to easily create abbreviated words that are suitable for use by unspecified majority as dictionary information and that can obtain a wide consensus. it can.
[Brief description of the drawings]
FIG. 1 is a block diagram of an electronic catalog dictionary creation device according to an embodiment of the present invention.
FIG. 2 is a block diagram showing a configuration of a processing system realized by a processor 1 by software processing based on a short name creation support program 3a in FIG.
FIG. 3 is a flowchart showing an overall processing algorithm by a processor 1 in FIG. 1;
FIG. 4 is a view showing a data structure of dictionary data 21 in FIG. 2;
FIG. 5 is a diagram showing a data structure of a generation pattern determination rule 22 in FIG. 2;
FIG. 6 is a diagram showing a data structure of constraint condition setting data 23 in FIG. 2;
FIG. 7 is a flowchart illustrating a processing algorithm in a basic abbreviation replacement process.
FIG. 8 is a diagram showing a data structure of abbreviation candidate generation condition data 24 in FIG. 2;
FIG. 9 is a diagram showing a data structure of basic abbreviation data 25 in FIG. 2;
FIG. 10 is a flowchart illustrating a processing algorithm in abbreviated name generation processing.
FIG. 11 is a diagram showing a data structure of abbreviation generation rule setting data 27;
FIG. 12 is a diagram showing a data structure of a morphological analysis dictionary 26;
FIG. 13 is a flowchart showing a processing algorithm in another definition selection processing.
FIG. 14 is a flowchart illustrating a processing algorithm of a short name registration process.
FIG. 15 is a diagram showing a state in which abbreviation candidates are generated by the abbreviation substitution process.
FIG. 16 is a diagram illustrating a manner in which abbreviation candidates are generated by abbreviation generation processing.
FIG. 17 shows an example of a short name candidate list. The figure which shows a mode that EN is determined.
FIG. 18 is a diagram showing a state of another definition selecting process.
FIG. 19: Confirmed SHORTNAME. EN and SHORTNAME. The figure which shows an example of the dictionary data updated by JA.
[Explanation of symbols]
1. Processor
2 ... Main memory
3 ... Hard disk drive
3a: Short name creation support program
4: CD-ROM drive
5. Keyboard / mouse
6. Display
7 ... Bus
11: Dictionary data reading unit
12: Short name generation pattern judgment unit
13: generation processing control unit
14 Basic abbreviation replacement processing unit
15: Abbreviation generation processing unit
16 Other definition selection processing unit
17… Short name registration section
21 ... Dictionary data
22 ... Generation pattern judgment rule
23… Constraint condition setting data
24 ... Abbreviated name candidate generation condition data
25 Basic abbreviation data
26 ... Dictionary for morphological analysis
27 ... Abbreviation generation rule setting data
28 ... Abbreviated name candidate list
M: CD-ROM media

Claims (10)

電子カタログ辞書に含まれる語句に関する短縮語の作成を支援する短縮語作成支援装置において、
短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報に基づきそれぞれ異なる方法で前記短縮語としての候補文字列を生成する複数の候補生成手段と、
短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報と予め定められたルールとに基づいて前記複数の候補生成手段のうちの少なくとも1つを選択する選択手段と、
この選択手段により選択された候補生成手段により生成された候補文字列を前記短縮語の候補として選定する候補選定手段とを具備したことを特徴とする短縮語作成支援装置。
In a shortened word creation support device that supports creation of shortened words related to phrases included in an electronic catalog dictionary,
A plurality of candidate generating means for generating a candidate character string as the shortened word in a different manner based on information indicated in the electronic catalog dictionary with respect to a phrase to be shortened,
Selecting means for selecting at least one of the plurality of candidate generating means based on information indicated in the electronic catalog dictionary and a predetermined rule with respect to a phrase to be abbreviated,
An abbreviation word creation support device, comprising: candidate selection means for selecting a candidate character string generated by the candidate generation means selected by the selection means as a candidate for the shortened word.
前記候補選定手段により選定された前記短縮語の候補のうちから所定の決定条件に従って前記短縮語を決定する短縮語決定手段を備えたことを特徴とする請求項1に記載の短縮語作成支援装置。2. The abbreviated word creation support apparatus according to claim 1, further comprising: abbreviated word determination means for determining the abbreviated word according to a predetermined determination condition from among the abbreviated word candidates selected by the candidate selection means. . 前記短縮語決定手段は、前記短縮語の候補のうちから短縮語とするもののユーザ指定を受け付け、そのユーザ指定に応じて短縮語を決定することを特徴とする請求項2に記載の短縮語作成支援装置。3. The abbreviated word creation method according to claim 2, wherein the abbreviated word determination means receives a user designation of abbreviated words from among the abbreviated word candidates and determines abbreviated words according to the user designation. Support device. 前記短縮語決定手段により決定された短縮語を前記電子カタログ辞書に登録する登録手段を備えたことを特徴とする請求項1乃至請求項3のいずれかに記載の短縮語作成支援装置。4. The abbreviated word creation support device according to claim 1, further comprising a registration unit that registers the abbreviation word determined by the abbreviation word determination unit in the electronic catalog dictionary. 前記候補生成手段としては、短縮語作成の対象となる語句に含まれる文字列を予め用意された基本略語で置換することで前記候補文字列を生成するものを含むことを特徴とする請求項1乃至請求項4のいずれかに記載の短縮語作成支援装置。2. The candidate generating unit according to claim 1, wherein the candidate generating unit generates the candidate character string by replacing a character string included in a phrase to be abbreviated with a basic abbreviation prepared in advance. A shortened word creation support device according to any one of claims 4 to 4. 前記候補生成手段としては、短縮語作成の対象となる語句の構文を解析し、この解析結果を予め定められた短縮語生成規則に基づいて処理することで前記候補文字列を生成するものを含むことを特徴とする請求項1乃至請求項5のいずれかに記載の短縮語作成支援装置。The candidate generating unit includes a unit that analyzes the syntax of a phrase for which a shortened word is to be created, and processes the analysis result based on a predetermined shortened word generating rule to generate the candidate character string. The abbreviation creation support apparatus according to any one of claims 1 to 5, wherein: 前記電子カタログ辞書は多言語化されたものであって、
かつ前記候補生成手段としては、短縮語作成の対象となる語句に対応する他言語に対して定められた短縮語を前記候補文字列とするものを含むことを特徴とする請求項1乃至請求項6のいずれかに記載の短縮語作成支援装置。
The electronic catalog dictionary is multilingualized,
4. The method according to claim 1, wherein the candidate generating unit includes a unit that uses a shortened word defined for another language corresponding to a phrase to be abbreviated as the candidate character string. 6. The shortened word creation support device according to any one of 6.
電子カタログ辞書に含まれる語句に関する短縮語の作成を支援するための処理をコンピュータに行わせるもので、前記コンピュータを、
短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報に基づきそれぞれ異なる方法で前記短縮語としての候補文字列を生成する複数の候補生成手段と、
短縮語作成の対象となる語句に関して前記電子カタログ辞書に示された情報と予め定められたルールとに基づいて前記複数の候補生成手段のうちの少なくとも1つを選択する選択手段と、
この選択手段により選択された候補生成手段により生成された候補文字列の全てを前記短縮語の候補として選定する候補選定手段としてそれぞれ機能させる短縮語作成支援プログラム。
What causes the computer to perform processing for supporting the creation of abbreviated words related to phrases included in the electronic catalog dictionary, the computer,
A plurality of candidate generating means for generating a candidate character string as the shortened word in a different manner based on information indicated in the electronic catalog dictionary with respect to a phrase to be shortened,
Selecting means for selecting at least one of the plurality of candidate generating means based on information indicated in the electronic catalog dictionary and a predetermined rule with respect to a phrase to be abbreviated,
A shortened word creation support program that functions as candidate selecting means for selecting all of the candidate character strings generated by the candidate generating means selected by the selecting means as candidates for the shortened word.
さらに前記コンピュータを、前記候補選定手段により選定された前記短縮語の候補のうちから所定の決定条件に従って前記短縮語を決定する短縮語決定手段として機能させることを特徴とする請求項8に記載の短縮語作成支援プログラム。9. The computer according to claim 8, further comprising causing the computer to function as shortened word determining means for determining the shortened word from predetermined candidates of the shortened word selected by the candidate selecting means in accordance with a predetermined determining condition. Abbreviated word creation support program. さらに前記コンピュータを、前記短縮語決定手段により決定された短縮語を前記電子カタログ辞書に登録する登録手段として機能させることを特徴とする請求項9に記載の短縮語作成支援プログラム。The computer-readable storage medium according to claim 9, further comprising causing the computer to function as a registration unit that registers the abbreviation word determined by the abbreviation word determination unit in the electronic catalog dictionary.
JP2002284332A 2002-09-27 2002-09-27 Abbreviated word creation support device and abbreviated word creation support program Expired - Fee Related JP3898615B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002284332A JP3898615B2 (en) 2002-09-27 2002-09-27 Abbreviated word creation support device and abbreviated word creation support program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002284332A JP3898615B2 (en) 2002-09-27 2002-09-27 Abbreviated word creation support device and abbreviated word creation support program

Publications (2)

Publication Number Publication Date
JP2004118741A true JP2004118741A (en) 2004-04-15
JP3898615B2 JP3898615B2 (en) 2007-03-28

Family

ID=32277926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002284332A Expired - Fee Related JP3898615B2 (en) 2002-09-27 2002-09-27 Abbreviated word creation support device and abbreviated word creation support program

Country Status (1)

Country Link
JP (1) JP3898615B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006185424A (en) * 2004-11-30 2006-07-13 Ricoh Co Ltd Information processing apparatus, method and program for setting image processing function and recording medium
JP2007148674A (en) * 2005-11-25 2007-06-14 Konica Minolta Business Technologies Inc Information display method
JP2009169513A (en) * 2008-01-11 2009-07-30 Toshiba Corp Device, method and program for estimating nickname
JP2012018682A (en) * 2006-12-18 2012-01-26 Mitsubishi Electric Corp Shortened character string display device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006185424A (en) * 2004-11-30 2006-07-13 Ricoh Co Ltd Information processing apparatus, method and program for setting image processing function and recording medium
JP2007148674A (en) * 2005-11-25 2007-06-14 Konica Minolta Business Technologies Inc Information display method
JP2012018682A (en) * 2006-12-18 2012-01-26 Mitsubishi Electric Corp Shortened character string display device
JP2009169513A (en) * 2008-01-11 2009-07-30 Toshiba Corp Device, method and program for estimating nickname

Also Published As

Publication number Publication date
JP3898615B2 (en) 2007-03-28

Similar Documents

Publication Publication Date Title
US6345243B1 (en) System, method, and product for dynamically propagating translations in a translation-memory system
JP2008083952A (en) Dictionary creation support system, method and program
JP3372532B2 (en) Computer-readable recording medium for emotion information extraction method and emotion information extraction program
JP3871832B2 (en) Data processing program automatic generation system and method, and computer-readable recording medium
JP4160548B2 (en) Document summary creation system, method, and program
US7478092B2 (en) Key term extraction
JP4001283B2 (en) Morphological analyzer and natural language processor
JP4856573B2 (en) Summary sentence generation device and summary sentence generation program
JP3898615B2 (en) Abbreviated word creation support device and abbreviated word creation support program
JP5447368B2 (en) NEW CASE GENERATION DEVICE, NEW CASE GENERATION METHOD, AND NEW CASE GENERATION PROGRAM
JP2010003104A (en) Development support apparatus, method, and program
JP2005063030A (en) Method for expressing concept, method and device for creating expression of concept, program for implementing this method, and recording medium for recording this program
JP2005025555A (en) Thesaurus construction system, thesaurus construction method, program for executing the method, and storage medium with the program stored thereon
JP4341077B2 (en) Document processing apparatus, document processing method, and document processing program
JP7083473B2 (en) Input support device
CN1322417C (en) Multilingual software installation system and method, medium and multilingual software installation product
JP2009230705A (en) Template preparation device, device and method for preparing document data, and program
JP4399154B2 (en) Translation apparatus and translation program
JP2010217972A (en) Structured document generation device and structured document generation program
JP6657920B2 (en) Document verification support device, document verification support method, and document verification support program
JP6267971B2 (en) Source code analysis support device, source code analysis support method
CN116226397A (en) Knowledge extraction method, system, equipment and storage medium
JP5367099B2 (en) Difference location extraction apparatus and program
JP2006127397A (en) Required specification extraction method linked with architecture construction
JPH05342258A (en) Natural language processing system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051011

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061221

LAPS Cancellation because of no payment of annual fees