JP2783558B2 - 要約生成方法および要約生成装置 - Google Patents
要約生成方法および要約生成装置Info
- Publication number
- JP2783558B2 JP2783558B2 JP63245967A JP24596788A JP2783558B2 JP 2783558 B2 JP2783558 B2 JP 2783558B2 JP 63245967 A JP63245967 A JP 63245967A JP 24596788 A JP24596788 A JP 24596788A JP 2783558 B2 JP2783558 B2 JP 2783558B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- document
- word
- extracted
- searched
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、入力された文書データからその要約文を生
成する要約生成方法および要約生成装置に関する。
成する要約生成方法および要約生成装置に関する。
(従来の技術) 近年、大量の特許公報やその他の技術文献等を電子的
にファイルしてデータベース化することがなされてい
る。これらのデータベースシステムでは、しばしば文書
検索の容易化を目的として各文書データに含まれるキー
ワードを登録しておくことがなされるが、一般にキーワ
ードだけでは、その文書の内容を理解することは不可能
である。そこで、文書データごとにその文書の内容を簡
潔に表現した要約文を作成することが考えられるが、大
量の文書データのそれぞれについて要約文を作成するこ
とは困難である。
にファイルしてデータベース化することがなされてい
る。これらのデータベースシステムでは、しばしば文書
検索の容易化を目的として各文書データに含まれるキー
ワードを登録しておくことがなされるが、一般にキーワ
ードだけでは、その文書の内容を理解することは不可能
である。そこで、文書データごとにその文書の内容を簡
潔に表現した要約文を作成することが考えられるが、大
量の文書データのそれぞれについて要約文を作成するこ
とは困難である。
そこで、計算機を用いた要約文の自動生成法が提案さ
れている。その一つは、文書中の出現頻度の高い単語を
含む文を抽出する方式である(Luhn H.P.;The Automati
c Creation of Literature Abstracts,IBM J.Res.Dev.V
ol 2,pp159−195)。この方式では、重要な単語は高頻
度に出現するという仮定のもとで要約を作成している
が、高頻度で出現される単語を含む文を抽出するので、
抽出される文が必然的に多くなりすぎるという欠点があ
る。しかも、文書中に高頻度で出現する単語が必ずしも
その文書の主題を適確に表わしたものであるとは言え
ず、適切な要約文が生成されないことが多いという問題
があった。
れている。その一つは、文書中の出現頻度の高い単語を
含む文を抽出する方式である(Luhn H.P.;The Automati
c Creation of Literature Abstracts,IBM J.Res.Dev.V
ol 2,pp159−195)。この方式では、重要な単語は高頻
度に出現するという仮定のもとで要約を作成している
が、高頻度で出現される単語を含む文を抽出するので、
抽出される文が必然的に多くなりすぎるという欠点があ
る。しかも、文書中に高頻度で出現する単語が必ずしも
その文書の主題を適確に表わしたものであるとは言え
ず、適切な要約文が生成されないことが多いという問題
があった。
これに対し、文書の内容を理解することにより意味的
に正しい要約文を生成しようとする試み(Fun.D.,et.a
l;Step toword the evaluation of text,in IJCAI85)
もなされているが、まだ実用化の可能性を確認するまで
には至っていないのが現状である。
に正しい要約文を生成しようとする試み(Fun.D.,et.a
l;Step toword the evaluation of text,in IJCAI85)
もなされているが、まだ実用化の可能性を確認するまで
には至っていないのが現状である。
(発明が解決しようとする課題) このように、従来の要約作成方法では、適切な要約文
を自動生成することが難しく、結局、人手による要約作
成作業によらざるを得なかった。
を自動生成することが難しく、結局、人手による要約作
成作業によらざるを得なかった。
本発明は、このような問題に鑑みなされたもので、適
切な要約文を生成可能な要約生成方法および要約生成装
置を提供することを目的とする。
切な要約文を生成可能な要約生成方法および要約生成装
置を提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、文書の内容に基づく要約文を生成する際
に、入力文書から文書の内容を反映する文の存在を示唆
し、かつ文書の内容に依存しない単語を検索し、この検
索された単語を少なくとも1つ含む文を抽出して前記入
力文書の要約を生成することを特徴とする。
に、入力文書から文書の内容を反映する文の存在を示唆
し、かつ文書の内容に依存しない単語を検索し、この検
索された単語を少なくとも1つ含む文を抽出して前記入
力文書の要約を生成することを特徴とする。
(作用) 本発明によれば、キーワード記憶部に記憶された意味
的に重要な単語を含む文を文書データ中から抽出し要約
文を生成するので、出現頻度は少なくても意味のあるキ
ーワードを含んだ重要な文が抽出できる。このため、ユ
ーザは容易にかつ正しい要約文を得ることができる。
的に重要な単語を含む文を文書データ中から抽出し要約
文を生成するので、出現頻度は少なくても意味のあるキ
ーワードを含んだ重要な文が抽出できる。このため、ユ
ーザは容易にかつ正しい要約文を得ることができる。
(実施例) 以下、図面を参照しながら本発明の実施例について説
明する。
明する。
第1図は本発明の一実施例に係る要約生成装置の概略
構成を示すブロック図である。この装置は、文書データ
や編集コマンドを入力するためのマウス、キーボードな
どからなる入力部1と、この入力部1を介して入力され
た文書データを記憶する文書記憶部2と、文書中の意味
のある単語をキーワードとして記憶してなるキーワード
辞書3と、このキーワード辞書3に格納されたキーワー
ドを含む文を抽出し連結することにより要約文を生成す
る要約部4と、入力された文書データや前記要約部4で
生成された要約文を表示するディスプレイ装置、プリン
タ等からなる出力部5と、これら各部の動作を管理する
文書管理部6とを具備したものとなっている。
構成を示すブロック図である。この装置は、文書データ
や編集コマンドを入力するためのマウス、キーボードな
どからなる入力部1と、この入力部1を介して入力され
た文書データを記憶する文書記憶部2と、文書中の意味
のある単語をキーワードとして記憶してなるキーワード
辞書3と、このキーワード辞書3に格納されたキーワー
ドを含む文を抽出し連結することにより要約文を生成す
る要約部4と、入力された文書データや前記要約部4で
生成された要約文を表示するディスプレイ装置、プリン
タ等からなる出力部5と、これら各部の動作を管理する
文書管理部6とを具備したものとなっている。
入力部1を介して入力された文書データは、文書管理
部6を介して文書記憶部2に一旦格納されるとともに出
力部5に例えば第2図に示すように表示される。なお、
この表示例では、一文単位に分離して表示をしている
が、これは一例であって、必ずしも一文単位で分れた表
示を行なう必要はない。
部6を介して文書記憶部2に一旦格納されるとともに出
力部5に例えば第2図に示すように表示される。なお、
この表示例では、一文単位に分離して表示をしている
が、これは一例であって、必ずしも一文単位で分れた表
示を行なう必要はない。
入力部1より要約生成の指示コマンドが入力される
と、文書管理部6は、要約部4を起動する。要約部4
は、文書管理部6によって起動されると、文書記憶部2
に格納されている文書データを文書管理部6を介して読
出し、要約生成を開始する。
と、文書管理部6は、要約部4を起動する。要約部4
は、文書管理部6によって起動されると、文書記憶部2
に格納されている文書データを文書管理部6を介して読
出し、要約生成を開始する。
以下、要約生成について説明する。
キーワード辞書3には予め第3図に示すようなキーワ
ードが格納されている。キーワードは、文書データが対
象としている分野に応じて例えば「develop」、「statu
s」、「method」等の項目別に大きく分けられている。
キーワードが多品詞である場合には、重要度の最も高い
品詞名が品詞欄に記される。例えば「開発」というキー
ワードであれば、動詞(v)「開発する」と名詞(n)
「開発」の2品詞が考えられるが、動詞は意味を決定す
る格であることから、前者の場合がより重要なので、品
詞の欄には「v」が記されている。但しキーワード辞書
3の記憶形式は、この第3図の形式に限定されない。
ードが格納されている。キーワードは、文書データが対
象としている分野に応じて例えば「develop」、「statu
s」、「method」等の項目別に大きく分けられている。
キーワードが多品詞である場合には、重要度の最も高い
品詞名が品詞欄に記される。例えば「開発」というキー
ワードであれば、動詞(v)「開発する」と名詞(n)
「開発」の2品詞が考えられるが、動詞は意味を決定す
る格であることから、前者の場合がより重要なので、品
詞の欄には「v」が記されている。但しキーワード辞書
3の記憶形式は、この第3図の形式に限定されない。
要約部4は、文書管理部6を介して文書記憶部2から
文書データを読み出して、第3図に示したようなキーワ
ードが文書データに含まれているかをサーチする。そし
て、そのようなキーワードが含まれている文があれば、
その文を文書データから抽出して、それらを結合して要
約文を生成する。文書管理部6は生成された要約文を出
力部2に送る。出力部2は、生成された要約文を例えば
第4図(a)に示すように文書データに重ねて表示す
る。
文書データを読み出して、第3図に示したようなキーワ
ードが文書データに含まれているかをサーチする。そし
て、そのようなキーワードが含まれている文があれば、
その文を文書データから抽出して、それらを結合して要
約文を生成する。文書管理部6は生成された要約文を出
力部2に送る。出力部2は、生成された要約文を例えば
第4図(a)に示すように文書データに重ねて表示す
る。
ここで、要約の生成に使用された情報を表示するコマ
ンドを入力部1を介して入力すると、例えば第4図
(b)に示すように、抽出された文が、キーワード部分
を例えば網かけにして、その文番号とともに表示され
る。また、23文目「2.認識方式」が要約としては不要で
あるとユーザが判断した場合、入力部1より文の削除が
指示されると、この文が削除される。また削除以外の編
集も公知の手段を用いて行なうことができる。なお、こ
のようにして作成された要約文は、文書データの一部と
して或は別文書として保存するようにしても良い。
ンドを入力部1を介して入力すると、例えば第4図
(b)に示すように、抽出された文が、キーワード部分
を例えば網かけにして、その文番号とともに表示され
る。また、23文目「2.認識方式」が要約としては不要で
あるとユーザが判断した場合、入力部1より文の削除が
指示されると、この文が削除される。また削除以外の編
集も公知の手段を用いて行なうことができる。なお、こ
のようにして作成された要約文は、文書データの一部と
して或は別文書として保存するようにしても良い。
この装置によれば、ユーザが予め設定しておいたキー
ワードに基づいて要約文を構成する文が抽出されるの
で、キーワードとして意味的に重要なものを登録してお
くことによって、文書中の出現頻度にはよらない極めて
適切な要約を抽出することができる。なお、キーワード
が不足していて要約として抽出されるべき文が抽出され
ない場合には、ユーザは入力部1を介して新しくいくつ
かのキーワードをキーワード辞書3に登録すれば良い。
このようなキーワードは、ユーザによって多様であるた
め、標準的なキーワードとは別に、ユーザ毎に別れたユ
ーザ指定キーワードとして記憶するのが好ましい。
ワードに基づいて要約文を構成する文が抽出されるの
で、キーワードとして意味的に重要なものを登録してお
くことによって、文書中の出現頻度にはよらない極めて
適切な要約を抽出することができる。なお、キーワード
が不足していて要約として抽出されるべき文が抽出され
ない場合には、ユーザは入力部1を介して新しくいくつ
かのキーワードをキーワード辞書3に登録すれば良い。
このようなキーワードは、ユーザによって多様であるた
め、標準的なキーワードとは別に、ユーザ毎に別れたユ
ーザ指定キーワードとして記憶するのが好ましい。
ところで、ユーザによって登録されるキーワードが増
えると、それに伴って文書データから抽出される文の数
も増えてしまい、本発明の効果が十分に得られなくなっ
てしまう。第5図はこのような問題を解決するための本
発明の別の実施例に係る要約作成装置の概略構成を示す
図で、第1図と同一部分には同一符号を付してある。し
たがって、重複する部分の詳しい説明は省略する。
えると、それに伴って文書データから抽出される文の数
も増えてしまい、本発明の効果が十分に得られなくなっ
てしまう。第5図はこのような問題を解決するための本
発明の別の実施例に係る要約作成装置の概略構成を示す
図で、第1図と同一部分には同一符号を付してある。し
たがって、重複する部分の詳しい説明は省略する。
この装置には、論理構造記憶部7と言語解析部8と生
成部9が設けられている。論理構造記憶部7は、標題、
概要、章、節等の構造を記憶するもので、第2図の文書
データに対して例えば第6図に示すような形式で記憶さ
れている。この論理構造は、文書データの形態的特徴等
の公知の解析手法を用いて得られたものであっても、ユ
ーザにより入力部1を介して直接指定されたものでも良
い。
成部9が設けられている。論理構造記憶部7は、標題、
概要、章、節等の構造を記憶するもので、第2図の文書
データに対して例えば第6図に示すような形式で記憶さ
れている。この論理構造は、文書データの形態的特徴等
の公知の解析手法を用いて得られたものであっても、ユ
ーザにより入力部1を介して直接指定されたものでも良
い。
第6図は、各文の属性を表しており、章や節の見出し
に関しては、その順序がオーダーとして表されている。
また、各文の階層もレベルとして表されている。なお、
論理構造の記憶形式は、必ずしもこの形式に限定される
ものではない。
に関しては、その順序がオーダーとして表されている。
また、各文の階層もレベルとして表されている。なお、
論理構造の記憶形式は、必ずしもこの形式に限定される
ものではない。
要約部4は、この論理構造に基づき、キーワード辞書
3のどの項目のキーワードを文書データのどこからサー
チすべきかを制御する。つまり項目「develop」や「sta
tus」等は概要的な文章、即ち概要や序章(第1章)に
述べられており、より詳細で具体的な項目「method」等
は、通常、第2章以後に述べられていることが多い。こ
の前提に基づき、項目「develop」や「status」等の概
要的キーワードは第1章のみ、例えば第6図の例では5
文から22文の範囲、に対してサーチを行なう。第4文は
「章見出し」なので、サーチする範囲から除かれる。同
様に項目「method」に含まれるキーワードは、第2章以
降、つまり24文以降を対象にサーチされる。その結果、
得られた要約文は、第4図(b)で示した要約文から
「2.認識方式」なる章見出しを除いたものとなる。
3のどの項目のキーワードを文書データのどこからサー
チすべきかを制御する。つまり項目「develop」や「sta
tus」等は概要的な文章、即ち概要や序章(第1章)に
述べられており、より詳細で具体的な項目「method」等
は、通常、第2章以後に述べられていることが多い。こ
の前提に基づき、項目「develop」や「status」等の概
要的キーワードは第1章のみ、例えば第6図の例では5
文から22文の範囲、に対してサーチを行なう。第4文は
「章見出し」なので、サーチする範囲から除かれる。同
様に項目「method」に含まれるキーワードは、第2章以
降、つまり24文以降を対象にサーチされる。その結果、
得られた要約文は、第4図(b)で示した要約文から
「2.認識方式」なる章見出しを除いたものとなる。
要約部4は、キーワードを含む文を言語解析部8に送
り、公知の形態素解析、構文解析処理を行なう。例え
ば、第8文の解析結果は第7図のようになる。要約部4
は、この解析結果に含まれる各キーワードの品詞と第3
図のキーワード辞書3の品詞欄の内容とを比較し、両者
が一致したものを検出する。ここでは、第7図の「開発
した」(動詞)というキーワードの品詞情報が一致して
いるので、構文木の「開発した」に対応するノードにマ
ークが付加される。そして、要約部4はキーワード及び
その品詞情報が一致した文だけを要約文として抽出す
る。或は、一致したものには得点5、一致しないものに
は得点1を与え、各文に与えられた得点の合計が一定以
上のものだけを要約文として抽出するようにしても良
い。なお、このとき、第6図の論理構造に基づき、「標
題」である第1文、「著者」である第2文、「所属」で
ある第3文も要約文として抽出する。このような操作に
よれば、登録されたキーワードの数が多い場合でも、抽
出される文がある程度絞りこまれるので、第8図(a)
に示すような簡潔な要約文が抽出されることになる。
り、公知の形態素解析、構文解析処理を行なう。例え
ば、第8文の解析結果は第7図のようになる。要約部4
は、この解析結果に含まれる各キーワードの品詞と第3
図のキーワード辞書3の品詞欄の内容とを比較し、両者
が一致したものを検出する。ここでは、第7図の「開発
した」(動詞)というキーワードの品詞情報が一致して
いるので、構文木の「開発した」に対応するノードにマ
ークが付加される。そして、要約部4はキーワード及び
その品詞情報が一致した文だけを要約文として抽出す
る。或は、一致したものには得点5、一致しないものに
は得点1を与え、各文に与えられた得点の合計が一定以
上のものだけを要約文として抽出するようにしても良
い。なお、このとき、第6図の論理構造に基づき、「標
題」である第1文、「著者」である第2文、「所属」で
ある第3文も要約文として抽出する。このような操作に
よれば、登録されたキーワードの数が多い場合でも、抽
出される文がある程度絞りこまれるので、第8図(a)
に示すような簡潔な要約文が抽出されることになる。
次に、入力部1より要約文生成の指示がなされると、
生成部9は、構文木のノードにマークが付加されている
語(第7図では「開発して」)が動詞ならばそれを述部
とするような形に抽出された要約文を変形させ、最終的
な要約文を生成する。第7図の例では、「開発した」を
述部とするための主語(S)が欠けているが、このよう
な場合には論理構造をもとに、「所属」を主語に代用す
る。マークが付加されている語が名詞ならば、それを主
語とするよう生成を行なう。この結果、要約文は第8図
(b)のようになる。このような要約文の生成処理によ
って理解し易い簡潔な要約文が生成されることになる。
生成部9は、構文木のノードにマークが付加されている
語(第7図では「開発して」)が動詞ならばそれを述部
とするような形に抽出された要約文を変形させ、最終的
な要約文を生成する。第7図の例では、「開発した」を
述部とするための主語(S)が欠けているが、このよう
な場合には論理構造をもとに、「所属」を主語に代用す
る。マークが付加されている語が名詞ならば、それを主
語とするよう生成を行なう。この結果、要約文は第8図
(b)のようになる。このような要約文の生成処理によ
って理解し易い簡潔な要約文が生成されることになる。
以上2つの実施例について述べたが、本発明は上述し
た実施例に限定されるものではない。例えば、上記第2
の実施例では、論理構造記憶部7、言語解析部8及び生
成部9を備えたが、例えばそれらのうちの1つのみを備
えた構成であっても基本的な効果は十分に奏し得る。
た実施例に限定されるものではない。例えば、上記第2
の実施例では、論理構造記憶部7、言語解析部8及び生
成部9を備えたが、例えばそれらのうちの1つのみを備
えた構成であっても基本的な効果は十分に奏し得る。
[発明の効果] 以上述べたように、本発明によれば、キーワード記憶
部に格納された意味的に重要なキーワードに基づいて抽
出された文に基づいて要約文が生成されるので、簡潔で
適切な要約文を得ることができる。
部に格納された意味的に重要なキーワードに基づいて抽
出された文に基づいて要約文が生成されるので、簡潔で
適切な要約文を得ることができる。
第1図〜第4図は本発明の第1の実施例に係る要約生成
装置を説明するための図で、第1図は装置の概略的な構
成を示すブロック図、第2図は文書データの出力例を示
す図、第3図はキーワード辞書の内容を示す図、第4図
(a)(b)は生成された要約の表示例をそれぞれ示す
図、第5図〜第8図は本発明の第2の実施例に係る要約
生成装置を説明するための図で、第5図は装置の概略構
成を示すブロック図、第6図は論理構造記憶部の内容を
示す図、第7図は言語解析部での解析結果を示す図、第
8図(a)は要約部で抽出された要約文の出力例を示す
図、同図(b)は生成部で生成された要約文の出力例を
示す図である。 1……入力部、2……文書記憶部、3……キーワード辞
書、4……要約部、5……出力部、6……文書管理部、
7……論理構造記憶部、8……言語解析部、9……生成
部。
装置を説明するための図で、第1図は装置の概略的な構
成を示すブロック図、第2図は文書データの出力例を示
す図、第3図はキーワード辞書の内容を示す図、第4図
(a)(b)は生成された要約の表示例をそれぞれ示す
図、第5図〜第8図は本発明の第2の実施例に係る要約
生成装置を説明するための図で、第5図は装置の概略構
成を示すブロック図、第6図は論理構造記憶部の内容を
示す図、第7図は言語解析部での解析結果を示す図、第
8図(a)は要約部で抽出された要約文の出力例を示す
図、同図(b)は生成部で生成された要約文の出力例を
示す図である。 1……入力部、2……文書記憶部、3……キーワード辞
書、4……要約部、5……出力部、6……文書管理部、
7……論理構造記憶部、8……言語解析部、9……生成
部。
Claims (5)
- 【請求項1】文書の内容に基づく要約文を生成する要約
生成方法において、 入力文書から文書の内容を反映する文の存在を示唆し、
かつ文書の内容に依存しない単語を検索し、この検索さ
れた単語を少なくとも1つ含む文を抽出して前記入力文
書の要約を生成することを特徴とする要約生成方法。 - 【請求項2】前記入力文書の論理構造に基づき該入力文
書から前記単語の存在し得る文を選択して、その選択さ
れた文から当該単語を検索し、この検索された単語を少
なくとも1つ含む文を抽出することを特徴とする請求項
1記載の要約生成方法。 - 【請求項3】前記単語には予め品詞が指定されていて、
前記入力文書の文を言語解析した結果に基づき前記入力
文書から品詞の一致する単語を検索し、この検索された
単語を少なくとも1つ含む文を抽出することを特徴とす
る請求項1記載の要約生成方法。 - 【請求項4】前記単語には予め品詞が指定されていて、
前記入力文書の文を言語解析した結果に基づき前記入力
文書から品詞の一致する単語を検索して、この検索され
た単語を少なくとも1つ含む文を抽出し、この抽出され
た文に含まれる単語の品詞が動詞のときは該単語が述部
となるように当該文を変形し、前記抽出された文に含ま
れる単語の品詞が名詞のときは該単語が主語となるよう
に当該文を変形することを特徴とする請求項1記載の要
約生成方法。 - 【請求項5】文書の内容に基づく要約文を生成する要約
生成装置において、 文書の内容を反映し得る文の存在を示唆し、かつ文書の
内容に依存しない単語を入力文書から検索する検索手段
と、 この検索手段で検索された単語を少なくとも1つ含む文
を前記入力文書から抽出する抽出手段と、 この抽出手段で抽出された文に基づき前記入力文書の要
約を生成する要約生成手段と、 を具備したことを特徴とする要約生成装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63245967A JP2783558B2 (ja) | 1988-09-30 | 1988-09-30 | 要約生成方法および要約生成装置 |
EP89117915A EP0361464B1 (en) | 1988-09-30 | 1989-09-28 | Method and apparatus for producing an abstract of a document |
DE68928775T DE68928775T2 (de) | 1988-09-30 | 1989-09-28 | Verfahren und Vorrichtung zur Herstellung einer Zusammenfassung eines Dokumentes |
US07/413,605 US5077668A (en) | 1988-09-30 | 1989-09-28 | Method and apparatus for producing an abstract of a document |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63245967A JP2783558B2 (ja) | 1988-09-30 | 1988-09-30 | 要約生成方法および要約生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0293866A JPH0293866A (ja) | 1990-04-04 |
JP2783558B2 true JP2783558B2 (ja) | 1998-08-06 |
Family
ID=17141498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63245967A Expired - Lifetime JP2783558B2 (ja) | 1988-09-30 | 1988-09-30 | 要約生成方法および要約生成装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5077668A (ja) |
EP (1) | EP0361464B1 (ja) |
JP (1) | JP2783558B2 (ja) |
DE (1) | DE68928775T2 (ja) |
Families Citing this family (100)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0418673A (ja) * | 1990-05-11 | 1992-01-22 | Hitachi Ltd | テキスト情報抽出方法および装置 |
JP3691844B2 (ja) * | 1990-05-21 | 2005-09-07 | 株式会社東芝 | 文書処理方法 |
JP2895184B2 (ja) * | 1990-08-22 | 1999-05-24 | 株式会社日立製作所 | 文書処理システム及び文書処理方法 |
US5708829A (en) * | 1991-02-01 | 1998-01-13 | Wang Laboratories, Inc. | Text indexing system |
US5390259A (en) * | 1991-11-19 | 1995-02-14 | Xerox Corporation | Methods and apparatus for selecting semantically significant images in a document image without decoding image content |
CA2077274C (en) * | 1991-11-19 | 1997-07-15 | M. Margaret Withgott | Method and apparatus for summarizing a document without document image decoding |
US5384863A (en) * | 1991-11-19 | 1995-01-24 | Xerox Corporation | Methods and apparatus for automatic modification of semantically significant portions of a document without document image decoding |
CA2077604C (en) * | 1991-11-19 | 1999-07-06 | Todd A. Cass | Method and apparatus for determining the frequency of words in a document without document image decoding |
CA2078423C (en) * | 1991-11-19 | 1997-01-14 | Per-Kristian Halvorsen | Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information |
US5537586A (en) * | 1992-04-30 | 1996-07-16 | Individual, Inc. | Enhanced apparatus and methods for retrieving and selecting profiled textural information records from a database of defined category structures |
JPH05314173A (ja) * | 1992-05-13 | 1993-11-26 | Nippon Telegr & Teleph Corp <Ntt> | 文章要約支援装置 |
JPH06215036A (ja) * | 1992-12-10 | 1994-08-05 | Xerox Corp | ドキュメントコレクションの探索方法 |
EP0610760B1 (en) * | 1993-01-28 | 2003-05-02 | Kabushiki Kaisha Toshiba | Document detection system with improved document detection efficiency |
US5638543A (en) * | 1993-06-03 | 1997-06-10 | Xerox Corporation | Method and apparatus for automatic document summarization |
US5331556A (en) * | 1993-06-28 | 1994-07-19 | General Electric Company | Method for natural language data processing using morphological and part-of-speech information |
US5384703A (en) * | 1993-07-02 | 1995-01-24 | Xerox Corporation | Method and apparatus for summarizing documents according to theme |
US5826241A (en) | 1994-09-16 | 1998-10-20 | First Virtual Holdings Incorporated | Computerized system for making payments and authenticating transactions over the internet |
EP1691315A1 (en) * | 1994-10-27 | 2006-08-16 | Intarsia Software LLC | Data copyright management system |
JP2809341B2 (ja) * | 1994-11-18 | 1998-10-08 | 松下電器産業株式会社 | 情報要約方法、情報要約装置、重み付け方法、および文字放送受信装置。 |
NZ298861A (en) * | 1995-01-23 | 1999-01-28 | British Telecomm | Accessing information from a store by comparing keywords with information descriptors |
US5689716A (en) * | 1995-04-14 | 1997-11-18 | Xerox Corporation | Automatic method of generating thematic summaries |
US5745602A (en) * | 1995-05-01 | 1998-04-28 | Xerox Corporation | Automatic method of selecting multi-word key phrases from a document |
US5918240A (en) * | 1995-06-28 | 1999-06-29 | Xerox Corporation | Automatic method of extracting summarization using feature probabilities |
US5778397A (en) * | 1995-06-28 | 1998-07-07 | Xerox Corporation | Automatic method of generating feature probabilities for automatic extracting summarization |
US5691708A (en) * | 1995-08-14 | 1997-11-25 | Lotus Development Corporation | Text abstraction method and apparatus |
US6112201A (en) * | 1995-08-29 | 2000-08-29 | Oracle Corporation | Virtual bookshelf |
CA2233023A1 (en) * | 1995-09-25 | 1997-04-03 | Edward A. Taft | Optimum access to electronic documents |
US5850476A (en) * | 1995-12-14 | 1998-12-15 | Xerox Corporation | Automatic method of identifying drop words in a document image without performing character recognition |
US5848191A (en) * | 1995-12-14 | 1998-12-08 | Xerox Corporation | Automatic method of generating thematic summaries from a document image without performing character recognition |
US5892842A (en) * | 1995-12-14 | 1999-04-06 | Xerox Corporation | Automatic method of identifying sentence boundaries in a document image |
JP3254642B2 (ja) * | 1996-01-11 | 2002-02-12 | 株式会社日立製作所 | 索引の表示方法 |
US5931907A (en) * | 1996-01-23 | 1999-08-03 | British Telecommunications Public Limited Company | Software agent for comparing locally accessible keywords with meta-information and having pointers associated with distributed information |
US6076109A (en) | 1996-04-10 | 2000-06-13 | Lextron, Systems, Inc. | Simplified-file hyper text protocol |
US6098034A (en) * | 1996-03-18 | 2000-08-01 | Expert Ease Development, Ltd. | Method for standardizing phrasing in a document |
JP3270351B2 (ja) | 1997-01-31 | 2002-04-02 | 株式会社東芝 | 電子化文書処理装置 |
US5960383A (en) * | 1997-02-25 | 1999-09-28 | Digital Equipment Corporation | Extraction of key sections from texts using automatic indexing techniques |
WO1998041930A1 (de) * | 1997-03-18 | 1998-09-24 | Siemens Aktiengesellschaft | Verfahren zur automatischen generierung einer zusammenfassung von einem text durch einen rechner |
JP3001047B2 (ja) | 1997-04-17 | 2000-01-17 | 日本電気株式会社 | 文書要約装置 |
US6374275B2 (en) * | 1997-06-11 | 2002-04-16 | Scientific-Atlanta, Inc. | System, method, and media for intelligent selection of searching terms in a keyboardless entry environment |
JPH1115830A (ja) * | 1997-06-20 | 1999-01-22 | Fuji Xerox Co Ltd | 文短縮装置及び文短縮プログラムを記録した媒体 |
US6470307B1 (en) * | 1997-06-23 | 2002-10-22 | National Research Council Of Canada | Method and apparatus for automatically identifying keywords within a document |
US6353824B1 (en) | 1997-11-18 | 2002-03-05 | Apple Computer, Inc. | Method for dynamic presentation of the contents topically rich capsule overviews corresponding to the plurality of documents, resolving co-referentiality in document segments |
US6185592B1 (en) * | 1997-11-18 | 2001-02-06 | Apple Computer, Inc. | Summarizing text documents by resolving co-referentiality among actors or objects around which a story unfolds |
US6533822B2 (en) * | 1998-01-30 | 2003-03-18 | Xerox Corporation | Creating summaries along with indicators, and automatically positioned tabs |
GB9806085D0 (en) * | 1998-03-23 | 1998-05-20 | Xerox Corp | Text summarisation using light syntactic parsing |
JP4214598B2 (ja) | 1998-04-02 | 2009-01-28 | ソニー株式会社 | 文書処理方法および装置ならびに記録媒体 |
US7447626B2 (en) * | 1998-09-28 | 2008-11-04 | Udico Holdings | Method and apparatus for generating a language independent document abstract |
US6104990A (en) * | 1998-09-28 | 2000-08-15 | Prompt Software, Inc. | Language independent phrase extraction |
US6768996B1 (en) * | 1998-10-08 | 2004-07-27 | Hewlett-Packard Development Company, L.P. | System and method for retrieving an abstracted portion of a file without regard to the operating system of the current host computer |
US6363174B1 (en) * | 1998-12-28 | 2002-03-26 | Sony Corporation | Method and apparatus for content identification and categorization of textual data |
US6317708B1 (en) | 1999-01-07 | 2001-11-13 | Justsystem Corporation | Method for producing summaries of text document |
WO2000043911A1 (en) * | 1999-01-22 | 2000-07-27 | Wordstream, Inc. | Method and apparatus for improved document searching |
IL144950A0 (en) * | 1999-02-19 | 2002-06-30 | Univ Columbia | Cut and paste document summarization system and method |
CA2363017C (en) * | 1999-02-19 | 2011-04-19 | The Trustees Of Columbia University In The City Of New York | Multi-document summarization system and method |
US7366711B1 (en) | 1999-02-19 | 2008-04-29 | The Trustees Of Columbia University In The City Of New York | Multi-document summarization system and method |
US6523040B1 (en) | 1999-06-24 | 2003-02-18 | Ibm Corporation | Method and apparatus for dynamic and flexible table summarization |
JP2001014306A (ja) * | 1999-06-30 | 2001-01-19 | Sony Corp | 電子文書処理方法及び電子文書処理装置並びに電子文書処理プログラムが記録された記録媒体 |
US7162413B1 (en) * | 1999-07-09 | 2007-01-09 | International Business Machines Corporation | Rule induction for summarizing documents in a classified document collection |
US6622160B1 (en) * | 1999-07-30 | 2003-09-16 | Microsoft Corporation | Methods for routing items for communications based on a measure of criticality |
US7194681B1 (en) | 1999-07-30 | 2007-03-20 | Microsoft Corporation | Method for automatically assigning priorities to documents and messages |
US7120865B1 (en) * | 1999-07-30 | 2006-10-10 | Microsoft Corporation | Methods for display, notification, and interaction with prioritized messages |
US6714967B1 (en) * | 1999-07-30 | 2004-03-30 | Microsoft Corporation | Integration of a computer-based message priority system with mobile electronic devices |
JP2001043215A (ja) | 1999-08-02 | 2001-02-16 | Sony Corp | 文書処理装置、文書処理方法、及び記録媒体 |
US7475334B1 (en) * | 2000-01-19 | 2009-01-06 | Alcatel-Lucent Usa Inc. | Method and system for abstracting electronic documents |
GB2377059A (en) | 2000-03-17 | 2002-12-31 | Ebay Inc | Method and apparatus for facilitating online payment transactions in a network based transaction facility using multiple payment instruments |
US8706618B2 (en) | 2005-09-29 | 2014-04-22 | Ebay Inc. | Release of funds based on criteria |
US7499875B1 (en) | 2000-03-17 | 2009-03-03 | Ebay Inc. | Method and apparatus for facilitating online payment transactions in a network-based transaction facility using multiple payment instruments |
US6581057B1 (en) | 2000-05-09 | 2003-06-17 | Justsystem Corporation | Method and apparatus for rapidly producing document summaries and document browsing aids |
GB2362972A (en) * | 2000-06-02 | 2001-12-05 | Res Summary Com | An internet based searchable database for up to date financial executive summaries with links to full documents |
US6941513B2 (en) | 2000-06-15 | 2005-09-06 | Cognisphere, Inc. | System and method for text structuring and text generation |
AU2000269782A1 (en) | 2000-09-07 | 2002-03-22 | Intel Corporation | Method and apparatus for summarizing multiple documents using a subsumption model |
US7139977B1 (en) * | 2001-01-24 | 2006-11-21 | Oracle International Corporation | System and method for producing a virtual online book |
JP4630480B2 (ja) * | 2001-03-19 | 2011-02-09 | 株式会社東芝 | 要約抽出プログラム、文書分析支援プログラム、要約抽出方法、文書分析支援方法、文書分析支援システム |
JP2002283301A (ja) * | 2001-03-26 | 2002-10-03 | Makita Corp | 際切りマルノコ |
US7092872B2 (en) * | 2001-06-19 | 2006-08-15 | Fuji Xerox Co., Ltd. | Systems and methods for generating analytic summaries |
US7117200B2 (en) * | 2002-01-11 | 2006-10-03 | International Business Machines Corporation | Synthesizing information-bearing content from multiple channels |
JP3682529B2 (ja) * | 2002-01-31 | 2005-08-10 | 独立行政法人情報通信研究機構 | 要約自動評価処理装置、要約自動評価処理プログラム、および要約自動評価処理方法 |
US7650562B2 (en) * | 2002-02-21 | 2010-01-19 | Xerox Corporation | Methods and systems for incrementally changing text representation |
US7228507B2 (en) | 2002-02-21 | 2007-06-05 | Xerox Corporation | Methods and systems for navigating a workspace |
US8370761B2 (en) * | 2002-02-21 | 2013-02-05 | Xerox Corporation | Methods and systems for interactive classification of objects |
US7549114B2 (en) | 2002-02-21 | 2009-06-16 | Xerox Corporation | Methods and systems for incrementally changing text representation |
US7487462B2 (en) | 2002-02-21 | 2009-02-03 | Xerox Corporation | Methods and systems for indicating invisible contents of workspace |
JP2003248676A (ja) * | 2002-02-22 | 2003-09-05 | Communication Research Laboratory | 解データ編集処理装置、解データ編集処理方法、自動要約処理装置、および自動要約処理方法 |
JP3624186B2 (ja) * | 2002-03-15 | 2005-03-02 | Tdk株式会社 | スイッチング電源装置用の制御回路及びこれを用いたスイッチング電源装置 |
US8868670B2 (en) * | 2004-04-27 | 2014-10-21 | Avaya Inc. | Method and apparatus for summarizing one or more text messages using indicative summaries |
US8209617B2 (en) * | 2007-05-11 | 2012-06-26 | Microsoft Corporation | Summarization of attached, linked or related materials |
US20080281927A1 (en) * | 2007-05-11 | 2008-11-13 | Microsoft Corporation | Summarization tool and method for a dialogue sequence |
KR101254362B1 (ko) | 2007-05-18 | 2013-04-12 | 엔에이치엔(주) | 공통 접사를 이용한 키워드 순위를 제공하는 방법 및시스템 |
WO2008143407A1 (en) * | 2007-05-18 | 2008-11-27 | Nhn Corporation | Method and system for providing keyword ranking using common affix |
US8219397B2 (en) * | 2008-06-10 | 2012-07-10 | Nuance Communications, Inc. | Data processing system for autonomously building speech identification and tagging data |
US8874529B2 (en) * | 2009-03-16 | 2014-10-28 | Bert A. Silich | User-determinable method and system for manipulating and displaying textual and graphical information |
US9589254B2 (en) | 2010-12-08 | 2017-03-07 | Microsoft Technology Licensing, Llc | Using e-mail message characteristics for prioritization |
US9442930B2 (en) | 2011-09-07 | 2016-09-13 | Venio Inc. | System, method and computer program product for automatic topic identification using a hypertext corpus |
US9442928B2 (en) | 2011-09-07 | 2016-09-13 | Venio Inc. | System, method and computer program product for automatic topic identification using a hypertext corpus |
KR101656245B1 (ko) * | 2015-09-09 | 2016-09-09 | 주식회사 위버플 | 문장 추출 방법 및 시스템 |
CN111368565B (zh) * | 2018-09-05 | 2022-03-18 | 腾讯科技(深圳)有限公司 | 文本翻译方法、装置、存储介质和计算机设备 |
US11392753B2 (en) | 2020-02-07 | 2022-07-19 | International Business Machines Corporation | Navigating unstructured documents using structured documents including information extracted from unstructured documents |
US11423042B2 (en) | 2020-02-07 | 2022-08-23 | International Business Machines Corporation | Extracting information from unstructured documents using natural language processing and conversion of unstructured documents into structured documents |
KR102550753B1 (ko) * | 2021-11-12 | 2023-07-04 | 주식회사 솔트룩스 | 개체명 교정 시스템 및 이를 훈련시키는 방법 |
CN114140077A (zh) * | 2021-11-30 | 2022-03-04 | 宁波帮企一把企业服务平台有限公司 | 一种政府政策解构方法、装置、计算机设备和存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4358824A (en) * | 1979-12-28 | 1982-11-09 | International Business Machines Corporation | Office correspondence storage and retrieval system |
JPS61248160A (ja) * | 1985-04-26 | 1986-11-05 | Hitachi Ltd | 文書情報登録方式 |
JPH01273164A (ja) * | 1988-04-25 | 1989-11-01 | Nippon Telegr & Teleph Corp <Ntt> | 日本語文書要約装置 |
JPH0743717B2 (ja) * | 1989-02-06 | 1995-05-15 | 株式会社テレマティーク国際研究所 | 抄録文作成装置 |
-
1988
- 1988-09-30 JP JP63245967A patent/JP2783558B2/ja not_active Expired - Lifetime
-
1989
- 1989-09-28 DE DE68928775T patent/DE68928775T2/de not_active Expired - Lifetime
- 1989-09-28 US US07/413,605 patent/US5077668A/en not_active Expired - Lifetime
- 1989-09-28 EP EP89117915A patent/EP0361464B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0361464A3 (en) | 1992-09-02 |
EP0361464B1 (en) | 1998-08-12 |
EP0361464A2 (en) | 1990-04-04 |
JPH0293866A (ja) | 1990-04-04 |
DE68928775D1 (de) | 1998-09-17 |
DE68928775T2 (de) | 1999-01-21 |
US5077668A (en) | 1991-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2783558B2 (ja) | 要約生成方法および要約生成装置 | |
US5794177A (en) | Method and apparatus for morphological analysis and generation of natural language text | |
JP3691844B2 (ja) | 文書処理方法 | |
JP4544674B2 (ja) | 選択文字列に関連する情報を提供するシステム | |
WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
JPS63231674A (ja) | コンピュータによる形態論的テキスト解析方法 | |
JPH03172966A (ja) | 類似文書検索装置 | |
JP2885487B2 (ja) | 文書内情報検索装置 | |
JP2006099428A (ja) | 文書要約作成システム、方法、及びプログラム | |
JPH09198395A (ja) | 文書検索装置 | |
KR101835994B1 (ko) | 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치 | |
JP3851712B2 (ja) | 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2885489B2 (ja) | 文書内容検索装置 | |
JPH01136270A (ja) | ワードプロセッサ装置 | |
JPH01214963A (ja) | 辞書引き装置 | |
JPH02253474A (ja) | テキストベース検索方法 | |
JPH0561902A (ja) | 機械翻訳システム | |
JPH07296005A (ja) | 日本語テキスト登録・検索装置 | |
JPH01307865A (ja) | 文字列検索方式 | |
JP3501240B2 (ja) | 文書作成支援装置 | |
JP2819766B2 (ja) | 外国語電子辞書検索方式 | |
JPS6389976A (ja) | 言語解析装置 | |
JPH04211868A (ja) | Cd―romデータの検索用キーワードの作成方法 | |
JP2786211B2 (ja) | 機械翻訳装置における後編集装置 | |
JPH0973454A (ja) | 文書作成装置及び文書作成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090522 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090522 Year of fee payment: 11 |