[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2005004657A - Information classification method and device - Google Patents

Information classification method and device Download PDF

Info

Publication number
JP2005004657A
JP2005004657A JP2003169941A JP2003169941A JP2005004657A JP 2005004657 A JP2005004657 A JP 2005004657A JP 2003169941 A JP2003169941 A JP 2003169941A JP 2003169941 A JP2003169941 A JP 2003169941A JP 2005004657 A JP2005004657 A JP 2005004657A
Authority
JP
Japan
Prior art keywords
information
classification
target information
client
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003169941A
Other languages
Japanese (ja)
Inventor
Katsuhiro Endo
勝博 遠藤
Hajime Noto
肇 能登
Masato Aranishi
誠人 新西
Takafumi Suzuki
尚文 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003169941A priority Critical patent/JP2005004657A/en
Publication of JP2005004657A publication Critical patent/JP2005004657A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To classify information mainly in consideration of a user, to realize the classification such that positioning of the information or the user is understood, and to allow the user to passively receive information related to a classification result thereof. <P>SOLUTION: A server device 110 comprises an information management part 111, a characteristic amount calculation part 112 and an automatic transmission/reception part 113. A client device 120 comprises an information management part 121, an information classification part 122, a group classification part 123, and an automatic transmission/reception part 124. The information management part 111 manages the information about a classification target in a lump, and the characteristic amount calculation part 112 calculates a characteristic amount of the information. The user obtains the information or its characteristic amount registered in the server device via a network by the information management part 121. The information classification part 122 and the group classification part 123 classify the information and a group, and each classification result can be displayed and viewed on each the client device. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、情報を分類する情報分類方法及び装置に関し、より詳細には、分類対象情報群に含まれる各情報間の類似度に基づいて情報を分類する情報分類方法及び装置に関する。
【0002】
【従来の技術】
従来の情報分類システム、特に文書の分類システムとして文書中に出現する単語の出現頻度を利用して自動分類するシステムには「文章自動分類システム」(例えば、特許文献1参照)がある。これは次のような方法で分類を行う。まず、入力した文章における単語の出現頻度を統計処理することによって文書における単語の出現頻度からなる出現頻度ベクトルを形成する。そして、この出現頻度ベクトルを用いて所定の情報量基準に基づき部類対象の文章をクラスタに分割し、その分割したクラスタがそれ以上分けることができないところまでその分割を繰り返していくことによって文章の分類を行う。
【0003】
一方、情報のプッシュ型サービスとして、ユーザが所望の情報を選択的に受け取ることを可能とする「ユーザ適応情報配信システム」(例えば、特許文献2参照)がある。これは次のような方法でユーザに情報を提供する。クライアントにおいてユーザがアクセスする文書情報の統計的な特徴を示す情報をユーザのアクセス特性として入力し、蓄積された文書情報それぞれについて、その統計的特徴を抽出し、ユーザのアクセス特性と抽出結果とに基づいて、ユーザがアクセスする文書情報と配信対象の文書情報それぞれとの類似度を評価し、評価結果に応じて類似度の高い文書情報を選択的にユーザに配信する。
【0004】
【特許文献1】
特開平8−263510号公報
【特許文献2】
特開平11−232287号公報
【0005】
【発明が解決しようとする課題】
しかしながら、従来の情報分類方法は次のような問題点を持っている。
【0006】
上述の文書中に出現する単語の出現頻度を利用して自動分類する「文章自動分類システム」においては、文章などの情報を分類するためのキーを抽出し、そのキーから類似度を計算してクラスタリングしていくので、あくまで文書を適当なグループに分類するのみである。しかし、この方法では情報の全体的な位置づけや分類がわかるものの、ユーザにとって情報がどの程度どのように関連するかがわかりにくいため情報の有効活用が困難である。
【0007】
一方、ユーザが所望の情報を選択的に受け取ることを可能とする「ユーザ適応情報配信システム」においては、ユーザが受動的に情報を受け取る場合、関連づける情報に対しユーザのアクセスが必須であり、「文章自動分類システム」のような情報の分類結果をそのまま利用してプッシュ型で関連情報を配信することが難しいという問題がある。
【0008】
そこで、本発明は、上記の従来の課題に鑑みてなされたものであり、その目的とするところは、情報の分類をユーザ中心に考えて行い、情報やユーザの位置づけがわかるような分類を実現し、また、その分類結果に関連する情報を受動的にユーザが受け取ることができる情報分類システムおよび方法を提供することにある。
【0009】
【課題を解決するための手段】
このような目的を達成するために、請求項1に記載の発明は、情報分類システムにおいて、複数の分類対象情報を含む分類対象情報群を格納するサーバ記憶手段、複数の分類対象情報の各々の間で情報特徴量を相互に算出してサーバ記憶手段に格納するサーバ制御手段、および情報特徴量送信要求を受信し、サーバ記憶手段から読み出された情報特徴量を送信するサーバ通信手段を含むサーバ装置と、ユーザによって設定された、情報グループを分類する場合基準となる分類基準を予め格納するクライアント記憶手段、サーバ装置に情報特徴量送信要求を送信し、情報特徴量をサーバ装置から受信するクライアント通信手段、およびユーザの要求によりまたは所定の条件が満たされると自動的に、クライアント記憶手段から分類基準を読み出し、通信部において受信した情報特徴量に基づいて当該読み出された分類基準を用いて分類対象情報を分類し、分類された結果をクライアント記憶手段に格納するクライアント制御手段を含むクライアント装置とを備えたことを特徴とする。
【0010】
請求項2に記載の発明は、請求項1記載の情報分類システムにおいて、分類基準は、分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、クライアント制御手段は、中心情報の指示において示される情報を中心に分類することを特徴とする。
【0011】
請求項3に記載の発明は、請求項1または2記載の情報分類システムにおいて、分類対象情報は、情報の内容および所有者を含み、クライアント制御手段は、分類対象情報の各々の間で分類対象情報の各々に含まれる情報の内容および所有者についてそれぞれ相互に算出された情報特徴量に基づいて分類することを特徴とする。
【0012】
請求項4に記載の発明は、情報分類システムにおいて、複数の分類対象情報を含む分類対象情報群を格納するサーバ記憶手段、複数の分類対象情報の各々の間で情報特徴量を相互に算出してサーバ記憶手段に格納し、および分類対象情報群に含まれる分類対象情報を所定の規則によって分類した複数の情報グループを生成してサーバ記憶手段に格納するサーバ制御手段、ならびに情報特徴量送信要求を受信し、サーバ記憶手段から読み出された情報特徴量および複数の情報グループを送信するサーバ通信手段を含むサーバ装置と、ユーザによって設定された、情報グループを分類する場合基準となる分類基準を予め格納するクライアント記憶手段、サーバ装置に情報特徴量送信要求を送信し、情報特徴量および複数の情報グループをサーバ装置から受信するクライアント通信手段、ならびにユーザの要求によりまたは所定の条件が満たされると自動的に、クライアント記憶手段から分類基準を読み出し、通信部において受信した情報特徴量および複数の情報グループを用いて算出されたグループ情報特徴量に基づき読み出された分類基準を用いて複数の情報グループを分類し、分類された結果をクライアント記憶手段に格納するクライアント制御手段とを備えたことを特徴とする。
【0013】
請求項5に記載の発明は、請求項4記載の情報分類システムにおいて、分類基準は、分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、クライアント制御手段は、中心情報の指示において示される情報を含む情報グループを中心に分類することを特徴とする。
【0014】
請求項6に記載の発明は、請求項4または5記載の情報分類システムにおいて、分類対象情報は、情報の内容および所有者を含み、クライアント制御手段は、情報グループの各々の間で情報グループの各々に含まれる情報の内容および所有者についてそれぞれ相互に算出されたグループ情報特徴量に基づいて分類することを特徴とする。
【0015】
請求項7に記載の発明は、請求項1ないし6のいずれかに記載の情報分類システムにおいて、分類基準は、情報特徴量をユーザごとに調整する場合の調整量を示す特徴量調整値を含み、クライアント制御手段は、情報特徴量を該特徴量調整値によって調整した値に基づいて分類することを特徴とする。
【0016】
請求項8に記載の発明は、請求項1ないし7のいずれかに記載の情報分類システムにおいて、所定の条件は、対象情報群に新たな情報である追加情報が追加されることであり、クライアント制御手段は、追加情報と分類対象情報の各々との間で算出された情報特徴量に基づいて分類することを特徴とする。
【0017】
請求項9に記載の発明は、請求項1ないし7のいずれかに記載の情報分類システムにおいて、所定の条件は、対象情報群に新たな情報である追加情報が追加されることであり、クライアント通信手段は、サーバ装置から追加情報を受信し、クライアント制御手段は、受信した追加情報をすでに受信済みの情報特徴量に基づいて対象情報に含めて分類することを特徴とする。
【0018】
請求項10に記載の発明は、請求項1ないし7のいずれかに記載の情報分類システム、サーバ制御部は、クライアント装置が情報特徴量を所定の時間間隔ごとに算出時点において格納されている対象情報群に含まれる分類対象情報の各々の間で相互に算出するか、または追加情報が追加されるごとに追加情報を対象情報群に追加して追加が行われた対象情報群に含まれる分類対象情報の各々の間で相互に算出することを特徴とする。
【0019】
請求項11に記載の発明は、請求項1ないし10のいずれかに記載の情報分類システムにおいて、サーバ装置は、クライアント装置のうちの1つから追加情報があるとの通知を受信したときは、通知をしたクライアント装置以外のクライアント装置に、追加情報がある旨通知し、クライアント装置は、追加情報を要求するときは、サーバ装置および追加情報があるとの通知を送信したクライアント装置のいずれかから追加情報を受信することを特徴とする。
【0020】
請求項12に記載の発明は、サーバ装置において、複数の分類対象情報を含む分類対象情報群を格納するサーバ記憶手段と、複数の分類対象情報の各々の間で情報特徴量を相互に算出してサーバ記憶手段に格納するサーバ制御手段と、情報特徴量送信要求を受信し、サーバ記憶手段から読み出された情報特徴量を送信するサーバ通信手段とを備えたことを特徴とする。
【0021】
請求項13に記載の発明は、サーバ装置において、複数の分類対象情報を含む分類対象情報群を格納するサーバ記憶手段と、複数の分類対象情報の各々の間で情報特徴量を相互に算出してサーバ記憶手段に格納し、および分類対象情報群に含まれる分類対象情報を所定の規則によって分類した複数の情報グループを生成してサーバ記憶手段に格納するサーバ制御手段と、情報特徴量送信要求を受信し、サーバ記憶手段から読み出された情報特徴量および複数の情報グループを送信するサーバ通信手段とを備えたことを特徴とする。
【0022】
請求項14に記載の発明は、請求項12または13記載のサーバ装置において、サーバ制御部は、情報特徴量を所定の時間間隔ごとに算出時点において格納されている対象情報群に含まれる分類対象情報の各々の間で相互に算出するか、または追加情報が追加されるごとに追加情報を対象情報群に追加して追加が行われた対象情報群に含まれる分類対象情報の各々の間で相互に算出することを特徴とする。
【0023】
請求項15に記載の発明は、クライアント装置において、情報特徴量送信要求を送信し、分類対象情報群に含まれる複数の分類対象情報の各々の間で相互に算出される情報特徴量を受信するクライアント通信手段と、ユーザによって設定された、複数の分類対象情報を分類する場合基準となる分類基準を予め格納するクライアント記憶手段と、ユーザの要求によりまたは所定の条件が満たされると自動的に、クライアント記憶手段から分類基準を読み出し、通信部において受信した情報特徴量に基づいて読み出された分類基準を用いて分類対象情報を分類し、分類された結果をクライアント記憶手段に格納するクライアント制御手段とを備えたことを特徴とする。
【0024】
請求項16に記載の発明は、請求項15記載のクライアント装置において、分類基準は、分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、クライアント制御手段は、中心情報の指示において示される情報を中心に分類することを特徴とする。
【0025】
請求項17に記載の発明は、請求項15または16記載のクライアント装置において、分類対象情報は、情報の内容および所有者を含み、クライアント制御手段は、分類対象情報の各々の間で分類対象情報の各々に含まれる情報の内容および所有者についてそれぞれ相互に算出された情報特徴量に基づいて分類することを特徴とする。
【0026】
請求項18に記載の発明は、クライアント装置において、情報特徴量送信要求を送信し、分類対象情報群に含まれる複数の分類対象情報の各々の間で相互に算出される情報特徴量、および分類対象情報群に含まれる分類対象情報を所定の規則によって分類した複数の情報グループを受信するクライアント通信手段と、ユーザによって設定された、複数の分類対象情報を分類する場合基準となる分類基準を予め格納するクライアント記憶手段と、ユーザの要求によりまたは所定の条件が満たされると自動的に、クライアント記憶手段から分類基準を読み出し、通信部において受信した情報特徴量および複数の情報グループを用いて算出されたグループ情報特徴量に基づき当該読み出された分類基準を用いて複数の情報グループを分類し、分類された結果をクライアント記憶手段に格納するクライアント制御手段とを備えたことを特徴とする。
【0027】
請求項19に記載の発明は、請求項18記載のクライアント装置において、分類基準は、分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、クライアント制御手段は、中心情報の指示において示される情報を含む情報グループを中心に分類することを特徴とする。
【0028】
請求項20分類対象情報は、請求項18または19記載のクライアント装置において、情報の内容および所有者を含み、クライアント制御手段は、情報グループの各々の間で情報グループの各々に含まれる情報の内容および所有者についてそれぞれ相互に算出されたグループ情報特徴量に基づいて分類することを特徴とする。
【0029】
請求項21に記載の発明は、請求項15ないし20のいずれかに記載のクライアント装置において、分類基準は、情報特徴量をユーザごとに調整する場合の調整量を示す特徴量調整値を含み、クライアント制御手段は、情報特徴量を特徴量調整値によって調整した値に基づいて分類することを特徴とする。
【0030】
請求項22に記載の発明は、請求項15ないし21のいずれかに記載のクライアント装置において、所定の条件は、対象情報群に新たな情報である追加情報が追加されることであり、クライアント制御手段は、追加情報と分類対象情報の各々との間で算出された情報特徴量に基づいて分類することを特徴とする。
【0031】
請求項23に記載の発明は、請求項15ないし21のいずれかに記載のクライアント装置において、所定の条件は、対象情報群に新たな情報である追加情報が追加されることであり、クライアント通信手段は、追加情報を受信し、クライアント制御手段は、受信した追加情報をすでに受信済みの情報特徴量に基づいて対象情報に含めて分類することを特徴とする。
【0032】
請求項24に記載の発明は、分類対象情報群に含まれる分類対象情報の各々の間で相互に算出される情報特徴量に基づいて分類対象情報を分類するステップを実行するプログラムであって、複数の分類対象情報の各々の間で情報特徴量を相互に算出してサーバ記憶手段にサーバ制御手段が格納する特徴量格納ステップと、情報特徴量送信要求を受信し、サーバ記憶手段から読み出された情報特徴量をサーバ通信手段が送信する送信ステップとを実行することを特徴とする。
【0033】
請求項25に記載の発明は、分類対象情報群に含まれる分類対象情報の各々の間で相互に算出される情報特徴量に基づいて該分類対象情報を分類するステップを実行するプログラムであって、複数の分類対象情報の各々の間で情報特徴量を相互に算出してサーバ記憶手段にサーバ制御手段が格納し、および分類対象情報群に含まれる分類対象情報を所定の規則によって分類した複数の情報グループを生成してサーバ記憶手段に格納する特徴量格納ステップと、情報特徴量送信要求を受信し、サーバ通信手段が、サーバ記憶手段から特徴情報量および複数の情報グループを読み出して送信する送信ステップとを実行することを特徴とする。
【0034】
請求項26に記載の発明は、請求項24または25記載のプログラムであって、特徴量格納ステップは、情報特徴量を所定の時間間隔ごとに算出時点において格納されている対象情報群に含まれる分類対象情報の各々の間で相互に算出するか、または追加情報が追加されるごとに追加情報を対象情報群に追加して追加が行われた対象情報群に含まれる分類対象情報の各々の間で相互に算出することを特徴とする。
【0035】
請求項27に記載の発明は、分類対象情報群に含まれる分類対象情報の各々の間で相互に算出される情報特徴量に基づいて分類対象情報を分類するステップを実行するプログラムであって、情報特徴量送信要求を送信し、分類対象情報群に含まれる複数の分類対象情報の各々の間で相互に算出される情報特徴量をクライアント通信手段が受信する特徴量受信ステップと、ユーザによって設定された、複数の分類対象情報を分類する場合基準となる分類基準を予めクライアント記憶手段が格納する分類基準格納ステップと、クライアント制御手段は、ユーザの要求によりまたは所定の条件が満たされると自動的に、クライアント記憶手段から分類基準を読み出し、通信部において受信した情報特徴量に基づいて読み出された分類基準を用いて分類対象情報を分類し、分類された結果をクライアント記憶手段に格納する分類結果格納ステップとを実行することを特徴とする。
【0036】
請求項28に記載の発明は、請求項27記載のプログラムであって、分類基準は、分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、分類結果格納ステップは、中心情報の指示において示される情報を中心に分類することを特徴とする。
【0037】
請求項29に記載の発明は、請求項27または28記載のプログラムであって、分類対象情報は、情報の内容および所有者を含み、分類格納ステップは、分類対象情報の各々の間で分類対象情報の各々に含まれる情報の内容および所有者についてそれぞれ相互に算出された情報特徴量に基づいて分類することを特徴とする。
【0038】
請求項30に記載の発明は、分類対象情報群に含まれる分類対象情報の各々の間で相互に算出される情報特徴量に基づいて分類対象情報を分類するステップを実行するプログラムであって、情報特徴量送信要求を送信し、分類対象情報群に含まれる複数の分類対象情報の各々の間で相互に算出される情報特徴量、および分類対象情報群に含まれる分類対象情報を所定の規則によって分類した複数の情報グループをクライアント通信手段が受信する特徴量受信ステップと、ユーザによって設定された、複数の分類対象情報を分類する場合基準となる分類基準を予めクライアント記憶手段が格納する分類基準格納ステップと、クライアント制御手段は、ユーザの要求によりまたは所定の条件が満たされると自動的に、クライアント記憶手段から分類基準を読み出し、通信部において受信した情報特徴量および複数の情報グループに基づいて読み出された分類基準を用いて分類対象情報を分類し、分類された結果をクライアント記憶手段に格納する分類結果格納ステップとを実行することを特徴とする。
【0039】
請求項31に記載の発明は、請求項30記載のプログラムであって、分類基準は、分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、分類結果格納ステップは、中心情報の指示において示される情報を含む情報グループを中心に分類することを特徴とする。
【0040】
請求項32に記載の発明は、請求項30または31記載のプログラムであって、分類対象情報は、情報の内容および所有者を含み、分類結果格納ステップは、情報グループの各々の間で情報グループの各々に含まれる情報の内容および所有者についてそれぞれ相互に算出されたグループ情報特徴量に基づいて分類することを特徴とする。
【0041】
請求項33に記載の発明は、請求項27ないし32のいずれかに記載のプログラムであって、分類基準は、情報特徴量をユーザごとに調整する場合の調整量を示す特徴量調整値を含み、分類結果格納ステップは、情報特徴量を特徴量調整値によって調整した値に基づいて分類することを特徴とする。
【0042】
請求項34に記載の発明は、請求項27ないし33のいずれかに記載のプログラムであって、所定の条件は、対象情報群に新たな情報である追加情報が追加されることであり、分類結果格納ステップは、追加情報と分類対象情報の各々との間で算出された情報特徴量に基づいて分類することを特徴とする。
【0043】
請求項35に記載の発明は、請求項27ないし33のいずれかに記載のプログラムであって、所定の条件は、対象情報群に新たな情報である追加情報が追加されることであり、クライアント通信手段は、追加情報を受信するステップをさらに実行し、分類結果格納ステップは、受信した追加情報をすでに受信済みの情報特徴量に基づいて対象情報に含めて分類することを特徴とする。
【0044】
請求項36に記載の発明は、コンピュータ読み取り可能な記録媒体であって、請求項24ないし35に記載の各プログラムを記録したことを特徴とする。
【0045】
請求項37に記載の発明は、分類対象情報群に含まれる分類対象情報の各々の間で相互に算出される情報特徴量に基づいて分類対象情報を分類する情報分類方法において、分類対象情報を分類する場合基準となる分類基準を予め設定し格納する設定ステップと、ユーザの要求によりまたは分類対象情報群に新たな情報が追加されると自動的に、分類基準を読み出し読み出された分類基準を用いて分類対象情報を分類する分類ステップとを備えたことを特徴とする。
【0046】
請求項38に記載の発明は、請求項37記載の情報分類方法において、分類基準は、分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、分類ステップは、中心情報の指示において示される情報を中心に分類することを特徴とする。
【0047】
請求項39に記載の発明は、分類対象情報群に含まれる分類対象情報の各々の間で相互に算出される情報特徴量に基づいて分類対象情報を分類する情報分類方法において、分類対象情報群に含まれる分類対象情報を所定の規則によって分類して複数の情報グループを生成する生成ステップと、情報グループを分類する場合基準となる分類基準を予め設定し格納する設定ステップと、ユーザの要求によりまたは所定の条件が満たされると自動的に、分類基準を読み出し、複数の情報グループを複数の情報グループの各々の間で相互に算出される情報特徴量に基づいて読み出された分類基準を用いて分類する分類ステップとを備えたことを特徴とする。
【0048】
請求項40に記載の発明は、請求項39記載の情報分類方法において、分類基準は、分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、分類ステップは、中心情報の指示において示される情報を含む情報グループを中心に分類することを特徴とする。
【0049】
請求項41に記載の発明は、請求項37ないし40のいずれかに記載の情報分類方法において、分類対象情報は、情報の内容および所有者を含み、分類ステップは、分類対象情報の各々の間で分類対象情報の各々に含まれる情報の内容および所有者についてそれぞれ相互に算出された情報特徴量に基づいて分類することを特徴とする。
【0050】
請求項42に記載の発明は、請求項37ないし41のいずれかに記載の情報分類方法において、分類基準は、情報特徴量をユーザごとに調整する場合の調整量を示す特徴量調整値を含み、分類ステップは、情報特徴量を特徴量調整値によって調整した値に基づいて分類することを特徴とする。
【0051】
請求項43に記載の発明は、請求項37ないし42のいずれかに記載の情報分類方法において、所定の条件は、対象情報群に新たな情報である追加情報が追加されることであり、分類ステップは、追加情報と分類対象情報の各々との間で算出された情報特徴量に基づいて分類することを特徴とする。
【0052】
請求項44に記載の発明は、請求項37ないし42のいずれかに記載の情報分類方法において、情報特徴量は、所定の時間間隔ごとにその算出時点において格納されている対象情報群に含まれる分類対象情報の各々の間で相互に算出するか、または追加情報が追加されるごとに追加情報を対象情報群に追加して追加が行われた対象情報群に含まれる分類対象情報の各々の間で相互に算出することを特徴とする。
【0053】
請求項45に記載の発明は、請求項37ないし44のいずれかに記載の情報分類方法において、クライアント装置のうちの1つから追加情報があるとの通知をサーバ装置が受信したときは、通知をしたクライアント装置以外のクライアント装置に、追加情報がある旨通知する追加情報通知ステップと、クライアント装置が追加情報を要求するときは、サーバ装置および追加情報があるとの通知を送信したクライアント装置のいずれかから追加情報を受信する追加情報受信ステップとをさらに備えたことを特徴とする。
【0054】
【発明の実施の形態】
以下、図面を参照して本発明の実施形態について説明する。
(第1実施形態)
図1は、本実施形態の分類システムの全体構成を説明する図である。本実施形態のシステムは、1つのサーバ装置と複数のクライアント装置とそれぞれがもつデータベースから構成される。ただし、サーバ装置が複数あって協調しながら動作する構成とすることもできる。本実施形態では、サーバ装置が1つの場合について説明する。
【0055】
サーバ装置110は、情報管理部111、特徴量計算部112および自動送受信部113から構成される。クライアント装置120は、情報管理部121、情報分類部122、グループ分類部123および自動送受信部124から構成される。
【0056】
本実施形態の文類システムでは、サーバ装置110の情報管理部111で分類対象の情報を一括して管理し、特徴量計算部112により情報の特徴量を計算する。ユーザは、クライアント装置120の情報管理部121により、ネットワークを介してサーバ装置に登録さている情報やその特徴量を得る。また、情報分類部122とグループ分類部123により情報とグループの分類を行う。各分類結果は、情報管理部121によって各クライアント装置上で表示し観覧することができる。
【0057】
また、サーバ装置110とクライアント装置120の自動送受信部113と124とにより、新規に登録された情報についてネットワークを介して自動的にユーザに知らせて、情報を取得する機能を実現する。詳細は後述する。
【0058】
なお、分類対象の情報、情報の特徴量、分類結果などは、サーバ装置とクライアント装置のデータベース115、125に保存され、各部は適宜読み出し利用する。
【0059】
図2は、本実施形態のシステムが動作する場合の配置構成を説明する図である。図1と同様の構成品については同一の符号を付す。サーバ装置110とクライアント装置A201、B202、C203がネットワーク220に接続されており、サーバ装置110とクライアント装置120がそれぞれの情報管理部111、121を用いてこのネットワーク220を介して情報のやりとりを行う。
【0060】
クライアント装置A、B、Cはそれぞれネットワークパス211、212、213を通りサーバ装置110と通信する。また、自動送受信部113、124において、ネットワークパス214などを通りクライアント装置同士が直接情報のやりとりを行う。詳細は第4実施形態で説明する。
【0061】
図3は、サーバ装置115とクライアント装置125のデータベースについて説明する図である。図1等と同様の構成品については同一の符号を付す。サーバデータベース115には、システムに参加しているユーザのユーザ設定311および分類の対象となる登録情報312が格納されている。ここで、ユーザ設定は、分類を行う場合の部類基準となるものの一例であり、少なくともユーザ名およびユーザの所有する情報が含まれる。
【0062】
これらはサーバ装置110の情報管理部により登録や変更の処理が行われ、その更新状態はログ313として格納される。さらに、サーバデータベース115は、サーバ装置110の特徴量計算部112によって計算される情報の特徴量314、サーバ装置110の情報管理部111により生成される基本グループ315、サーバ装置110の自動送受信部113で設定される自動送受信設定318が格納される。これらのデータは、適宜必要な時に各部によって読み書きされる。ここで、自動送受信設定とは、自動的にいずれの情報を取得するかを選択することについての設定であり、例えば特定の情報およびその情報からの特徴量ベクトルの閾値などである。
【0063】
クライアントデータベース125は、システムを利用するユーザのユーザ設定321が格納されている。また、クライアント装置の情報管理部によって取得、生成される登録情報312に含まれる所有者などのメタ情報322および登録情報312の追加や変更等があった場合の更新状態を表すログ323、サーバ装置110から取得した情報特徴量324、サーバ装置110から取得した基本グループ325が格納される。
【0064】
さらに、クライアント装置の情報分類部によって計算される情報分類結果326、クライアント装置120のグループ分類部123によって計算される基本グループ分類結果327、およびクライアント装置120の自動送受信部125で設定される自動送受信設定328が格納される。これらのデータは、適宜必要な時に各部によって読み書きされる。
【0065】
図4は、本実施形態のシステムのサーバ装置の起動時の処理を説明する図である。図1等と同様の構成品については同一の符号を付す。まず、サーバ装置110のデータベース115に分類対象の情報が格納されているとする。サーバ装置110が初めて起動した場合は、情報管理処理S301において、データベース115上の分類対象の情報から登録情報312と基本グループ315を生成し格納する。次に、特徴量計算処理S302において各情報の特徴量を計算し、その特徴量をデータベース115に格納して次の処理の待ち状態であるアイドル状態となる。
【0066】
なお、サーバ装置110のデータベース115に情報がない場合は、以上の処理は行わずにアイドル状態となる。
【0067】
サーバ装置110の2回目以降の起動では、情報管理部111により登録情報312やログ313などのシステムの状態を読み出してアイドル状態となる。
【0068】
図5は、本実施形態のサーバ装置起動時の情報管理処理を説明する図である。図1等と同様の構成品については同一の符号を付す。まず、サーバデータベース115から分類対象の情報を読み込む(S501)。次に各情報が属するグループ情報から基本グループ315を作成する(S502)。この時、その基本グループに属する情報をリスト化して基本グループに関連付ける。次に分類対象の各情報を登録情報312として、この登録情報312と作成した基本グループ315をデータベース115に格納し、更新のログ313を作成してデータベース115に格納して(S503)情報管理処理を終了する。
【0069】
なお、この基本グループ315はユーザが情報を登録する際に、またはシステム管理者が後から、特定の規則によって付加することが望ましい。これらの規則としては、管理者によって予め定義された所定の分野または論文等の場合は学会が予め定める技術分野を用いることができるが、これに限られない。
【0070】
図6は、本実施形態のシステムのクライアント装置の起動時の処理を説明する図である。図1等と同様の構成品については同一の符号を付す。クライアント装置120の起動では、クライアント装置120の情報管理部121とサーバ装置110の情報管理部111により、ネットワーク220を介して各データベース115、125にあるユーザ設定、ログ、メタ情報、情報の特徴量、基本グループのやりとりを行い、ユーザの要求を待つアイドル状態となる。
【0071】
図7は、クライアント装置起動時の情報管理部を説明する図である。クライアント装置120はデータベース125からユーザ設定321を読み込み、ユーザの設定を確認して新たなユーザであれば登録し、変更の必要があれば設定を更新してユーザ設定をデータベースに格納する(S721)。なお、ユーザのログイン等もこのユーザ設定を使って実現する。ユーザ設定が変更され、または更新された場合、クライアント装置120はネットワーク220を介してサーバ装置110に通報し(S722)、サーバ装置110はサーバ装置110が持つユーザ設定311と異なっていればユーザ設定を更新してサーバ装置110のデータベース115に格納する(S711)。次にクライアント装置120はサーバ装置110の状態を取得し(S712)、これに応じてサーバ装置110はデータベース115からログを読み出してクライアント装置120に送信する(S713)。クライアント装置120はデータベース125からログ323を読み出しサーバ装置のログ313との比較を行い、サーバ装置110の状態が更新されていれば更新情報を取得し(S713)、サーバ装置110はデータベース115から更新された登録情報312、情報特徴量314、基本グループ315をクライアント装置120に送信し(S713)、クライアント装置120はその情報をデータベース125に格納し(S725)情報管理処理を終了する。
【0072】
図8は、本実施形態のシステムの分類対象となる情報の定義を説明する図である。情報801は、情報名部802、情報の所有者806、情報の分類およびグループの分類を行うための情報が所属するグループ部807ならびに情報の内容である内容部805が必要である.さらに、本実施形態で説明する分類方法のために、情報に関連する情報の参照情報部803と情報を表現するキーワード部804を持つこととする。
【0073】
また、情報の集合である分類対象の情報群808は、分類の対象となる情報と情報が参照している情報を合わせたものとする。
【0074】
図9は、サーバ装置の特徴量計算処理を説明する図である。特徴量計算処理は、まずサーバ装置110のデータベース115にある登録情報312を読み込み(S901)、この登録情報312の特徴量を計算し(S902)、計算した特徴量314をデータベース115に格納して(S903)終了する。
【0075】
図10〜13は、本実施形態の情報特徴量を計算する場合のサーバ装置の特徴量計算処理の具体的例を説明する図である。ここでは、情報特徴量314を情報が参照する情報および情報の内容やキーワードから計算する方法を説明する。
【0076】
図10は、情報特徴量314を計算するための参照ツリーの作成方法を説明する図である。基本的な参照ツリーは、情報が参照する情報を木構造で関連づけているものである。情報A1001について具体的に次のような方法で参照ツリーを作成する。
【0077】
情報A1001は、情報B1002、C1003、D1004を参照しているとする。すなわち情報階層1011が情報A1001の参照情報を表す。まず情報A1001から各情報B1002、C1003、D1004へリンクを張る。
【0078】
次に情報B1002から情報B1002が参照している情報C1005、E1006、F1007へリンクを張る。ここで、各情報を参照ツリーのセル、情報から情報へのリンクを参照ツリーの枝と呼ぶ。以上のように参照ツリーを生成した結果、所定の終了条件が満たされると参照ツリーの生成を終了する。
【0079】
本実施形態において用いられる終了条件は、図10に示すように以下の5つの終了条件である。
【0080】
終了条件<1>:参照ツリーに一度出現している情報が参照されたとき
終了条件<2>:所定の範囲外の日付日時を持つ情報が参照されたとき
終了条件<3>:参照ツリーが所定の階層値を越えたとき
終了条件<4>:参照ツリーに含まれるセルの数が所定の数を超えたとき
終了条件<5>:参照情報が情報群に存在しないとき
【0081】
これらの5つの条件をすべてのセルで満たしたとき、参照ツリーの作成は終了する。例えば、情報Cは,セルC1003で一度出現しているので、終了条件<1>により終了する。本実施形態において、情報Hは所定の範囲外の日付日時を持つ情報であるとすると、情報Eが参照する情報Hは終了条件<2>を満たすので、セルE1006からリンクを張られたセルH1008はさらにリンクを張ることなくツリーの生成を終了する。また、本実施形態の終了条件<3>に示される所定の階層値を4とすると、図4において階層1011は階層値1、階層1012は階層値2、階層1013は階層値3および階層1014は階層値4となるから、情報Iが参照する情報Kに対応するセルK1010は、終了条件<3>を満たすためツリーの生成は終了する。
【0082】
なお,終了条件は上記に限られるものではなく、情報の特性に応じて追加修正等することができる。また、本実施形態において、参照ツリーの作成は,参照ツリーの階層毎に行う。従って、特定の参照情報についてだけ参照ツリーが深くなっていくことはなく、参照ツリーに情報が再出現するときは、情報が最初に出現した階層よりも決して浅い(階層値が小さい)位置に出現することはない。
【0083】
図11は,参照ツリーへ新しいセルを追加する方法を説明するための参照ツリーを示す図である。図10を参照して上記で説明した参照ツリー生成方法は、情報Aの参照情報をツリー上に展開する手法を用いるため、そもそも情報Aによって参照されていない情報は参照ツリーには組み込まれない。したがって、情報Aよりも新しい情報は追加されないため、他の方法で組み込む、すなわち参照ツリーへの新しい情報に対応するセルの追加を行う必要がある。このような情報を本明細書では追加参照情報とする。
【0084】
図11に示す参照ツリーも図10に示す参照ツリーと同様に、情報Aを分類の中心(セルA1101をルートセル)として参照ツリーを作成する。情報Aは情報Bを参照しているため、セルA1101からセルB1102へリンクが張られる。この時、情報Bとの間で高い類似性を有する情報を検索し、(後述する)所定のセル追加条件を満たす場合にセルの追加を実行する。図11では、情報Bと同じ階層1110に、追加参照情報である新しい情報Lに対応するセルL1103を追加する。
【0085】
情報Lについても上述の参照ツリー生成と同様の方法でツリーを生成する。情報Lは情報Aと情報Mとを参照しているが、情報Aは既に出現しているので、終了条件<1>により参照ツリーの生成を終了する。さらに、情報Mは情報C、情報Nおよび情報Fを参照している。情報Cに対応するセルC1106は終了条件<1>を満たすためここでツリーの生成が終了し、情報Nは情報Oを参照していて情報Oに対応するセルO1108は終了条件<3>を満たしてツリーの生成が終了し、および情報Fに対応するセルF1109は終了条件<1>を満たしツリーの生成が終了する。
【0086】
本実施形態では、参照ツリーへセルを追加する条件として以下のような3つの条件を定める。
追加条件<1>:1セルに対して追加するセル数が所定の値以下である
追加条件<2>:セルを追加する参照ツリーの階層値が値以下である
追加条件<3>:追加する情報の非類似度が所定の値よりも低い
【0087】
追加条件<1>は、参照ツリーの各セルに対して追加することができるセル数を規定する。追加条件<2>は、参照ツリーのいずれの階層にセルを追加することができるかを規定する。例えば、参照ツリーの1セルに対して追加することができるセル数を1、追加できる参照ツリーの階層値を1とすると、図10に示す参照ツリーではセルB1002、C1003およびセルD1004に対してのみ、それぞれ1個ずつセルを追加することが可能である。
【0088】
追加条件<3>は、参照ツリーに既に出現している情報と追加するセルとの非類似度が一定以下である必要があることを規定している。すなわち、条件<1>と<2>が満たされる場合であっても、あまりに類似しない(非類似度が一定以上の)情報は参照ツリーに追加する意味がないということである。
【0089】
なお、追加条件は上記に限られるものではなく、情報の特性に応じて追加修正等することができる。また、本実施形態において参照ツリーへのセルの追加は、参照ツリーの作成時、各階層においてセルが作成された時点で行う。
【0090】
図12、13は、参照ツリーから特徴量ベクトルを作成する方法を説明する図である。
【0091】
図12は、参照ツリーの解析による情報特徴量の算出方法を説明するための図である。本実施形態では、参照ツリー1201に基づいて、情報特徴量ベクトルの算出を行うが、参照ツリー1201は、図10に示す参照ツリーに図11で示すように情報Lに対応するセルL1103を追加したものである。
【0092】
本発明の参照ツリーの解析による情報特徴量ベクトルは、参照情報または情報に含まれるキーワードもしくは内容に基づいて参照ツリーの解析を行い、類似性を示すパラメータを計算して算出される。本実施形態では、パラメータとして出現頻度α、平均階層値β、再出現頻度γ、重み1δおよび重み2(1/ε)を使用する。
【0093】
まず、参照ツリー1201に含まれる各情報に対して、出現頻度などの解析を実行して、上記の各パラメータを算出する。各情報の再出現頻度γは、例えば情報が出現する階層に、階層値0では点数5、階層値1では点数4として階層値が1増えるごとにその点数が1減じるような点数を付与するものとすると、次のように計算することができる。
【0094】
情報が最初に出現した階層の点数 ÷ その情報が再出現する階層の階層値
例として情報Cについて考えると、情報Bは階層値2の階層で出現する情報Cを参照しており、また情報Aも階層値1の階層で情報Cを参照している。従って、情報Cが最初に出現した階層は階層値1であり、その点数は4である。次に再出現の階層は階層値2および階層値3であり、階層値3の階層には2回出現していることから、再出現頻度γは(4/2+4/3+4/3)となる。
【0095】
また、図12に示す本実施形態の例では、重み1(δ)は、情報に含まれるキーワードが一致した場合をカウントした数値であり、重み2(1/ε)としては、情報Aに対する図11で示された非類似度と同様の数値を使用する。
【0096】
次にこれらの解析値を元として、各情報をベクトル表現して類似度ベクトル1203とする。ここで、ベクトルの元は必要に応じて正規化したりパラメータをかけたりすることができる。
【0097】
なお,解析を行う項目はこれに限られるものではなく、情報の特性に応じて追加修正等することができる。
【0098】
図13は、参照ツリーの比較による情報特徴量の算出方法を説明するための図である。本算出方法は、情報が類似している場合は同じ情報を参照するという原理を用いた算出方法である。
【0099】
本発明の参照ツリーの比較による情報特徴量ベクトルは、分類対象情報に対して参照ツリーの解析によって得られた各情報の解析値を所定の計算式にかけ、算出された値を情報特徴量ベクトルとすることによって生成される。図13に示す本実施形態の一例では計算式1301を用いる。参照ツリー解析による解析値としては、図12に示す解析値を正規化した数値の和を用いる。図13に示す表1302は、各情報について算出された値をベクトル表現したものである。
【0100】
図14は、クライアント装置120の情報分類処理について説明する図である。情報分類処理は、ユーザのリクエストに応じて実行される。また、情報が追加された時や定期的に実行されるようにすることもできる。
【0101】
情報分類処理は、大きく二つの機能を持ち、一つは分類対象の情報をその特徴量から類似度を計算して情報を分類する機能であり、もう一つは情報の類似度を用いて既存の分類結果に対応して分類する機能である。以下に前者について説明する。後者に関しては情報が追加された場合の動作であり、第2実施形態で説明する。
【0102】
情報分類処理では、まずクライアント装置120のデータベース125から情報特徴量324を読み込む(S1401)。次にユーザにより特徴量の調整と分類の中心となる情報等の分類である分類基準の設定を行う(S1402)。ここで、特徴量の調整とは、ユーザの好みや分類の内容に応じて、サーバ装置110で作成した特徴量を修正することである。また、分類の中心となる情報とは、ユーザがどの情報を中心として分類を行いたいかによって決まり、情報の分類処理S1403に適用される。次にこの特徴量を用いて情報の分類を行って、その分類結果を可視化できるように操作し(S1404)、最終的な分類結果をデータベース125に格納し(S1405)終了する。
【0103】
この時、情報を分類する方法としては、k−mean法やISODATA法、自己組織化マップなどの方法を適用することができる。本実施形態のシステムの情報分類処理の目的は、単純に情報を分類することはもちろん、特定の情報を中心としてユーザが類似する情報を取得できるように分類することであり、分類結果の可視化も重要な分類の機能となる。
【0104】
例えば、自己組織化マップ(T. Kohonen: ”Self−Organizing Maps”、 Springer、 1997)では、情報を多次元のベクトルとして扱って2次元平面や3次元空間に配置しながら分類を行う。その分類結果は、2次元平面や3次元空間に配置されているため、そのまま分類結果の可視化を実現している。従って、前述の特徴量ベクトルに対し自己組織化マップを適用し、その結果を情報の分類結果とすることができる。
【0105】
図15は、自己組織化マップによる情報の分類方法を説明する図である。ここでは2次元平面に分類する方法を説明する。なお、3次元空間に分類する方法も同様に実現できる.今、o×pのセル1501上に情報を配置することを考える。中心となる情報の情報特徴量ベクトルを入力データとし、n次元のベクトルとする。その時、各セルjに次のようなn次元の参照ベクトルを持たせる。
【0106】
【数1】

Figure 2005004657
【0107】
分類は次のように行われる。すべての入力データxに対し、繰り返し回数tだけ以降の処理を行う。入力データxに最も近い参照ベクトルをもつセルcを探索する。探索は式(2)に従って行う。
【0108】
【数2】
Figure 2005004657
【0109】
すなわち、i番目の入力ベクトルxと出力層のj番目のセルの参照ベクトルmの距離が最小となる出力層のセルjを見つけ、それをcとする。ここで、入力ベクトルと参照ベクトルの距離は、例えば式(3)のようなユークリッド距離で表現する。セルcの近傍集合が形成される。この近傍集合N(t)は、例えば式(4)で定義する。
【0110】
【数3】
Figure 2005004657
【0111】
式(4)で、dis(j、c)はセルjとセルcの距離を表し、セルcからの距離がr(t)より近いセルjを集めたものを近傍集合とする。例えば、近傍集合1502はセルcの周りに形成されている。次に、近傍集合に属するセルの参照ベクトルを式(5)、(6)に従って更新する。
【0112】
【数4】
Figure 2005004657
【0113】
すなわち、近傍集合N(t)に属するセルの参照ベクトルはその値を式(5)に従って更新し、それ以外のセルの参照ベクトルは何もしない。ここで、距離r(t)と係数α(t)は、繰り返し回数tに対して一様に減少させる。最後に、入力データに対して式(2)のように最も近い参照ベクトルを持つセルを探索してデータを配置する。以上の処理によって、参照ベクトルの各元の値は変化していくが、更新後も参照ベクトルと入力ベクトルとは関連付けされているため、いずれの情報がいずれの場所にマッピングされているかを知ることができる。
【0114】
従って、情報の特徴量ベクトルを入力データとして情報の分類を行い、処理後に特徴量ベクトルに最も近い参照ベクトルを持つセルに情報を配置した結果の可視化が行われることとなって分類結果を得ることができる。さらに、特定の情報を中心に分類するために、その情報に対しては自己組織化マップのo×pの中心セルをセルcとして近傍集合を形成して分類処理を行う。このように処理することによって、常に特定の情報が中心になるように分類が実施される。
【0115】
なお、k−means法は情報をk個のクラスタ(グループ)に分類する方法であり、最初に分類する数kを設定して次のようなステップで分類を行う。
【0116】
ステップ1:k個の初期クラスタ中心z(1),z(1),・・・,z(1)を適当に決める。
ステップ2:n回目の繰り返しステップにおいて、すべての入力データxを次の方法でk個のクラスタに分類する。すべてのl=1,2,・・・,k (l≠m)について、
【0117】
【数5】
Figure 2005004657
【0118】
とする。ここでs(n)はz(n)をクラスタ中心とする入力データの集合である。
ステップ3:ステップ2で得たS(n)の新しいクラスタ中心z(n+1)を
【0119】
【数6】
Figure 2005004657
【0120】
とする。ここで、Nは、S(n)の数である。
ステップ4:すべてのm=1,2,・・・,kに対して、z(n+1)=z(n)となればアルゴリズムは収束したものとして終了する。そうでなければステップ2に戻る。
【0121】
また、ISODATA法はクラスタ数kを与えることなく、入力データの性質によって変えていく方法である。これは、複数のパラメータを与えてパラメータを変化させながらクラスタ分類を行っていく方法である。しかし、パラメータが入力データに依存して決まり、その設定も煩雑であるという欠点がある。
【0122】
k−means法やISODATA法で分類を行った後は、クラスタ毎に2次元や3次元にベクトル量子化を行い、2次元や3次元上に配置して可視化を行う。
【0123】
図16は、クライアント装置120のグループ分類処理について説明する図である。グループ分類処理は、ユーザのリクエストに応じて実行される。また、情報が追加された時や定期的に実行されるようにすることもできる。
【0124】
グループ分類処理では、基本グループ325に属する情報特徴量324を用いて、特定の所有者を中心として基本グループの特徴量を計算し、その特徴量から基本グループを分類する。ここで、所有者とは、情報の所有者のことであり、対象情報が文献であれば執筆者あるいは著作者のことである。
【0125】
グループ分類処理は、まずクライアントデータベース125から情報特徴量324と基本グループ325とを読み込む(S1601)。次にユーザによって、情報特徴量の調整、分類の中心となる所有者および中心となる基本グループを決定する分類基準である分類の設定を行う(S1602)。ここで、特徴量の調整とは、ユーザの好みや分類の内容に応じて、サーバ装置で作成した特徴量を修正することである。次にこの情報の特徴量を用いて基本グループの特徴量を計算する(S1603)。これはグループ毎に行われ、S1602で設定した分類の中心となる所有者と基本グループにより決定する。この計算した基本グループの特徴量から基本グループの分類を行う(S1604)。
【0126】
次に各基本グループについて、基本グループに属する所有者の分類を行い(S1605)、最終的な分類結果をデータベース125に格納し(S1606)、終了する。
【0127】
なお、グループの分類やグループ内の分類は、前述した自己組織化マップ等の分類方法を用いて行う。
【0128】
図17は、基本グループの特徴量の例について説明する図である。各基本グループは、グループ名1701と代表ベクトル1702とグループの重み1703をもつ。代表ベクトル1702は、基本グループに属する全ての登録情報の特徴量ベクトルの平均などで表現される。グループの重みは、初期状態はシステムの管理者が基本グループの関連度により決め、分類時にはユーザによって変更することができるようにする。基本グループに属する情報は所有者毎(1704〜1706)にまとめておき、所有者毎に基本グループに属する情報数、その所有者の全情報数、情報数を全情報数で割った所属率、および情報の特徴量ベクトルの平均を取った平均ベクトルをもつ。また、所有者毎に類似度を設定し、例えば所有者1704を分類の中心とする特定所有者とするとき、図12のα/βなどを類似度とする。ここで、図17の網掛けの部分が基本グループの特徴量を表し、例えば1707のように基本グループの情報特徴量ベクトルを生成する。すなわち、基本グループの代表ベクトルと分類中心となる基本グループの代表ベクトルの距離(例えばユークリッド距離)、基本グループの重み、分類中心となる所有者の所属率、または基本グループに属する所有者の類似度の総和などを元としたベクトルを基本グループの特徴量ベクトルとする。ここで、ベクトルの項目は自由であり、システムの特性に応じて決めることとする。ただし、ある所有者が中心となるような類似度を用いる必要がある。また、特徴量ベクトルは便宜上規格化などを施す必要がある。
【0129】
図18は、クライアント装置120がサーバ装置110から登録情報を取得するときの情報管理処理について説明する図である。ユーザが分類結果などを用いて所望の情報を探し出し、実際にその情報を取得する場合は、次のように情報管理処理を実行する。
【0130】
まず、クライアントデータベース125から分類結果などのシステムの状態を取得する(S1801)。次にユーザが所望の情報を選択する(S1802)。そしてその情報をネットワークを介してサーバ装置110から取得し(S1803)、サーバ装置110はクライアント装置120からの要求に応じてサーバ装置のデータベース115から登録情報を読み出してクライアント装置120に送信する(S1805)。最後に取得した情報をユーザに提示して(S1804)終了する。
【0131】
図19は、ユーザがシステムを利用する時の例を説明する図である。上記に説明した方法により、クライアント装置120上で情報と情報が属する基本グループの分類が行われ、ユーザはその分類結果に応じてサーバ装置110に登録されている情報を取得することができる。
【0132】
具体的には次のようにユーザはシステムを利用する。まず、図6で説明したようにクライアント装置120を起動してシステムの利用をスタートする。ここで、既にクライアント装置120が起動している場合は、ユーザがログインするのみで処理が実行されるようにすることができる。次にユーザが情報の分類を要求し、図14で説明した情報分類処理により登録情報を分類する(S1901)。次にユーザがグループの分類を要求し、図16で説明したグループ分類処理により登録情報が属する基本グループを分類する(S1902)。次にユーザが分類結果の表示を要求し、クライアント装置120の情報管理部により、分類結果がクライアント装置120の画面等に表示される(S1903)。さらにユーザが特定の情報の取得を要求し、図18で説明した情報管理処理においてユーザが選択した情報をサーバ装置110から取得し、ユーザに提示する(S1904)。次にユーザが新しく追加された情報を自動的に設定する自動送受信の設定を要求し、第4実施形態で説明する方法により自動送受信設定を行い(S1905)、最後に情報管理部によりユーザの利用履歴をログとしてクライアント装置のデータベースに格納して、システムを終了するか、ユーザがログオフを行う。
【0133】
なお、図19で説明した手順はあくまで例であり、要求を入れ替えたり、一部の要求だけとすることもできる。また、情報やグループの分類は、クライアント装置120上で自動的に実行するように設定しておけば、ユーザは処理の時間待つことなく最新の分類結果を取得することができる。
【0134】
(第2実施形態)
情報がシステムに追加される場合の分類処理について図面を参照して説明する。
【0135】
図20は、情報の追加処理の流れを説明する概念図である。サーバ装置110で情報の追加があった場合に、サーバ装置110の情報管理処理においてシステムに情報を登録し、登録情報312、基本グループ315および更新のログ313をサーバ装置のデータベース115に格納する。次にサーバ装置の特徴量計算処理S2002により、各登録情報312の特徴量をすべて計算して再処理するか、追加された情報についてだけ計算して追加処理を行って特徴量314をデータベース115に格納する。そして、サーバ装置の情報管理処理S2001において変更をクライアント装置120に送信し、クライアント装置120の情報管理処理S2004において更新のログ323、メタ情報322、情報の特徴量324および基本グループ325をクライアント装置のデータベース125に格納してサーバ装置110はアイドル状態となる。
【0136】
もし、サーバ装置へ情報が追加された際にクライアント装置120が起動していない場合は、次にクライアント装置120が起動すると図6で説明したようにその追加が反映される。
【0137】
図21は、情報の追加時のサーバ装置110の特徴量計算処理の追加処理を説明する図である。図20における特徴量計算処理は、すべての登録情報について特徴量を再計算する場合と、追加された登録情報についてのみ特徴量を計算する場合がある。前者は、図9に説明したように処理を行い、後者は次に説明するように図21に示す方法で行う。
【0138】
まず、サーバ装置110のデータベース115から追加された登録情報312を読み込む(S2101)。次に追加された登録情報について特徴量の計算を行う(S2102)。この時、前述した方法で特徴量を計算するときの参照情報は適宜データベースから取得する。最後に計算した情報の特徴量をデータベース115格納して(S2103)終了する。
【0139】
図22は、情報の追加後のクライアント装置の情報分類処理の追加処理を説明する図である。情報追加後の情報分類は、登録情報312の特徴量がすべて再計算された場合は前述の図14の方法で行い、追加された登録情報についてのみ特徴量が計算された場合は図22に示す方法で行う。
【0140】
まず、クライアント装置120のデータベース125から更新のログ323を取得し(S2201)、追加された情報の特徴量324とその時点での分類結果326をデータベース125から取得する(S2202)。そして、分類結果に対して追加された情報を配置し(S2203)、これを新たな分類結果としてデータベース125に格納して(S2204)終了する。ここで、処理S2203は、自己組織化マップを用いる場合、分類の処理を行うことなしに、最後の特徴量ベクトルに最も近い参照ベクトルを探して配置することを行う。なお、分類の設定は以前の分類時の設定を用いる。
【0141】
図23は、情報の追加後のグループの分類部の追加処理を説明する図である。情報追加後のグループ分類は、登録情報の特徴量がすべて再計算された場合は前述の図16に示す方法で行い、追加された登録情報についてのみ特徴量が計算された場合は図23に示す方法で行う。ただしこの場合、追加された登録情報によって新たな基本グループが作成されない時は、グループ分類の追加処理は行わない。
【0142】
まず、クライアント装置のデータベース125から更新のログを取得し(S2301)、追加された情報の特徴量、新たに追加された基本グループおよびその時点でのグループの分類結果をデータベース125から取得する(S2302)。次に追加された基本グループの特徴量を計算し(S2303)、分類結果に対して追加された基本グループを配置し(S2304)、追加された基本グループ内の分類を行う(S2305)。最後に最後の分類結果をデータベース125に格納して(S2306)終了する。
【0143】
なお、基本グループの特徴量や分類の方法は図16で説明した方法を用いる。なお、分類基準等の設定は以前の分類時に設定した設定を用いる。
【0144】
以上のように、情報が新たにサーバ装置に追加された場合でも、情報と基本グループの分類を行うことができる。また、既に登録されている情報が更新された場合においても、同様の方法で適用することができる。
【0145】
(第3実施形態)
次に、前述の方法を応用した所有者の分類について説明する。図16、17において説明した基本グループ内の分類を用いれば、情報の所有者を分類することができる。すなわち、所有者毎に所有者が持つ登録情報の特徴量ベクトルを平均した平均ベクトルを用いて、情報の分類と同様の方法を用いて、所有者を分類することができる。分類に自己組織化マップを用いるならば、この場合も情報の分類と同様に、分類の中心にしたい所有者の平均ベクトルをマップの中央に位置するようにして分類を行うことにより、特定の所有者を中心とした分類が可能となる。
【0146】
(第4実施形態)
サーバ装置110とクライアント装置120との間での情報の自動送受信について、図面を参照して説明する。自動送受信は、サーバ装置110に情報が新たに追加された場合に、ユーザが欲する情報を自動的にクライアント装置120に送信するという機能である。
【0147】
図24は、自動送受信の設定を説明する該略図である。まず、クライアント装置データベース125から情報とグループの分類結果を取得する(S2401)。次に、自動的に取得する情報の対象を選択し、自動送受信設定328としてデータベース125に格納する(S2402)。そして、この自動送受信設定328をサーバ装置110に登録し(S2403)、サーバ装置110では自動送受信設定318をサーバ装置110のデータベース115に格納する。
【0148】
ここで、自動的に取得する情報の対象の選択では、ある特定の情報の特徴量ベクトルおよび取得する情報の特徴量ベクトルの距離、または特定の基本グループもしくは特定の基本グループの特徴量ベクトルとの距離、または特定の所有者、もしくは特定の所有者との距離を指定して自動送受信設定とし、それを満たす物を取得することとする。
【0149】
図25は、自動送受信の方法の第1の例を説明する図である。ここでは図面の簡単化の為に、各データベースを省略して説明する。
【0150】
今、クライアント装置Bがサーバ装置に新たに情報を登録し、これに対し、クライアント装置Aが自動送受信設定を行っているとする。まず、クライアント装置Bがサーバ装置に情報を登録する(S2501)。サーバ装置では図20で説明した情報の追加処理S2502を行い、そこで得られた情報の特徴量ベクトル等と自動送受信設定を比較して、クライアント装置Aへの送信の判断を行う(S2503)。設定を満たした場合サーバ装置はクライアント装置Aに新着情報を通報し(S2504)、クライアント装置Aはその情報を取得するかの判断を行う(S2505)。ここで、自動送受信設定328を行っていても、処理S2505によってクライアント装置Aは情報の取得を拒絶することができる。情報を取得する場合は、情報の発信者であるクライアント装置Bに情報を送信できるかどうかの問合を行い(S2506)、クライアント装置Bはそれに答える(S2507)。この際、送信できるかどうかは、クライアント装置Bが直接送信するかどうか、またはクライアント装置Aからサーバ装置とクライアント装置Aからクライアント装置Bまでのネットワークの状態などから判断する。クライアント装置Aがクライアント装置Bから情報を取得する場合は処理S2508とS2509が実行され、クライアント装置Aがサーバ装置から情報を取得する場合は処理S2510とS2511が実行されて処理が終了する。
【0151】
図26は、自動送受信の方法の第2の例を説明する該略図である。ここでは図面の簡単化の為に、各データベースを省略して説明する。図25と同様に、クライアント装置Bがサーバ装置に新たに情報を登録し、これに対し、クライアント装置Aが自動送受信設定を行っているものとする。
【0152】
まず、クライアント装置Bがサーバ装置に情報を登録する(S2601)。サーバ装置では図20で説明した情報の追加処理S2602を行い、新着情報をクライアント装置Aに通報する(S2603)。クライアント装置Aでは図22と図23で説明した情報の分類S2604とグループの分類S2605を行い、情報を取得するかどうかの判断を行う(S2606)。これは自動送受信設定318に従って行なわれる.次に情報を取得する場合は、情報の発信者であるクライアント装置Bに情報を送信できるかどうかの問合せを行い(S2607)、クライアント装置Bはそれに答える(S2608)。この際、送信できるかどうかについては、クライアント装置Bが直接送信するかどうか、またはクライアント装置Aからサーバ装置までもしくはクライアント装置Aからクライアント装置Bまでのネットワークの状態などから判断する。クライアント装置Aがクライアント装置Bから情報を取得する場合は処理S2609とS2610によって実行し、クライアント装置Aがサーバ装置から情報を取得する場合は処理S2611とS2612によって実行されて処理を終了する。
【0153】
以上のように、ユーザは特に意識して処理することなく、ユーザに関連する最新の登録情報を取得することができる。
【0154】
【発明の効果】
以上説明したように、本発明によれば、複数の分類対象情報を含む分類対象情報群を格納するサーバ記憶手段、複数の分類対象情報の各々の間で情報特徴量を相互に算出してサーバ記憶手段に格納するサーバ制御手段、および情報特徴量送信要求を受信し、サーバ記憶手段から読み出された情報特徴量を送信するサーバ通信手段を含むサーバ装置と、ユーザによって設定された、情報グループを分類する場合基準となる分類基準を予め格納するクライアント記憶手段、サーバ装置に情報特徴量送信要求を送信し、情報特徴量をサーバ装置から受信するクライアント通信手段、およびユーザの要求によりまたは所定の条件が満たされると自動的に、クライアント記憶手段から分類基準を読み出し、通信手段において受信した情報特徴量に基づいて当該読み出された分類基準を用いて分類対象情報を分類し、分類された結果をクライアント記憶手段に格納するクライアント制御手段を含むクライアント装置とを備えているため、情報やユーザの位置づけがわかるような分類を実現することができ、また分類結果に関連する情報を受動的にユーザが受け取ることができる。
【図面の簡単な説明】
【図1】本実施形態の分類システムの全体構成を説明する図である。
【図2】本実施形態のシステムが動作する場合の配置構成を説明する図である。
【図3】本実施形態のサーバ装置とクライアント装置のデータベースについて説明する図である。
【図4】本実施形態のシステムのサーバ装置の起動時の処理を説明する図である。
【図5】本実施形態のサーバ装置起動時の情報管理処理を説明する図である。
【図6】本実施形態のシステムのクライアント装置の起動時の処理を説明する図である。
【図7】クライアント装置起動時の情報管理部を説明する図である。
【図8】本実施形態のシステムの分類対象となる情報の定義を説明する図である。
【図9】サーバ装置の特徴量計算処理を説明する図である。
【図10】情報特徴量を計算するための参照ツリーの作成方法を説明する図である。
【図11】参照ツリーへ新しいセルを追加する方法を説明するための参照ツリーを示す図である。
【図12】参照ツリーの解析による情報特徴量の算出方法を説明するための図である。
【図13】参照ツリーの比較による情報特徴量の算出方法を説明するための図である。
【図14】クライアント装置の情報分類処理について説明する図である。
【図15】自己組織化マップによる情報の分類方法を説明する図である。
【図16】クライアント装置のグループ分類処理について説明する図である。
【図17】基本グループの特徴量の例について説明する図である。
【図18】本実施形態のクライアント装置がサーバ装置から登録情報を取得するときの情報管理処理について説明する図である。
【図19】ユーザがシステムを利用する時の例を説明する図である。
【図20】情報の追加処理の流れを説明する概念図である。
【図21】情報の追加時のサーバ装置の特徴量計算処理の追加処理を説明する図である。
【図22】情報の追加後のクライアント装置の情報分類処理の追加処理を説明する図である。
【図23】情報の追加後のグループの分類部の追加処理を説明する図である。
【図24】自動送受信の設定を説明する該略図である。
【図25】自動送受信の方法の第1の例を説明する図である。
【図26】自動送受信の方法の第2の例を説明する該略図である。
【符号の説明】
110 サーバ装置
120 クライアント装置
111、121 情報管理部
112 特徴量計算部
113、124 自動送受信部部
122 情報分類部
123 グループ分類部
115、125 データベース
201、202、203 クライアント装置
220 ネットワーク
311、321 ユーザ設定
312 登録情報
313、323 LOG
314、324 特徴情報量
315、325 基本グループ
318、328 自動送受信設定
322 メタ情報
326、327 情報、グループ分類結果
801 情報
802 情報名部
803 参照情報部
804 キーワード部
805 内容部
806 所有者
807 グループ部
808 情報群
1001〜1010、1101〜1109 セル
1011〜1014、1110 階層
1201 参照ツリー
1202 解析結果の表
1203 類似度ベクトル
1301 類似度計算式
1302 類似度ベクトルの表
1501 自己組織化マップ
1502 近傍集合
1701 グループ名
1702 代表ベクトル
1703 重み
1704〜1706 所有者
1707 特徴量ベクトル[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information classification method and apparatus for classifying information, and more particularly to an information classification method and apparatus for classifying information based on the similarity between pieces of information included in a classification target information group.
[0002]
[Prior art]
As a conventional information classification system, in particular, a system for automatically classifying using the appearance frequency of words appearing in a document as a document classification system, there is a “sentence automatic classification system” (for example, see Patent Document 1). This is classified by the following method. First, an appearance frequency vector composed of word appearance frequencies in a document is formed by statistically processing the word appearance frequencies in the input sentence. Then, using this appearance frequency vector, the sentence to be classified is divided into clusters based on a predetermined information amount criterion, and the division is repeated until the divided cluster cannot be further divided. I do.
[0003]
On the other hand, there is a “user adaptive information distribution system” (see, for example, Patent Document 2) that enables a user to selectively receive desired information as an information push type service. This provides information to the user in the following manner. Information indicating the statistical characteristics of the document information accessed by the user in the client is input as the user's access characteristics, the statistical characteristics are extracted for each stored document information, and the user's access characteristics and extraction results are extracted. Based on this, the similarity between the document information accessed by the user and each of the document information to be distributed is evaluated, and the document information having a high similarity is selectively distributed to the user according to the evaluation result.
[0004]
[Patent Document 1]
JP-A-8-263510
[Patent Document 2]
JP-A-11-232287
[0005]
[Problems to be solved by the invention]
However, the conventional information classification method has the following problems.
[0006]
In the "automatic sentence classification system" that automatically classifies using the appearance frequency of words appearing in the above-mentioned document, a key for classifying information such as sentences is extracted, and the similarity is calculated from the key. Since the clustering is performed, the documents are only classified into appropriate groups. However, with this method, although the overall positioning and classification of information can be understood, it is difficult for the user to understand how much information is related and how difficult it is to use information effectively.
[0007]
On the other hand, in the “user adaptive information distribution system” that enables a user to selectively receive desired information, when the user passively receives information, the user needs to access the information to be associated. There is a problem that it is difficult to distribute related information in a push type using the classification result of information as in the “automatic text classification system”.
[0008]
Accordingly, the present invention has been made in view of the above-described conventional problems, and the object of the present invention is to realize classification that allows information and user positioning to be understood by focusing on classification of information. It is another object of the present invention to provide an information classification system and method that enables a user to passively receive information related to the classification result.
[0009]
[Means for Solving the Problems]
In order to achieve such an object, the invention according to claim 1 is the information classification system, wherein the server storage means for storing the classification target information group including the plurality of classification target information, each of the plurality of classification target information Server control means for mutually calculating information feature quantities between them and storing them in the server storage means, and server communication means for receiving the information feature quantity transmission request and transmitting the information feature quantities read from the server storage means The server device, client storage means for storing in advance a classification criterion that is set by the user and used as a criterion for classifying the information group, transmits an information feature amount transmission request to the server device, and receives the information feature amount from the server device The client communication means and automatically read the classification criteria from the client storage means upon user request or when a predetermined condition is met A client device including client control means for classifying the classification target information using the read classification criteria based on the information feature quantity received in the communication unit and storing the classified result in the client storage means. It is characterized by that.
[0010]
According to a second aspect of the present invention, in the information classification system according to the first aspect, the classification standard includes an instruction of central information required to be classified as the center of the classification target information, and the client control means It is characterized by classifying information indicated in the information instruction as a center.
[0011]
According to a third aspect of the present invention, in the information classification system according to the first or second aspect, the classification target information includes information content and an owner, and the client control means includes a classification target between each of the classification target information. The content and owner of the information included in each piece of information are classified based on information feature amounts calculated mutually.
[0012]
According to a fourth aspect of the present invention, in the information classification system, a server storage unit that stores a classification target information group including a plurality of classification target information, and an information feature amount is calculated between each of the plurality of classification target information. A server control unit that stores the information in the server storage unit and generates a plurality of information groups in which the classification target information included in the classification target information group is classified according to a predetermined rule, and stores the information group in the server storage unit, and an information feature amount transmission request And a server apparatus including server communication means for transmitting the information feature quantity read from the server storage means and a plurality of information groups, and a classification standard set by the user as a standard for classifying the information groups An information feature amount transmission request is transmitted to the client storage means and the server device stored in advance, and the information feature amount and the plurality of information groups are transmitted to the server device. The client communication means received from the server, and the classification criteria are automatically read from the client storage means when requested by the user or when a predetermined condition is satisfied, and is calculated using the information feature quantity and the plurality of information groups received by the communication unit And a client control unit that classifies a plurality of information groups using the classification criteria read out based on the group information feature amount and stores the classified results in the client storage unit.
[0013]
According to a fifth aspect of the present invention, in the information classification system according to the fourth aspect, the classification standard includes an instruction of central information required to be classified as the center of the classification target information, and the client control means An information group including information indicated in the information instruction is classified as a center.
[0014]
According to a sixth aspect of the present invention, in the information classification system according to the fourth or fifth aspect, the information to be classified includes the content and owner of the information, and the client control means includes the information group between each of the information groups. The content and the owner of the information included in each are classified based on the mutually calculated group information feature amounts.
[0015]
According to a seventh aspect of the present invention, in the information classification system according to any one of the first to sixth aspects, the classification standard includes a feature amount adjustment value indicating an adjustment amount when the information feature amount is adjusted for each user. The client control means classifies the information feature quantity based on the value adjusted by the feature quantity adjustment value.
[0016]
The invention according to claim 8 is the information classification system according to any one of claims 1 to 7, wherein the predetermined condition is that additional information that is new information is added to the target information group, and the client The control means classifies based on the information feature amount calculated between the additional information and each of the classification target information.
[0017]
The invention according to claim 9 is the information classification system according to any one of claims 1 to 7, wherein the predetermined condition is that additional information as new information is added to the target information group, and the client The communication unit receives the additional information from the server device, and the client control unit includes the received additional information in the target information based on the already received information feature amount and classifies the information.
[0018]
A tenth aspect of the present invention is the information classification system according to any one of the first to seventh aspects, wherein the server control unit is an object in which the client device stores the information feature amount at a predetermined time interval. The classification included in the target information group that is calculated by adding each additional information to the target information group, or calculating each other among the classification target information included in the information group. It is characterized by mutually calculating between each piece of object information.
[0019]
According to an eleventh aspect of the present invention, in the information classification system according to any one of the first to tenth aspects, when the server device receives a notification that there is additional information from one of the client devices, When a client device other than the client device that has notified is notified that there is additional information, the client device requests the additional information from either the server device or the client device that transmitted the notification that there is additional information. It is characterized by receiving additional information.
[0020]
According to the twelfth aspect of the present invention, in the server device, an information feature amount is calculated between the server storage unit that stores the classification target information group including the plurality of classification target information and each of the plurality of classification target information. Server control means for storing in the server storage means, and server communication means for receiving the information feature quantity transmission request and transmitting the information feature quantity read from the server storage means.
[0021]
According to a thirteenth aspect of the present invention, in the server device, the server storage means for storing the classification target information group including the plurality of classification target information and each of the plurality of classification target information mutually calculate information feature amounts. A server control unit that stores the information in the server storage unit and generates a plurality of information groups in which the classification target information included in the classification target information group is classified according to a predetermined rule, and stores the information group in the server storage unit, and an information feature amount transmission request And server communication means for transmitting the information feature amount read from the server storage means and a plurality of information groups.
[0022]
According to a fourteenth aspect of the present invention, in the server device according to the twelfth or thirteenth aspect, the server control unit includes a classification target included in the target information group stored at the time of calculation of the information feature amount at predetermined time intervals. Between each of the classification target information included in the target information group added by adding additional information to the target information group each time information is calculated between each other or added. It is characterized by mutual calculation.
[0023]
According to the fifteenth aspect of the present invention, in the client device, an information feature amount transmission request is transmitted, and information feature amounts calculated mutually among a plurality of pieces of classification target information included in the classification target information group are received. Client communication means, client storage means for preliminarily storing a classification standard that is set by the user and used as a reference when classifying a plurality of classification target information, and automatically when a user's request or a predetermined condition is satisfied, Client control means for reading out classification criteria from the client storage means, classifying the classification target information using the classification criteria read out based on the information feature received by the communication unit, and storing the classified results in the client storage means It is characterized by comprising.
[0024]
According to a sixteenth aspect of the present invention, in the client device according to the fifteenth aspect, the classification criterion includes an indication of central information that is required to be classified as the center of the classification target information, and the client control means includes the central information It is characterized in that the information shown in the instruction is classified mainly.
[0025]
According to a seventeenth aspect of the present invention, in the client device according to the fifteenth or sixteenth aspect, the classification target information includes information content and an owner, and the client control means includes the classification target information between each of the classification target information. The contents and owner of the information included in each of the information are classified based on information feature amounts calculated mutually.
[0026]
According to an eighteenth aspect of the present invention, in the client device, an information feature amount transmission request is transmitted, and an information feature amount calculated between each of a plurality of pieces of classification target information included in the classification target information group, and a classification Client communication means for receiving a plurality of information groups obtained by classifying classification target information included in the target information group according to a predetermined rule, and a classification standard set by the user as a standard for classifying the plurality of classification target information in advance The client storage means to be stored, and when the user's request or a predetermined condition is satisfied, the classification criteria are automatically read from the client storage means and calculated using the information feature quantity and the plurality of information groups received in the communication unit. A plurality of information groups are classified using the read classification criteria based on the group information feature amount. Characterized in that the results and a client control means for storing in the client storage means.
[0027]
According to a nineteenth aspect of the present invention, in the client device according to the eighteenth aspect, the classification criterion includes an indication of central information that is required to be classified as the center of the classification target information, and the client control means includes the central information. It classifies | categorizes centering on the information group containing the information shown in instruction | indication.
[0028]
20. The classification target information in the client device according to claim 18 or 19, including the content and owner of the information, and the client control means includes the content of the information included in each of the information groups among the information groups. And the owners are classified based on the mutually calculated group information feature amounts.
[0029]
According to a twenty-first aspect of the present invention, in the client device according to any one of the fifteenth to twentieth aspects, the classification criterion includes a feature amount adjustment value indicating an adjustment amount when the information feature amount is adjusted for each user, The client control means classifies the information feature quantity based on a value adjusted by the feature quantity adjustment value.
[0030]
According to a twenty-second aspect of the present invention, in the client device according to any one of the fifteenth to twenty-first aspects, the predetermined condition is that additional information that is new information is added to the target information group. The means is characterized in that the classification is performed based on the information feature amount calculated between the additional information and each of the classification target information.
[0031]
According to a twenty-third aspect of the present invention, in the client device according to any one of the fifteenth to twenty-first aspects, the predetermined condition is that additional information that is new information is added to the target information group. The means receives the additional information, and the client control means includes the received additional information in the target information based on the already received information feature quantity and classifies the information.
[0032]
The invention according to claim 24 is a program for executing a step of classifying classification target information based on information feature amounts calculated mutually between the classification target information included in the classification target information group, A feature quantity storing step in which the server control means stores the information feature quantity between each of the plurality of classification target information and the server storage means stores it, and an information feature quantity transmission request is received and read from the server storage means And a transmission step in which the server communication means transmits the information feature amount.
[0033]
The invention according to claim 25 is a program for executing a step of classifying the classification target information based on information feature amounts calculated mutually between the classification target information included in the classification target information group. A plurality of information feature quantities calculated between each of a plurality of classification target information, stored in the server storage means by the server control means, and classified target information included in the classification target information group according to a predetermined rule The feature amount storing step of generating the information group and storing it in the server storage means and the information feature amount transmission request are received, and the server communication means reads out the feature information amount and the plurality of information groups from the server storage means and transmits them. And a transmission step.
[0034]
The invention according to claim 26 is the program according to claim 24 or 25, wherein the feature amount storing step is included in the target information group in which the information feature amount is stored at a predetermined time interval. Each of the classification target information included in the target information group that is calculated by mutual calculation between each of the classification target information or adding additional information to the target information group each time additional information is added It is characterized by being calculated mutually.
[0035]
The invention according to claim 27 is a program for executing a step of classifying classification target information based on information feature amounts calculated mutually between the classification target information included in the classification target information group, A feature amount receiving step in which an information feature amount is transmitted between each of a plurality of pieces of classification target information included in the classification target information group by transmitting an information feature amount transmission request, and set by the user A classification criteria storage step in which the client storage means stores in advance the classification criteria that serve as the criteria for classifying a plurality of classification target information, and the client control means automatically upon request of the user or when a predetermined condition is satisfied In addition, the classification standard is read from the client storage unit, and the classification standard read based on the information feature amount received by the communication unit is used for the classification. Classifying the target information, and executes the classification result storing step of storing the classified results to the client storage means.
[0036]
The invention according to claim 28 is the program according to claim 27, wherein the classification standard includes an instruction of center information required to be classified as the center of the classification target information, and the classification result storing step includes: It is characterized in that the information shown in the center information instruction is classified into the center.
[0037]
The invention according to claim 29 is the program according to claim 27 or 28, wherein the classification target information includes the content and owner of the information, and the classification storage step includes a classification target between each of the classification target information. The content and owner of the information included in each piece of information are classified based on information feature amounts calculated mutually.
[0038]
The invention according to claim 30 is a program for executing a step of classifying the classification target information based on information feature amounts calculated mutually between the classification target information included in the classification target information group, The information feature amount transmission request is transmitted, and the information feature amount calculated between each of the plurality of classification target information included in the classification target information group and the classification target information included in the classification target information group are determined according to a predetermined rule. A feature receiving step in which the client communication means receives a plurality of information groups classified by the client, and a classification criterion in which the client storage means stores in advance a classification criterion that is set by the user and serves as a reference when classifying the plurality of classification target information The storing step and the client control means are automatically separated from the client storage means by a user request or when a predetermined condition is satisfied. A classification result storage that reads out the reference, classifies the classification target information using the classification feature read based on the information feature amount and the plurality of information groups received in the communication unit, and stores the classified result in the client storage unit And executing the step.
[0039]
The invention according to claim 31 is the program according to claim 30, wherein the classification criterion includes an instruction of center information required to be classified as the center of the classification target information, and the classification result storing step includes: An information group including information indicated in the instruction of the center information is classified as a center.
[0040]
A thirty-second aspect of the invention is the program according to the thirty-third or thirty-first aspect, wherein the classification target information includes the content and owner of the information, and the classification result storing step is performed between the information groups. The contents and owners of the information included in each are classified based on mutually calculated group information feature amounts.
[0041]
A thirty-third aspect of the invention is the program according to any one of the twenty-seventh to thirty-second aspects, wherein the classification standard includes a feature amount adjustment value indicating an adjustment amount when the information feature amount is adjusted for each user. The classification result storing step is characterized in that the information feature amount is classified based on a value adjusted by the feature amount adjustment value.
[0042]
The invention according to claim 34 is the program according to any one of claims 27 to 33, wherein the predetermined condition is that additional information which is new information is added to the target information group, and classification The result storing step is characterized in that classification is performed based on the information feature amount calculated between the additional information and each of the classification target information.
[0043]
The invention according to claim 35 is the program according to any one of claims 27 to 33, wherein the predetermined condition is that additional information as new information is added to the target information group, and the client The communication means further executes a step of receiving additional information, and the classification result storing step is characterized in that the received additional information is included in the target information and classified based on the already received information feature quantity.
[0044]
A thirty-sixth aspect of the present invention is a computer-readable recording medium in which each program according to the twenty-fourth to thirty-fifth aspects is recorded.
[0045]
The invention according to claim 37 is the information classification method for classifying the classification target information based on the information feature amount calculated mutually between the classification target information included in the classification target information group. A setting step for presetting and storing a classification standard as a standard for classification, and a classification standard that is automatically read out and read out when new information is added to the classification target information group upon user request. And a classification step of classifying the classification target information by using.
[0046]
According to a thirty-eighth aspect of the present invention, in the information classification method according to the thirty-seventh aspect, the classification criterion includes an instruction of central information that is required to be classified as the center of the classification target information, and the classification step includes the central information. It is characterized in that the information shown in the instruction is classified mainly.
[0047]
The invention according to claim 39 is an information classification method for classifying classification target information based on information feature amounts calculated mutually between the classification target information included in the classification target information group. Generating a plurality of information groups by classifying the classification target information included in the information according to a predetermined rule, a setting step for presetting and storing a classification criterion as a reference when the information group is classified, and a user request Or, when a predetermined condition is satisfied, the classification standard is automatically read out, and the plurality of information groups are used based on the information feature amount calculated mutually between the plurality of information groups. And a classification step for classifying the data.
[0048]
The invention according to claim 40 is the information classification method according to claim 39, wherein the classification standard includes an instruction of center information required to be classified as the center of the classification target information, and the classification step includes the center information. It classifies | categorizes centering on the information group containing the information shown in instruction | indication.
[0049]
The invention according to claim 41 is the information classification method according to any one of claims 37 to 40, wherein the classification target information includes information contents and an owner, and the classification step is performed between each of the classification target information. And classifying information contents and owners of information included in each of the classification target information based on mutually calculated information feature amounts.
[0050]
The invention according to claim 42 is the information classification method according to any one of claims 37 to 41, wherein the classification standard includes a feature amount adjustment value indicating an adjustment amount when the information feature amount is adjusted for each user. The classification step is characterized in that the information feature amount is classified based on a value adjusted by the feature amount adjustment value.
[0051]
The invention according to claim 43 is the information classification method according to any one of claims 37 to 42, wherein the predetermined condition is that additional information which is new information is added to the target information group, and the classification is performed. The step is characterized in that the classification is performed based on the information feature amount calculated between the additional information and each of the classification target information.
[0052]
According to a 44th aspect of the present invention, in the information classification method according to any of the 37th to 42nd aspects, the information feature amount is included in the target information group stored at the time of calculation at every predetermined time interval. Each of the classification target information included in the target information group that is calculated by mutual calculation between each of the classification target information or adding additional information to the target information group each time additional information is added It is characterized by being calculated mutually.
[0053]
According to a 45th aspect of the present invention, in the information classification method according to any of the 37th to 44th aspects, when the server device receives a notification that there is additional information from one of the client devices, the notification is provided. Additional information notification step for notifying the client device other than the client device that there is additional information, and when the client device requests additional information, the server device and the client device that has transmitted the notification that there is additional information. And an additional information receiving step of receiving additional information from any of them.
[0054]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
(First embodiment)
FIG. 1 is a diagram for explaining the overall configuration of the classification system of the present embodiment. The system according to the present embodiment is composed of one server device and a plurality of client devices, each of which has a database. However, there may be a configuration in which there are a plurality of server devices and operate in cooperation. In the present embodiment, a case where there is one server device will be described.
[0055]
The server device 110 includes an information management unit 111, a feature amount calculation unit 112, and an automatic transmission / reception unit 113. The client device 120 includes an information management unit 121, an information classification unit 122, a group classification unit 123, and an automatic transmission / reception unit 124.
[0056]
In the literary system of this embodiment, the information management unit 111 of the server device 110 collectively manages the information to be classified, and the feature amount calculation unit 112 calculates the feature amount of the information. The user obtains information registered in the server device and its feature amount via the network by the information management unit 121 of the client device 120. In addition, the information classification unit 122 and the group classification unit 123 classify information and groups. Each classification result can be displayed and viewed on each client device by the information management unit 121.
[0057]
In addition, the automatic transmission / reception units 113 and 124 of the server apparatus 110 and the client apparatus 120 realize a function of automatically informing the user of newly registered information via the network and acquiring the information. Details will be described later.
[0058]
The information to be classified, the feature amount of the information, the classification result, and the like are stored in the databases 115 and 125 of the server device and the client device, and each unit is appropriately read and used.
[0059]
FIG. 2 is a diagram illustrating an arrangement configuration when the system of this embodiment operates. Components similar to those in FIG. 1 are denoted by the same reference numerals. The server apparatus 110 and the client apparatuses A 201, B 202, and C 203 are connected to the network 220, and the server apparatus 110 and the client apparatus 120 exchange information via the network 220 using the information management units 111 and 121. .
[0060]
The client devices A, B, and C communicate with the server device 110 through network paths 211, 212, and 213, respectively. In the automatic transmission / reception units 113 and 124, the client apparatuses directly exchange information through the network path 214 and the like. Details will be described in a fourth embodiment.
[0061]
FIG. 3 is a diagram for explaining the databases of the server device 115 and the client device 125. Components similar to those in FIG. 1 and the like are denoted by the same reference numerals. The server database 115 stores user settings 311 of users participating in the system and registration information 312 to be classified. Here, the user setting is an example of what is a category standard when performing classification, and includes at least a user name and information owned by the user.
[0062]
These are registered and changed by the information management unit of the server apparatus 110, and the update state is stored as a log 313. Further, the server database 115 includes a feature amount 314 of information calculated by the feature amount calculation unit 112 of the server device 110, a basic group 315 generated by the information management unit 111 of the server device 110, and an automatic transmission / reception unit 113 of the server device 110. The automatic transmission / reception setting 318 set in is stored. These data are read and written by each unit as appropriate. Here, the automatic transmission / reception setting is a setting for selecting which information is automatically acquired, for example, specific information and a threshold value of a feature vector from the information.
[0063]
The client database 125 stores user settings 321 of users who use the system. In addition, a log 323 representing an update state when the meta information 322 such as an owner included in the registration information 312 acquired and generated by the information management unit of the client device and the registration information 312 are added or changed, and the server device The information feature quantity 324 acquired from 110 and the basic group 325 acquired from the server apparatus 110 are stored.
[0064]
Furthermore, the information classification result 326 calculated by the information classification unit of the client device, the basic group classification result 327 calculated by the group classification unit 123 of the client device 120, and the automatic transmission / reception set by the automatic transmission / reception unit 125 of the client device 120 Settings 328 are stored. These data are read and written by each unit as appropriate.
[0065]
FIG. 4 is a diagram illustrating processing at the time of starting the server device of the system according to the present embodiment. Components similar to those in FIG. 1 and the like are denoted by the same reference numerals. First, it is assumed that information to be classified is stored in the database 115 of the server device 110. When the server apparatus 110 is activated for the first time, registration information 312 and a basic group 315 are generated from information to be classified on the database 115 and stored in the information management process S301. Next, the feature amount of each information is calculated in the feature amount calculation process S302, the feature amount is stored in the database 115, and the idle state, which is a waiting state for the next processing, is entered.
[0066]
In addition, when there is no information in the database 115 of the server apparatus 110, it will be in an idle state, without performing the above process.
[0067]
In the second and subsequent activations of the server device 110, the information management unit 111 reads the system state such as the registration information 312 and the log 313 and enters an idle state.
[0068]
FIG. 5 is a diagram for explaining information management processing when the server apparatus according to the present embodiment is activated. Components similar to those in FIG. 1 and the like are denoted by the same reference numerals. First, classification target information is read from the server database 115 (S501). Next, a basic group 315 is created from the group information to which each information belongs (S502). At this time, information belonging to the basic group is listed and associated with the basic group. Next, each piece of information to be classified is registered information 312, and this registration information 312 and the created basic group 315 are stored in the database 115, and an update log 313 is created and stored in the database 115 (S503). Exit.
[0069]
The basic group 315 is preferably added according to a specific rule when the user registers information or later by the system administrator. As these rules, in the case of a predetermined field or a paper defined in advance by an administrator, a technical field predetermined by an academic society can be used, but is not limited thereto.
[0070]
FIG. 6 is a diagram illustrating processing at the time of starting the client device of the system according to the present embodiment. Components similar to those in FIG. 1 and the like are denoted by the same reference numerals. When the client device 120 is activated, the information management unit 121 of the client device 120 and the information management unit 111 of the server device 110 perform user settings, logs, meta information, and information feature amounts in the databases 115 and 125 via the network 220. , The basic group is exchanged and is in an idle state waiting for a user request.
[0071]
FIG. 7 is a diagram for explaining the information management unit when the client device is activated. The client device 120 reads the user setting 321 from the database 125, confirms the user setting, registers if it is a new user, updates the setting if necessary, and stores the user setting in the database (S721). . Note that user login and the like are also realized using this user setting. When the user setting is changed or updated, the client device 120 notifies the server device 110 via the network 220 (S722). If the server device 110 is different from the user setting 311 of the server device 110, the user setting is performed. Is updated and stored in the database 115 of the server apparatus 110 (S711). Next, the client device 120 acquires the state of the server device 110 (S712), and in response to this, the server device 110 reads a log from the database 115 and transmits it to the client device 120 (S713). The client device 120 reads the log 323 from the database 125, compares it with the log 313 of the server device, acquires update information if the state of the server device 110 has been updated (S713), and the server device 110 updates from the database 115. The registered information 312, the information feature amount 314, and the basic group 315 are transmitted to the client device 120 (S713), the client device 120 stores the information in the database 125 (S725), and the information management process ends.
[0072]
FIG. 8 is a diagram for explaining the definition of information to be classified in the system of the present embodiment. The information 801 requires an information name part 802, an information owner 806, a group part 807 to which information for classifying information and a group belongs, and a content part 805 which is information contents. Furthermore, for the classification method described in the present embodiment, it is assumed to have a reference information part 803 for information related to information and a keyword part 804 for expressing information.
[0073]
In addition, the classification target information group 808, which is a set of information, is a combination of the classification target information and the information referred to by the information.
[0074]
FIG. 9 is a diagram illustrating the feature amount calculation processing of the server device. In the feature amount calculation processing, first, the registration information 312 in the database 115 of the server apparatus 110 is read (S901), the feature amount of the registration information 312 is calculated (S902), and the calculated feature amount 314 is stored in the database 115. (S903) The process ends.
[0075]
10 to 13 are diagrams for describing a specific example of the feature amount calculation processing of the server device in the case of calculating the information feature amount according to the present embodiment. Here, a method of calculating the information feature amount 314 from information referred to by information, information contents, and keywords will be described.
[0076]
FIG. 10 is a diagram illustrating a method for creating a reference tree for calculating the information feature quantity 314. A basic reference tree associates information referred to by information in a tree structure. A reference tree is created specifically for the information A1001 by the following method.
[0077]
It is assumed that information A1001 refers to information B1002, C1003, and D1004. That is, the information hierarchy 1011 represents the reference information of the information A1001. First, the information A1001 is linked to each information B1002, C1003, and D1004.
[0078]
Next, links are established from the information B1002 to the information C1005, E1006, and F1007 referred to by the information B1002. Here, each piece of information is called a cell of the reference tree, and a link from the information to the information is called a branch of the reference tree. As a result of generating the reference tree as described above, the generation of the reference tree is ended when a predetermined end condition is satisfied.
[0079]
The end conditions used in this embodiment are the following five end conditions as shown in FIG.
[0080]
End condition <1>: When information that appears once in the reference tree is referenced
End condition <2>: When information with date and time outside the specified range is referenced
End condition <3>: When the reference tree exceeds the specified hierarchy value
Termination condition <4>: When the number of cells included in the reference tree exceeds a predetermined number
End condition <5>: When the reference information does not exist in the information group
[0081]
When these five conditions are satisfied in all cells, the creation of the reference tree is finished. For example, since the information C has appeared once in the cell C1003, the information C is ended by the end condition <1>. In this embodiment, if the information H is information having a date and time outside the predetermined range, the information H referred to by the information E satisfies the end condition <2>, and thus the cell H1008 linked from the cell E1006. Terminates tree generation without further linking. Also, assuming that the predetermined hierarchy value indicated in the end condition <3> of this embodiment is 4, in FIG. 4, the hierarchy 1011 is the hierarchy value 1, the hierarchy 1012 is the hierarchy value 2, the hierarchy 1013 is the hierarchy value 3, and the hierarchy 1014 is Since the hierarchy value is 4, generation of the tree ends because the cell K1010 corresponding to the information K referred to by the information I satisfies the end condition <3>.
[0082]
Note that the termination condition is not limited to the above, and can be additionally modified according to the characteristics of the information. In the present embodiment, the reference tree is created for each hierarchy of the reference tree. Therefore, the reference tree does not become deeper only for specific reference information, and when information reappears in the reference tree, it appears at a position that is never shallower (hierarchy value is smaller) than the first occurrence of the information. Never do.
[0083]
FIG. 11 is a diagram illustrating a reference tree for explaining a method of adding a new cell to the reference tree. Since the reference tree generation method described above with reference to FIG. 10 uses a technique for expanding the reference information of information A on the tree, information that is not referred to by information A is not incorporated into the reference tree. Therefore, since information newer than information A is not added, it is necessary to incorporate in another method, that is, to add a cell corresponding to the new information to the reference tree. Such information is referred to as additional reference information in this specification.
[0084]
Similarly to the reference tree shown in FIG. 10, the reference tree shown in FIG. 11 creates a reference tree with the information A as the center of classification (cell A 1101 as the root cell). Since information A refers to information B, a link is established from cell A 1101 to cell B 1102. At this time, information having high similarity with information B is searched, and addition of a cell is executed when a predetermined cell addition condition (described later) is satisfied. In FIG. 11, a cell L1103 corresponding to new information L that is additional reference information is added to the same hierarchy 1110 as information B.
[0085]
For the information L, a tree is generated in the same manner as the above-described reference tree generation. The information L refers to the information A and the information M, but since the information A has already appeared, the generation of the reference tree is terminated by the termination condition <1>. Further, information M refers to information C, information N, and information F. Since the cell C1106 corresponding to the information C satisfies the end condition <1>, the generation of the tree ends here, the information N refers to the information O, and the cell O1108 corresponding to the information O satisfies the end condition <3>. Thus, the generation of the tree ends, and the cell F1109 corresponding to the information F satisfies the end condition <1>, and the generation of the tree ends.
[0086]
In the present embodiment, the following three conditions are defined as conditions for adding a cell to the reference tree.
Additional condition <1>: The number of cells added to one cell is less than or equal to a predetermined value
Additional condition <2>: The hierarchical value of the reference tree to which the cell is added is less than or equal to the value
Additional condition <3>: dissimilarity of information to be added is lower than a predetermined value
[0087]
The addition condition <1> defines the number of cells that can be added to each cell of the reference tree. The additional condition <2> defines in which hierarchy of the reference tree the cell can be added. For example, if the number of cells that can be added to one cell of the reference tree is 1, and the hierarchical value of the reference tree that can be added is 1, only the cells B1002, C1003, and the cell D1004 in the reference tree shown in FIG. Each cell can be added one by one.
[0088]
The additional condition <3> specifies that the dissimilarity between the information already appearing in the reference tree and the cell to be added needs to be a certain level or less. That is, even if the conditions <1> and <2> are satisfied, information that is not very similar (dissimilarity is more than a certain level) has no meaning to be added to the reference tree.
[0089]
The additional conditions are not limited to the above, and additional corrections can be made according to the characteristics of the information. In this embodiment, addition of a cell to the reference tree is performed when a cell is created in each layer when creating the reference tree.
[0090]
12 and 13 are diagrams for explaining a method for creating a feature vector from a reference tree.
[0091]
FIG. 12 is a diagram for explaining a method for calculating an information feature amount by analyzing a reference tree. In this embodiment, the information feature quantity vector is calculated based on the reference tree 1201. The reference tree 1201 adds a cell L1103 corresponding to the information L as shown in FIG. 11 to the reference tree shown in FIG. Is.
[0092]
The information feature amount vector obtained by analyzing the reference tree of the present invention is calculated by analyzing the reference tree based on the reference information or the keyword or content included in the information, and calculating a parameter indicating similarity. In this embodiment, the appearance frequency α, the average layer value β, the reappearance frequency γ, the weight 1δ, and the weight 2 (1 / ε) are used as parameters.
[0093]
First, each parameter included in the reference tree 1201 is subjected to analysis such as appearance frequency to calculate the above parameters. The re-appearance frequency γ of each information is given, for example, to a hierarchy in which information appears, with a score of 5 for the hierarchy value 0 and 4 for the hierarchy value 1 so that the score decreases by 1 for each increase of the hierarchy value by 1. Then, it can be calculated as follows.
[0094]
Number of points in the hierarchy where the information first appears ÷ Hierarchy value of the hierarchy where the information appears again
Considering information C as an example, information B refers to information C that appears in a hierarchy of layer value 2, and information A also refers to information C in a layer of layer value 1. Therefore, the hierarchy in which the information C first appears is the hierarchy value 1 and the score is 4. Next, the re-appearance layers are the layer value 2 and the layer value 3, and the re-appearance frequency γ is (4/2 + 4/3 + 4/3) because it appears twice in the layer of the layer value 3.
[0095]
In the example of the present embodiment shown in FIG. 12, the weight 1 (δ) is a numerical value obtained when the keywords included in the information match, and the weight 2 (1 / ε) is a figure for the information A. A numerical value similar to the dissimilarity indicated by 11 is used.
[0096]
Next, based on these analysis values, each information is represented as a vector to obtain a similarity vector 1203. Here, the vector element can be normalized or parameterized as necessary.
[0097]
Note that the items to be analyzed are not limited to this, and can be additionally modified according to the characteristics of the information.
[0098]
FIG. 13 is a diagram for explaining a method of calculating information feature amounts by comparing reference trees. This calculation method is a calculation method using the principle that the same information is referred to when the information is similar.
[0099]
The information feature quantity vector based on the comparison of the reference trees of the present invention is obtained by applying the analysis value of each information obtained by analyzing the reference tree to the classification target information to a predetermined calculation formula, and calculating the calculated value as the information feature quantity vector. Is generated by In the example of the present embodiment shown in FIG. 13, a calculation formula 1301 is used. As an analysis value by the reference tree analysis, a sum of numerical values obtained by normalizing the analysis values shown in FIG. 12 is used. A table 1302 shown in FIG. 13 is a vector representation of values calculated for each piece of information.
[0100]
FIG. 14 is a diagram for explaining the information classification process of the client device 120. The information classification process is executed in response to a user request. It can also be executed periodically when information is added.
[0101]
The information classification process has two main functions: one is a function that classifies information by calculating the similarity from the feature quantity of the information to be classified, and the other is an existing function that uses the similarity of information. It is a function to classify according to the classification result. The former will be described below. The latter is an operation when information is added, and will be described in the second embodiment.
[0102]
In the information classification process, first, the information feature quantity 324 is read from the database 125 of the client device 120 (S1401). Next, the user adjusts the feature amount and sets a classification standard, which is a classification of information that is the center of the classification (S1402). Here, the adjustment of the feature amount is to correct the feature amount created by the server device 110 according to the user's preference or the content of the classification. The information that is the center of the classification is determined by which information the user wants to perform the classification, and is applied to the information classification process S1403. Next, information is classified using this feature quantity, and the classification result is operated so as to be visualized (S1404). The final classification result is stored in the database 125 (S1405), and the process ends.
[0103]
At this time, as a method for classifying information, a method such as a k-mean method, an ISODATA method, or a self-organizing map can be applied. The purpose of the information classification process of the system of the present embodiment is not only to simply classify information but also to classify specific information so that the user can obtain similar information, and also to visualize the classification result. An important classification function.
[0104]
For example, in a self-organizing map (T. Kohonen: “Self-Organizing Map”, Springer, 1997), information is treated as a multidimensional vector and classified while being arranged in a two-dimensional plane or a three-dimensional space. Since the classification result is arranged in a two-dimensional plane or a three-dimensional space, the classification result is visualized as it is. Therefore, the self-organizing map is applied to the above-described feature quantity vector, and the result can be used as the information classification result.
[0105]
FIG. 15 is a diagram for explaining a method of classifying information using a self-organizing map. Here, a method for classifying into a two-dimensional plane will be described. The method of classifying into a three-dimensional space can be realized in the same way. Now, consider placing information on an o × p cell 1501. The information feature vector of the central information is used as input data and is an n-dimensional vector. At that time, each cell j has the following n-dimensional reference vector.
[0106]
[Expression 1]
Figure 2005004657
[0107]
Classification is performed as follows. All input data x i On the other hand, the subsequent processing is performed by the number of repetitions t. Input data x i The cell c having the reference vector closest to is searched. The search is performed according to equation (2).
[0108]
[Expression 2]
Figure 2005004657
[0109]
That is, the i-th input vector x i And the reference vector m of the jth cell in the output layer j Find the cell j in the output layer that minimizes the distance, and let c be that. Here, the distance between the input vector and the reference vector is expressed by, for example, a Euclidean distance as shown in Equation (3). A neighborhood set of cells c is formed. This neighborhood set N c (T) is defined by, for example, Expression (4).
[0110]
[Equation 3]
Figure 2005004657
[0111]
In equation (4), dis (j, c) represents the distance between cell j and cell c, and a collection of cells j whose distance from cell c is closer than r (t) is a neighborhood set. For example, the neighborhood set 1502 is formed around the cell c. Next, the reference vectors of the cells belonging to the neighborhood set are updated according to equations (5) and (6).
[0112]
[Expression 4]
Figure 2005004657
[0113]
That is, the neighborhood set N c The value of the reference vector of the cell belonging to (t) is updated according to equation (5), and the reference vectors of the other cells do nothing. Here, the distance r (t) and the coefficient α (t) are reduced uniformly with respect to the number of repetitions t. Finally, the cell having the closest reference vector is searched for the input data as shown in Expression (2), and the data is arranged. By the above process, each original value of the reference vector changes, but the reference vector and the input vector are still associated after the update, so it is possible to know which information is mapped to which location. Can do.
[0114]
Therefore, the information is classified using the feature vector of the information as input data, and the result of placing the information in the cell having the reference vector closest to the feature vector after the processing is visualized to obtain the classification result. Can do. Furthermore, in order to classify specific information as a center, the information is subjected to classification processing by forming a neighborhood set with the center cell of o × p of the self-organizing map as cell c. By processing in this way, classification is performed so that specific information is always at the center.
[0115]
The k-means method is a method of classifying information into k clusters (groups), and the number k to be classified first is set and classification is performed in the following steps.
[0116]
Step 1: k initial cluster centers z 1 (1), z 2 (1), ..., z k Determine (1) appropriately.
Step 2: In the n-th iteration step, all input data x is classified into k clusters by the following method. For all l = 1, 2,..., K (l ≠ m),
[0117]
[Equation 5]
Figure 2005004657
[0118]
And Where s m (N) is z m This is a set of input data with (n) as the cluster center.
Step 3: S obtained in Step 2 m New cluster center z in (n) m (N + 1)
[0119]
[Formula 6]
Figure 2005004657
[0120]
And Where N m S m It is the number of (n).
Step 4: z for all m = 1, 2,..., K m (N + 1) = z m If (n), the algorithm ends as converged. Otherwise, go back to step 2.
[0121]
In addition, the ISODATA method is a method of changing according to the nature of input data without giving the number k of clusters. This is a method of performing cluster classification while giving a plurality of parameters and changing the parameters. However, there is a disadvantage that the parameters are determined depending on the input data, and the setting is complicated.
[0122]
After classification by the k-means method or the ISODATA method, vector quantization is performed in 2D or 3D for each cluster, and visualization is performed by arranging in 2D or 3D.
[0123]
FIG. 16 is a diagram for explaining the group classification process of the client device 120. The group classification process is executed in response to a user request. It can also be executed periodically when information is added.
[0124]
In the group classification process, using the information feature quantity 324 belonging to the basic group 325, the feature quantity of the basic group is calculated around a specific owner, and the basic group is classified from the feature quantity. Here, the owner is the owner of the information, and if the target information is a document, it is the author or the author.
[0125]
In the group classification process, first, the information feature quantity 324 and the basic group 325 are read from the client database 125 (S1601). Next, the user adjusts the information feature amount, and sets the classification, which is a classification standard for determining the owner who is the center of the classification and the basic group which is the center (S1602). Here, the adjustment of the feature amount is to correct the feature amount created by the server device in accordance with the user's preference and the content of the classification. Next, the basic group feature quantity is calculated using the feature quantity of this information (S1603). This is performed for each group, and is determined by the owner and basic group that are the center of the classification set in S1602. Based on the calculated basic group feature amount, the basic group is classified (S1604).
[0126]
Next, for each basic group, the owners belonging to the basic group are classified (S1605), the final classification result is stored in the database 125 (S1606), and the process ends.
[0127]
The group classification and the group classification are performed by using the classification method such as the self-organizing map described above.
[0128]
FIG. 17 is a diagram for describing an example of the feature amount of the basic group. Each basic group has a group name 1701, a representative vector 1702, and a group weight 1703. The representative vector 1702 is expressed by an average of feature quantity vectors of all registered information belonging to the basic group. The initial weight of the group is determined by the system administrator based on the relevance of the basic group, and can be changed by the user during classification. The information belonging to the basic group is collected for each owner (1704 to 1706), the number of information belonging to the basic group for each owner, the total number of information of the owner, the affiliation rate obtained by dividing the number of information by the total number of information, And an average vector obtained by averaging the feature vector of information. Also, a similarity is set for each owner. For example, when the owner 1704 is a specific owner with the classification as the center, α / β in FIG. 12 is set as the similarity. Here, the shaded portion in FIG. 17 represents the feature amount of the basic group. For example, an information feature amount vector of the basic group is generated as 1707. That is, the distance between the representative vector of the basic group and the representative vector of the basic group serving as the classification center (for example, Euclidean distance), the weight of the basic group, the membership rate of the owner serving as the classification center, or the similarity of the owners belonging to the basic group A vector based on the sum of, etc. is used as a feature vector of the basic group. Here, the item of the vector is free and determined according to the characteristics of the system. However, it is necessary to use a similarity that is centered on a certain owner. The feature vector needs to be normalized for convenience.
[0129]
FIG. 18 is a diagram for describing information management processing when the client device 120 acquires registration information from the server device 110. When a user searches for desired information using a classification result or the like and actually acquires the information, information management processing is executed as follows.
[0130]
First, the system state such as the classification result is acquired from the client database 125 (S1801). Next, the user selects desired information (S1802). The information is acquired from the server apparatus 110 via the network (S1803), and the server apparatus 110 reads the registration information from the database 115 of the server apparatus in response to a request from the client apparatus 120 and transmits the registration information to the client apparatus 120 (S1805). ). The finally acquired information is presented to the user (S1804), and the process ends.
[0131]
FIG. 19 is a diagram illustrating an example when a user uses the system. By the method described above, the information and the basic group to which the information belongs are classified on the client device 120, and the user can acquire the information registered in the server device 110 according to the classification result.
[0132]
Specifically, the user uses the system as follows. First, as described with reference to FIG. 6, the client apparatus 120 is activated to start using the system. Here, when the client device 120 is already activated, the processing can be executed only by the user logging in. Next, the user requests information classification, and the registered information is classified by the information classification processing described with reference to FIG. 14 (S1901). Next, the user requests group classification, and the basic group to which the registration information belongs is classified by the group classification processing described with reference to FIG. 16 (S1902). Next, the user requests display of the classification result, and the information management unit of the client device 120 displays the classification result on the screen of the client device 120 (S1903). Further, the user requests acquisition of specific information, acquires the information selected by the user in the information management processing described with reference to FIG. 18 from the server device 110, and presents the information to the user (S1904). Next, the user requests the automatic transmission / reception setting for automatically setting newly added information, performs automatic transmission / reception setting by the method described in the fourth embodiment (S1905), and finally uses the user by the information management unit. The history is stored as a log in the database of the client device, and the system is terminated or the user logs off.
[0133]
Note that the procedure described with reference to FIG. 19 is merely an example, and the requests can be replaced or only a part of the requests can be used. If the information and group classification are set to be automatically executed on the client device 120, the user can acquire the latest classification result without waiting for the processing time.
[0134]
(Second Embodiment)
A classification process when information is added to the system will be described with reference to the drawings.
[0135]
FIG. 20 is a conceptual diagram illustrating the flow of information addition processing. When information is added to the server apparatus 110, the information is registered in the system in the information management process of the server apparatus 110, and the registration information 312, the basic group 315, and the update log 313 are stored in the database 115 of the server apparatus. Next, in the feature amount calculation process S2002 of the server device, all the feature amounts of each registered information 312 are calculated and reprocessed, or only the added information is calculated and added, and the feature amount 314 is stored in the database 115. Store. Then, the change is transmitted to the client device 120 in the information management processing S2001 of the server device. In the information management processing S2004 of the client device 120, the update log 323, the meta information 322, the information feature amount 324, and the basic group 325 are stored. The data is stored in the database 125, and the server device 110 enters an idle state.
[0136]
If the client apparatus 120 is not activated when information is added to the server apparatus, the addition is reflected as described with reference to FIG. 6 when the client apparatus 120 is activated next time.
[0137]
FIG. 21 is a diagram for explaining the addition processing of the feature amount calculation processing of the server apparatus 110 when information is added. In the feature amount calculation processing in FIG. 20, there are a case where feature amounts are recalculated for all registered information and a case where feature amounts are calculated only for added registration information. The former is performed as described in FIG. 9, and the latter is performed by the method shown in FIG. 21 as described below.
[0138]
First, the added registration information 312 is read from the database 115 of the server apparatus 110 (S2101). Next, a feature amount is calculated for the added registration information (S2102). At this time, reference information for calculating the feature value by the method described above is appropriately acquired from the database. The feature quantity of the last calculated information is stored in the database 115 (S2103), and the process ends.
[0139]
FIG. 22 is a diagram for explaining the addition process of the information classification process of the client device after the addition of information. The information classification after the information addition is performed by the method of FIG. 14 when all the feature amounts of the registration information 312 are recalculated, and when the feature amount is calculated only for the added registration information, it is shown in FIG. By the way.
[0140]
First, an update log 323 is acquired from the database 125 of the client device 120 (S2201), and the feature amount 324 of the added information and the classification result 326 at that time are acquired from the database 125 (S2202). Then, information added to the classification result is arranged (S2203), this is stored in the database 125 as a new classification result (S2204), and the process is terminated. Here, in the case of using the self-organizing map, the process S2203 searches for and arranges the reference vector closest to the last feature vector without performing the classification process. The classification setting uses the previous classification setting.
[0141]
FIG. 23 is a diagram illustrating the addition processing of the group classification unit after the addition of information. The group classification after the addition of information is performed by the method shown in FIG. 16 when all the feature amounts of the registration information are recalculated, and when the feature amount is calculated only for the added registration information, it is shown in FIG. By the way. However, in this case, when a new basic group is not created by the added registration information, the group classification addition process is not performed.
[0142]
First, an update log is acquired from the database 125 of the client device (S2301), and the feature amount of the added information, the newly added basic group, and the group classification result at that time are acquired from the database 125 (S2302). ). Next, the feature amount of the added basic group is calculated (S2303), the added basic group is arranged with respect to the classification result (S2304), and the added basic group is classified (S2305). Finally, the last classification result is stored in the database 125 (S2306), and the process ends.
[0143]
Note that the method described with reference to FIG. 16 is used as the feature amount and classification method of the basic group. Note that the settings set during the previous classification are used for setting the classification criteria and the like.
[0144]
As described above, even when information is newly added to the server device, the information and the basic group can be classified. In addition, even when already registered information is updated, it can be applied in the same manner.
[0145]
(Third embodiment)
Next, the classification of owners applying the above-described method will be described. If the classification within the basic group described with reference to FIGS. 16 and 17 is used, the owner of the information can be classified. That is, for each owner, the owner can be classified using the same method as the information classification using the average vector obtained by averaging the feature quantity vectors of the registered information possessed by the owner. If a self-organizing map is used for classification, as in the case of classification of information, the classification is performed by classifying the owner so that the average vector of the owner to be the center of the classification is located at the center of the map. Classification centered on the person.
[0146]
(Fourth embodiment)
Automatic transmission / reception of information between the server apparatus 110 and the client apparatus 120 will be described with reference to the drawings. The automatic transmission / reception is a function of automatically transmitting information desired by the user to the client device 120 when information is newly added to the server device 110.
[0147]
FIG. 24 is a schematic diagram illustrating automatic transmission / reception settings. First, information and group classification results are acquired from the client device database 125 (S2401). Next, a target of information to be automatically acquired is selected and stored in the database 125 as an automatic transmission / reception setting 328 (S2402). The automatic transmission / reception setting 328 is registered in the server device 110 (S2403), and the server device 110 stores the automatic transmission / reception setting 318 in the database 115 of the server device 110.
[0148]
Here, in selecting the target of information to be automatically acquired, the distance between the feature vector of specific information and the feature vector of information to be acquired, or a specific basic group or a specific basic group feature vector A distance or a specific owner, or a distance from a specific owner is designated to set automatic transmission / reception, and an object that satisfies the automatic transmission / reception setting is acquired.
[0149]
FIG. 25 is a diagram illustrating a first example of an automatic transmission / reception method. Here, in order to simplify the drawing, each database is omitted for explanation.
[0150]
Now, it is assumed that the client apparatus B newly registers information in the server apparatus, and the client apparatus A performs automatic transmission / reception settings. First, the client apparatus B registers information with the server apparatus (S2501). The server apparatus performs the information addition process S2502 described with reference to FIG. 20, compares the obtained feature amount vector with the automatic transmission / reception setting, and determines transmission to the client apparatus A (S2503). When the setting is satisfied, the server device reports new arrival information to the client device A (S2504), and the client device A determines whether to acquire the information (S2505). Here, even if the automatic transmission / reception setting 328 is performed, the client apparatus A can reject the acquisition of information through the processing S2505. When acquiring the information, an inquiry is made as to whether or not the information can be transmitted to the client apparatus B that is the sender of the information (S2506), and the client apparatus B answers it (S2507). At this time, whether or not transmission is possible is determined based on whether or not the client apparatus B directly transmits, or the state of the network from the client apparatus A to the server apparatus and from the client apparatus A to the client apparatus B. When the client apparatus A acquires information from the client apparatus B, processes S2508 and S2509 are executed. When the client apparatus A acquires information from the server apparatus, processes S2510 and S2511 are executed and the process ends.
[0151]
FIG. 26 is a schematic diagram for explaining a second example of the automatic transmission / reception method. Here, in order to simplify the drawing, each database is omitted for explanation. Similarly to FIG. 25, it is assumed that the client apparatus B newly registers information in the server apparatus, and the client apparatus A performs automatic transmission / reception settings.
[0152]
First, the client apparatus B registers information in the server apparatus (S2601). The server apparatus performs the information addition process S2602 described with reference to FIG. 20, and notifies the client apparatus A of new arrival information (S2603). The client apparatus A performs the information classification S2604 and the group classification S2605 described with reference to FIGS. 22 and 23, and determines whether to acquire information (S2606). This is done according to the automatic transmission / reception setting 318. Next, when acquiring information, an inquiry is made as to whether or not the information can be transmitted to the client apparatus B, which is the sender of the information (S2607), and the client apparatus B answers it (S2608). At this time, whether or not transmission is possible is determined based on whether or not the client apparatus B directly transmits, or the state of the network from the client apparatus A to the server apparatus or from the client apparatus A to the client apparatus B. When the client apparatus A acquires information from the client apparatus B, the processes are executed in steps S2609 and S2610. When the client apparatus A acquires information from the server apparatus, the processes are completed by steps S2611 and S2612.
[0153]
As described above, the user can acquire the latest registration information related to the user without particularly processing.
[0154]
【The invention's effect】
As described above, according to the present invention, server storage means for storing a classification target information group including a plurality of classification target information, a server that mutually calculates information feature amounts between each of the plurality of classification target information Server control means for storing in the storage means, a server apparatus including server communication means for receiving the information feature quantity transmission request and transmitting the information feature quantity read from the server storage means, and an information group set by the user Client storage means for storing in advance a classification criterion as a reference, a client communication means for transmitting an information feature amount transmission request to the server device and receiving an information feature amount from the server device, and a user request or a predetermined When the condition is satisfied, the classification standard is automatically read from the client storage means, and based on the information feature amount received by the communication means Since it includes a client device including client control means for classifying the classification target information using the read classification criteria and storing the classified result in the client storage means, the information and the position of the user can be understood. Classification can be realized, and information related to the classification result can be passively received by the user.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating an overall configuration of a classification system according to an embodiment.
FIG. 2 is a diagram illustrating an arrangement configuration when the system of the present embodiment operates.
FIG. 3 is a diagram illustrating a database of a server device and a client device according to the present embodiment.
FIG. 4 is a diagram illustrating processing at the time of activation of a server device of the system according to the present embodiment.
FIG. 5 is a diagram illustrating an information management process when the server apparatus according to the present embodiment is activated.
FIG. 6 is a diagram illustrating processing at the time of activation of a client device of the system according to the present embodiment.
FIG. 7 is a diagram illustrating an information management unit when a client device is activated.
FIG. 8 is a diagram illustrating the definition of information to be classified in the system of the present embodiment.
FIG. 9 is a diagram illustrating a feature amount calculation process of the server device.
FIG. 10 is a diagram illustrating a method for creating a reference tree for calculating an information feature amount.
FIG. 11 is a diagram illustrating a reference tree for explaining a method of adding a new cell to the reference tree.
FIG. 12 is a diagram for explaining a method for calculating an information feature amount by analyzing a reference tree.
FIG. 13 is a diagram for explaining a method for calculating an information feature amount by comparing reference trees.
FIG. 14 is a diagram illustrating information classification processing of a client device.
FIG. 15 is a diagram for explaining a method of classifying information using a self-organizing map;
FIG. 16 is a diagram illustrating group classification processing of a client device.
FIG. 17 is a diagram for describing an example of a basic group feature amount;
FIG. 18 is a diagram illustrating an information management process when the client device of the present embodiment acquires registration information from the server device.
FIG. 19 is a diagram illustrating an example when a user uses a system.
FIG. 20 is a conceptual diagram illustrating a flow of information addition processing.
FIG. 21 is a diagram illustrating an addition process of a feature amount calculation process of a server device when information is added.
FIG. 22 is a diagram for explaining an adding process of an information classification process of a client device after adding information;
FIG. 23 is a diagram for describing an adding process of a group classification unit after adding information;
FIG. 24 is a schematic diagram illustrating automatic transmission / reception settings.
FIG. 25 is a diagram illustrating a first example of an automatic transmission / reception method.
FIG. 26 is a schematic diagram illustrating a second example of an automatic transmission / reception method.
[Explanation of symbols]
110 Server device
120 Client device
111, 121 Information Management Department
112 Feature amount calculator
113, 124 Automatic transmission / reception unit
122 Information classification part
123 Group classification part
115, 125 database
201, 202, 203 Client device
220 network
311, 321 User setting
312 Registration Information
313, 323 LOG
314, 324 Feature information
315, 325 Basic group
318, 328 Automatic transmission / reception setting
322 meta information
326, 327 information, group classification results
801 Information
802 Information name part
803 Reference information section
804 Keyword part
805 Contents
806 owner
807 Group Department
808 information group
1001-1010, 1101-1109 cells
1011-1014, 1110 hierarchy
1201 Reference tree
1202 Analysis result table
1203 similarity vector
1301 Similarity calculation formula
1302 Similarity vector table
1501 Self-organizing map
1502 Neighbor set
1701 Group name
1702 Representative vector
1703 weight
1704-1706 owner
1707 feature vector

Claims (45)

複数の分類対象情報を含む分類対象情報群を格納するサーバ記憶手段、前記複数の分類対象情報の各々の間で情報特徴量を相互に算出して前記サーバ記憶手段に格納するサーバ制御手段、および情報特徴量送信要求を受信し、前記サーバ記憶手段から読み出された前記情報特徴量を送信するサーバ通信手段を含むサーバ装置と、
ユーザによって設定された、前記情報グループを分類する場合基準となる分類基準を予め格納するクライアント記憶手段、前記サーバ装置に前記情報特徴量送信要求を送信し、前記情報特徴量を前記サーバ装置から受信するクライアント通信手段、およびユーザの要求によりまたは所定の条件が満たされると自動的に、前記クライアント記憶手段から前記分類基準を読み出し、前記通信部において受信した前記情報特徴量に基づいて当該読み出された分類基準を用いて前記分類対象情報を分類し、当該分類された結果を前記クライアント記憶手段に格納するクライアント制御手段を含むクライアント装置と
を備えたことを特徴とする情報分類システム。
Server storage means for storing a classification target information group including a plurality of classification target information, server control means for mutually calculating information feature amounts between each of the plurality of classification target information, and storing the information feature quantities in the server storage means; and A server device including a server communication unit that receives an information feature amount transmission request and transmits the information feature amount read from the server storage unit;
Client storage means for storing in advance a classification criterion that is set by a user and serving as a criterion for classifying the information group, transmits the information feature amount transmission request to the server device, and receives the information feature amount from the server device The client communication means and the user's request or when a predetermined condition is satisfied, the classification standard is automatically read out from the client storage means and read out based on the information feature amount received in the communication unit. An information classification system comprising: a client device including client control means for classifying the classification target information using the classification criteria and storing the classified result in the client storage means.
前記分類基準は、前記分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、
前記クライアント制御手段は、前記中心情報の指示において示される情報を中心に分類することを特徴とする請求項1記載の情報分類システム。
The classification criteria includes an indication of center information that is required to be classified as the center of the classification target information,
The information classification system according to claim 1, wherein the client control unit classifies information indicated in the instruction of the center information as a center.
前記分類対象情報は、情報の内容および所有者を含み、
前記クライアント制御手段は、前記分類対象情報の各々の間で前記分類対象情報の各々に含まれる情報の内容および所有者についてそれぞれ相互に算出された情報特徴量に基づいて分類することを特徴とする請求項1または2記載の情報分類システム。
The classification target information includes information content and owner,
The client control means classifies the content of information included in each of the classification target information and the owner among the classification target information based on mutually calculated information feature amounts. The information classification system according to claim 1 or 2.
複数の分類対象情報を含む分類対象情報群を格納するサーバ記憶手段、前記複数の分類対象情報の各々の間で情報特徴量を相互に算出して前記サーバ記憶手段に格納し、および前記分類対象情報群に含まれる分類対象情報を所定の規則によって分類した複数の情報グループを生成して前記サーバ記憶手段に格納するサーバ制御手段、ならびに情報特徴量送信要求を受信し、前記サーバ記憶手段から読み出された前記情報特徴量および前記複数の情報グループを送信するサーバ通信手段を含むサーバ装置と、
ユーザによって設定された、前記情報グループを分類する場合基準となる分類基準を予め格納するクライアント記憶手段、前記サーバ装置に前記情報特徴量送信要求を送信し、前記情報特徴量および前記複数の情報グループを前記サーバ装置から受信するクライアント通信手段、ならびにユーザの要求によりまたは所定の条件が満たされると自動的に、前記クライアント記憶手段から前記分類基準を読み出し、前記通信部において受信した前記情報特徴量および前記複数の情報グループを用いて算出されたグループ情報特徴量に基づき当該読み出された分類基準を用いて前記複数の情報グループを分類し、当該分類された結果を前記クライアント記憶手段に格納するクライアント制御手段を含むクライアント装置と
を備えたことを特徴とする情報分類システム。
Server storage means for storing a classification target information group including a plurality of classification target information, information feature amounts calculated between each of the plurality of classification target information, stored in the server storage means, and the classification target A server control unit that generates a plurality of information groups in which information to be classified included in the information group is classified according to a predetermined rule and stores the information group in the server storage unit, and receives an information feature amount transmission request and reads it from the server storage unit A server device including server communication means for transmitting the issued information feature quantity and the plurality of information groups;
Client storage means that stores in advance a classification criterion that is set by the user and serves as a criterion for classifying the information group, the information feature amount transmission request is transmitted to the server device, and the information feature amount and the plurality of information groups Client communication means for receiving the information from the server device, and when the user requests or when a predetermined condition is satisfied, the classification criteria are automatically read from the client storage means, and the information feature amount received by the communication unit and Client that classifies the plurality of information groups using the read classification criteria based on the group information feature amount calculated using the plurality of information groups, and stores the classified result in the client storage unit And a client device including a control unit. Broadcast classification system.
前記分類基準は、前記分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、
前記クライアント制御手段は、前記中心情報の指示において示される情報を含む情報グループを中心に分類することを特徴とする請求項4記載の情報分類システム。
The classification criteria includes an indication of center information that is required to be classified as the center of the classification target information,
5. The information classification system according to claim 4, wherein the client control unit classifies the information group including information indicated in the instruction of the center information as a center.
前記分類対象情報は、情報の内容および所有者を含み、
前記クライアント制御手段は、前記情報グループの各々の間で前記情報グループの各々に含まれる情報の内容および所有者についてそれぞれ相互に算出されたグループ情報特徴量に基づいて分類することを特徴とする請求項4または5記載の情報分類システム。
The classification target information includes information content and owner,
The client control means classifies information contents and owners included in each of the information groups among the information groups based on mutually calculated group information feature amounts. Item 4. The information classification system according to item 4 or 5.
前記分類基準は、前記情報特徴量をユーザごとに調整する場合の調整量を示す特徴量調整値を含み、
前記クライアント制御手段は、前記情報特徴量を該特徴量調整値によって調整した値に基づいて分類することを特徴とする請求項1ないし6のいずれかに記載の情報分類システム。
The classification standard includes a feature amount adjustment value indicating an adjustment amount when adjusting the information feature amount for each user,
The information classification system according to claim 1, wherein the client control unit classifies the information feature amount based on a value adjusted by the feature amount adjustment value.
前記所定の条件は、前記対象情報群に新たな情報である追加情報が追加されることであり、
前記クライアント制御手段は、前記追加情報と前記分類対象情報の各々との間で算出された情報特徴量に基づいて分類することを特徴とする請求項1ないし7のいずれかに記載の情報分類システム。
The predetermined condition is that additional information that is new information is added to the target information group,
8. The information classification system according to claim 1, wherein the client control unit performs classification based on an information feature amount calculated between the additional information and each of the classification target information. .
前記所定の条件は、前記対象情報群に新たな情報である追加情報が追加されることであり、
前記クライアント通信手段は、前記サーバ装置から前記追加情報を受信し、
前記クライアント制御手段は、当該受信した追加情報をすでに受信済みの前記情報特徴量に基づいて前記対象情報に含めて分類することを特徴とする請求項1ないし7のいずれかに記載の情報分類システム。
The predetermined condition is that additional information that is new information is added to the target information group,
The client communication means receives the additional information from the server device;
8. The information classification system according to claim 1, wherein the client control means classifies the received additional information by including it in the target information based on the already received information feature amount. .
前記サーバ制御部は、前記クライアント装置が前記情報特徴量を所定の時間間隔ごとに当該算出時点において格納されている前記対象情報群に含まれる分類対象情報の各々の間で相互に算出するか、または前記追加情報が追加されるごとに前記追加情報を前記対象情報群に追加して当該追加が行われた対象情報群に含まれる分類対象情報の各々の間で相互に算出することを特徴とする請求項1ないし7のいずれかに記載の情報分類システム。The server control unit may calculate the information feature amount between each of the classification target information included in the target information group stored at the calculation time point for each predetermined time interval between the client device, Alternatively, each time the additional information is added, the additional information is added to the target information group and is calculated between each of the classification target information included in the target information group to which the addition has been performed. The information classification system according to any one of claims 1 to 7. 前記サーバ装置は、前記クライアント装置のうちの1つから追加情報があるとの通知を受信したときは、当該通知をしたクライアント装置以外のクライアント装置に、前記追加情報がある旨通知し、
該クライアント装置は、前記追加情報を要求するときは、前記サーバ装置および前記追加情報があるとの通知を送信したクライアント装置のいずれかから前記追加情報を受信することを特徴とする請求項1ないし10のいずれかに記載の情報分類システム。
When the server device receives a notification that there is additional information from one of the client devices, the server device notifies a client device other than the client device that made the notification that the additional information is present,
The client device, when requesting the additional information, receives the additional information from either the server device or a client device that has transmitted a notification that there is the additional information. The information classification system according to any one of 10.
複数の分類対象情報を含む分類対象情報群を格納するサーバ記憶手段と、
前記複数の分類対象情報の各々の間で情報特徴量を相互に算出して前記サーバ記憶手段に格納するサーバ制御手段と、
情報特徴量送信要求を受信し、前記サーバ記憶手段から読み出された前記情報特徴量を送信するサーバ通信手段と
を備えたことを特徴とするサーバ装置。
Server storage means for storing a classification target information group including a plurality of classification target information;
Server control means for mutually calculating an information feature quantity between each of the plurality of classification target information and storing it in the server storage means;
A server apparatus comprising: a server communication unit that receives an information feature amount transmission request and transmits the information feature amount read from the server storage unit.
複数の分類対象情報を含む分類対象情報群を格納するサーバ記憶手段と、
前記複数の分類対象情報の各々の間で情報特徴量を相互に算出して前記サーバ記憶手段に格納し、および前記分類対象情報群に含まれる分類対象情報を所定の規則によって分類した複数の情報グループを生成して前記サーバ記憶手段に格納するサーバ制御手段と、
情報特徴量送信要求を受信し、前記サーバ記憶手段から読み出された前記情報特徴量および前記複数の情報グループを送信するサーバ通信手段と
を備えたことを特徴とするサーバ装置。
Server storage means for storing a classification target information group including a plurality of classification target information;
A plurality of pieces of information obtained by mutually calculating information feature amounts between each of the plurality of classification target information and storing them in the server storage means, and classifying the classification target information included in the classification target information group according to a predetermined rule Server control means for generating a group and storing it in the server storage means;
A server apparatus comprising: a server communication unit that receives an information feature amount transmission request and transmits the information feature amount read from the server storage unit and the plurality of information groups.
前記サーバ制御部は、前記情報特徴量を所定の時間間隔ごとに当該算出時点において格納されている前記対象情報群に含まれる分類対象情報の各々の間で相互に算出するか、または前記追加情報が追加されるごとに前記追加情報を前記対象情報群に追加して当該追加が行われた対象情報群に含まれる分類対象情報の各々の間で相互に算出することを特徴とする請求項12または13記載のサーバ装置。The server control unit mutually calculates the information feature amount between each of the classification target information included in the target information group stored at the calculation time point for each predetermined time interval, or the additional information 13. The additional information is added to the target information group each time a target is added, and mutual calculation is performed between each of the classification target information included in the target information group to which the addition is performed. Or the server apparatus of 13. 情報特徴量送信要求を送信し、分類対象情報群に含まれる複数の分類対象情報の各々の間で相互に算出される情報特徴量を受信するクライアント通信手段と、
ユーザによって設定された、前記複数の分類対象情報を分類する場合基準となる分類基準を予め格納するクライアント記憶手段と、
ユーザの要求によりまたは所定の条件が満たされると自動的に、前記クライアント記憶手段から前記分類基準を読み出し、前記通信部において受信した前記情報特徴量に基づいて当該読み出された分類基準を用いて前記分類対象情報を分類し、当該分類された結果を前記クライアント記憶手段に格納するクライアント制御手段と
を備えたことを特徴とするクライアント装置。
Client communication means for transmitting an information feature amount transmission request and receiving information feature amounts calculated mutually between each of a plurality of classification target information included in the classification target information group;
Client storage means for preliminarily storing a classification standard that is set by a user and serves as a reference when classifying the plurality of classification target information;
When the user's request or a predetermined condition is satisfied, the classification standard is automatically read from the client storage unit, and the read classification standard is used based on the information feature amount received by the communication unit. A client apparatus comprising: a client control unit that classifies the classification target information and stores the classified result in the client storage unit.
前記分類基準は、前記分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、
前記クライアント制御手段は、前記中心情報の指示において示される情報を中心に分類することを特徴とする請求項15記載のクライアント装置。
The classification criteria includes an indication of center information that is required to be classified as the center of the classification target information,
16. The client device according to claim 15, wherein the client control means classifies information indicated in the instruction of the center information as a center.
前記分類対象情報は、情報の内容および所有者を含み、
前記クライアント制御手段は、前記分類対象情報の各々の間で前記分類対象情報の各々に含まれる情報の内容および所有者についてそれぞれ相互に算出された情報特徴量に基づいて分類することを特徴とする請求項15または16記載のクライアント装置。
The classification target information includes information content and owner,
The client control means classifies the content of information included in each of the classification target information and the owner among the classification target information based on mutually calculated information feature amounts. The client device according to claim 15 or 16.
情報特徴量送信要求を送信し、分類対象情報群に含まれる複数の分類対象情報の各々の間で相互に算出される情報特徴量、および前記分類対象情報群に含まれる分類対象情報を所定の規則によって分類した複数の情報グループを受信するクライアント通信手段と、
ユーザによって設定された、前記複数の分類対象情報を分類する場合基準となる分類基準を予め格納するクライアント記憶手段と、
ユーザの要求によりまたは所定の条件が満たされると自動的に、前記クライアント記憶手段から前記分類基準を読み出し、前記通信部において受信した前記情報特徴量および前記複数の情報グループを用いて算出されたグループ情報特徴量に基づき当該読み出された分類基準を用いて前記複数の情報グループを分類し、当該分類された結果を前記クライアント記憶手段に格納するクライアント制御手段と
を備えたことを特徴とするクライアント装置。
An information feature amount transmission request is transmitted, and information feature amounts calculated mutually among each of a plurality of classification target information included in the classification target information group and the classification target information included in the classification target information group A client communication means for receiving a plurality of information groups classified according to a rule;
Client storage means for preliminarily storing a classification standard that is set by a user and serves as a reference when classifying the plurality of classification target information;
A group calculated by using the information feature amount and the plurality of information groups received by the communication unit by automatically reading the classification criteria from the client storage unit upon a user request or when a predetermined condition is satisfied Client control means for classifying the plurality of information groups using the read classification criteria based on the information feature quantity and storing the classified results in the client storage means apparatus.
前記分類基準は、前記分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、
前記クライアント制御手段は、前記中心情報の指示において示される情報を含む情報グループを中心に分類することを特徴とする請求項18記載のクライアント装置。
The classification criteria includes an indication of center information that is required to be classified as the center of the classification target information,
19. The client apparatus according to claim 18, wherein the client control means classifies the information group including information indicated in the instruction of the center information as a center.
前記分類対象情報は、情報の内容および所有者を含み、
前記クライアント制御手段は、前記情報グループの各々の間で前記情報グループの各々に含まれる情報の内容および所有者についてそれぞれ相互に算出されたグループ情報特徴量に基づいて分類することを特徴とする請求項18または19記載のクライアント装置。
The classification target information includes information content and owner,
The client control means classifies information contents and owners included in each of the information groups among the information groups based on mutually calculated group information feature amounts. Item 20. The client device according to Item 18 or 19.
前記分類基準は、前記情報特徴量をユーザごとに調整する場合の調整量を示す特徴量調整値を含み、
前記クライアント制御手段は、前記情報特徴量を該特徴量調整値によって調整した値に基づいて分類することを特徴とする請求項15ないし20のいずれかに記載のクライアント装置。
The classification standard includes a feature amount adjustment value indicating an adjustment amount when adjusting the information feature amount for each user,
21. The client device according to claim 15, wherein the client control unit classifies the information feature quantity based on a value adjusted by the feature quantity adjustment value.
前記所定の条件は、前記対象情報群に新たな情報である追加情報が追加されることであり、
前記クライアント制御手段は、前記追加情報と前記分類対象情報の各々との間で算出された情報特徴量に基づいて分類することを特徴とする請求項15ないし21のいずれかに記載のクライアント装置。
The predetermined condition is that additional information that is new information is added to the target information group,
The client device according to any one of claims 15 to 21, wherein the client control unit performs classification based on an information feature amount calculated between the additional information and each of the classification target information.
前記所定の条件は、前記対象情報群に新たな情報である追加情報が追加されることであり、
前記クライアント通信手段は、前記追加情報を受信し、
前記クライアント制御手段は、当該受信した追加情報をすでに受信済みの前記情報特徴量に基づいて前記対象情報に含めて分類することを特徴とする請求項15ないし21のいずれかに記載のクライアント装置。
The predetermined condition is that additional information that is new information is added to the target information group,
The client communication means receives the additional information;
The client device according to any one of claims 15 to 21, wherein the client control unit classifies the received additional information by including it in the target information based on the already received information feature amount.
分類対象情報群に含まれる分類対象情報の各々の間で相互に算出される情報特徴量に基づいて該分類対象情報を分類するステップを実行するプログラムであって、
前記複数の分類対象情報の各々の間で情報特徴量を相互に算出してサーバ記憶手段にサーバ制御手段が格納する特徴量格納ステップと、
情報特徴量送信要求を受信し、前記サーバ記憶手段から読み出された前記情報特徴量をサーバ通信手段が送信する送信ステップと
を実行することを特徴とするプログラム。
A program for executing a step of classifying the classification target information based on information feature amounts calculated mutually between the classification target information included in the classification target information group,
A feature amount storing step in which the server control unit stores the information feature amount between each of the plurality of classification target information and stores it in the server storage unit;
A program for receiving an information feature amount transmission request and executing a transmission step in which a server communication unit transmits the information feature amount read from the server storage unit.
分類対象情報群に含まれる分類対象情報の各々の間で相互に算出される情報特徴量に基づいて該分類対象情報を分類するステップを実行するプログラムであって、
前記複数の分類対象情報の各々の間で情報特徴量を相互に算出してサーバ記憶手段にサーバ制御手段が格納し、および前記分類対象情報群に含まれる分類対象情報を所定の規則によって分類した複数の情報グループを生成して前記サーバ記憶手段に格納する特徴量格納ステップと、
情報特徴量送信要求を受信し、サーバ通信手段が、前記サーバ記憶手段から前記特徴情報量および前記複数の情報グループを読み出して送信する送信ステップと
を実行することを特徴とするプログラム。
A program for executing a step of classifying the classification target information based on information feature amounts calculated mutually between the classification target information included in the classification target information group,
An information feature amount is calculated between each of the plurality of classification target information, the server control means stores it in the server storage means, and the classification target information included in the classification target information group is classified according to a predetermined rule A feature amount storing step of generating a plurality of information groups and storing them in the server storage means;
A program characterized by receiving an information feature amount transmission request and executing a transmission step in which server communication means reads and transmits the feature information amount and the plurality of information groups from the server storage means.
前記特徴量格納ステップは、前記情報特徴量を所定の時間間隔ごとに当該算出時点において格納されている前記対象情報群に含まれる分類対象情報の各々の間で相互に算出するか、または前記追加情報が追加されるごとに前記追加情報を前記対象情報群に追加して当該追加が行われた対象情報群に含まれる分類対象情報の各々の間で相互に算出することを特徴とする請求項24または25記載のプログラム。The feature amount storing step calculates the information feature amount between each of the classification target information included in the target information group stored at the calculation time point at predetermined time intervals, or adds the information feature amount The additional information is added to the target information group each time information is added, and is calculated between each of the classification target information included in the target information group to which the addition is performed. The program according to 24 or 25. 分類対象情報群に含まれる分類対象情報の各々の間で相互に算出される情報特徴量に基づいて該分類対象情報を分類するステップを実行するプログラムであって、
情報特徴量送信要求を送信し、分類対象情報群に含まれる複数の分類対象情報の各々の間で相互に算出される情報特徴量をクライアント通信手段が受信する特徴量受信ステップと、
ユーザによって設定された、前記複数の分類対象情報を分類する場合基準となる分類基準を予めクライアント記憶手段が格納する分類基準格納ステップと、
クライアント制御手段は、ユーザの要求によりまたは所定の条件が満たされると自動的に、前記クライアント記憶手段から前記分類基準を読み出し、前記通信部において受信した前記情報特徴量に基づいて当該読み出された分類基準を用いて前記分類対象情報を分類し、当該分類された結果を前記クライアント記憶手段に格納する分類結果格納ステップと
を実行することを特徴とするプログラム。
A program for executing a step of classifying the classification target information based on information feature amounts calculated mutually between the classification target information included in the classification target information group,
A feature amount receiving step in which the client communication means receives an information feature amount that is calculated between each of a plurality of pieces of classification target information included in the classification target information group by transmitting an information feature amount transmission request;
A classification criterion storage step in which the client storage means stores in advance a classification criterion that is set by the user and serves as a criterion when classifying the plurality of classification target information;
The client control means automatically reads out the classification criteria from the client storage means when requested by a user or when a predetermined condition is satisfied, and the read out based on the information feature amount received in the communication unit. A classification result storing step of classifying the classification target information using a classification criterion and storing the classified result in the client storage means.
前記分類基準は、前記分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、
前記分類結果格納ステップは、前記中心情報の指示において示される情報を中心に分類することを特徴とする請求項27記載のプログラム。
The classification criteria includes an indication of center information that is required to be classified as the center of the classification target information,
28. The program according to claim 27, wherein the classification result storing step classifies the information indicated in the instruction of the center information as a center.
前記分類対象情報は、情報の内容および所有者を含み、
前記分類格納ステップは、前記分類対象情報の各々の間で前記分類対象情報の各々に含まれる情報の内容および所有者についてそれぞれ相互に算出された情報特徴量に基づいて分類することを特徴とする請求項27または28記載のプログラム。
The classification target information includes information content and owner,
In the classification storing step, classification is performed based on information feature amounts calculated mutually with respect to contents and owners of information included in each of the classification target information among the classification target information. The program according to claim 27 or 28.
分類対象情報群に含まれる分類対象情報の各々の間で相互に算出される情報特徴量に基づいて該分類対象情報を分類するステップを実行するプログラムであって、
情報特徴量送信要求を送信し、分類対象情報群に含まれる複数の分類対象情報の各々の間で相互に算出される情報特徴量、および前記分類対象情報群に含まれる分類対象情報を所定の規則によって分類した複数の情報グループをクライアント通信手段が受信する特徴量受信ステップと、
ユーザによって設定された、前記複数の分類対象情報を分類する場合基準となる分類基準を予めクライアント記憶手段が格納する分類基準格納ステップと、
クライアント制御手段は、ユーザの要求によりまたは所定の条件が満たされると自動的に、前記クライアント記憶手段から前記分類基準を読み出し、前記通信部において受信した前記情報特徴量および前記複数の情報グループに基づいて当該読み出された分類基準を用いて前記分類対象情報を分類し、当該分類された結果を前記クライアント記憶手段に格納する分類結果格納ステップと
を実行することを特徴とするプログラム。
A program for executing a step of classifying the classification target information based on information feature amounts calculated mutually between the classification target information included in the classification target information group,
An information feature amount transmission request is transmitted, and information feature amounts calculated mutually among each of a plurality of classification target information included in the classification target information group and the classification target information included in the classification target information group are set as predetermined A feature receiving step in which the client communication means receives a plurality of information groups classified according to the rules;
A classification criterion storage step in which the client storage means stores in advance a classification criterion that is set by the user and serves as a criterion when classifying the plurality of classification target information;
The client control means automatically reads out the classification criteria from the client storage means according to a user request or when a predetermined condition is satisfied, and based on the information feature amount and the plurality of information groups received in the communication unit And a classification result storing step of classifying the classification target information using the read classification standard and storing the classified result in the client storage means.
前記分類基準は、前記分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、
前記分類結果格納ステップは、前記中心情報の指示において示される情報を含む情報グループを中心に分類することを特徴とする請求項30記載のプログラム。
The classification criteria includes an indication of center information that is required to be classified as the center of the classification target information,
31. The program according to claim 30, wherein the classification result storing step classifies the information group including information indicated in the instruction of the center information as a center.
前記分類対象情報は、情報の内容および所有者を含み、
前記分類結果格納ステップは、前記情報グループの各々の間で前記情報グループの各々に含まれる情報の内容および所有者についてそれぞれ相互に算出されたグループ情報特徴量に基づいて分類することを特徴とする請求項30または31記載のプログラム。
The classification target information includes information content and owner,
The classification result storing step classifies the content of information included in each of the information groups and the owner based on the mutually calculated group information feature amounts among the information groups. The program according to claim 30 or 31.
前記分類基準は、前記情報特徴量をユーザごとに調整する場合の調整量を示す特徴量調整値を含み、
前記分類結果格納ステップは、前記情報特徴量を該特徴量調整値によって調整した値に基づいて分類することを特徴とする請求項27ないし32のいずれかに記載のプログラム。
The classification standard includes a feature amount adjustment value indicating an adjustment amount when adjusting the information feature amount for each user,
33. The program according to claim 27, wherein the classification result storing step classifies the information feature quantity based on a value adjusted by the feature quantity adjustment value.
前記所定の条件は、前記対象情報群に新たな情報である追加情報が追加されることであり、
前記分類結果格納ステップは、前記追加情報と前記分類対象情報の各々との間で算出された情報特徴量に基づいて分類することを特徴とする請求項27ないし33のいずれかに記載のプログラム。
The predetermined condition is that additional information that is new information is added to the target information group,
The program according to any one of claims 27 to 33, wherein the classification result storing step performs classification based on an information feature amount calculated between the additional information and each of the classification target information.
前記所定の条件は、前記対象情報群に新たな情報である追加情報が追加されることであり、
前記クライアント通信手段は、前記追加情報を受信するステップをさらに実行し、
前記分類結果格納ステップは、当該受信した追加情報をすでに受信済みの前記情報特徴量に基づいて前記対象情報に含めて分類することを特徴とする請求項27ないし33のいずれかに記載のプログラム。
The predetermined condition is that additional information that is new information is added to the target information group,
The client communication means further executes a step of receiving the additional information;
34. The program according to claim 27, wherein the classification result storing step classifies the received additional information by including it in the target information based on the already received information feature amount.
請求項24ないし35に記載の各プログラムを記録したコンピュータ読み取り可能な記録媒体。36. A computer-readable recording medium on which each program according to claim 24 is recorded. 分類対象情報群に含まれる分類対象情報の各々の間で相互に算出される情報特徴量に基づいて該分類対象情報を分類する情報分類方法において、
前記分類対象情報を分類する場合基準となる分類基準を予め設定し格納する設定ステップと、
ユーザの要求によりまたは前記分類対象情報群に新たな情報が追加されると自動的に、前記分類基準を読み出し当該読み出された分類基準を用いて前記分類対象情報を分類する分類ステップと
を備えたことを特徴とする情報分類方法。
In an information classification method for classifying the classification target information based on information feature amounts calculated mutually between the classification target information included in the classification target information group,
A setting step for preliminarily setting and storing a classification standard as a standard when classifying the classification target information;
A classification step of automatically reading out the classification standard and classifying the classification target information using the read classification standard, upon request of a user or when new information is added to the classification target information group An information classification method characterized by that.
前記分類基準は、前記分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、
前記分類ステップは、前記中心情報の指示において示される情報を中心に分類することを特徴とする請求項37記載の情報分類方法。
The classification criteria includes an indication of center information that is required to be classified as the center of the classification target information,
38. The information classification method according to claim 37, wherein the classification step classifies the information indicated in the instruction of the central information as a center.
分類対象情報群に含まれる分類対象情報の各々の間で相互に算出される情報特徴量に基づいて該分類対象情報を分類する情報分類方法において、
前記分類対象情報群に含まれる分類対象情報を所定の規則によって分類して複数の情報グループを生成する生成ステップ
前記情報グループを分類する場合基準となる分類基準を予め設定し格納する設定ステップと、
ユーザの要求によりまたは所定の条件が満たされると自動的に、前記分類基準を読み出し、前記複数の情報グループを前記複数の情報グループの各々の間で相互に算出される情報特徴量に基づいて当該読み出された分類基準を用いて分類する分類ステップと
を備えたことを特徴とする情報分類方法。
In an information classification method for classifying the classification target information based on information feature amounts calculated mutually between the classification target information included in the classification target information group,
A generation step of classifying classification target information included in the classification target information group according to a predetermined rule to generate a plurality of information groups; a setting step of presetting and storing a classification standard as a reference when classifying the information group;
When the user's request or when a predetermined condition is satisfied, the classification criteria are read out, and the plurality of information groups are determined based on information feature amounts calculated mutually between the plurality of information groups. An information classification method comprising: a classification step of classifying using the read classification standard.
前記分類基準は、前記分類対象情報のうち中心として分類することが要求される中心情報の指示を含み、
前記分類ステップは、前記中心情報の指示において示される情報を含む情報グループを中心に分類することを特徴とする請求項39記載の情報分類方法。
The classification criteria includes an indication of center information that is required to be classified as the center of the classification target information,
40. The information classification method according to claim 39, wherein the classification step classifies the information group including information indicated in the instruction of the center information as a center.
前記分類対象情報は、情報の内容および所有者を含み、
前記分類ステップは、前記分類対象情報の各々の間で前記分類対象情報の各々に含まれる情報の内容および所有者についてそれぞれ相互に算出された情報特徴量に基づいて分類することを特徴とする請求項37ないし40のいずれかに記載の情報分類方法。
The classification target information includes information content and owner,
The classification step is characterized in that classification is performed on the basis of information features calculated for each content and owner included in each of the classification target information among the classification target information. Item 41. The information classification method according to any one of Items 37 to 40.
前記分類基準は、前記情報特徴量をユーザごとに調整する場合の調整量を示す特徴量調整値を含み、
前記分類ステップは、前記情報特徴量を該特徴量調整値によって調整した値に基づいて分類することを特徴とする請求項37ないし41のいずれかに記載の情報分類方法。
The classification standard includes a feature amount adjustment value indicating an adjustment amount when adjusting the information feature amount for each user,
42. The information classification method according to claim 37, wherein the classification step classifies the information feature quantity based on a value adjusted by the feature quantity adjustment value.
前記所定の条件は、前記対象情報群に新たな情報である追加情報が追加されることであり、
前記分類ステップは、前記追加情報と前記分類対象情報の各々との間で算出された情報特徴量に基づいて分類することを特徴とする請求項37ないし42のいずれかに記載の情報分類方法。
The predetermined condition is that additional information that is new information is added to the target information group,
43. The information classification method according to claim 37, wherein the classification step performs classification based on an information feature amount calculated between the additional information and each of the classification target information.
前記情報特徴量は、所定の時間間隔ごとに当該算出時点において格納されている前記対象情報群に含まれる分類対象情報の各々の間で相互に算出するか、または前記追加情報が追加されるごとに前記追加情報を前記対象情報群に追加して当該追加が行われた対象情報群に含まれる分類対象情報の各々の間で相互に算出することを特徴とする請求項37ないし42のいずれかに記載の情報分類方法。The information feature amount is calculated between each of the classification target information included in the target information group stored at the calculation time point for each predetermined time interval, or whenever the additional information is added 43. The method according to claim 37, wherein the additional information is added to the target information group, and the classification target information included in the target information group to which the addition has been performed is mutually calculated. Information classification method described in 1. 前記クライアント装置のうちの1つから追加情報があるとの通知を前記サーバ装置が受信したときは、当該通知をしたクライアント装置以外のクライアント装置に、前記追加情報がある旨通知する追加情報通知ステップと、
該クライアント装置が前記追加情報を要求するときは、前記サーバ装置および前記追加情報があるとの通知を送信したクライアント装置のいずれかから前記追加情報を受信する追加情報受信ステップと
をさらに備えたことを特徴とする請求項37ないし44のいずれかに記載の情報分類方法。
When the server device receives a notification that there is additional information from one of the client devices, an additional information notification step for notifying that there is the additional information to a client device other than the client device that has made the notification When,
When the client device requests the additional information, the client device further includes an additional information receiving step of receiving the additional information from either the server device or the client device that has transmitted a notification that there is the additional information. 45. The information classification method according to any one of claims 37 to 44, wherein:
JP2003169941A 2003-06-13 2003-06-13 Information classification method and device Pending JP2005004657A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003169941A JP2005004657A (en) 2003-06-13 2003-06-13 Information classification method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003169941A JP2005004657A (en) 2003-06-13 2003-06-13 Information classification method and device

Publications (1)

Publication Number Publication Date
JP2005004657A true JP2005004657A (en) 2005-01-06

Family

ID=34094927

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003169941A Pending JP2005004657A (en) 2003-06-13 2003-06-13 Information classification method and device

Country Status (1)

Country Link
JP (1) JP2005004657A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507100A (en) * 2020-12-18 2021-03-16 北京百度网讯科技有限公司 Method and device for updating question-answering system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507100A (en) * 2020-12-18 2021-03-16 北京百度网讯科技有限公司 Method and device for updating question-answering system
JP2022097397A (en) * 2020-12-18 2022-06-30 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド Method and apparatus for update processing of question answering system
JP7293544B2 (en) 2020-12-18 2023-06-20 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド Q&A system update processing method and device
CN112507100B (en) * 2020-12-18 2023-12-22 北京百度网讯科技有限公司 Update processing method and device of question-answering system

Similar Documents

Publication Publication Date Title
CN108804641B (en) Text similarity calculation method, device, equipment and storage medium
US7555412B2 (en) Communication efficient spatial search in a sensor data web portal
KR101700352B1 (en) Generating improved document classification data using historical search results
CN103425727B (en) Context speech polling expands method and system
JP2007334402A (en) Server, system and method for retrieving clustered vector data
Amine et al. Evaluation of text clustering methods using wordnet.
EP4148593A1 (en) Methods and systems for extracting and visualizing patterns in large-scale data sets
CN116662521B (en) Electronic document screening and inquiring method and system
CN111708774A (en) Industry analytic system based on big data
CN109815232A (en) A kind of method and system of retrieval, the data processing of the data rank using binary search tree
KR20170086353A (en) Method for providing interactive information service and apparatus therefor
Drakopoulos et al. Higher order graph centrality measures for Neo4j
CN116049381A (en) Knowledge graph-based specific target visual analysis method and system
CN112330164B (en) Data quality management system and method based on message bus
JP5470082B2 (en) Information storage search method and information storage search program
CN117271577B (en) Keyword retrieval method based on intelligent analysis
JP2005004657A (en) Information classification method and device
CN116028699B (en) Data query method, device and electronic equipment
JP6065001B2 (en) Data search device, data search method, and data search program
CN110097126B (en) Method for checking important personnel and house missing registration based on DBSCAN clustering algorithm
Sharif et al. A large-scale, hybrid approach for recommending pages based on previous user click pattern and content
CN114610945A (en) Real-time short video user portrait prediction method and system based on DCWP-RF algorithm
CN112612870A (en) Unstructured data management method
JPH08263510A (en) Automatic document classification system
Adeel et al. Efficient cluster-based information retrieval from mathematical markup documents