JP2006146621A - Information management device and method, and information management program - Google Patents
Information management device and method, and information management program Download PDFInfo
- Publication number
- JP2006146621A JP2006146621A JP2004336619A JP2004336619A JP2006146621A JP 2006146621 A JP2006146621 A JP 2006146621A JP 2004336619 A JP2004336619 A JP 2004336619A JP 2004336619 A JP2004336619 A JP 2004336619A JP 2006146621 A JP2006146621 A JP 2006146621A
- Authority
- JP
- Japan
- Prior art keywords
- input
- data
- output
- personal knowledge
- output data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、情報管理装置にかかり、特に、ユーザによる入出力データを、特徴付けてユーザごとに管理する情報管理装置に関する。また、情報管理方法及び情報管理用プログラムに関する。 The present invention relates to an information management apparatus, and more particularly to an information management apparatus that characterizes input / output data by a user and manages it for each user. The present invention also relates to an information management method and an information management program.
近年、大量の情報が供給される中で、個人が所望の情報を簡単に検索したり配信されて受け取ったりすることや(情報検索や情報配信)、所望の知識をもった専門家を検索すること(専門家検索)、などの要求が高まっている。 In recent years, with a large amount of information being supplied, individuals can easily search for or receive desired information (information search and information distribution), and search for experts with the desired knowledge. (Expert search), etc. are increasing.
一方で、個人の情報の入出力が電子文書や電子メール、電子画像などの電子情報としてコンピュータ上で行われることが多くなり、個人の入出力情報をその個人の関心事や専門知識として保存することが可能になってきている。 On the other hand, personal information is often input / output on a computer as electronic information such as electronic documents, e-mails, and electronic images, and personal input / output information is stored as personal interests and expertise. It is becoming possible.
ここで、入出力情報とは、例えば、コピーや閲覧した入力情報と、作成や編集した出力情報を指す。こうした個人の現在までの入出力情報を利用して検索や配信に活用するという従来技術が提案されている。それらの従来技術には以下のものがある。例えば、(1)各個人の入出力情報を蓄積して、後に情報検索、専門家検索に活用するナレッジマネージメントサービスや、(2)個人の情報の入出力を保存して、その個人にあった情報提供を可能とする情報配信パーソナライゼーション、リコメンデーションサービス(例えば特許文献1)である。 Here, the input / output information refers to, for example, input information that has been copied or browsed and output information that has been created or edited. Conventional techniques have been proposed in which such input / output information of an individual is used for search and distribution. These prior arts include the following. For example, (1) Knowledge management service that accumulates input / output information of each individual and later uses it for information search and expert search, and (2) Stores input / output of personal information, and was in that individual Information distribution personalization and recommendation service (for example, Patent Document 1) enabling information provision.
しかし、上記従来例の第1の問題点として、古いデータはデータベースに埋もれてしまい、検索することが困難となってしまう、という問題が生じる。すなわち、通常、個人の関心事や専門知識は時期に応じて移り変わり、個人は時間の経過とともに複数の関心事や専門知識をもつものであるが、従来の方法では、過去から現在までの期間全体ではそれほど顕著ではないが、過去のある時期だけに取り扱ったテーマのように、過去のある期間に集中的に入出力した情報から抽出される個人の関心事や専門知識が全体に埋もれてしまい、抽出することが困難となってしまう。 However, as a first problem of the above-described conventional example, there arises a problem that old data is buried in a database and it is difficult to search. In other words, individual interests and expertise usually change over time, and individuals have multiple interests and expertise over time, but conventional methods use the entire period from the past to the present. Although it is not so noticeable, personal interests and expertise extracted from information intensively input and output during a certain past period, such as themes handled only in a certain past period, are buried in the whole, It becomes difficult to extract.
上記状況を、図21を参照しながら説明する。図21の実線(横線)は、ある個人Pが時間t(横軸)上の特定の期間に、特定の関心事や専門知識にかかわる活動をしていたことを表している。例えば、図21内の最上段に位置する三本の実線(横線)は、個人Pが時間t1〜t2と、t3〜t5と、t7〜t9との期間に関心事や専門知識aにかかわる活動をしていたことを表している。同様に図21内のその他の下の二本の実線(横線)は、個人Pが時間t2〜t4の期間に関心事や専門知識bにかかわる活動をし、時間t6〜t8の期間に関心事や専門知識cにかかわる活動をしていたことを表している。 The above situation will be described with reference to FIG. A solid line (horizontal line) in FIG. 21 indicates that a certain individual P was engaged in an activity related to a specific interest or expertise in a specific period on time t (horizontal axis). For example, the three solid lines (horizontal lines) located at the top in FIG. 21 indicate that the individual P is involved in the interests and expertise a during the period from time t1 to t2, t3 to t5, and t7 to t9. It means that he was doing. Similarly, two lower solid lines (horizontal lines) in FIG. 21 indicate that the individual P is engaged in activities related to interests and expertise b in the period from time t2 to t4, and is interested in the period from time t6 to t8. And activities related to expertise c.
そして、上述した従来例では、入出力情報全体から一つの個人の関心事や専門知識を抽出しているため、個人の関心事や専門知識aのみが抽出でき、過去のある時期に集中的に取り扱った関心事や専門知識bやcが抽出できない、という問題が生じる。また、同様に、従来例では、時間的に古い入出力情報からは個人の関心事や専門知識の抽出を困難にしているため、過去のあるときに集中的に入出力した情報でも、現在の時点から遠く離れている情報は、抽出されにくい。その結果、全体を通じて多く取り扱ったaや最近集中的に取り扱ったcは抽出できるが、cよりも古く過去のある時期に集中的に取り扱った関心事や専門知識bが抽出できない、という問題が生じる。 In the conventional example described above, since one individual's interests and expertise are extracted from the entire input / output information, only the individual interests and expertise a can be extracted and concentrated on a certain period in the past. There arises a problem that the handled interests and expertise b and c cannot be extracted. Similarly, in the conventional example, it is difficult to extract personal interests and expertise from input / output information that is old in time. Information that is far away from the time is difficult to extract. As a result, although a that has been dealt with a lot throughout and c that has recently been handled intensively can be extracted, there is a problem that interests and expertise b that are older than c and that have been handled intensively at a certain time in the past cannot be extracted. .
また、従来例の第2の問題点として、個人の関心事や専門知識を正確に抽出することが困難となる、という問題が生じる。それは、個人が見ただけなのかそれとも深く理解したのかを区別せず、個人の情報の入出力全体からその個人の関心事や専門知識を抽出しているためである。さらに詳述すると、情報をコピー・閲覧しただけなのか、それとも作成・編集するほど自分の高い関心事や専門知識として扱ったのか、を区別せず、それら混在した両方から特徴を抽出しているためである。 Further, as a second problem of the conventional example, there arises a problem that it becomes difficult to accurately extract personal interests and expertise. This is because the individual's interests and expertise are extracted from the entire input / output of personal information without distinguishing whether the individual has just seen or deeply understood. To elaborate further, we do not distinguish between whether the information was just copied / viewed or whether it was treated as a high level of interest or expertise so that it could be created / edited, and features were extracted from both of them. Because.
このため、本発明は、個人の入出力状況に応じたデータ管理を行うことで、各ユーザの知識状態を容易に認識可能とし、これにより、あらゆる情報検索の容易化を図る、ことをその目的とする。具体的には、上記の第1の問題点に対応して、時間情報を用いて個人の期間ごとの関心事や専門知識を抽出することで、過去のある時期だけに取り扱ったテーマのように、過去のある期間に集中的に入出力した情報から抽出される個人の関心事や専門知識を検索することができるようにすることを目的とする。また、上記の第2の問題点に対応して、個人が見ただけなのかそれとも深く理解したのか、個人の関心事や専門知識を正確に抽出することを目的とする。 Therefore, the object of the present invention is to make it possible to easily recognize the knowledge state of each user by performing data management in accordance with the personal input / output status, thereby facilitating all information retrieval. And Specifically, in response to the first problem described above, by extracting the interests and specialized knowledge of each individual period using time information, it looks like a theme handled only at a certain time in the past An object is to make it possible to search for personal interests and expertise extracted from information intensively input and output during a past period. Another object of the present invention is to accurately extract the interests and expertise of an individual, whether they have only seen it or understood it deeply in response to the second problem.
そこで、本発明の一形態である情報管理装置は、
ユーザにて入出力される入出力データと、この入出力データの入出力状況を表す入出力状況データと、を記憶する入出力データ記憶手段と、
入出力データの予め定められた基準に基づく特徴値を抽出する特徴値抽出手段と、
入出力データの特徴値と入出力状況データとに基づいて、入出力データを入出力したユーザごとにおける入出力データの特徴を表す個人知識データを生成する個人知識データ生成手段と、
を備えたことを特徴としている。
Therefore, an information management apparatus according to one aspect of the present invention is
Input / output data storage means for storing input / output data input / output by the user and input / output status data representing the input / output status of the input / output data;
Feature value extraction means for extracting feature values based on predetermined criteria of input / output data;
Personal knowledge data generating means for generating personal knowledge data representing the characteristics of the input / output data for each user who has input / output the input / output data based on the feature values of the input / output data and the input / output status data;
It is characterized by having.
これにより、ユーザごとの入出力状況に応じて入出力データの特徴を表す個人知識データが生成されるため、各ユーザの知識状態を容易に認識可能となり、的確な情報の検索を実現できる。 As a result, personal knowledge data representing the characteristics of the input / output data is generated according to the input / output status of each user, so that the knowledge state of each user can be easily recognized, and accurate information search can be realized.
また、特徴値抽出手段は、入出力データに含まれる各用語の出現頻度、出現位置、強調情報のうち、少なくとも1つに基づいて特徴値を抽出する、ことを特徴としている。これにより、ユーザごとの個人知識データが入出力された用語の頻度等に応じて生成されるため、より明確に各ユーザの知識状態を認識することができる。 The feature value extracting means is characterized in that the feature value is extracted based on at least one of the appearance frequency, appearance position, and emphasis information of each term included in the input / output data. Thereby, since personal knowledge data for each user is generated according to the frequency of input / output terms, the knowledge state of each user can be recognized more clearly.
また、入出力状況データは、入出力データが入出力された時間を表すデータである、ことを特徴としている。そして、このとき、個人知識データ生成手段は、予め定められた期間内に入出力が行われた複数の入出力データに基づいて個人知識データを生成する、ことを特徴としている。これにより、入出力データの入出力時期ごとに個人知識データを生成することができ、時期ごとの各ユーザの知識状態を認識することができる。従って、情報の新旧を意識せずに、検索が可能となる。 In addition, the input / output status data is data representing the time when the input / output data was input / output. At this time, the personal knowledge data generating means generates personal knowledge data based on a plurality of input / output data that are input / output within a predetermined period. Thereby, personal knowledge data can be generated for each input / output time of the input / output data, and the knowledge state of each user for each time can be recognized. Therefore, it is possible to search without being conscious of new and old information.
また、入出力状況データは、入出力データの入出力の区別を表す入出力区別データである、ことを特徴としている。このとき、個人知識データ生成手段は、入出力区別データに応じて入出力データに重み付けを行って個人知識データを生成する、ことを特徴としている。さらに、このとき、個人知識データ生成手段は、入出力データのうち出力データに対して入力データよりも高い重み付けを行う、ことを特徴としている。また、入出力状況データは、入出力データにおける他のデータの参照状況を表す参照状況データである、ことを特徴としている。このとき、個人知識データ生成手段は、参照状況データに応じて入出力データに重み付けを行って個人知識データを生成する、ことを特徴としている。特に、重み付けは、入出力データのうち所定のデータの参照先となるデータに対して重み付けを行う、ことを特徴としている。これにより、入出力データの入出力の区別、あるいは、参照状態に応じて、ユーザごとの個人知識データの特徴が生成されるため、より個人の知識状態を反映して生成することができ、より的確な情報検索が可能となる。 The input / output status data is input / output distinction data representing input / output distinction of the input / output data. At this time, the personal knowledge data generating means generates the personal knowledge data by weighting the input / output data according to the input / output distinction data. Further, at this time, the personal knowledge data generating means is characterized in that the output data of the input / output data is weighted higher than the input data. Further, the input / output status data is reference status data representing a reference status of other data in the input / output data. At this time, the personal knowledge data generating means generates the personal knowledge data by weighting the input / output data according to the reference situation data. In particular, the weighting is characterized in that weighting is performed on data serving as a reference destination of predetermined data among input / output data. As a result, the characteristics of the personal knowledge data for each user are generated according to the input / output distinction of the input / output data or the reference state, so that it can be generated more reflecting the individual knowledge state. Accurate information search is possible.
また、複数の入出力データの特徴値間の類似度を算出する類似度算出手段を備え、個人知識データ生成手段は、類似度が所定値以上の複数の入出力データに対して個人知識データの生成を行う、ことを特徴としている。これにより、互いに特徴が類似する入出力データに対する個人知識データを生成することができ、同類のデータ群にまとめて個人知識データを生成でき、より個人の特徴を反映することができる。 In addition, a similarity calculation unit that calculates a similarity between feature values of a plurality of input / output data is provided, and the personal knowledge data generation unit is configured to store personal knowledge data for a plurality of input / output data having a similarity equal to or greater than a predetermined value. It is characterized by generating. As a result, personal knowledge data for input / output data having similar characteristics can be generated, and personal knowledge data can be generated in a group of similar data, and more personal characteristics can be reflected.
さらに、上記構成に加え、個人知識データ生成手段にて生成された個人知識データを蓄積する情報蓄積手段を備えた、ことを特徴としている。そして、他のユーザから入出力データに対応するデータを含む検索要求データを受け付けて、当該検索要求データに基づいて情報蓄積手段に記憶された個人知識データを検索する検索手段を備えた、ことを特徴としている。このとき、検索手段は、検索した個人知識データに予め定められた基準にて類似する他の個人知識データを検索する、ことを特徴としている。また、上記構成に加え、検索手段にて検索した個人知識データを出力する検索情報出力手段を備えた、ことを特徴としている。また、検索手段にて検索した個人知識データに対応する入出力データを、入出力データ記憶手段から読み出して出力する検索情報出力手段を備えた、ことを特徴としている。さらに、検索手段にて検索した個人知識データに対応するユーザを特定するユーザ特定情報を出力する検索情報出力手段を備えた、ことを特徴としている。これにより、個人ごとの入出力データの特徴に基づいて情報の検索を行うことができ、より的確な情報の検索を行うことができる。 Further, in addition to the above configuration, the information storage means for storing the personal knowledge data generated by the personal knowledge data generating means is provided. And a search means for receiving search request data including data corresponding to the input / output data from another user and searching the personal knowledge data stored in the information storage means based on the search request data. It is a feature. At this time, the search means is characterized in that it searches for other personal knowledge data similar to the searched personal knowledge data based on a predetermined criterion. Further, in addition to the above configuration, a search information output means for outputting personal knowledge data searched by the search means is provided. Further, the present invention is characterized in that it includes search information output means for reading out and outputting input / output data corresponding to the personal knowledge data searched by the search means from the input / output data storage means. Further, the present invention is characterized in that search information output means for outputting user specifying information for specifying a user corresponding to the personal knowledge data searched by the search means is provided. Accordingly, information can be searched based on the characteristics of input / output data for each individual, and more accurate information can be searched.
また、本発明の他の形態である情報管理方法は、
ユーザにて入出力された入出力データと、この入出力データの入出力状況を表す入出力状況データと、を記憶する入出力データ記憶手段に接続されたコンピュータが実行する情報管理方法であって、
入出力データの特徴値を予め定められた基準に基づいて抽出する特徴値抽出工程と、
入出力データの特徴値と、入出力データ記憶手段に記憶された入出力状況データと、に基づいて、入出力データを入出力したユーザごとにおける入出力データの特徴を表す個人知識データを生成する個人知識データ生成工程と、
を有することを特徴としている。
In addition, an information management method according to another aspect of the present invention includes:
An information management method executed by a computer connected to input / output data storage means for storing input / output data input / output by a user and input / output status data representing the input / output status of the input / output data. ,
A feature value extraction step of extracting feature values of the input / output data based on a predetermined criterion;
Based on the characteristic value of the input / output data and the input / output status data stored in the input / output data storage means, personal knowledge data representing the characteristics of the input / output data for each user who has input / output the input / output data is generated. Personal knowledge data generation process,
It is characterized by having.
そして、特徴値抽出工程は、入出力データに含まれる各用語の出現頻度、出現位置、強調情報のうち、少なくとも1つに基づいて特徴値を抽出する、ことを特徴としている。 The feature value extraction step is characterized in that feature values are extracted based on at least one of the appearance frequency, appearance position, and emphasis information of each term included in the input / output data.
また、入出力状況データは、入出力データが入出力された時間を表すデータであり、
個人知識データ生成工程は、予め定められた期間内に入出力が行われた複数の入出力データに基づいて個人知識データを生成する、ことを特徴としている。
The input / output status data is data representing the time when the input / output data was input / output.
The personal knowledge data generating step is characterized in that personal knowledge data is generated based on a plurality of input / output data input / output within a predetermined period.
また、入出力状況データは、入出力データの入出力の区別を表す入出力区別データであり、
個人知識データ生成工程は、入出力区別データに応じて入出力データに重み付けを行って個人知識データを生成する、ことを特徴としている。
The input / output status data is input / output distinction data indicating the input / output distinction of the input / output data.
The personal knowledge data generation step is characterized in that the personal knowledge data is generated by weighting the input / output data according to the input / output distinction data.
さらに、個人知識データ生成工程は、複数の入出力データの特徴値間の類似度を算出すると共に、当該類似度が所定値以上の複数の入出力データに対して個人知識データの生成を行う、ことを特徴としている。 Furthermore, the personal knowledge data generation step calculates similarity between feature values of a plurality of input / output data, and generates personal knowledge data for a plurality of input / output data having the similarity equal to or higher than a predetermined value. It is characterized by that.
また、本発明の他の形態である情報管理用プログラムは、
ユーザにて入出力された入出力データと、この入出力データの入出力状況を表す入出力状況データと、を記憶する入出力データ記憶手段に接続されたコンピュータに、
入出力データの特徴値を予め定められた基準に基づいて抽出する特徴値抽出手段と、
入出力データの特徴値と、入出力データ記憶手段に記憶された入出力状況データと、に基づいて、入出力データを入出力したユーザごとにおける入出力データの特徴を表す個人知識データを生成する個人知識データ生成手段と、
を実現するための情報管理用プログラム、という構成を採っている。
An information management program according to another aspect of the present invention is
To a computer connected to input / output data storage means for storing input / output data input / output by the user and input / output status data representing the input / output status of the input / output data,
Feature value extraction means for extracting feature values of the input / output data based on a predetermined criterion;
Based on the characteristic value of the input / output data and the input / output status data stored in the input / output data storage means, personal knowledge data representing the characteristics of the input / output data for each user who has input / output the input / output data is generated. Personal knowledge data generation means;
It adopts the configuration of an information management program for realizing the above.
そして、コンピュータに、入出力データに含まれる各用語の出現頻度、出現位置、強調情報のうち、少なくとも1つに基づいて特徴値を抽出する特徴値抽出手段、を実現するための情報管理用プログラムでもある。 An information management program for realizing, on the computer, feature value extraction means for extracting a feature value based on at least one of the appearance frequency, appearance position, and emphasis information of each term included in the input / output data But there is.
また、コンピュータに、
入出力状況データが入出力データの入出力時間を表すデータである場合に、予め定められた期間内に入出力が行われた複数の入出力データに基づいて個人知識データを生成する個人知識データ生成手段、を実現するための情報管理用プログラムでもある。
Also on the computer,
Personal knowledge data for generating personal knowledge data based on a plurality of input / output data input / output within a predetermined period when the input / output status data is data representing the input / output time of the input / output data. It is also an information management program for realizing the generation means.
また、コンピュータに、
入出力状況データが入出力データの入出力の区別を表す入出力区別データである場合に、入出力区別データに応じて入出力データに重み付けを行って個人知識データを生成する個人知識データ生成手段、を実現するための情報管理用プログラムでもある。
Also on the computer,
Personal knowledge data generating means for generating personal knowledge data by weighting the input / output data according to the input / output distinction data when the input / output status data is input / output distinction data representing the input / output distinction of the input / output data It is also an information management program for realizing.
さらに、コンピュータに、
複数の入出力データの特徴値間の類似度を算出する類似度算出手段と、
類似度が所定値以上の複数の入出力データに対して個人知識データの生成を行う個人知識データ生成手段と、を実現するための情報管理用プログラムでもある。
In addition,
Similarity calculation means for calculating the similarity between feature values of a plurality of input / output data;
It is also an information management program for realizing personal knowledge data generating means for generating personal knowledge data for a plurality of input / output data having a similarity equal to or greater than a predetermined value.
上記構成の情報管理方法及び情報管理用プログラムであっても、上述した情報管理装置と同様に作用するため、上記目的を達成することができる。 Even the information management method and the information management program having the above-described configuration operate in the same manner as the information management apparatus described above, and thus the above-described object can be achieved.
本発明は、上述したように構成され機能するので、これによると、ユーザによる入出力データの履歴を、ユーザごとの入出力状況に応じて入出力データの特徴を表す個人知識データとして生成しておくことができるため、各ユーザの知識状態を容易に認識することが可能となり、かかる個人知識データを管理することで、容易かつ的確な情報検索を実現できる、という従来にない優れた効果を有する。 Since the present invention is configured and functions as described above, according to this, the history of input / output data by the user is generated as personal knowledge data representing the characteristics of the input / output data according to the input / output situation for each user. Therefore, it is possible to easily recognize the knowledge status of each user, and it is possible to easily and accurately search information by managing such personal knowledge data. .
本発明は、ユーザによって入出力された個人の関心事や専門知識である入出力データを、後に容易に検索可能なよう蓄積管理する情報管理装置である。このため、本発明は、入出力データの特徴を表す個人知識データを入出力状況に応じて生成し、これを管理することに特徴を有する。 The present invention is an information management apparatus for accumulating and managing input / output data, which are personal interests and expertise input / output by a user, so that it can be easily retrieved later. For this reason, the present invention is characterized in that personal knowledge data representing the characteristics of input / output data is generated according to the input / output situation and managed.
以下、実施例1では、入出力状況の一例として入出力時期を挙げ、入出力が行われた期間ごとに入出力データを区切って管理する情報管理装置を説明する。また、実施例2では、入出力状況の他の例として入出力の区別を挙げ、入出力の相違や他の参照の有無に応じた特徴を生成して管理する情報管理装置を説明する。また、実施例3では、上記期間と入出力区別とを組み合わせた場合を説明する。 In the following, in the first embodiment, an input / output time is given as an example of an input / output state, and an information management apparatus that manages by dividing input / output data for each period during which input / output is performed will be described. In the second embodiment, an input / output distinction is given as another example of the input / output situation, and an information management apparatus that generates and manages features according to input / output differences and the presence or absence of other references will be described. In the third embodiment, a case where the above period and input / output distinction are combined will be described.
本発明の第1の実施例を、図1乃至図12を参照して説明する。図1は、本発明の全体構成を示すブロック図である。図2は、情報管理装置の構成を示す機能ブロック図である。図3乃至図5は、情報管理装置における情報処理の様子を示す説明図である。図6乃至図12は、情報管理装置の動作を示すフローチャートである。 A first embodiment of the present invention will be described with reference to FIGS. FIG. 1 is a block diagram showing the overall configuration of the present invention. FIG. 2 is a functional block diagram showing the configuration of the information management apparatus. 3 to 5 are explanatory diagrams showing the state of information processing in the information management apparatus. 6 to 12 are flowcharts showing the operation of the information management apparatus.
[構成]
本発明は、ユーザにて入出力されるデータを管理する情報管理装置2であって、サーバコンピュータなどの情報処理装置にて構成されている。そして、この情報管理装置2に対してデータの登録や閲覧など、データの入出力を行うユーザA,B,Cが操作するコンピュータであるユーザ端末11,12,13に、ネットワークNを介して接続されている。また、この情報管理装置2に対してデータの検索要求を行うユーザDの操作するコンピュータであるユーザ端末14にもネットワークNを介して接続されている。
[Constitution]
The present invention is an
なお、情報管理装置2は、必ずしも一台のコンピュータにて構成されていることに限定されず、複数台のコンピュータにて構成されていてもよい。また、データの入出力や検索は、上記ユーザ端末11,12,13,14によって行われることに限定されず、情報管理装置2自体をユーザが操作することによって行われてもよい。また、「ユーザ」とは、個人であることに限定されず、複数の主体からなる組織やグループを指してもよい。以下、情報管理装置2の具体的な構成について説明する。
Note that the
情報管理装置2は、情報の演算処理を行う演算部20と、情報を記憶する記憶部30とを備えており、演算部20には、情報管理用プログラムが組み込まれることで、図2に示すように、データ入力処理部21と、特徴値抽出処理部22と、個人知識生成処理部23と、が構築されており、ユーザ端末11,12,13による入出力データを、その特徴に基づいて管理する機能を有する。さらに、演算部20には、上記プログラムが組み込まれることで、検索要求受付処理部24と、検索処理部25と、検索結果出力処理部26と、が構築されており、ユーザ端末14からのデータの検索要求に応じて検索処理を行う機能を有する。また、これに応じて、記憶部30には、入出力データ記憶部31と、時間データ記憶部32と、期間設定データ記憶部33と、個人知識データ記憶部34と、が形成されている。以下、各処理部21〜26、及び、各記憶部31〜34について詳述する。
The
上記データ入出力処理部21は、ユーザがユーザ端末11,12,13を介して情報管理装置2に入出力した入出力データと、当該ユーザが入出力した時間を表す時間データと、を受け付けて、記憶部30内の入出力データ記憶部31と時間データ記憶部32とに(入出力データ記憶手段)それぞれ記憶する機能を有する。ここで、時間データとは、例えば、ユーザが入出力データにアクセスした時間、あるいは、入出力データを更新した時間を表す。また、入出力データは、あらかじめ情報管理装置2の記憶部に格納済みのデータである。従って、かかる場合には、時間データとは、ユーザが入出力データを記憶部30に保存した時間を指す。なお、ユーザにて入出力されるデータとは、他のコンピュータの記憶部に対して入出力されるデータであってもよい。その場合には、かかる入出力状態を情報管理装置2が監視して、入出力データと時間データとを記憶するよう作動する。また、入出力データは、ユーザの関心事や専門知識を表すデータであり、後述するように、個人知識として抽出・蓄積・共有される。
The data input /
そして、上述したようにして入出力データと時間データとが記憶されたときの様子を、図3、図4を参照して説明する。例えば、ユーザAが、プログラミング言語「C++」に関心を持ち知識を身に付けるために文書を読んだりした場合には、ユーザAがユーザ端末11を介して入出力したデータを、随時、記憶部30の入出力データ記憶部31に保存する。また、同時に、ユーザAが入出力データを入出力した時間データ(時間情報)を記憶部30の時間データ記憶部32に保存する。すると、図3に示すように、ユーザAによる入出力データは、当該入出力データのIDと、入出力時間とが関連付けられて記憶されることとなる。そして、入出力データとしては、後述するように、図4に示す「C++」や、「ライブラリ」、「クラス」、「変数」などがある。
The state when the input / output data and the time data are stored as described above will be described with reference to FIGS. For example, when the user A is interested in the programming language “C ++” and reads a document to acquire knowledge, the data input / output by the user A via the
次に、特徴値抽出処理部22(特徴値抽出手段)について説明する。特徴値抽出処理部22は、入出力データの特徴値を算出するよう作動する。このとき、特徴値の算出ルール(基準)は予め設定されており、かかる処理部22に組み込まれている。以下、特徴値抽出の一例を説明する。ここでは、入出力データがテキスト情報であるものとし、かかるテキスト情報に含まれる各用語の出現頻度に基づいて特徴値を抽出するものとする。
Next, the feature value extraction processing unit 22 (feature value extraction means) will be described. The feature value
特徴値抽出処理部22は、記憶部30の入出力データ記憶部31に保存されているユーザAが入出力したデータを読み出し、そのデータの解析を行う。このとき、解析単位は任意でよく、1ファイルといった情報単位でなくてもよい。そして、解析方法は、例えば、ある期間の入出力データAj(j>=1)がテキスト情報であった場合、公知の技術であるTF/IDF手法を用いて重み付けを行い、特徴単語(用語)を抽出することにより行う。さらに具体的には、各入出力データAjから形態素解析処理によって単語を抽出し、抽出された単語の中から、名詞、動詞、形容詞などの内容語の出現頻度をカウントし、内容語の各入出力データでの出現頻度を用いて内容語のTF/IDF値を計算する。そして、TF/IDF値の上位N位の特徴単語とTF/IDF値を、その入出力データの特徴量とする。なお、TF/IDF手法については、文献「Sparck
Jones, Karen. (1972). A statistical interpretation of term specificity and its
application in retrieval. Journal of Documentation 28: 11-21.」他に記述があり、周知であるため詳細な説明は省略する。
The feature value
Jones, Karen. (1972). A statistical interpretation of term specificity and its
Journal of Documentation 28: 11-21 "and so on, and is well known, so detailed explanation is omitted.
なお、上記では、入出力データがテキスト情報である場合を説明したが、入力データはこれに限定されず、例えば、テキスト情報の他、注釈の付与された画像情報や音声情報であってもよい。また、特徴値の抽出方法は上記方法に限定されず、入出力データに含まれる各用語の出現位置、フォント情報や韻律情報といった強調情報に基づいて特徴値を抽出してもよい。そして、これらを組み合わせて特徴値を抽出してもよい。 In the above description, the case where the input / output data is text information has been described. However, the input data is not limited thereto, and may be, for example, text information, annotated image information or audio information. . The feature value extraction method is not limited to the above method, and the feature value may be extracted based on the appearance position of each term included in the input / output data, emphasis information such as font information and prosodic information. And you may extract a feature value combining these.
ここで、特徴値抽出処理22の結果の一例を、図4乃至図5(a)に示す。図4では、入出力データIDがA3である入出力データを形態素解析し、名詞、動詞、形容詞といった内容語を抽出し、その他の入出力情報での内容語の頻度と比較してTF/IDF値を計算した結果、上位4位の特徴単語「C++」、「ライブラリ」、「クラス」、「変数」と、そのTF/IDF値を、特徴値として抽出した例である。そして、図5(a)には、各時間における入出力データA1〜Ajを特徴値で表示した例を示している。
Here, an example of the result of the feature
次に、個人知識生成処理部23(個人知識データ生成手段)について説明する。個人知識生成処理部23は、上記入出力データの特徴値から、入出力状況データである時間データに基づいて、入出力データを入出力したユーザごとにおける入出力データの特徴を表す個人知識データを生成するよう作動する。そして、本実施例では、特に、入出力の時間の近接性が高い複数の入出力データの特徴を計算することにより、ユーザ個人の入出力データの特徴を表す個人知識データを作成する。
Next, the personal knowledge generation processing unit 23 (personal knowledge data generation means) will be described. The personal knowledge
さらに、個人知識生成処理部23について具体的に説明すると、まず、期間設定データ記憶部33に記憶された期間設定データを読み出す。この期間設定データとは、例えば、時間的に近接する複数の入出力データを一期間内のデータとして設定するデータであったり、所定時間内の入出力データを1つの期間として設定するデータであるなど、所定の期間を設定する基準となるデータである。そして、この期間設定データに基づいて期間を設定するが、本実施例では、図5(a)に示すA1〜A3の期間を特定の期間At1として設定する。そして、かかる期間内の入出力データの特徴値から、さらに特徴を表す個人知識データを生成する。例えば、各入出力データの上位N位の特徴単語のTF/IDF値をそれぞれ特徴単語ベクトルとし、その和を生成する。そして、生成されたデータを、図5(b)に示すように個人知識データとする。その後は、別の期間における個人知識データも作成し、さらには、ユーザB,Cによる入出力データに対しても個人知識データの作成を行う。また、個人知識生成処理部23は、上述したように生成した個人知識データを、個人知識データ記憶部34(情報蓄積手段)に保存する。
Further, the personal knowledge
ここで、個人知識生成処理部23による個人識別データの生成方法は、上述したものに限定されない。例えば、入出力データの特徴値である特徴単語とそのTF/IDF値を一定時間内で合計し、平均をとることにより、個人識別データを生成してもよい。また、期間の設定も上述したものに限定されず、さらには、期間は一定の時間でなく動的であってもよい。
Here, the method of generating personal identification data by the personal knowledge
次に、検索要求受付部24について説明する。検索要求受付部24は、情報管理装置2に管理されているデータの検索要求を、ユーザ端末14から受け付け、検索処理部25に通知するよう作動する。このとき、検索要求を行うユーザ端末14は、ユーザDが操作するものとする。そして、ユーザDが、「C++やそのライブラリ」という検索要求データを送信して、検索要求を行ったとする。
Next, the search
検索処理部25(検索手段)は、上記検索要求受付部24から検索要求データの通知を受けると、検索要求データの内容を分析し、蓄積された個人知識データの少なくとも一つを検索する。具体的な検索処理としては、例えば、形態素解析処理にかけ、抽出された内容語である「C++」と「ライブラリ」に「1.0」の値を付与する。同時に、検索対象に含まれていて、検索要求に含まれていない単語には「0」の値を付与する。その結果、例えば、(C++,ライブラリ,クラス,変数)=(1.0, 1.0, 0,0)といった検索要求の特徴単語ベクトルを作成する。そして、この検索要求データの単語特徴ベクトルと、1つ以上の個人知識データの類似度を各々計算する。類似度の計算方法は任意でよいが、例えば、空間ベクトル法を用いて計算すると、上述した個人知識データAt1と検索要求データとの間の類似度は「0.91」になる。これを全てのユーザA,B、Cの各期間ごとの個人知識データを対象に検索要求との間の類似度を計算し、この結果から検索要求データと最も類似度の高い個人知識データを特定する。
Upon receiving notification of the search request data from the search
そして、上記特定された個人知識データ自体を個人知識データ記憶部34から抽出してもよく、さらに、これに類似する他の個人知識データを特定して抽出してもよい。例えば、上記類似度を参照して、2番目に高い個人知識データをも抽出してもよい。また、特定された個人知識データに対応する入出力データを、入出力データ記憶部31から抽出してもよい。また、さらには、特定された個人知識データに対応するユーザを特定するユーザ特定情報を抽出してもよい。すなわち、上述した例では、ユーザAを特定する情報(例えば、ユーザAの個人名)が抽出される。なお、このような検索は、検索要求時に、ユーザ端末14から人物検索要求がなされたときに行ってもよい。
Then, the specified personal knowledge data itself may be extracted from the personal knowledge
そして、これら抽出した情報は検索結果出力処理部26(検索結果出力手段)に渡され、当該検索結果出力処理部26から検索要求を行ったユーザ端末14に送信される。
The extracted information is passed to the search result output processing unit 26 (search result output unit), and is transmitted from the search result
[動作]
次に、図6乃至図11を参照して、上述した情報管理装置2の動作を説明する。図6は、ユーザA,B,Cのユーザ端末11,12,13による入出力データに対する情報管理装置による情報蓄積処理を示すフローチャートであり、図7乃至図8は、その一部の詳細な動作を示すフローチャートである。図9は、ユーザDのユーザ端末14による検索要求に対する情報管理装置による検索処理を示すフローチャートであり、図10乃至図11は、その一部の詳細な動作を示すフローチャートである。なお、特に、ユーザAがプログラミング言語C++に関心を持ち、知識を身に付けるために文書を読んだり、メモを作成することにより、かかる知識のデータを入出力している状態と、ユーザDが「C++やそのライブラリ」について知りたいと思い、他者の個人知識を検索する場合を考える。すなわち、上述した図3乃至図5も参照して説明する。
[Operation]
Next, the operation of the
まず、情報管理装置2のデータ入出力処理部21が、ユーザAのユーザ端末11にて入出力された入出力データを、入出力データ記憶部31に保存する(ステップS1)。このとき、同時に、情報管理装置2のデータ入出力処理部21は、ユーザAが入出力データを入出力した時間データを時間データ記憶部32に保存する(ステップS2)。すると、図3に示すように、ユーザAによるユーザ端末11からの入出力データのIDと、それら入出力データにアクセスした時間データが記憶される。
First, the data input /
続いて、情報管理装置2の特徴値抽出処理部22が、記憶部30に保存されている入出力データを読み出し、その特徴値を抽出する(ステップS3、特徴値抽出工程)。かかる特徴値の抽出処理を、図7を参照して詳述する。特徴値抽出処理部22は、入出力データがテキスト情報であった場合には、所定の期間の入出力データAj(j>=1)に対して、公知の技術であるTF/IDF手法を用いて重み付けを行う。具体的には、図4に示すように、入出力データA3に形態素解析処理を行い、名詞、動詞、形容詞といった内容語を抽出する(ステップS11)。そして、抽出された単語の中から、名詞、動詞、形容詞などの内容語の出現頻度をカウントし(ステップS12)、内容語の各入出力データでの出現頻度を用いて当該内容語のTF/IDF値を計算する(ステップS13)。続いて、TF/IDF値の上位4位を特徴単語「C++」、「ライブラリ」、「クラス」、「変数」を抽出し(ステップS14)、そのTF/IDF値を抽出して、特徴単語とそのTF/IDF値を特徴値とする(ステップS15)。
Subsequently, the feature value
続いて、個人知識生成処理部23が、上記特徴値抽出処理部22にて得られた入出力データの特徴値と、記憶部30の時間データ記憶部32に保存された時間データを用いて、時間の近接性が高い入出力データ間における代表的な特徴を、その期間の個人の関心事や専門知識を表す個人知識データとして生成する(ステップS4、個人知識データ生成工程)。この動作を、図8を参照してさらに詳述する。
Subsequently, the personal knowledge
個人知識生成処理部23は、まず、期間設定データ記憶部33から期間設定データを読み出し(ステップS21)、これに基づいて個人知識データを生成する入出力データの入出力が行われた期間を設定する(ステップS22)。この場合には、図5(a)に示すように、期間t1が設定され、入出力データA1〜A3までの特徴が個人知識データを生成する対象となる。そして、各入出力データのTF/IDF値上位4位の特徴単語のTF/IDF値を特徴単語ベクトルとし、それらの和を作成し、個人知識データとする(ステップS23)。具体的には、期間t1内の単語特徴ベクトルの和をAt1とすると、At1=A1+A2+A3=(0.96,0.84,0)+(0,0.92,0,064)+(0.93,0.86,0.74,0.55)=(1.89,2.62,0.74,1.19)となる。そして、上記同様に、個人知識データを、各期間tk(k>=1)ごとにそれぞれ作成する。
The personal knowledge
その後、生成された個人知識データを、個人知識データ記憶部34に保存する(ステップS5)。そして、ユーザAの個人知識データだけでなく、ユーザB,C等についても、同様に期間ごとの個人知識データを作成し、個人知識データ記憶部34に保存する。
Thereafter, the generated personal knowledge data is stored in the personal knowledge data storage unit 34 (step S5). Then, not only the personal knowledge data of the user A but also the personal knowledge data for each of the users B, C, etc. are created and stored in the personal knowledge
続いて、ユーザDのユーザ端末14から検索要求がなされた場合における情報管理装置2による検索処理動作を、図9を参照して説明する。まず、ユーザ端末14から検索要求がなされると、検索要求受付処理部24が検索要求を受け付け(ステップS41)、検索処理部25に通知する。このとき、ユーザDが「C++やそのライブラリ」という検索要求を送信した場合を考える。
Next, a search processing operation by the
続いて、検索処理部25は、検索要求の内容を分析する(ステップS42)。例えば、検索要求データを形態素解析処理にかけ、抽出された内容語「C++」と「ライブラリ」に「1.0」の値を付与する。同時に、検索対象に含まれていて、検索要求に含まれていない単語には「0」の値を付与する。その結果、例えば、(C++,ライブラリ,クラス,変数)=(1.0,
1.0, 0,0)といった検索要求の特徴単語ベクトルが作成される。
Subsequently, the
A feature word vector for a search request such as 1.0, 0, 0) is created.
そして、これに基づいて、個人知識データ記憶部中から検索を行う(ステップS43)。具体的には、図10に示すように、検索要求データの単語特徴ベクトルと個人知識データとの類似度をそれぞれ計算する。例えば、空間ベクトル法を用いて計算すると、図5(a)に示す個人知識データAt1と検索要求の間の類似度は「0.91」になる。これをユーザA、ユーザB、ユーザCなどの各期間ごとの個人知識データを対象に、検索要求データとの間の類似度を計算する。この結果から検索要求と最も類似度の高い個人知識データを特定する(ステップS52)。例えば、個人知識データAt1が最も類似度の高い個人知識データであると判定された場合、個人知識データAt1を検索結果として抽出する(ステップS44)。なお、かかるステップS44の詳細な動作を図11(a)にも示す(ステップS61)。そして、抽出した個人知識データAt1をユーザDのユーザ端末14に対して出力する(ステップS45)。なお、検索結果として出力するデータは、個人知識データAt1ばかりでなく、検索要求データに対して類似度が2番目、3番目に高い個人知識データなどを抽出して出力してもよい。さらには、個人知識データに限らず、これの元となる入出力データを入出力データ記憶部31から抽出して(図11(b)のステップS71参照)、ユーザDのユーザ端末14に出力してもよい。
Based on this, the personal knowledge data storage unit is searched (step S43). Specifically, as shown in FIG. 10, the similarity between the word feature vector of the search request data and the personal knowledge data is calculated. For example, when the calculation is performed using the space vector method, the similarity between the personal knowledge data At1 shown in FIG. 5A and the search request is “0.91”. The degree of similarity with the search request data is calculated for the personal knowledge data for each period such as user A, user B, and user C. From this result, the personal knowledge data having the highest similarity with the search request is specified (step S52). For example, when it is determined that the personal knowledge data At1 is the personal data having the highest similarity, the personal knowledge data At1 is extracted as a search result (step S44). The detailed operation of step S44 is also shown in FIG. 11A (step S61). And the extracted personal knowledge data At1 is output with respect to the
なお、検索要求を行ったユーザDからの要求が、個人知識データのみではなく、「C++やそのライブラリ」について「詳しい人物」を検索する要求である場合には、上述したように、個人知識データAt1を特定した後に、当該個人知識データのもととなる入出力データを入出力したユーザAを特定し(図11(c)のステップS81参照)、その「個人名であるA」を検索結果としてユーザDのユーザ端末14に出力する。
When the request from the user D who made the search request is not only the personal knowledge data but also a request to search for “detailed person” for “C ++ and its library”, as described above, the personal knowledge data After specifying At1, the user A who inputs / outputs the input / output data that is the basis of the personal knowledge data is specified (see step S81 in FIG. 11C), and the search result is “A that is an individual name”. To the
このようにすることにより、上記情報管理装置2によると、時間情報を用いて個人の期間ごとの関心事や専門知識を抽出することで、過去のある期間に集中的に入出力した情報を検索することができることから、過去のある時期だけに取り扱ったテーマのように、過去のある期間に集中的に入出力した情報から抽出される個人の関心事や専門知識を持っていた専門家である他の個人やその情報を検索することができる。また、同様に、現在一致する関心事や専門知識を持っている他の個人が過去にはどのような関心事や専門知識を持っていたのか、といったことも検索できることである。
In this way, according to the
さらに、時間情報を用いて個人の期間ごとの関心事や専門知識を抽出すること、個人の過去から現在までの関心事や専門知識の変遷を検索できるようにしたため、検索者である個人が所望の情報を検索する際に、自分の過去から現在までの関心事や専門知識の変遷により近い人物の持っている情報から所望の情報を検索することができ、情報の再利用化を図ることができる。 Furthermore, it is now possible to extract interests and expertise for each individual period using time information, and to search for changes in interests and expertise from the past to the present of the individual, so that the individual who is the searcher wants When searching for information, it is possible to search for desired information from information held by a person closer to the interests of the past and the present and the transition of expertise, so that information can be reused it can.
[変形例]
次に、上記構成の情報管理装置2の変形例を、図12を参照して説明する。この変形では、基本的な構成は上述した情報管理装置2と同様であるが、情報蓄積処理時における個人知識データの作成方法が異なる。すなわち、個人知識生成処理部23が以下のような機能を有し、図6のステップS4の動作が図12のフローチャートに示すようになる。
[Modification]
Next, a modified example of the
[構成]
まず、この変形例における個人知識生成処理部23は、複数の入出力データの特徴値間の類似度を算出する類似度算出機能(類似度算出手段)を有している。そして、この算出された類似度に基づいて、当該類似度が所定値以上の複数の入出力データの特徴値を用いて、個人知識データの生成を行う、という機能を有する。そして、本実施例では、特に、上述したように、設定された期間内の入出力データの特徴値に基づいて個人知識データの生成が行われるため、お互いに類似度が大きく、かつ、入出力の時間の近接性が高い入出力データの特徴値から、個人知識データが生成されることとなる。
[Constitution]
First, the personal knowledge
[動作]
具体的な処理動作を、図12のフローチャートを参照して説明する。まず、各入出力データの特徴値が算出されると、特徴値間の類似度を算出する(ステップS31)。このとき、類似度の計算方法は任意でよいが、例えば、特徴単語の集合の重なりによって、類似度を判定する。また、公知技術であるVector Space Model(ベクトル空間法)等を用いて、情報の特徴をそのテキスト情報の中に出現する単語データをもとに単語行列ベクトル(特徴単語ベクトル)で表し、各特徴単語ベクトル間の距離や内積等によって、二情報間の類似度の大きさを求めることが可能である。ベクトル空間法は文献「Salton,
G. (1989) Automatic Text Processing. Addison-Wesley Publishing Company.」の十章等に詳細に述べられている。また、別の公知の技術であるLatent
Semantic Space(潜在的意味空間法)等を用いて、作成した特徴単語ベクトルを、特異値分解により低階数近似し、ベクトルの次元を小さくして計算することも可能である。潜在的意味空間法については、文献「Deerwester,
S. et. al.(1990): Indexing by latent semantic analysis. Journal of the American
Society for Information Science, 41(7), 391-407.」他に記述があるため詳細な説明は省略する。
[Operation]
A specific processing operation will be described with reference to the flowchart of FIG. First, when the feature value of each input / output data is calculated, the similarity between the feature values is calculated (step S31). At this time, the method for calculating the degree of similarity may be arbitrary, but the degree of similarity is determined based on, for example, overlapping of sets of feature words. In addition, using the well-known Vector Space Model (vector space method) etc., the feature of the information is expressed as a word matrix vector (feature word vector) based on the word data that appears in the text information. The degree of similarity between two pieces of information can be obtained from the distance between word vectors, the inner product, and the like. The vector space method is described in the document "Salton,
G. (1989) Automatic Text Processing. Addison-Wesley Publishing Company. Another known technology, Latent
Using the Semantic Space (latent semantic space method) or the like, it is also possible to approximate the created feature word vector by low-order approximation by singular value decomposition and reduce the vector dimension. The latent semantic space method is described in the document “Deerwester,
S. et. Al. (1990): Indexing by latent semantic analysis.Journal of the American
"Society for Information Science, 41 (7), 391-407."
そして、算出した類似度を用いて、お互いに類似度が高い入出力データの特徴値を抽出し(ステップS32)、かつ、時間の近接性が高い入出力データ間の特徴値に対して、個人知識データを生成する(ステップS35)。すなわち、上述同様に、期間設定データを読み出して、所定の期間を設定し(ステップS34)、かかる期間内の存在する入出力データのうち、類似度が高い特徴値のみの特徴を表す個人知識データを生成する。 Then, using the calculated similarity, the feature values of the input / output data having a high similarity to each other are extracted (step S32), and the feature values between the input / output data having a high temporal proximity are obtained for the individual. Knowledge data is generated (step S35). That is, as described above, the period setting data is read out, a predetermined period is set (step S34), and the personal knowledge data representing the feature of only the feature value having high similarity among the input / output data existing in the period. Is generated.
次に、本発明の第2の実施例を、図13乃至図17を参照して説明する。図13は、情報管理装置の構成を示す機能ブロック図である。図14乃至図15は、情報管理装置における情報処理の様子を示す説明図である。図16乃至図17は、情報管理装置の動作を示すフローチャートである。 Next, a second embodiment of the present invention will be described with reference to FIGS. FIG. 13 is a functional block diagram showing the configuration of the information management apparatus. FIG. 14 to FIG. 15 are explanatory diagrams showing the state of information processing in the information management apparatus. 16 to 17 are flowcharts showing the operation of the information management apparatus.
[構成]
本実施例における情報処理装置102は、基本的には、上述した実施例1におけるものと同様の構成を採っている。従って、情報管理装置102は、1台又は複数台のサーバコンピュータなどの情報処理装置にて構成されており、データの登録や閲覧などデータの入出力を行うユーザA,B,Cが操作するコンピュータであるユーザ端末11,12,13に、ネットワークNを介して接続されている。また、この情報管理装置102に対してデータの検索要求を行うユーザDの操作するコンピュータであるユーザ端末14にもネットワークNを介して接続されている。
[Constitution]
The
そして、情報管理装置102は、情報の演算処理を行う演算部120と、情報を記憶する記憶部130とを備えており、演算部120には、情報管理用プログラムが組み込まれることで、図13に示すように、データ入力処理部121と、特徴値抽出処理部122と、個人知識生成処理部123と、が構築されており、ユーザ端末11,12,13による入出力データを、その特徴に基づいて管理する機能を有する。本実施例では、特に、上記実施例1の場合と比較して、入出力データの個人知識データの生成方法が異なるため、上記各処理部121,122,123の機能が異なる。また、これに伴い、記憶部130には、入出力データ記憶部131と、入出力区分データ記憶部132と、重み付け設定データ記憶部133と、個人知識データ記憶部134と、が形成されている。これらについては、以下に詳述する。
The
また、演算部120には、上記プログラムが組み込まれることで、検索要求受付処理部124と、検索処理部125と、検索結果出力処理部126と、が構築されており、ユーザ端末14からのデータの検索要求に応じて検索処理を行う機能を有しているが、これら各処理部124,125,126の機能は、上記実施例1の場合とほぼ同一であるので、その説明は省略する。
In addition, the
上記データ入出力処理部121は、ユーザがユーザ端末11,12,13を介して情報管理装置102に入出力した入出力データと、この入出力データの入出力状況を表すデータである入出力の区別を表す入出力区別データと、を受け付けて、記憶部130内の入出力データ記憶部131と入出力区別データ記憶部132とにそれぞれ記憶する機能を有する。また、データ入出力処理部121は、さらに、入出力データにおける他のデータの参照状況を表す参照状況データをも受け付けて、入出力区分データ記憶部132に記憶する機能を有する。
The data input /
ここで、上述した各データについて詳述する。入出力データは、あらかじめ情報管理装置102に格納済みの、例えば電子メールの送信メールや受信メールなどの入出力の区別が可能なユーザ個人の入出力データである。また、入出力区別データは、上記入出力データが入力データか、出力データか、ということを示すデータであり、例えば、送信メールには出力データであることを示す区別データ「1」を付与し、受信メールには入力データであることを示す区別データ「0」を付与して記憶しておく。そのときの記憶例を図14に示す。この図は、ユーザAの入出力データのIDと入出力区別データと参照関係を記録した一例である。まず、入出力データにIDを付与してデータの内容と共に記憶し、さらにこの入出力データユーザAが出力データであれば「1」を、入力データであれば「0」といった区別データを付与し、図示するように記憶する。
Here, each data mentioned above is explained in full detail. The input / output data is personal input / output data stored in the
また、参照状況データは、入出力データ間の参照関係を示すデータである。参照関係は、例えば、出力データ内に明記された参考文献や引用符で囲まれた記述等の説明からその説明の内容が書かれた入力データを特定することで得ることができることを表している。そして、例えば、図14に示すように、出力データA3を作成する際に当該A3が他の入力データA2を参照して作成している場合には(図14内の矢印参照)、その参照関係を「A3−>A2」のようにA3のデータに対して付与し、記憶する。 The reference status data is data indicating a reference relationship between input and output data. The reference relationship indicates that it can be obtained, for example, by specifying the input data in which the content of the description is written from the description such as the reference document specified in the output data or the description enclosed in quotation marks. . Then, for example, as shown in FIG. 14, when the output data A3 is created by referring to the other input data A2 (see the arrow in FIG. 14), the reference relationship is created. Is assigned to the data of A3 as “A3-> A2” and stored.
また、特徴値抽出処理部122は、実施例1にて説明したものと同様に作用し、例えば、各入出力データAjから形態素解析処理によって単語を抽出し、抽出された単語の中から、名詞、動詞、形容詞などの内容語の出現頻度をカウントし、内容語の各入出力データでの出現頻度を用いて内容語のTF/IDF値を計算する。これにより、実施例1にて説明した図4に示すように、上位N位の特徴単語とTF/IDF値を、特徴値として抽出する。
The feature value
次に、個人知識生成処理部123(個人知識データ生成手段)について説明する。個人知識生成処理部123は、上記入出力データの特徴値に対して、入出力区別データに応じて重み付けを行って、個人知識データを生成するよう作動する。このとき、重み付けは、例えば、出力データに対しては入力データよりも高い重み付けを行う。また、さらに、上記参照状況データに応じても、入出力データに重み付けを行う。例えば、参照されている入力データに対して所定の重み付けを付加する。
Next, the personal knowledge generation processing unit 123 (personal knowledge data generation means) will be described. The personal knowledge
上記個人知識生成処理部123による個人知識データ作成の具体的な処理を、図14乃至図15を参照して説明する。まず、図15(a)には入出力データの一例を示しているが、図14に示すように、A1,A2は入力データであり、A3は出力データである。また、A3はA2を参照している。かかる場合に、入出力データの特徴値のうち、出力データA3の特徴値に任意の重み、例えば、w=0.8(0<=w<=1)を加算し、入力データA1,A2の特徴値に重み0.2(1−w)を加算する。また、A3の参照先となっている入力データA2には、さらに、例えば0.5の重みを加算する。従って、A2には、(1−w)+0.5=0.7の重みが加算されたこととなる。そして、上記重みを付加した各入出力データの特徴値を特徴単語ベクトルとし、各入出力データにおける単語特徴ベクトルの和Awを取る。すると、Aw=(0.94,1.50,0.59,0.89)となり、これを、ユーザAによる入出力データの代表的な特徴を表す個人知識データとして生成する。かかる結果は、ユーザAが出力データとして取り扱った情報の特徴をより強く反映したものとなる。
Specific processing of personal knowledge data creation by the personal knowledge
そして、上述したように生成した個人知識データを、個人知識データ記憶部134に記憶しておく。また、他のユーザの入出力データに対しても、同様に個人知識データの生成及び保存を行う。
The personal knowledge data generated as described above is stored in the personal knowledge
ここで、上述した重み付けの値は一例であって、上記値に限定されるものではない。また、上述した個人知識データを算出する手法では、参照関係に基づいて入出力データの特徴値に重みを付加する例を説明したが、必ずしもこれに限定されず、かかる参照関係に基づいた重みは付加されなくてもよい。逆に、参照関係に基づく重み付けのみが付加され、入出力区別に基づく重みが付加されなくてもよい。 Here, the above-described weighting value is an example, and is not limited to the above value. In the above-described method for calculating the personal knowledge data, the example in which the weight is added to the feature value of the input / output data based on the reference relationship has been described. However, the weight based on the reference relationship is not necessarily limited thereto. It may not be added. Conversely, only the weight based on the reference relationship is added, and the weight based on the input / output distinction may not be added.
そして、上述したように生成され記憶された個人知識データに対して、他のユーザから検索要求があった場合には、情報管理装置102は検索要求受付部124と検索処理部125と検索結果出力処理部126との作用により、検索処理を実行する。但し、これら各処理部124,125,126の機能は上記実施例1のものとほぼ同一であるので、その説明は省略する。
When there is a search request from another user for the personal knowledge data generated and stored as described above, the
[動作]
次に、図16乃至図17を参照して、上述した情報管理装置102の動作を説明する。図16は、ユーザA,B,Cのユーザ端末11,12,13による入出力データに対する情報管理装置による情報蓄積処理を示すフローチャートであり、図17は、その一部の詳細な動作を示すフローチャートである。なお、上記実施例1と同様に、ユーザAがプログラミング言語C++に関心を持ち、知識を身に付けるために文書を読んだり、メモを作成している場合における情報蓄積処理の動作を説明する。
[Operation]
Next, the operation of the
まず、情報管理装置102のデータ入出力処理部121が、ユーザAのユーザ端末11にて入出力された入出力データを、入出力データ記憶部131に保存する(ステップS101)。このとき、同時に、情報管理装置102のデータ入出力処理部121は、ユーザAが入出力したデータの入手・出力の区別である入出力区別データを、入出力区別データ記憶部132に保存する(ステップS102)。また、このとき、入出力データの参照関係も入出力区別データ記憶部132に保存する。このようにして記憶した例を図14に示す。上述したように、かかる記憶例では、ユーザAが入出力したデータに入出力データIDを付与し、そのデータ内容とIDを保存する。また、ユーザAがアクセスまたは保存したデータが出力データであれば「1」を、入力データであれば「0」といった区別データを付与して保存する。さらには、ある出力データA3を作成する際に入力データA2を参照して作成したという参照関係を「A3−>A2」のように、A3に付与して保存する。なお、入出力データの内容とは、例えば、電子メールの送信メール、受信メールなどの入出力の区別が可能なデータである。
First, the data input /
続いて、情報管理装置102の特徴値抽出処理部122が、記憶した入出力データを読み出し、実施例1の場合と同様に、その特徴値を抽出する(ステップS103)。
Subsequently, the feature value
続いて、個人知識生成処理部123が、上記特徴値抽出処理部122にて得られた入出力データの特徴値と、入出力区別データ記憶部132に保存された入出力区別データを用いて、入出力状況に対応した個人の関心事や専門知識をあらわす代表的な特徴を、個人知識データとして生成する(ステップS104)。この動作を、図17を参照してさらに詳述する。
Subsequently, the personal knowledge
個人知識生成処理部123は、まず、重み付け設定データ記憶部133から重み付け設定データを読み出すと共に(ステップS111)、入出力区別データ記憶部132から、入出力区別データと参照状況データとを読み出す(ステップS112)。そして、これらに基づいて、各入出力データの特徴値に重み付けを行う(ステップS113)。本実施例の場合には、出力データに対しては重み付けが高くなるよう設定されており、また、参照先となるデータに対しても重みが高くなるよう設定されている。具体的には、図15(a)に示すように重み付けが加算され、各入出力データA1,A2,A3の単語特徴ベクトルの和を計算することで、図15(b)のAwに示す個人知識データが生成される(ステップS114)。
The personal knowledge
その後、生成された個人知識データを、個人知識データ記憶部134に保存する(ステップS105)。そして、ユーザAの個人知識データだけでなく、ユーザB,C等についても、同様に個人知識データを作成し、個人知識データ記憶部134に保存する。
Thereafter, the generated personal knowledge data is stored in the personal knowledge data storage unit 134 (step S105). Then, not only the personal knowledge data of the user A but also the personal knowledge data is created for the users B, C, etc., and stored in the personal knowledge
なお、後に、ユーザDのユーザ端末14から検索要求がなされた場合における情報管理装置102による検索処理動作は、上記実施例1と同様なので、その説明は省略する。
Note that the search processing operation by the
このようにすることにより、入出力区別データを用いて、個人知識のうち出力データをもとに作成された知識に重みづけをして個人知識データを作成していることから、ユーザが出力データとして取り扱った情報の特徴をより強く反映したものとなるため、後の検索時に、個人の関心事や専門知識を正確に抽出することができる。これは、個人が閲覧やコピーをするといった入力データは個人が単に見ただけといったことが考えられ、個人の関心事や専門知識との関連の度合いは低いかもしれないのに対して、個人が作成や編集をするといった出力データは、個人が選択や創作をするステップを経なければ実現せず、個人の関心事や専門知識との関連の度合いが強いと考えられることによる。 In this way, since the personal knowledge data is created by weighting the knowledge created based on the output data of the personal knowledge using the input / output distinction data, the user outputs the output data Since it reflects the characteristics of the information handled as a more strongly, it is possible to accurately extract personal interests and expertise during subsequent searches. This is because the input data that the individual browses and copies is simply viewed by the individual, and the degree of association with the individual's interests and expertise may be low, whereas the individual This is because output data such as creation and editing is not realized unless the individual goes through the selection and creation steps, and it is considered that the degree of association with the individual's interests and expertise is strong.
また、出力データとその参照関係にある入力データに重みづけをして個人知識を作成することで、出力データに重みづけをして個人知識を作成する場合と同様、個人の関心事や専門知識を正確に保存することが可能になる。すなわち、出力データと同様に、その出力データを作成するときに参考にした情報である入力データは、個人が単に見ただけかもしれない入力データ全体に比べて、個人がその情報を利用して出力データを作成しているので、個人の関心事や専門知識との関連の度合いが強いと考えられるためである。 In addition, by creating a personal knowledge by weighting the input data that has a reference relationship with the output data, as with the case of creating personal knowledge by weighting the output data, individual interests and expertise Can be stored accurately. That is, as with the output data, the input data, which is the information that was referenced when creating the output data, is used by the individual in comparison to the entire input data that the individual may have just viewed. This is because the output data is created, so it is considered that there is a strong degree of association with individual interests and expertise.
次に、本発明の第3の実施例を、図18乃至図20を参照して説明する。図18は、情報管理装置の構成を示す機能ブロック図である。図19乃至図20は、情報管理装置の動作を示すフローチャートである。 Next, a third embodiment of the present invention will be described with reference to FIGS. FIG. 18 is a functional block diagram illustrating the configuration of the information management apparatus. 19 to 20 are flowcharts showing the operation of the information management apparatus.
[構成]
本実施例における情報処理装置202は、上述した実施例1と実施例2において説明したそれぞれの情報処理装置2,102が有する各処理部を組み合わせた構成を採っている。そして、情報管理装置202は、情報の演算処理を行う演算部220と、情報を記憶する記憶部230とを備えており、演算部220には、情報管理用プログラムが組み込まれることで、図18に示すように、データ入力処理部221と、特徴値抽出処理部222と、個人知識生成処理部223と、が構築されており、ユーザ端末11,12,13による入出力データを、その特徴に基づいて管理する機能を有する。本実施例では、特に、入出力データの個人知識データの生成方法が異なるため、上記データ入出力処理部221と個人知識生成処理部223の機能が異なる。また、これに伴い、記憶部230には、入出力データ記憶部231と、時間データ・入出力区別データ記憶部232と、期間設定データ・重み付け設定データ記憶部233と、個人知識データ記憶部234と、が形成されている。これらについては、以下に詳述する。
[Constitution]
The
また、演算部220には、上記プログラムが組み込まれることで、検索要求受付処理部224と、検索処理部225と、検索結果出力処理部226と、が構築されており、ユーザ端末14からのデータの検索要求に応じて検索処理を行う機能を有しているが、これら各処理部224,225,226の機能は、上記実施例1の場合とほぼ同一であるので、その説明は省略する。
In addition, the
そして、上記データ入出力処理部221は、入出力データを受け付けて入出力データ記憶部231に記憶すると共に、入出力データの入出力時間を表す時間データと、入出力データの入出力の区別を表す入出力区別データや入出力データ間の参照関係を表す参照状況データと、をそれぞれ受け付けて、時間データ・入出力区別データ記憶部232に記憶する、という機能を有している。
The data input /
また、個人知識生成処理部223は、時間データと入出力区別データとに基づいて、入出力の時間の近接性が高い所定の期間内における複数の入出力データの特徴を算出する際に、出力データに重みづけを付加するなど入出力状況を考慮して重み付けを加算し、個人知識データを生成する。
In addition, the personal knowledge
[動作]
次に、図19乃至図20を参照して、上述した情報管理装置202の動作を説明する。図19は、ユーザA,B,Cのユーザ端末11,12,13による入出力データに対する情報管理装置による情報蓄積処理を示すフローチャートであり、図20は、その一部の詳細な動作を示すフローチャートである。なお、上記実施例1,2と同様に、ユーザAがプログラミング言語C++に関心を持ち、知識を身に付けるために文書を読んだり、メモを作成している場合における情報蓄積処理の動作を説明する。
[Operation]
Next, the operation of the
まず、情報管理装置202のデータ入出力処理部221が、ユーザAのユーザ端末11にて入出力された入出力データを、入出力データ記憶部231に保存する(ステップS201)。このとき、同時に、情報管理装置202のデータ入出力処理部221は、入出力データの入出力時間を表す時間データと、ユーザAが入出力したデータの入力・出力の区別である入出力区別データとを、時間データ・入出力区別データ記憶部232に保存する(ステップS202)。また、このとき、入出力データの参照関係も時間データ・入出力区別データ記憶部232に保存する。
First, the data input /
続いて、情報管理装置202の特徴値抽出処理部222が、記憶されている入出力データを読み出し、実施例1の場合と同様に、その特徴値を抽出する(ステップS203)。
Subsequently, the feature value
続いて、個人知識生成処理部223が、上記特徴値抽出処理部222にて得られた入出力データの特徴値と、時間データ・入出力区別データ記憶部232に保存された時間データ及び入出力区別データを用いて、所定期間における入出力データにおける入出力状況に対応した個人の関心事や専門知識をあらわす代表的な特徴を、個人知識データとして生成する(ステップS204)。この動作を、図20を参照してさらに詳述する。
Subsequently, the personal knowledge
個人知識生成処理部223は、まず、期間設定データ・重み付け設定記憶部233から期間設定データを読み出し(ステップS211)、これに基づいて個人知識データを生成する入出力データの入出力が行われた期間を設定する(ステップS212)。続いて、期間設定データ・重み付け設定データ記憶部233から重み付け設定データを読み出し(ステップS213)、これに基づいて、実施例2において説明したように、上記設定された期間内の各入出力データの特徴値に重み付けを行う(ステップS214)。そして、この設定された期間内の入出力データであって、重み付けが加算された特徴値の単語特徴ベクトルの和を計算することにより、個人知識データを生成する(ステップS215)。なお、上記個人知識データの生成方法は一例であって、上記手法に限定されるものではない。
First, the personal knowledge
その後、生成された個人知識データを、個人知識データ記憶部234に保存する(ステップS205)。そして、ユーザAの個人知識データだけでなく、ユーザB,C等についても、同様に個人知識データを作成し、個人知識データ記憶部234に保存する。 Thereafter, the generated personal knowledge data is stored in the personal knowledge data storage unit 234 (step S205). Then, not only the personal knowledge data of the user A but also the personal knowledge data is created for the users B, C, etc., and stored in the personal knowledge data storage unit 234.
なお、後に、ユーザDのユーザ端末14から検索要求がなされた場合における情報管理装置202による検索処理動作は、上記実施例1と同様なので、その説明は省略する。
Note that the search processing operation by the
このようにすることにより、入出力データが入出力された期間と、その入出力区別が考慮された個人知識データが作成されるため、入出力データを取り扱ったユーザの特徴をより反映させることができ、後のデータの利用がさらに容易となる。特に、過去のある期間に集中的に入出力した情報を検索することができ、また、個人の関心事や専門知識をより高精度に抽出することができる。 By doing this, personal knowledge data is created in consideration of the period during which the input / output data is input / output and the input / output distinction, so that the characteristics of the user who handled the input / output data can be more reflected. This makes it easier to use the data later. In particular, information input / output intensively during a certain past period can be searched, and personal interests and expertise can be extracted with higher accuracy.
本発明は、ユーザによる入出力データを蓄積して管理すると共に、その検索を可能とするデータベースとして利用可能であるため、産業上の利用可能性を有する。 The present invention has industrial applicability because it can be used as a database for storing and managing input / output data by a user and enabling the search.
2 情報管理装置
11,12,13,14 ユーザ端末
21,121 データ入出力処理部
22,122 特徴値抽出処理部(特徴値抽出手段)
23,123 個人知識生成処理部(個人知識データ生成手段)
24,124 検索要求受付処理部(検索手段)
25,125 検索処理部(検索手段)
26,126 検索結果出力処理部(検索結果出力手段)
31,131 入出力データ記憶部(入出力データ記憶手段)
32 時間データ記憶部(入出力データ記憶手段)
33 期間設定データ記憶部
34,134 個人知識データ記憶部(情報蓄積手段)
132 入出力区別データ記憶手段(入出力データ記憶手段)
133 重み付け設定データ記憶部
2
23,123 Personal knowledge generation processing unit (personal knowledge data generation means)
24,124 Search request reception processing unit (search means)
25, 125 Search processing unit (search means)
26, 126 Search result output processing unit (search result output means)
31, 131 Input / output data storage unit (input / output data storage means)
32 hour data storage (input / output data storage means)
33 Period setting
132 Input / output distinction data storage means (input / output data storage means)
133 Weight setting data storage unit
Claims (29)
前記入出力データの予め定められた基準に基づく特徴値を抽出する特徴値抽出手段と、
前記入出力データの特徴値と前記入出力状況データとに基づいて、前記入出力データを入出力した前記ユーザごとにおける前記入出力データの特徴を表す個人知識データを生成する個人知識データ生成手段と、
を備えたことを特徴とする情報管理装置。 Input / output data storage means for storing input / output data input / output by the user and input / output status data representing the input / output status of the input / output data;
Feature value extraction means for extracting feature values based on predetermined criteria of the input / output data;
Personal knowledge data generating means for generating personal knowledge data representing the characteristics of the input / output data for each of the users who input / output the input / output data based on the feature values of the input / output data and the input / output status data; ,
An information management device comprising:
前記個人知識データ生成手段は、前記類似度が所定値以上の複数の前記入出力データに対して前記個人知識データの生成を行う、ことを特徴とする請求項1,2,3,4,5,6,7,8,9,10,11又は12記載の情報管理装置。 A similarity calculating means for calculating a similarity between feature values of the plurality of input / output data;
6. The personal knowledge data generating means generates the personal knowledge data for a plurality of the input / output data having a similarity equal to or greater than a predetermined value. , 6, 7, 8, 9, 10, 11 or 12.
前記入出力データの特徴値を予め定められた基準に基づいて抽出する特徴値抽出工程と、
前記入出力データの特徴値と、前記入出力データ記憶手段に記憶された前記入出力状況データと、に基づいて、前記入出力データを入出力した前記ユーザごとにおける前記入出力データの特徴を表す個人知識データを生成する個人知識データ生成工程と、
を有することを特徴とする情報管理方法。 An information management method executed by a computer connected to input / output data storage means for storing input / output data input / output by a user and input / output status data representing the input / output status of the input / output data. ,
A feature value extracting step of extracting the feature value of the input / output data based on a predetermined criterion;
Based on the characteristic value of the input / output data and the input / output status data stored in the input / output data storage unit, the characteristic of the input / output data for each user who has input / output the input / output data is represented. Personal knowledge data generation process for generating personal knowledge data;
An information management method characterized by comprising:
前記個人知識データ生成工程は、予め定められた期間内に入出力が行われた複数の前記入出力データに基づいて前記個人知識データを生成する、ことを特徴とする請求項20又は21記載の情報管理方法。 The input / output status data is data representing the time when the input / output data was input / output,
22. The personal knowledge data generation step generates the personal knowledge data based on a plurality of the input / output data input / output within a predetermined period. Information management method.
前記個人知識データ生成工程は、前記入出力区別データに応じて前記入出力データに重み付けを行って前記個人知識データを生成する、ことを特徴とする請求項20,21又は22記載の情報管理方法。 The input / output status data is input / output distinction data representing input / output distinction of the input / output data,
23. The information management method according to claim 20, wherein the personal knowledge data generating step generates the personal knowledge data by weighting the input / output data according to the input / output distinction data. .
前記入出力データの特徴値を予め定められた基準に基づいて抽出する特徴値抽出手段と、
前記入出力データの特徴値と、前記入出力データ記憶手段に記憶された前記入出力状況データと、に基づいて、前記入出力データを入出力した前記ユーザごとにおける前記入出力データの特徴を表す個人知識データを生成する個人知識データ生成手段と、
を実現するための情報管理用プログラム。 To a computer connected to input / output data storage means for storing input / output data input / output by the user and input / output status data representing the input / output status of the input / output data,
Feature value extracting means for extracting feature values of the input / output data based on a predetermined criterion;
Based on the characteristic value of the input / output data and the input / output status data stored in the input / output data storage unit, the characteristic of the input / output data for each user who has input / output the input / output data is represented. Personal knowledge data generating means for generating personal knowledge data;
Information management program for realizing
前記入出力データに含まれる各用語の出現頻度、出現位置、強調情報のうち少なくとも1つに基づいて特徴値を抽出する前記特徴値抽出手段、を実現するための請求項25記載の情報管理用プログラム。 In the computer,
26. For information management according to claim 25, for realizing the feature value extracting means for extracting a feature value based on at least one of appearance frequency, appearance position, and emphasis information of each term included in the input / output data. program.
前記入出力状況データが前記入出力データの入出力時間を表すデータである場合に、予め定められた期間内に入出力が行われた複数の前記入出力データに基づいて前記個人知識データを生成する前記個人知識データ生成手段、を実現するための請求項25又は26記載の情報管理用プログラム。 In the computer,
When the input / output status data is data representing the input / output time of the input / output data, the personal knowledge data is generated based on a plurality of the input / output data input / output within a predetermined period. 27. The information management program according to claim 25 or 26 for realizing the personal knowledge data generating means.
前記入出力状況データが前記入出力データの入出力の区別を表す入出力区別データである場合に、前記入出力区別データに応じて前記入出力データに重み付けを行って前記個人知識データを生成する前記個人知識データ生成手段、を実現するための請求項25,26又は27記載の情報管理用プログラム。 In the computer,
When the input / output status data is input / output distinction data representing the input / output distinction of the input / output data, the input / output distinction data is weighted to generate the personal knowledge data. 28. The information management program according to claim 25, 26 or 27 for realizing the personal knowledge data generating means.
複数の前記入出力データの特徴値間の類似度を算出する類似度算出手段と、
前記類似度が所定値以上の複数の前記入出力データに対して前記個人知識データの生成を行う前記個人知識データ生成手段と、を実現するための請求項25,26,27又は28記載の情報管理用プログラム。
In the computer,
Similarity calculating means for calculating the similarity between feature values of the plurality of input / output data;
29. Information according to claim 25, 26, 27, or 28, for realizing the personal knowledge data generating means for generating the personal knowledge data for a plurality of the input / output data having a similarity equal to or greater than a predetermined value. Administrative program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004336619A JP2006146621A (en) | 2004-11-19 | 2004-11-19 | Information management device and method, and information management program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004336619A JP2006146621A (en) | 2004-11-19 | 2004-11-19 | Information management device and method, and information management program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006146621A true JP2006146621A (en) | 2006-06-08 |
Family
ID=36626219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004336619A Pending JP2006146621A (en) | 2004-11-19 | 2004-11-19 | Information management device and method, and information management program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006146621A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008117134A (en) * | 2006-11-02 | 2008-05-22 | Nippon Telegr & Teleph Corp <Ntt> | Period extraction device, period extraction method, period extraction program implementing the method, and recording medium storing its program |
JP2017505964A (en) * | 2013-11-27 | 2017-02-23 | 株式会社Nttドコモ | Automatic task classification based on machine learning |
WO2020079748A1 (en) * | 2018-10-16 | 2020-04-23 | 株式会社島津製作所 | Case searching method and case searching system |
US11630824B2 (en) | 2018-10-16 | 2023-04-18 | Shimadzu Corporation | Document search method and document search system |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1153394A (en) * | 1997-07-29 | 1999-02-26 | Just Syst Corp | Device and method for document processing and storage medium storing document processing program |
JPH1166081A (en) * | 1997-08-12 | 1999-03-09 | N T T Data:Kk | Profile acquisition system, information provision system, profile acquiring method and medium |
JP2000293526A (en) * | 1999-04-06 | 2000-10-20 | Ntt Data Corp | Liking information collection system |
JP2001306606A (en) * | 2000-04-24 | 2001-11-02 | Nippon Telegr & Teleph Corp <Ntt> | Communication party selecting method and recording medium with recorded communication party selection processing program |
JP2002140361A (en) * | 2000-10-31 | 2002-05-17 | Hitachi Ltd | Method and device for document retrieval, and storage medium for document retrieving program |
JP2002334106A (en) * | 2001-05-11 | 2002-11-22 | Fujitsu Ltd | Device, method, program for extracting topic and recording medium to record the same program |
JP2003256464A (en) * | 2002-03-01 | 2003-09-12 | Osaka Gas Co Ltd | Display for newly-received contribution information |
JP2003288342A (en) * | 2002-03-28 | 2003-10-10 | Ricoh Co Ltd | Information processor |
JP2004110435A (en) * | 2002-09-18 | 2004-04-08 | Ricoh Co Ltd | Profile generating device and information providing device |
-
2004
- 2004-11-19 JP JP2004336619A patent/JP2006146621A/en active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1153394A (en) * | 1997-07-29 | 1999-02-26 | Just Syst Corp | Device and method for document processing and storage medium storing document processing program |
JPH1166081A (en) * | 1997-08-12 | 1999-03-09 | N T T Data:Kk | Profile acquisition system, information provision system, profile acquiring method and medium |
JP2000293526A (en) * | 1999-04-06 | 2000-10-20 | Ntt Data Corp | Liking information collection system |
JP2001306606A (en) * | 2000-04-24 | 2001-11-02 | Nippon Telegr & Teleph Corp <Ntt> | Communication party selecting method and recording medium with recorded communication party selection processing program |
JP2002140361A (en) * | 2000-10-31 | 2002-05-17 | Hitachi Ltd | Method and device for document retrieval, and storage medium for document retrieving program |
JP2002334106A (en) * | 2001-05-11 | 2002-11-22 | Fujitsu Ltd | Device, method, program for extracting topic and recording medium to record the same program |
JP2003256464A (en) * | 2002-03-01 | 2003-09-12 | Osaka Gas Co Ltd | Display for newly-received contribution information |
JP2003288342A (en) * | 2002-03-28 | 2003-10-10 | Ricoh Co Ltd | Information processor |
JP2004110435A (en) * | 2002-09-18 | 2004-04-08 | Ricoh Co Ltd | Profile generating device and information providing device |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008117134A (en) * | 2006-11-02 | 2008-05-22 | Nippon Telegr & Teleph Corp <Ntt> | Period extraction device, period extraction method, period extraction program implementing the method, and recording medium storing its program |
JP4610543B2 (en) * | 2006-11-02 | 2011-01-12 | 日本電信電話株式会社 | Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program |
JP2017505964A (en) * | 2013-11-27 | 2017-02-23 | 株式会社Nttドコモ | Automatic task classification based on machine learning |
WO2020079748A1 (en) * | 2018-10-16 | 2020-04-23 | 株式会社島津製作所 | Case searching method and case searching system |
WO2020080376A1 (en) * | 2018-10-16 | 2020-04-23 | 株式会社島津製作所 | Case history retrieval method and case history retrieval system |
JPWO2020080376A1 (en) * | 2018-10-16 | 2021-11-04 | 株式会社島津製作所 | Case search method and case search system |
US20220035846A1 (en) * | 2018-10-16 | 2022-02-03 | Shimadzu Corporation | Case search method and case search system |
US11630824B2 (en) | 2018-10-16 | 2023-04-18 | Shimadzu Corporation | Document search method and document search system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8200667B2 (en) | Method and apparatus for constructing user profile using content tag, and method for content recommendation using the constructed user profile | |
JP5454357B2 (en) | Information processing apparatus and method, and program | |
KR101775742B1 (en) | Contextual queries | |
US20090265338A1 (en) | Contextual ranking of keywords using click data | |
US20110047161A1 (en) | Query/Document Topic Category Transition Analysis System and Method and Query Expansion-Based Information Retrieval System and Method | |
US20110060717A1 (en) | Systems and methods for improving web site user experience | |
JP5329540B2 (en) | User-centric information search method, computer-readable recording medium, and user-centric information search system | |
JP6123143B1 (en) | Patent requirement conformity prediction device and patent requirement conformity prediction program | |
KR20090087269A (en) | Method and apparatus for information processing based on context, and computer readable medium thereof | |
JP5952711B2 (en) | Prediction server, program and method for predicting future number of comments in prediction target content | |
Raad et al. | Discovering relationship types between users using profiles and shared photos in a social network | |
JP2017097823A (en) | Search server, terminal equipment, and search method to be used for distributed network | |
JP4879775B2 (en) | Dictionary creation method | |
Kuck et al. | Context-sensitive service discovery meets information retrieval | |
JP2006285526A (en) | Information retrieval according to image data | |
JP2019128925A (en) | Event presentation system and event presentation device | |
JP2006146621A (en) | Information management device and method, and information management program | |
EP4002152A1 (en) | Data tagging and synchronisation system | |
JP4134975B2 (en) | Topic document presentation method, apparatus, and program | |
JPWO2015063873A1 (en) | Information search system and information search method | |
KR101319024B1 (en) | Apparatus and method for searching personalized contents using a mobile terminal | |
CN110147488B (en) | Page content processing method, processing device, computing equipment and storage medium | |
JP2010015394A (en) | Link destination presentation device and computer program | |
JP4900475B2 (en) | Electronic document management apparatus and electronic document management program | |
Garrido et al. | KGNR: A knowledge-based geographical news recommender |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071010 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100608 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101019 |