[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2006146621A - Information management device and method, and information management program - Google Patents

Information management device and method, and information management program Download PDF

Info

Publication number
JP2006146621A
JP2006146621A JP2004336619A JP2004336619A JP2006146621A JP 2006146621 A JP2006146621 A JP 2006146621A JP 2004336619 A JP2004336619 A JP 2004336619A JP 2004336619 A JP2004336619 A JP 2004336619A JP 2006146621 A JP2006146621 A JP 2006146621A
Authority
JP
Japan
Prior art keywords
input
data
output
personal knowledge
output data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004336619A
Other languages
Japanese (ja)
Inventor
Kiyomi Yatabe
清美 矢田部
Shinichi Doi
伸一 土井
Shinichi Ando
真一 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004336619A priority Critical patent/JP2006146621A/en
Publication of JP2006146621A publication Critical patent/JP2006146621A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To easily recognize the state of knowledge of each user. <P>SOLUTION: An information management device includes input/output data storage means 31, 32 for storing input/output data inputted and outputted by users and input/output condition data indicative of the input/output conditions of the input/output data; a feature value extraction means 22 for extracting feature values based on the predetermined standard of the input/output data; and an individual knowledge data creation means 23 for creating, based on the feature value of the input/output data and the input/output condition data, individual knowledge data indicative of the feature of the input/output data for each of the users who inputted or outputted the input/output data. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、情報管理装置にかかり、特に、ユーザによる入出力データを、特徴付けてユーザごとに管理する情報管理装置に関する。また、情報管理方法及び情報管理用プログラムに関する。   The present invention relates to an information management apparatus, and more particularly to an information management apparatus that characterizes input / output data by a user and manages it for each user. The present invention also relates to an information management method and an information management program.

近年、大量の情報が供給される中で、個人が所望の情報を簡単に検索したり配信されて受け取ったりすることや(情報検索や情報配信)、所望の知識をもった専門家を検索すること(専門家検索)、などの要求が高まっている。   In recent years, with a large amount of information being supplied, individuals can easily search for or receive desired information (information search and information distribution), and search for experts with the desired knowledge. (Expert search), etc. are increasing.

一方で、個人の情報の入出力が電子文書や電子メール、電子画像などの電子情報としてコンピュータ上で行われることが多くなり、個人の入出力情報をその個人の関心事や専門知識として保存することが可能になってきている。   On the other hand, personal information is often input / output on a computer as electronic information such as electronic documents, e-mails, and electronic images, and personal input / output information is stored as personal interests and expertise. It is becoming possible.

ここで、入出力情報とは、例えば、コピーや閲覧した入力情報と、作成や編集した出力情報を指す。こうした個人の現在までの入出力情報を利用して検索や配信に活用するという従来技術が提案されている。それらの従来技術には以下のものがある。例えば、(1)各個人の入出力情報を蓄積して、後に情報検索、専門家検索に活用するナレッジマネージメントサービスや、(2)個人の情報の入出力を保存して、その個人にあった情報提供を可能とする情報配信パーソナライゼーション、リコメンデーションサービス(例えば特許文献1)である。   Here, the input / output information refers to, for example, input information that has been copied or browsed and output information that has been created or edited. Conventional techniques have been proposed in which such input / output information of an individual is used for search and distribution. These prior arts include the following. For example, (1) Knowledge management service that accumulates input / output information of each individual and later uses it for information search and expert search, and (2) Stores input / output of personal information, and was in that individual Information distribution personalization and recommendation service (for example, Patent Document 1) enabling information provision.

特開2001−175676号公報JP 2001-175676 A

しかし、上記従来例の第1の問題点として、古いデータはデータベースに埋もれてしまい、検索することが困難となってしまう、という問題が生じる。すなわち、通常、個人の関心事や専門知識は時期に応じて移り変わり、個人は時間の経過とともに複数の関心事や専門知識をもつものであるが、従来の方法では、過去から現在までの期間全体ではそれほど顕著ではないが、過去のある時期だけに取り扱ったテーマのように、過去のある期間に集中的に入出力した情報から抽出される個人の関心事や専門知識が全体に埋もれてしまい、抽出することが困難となってしまう。   However, as a first problem of the above-described conventional example, there arises a problem that old data is buried in a database and it is difficult to search. In other words, individual interests and expertise usually change over time, and individuals have multiple interests and expertise over time, but conventional methods use the entire period from the past to the present. Although it is not so noticeable, personal interests and expertise extracted from information intensively input and output during a certain past period, such as themes handled only in a certain past period, are buried in the whole, It becomes difficult to extract.

上記状況を、図21を参照しながら説明する。図21の実線(横線)は、ある個人Pが時間t(横軸)上の特定の期間に、特定の関心事や専門知識にかかわる活動をしていたことを表している。例えば、図21内の最上段に位置する三本の実線(横線)は、個人Pが時間t1〜t2と、t3〜t5と、t7〜t9との期間に関心事や専門知識aにかかわる活動をしていたことを表している。同様に図21内のその他の下の二本の実線(横線)は、個人Pが時間t2〜t4の期間に関心事や専門知識bにかかわる活動をし、時間t6〜t8の期間に関心事や専門知識cにかかわる活動をしていたことを表している。   The above situation will be described with reference to FIG. A solid line (horizontal line) in FIG. 21 indicates that a certain individual P was engaged in an activity related to a specific interest or expertise in a specific period on time t (horizontal axis). For example, the three solid lines (horizontal lines) located at the top in FIG. 21 indicate that the individual P is involved in the interests and expertise a during the period from time t1 to t2, t3 to t5, and t7 to t9. It means that he was doing. Similarly, two lower solid lines (horizontal lines) in FIG. 21 indicate that the individual P is engaged in activities related to interests and expertise b in the period from time t2 to t4, and is interested in the period from time t6 to t8. And activities related to expertise c.

そして、上述した従来例では、入出力情報全体から一つの個人の関心事や専門知識を抽出しているため、個人の関心事や専門知識aのみが抽出でき、過去のある時期に集中的に取り扱った関心事や専門知識bやcが抽出できない、という問題が生じる。また、同様に、従来例では、時間的に古い入出力情報からは個人の関心事や専門知識の抽出を困難にしているため、過去のあるときに集中的に入出力した情報でも、現在の時点から遠く離れている情報は、抽出されにくい。その結果、全体を通じて多く取り扱ったaや最近集中的に取り扱ったcは抽出できるが、cよりも古く過去のある時期に集中的に取り扱った関心事や専門知識bが抽出できない、という問題が生じる。   In the conventional example described above, since one individual's interests and expertise are extracted from the entire input / output information, only the individual interests and expertise a can be extracted and concentrated on a certain period in the past. There arises a problem that the handled interests and expertise b and c cannot be extracted. Similarly, in the conventional example, it is difficult to extract personal interests and expertise from input / output information that is old in time. Information that is far away from the time is difficult to extract. As a result, although a that has been dealt with a lot throughout and c that has recently been handled intensively can be extracted, there is a problem that interests and expertise b that are older than c and that have been handled intensively at a certain time in the past cannot be extracted. .

また、従来例の第2の問題点として、個人の関心事や専門知識を正確に抽出することが困難となる、という問題が生じる。それは、個人が見ただけなのかそれとも深く理解したのかを区別せず、個人の情報の入出力全体からその個人の関心事や専門知識を抽出しているためである。さらに詳述すると、情報をコピー・閲覧しただけなのか、それとも作成・編集するほど自分の高い関心事や専門知識として扱ったのか、を区別せず、それら混在した両方から特徴を抽出しているためである。   Further, as a second problem of the conventional example, there arises a problem that it becomes difficult to accurately extract personal interests and expertise. This is because the individual's interests and expertise are extracted from the entire input / output of personal information without distinguishing whether the individual has just seen or deeply understood. To elaborate further, we do not distinguish between whether the information was just copied / viewed or whether it was treated as a high level of interest or expertise so that it could be created / edited, and features were extracted from both of them. Because.

このため、本発明は、個人の入出力状況に応じたデータ管理を行うことで、各ユーザの知識状態を容易に認識可能とし、これにより、あらゆる情報検索の容易化を図る、ことをその目的とする。具体的には、上記の第1の問題点に対応して、時間情報を用いて個人の期間ごとの関心事や専門知識を抽出することで、過去のある時期だけに取り扱ったテーマのように、過去のある期間に集中的に入出力した情報から抽出される個人の関心事や専門知識を検索することができるようにすることを目的とする。また、上記の第2の問題点に対応して、個人が見ただけなのかそれとも深く理解したのか、個人の関心事や専門知識を正確に抽出することを目的とする。   Therefore, the object of the present invention is to make it possible to easily recognize the knowledge state of each user by performing data management in accordance with the personal input / output status, thereby facilitating all information retrieval. And Specifically, in response to the first problem described above, by extracting the interests and specialized knowledge of each individual period using time information, it looks like a theme handled only at a certain time in the past An object is to make it possible to search for personal interests and expertise extracted from information intensively input and output during a past period. Another object of the present invention is to accurately extract the interests and expertise of an individual, whether they have only seen it or understood it deeply in response to the second problem.

そこで、本発明の一形態である情報管理装置は、
ユーザにて入出力される入出力データと、この入出力データの入出力状況を表す入出力状況データと、を記憶する入出力データ記憶手段と、
入出力データの予め定められた基準に基づく特徴値を抽出する特徴値抽出手段と、
入出力データの特徴値と入出力状況データとに基づいて、入出力データを入出力したユーザごとにおける入出力データの特徴を表す個人知識データを生成する個人知識データ生成手段と、
を備えたことを特徴としている。
Therefore, an information management apparatus according to one aspect of the present invention is
Input / output data storage means for storing input / output data input / output by the user and input / output status data representing the input / output status of the input / output data;
Feature value extraction means for extracting feature values based on predetermined criteria of input / output data;
Personal knowledge data generating means for generating personal knowledge data representing the characteristics of the input / output data for each user who has input / output the input / output data based on the feature values of the input / output data and the input / output status data;
It is characterized by having.

これにより、ユーザごとの入出力状況に応じて入出力データの特徴を表す個人知識データが生成されるため、各ユーザの知識状態を容易に認識可能となり、的確な情報の検索を実現できる。   As a result, personal knowledge data representing the characteristics of the input / output data is generated according to the input / output status of each user, so that the knowledge state of each user can be easily recognized, and accurate information search can be realized.

また、特徴値抽出手段は、入出力データに含まれる各用語の出現頻度、出現位置、強調情報のうち、少なくとも1つに基づいて特徴値を抽出する、ことを特徴としている。これにより、ユーザごとの個人知識データが入出力された用語の頻度等に応じて生成されるため、より明確に各ユーザの知識状態を認識することができる。   The feature value extracting means is characterized in that the feature value is extracted based on at least one of the appearance frequency, appearance position, and emphasis information of each term included in the input / output data. Thereby, since personal knowledge data for each user is generated according to the frequency of input / output terms, the knowledge state of each user can be recognized more clearly.

また、入出力状況データは、入出力データが入出力された時間を表すデータである、ことを特徴としている。そして、このとき、個人知識データ生成手段は、予め定められた期間内に入出力が行われた複数の入出力データに基づいて個人知識データを生成する、ことを特徴としている。これにより、入出力データの入出力時期ごとに個人知識データを生成することができ、時期ごとの各ユーザの知識状態を認識することができる。従って、情報の新旧を意識せずに、検索が可能となる。   In addition, the input / output status data is data representing the time when the input / output data was input / output. At this time, the personal knowledge data generating means generates personal knowledge data based on a plurality of input / output data that are input / output within a predetermined period. Thereby, personal knowledge data can be generated for each input / output time of the input / output data, and the knowledge state of each user for each time can be recognized. Therefore, it is possible to search without being conscious of new and old information.

また、入出力状況データは、入出力データの入出力の区別を表す入出力区別データである、ことを特徴としている。このとき、個人知識データ生成手段は、入出力区別データに応じて入出力データに重み付けを行って個人知識データを生成する、ことを特徴としている。さらに、このとき、個人知識データ生成手段は、入出力データのうち出力データに対して入力データよりも高い重み付けを行う、ことを特徴としている。また、入出力状況データは、入出力データにおける他のデータの参照状況を表す参照状況データである、ことを特徴としている。このとき、個人知識データ生成手段は、参照状況データに応じて入出力データに重み付けを行って個人知識データを生成する、ことを特徴としている。特に、重み付けは、入出力データのうち所定のデータの参照先となるデータに対して重み付けを行う、ことを特徴としている。これにより、入出力データの入出力の区別、あるいは、参照状態に応じて、ユーザごとの個人知識データの特徴が生成されるため、より個人の知識状態を反映して生成することができ、より的確な情報検索が可能となる。   The input / output status data is input / output distinction data representing input / output distinction of the input / output data. At this time, the personal knowledge data generating means generates the personal knowledge data by weighting the input / output data according to the input / output distinction data. Further, at this time, the personal knowledge data generating means is characterized in that the output data of the input / output data is weighted higher than the input data. Further, the input / output status data is reference status data representing a reference status of other data in the input / output data. At this time, the personal knowledge data generating means generates the personal knowledge data by weighting the input / output data according to the reference situation data. In particular, the weighting is characterized in that weighting is performed on data serving as a reference destination of predetermined data among input / output data. As a result, the characteristics of the personal knowledge data for each user are generated according to the input / output distinction of the input / output data or the reference state, so that it can be generated more reflecting the individual knowledge state. Accurate information search is possible.

また、複数の入出力データの特徴値間の類似度を算出する類似度算出手段を備え、個人知識データ生成手段は、類似度が所定値以上の複数の入出力データに対して個人知識データの生成を行う、ことを特徴としている。これにより、互いに特徴が類似する入出力データに対する個人知識データを生成することができ、同類のデータ群にまとめて個人知識データを生成でき、より個人の特徴を反映することができる。   In addition, a similarity calculation unit that calculates a similarity between feature values of a plurality of input / output data is provided, and the personal knowledge data generation unit is configured to store personal knowledge data for a plurality of input / output data having a similarity equal to or greater than a predetermined value. It is characterized by generating. As a result, personal knowledge data for input / output data having similar characteristics can be generated, and personal knowledge data can be generated in a group of similar data, and more personal characteristics can be reflected.

さらに、上記構成に加え、個人知識データ生成手段にて生成された個人知識データを蓄積する情報蓄積手段を備えた、ことを特徴としている。そして、他のユーザから入出力データに対応するデータを含む検索要求データを受け付けて、当該検索要求データに基づいて情報蓄積手段に記憶された個人知識データを検索する検索手段を備えた、ことを特徴としている。このとき、検索手段は、検索した個人知識データに予め定められた基準にて類似する他の個人知識データを検索する、ことを特徴としている。また、上記構成に加え、検索手段にて検索した個人知識データを出力する検索情報出力手段を備えた、ことを特徴としている。また、検索手段にて検索した個人知識データに対応する入出力データを、入出力データ記憶手段から読み出して出力する検索情報出力手段を備えた、ことを特徴としている。さらに、検索手段にて検索した個人知識データに対応するユーザを特定するユーザ特定情報を出力する検索情報出力手段を備えた、ことを特徴としている。これにより、個人ごとの入出力データの特徴に基づいて情報の検索を行うことができ、より的確な情報の検索を行うことができる。   Further, in addition to the above configuration, the information storage means for storing the personal knowledge data generated by the personal knowledge data generating means is provided. And a search means for receiving search request data including data corresponding to the input / output data from another user and searching the personal knowledge data stored in the information storage means based on the search request data. It is a feature. At this time, the search means is characterized in that it searches for other personal knowledge data similar to the searched personal knowledge data based on a predetermined criterion. Further, in addition to the above configuration, a search information output means for outputting personal knowledge data searched by the search means is provided. Further, the present invention is characterized in that it includes search information output means for reading out and outputting input / output data corresponding to the personal knowledge data searched by the search means from the input / output data storage means. Further, the present invention is characterized in that search information output means for outputting user specifying information for specifying a user corresponding to the personal knowledge data searched by the search means is provided. Accordingly, information can be searched based on the characteristics of input / output data for each individual, and more accurate information can be searched.

また、本発明の他の形態である情報管理方法は、
ユーザにて入出力された入出力データと、この入出力データの入出力状況を表す入出力状況データと、を記憶する入出力データ記憶手段に接続されたコンピュータが実行する情報管理方法であって、
入出力データの特徴値を予め定められた基準に基づいて抽出する特徴値抽出工程と、
入出力データの特徴値と、入出力データ記憶手段に記憶された入出力状況データと、に基づいて、入出力データを入出力したユーザごとにおける入出力データの特徴を表す個人知識データを生成する個人知識データ生成工程と、
を有することを特徴としている。
In addition, an information management method according to another aspect of the present invention includes:
An information management method executed by a computer connected to input / output data storage means for storing input / output data input / output by a user and input / output status data representing the input / output status of the input / output data. ,
A feature value extraction step of extracting feature values of the input / output data based on a predetermined criterion;
Based on the characteristic value of the input / output data and the input / output status data stored in the input / output data storage means, personal knowledge data representing the characteristics of the input / output data for each user who has input / output the input / output data is generated. Personal knowledge data generation process,
It is characterized by having.

そして、特徴値抽出工程は、入出力データに含まれる各用語の出現頻度、出現位置、強調情報のうち、少なくとも1つに基づいて特徴値を抽出する、ことを特徴としている。   The feature value extraction step is characterized in that feature values are extracted based on at least one of the appearance frequency, appearance position, and emphasis information of each term included in the input / output data.

また、入出力状況データは、入出力データが入出力された時間を表すデータであり、
個人知識データ生成工程は、予め定められた期間内に入出力が行われた複数の入出力データに基づいて個人知識データを生成する、ことを特徴としている。
The input / output status data is data representing the time when the input / output data was input / output.
The personal knowledge data generating step is characterized in that personal knowledge data is generated based on a plurality of input / output data input / output within a predetermined period.

また、入出力状況データは、入出力データの入出力の区別を表す入出力区別データであり、
個人知識データ生成工程は、入出力区別データに応じて入出力データに重み付けを行って個人知識データを生成する、ことを特徴としている。
The input / output status data is input / output distinction data indicating the input / output distinction of the input / output data.
The personal knowledge data generation step is characterized in that the personal knowledge data is generated by weighting the input / output data according to the input / output distinction data.

さらに、個人知識データ生成工程は、複数の入出力データの特徴値間の類似度を算出すると共に、当該類似度が所定値以上の複数の入出力データに対して個人知識データの生成を行う、ことを特徴としている。   Furthermore, the personal knowledge data generation step calculates similarity between feature values of a plurality of input / output data, and generates personal knowledge data for a plurality of input / output data having the similarity equal to or higher than a predetermined value. It is characterized by that.

また、本発明の他の形態である情報管理用プログラムは、
ユーザにて入出力された入出力データと、この入出力データの入出力状況を表す入出力状況データと、を記憶する入出力データ記憶手段に接続されたコンピュータに、
入出力データの特徴値を予め定められた基準に基づいて抽出する特徴値抽出手段と、
入出力データの特徴値と、入出力データ記憶手段に記憶された入出力状況データと、に基づいて、入出力データを入出力したユーザごとにおける入出力データの特徴を表す個人知識データを生成する個人知識データ生成手段と、
を実現するための情報管理用プログラム、という構成を採っている。
An information management program according to another aspect of the present invention is
To a computer connected to input / output data storage means for storing input / output data input / output by the user and input / output status data representing the input / output status of the input / output data,
Feature value extraction means for extracting feature values of the input / output data based on a predetermined criterion;
Based on the characteristic value of the input / output data and the input / output status data stored in the input / output data storage means, personal knowledge data representing the characteristics of the input / output data for each user who has input / output the input / output data is generated. Personal knowledge data generation means;
It adopts the configuration of an information management program for realizing the above.

そして、コンピュータに、入出力データに含まれる各用語の出現頻度、出現位置、強調情報のうち、少なくとも1つに基づいて特徴値を抽出する特徴値抽出手段、を実現するための情報管理用プログラムでもある。   An information management program for realizing, on the computer, feature value extraction means for extracting a feature value based on at least one of the appearance frequency, appearance position, and emphasis information of each term included in the input / output data But there is.

また、コンピュータに、
入出力状況データが入出力データの入出力時間を表すデータである場合に、予め定められた期間内に入出力が行われた複数の入出力データに基づいて個人知識データを生成する個人知識データ生成手段、を実現するための情報管理用プログラムでもある。
Also on the computer,
Personal knowledge data for generating personal knowledge data based on a plurality of input / output data input / output within a predetermined period when the input / output status data is data representing the input / output time of the input / output data. It is also an information management program for realizing the generation means.

また、コンピュータに、
入出力状況データが入出力データの入出力の区別を表す入出力区別データである場合に、入出力区別データに応じて入出力データに重み付けを行って個人知識データを生成する個人知識データ生成手段、を実現するための情報管理用プログラムでもある。
Also on the computer,
Personal knowledge data generating means for generating personal knowledge data by weighting the input / output data according to the input / output distinction data when the input / output status data is input / output distinction data representing the input / output distinction of the input / output data It is also an information management program for realizing.

さらに、コンピュータに、
複数の入出力データの特徴値間の類似度を算出する類似度算出手段と、
類似度が所定値以上の複数の入出力データに対して個人知識データの生成を行う個人知識データ生成手段と、を実現するための情報管理用プログラムでもある。
In addition,
Similarity calculation means for calculating the similarity between feature values of a plurality of input / output data;
It is also an information management program for realizing personal knowledge data generating means for generating personal knowledge data for a plurality of input / output data having a similarity equal to or greater than a predetermined value.

上記構成の情報管理方法及び情報管理用プログラムであっても、上述した情報管理装置と同様に作用するため、上記目的を達成することができる。   Even the information management method and the information management program having the above-described configuration operate in the same manner as the information management apparatus described above, and thus the above-described object can be achieved.

本発明は、上述したように構成され機能するので、これによると、ユーザによる入出力データの履歴を、ユーザごとの入出力状況に応じて入出力データの特徴を表す個人知識データとして生成しておくことができるため、各ユーザの知識状態を容易に認識することが可能となり、かかる個人知識データを管理することで、容易かつ的確な情報検索を実現できる、という従来にない優れた効果を有する。   Since the present invention is configured and functions as described above, according to this, the history of input / output data by the user is generated as personal knowledge data representing the characteristics of the input / output data according to the input / output situation for each user. Therefore, it is possible to easily recognize the knowledge status of each user, and it is possible to easily and accurately search information by managing such personal knowledge data. .

本発明は、ユーザによって入出力された個人の関心事や専門知識である入出力データを、後に容易に検索可能なよう蓄積管理する情報管理装置である。このため、本発明は、入出力データの特徴を表す個人知識データを入出力状況に応じて生成し、これを管理することに特徴を有する。   The present invention is an information management apparatus for accumulating and managing input / output data, which are personal interests and expertise input / output by a user, so that it can be easily retrieved later. For this reason, the present invention is characterized in that personal knowledge data representing the characteristics of input / output data is generated according to the input / output situation and managed.

以下、実施例1では、入出力状況の一例として入出力時期を挙げ、入出力が行われた期間ごとに入出力データを区切って管理する情報管理装置を説明する。また、実施例2では、入出力状況の他の例として入出力の区別を挙げ、入出力の相違や他の参照の有無に応じた特徴を生成して管理する情報管理装置を説明する。また、実施例3では、上記期間と入出力区別とを組み合わせた場合を説明する。   In the following, in the first embodiment, an input / output time is given as an example of an input / output state, and an information management apparatus that manages by dividing input / output data for each period during which input / output is performed will be described. In the second embodiment, an input / output distinction is given as another example of the input / output situation, and an information management apparatus that generates and manages features according to input / output differences and the presence or absence of other references will be described. In the third embodiment, a case where the above period and input / output distinction are combined will be described.

本発明の第1の実施例を、図1乃至図12を参照して説明する。図1は、本発明の全体構成を示すブロック図である。図2は、情報管理装置の構成を示す機能ブロック図である。図3乃至図5は、情報管理装置における情報処理の様子を示す説明図である。図6乃至図12は、情報管理装置の動作を示すフローチャートである。   A first embodiment of the present invention will be described with reference to FIGS. FIG. 1 is a block diagram showing the overall configuration of the present invention. FIG. 2 is a functional block diagram showing the configuration of the information management apparatus. 3 to 5 are explanatory diagrams showing the state of information processing in the information management apparatus. 6 to 12 are flowcharts showing the operation of the information management apparatus.

[構成]
本発明は、ユーザにて入出力されるデータを管理する情報管理装置2であって、サーバコンピュータなどの情報処理装置にて構成されている。そして、この情報管理装置2に対してデータの登録や閲覧など、データの入出力を行うユーザA,B,Cが操作するコンピュータであるユーザ端末11,12,13に、ネットワークNを介して接続されている。また、この情報管理装置2に対してデータの検索要求を行うユーザDの操作するコンピュータであるユーザ端末14にもネットワークNを介して接続されている。
[Constitution]
The present invention is an information management apparatus 2 that manages data input and output by a user, and is configured by an information processing apparatus such as a server computer. Then, it is connected via a network N to user terminals 11, 12, and 13 which are computers operated by users A, B, and C that input and output data such as data registration and browsing with respect to the information management apparatus 2. Has been. Further, a user terminal 14 which is a computer operated by a user D who makes a data search request to the information management apparatus 2 is also connected via the network N.

なお、情報管理装置2は、必ずしも一台のコンピュータにて構成されていることに限定されず、複数台のコンピュータにて構成されていてもよい。また、データの入出力や検索は、上記ユーザ端末11,12,13,14によって行われることに限定されず、情報管理装置2自体をユーザが操作することによって行われてもよい。また、「ユーザ」とは、個人であることに限定されず、複数の主体からなる組織やグループを指してもよい。以下、情報管理装置2の具体的な構成について説明する。   Note that the information management apparatus 2 is not necessarily configured by a single computer, and may be configured by a plurality of computers. Data input / output and search are not limited to being performed by the user terminals 11, 12, 13, and 14, but may be performed by a user operating the information management apparatus 2 itself. Further, the “user” is not limited to being an individual, and may refer to an organization or group composed of a plurality of subjects. Hereinafter, a specific configuration of the information management apparatus 2 will be described.

情報管理装置2は、情報の演算処理を行う演算部20と、情報を記憶する記憶部30とを備えており、演算部20には、情報管理用プログラムが組み込まれることで、図2に示すように、データ入力処理部21と、特徴値抽出処理部22と、個人知識生成処理部23と、が構築されており、ユーザ端末11,12,13による入出力データを、その特徴に基づいて管理する機能を有する。さらに、演算部20には、上記プログラムが組み込まれることで、検索要求受付処理部24と、検索処理部25と、検索結果出力処理部26と、が構築されており、ユーザ端末14からのデータの検索要求に応じて検索処理を行う機能を有する。また、これに応じて、記憶部30には、入出力データ記憶部31と、時間データ記憶部32と、期間設定データ記憶部33と、個人知識データ記憶部34と、が形成されている。以下、各処理部21〜26、及び、各記憶部31〜34について詳述する。   The information management device 2 includes a calculation unit 20 that performs calculation processing of information and a storage unit 30 that stores information. The calculation unit 20 incorporates an information management program, which is shown in FIG. Thus, the data input processing unit 21, the feature value extraction processing unit 22, and the personal knowledge generation processing unit 23 are constructed, and input / output data by the user terminals 11, 12, and 13 are based on the features. Has the function to manage. Further, the calculation unit 20 includes the above-described program, so that a search request reception processing unit 24, a search processing unit 25, and a search result output processing unit 26 are constructed. Has a function of performing a search process in response to the search request. In response to this, the storage unit 30 includes an input / output data storage unit 31, a time data storage unit 32, a period setting data storage unit 33, and a personal knowledge data storage unit 34. Hereinafter, the processing units 21 to 26 and the storage units 31 to 34 will be described in detail.

上記データ入出力処理部21は、ユーザがユーザ端末11,12,13を介して情報管理装置2に入出力した入出力データと、当該ユーザが入出力した時間を表す時間データと、を受け付けて、記憶部30内の入出力データ記憶部31と時間データ記憶部32とに(入出力データ記憶手段)それぞれ記憶する機能を有する。ここで、時間データとは、例えば、ユーザが入出力データにアクセスした時間、あるいは、入出力データを更新した時間を表す。また、入出力データは、あらかじめ情報管理装置2の記憶部に格納済みのデータである。従って、かかる場合には、時間データとは、ユーザが入出力データを記憶部30に保存した時間を指す。なお、ユーザにて入出力されるデータとは、他のコンピュータの記憶部に対して入出力されるデータであってもよい。その場合には、かかる入出力状態を情報管理装置2が監視して、入出力データと時間データとを記憶するよう作動する。また、入出力データは、ユーザの関心事や専門知識を表すデータであり、後述するように、個人知識として抽出・蓄積・共有される。   The data input / output processing unit 21 receives input / output data input / output by the user to / from the information management apparatus 2 via the user terminals 11, 12, and 13 and time data representing the time input / output by the user. The input / output data storage unit 31 and the time data storage unit 32 (input / output data storage unit) in the storage unit 30 have a function of storing each. Here, the time data represents, for example, the time when the user accesses the input / output data or the time when the input / output data is updated. The input / output data is data that has been stored in the storage unit of the information management apparatus 2 in advance. Therefore, in such a case, the time data refers to the time when the user saved the input / output data in the storage unit 30. The data input / output by the user may be data input / output to / from a storage unit of another computer. In that case, the information management device 2 monitors such an input / output state and operates to store the input / output data and the time data. The input / output data is data representing the interests and expertise of the user, and is extracted, stored, and shared as personal knowledge, as will be described later.

そして、上述したようにして入出力データと時間データとが記憶されたときの様子を、図3、図4を参照して説明する。例えば、ユーザAが、プログラミング言語「C++」に関心を持ち知識を身に付けるために文書を読んだりした場合には、ユーザAがユーザ端末11を介して入出力したデータを、随時、記憶部30の入出力データ記憶部31に保存する。また、同時に、ユーザAが入出力データを入出力した時間データ(時間情報)を記憶部30の時間データ記憶部32に保存する。すると、図3に示すように、ユーザAによる入出力データは、当該入出力データのIDと、入出力時間とが関連付けられて記憶されることとなる。そして、入出力データとしては、後述するように、図4に示す「C++」や、「ライブラリ」、「クラス」、「変数」などがある。   The state when the input / output data and the time data are stored as described above will be described with reference to FIGS. For example, when the user A is interested in the programming language “C ++” and reads a document to acquire knowledge, the data input / output by the user A via the user terminal 11 is stored as needed. The data is stored in the 30 input / output data storage unit 31. At the same time, the time data (time information) when the user A inputs / outputs the input / output data is stored in the time data storage unit 32 of the storage unit 30. Then, as shown in FIG. 3, the input / output data by the user A is stored in association with the ID of the input / output data and the input / output time. The input / output data includes “C ++”, “library”, “class”, “variable” and the like shown in FIG. 4 as described later.

次に、特徴値抽出処理部22(特徴値抽出手段)について説明する。特徴値抽出処理部22は、入出力データの特徴値を算出するよう作動する。このとき、特徴値の算出ルール(基準)は予め設定されており、かかる処理部22に組み込まれている。以下、特徴値抽出の一例を説明する。ここでは、入出力データがテキスト情報であるものとし、かかるテキスト情報に含まれる各用語の出現頻度に基づいて特徴値を抽出するものとする。   Next, the feature value extraction processing unit 22 (feature value extraction means) will be described. The feature value extraction processing unit 22 operates to calculate the feature value of the input / output data. At this time, the feature value calculation rule (reference) is set in advance and incorporated in the processing unit 22. Hereinafter, an example of feature value extraction will be described. Here, the input / output data is assumed to be text information, and the feature value is extracted based on the appearance frequency of each term included in the text information.

特徴値抽出処理部22は、記憶部30の入出力データ記憶部31に保存されているユーザAが入出力したデータを読み出し、そのデータの解析を行う。このとき、解析単位は任意でよく、1ファイルといった情報単位でなくてもよい。そして、解析方法は、例えば、ある期間の入出力データAj(j>=1)がテキスト情報であった場合、公知の技術であるTF/IDF手法を用いて重み付けを行い、特徴単語(用語)を抽出することにより行う。さらに具体的には、各入出力データAjから形態素解析処理によって単語を抽出し、抽出された単語の中から、名詞、動詞、形容詞などの内容語の出現頻度をカウントし、内容語の各入出力データでの出現頻度を用いて内容語のTF/IDF値を計算する。そして、TF/IDF値の上位N位の特徴単語とTF/IDF値を、その入出力データの特徴量とする。なお、TF/IDF手法については、文献「Sparck
Jones, Karen. (1972). A statistical interpretation of term specificity and its
application in retrieval. Journal of Documentation 28: 11-21.」他に記述があり、周知であるため詳細な説明は省略する。
The feature value extraction processing unit 22 reads data input / output by the user A stored in the input / output data storage unit 31 of the storage unit 30 and analyzes the data. At this time, the analysis unit may be arbitrary and may not be an information unit such as one file. For example, when the input / output data Aj (j> = 1) for a certain period is text information, the analysis method performs weighting using a TF / IDF technique, which is a well-known technique, and features words (terms). This is done by extracting More specifically, words are extracted from each input / output data Aj by morphological analysis processing, and the frequency of appearance of content words such as nouns, verbs, and adjectives is counted from the extracted words, and each content word is input. The TF / IDF value of the content word is calculated using the appearance frequency in the output data. Then, the top N feature words of the TF / IDF value and the TF / IDF value are used as the feature amount of the input / output data. For the TF / IDF method, refer to the document “Sparck”.
Jones, Karen. (1972). A statistical interpretation of term specificity and its
Journal of Documentation 28: 11-21 "and so on, and is well known, so detailed explanation is omitted.

なお、上記では、入出力データがテキスト情報である場合を説明したが、入力データはこれに限定されず、例えば、テキスト情報の他、注釈の付与された画像情報や音声情報であってもよい。また、特徴値の抽出方法は上記方法に限定されず、入出力データに含まれる各用語の出現位置、フォント情報や韻律情報といった強調情報に基づいて特徴値を抽出してもよい。そして、これらを組み合わせて特徴値を抽出してもよい。   In the above description, the case where the input / output data is text information has been described. However, the input data is not limited thereto, and may be, for example, text information, annotated image information or audio information. . The feature value extraction method is not limited to the above method, and the feature value may be extracted based on the appearance position of each term included in the input / output data, emphasis information such as font information and prosodic information. And you may extract a feature value combining these.

ここで、特徴値抽出処理22の結果の一例を、図4乃至図5(a)に示す。図4では、入出力データIDがA3である入出力データを形態素解析し、名詞、動詞、形容詞といった内容語を抽出し、その他の入出力情報での内容語の頻度と比較してTF/IDF値を計算した結果、上位4位の特徴単語「C++」、「ライブラリ」、「クラス」、「変数」と、そのTF/IDF値を、特徴値として抽出した例である。そして、図5(a)には、各時間における入出力データA1〜Ajを特徴値で表示した例を示している。   Here, an example of the result of the feature value extraction process 22 is shown in FIGS. In FIG. 4, morphological analysis is performed on input / output data whose input / output data ID is A3, content words such as nouns, verbs, and adjectives are extracted, and compared with the frequency of content words in other input / output information, TF / IDF In this example, the top four feature words “C ++”, “library”, “class”, “variable” and their TF / IDF values are extracted as feature values. FIG. 5A shows an example in which input / output data A1 to Aj at each time are displayed as feature values.

次に、個人知識生成処理部23(個人知識データ生成手段)について説明する。個人知識生成処理部23は、上記入出力データの特徴値から、入出力状況データである時間データに基づいて、入出力データを入出力したユーザごとにおける入出力データの特徴を表す個人知識データを生成するよう作動する。そして、本実施例では、特に、入出力の時間の近接性が高い複数の入出力データの特徴を計算することにより、ユーザ個人の入出力データの特徴を表す個人知識データを作成する。   Next, the personal knowledge generation processing unit 23 (personal knowledge data generation means) will be described. The personal knowledge generation processing unit 23 obtains personal knowledge data representing the characteristics of the input / output data for each user who has input / output the input / output data, based on the time data which is the input / output status data, from the feature values of the input / output data. Operates to generate. In this embodiment, personal knowledge data representing the characteristics of individual user input / output data is created by calculating the characteristics of a plurality of input / output data that are particularly close in input / output time.

さらに、個人知識生成処理部23について具体的に説明すると、まず、期間設定データ記憶部33に記憶された期間設定データを読み出す。この期間設定データとは、例えば、時間的に近接する複数の入出力データを一期間内のデータとして設定するデータであったり、所定時間内の入出力データを1つの期間として設定するデータであるなど、所定の期間を設定する基準となるデータである。そして、この期間設定データに基づいて期間を設定するが、本実施例では、図5(a)に示すA1〜A3の期間を特定の期間At1として設定する。そして、かかる期間内の入出力データの特徴値から、さらに特徴を表す個人知識データを生成する。例えば、各入出力データの上位N位の特徴単語のTF/IDF値をそれぞれ特徴単語ベクトルとし、その和を生成する。そして、生成されたデータを、図5(b)に示すように個人知識データとする。その後は、別の期間における個人知識データも作成し、さらには、ユーザB,Cによる入出力データに対しても個人知識データの作成を行う。また、個人知識生成処理部23は、上述したように生成した個人知識データを、個人知識データ記憶部34(情報蓄積手段)に保存する。   Further, the personal knowledge generation processing unit 23 will be specifically described. First, the period setting data stored in the period setting data storage unit 33 is read. The period setting data is, for example, data that sets a plurality of input / output data that are close in time as data within one period, or data that sets input / output data within a predetermined time as one period. For example, it is data serving as a reference for setting a predetermined period. The period is set based on the period setting data. In this embodiment, the period A1 to A3 shown in FIG. 5A is set as the specific period At1. Then, personal knowledge data representing further features is generated from the feature values of the input / output data within the period. For example, the TF / IDF values of the top N feature words of each input / output data are used as feature word vectors, and the sum is generated. And let the produced | generated data be personal knowledge data, as shown in FIG.5 (b). Thereafter, personal knowledge data for another period is also created, and personal knowledge data is also created for input / output data by the users B and C. The personal knowledge generation processing unit 23 stores the personal knowledge data generated as described above in the personal knowledge data storage unit 34 (information storage unit).

ここで、個人知識生成処理部23による個人識別データの生成方法は、上述したものに限定されない。例えば、入出力データの特徴値である特徴単語とそのTF/IDF値を一定時間内で合計し、平均をとることにより、個人識別データを生成してもよい。また、期間の設定も上述したものに限定されず、さらには、期間は一定の時間でなく動的であってもよい。   Here, the method of generating personal identification data by the personal knowledge generation processing unit 23 is not limited to the above-described method. For example, the personal identification data may be generated by adding the feature words that are the feature values of the input / output data and their TF / IDF values within a predetermined time and taking the average. Further, the setting of the period is not limited to that described above, and the period may be dynamic rather than a fixed time.

次に、検索要求受付部24について説明する。検索要求受付部24は、情報管理装置2に管理されているデータの検索要求を、ユーザ端末14から受け付け、検索処理部25に通知するよう作動する。このとき、検索要求を行うユーザ端末14は、ユーザDが操作するものとする。そして、ユーザDが、「C++やそのライブラリ」という検索要求データを送信して、検索要求を行ったとする。   Next, the search request receiving unit 24 will be described. The search request receiving unit 24 operates to receive a search request for data managed by the information management device 2 from the user terminal 14 and notify the search processing unit 25 of the request. At this time, it is assumed that the user D operates the user terminal 14 that makes a search request. Then, it is assumed that the user D transmits search request data “C ++ or its library” and makes a search request.

検索処理部25(検索手段)は、上記検索要求受付部24から検索要求データの通知を受けると、検索要求データの内容を分析し、蓄積された個人知識データの少なくとも一つを検索する。具体的な検索処理としては、例えば、形態素解析処理にかけ、抽出された内容語である「C++」と「ライブラリ」に「1.0」の値を付与する。同時に、検索対象に含まれていて、検索要求に含まれていない単語には「0」の値を付与する。その結果、例えば、(C++,ライブラリ,クラス,変数)=(1.0, 1.0, 0,0)といった検索要求の特徴単語ベクトルを作成する。そして、この検索要求データの単語特徴ベクトルと、1つ以上の個人知識データの類似度を各々計算する。類似度の計算方法は任意でよいが、例えば、空間ベクトル法を用いて計算すると、上述した個人知識データAt1と検索要求データとの間の類似度は「0.91」になる。これを全てのユーザA,B、Cの各期間ごとの個人知識データを対象に検索要求との間の類似度を計算し、この結果から検索要求データと最も類似度の高い個人知識データを特定する。   Upon receiving notification of the search request data from the search request receiving unit 24, the search processing unit 25 (search means) analyzes the content of the search request data and searches for at least one of the stored personal knowledge data. As a specific search process, for example, a value of “1.0” is assigned to “C ++” and “library” which are extracted content words through a morphological analysis process. At the same time, a value of “0” is assigned to words that are included in the search target and are not included in the search request. As a result, for example, a feature word vector for a search request such as (C ++, library, class, variable) = (1.0, 1.0, 0, 0) is created. Then, the similarity between the word feature vector of the search request data and one or more personal knowledge data is calculated. Although the calculation method of the similarity may be arbitrary, for example, when the calculation is performed using the space vector method, the similarity between the above-described personal knowledge data At1 and the search request data becomes “0.91”. The degree of similarity between the search requests is calculated based on the personal knowledge data for each period of all users A, B, and C, and the personal knowledge data having the highest similarity to the search request data is identified from the result. To do.

そして、上記特定された個人知識データ自体を個人知識データ記憶部34から抽出してもよく、さらに、これに類似する他の個人知識データを特定して抽出してもよい。例えば、上記類似度を参照して、2番目に高い個人知識データをも抽出してもよい。また、特定された個人知識データに対応する入出力データを、入出力データ記憶部31から抽出してもよい。また、さらには、特定された個人知識データに対応するユーザを特定するユーザ特定情報を抽出してもよい。すなわち、上述した例では、ユーザAを特定する情報(例えば、ユーザAの個人名)が抽出される。なお、このような検索は、検索要求時に、ユーザ端末14から人物検索要求がなされたときに行ってもよい。   Then, the specified personal knowledge data itself may be extracted from the personal knowledge data storage unit 34, and other personal knowledge data similar to this may be specified and extracted. For example, the second highest personal knowledge data may be extracted by referring to the similarity. In addition, input / output data corresponding to the identified personal knowledge data may be extracted from the input / output data storage unit 31. Furthermore, user specifying information for specifying a user corresponding to the specified personal knowledge data may be extracted. That is, in the above-described example, information for identifying the user A (for example, the personal name of the user A) is extracted. Such a search may be performed when a person search request is made from the user terminal 14 at the time of the search request.

そして、これら抽出した情報は検索結果出力処理部26(検索結果出力手段)に渡され、当該検索結果出力処理部26から検索要求を行ったユーザ端末14に送信される。   The extracted information is passed to the search result output processing unit 26 (search result output unit), and is transmitted from the search result output processing unit 26 to the user terminal 14 that has made the search request.

[動作]
次に、図6乃至図11を参照して、上述した情報管理装置2の動作を説明する。図6は、ユーザA,B,Cのユーザ端末11,12,13による入出力データに対する情報管理装置による情報蓄積処理を示すフローチャートであり、図7乃至図8は、その一部の詳細な動作を示すフローチャートである。図9は、ユーザDのユーザ端末14による検索要求に対する情報管理装置による検索処理を示すフローチャートであり、図10乃至図11は、その一部の詳細な動作を示すフローチャートである。なお、特に、ユーザAがプログラミング言語C++に関心を持ち、知識を身に付けるために文書を読んだり、メモを作成することにより、かかる知識のデータを入出力している状態と、ユーザDが「C++やそのライブラリ」について知りたいと思い、他者の個人知識を検索する場合を考える。すなわち、上述した図3乃至図5も参照して説明する。
[Operation]
Next, the operation of the information management apparatus 2 described above will be described with reference to FIGS. FIG. 6 is a flowchart showing information storage processing by the information management apparatus for input / output data by the user terminals 11, 12, and 13 of the users A, B, and C, and FIGS. It is a flowchart which shows. FIG. 9 is a flowchart showing search processing by the information management apparatus in response to a search request from the user terminal 14 of the user D, and FIGS. 10 to 11 are flowcharts showing detailed operations of a part thereof. In particular, the user A is interested in the programming language C ++, reads a document to acquire knowledge, creates a memo, and the user D inputs and outputs such knowledge data. Suppose you want to know about "C ++ and its library" and search for the personal knowledge of others. That is, the description will be given with reference to FIGS. 3 to 5 described above.

まず、情報管理装置2のデータ入出力処理部21が、ユーザAのユーザ端末11にて入出力された入出力データを、入出力データ記憶部31に保存する(ステップS1)。このとき、同時に、情報管理装置2のデータ入出力処理部21は、ユーザAが入出力データを入出力した時間データを時間データ記憶部32に保存する(ステップS2)。すると、図3に示すように、ユーザAによるユーザ端末11からの入出力データのIDと、それら入出力データにアクセスした時間データが記憶される。   First, the data input / output processing unit 21 of the information management device 2 stores the input / output data input / output at the user terminal 11 of the user A in the input / output data storage unit 31 (step S1). At the same time, the data input / output processing unit 21 of the information management apparatus 2 stores the time data when the user A inputs / outputs the input / output data in the time data storage unit 32 (step S2). Then, as shown in FIG. 3, the ID of the input / output data from the user terminal 11 by the user A and the time data for accessing the input / output data are stored.

続いて、情報管理装置2の特徴値抽出処理部22が、記憶部30に保存されている入出力データを読み出し、その特徴値を抽出する(ステップS3、特徴値抽出工程)。かかる特徴値の抽出処理を、図7を参照して詳述する。特徴値抽出処理部22は、入出力データがテキスト情報であった場合には、所定の期間の入出力データAj(j>=1)に対して、公知の技術であるTF/IDF手法を用いて重み付けを行う。具体的には、図4に示すように、入出力データA3に形態素解析処理を行い、名詞、動詞、形容詞といった内容語を抽出する(ステップS11)。そして、抽出された単語の中から、名詞、動詞、形容詞などの内容語の出現頻度をカウントし(ステップS12)、内容語の各入出力データでの出現頻度を用いて当該内容語のTF/IDF値を計算する(ステップS13)。続いて、TF/IDF値の上位4位を特徴単語「C++」、「ライブラリ」、「クラス」、「変数」を抽出し(ステップS14)、そのTF/IDF値を抽出して、特徴単語とそのTF/IDF値を特徴値とする(ステップS15)。   Subsequently, the feature value extraction processing unit 22 of the information management device 2 reads the input / output data stored in the storage unit 30 and extracts the feature value (step S3, feature value extraction step). The feature value extraction process will be described in detail with reference to FIG. When the input / output data is text information, the feature value extraction processing unit 22 uses a known technique of TF / IDF for the input / output data Aj (j> = 1) for a predetermined period. Weight. Specifically, as shown in FIG. 4, morphological analysis processing is performed on the input / output data A3 to extract content words such as nouns, verbs, and adjectives (step S11). Then, the frequency of appearance of content words such as nouns, verbs, and adjectives is counted from the extracted words (step S12), and using the frequency of appearance of each content word in each input / output data, TF / An IDF value is calculated (step S13). Subsequently, feature words “C ++”, “library”, “class”, and “variable” are extracted from the top four TF / IDF values (step S14), the TF / IDF values are extracted, and the feature words and The TF / IDF value is set as a feature value (step S15).

続いて、個人知識生成処理部23が、上記特徴値抽出処理部22にて得られた入出力データの特徴値と、記憶部30の時間データ記憶部32に保存された時間データを用いて、時間の近接性が高い入出力データ間における代表的な特徴を、その期間の個人の関心事や専門知識を表す個人知識データとして生成する(ステップS4、個人知識データ生成工程)。この動作を、図8を参照してさらに詳述する。   Subsequently, the personal knowledge generation processing unit 23 uses the feature value of the input / output data obtained by the feature value extraction processing unit 22 and the time data stored in the time data storage unit 32 of the storage unit 30. Representative characteristics between input / output data with high temporal proximity are generated as personal knowledge data representing the interests and expertise of the individual during that period (step S4, personal knowledge data generation step). This operation will be further described in detail with reference to FIG.

個人知識生成処理部23は、まず、期間設定データ記憶部33から期間設定データを読み出し(ステップS21)、これに基づいて個人知識データを生成する入出力データの入出力が行われた期間を設定する(ステップS22)。この場合には、図5(a)に示すように、期間t1が設定され、入出力データA1〜A3までの特徴が個人知識データを生成する対象となる。そして、各入出力データのTF/IDF値上位4位の特徴単語のTF/IDF値を特徴単語ベクトルとし、それらの和を作成し、個人知識データとする(ステップS23)。具体的には、期間t1内の単語特徴ベクトルの和をAt1とすると、At1=A1+A2+A3=(0.96,0.84,0)+(0,0.92,0,064)+(0.93,0.86,0.74,0.55)=(1.89,2.62,0.74,1.19)となる。そして、上記同様に、個人知識データを、各期間tk(k>=1)ごとにそれぞれ作成する。   The personal knowledge generation processing unit 23 first reads the period setting data from the period setting data storage unit 33 (step S21), and sets a period during which input / output data for generating personal knowledge data is input / output based on the period setting data. (Step S22). In this case, as shown in FIG. 5A, a period t1 is set, and the features of the input / output data A1 to A3 are the targets for generating personal knowledge data. Then, the TF / IDF values of the top four feature words of each input / output data are used as feature word vectors, and their sum is created and used as personal knowledge data (step S23). Specifically, when the sum of the word feature vectors in the period t1 is At1, At1 = A1 + A2 + A3 = (0.96,0.84,0) + (0,0.92,0,064) + (0.93,0.86,0.74, 0.55) = (1.89, 2.62, 0.74, 1.19). Similarly to the above, personal knowledge data is created for each period tk (k> = 1).

その後、生成された個人知識データを、個人知識データ記憶部34に保存する(ステップS5)。そして、ユーザAの個人知識データだけでなく、ユーザB,C等についても、同様に期間ごとの個人知識データを作成し、個人知識データ記憶部34に保存する。   Thereafter, the generated personal knowledge data is stored in the personal knowledge data storage unit 34 (step S5). Then, not only the personal knowledge data of the user A but also the personal knowledge data for each of the users B, C, etc. are created and stored in the personal knowledge data storage unit 34 in the same manner.

続いて、ユーザDのユーザ端末14から検索要求がなされた場合における情報管理装置2による検索処理動作を、図9を参照して説明する。まず、ユーザ端末14から検索要求がなされると、検索要求受付処理部24が検索要求を受け付け(ステップS41)、検索処理部25に通知する。このとき、ユーザDが「C++やそのライブラリ」という検索要求を送信した場合を考える。   Next, a search processing operation by the information management apparatus 2 when a search request is made from the user terminal 14 of the user D will be described with reference to FIG. First, when a search request is made from the user terminal 14, the search request reception processing unit 24 receives the search request (step S41) and notifies the search processing unit 25 of it. At this time, consider a case where user D transmits a search request “C ++ or its library”.

続いて、検索処理部25は、検索要求の内容を分析する(ステップS42)。例えば、検索要求データを形態素解析処理にかけ、抽出された内容語「C++」と「ライブラリ」に「1.0」の値を付与する。同時に、検索対象に含まれていて、検索要求に含まれていない単語には「0」の値を付与する。その結果、例えば、(C++,ライブラリ,クラス,変数)=(1.0,
1.0, 0,0)といった検索要求の特徴単語ベクトルが作成される。
Subsequently, the search processing unit 25 analyzes the content of the search request (step S42). For example, the search request data is subjected to a morphological analysis process, and a value of “1.0” is assigned to the extracted content words “C ++” and “library”. At the same time, a value of “0” is assigned to words that are included in the search target and are not included in the search request. As a result, for example, (C ++, library, class, variable) = (1.0,
A feature word vector for a search request such as 1.0, 0, 0) is created.

そして、これに基づいて、個人知識データ記憶部中から検索を行う(ステップS43)。具体的には、図10に示すように、検索要求データの単語特徴ベクトルと個人知識データとの類似度をそれぞれ計算する。例えば、空間ベクトル法を用いて計算すると、図5(a)に示す個人知識データAt1と検索要求の間の類似度は「0.91」になる。これをユーザA、ユーザB、ユーザCなどの各期間ごとの個人知識データを対象に、検索要求データとの間の類似度を計算する。この結果から検索要求と最も類似度の高い個人知識データを特定する(ステップS52)。例えば、個人知識データAt1が最も類似度の高い個人知識データであると判定された場合、個人知識データAt1を検索結果として抽出する(ステップS44)。なお、かかるステップS44の詳細な動作を図11(a)にも示す(ステップS61)。そして、抽出した個人知識データAt1をユーザDのユーザ端末14に対して出力する(ステップS45)。なお、検索結果として出力するデータは、個人知識データAt1ばかりでなく、検索要求データに対して類似度が2番目、3番目に高い個人知識データなどを抽出して出力してもよい。さらには、個人知識データに限らず、これの元となる入出力データを入出力データ記憶部31から抽出して(図11(b)のステップS71参照)、ユーザDのユーザ端末14に出力してもよい。   Based on this, the personal knowledge data storage unit is searched (step S43). Specifically, as shown in FIG. 10, the similarity between the word feature vector of the search request data and the personal knowledge data is calculated. For example, when the calculation is performed using the space vector method, the similarity between the personal knowledge data At1 shown in FIG. 5A and the search request is “0.91”. The degree of similarity with the search request data is calculated for the personal knowledge data for each period such as user A, user B, and user C. From this result, the personal knowledge data having the highest similarity with the search request is specified (step S52). For example, when it is determined that the personal knowledge data At1 is the personal data having the highest similarity, the personal knowledge data At1 is extracted as a search result (step S44). The detailed operation of step S44 is also shown in FIG. 11A (step S61). And the extracted personal knowledge data At1 is output with respect to the user terminal 14 of the user D (step S45). Note that the data to be output as the search result may be extracted and output not only the personal knowledge data At1 but also personal knowledge data having the second and third highest similarity to the search request data. Furthermore, not only the personal knowledge data but also the input / output data that is the basis of the data is extracted from the input / output data storage unit 31 (see step S71 in FIG. 11B) and output to the user terminal 14 of the user D. May be.

なお、検索要求を行ったユーザDからの要求が、個人知識データのみではなく、「C++やそのライブラリ」について「詳しい人物」を検索する要求である場合には、上述したように、個人知識データAt1を特定した後に、当該個人知識データのもととなる入出力データを入出力したユーザAを特定し(図11(c)のステップS81参照)、その「個人名であるA」を検索結果としてユーザDのユーザ端末14に出力する。   When the request from the user D who made the search request is not only the personal knowledge data but also a request to search for “detailed person” for “C ++ and its library”, as described above, the personal knowledge data After specifying At1, the user A who inputs / outputs the input / output data that is the basis of the personal knowledge data is specified (see step S81 in FIG. 11C), and the search result is “A that is an individual name”. To the user terminal 14 of the user D.

このようにすることにより、上記情報管理装置2によると、時間情報を用いて個人の期間ごとの関心事や専門知識を抽出することで、過去のある期間に集中的に入出力した情報を検索することができることから、過去のある時期だけに取り扱ったテーマのように、過去のある期間に集中的に入出力した情報から抽出される個人の関心事や専門知識を持っていた専門家である他の個人やその情報を検索することができる。また、同様に、現在一致する関心事や専門知識を持っている他の個人が過去にはどのような関心事や専門知識を持っていたのか、といったことも検索できることである。   In this way, according to the information management device 2 described above, the information input / output intensively in a certain past period is retrieved by extracting the interests and expertise of each individual period using the time information. It is an expert who has personal interests and expertise extracted from information intensively input and output during a certain past period, such as themes handled only in a certain past period. You can search for other individuals and their information. Similarly, it is also possible to search what interests and expertise other individuals who have current matching interests and expertise have in the past.

さらに、時間情報を用いて個人の期間ごとの関心事や専門知識を抽出すること、個人の過去から現在までの関心事や専門知識の変遷を検索できるようにしたため、検索者である個人が所望の情報を検索する際に、自分の過去から現在までの関心事や専門知識の変遷により近い人物の持っている情報から所望の情報を検索することができ、情報の再利用化を図ることができる。   Furthermore, it is now possible to extract interests and expertise for each individual period using time information, and to search for changes in interests and expertise from the past to the present of the individual, so that the individual who is the searcher wants When searching for information, it is possible to search for desired information from information held by a person closer to the interests of the past and the present and the transition of expertise, so that information can be reused it can.

[変形例]
次に、上記構成の情報管理装置2の変形例を、図12を参照して説明する。この変形では、基本的な構成は上述した情報管理装置2と同様であるが、情報蓄積処理時における個人知識データの作成方法が異なる。すなわち、個人知識生成処理部23が以下のような機能を有し、図6のステップS4の動作が図12のフローチャートに示すようになる。
[Modification]
Next, a modified example of the information management apparatus 2 configured as described above will be described with reference to FIG. In this modification, the basic configuration is the same as that of the information management device 2 described above, but the method of creating personal knowledge data at the time of information storage processing is different. That is, the personal knowledge generation processing unit 23 has the following functions, and the operation in step S4 in FIG. 6 is as shown in the flowchart in FIG.

[構成]
まず、この変形例における個人知識生成処理部23は、複数の入出力データの特徴値間の類似度を算出する類似度算出機能(類似度算出手段)を有している。そして、この算出された類似度に基づいて、当該類似度が所定値以上の複数の入出力データの特徴値を用いて、個人知識データの生成を行う、という機能を有する。そして、本実施例では、特に、上述したように、設定された期間内の入出力データの特徴値に基づいて個人知識データの生成が行われるため、お互いに類似度が大きく、かつ、入出力の時間の近接性が高い入出力データの特徴値から、個人知識データが生成されることとなる。
[Constitution]
First, the personal knowledge generation processing unit 23 in this modification has a similarity calculation function (similarity calculation means) for calculating the similarity between feature values of a plurality of input / output data. And based on this calculated similarity, it has the function of producing | generating personal knowledge data using the feature value of several input / output data whose said similarity is more than predetermined value. In this embodiment, since the personal knowledge data is generated based on the feature values of the input / output data within the set period, as described above, the degree of similarity is high and the input / output The personal knowledge data is generated from the feature values of the input / output data having high time proximity.

[動作]
具体的な処理動作を、図12のフローチャートを参照して説明する。まず、各入出力データの特徴値が算出されると、特徴値間の類似度を算出する(ステップS31)。このとき、類似度の計算方法は任意でよいが、例えば、特徴単語の集合の重なりによって、類似度を判定する。また、公知技術であるVector Space Model(ベクトル空間法)等を用いて、情報の特徴をそのテキスト情報の中に出現する単語データをもとに単語行列ベクトル(特徴単語ベクトル)で表し、各特徴単語ベクトル間の距離や内積等によって、二情報間の類似度の大きさを求めることが可能である。ベクトル空間法は文献「Salton,
G. (1989) Automatic Text Processing. Addison-Wesley Publishing Company.」の十章等に詳細に述べられている。また、別の公知の技術であるLatent
Semantic Space(潜在的意味空間法)等を用いて、作成した特徴単語ベクトルを、特異値分解により低階数近似し、ベクトルの次元を小さくして計算することも可能である。潜在的意味空間法については、文献「Deerwester,
S. et. al.(1990): Indexing by latent semantic analysis. Journal of the American
Society for Information Science, 41(7), 391-407.」他に記述があるため詳細な説明は省略する。
[Operation]
A specific processing operation will be described with reference to the flowchart of FIG. First, when the feature value of each input / output data is calculated, the similarity between the feature values is calculated (step S31). At this time, the method for calculating the degree of similarity may be arbitrary, but the degree of similarity is determined based on, for example, overlapping of sets of feature words. In addition, using the well-known Vector Space Model (vector space method) etc., the feature of the information is expressed as a word matrix vector (feature word vector) based on the word data that appears in the text information. The degree of similarity between two pieces of information can be obtained from the distance between word vectors, the inner product, and the like. The vector space method is described in the document "Salton,
G. (1989) Automatic Text Processing. Addison-Wesley Publishing Company. Another known technology, Latent
Using the Semantic Space (latent semantic space method) or the like, it is also possible to approximate the created feature word vector by low-order approximation by singular value decomposition and reduce the vector dimension. The latent semantic space method is described in the document “Deerwester,
S. et. Al. (1990): Indexing by latent semantic analysis.Journal of the American
"Society for Information Science, 41 (7), 391-407."

そして、算出した類似度を用いて、お互いに類似度が高い入出力データの特徴値を抽出し(ステップS32)、かつ、時間の近接性が高い入出力データ間の特徴値に対して、個人知識データを生成する(ステップS35)。すなわち、上述同様に、期間設定データを読み出して、所定の期間を設定し(ステップS34)、かかる期間内の存在する入出力データのうち、類似度が高い特徴値のみの特徴を表す個人知識データを生成する。   Then, using the calculated similarity, the feature values of the input / output data having a high similarity to each other are extracted (step S32), and the feature values between the input / output data having a high temporal proximity are obtained for the individual. Knowledge data is generated (step S35). That is, as described above, the period setting data is read out, a predetermined period is set (step S34), and the personal knowledge data representing the feature of only the feature value having high similarity among the input / output data existing in the period. Is generated.

次に、本発明の第2の実施例を、図13乃至図17を参照して説明する。図13は、情報管理装置の構成を示す機能ブロック図である。図14乃至図15は、情報管理装置における情報処理の様子を示す説明図である。図16乃至図17は、情報管理装置の動作を示すフローチャートである。   Next, a second embodiment of the present invention will be described with reference to FIGS. FIG. 13 is a functional block diagram showing the configuration of the information management apparatus. FIG. 14 to FIG. 15 are explanatory diagrams showing the state of information processing in the information management apparatus. 16 to 17 are flowcharts showing the operation of the information management apparatus.

[構成]
本実施例における情報処理装置102は、基本的には、上述した実施例1におけるものと同様の構成を採っている。従って、情報管理装置102は、1台又は複数台のサーバコンピュータなどの情報処理装置にて構成されており、データの登録や閲覧などデータの入出力を行うユーザA,B,Cが操作するコンピュータであるユーザ端末11,12,13に、ネットワークNを介して接続されている。また、この情報管理装置102に対してデータの検索要求を行うユーザDの操作するコンピュータであるユーザ端末14にもネットワークNを介して接続されている。
[Constitution]
The information processing apparatus 102 in the present embodiment basically has the same configuration as that in the first embodiment described above. Therefore, the information management apparatus 102 is configured by an information processing apparatus such as one or a plurality of server computers, and is a computer operated by users A, B, and C that input and output data such as data registration and browsing. Are connected via a network N to user terminals 11, 12, and 13. Further, a user terminal 14 which is a computer operated by a user D who makes a data search request to the information management apparatus 102 is also connected via the network N.

そして、情報管理装置102は、情報の演算処理を行う演算部120と、情報を記憶する記憶部130とを備えており、演算部120には、情報管理用プログラムが組み込まれることで、図13に示すように、データ入力処理部121と、特徴値抽出処理部122と、個人知識生成処理部123と、が構築されており、ユーザ端末11,12,13による入出力データを、その特徴に基づいて管理する機能を有する。本実施例では、特に、上記実施例1の場合と比較して、入出力データの個人知識データの生成方法が異なるため、上記各処理部121,122,123の機能が異なる。また、これに伴い、記憶部130には、入出力データ記憶部131と、入出力区分データ記憶部132と、重み付け設定データ記憶部133と、個人知識データ記憶部134と、が形成されている。これらについては、以下に詳述する。   The information management apparatus 102 includes a calculation unit 120 that performs calculation processing of information, and a storage unit 130 that stores information. The information management program is incorporated in the calculation unit 120, so that FIG. As shown in FIG. 4, a data input processing unit 121, a feature value extraction processing unit 122, and a personal knowledge generation processing unit 123 are constructed, and input / output data by the user terminals 11, 12, and 13 are used as characteristics thereof. Based on the management function. In the present embodiment, in particular, since the method of generating personal knowledge data of input / output data is different from that in the first embodiment, the functions of the processing units 121, 122, and 123 are different. Accordingly, the storage unit 130 includes an input / output data storage unit 131, an input / output classification data storage unit 132, a weighting setting data storage unit 133, and a personal knowledge data storage unit 134. . These will be described in detail below.

また、演算部120には、上記プログラムが組み込まれることで、検索要求受付処理部124と、検索処理部125と、検索結果出力処理部126と、が構築されており、ユーザ端末14からのデータの検索要求に応じて検索処理を行う機能を有しているが、これら各処理部124,125,126の機能は、上記実施例1の場合とほぼ同一であるので、その説明は省略する。   In addition, the calculation unit 120 incorporates the above-described program, so that a search request reception processing unit 124, a search processing unit 125, and a search result output processing unit 126 are constructed. However, since the functions of the processing units 124, 125, and 126 are almost the same as those in the first embodiment, the description thereof is omitted.

上記データ入出力処理部121は、ユーザがユーザ端末11,12,13を介して情報管理装置102に入出力した入出力データと、この入出力データの入出力状況を表すデータである入出力の区別を表す入出力区別データと、を受け付けて、記憶部130内の入出力データ記憶部131と入出力区別データ記憶部132とにそれぞれ記憶する機能を有する。また、データ入出力処理部121は、さらに、入出力データにおける他のデータの参照状況を表す参照状況データをも受け付けて、入出力区分データ記憶部132に記憶する機能を有する。   The data input / output processing unit 121 inputs / outputs data that is input / output to / from the information management apparatus 102 by the user via the user terminals 11, 12, and 13 and data indicating the input / output status of the input / output data. It has a function of receiving input / output distinction data representing distinction and storing them in the input / output data storage unit 131 and the input / output distinction data storage unit 132 in the storage unit 130, respectively. The data input / output processing unit 121 further has a function of receiving reference status data representing the reference status of other data in the input / output data and storing it in the input / output segmented data storage unit 132.

ここで、上述した各データについて詳述する。入出力データは、あらかじめ情報管理装置102に格納済みの、例えば電子メールの送信メールや受信メールなどの入出力の区別が可能なユーザ個人の入出力データである。また、入出力区別データは、上記入出力データが入力データか、出力データか、ということを示すデータであり、例えば、送信メールには出力データであることを示す区別データ「1」を付与し、受信メールには入力データであることを示す区別データ「0」を付与して記憶しておく。そのときの記憶例を図14に示す。この図は、ユーザAの入出力データのIDと入出力区別データと参照関係を記録した一例である。まず、入出力データにIDを付与してデータの内容と共に記憶し、さらにこの入出力データユーザAが出力データであれば「1」を、入力データであれば「0」といった区別データを付与し、図示するように記憶する。   Here, each data mentioned above is explained in full detail. The input / output data is personal input / output data stored in the information management apparatus 102 in advance and capable of distinguishing input / output such as e-mail transmission mail and reception mail. The input / output distinction data is data indicating whether the input / output data is input data or output data. For example, the sent mail is provided with distinction data “1” indicating output data. The received mail is stored with the distinction data “0” indicating the input data. A storage example at that time is shown in FIG. This figure is an example in which the input / output data ID of user A, the input / output distinction data, and the reference relationship are recorded. First, an ID is assigned to the input / output data and stored together with the contents of the data. Further, if the input / output data user A is output data, “1” is assigned, and if the input data is input data, “0” is assigned. Store as shown.

また、参照状況データは、入出力データ間の参照関係を示すデータである。参照関係は、例えば、出力データ内に明記された参考文献や引用符で囲まれた記述等の説明からその説明の内容が書かれた入力データを特定することで得ることができることを表している。そして、例えば、図14に示すように、出力データA3を作成する際に当該A3が他の入力データA2を参照して作成している場合には(図14内の矢印参照)、その参照関係を「A3−>A2」のようにA3のデータに対して付与し、記憶する。   The reference status data is data indicating a reference relationship between input and output data. The reference relationship indicates that it can be obtained, for example, by specifying the input data in which the content of the description is written from the description such as the reference document specified in the output data or the description enclosed in quotation marks. . Then, for example, as shown in FIG. 14, when the output data A3 is created by referring to the other input data A2 (see the arrow in FIG. 14), the reference relationship is created. Is assigned to the data of A3 as “A3-> A2” and stored.

また、特徴値抽出処理部122は、実施例1にて説明したものと同様に作用し、例えば、各入出力データAjから形態素解析処理によって単語を抽出し、抽出された単語の中から、名詞、動詞、形容詞などの内容語の出現頻度をカウントし、内容語の各入出力データでの出現頻度を用いて内容語のTF/IDF値を計算する。これにより、実施例1にて説明した図4に示すように、上位N位の特徴単語とTF/IDF値を、特徴値として抽出する。   The feature value extraction processing unit 122 operates in the same manner as described in the first embodiment. For example, the feature value extraction processing unit 122 extracts words from each input / output data Aj by morpheme analysis processing, and extracts nouns from the extracted words. The frequency of appearance of content words such as verbs and adjectives is counted, and the TF / IDF value of the content word is calculated using the frequency of appearance of the content word in each input / output data. As a result, as shown in FIG. 4 described in the first embodiment, the top N feature words and TF / IDF values are extracted as feature values.

次に、個人知識生成処理部123(個人知識データ生成手段)について説明する。個人知識生成処理部123は、上記入出力データの特徴値に対して、入出力区別データに応じて重み付けを行って、個人知識データを生成するよう作動する。このとき、重み付けは、例えば、出力データに対しては入力データよりも高い重み付けを行う。また、さらに、上記参照状況データに応じても、入出力データに重み付けを行う。例えば、参照されている入力データに対して所定の重み付けを付加する。   Next, the personal knowledge generation processing unit 123 (personal knowledge data generation means) will be described. The personal knowledge generation processing unit 123 operates to generate personal knowledge data by weighting the feature values of the input / output data according to the input / output distinction data. At this time, for example, the weighting for the output data is higher than that for the input data. Further, the input / output data is also weighted according to the reference status data. For example, a predetermined weight is added to the input data being referred to.

上記個人知識生成処理部123による個人知識データ作成の具体的な処理を、図14乃至図15を参照して説明する。まず、図15(a)には入出力データの一例を示しているが、図14に示すように、A1,A2は入力データであり、A3は出力データである。また、A3はA2を参照している。かかる場合に、入出力データの特徴値のうち、出力データA3の特徴値に任意の重み、例えば、w=0.8(0<=w<=1)を加算し、入力データA1,A2の特徴値に重み0.2(1−w)を加算する。また、A3の参照先となっている入力データA2には、さらに、例えば0.5の重みを加算する。従って、A2には、(1−w)+0.5=0.7の重みが加算されたこととなる。そして、上記重みを付加した各入出力データの特徴値を特徴単語ベクトルとし、各入出力データにおける単語特徴ベクトルの和Awを取る。すると、Aw=(0.94,1.50,0.59,0.89)となり、これを、ユーザAによる入出力データの代表的な特徴を表す個人知識データとして生成する。かかる結果は、ユーザAが出力データとして取り扱った情報の特徴をより強く反映したものとなる。   Specific processing of personal knowledge data creation by the personal knowledge generation processing unit 123 will be described with reference to FIGS. First, FIG. 15A shows an example of input / output data. As shown in FIG. 14, A1 and A2 are input data, and A3 is output data. A3 refers to A2. In such a case, an arbitrary weight, for example, w = 0.8 (0 <= w <= 1) is added to the feature value of the output data A3 among the feature values of the input / output data, and the input data A1, A2 A weight of 0.2 (1-w) is added to the feature value. Further, for example, a weight of 0.5 is added to the input data A2 that is the reference destination of A3. Therefore, a weight of (1−w) + 0.5 = 0.7 is added to A2. Then, the feature value of each input / output data to which the weight is added is used as a feature word vector, and the sum Aw of the word feature vectors in each input / output data is taken. Then, Aw = (0.94, 1.50, 0.59, 0.89), which is generated as personal knowledge data representing typical characteristics of input / output data by the user A. Such a result more strongly reflects the characteristics of the information handled as output data by the user A.

そして、上述したように生成した個人知識データを、個人知識データ記憶部134に記憶しておく。また、他のユーザの入出力データに対しても、同様に個人知識データの生成及び保存を行う。   The personal knowledge data generated as described above is stored in the personal knowledge data storage unit 134. Similarly, personal knowledge data is generated and stored for input / output data of other users.

ここで、上述した重み付けの値は一例であって、上記値に限定されるものではない。また、上述した個人知識データを算出する手法では、参照関係に基づいて入出力データの特徴値に重みを付加する例を説明したが、必ずしもこれに限定されず、かかる参照関係に基づいた重みは付加されなくてもよい。逆に、参照関係に基づく重み付けのみが付加され、入出力区別に基づく重みが付加されなくてもよい。   Here, the above-described weighting value is an example, and is not limited to the above value. In the above-described method for calculating the personal knowledge data, the example in which the weight is added to the feature value of the input / output data based on the reference relationship has been described. However, the weight based on the reference relationship is not necessarily limited thereto. It may not be added. Conversely, only the weight based on the reference relationship is added, and the weight based on the input / output distinction may not be added.

そして、上述したように生成され記憶された個人知識データに対して、他のユーザから検索要求があった場合には、情報管理装置102は検索要求受付部124と検索処理部125と検索結果出力処理部126との作用により、検索処理を実行する。但し、これら各処理部124,125,126の機能は上記実施例1のものとほぼ同一であるので、その説明は省略する。   When there is a search request from another user for the personal knowledge data generated and stored as described above, the information management apparatus 102 outputs the search request receiving unit 124, the search processing unit 125, and the search result output. A search process is executed by the action of the processing unit 126. However, the function of each of the processing units 124, 125, 126 is almost the same as that of the first embodiment, and the description thereof is omitted.

[動作]
次に、図16乃至図17を参照して、上述した情報管理装置102の動作を説明する。図16は、ユーザA,B,Cのユーザ端末11,12,13による入出力データに対する情報管理装置による情報蓄積処理を示すフローチャートであり、図17は、その一部の詳細な動作を示すフローチャートである。なお、上記実施例1と同様に、ユーザAがプログラミング言語C++に関心を持ち、知識を身に付けるために文書を読んだり、メモを作成している場合における情報蓄積処理の動作を説明する。
[Operation]
Next, the operation of the information management apparatus 102 described above will be described with reference to FIGS. FIG. 16 is a flowchart showing information accumulation processing by the information management apparatus for input / output data by the user terminals 11, 12, and 13 of the users A, B, and C, and FIG. 17 is a flowchart showing a part of detailed operation thereof. It is. Similar to the first embodiment, the operation of the information accumulation process when the user A is interested in the programming language C ++ and reads a document or creates a memo to acquire knowledge will be described.

まず、情報管理装置102のデータ入出力処理部121が、ユーザAのユーザ端末11にて入出力された入出力データを、入出力データ記憶部131に保存する(ステップS101)。このとき、同時に、情報管理装置102のデータ入出力処理部121は、ユーザAが入出力したデータの入手・出力の区別である入出力区別データを、入出力区別データ記憶部132に保存する(ステップS102)。また、このとき、入出力データの参照関係も入出力区別データ記憶部132に保存する。このようにして記憶した例を図14に示す。上述したように、かかる記憶例では、ユーザAが入出力したデータに入出力データIDを付与し、そのデータ内容とIDを保存する。また、ユーザAがアクセスまたは保存したデータが出力データであれば「1」を、入力データであれば「0」といった区別データを付与して保存する。さらには、ある出力データA3を作成する際に入力データA2を参照して作成したという参照関係を「A3−>A2」のように、A3に付与して保存する。なお、入出力データの内容とは、例えば、電子メールの送信メール、受信メールなどの入出力の区別が可能なデータである。   First, the data input / output processing unit 121 of the information management apparatus 102 stores the input / output data input / output on the user terminal 11 of the user A in the input / output data storage unit 131 (step S101). At the same time, the data input / output processing unit 121 of the information management apparatus 102 stores the input / output distinction data, which is the distinction between acquisition and output of data input / output by the user A, in the input / output distinction data storage unit 132 ( Step S102). At this time, the input / output data reference relationship is also stored in the input / output distinction data storage unit 132. An example stored in this way is shown in FIG. As described above, in this storage example, the input / output data ID is assigned to the data input / output by the user A, and the data content and ID are stored. Further, if the data accessed or stored by the user A is output data, “1” is assigned, and if the data is input data, “0” is given and stored. Further, a reference relationship that is created by referring to the input data A2 when creating certain output data A3 is assigned to A3 and saved as "A3-> A2". The contents of input / output data are, for example, data that can be distinguished from input / output such as e-mail transmission mail and reception mail.

続いて、情報管理装置102の特徴値抽出処理部122が、記憶した入出力データを読み出し、実施例1の場合と同様に、その特徴値を抽出する(ステップS103)。   Subsequently, the feature value extraction processing unit 122 of the information management apparatus 102 reads the stored input / output data, and extracts the feature value as in the case of the first embodiment (step S103).

続いて、個人知識生成処理部123が、上記特徴値抽出処理部122にて得られた入出力データの特徴値と、入出力区別データ記憶部132に保存された入出力区別データを用いて、入出力状況に対応した個人の関心事や専門知識をあらわす代表的な特徴を、個人知識データとして生成する(ステップS104)。この動作を、図17を参照してさらに詳述する。   Subsequently, the personal knowledge generation processing unit 123 uses the feature value of the input / output data obtained by the feature value extraction processing unit 122 and the input / output distinction data stored in the input / output distinction data storage unit 132. Representative characteristics representing personal interests and expertise corresponding to the input / output situation are generated as personal knowledge data (step S104). This operation will be further described in detail with reference to FIG.

個人知識生成処理部123は、まず、重み付け設定データ記憶部133から重み付け設定データを読み出すと共に(ステップS111)、入出力区別データ記憶部132から、入出力区別データと参照状況データとを読み出す(ステップS112)。そして、これらに基づいて、各入出力データの特徴値に重み付けを行う(ステップS113)。本実施例の場合には、出力データに対しては重み付けが高くなるよう設定されており、また、参照先となるデータに対しても重みが高くなるよう設定されている。具体的には、図15(a)に示すように重み付けが加算され、各入出力データA1,A2,A3の単語特徴ベクトルの和を計算することで、図15(b)のAwに示す個人知識データが生成される(ステップS114)。   The personal knowledge generation processing unit 123 first reads the weight setting data from the weight setting data storage unit 133 (step S111), and also reads the input / output distinction data and the reference situation data from the input / output distinction data storage unit 132 (step S111). S112). Based on these, the feature value of each input / output data is weighted (step S113). In this embodiment, the output data is set to have a high weight, and the reference destination data is also set to have a high weight. Specifically, weights are added as shown in FIG. 15A, and the sum of word feature vectors of each input / output data A1, A2, A3 is calculated, so that the individual shown as Aw in FIG. Knowledge data is generated (step S114).

その後、生成された個人知識データを、個人知識データ記憶部134に保存する(ステップS105)。そして、ユーザAの個人知識データだけでなく、ユーザB,C等についても、同様に個人知識データを作成し、個人知識データ記憶部134に保存する。   Thereafter, the generated personal knowledge data is stored in the personal knowledge data storage unit 134 (step S105). Then, not only the personal knowledge data of the user A but also the personal knowledge data is created for the users B, C, etc., and stored in the personal knowledge data storage unit 134.

なお、後に、ユーザDのユーザ端末14から検索要求がなされた場合における情報管理装置102による検索処理動作は、上記実施例1と同様なので、その説明は省略する。   Note that the search processing operation by the information management apparatus 102 when a search request is made later from the user terminal 14 of the user D is the same as that in the first embodiment, and the description thereof is omitted.

このようにすることにより、入出力区別データを用いて、個人知識のうち出力データをもとに作成された知識に重みづけをして個人知識データを作成していることから、ユーザが出力データとして取り扱った情報の特徴をより強く反映したものとなるため、後の検索時に、個人の関心事や専門知識を正確に抽出することができる。これは、個人が閲覧やコピーをするといった入力データは個人が単に見ただけといったことが考えられ、個人の関心事や専門知識との関連の度合いは低いかもしれないのに対して、個人が作成や編集をするといった出力データは、個人が選択や創作をするステップを経なければ実現せず、個人の関心事や専門知識との関連の度合いが強いと考えられることによる。   In this way, since the personal knowledge data is created by weighting the knowledge created based on the output data of the personal knowledge using the input / output distinction data, the user outputs the output data Since it reflects the characteristics of the information handled as a more strongly, it is possible to accurately extract personal interests and expertise during subsequent searches. This is because the input data that the individual browses and copies is simply viewed by the individual, and the degree of association with the individual's interests and expertise may be low, whereas the individual This is because output data such as creation and editing is not realized unless the individual goes through the selection and creation steps, and it is considered that the degree of association with the individual's interests and expertise is strong.

また、出力データとその参照関係にある入力データに重みづけをして個人知識を作成することで、出力データに重みづけをして個人知識を作成する場合と同様、個人の関心事や専門知識を正確に保存することが可能になる。すなわち、出力データと同様に、その出力データを作成するときに参考にした情報である入力データは、個人が単に見ただけかもしれない入力データ全体に比べて、個人がその情報を利用して出力データを作成しているので、個人の関心事や専門知識との関連の度合いが強いと考えられるためである。   In addition, by creating a personal knowledge by weighting the input data that has a reference relationship with the output data, as with the case of creating personal knowledge by weighting the output data, individual interests and expertise Can be stored accurately. That is, as with the output data, the input data, which is the information that was referenced when creating the output data, is used by the individual in comparison to the entire input data that the individual may have just viewed. This is because the output data is created, so it is considered that there is a strong degree of association with individual interests and expertise.

次に、本発明の第3の実施例を、図18乃至図20を参照して説明する。図18は、情報管理装置の構成を示す機能ブロック図である。図19乃至図20は、情報管理装置の動作を示すフローチャートである。   Next, a third embodiment of the present invention will be described with reference to FIGS. FIG. 18 is a functional block diagram illustrating the configuration of the information management apparatus. 19 to 20 are flowcharts showing the operation of the information management apparatus.

[構成]
本実施例における情報処理装置202は、上述した実施例1と実施例2において説明したそれぞれの情報処理装置2,102が有する各処理部を組み合わせた構成を採っている。そして、情報管理装置202は、情報の演算処理を行う演算部220と、情報を記憶する記憶部230とを備えており、演算部220には、情報管理用プログラムが組み込まれることで、図18に示すように、データ入力処理部221と、特徴値抽出処理部222と、個人知識生成処理部223と、が構築されており、ユーザ端末11,12,13による入出力データを、その特徴に基づいて管理する機能を有する。本実施例では、特に、入出力データの個人知識データの生成方法が異なるため、上記データ入出力処理部221と個人知識生成処理部223の機能が異なる。また、これに伴い、記憶部230には、入出力データ記憶部231と、時間データ・入出力区別データ記憶部232と、期間設定データ・重み付け設定データ記憶部233と、個人知識データ記憶部234と、が形成されている。これらについては、以下に詳述する。
[Constitution]
The information processing apparatus 202 according to the present embodiment employs a configuration in which the processing units included in the information processing apparatuses 2 and 102 described in the first and second embodiments are combined. The information management apparatus 202 includes a calculation unit 220 that performs calculation processing of information and a storage unit 230 that stores information, and the information management program is incorporated in the calculation unit 220, so that FIG. As shown in FIG. 4, a data input processing unit 221, a feature value extraction processing unit 222, and a personal knowledge generation processing unit 223 are constructed, and input / output data by the user terminals 11, 12, and 13 are used as the characteristics. Based on the management function. In this embodiment, in particular, since the method of generating personal knowledge data of input / output data is different, the functions of the data input / output processing unit 221 and the personal knowledge generation processing unit 223 are different. Accordingly, the storage unit 230 includes an input / output data storage unit 231, a time data / input / output distinction data storage unit 232, a period setting data / weighting setting data storage unit 233, and a personal knowledge data storage unit 234. And are formed. These will be described in detail below.

また、演算部220には、上記プログラムが組み込まれることで、検索要求受付処理部224と、検索処理部225と、検索結果出力処理部226と、が構築されており、ユーザ端末14からのデータの検索要求に応じて検索処理を行う機能を有しているが、これら各処理部224,225,226の機能は、上記実施例1の場合とほぼ同一であるので、その説明は省略する。   In addition, the calculation unit 220 includes a search request reception processing unit 224, a search processing unit 225, and a search result output processing unit 226 by incorporating the above program. However, since the functions of the processing units 224, 225, and 226 are almost the same as those in the first embodiment, the description thereof is omitted.

そして、上記データ入出力処理部221は、入出力データを受け付けて入出力データ記憶部231に記憶すると共に、入出力データの入出力時間を表す時間データと、入出力データの入出力の区別を表す入出力区別データや入出力データ間の参照関係を表す参照状況データと、をそれぞれ受け付けて、時間データ・入出力区別データ記憶部232に記憶する、という機能を有している。   The data input / output processing unit 221 receives the input / output data and stores the input / output data in the input / output data storage unit 231, and distinguishes the time data indicating the input / output time of the input / output data from the input / output of the input / output data. It has a function of accepting input / output distinction data and reference status data representing a reference relationship between the input / output data and storing them in the time data / input / output distinction data storage unit 232.

また、個人知識生成処理部223は、時間データと入出力区別データとに基づいて、入出力の時間の近接性が高い所定の期間内における複数の入出力データの特徴を算出する際に、出力データに重みづけを付加するなど入出力状況を考慮して重み付けを加算し、個人知識データを生成する。   In addition, the personal knowledge generation processing unit 223 outputs, when calculating the characteristics of a plurality of input / output data within a predetermined period in which the proximity of input / output time is high, based on the time data and the input / output distinction data. The personal knowledge data is generated by adding weights in consideration of the input / output situation such as adding weights to the data.

[動作]
次に、図19乃至図20を参照して、上述した情報管理装置202の動作を説明する。図19は、ユーザA,B,Cのユーザ端末11,12,13による入出力データに対する情報管理装置による情報蓄積処理を示すフローチャートであり、図20は、その一部の詳細な動作を示すフローチャートである。なお、上記実施例1,2と同様に、ユーザAがプログラミング言語C++に関心を持ち、知識を身に付けるために文書を読んだり、メモを作成している場合における情報蓄積処理の動作を説明する。
[Operation]
Next, the operation of the information management apparatus 202 described above will be described with reference to FIGS. FIG. 19 is a flowchart showing information storage processing by the information management apparatus for input / output data by the user terminals 11, 12, and 13 of the users A, B, and C, and FIG. 20 is a flowchart showing a part of the detailed operation. It is. As in the first and second embodiments, the operation of the information accumulation process when the user A is interested in the programming language C ++ and reads a document or creates a memo to acquire knowledge is described. To do.

まず、情報管理装置202のデータ入出力処理部221が、ユーザAのユーザ端末11にて入出力された入出力データを、入出力データ記憶部231に保存する(ステップS201)。このとき、同時に、情報管理装置202のデータ入出力処理部221は、入出力データの入出力時間を表す時間データと、ユーザAが入出力したデータの入力・出力の区別である入出力区別データとを、時間データ・入出力区別データ記憶部232に保存する(ステップS202)。また、このとき、入出力データの参照関係も時間データ・入出力区別データ記憶部232に保存する。   First, the data input / output processing unit 221 of the information management apparatus 202 stores the input / output data input / output at the user terminal 11 of the user A in the input / output data storage unit 231 (step S201). At the same time, the data input / output processing unit 221 of the information management apparatus 202 performs the input / output distinction data which is the distinction between the time data indicating the input / output time of the input / output data and the input / output of the data input / output by the user A. Are stored in the time data / input / output distinction data storage unit 232 (step S202). At this time, the reference relationship of the input / output data is also stored in the time data / input / output distinction data storage unit 232.

続いて、情報管理装置202の特徴値抽出処理部222が、記憶されている入出力データを読み出し、実施例1の場合と同様に、その特徴値を抽出する(ステップS203)。   Subsequently, the feature value extraction processing unit 222 of the information management apparatus 202 reads the stored input / output data, and extracts the feature value as in the case of the first embodiment (step S203).

続いて、個人知識生成処理部223が、上記特徴値抽出処理部222にて得られた入出力データの特徴値と、時間データ・入出力区別データ記憶部232に保存された時間データ及び入出力区別データを用いて、所定期間における入出力データにおける入出力状況に対応した個人の関心事や専門知識をあらわす代表的な特徴を、個人知識データとして生成する(ステップS204)。この動作を、図20を参照してさらに詳述する。   Subsequently, the personal knowledge generation processing unit 223 performs the feature value of the input / output data obtained by the feature value extraction processing unit 222 and the time data and input / output stored in the time data / input / output distinction data storage unit 232. Using the distinction data, representative features representing personal interests and expertise corresponding to the input / output situation in the input / output data in a predetermined period are generated as personal knowledge data (step S204). This operation will be further described in detail with reference to FIG.

個人知識生成処理部223は、まず、期間設定データ・重み付け設定記憶部233から期間設定データを読み出し(ステップS211)、これに基づいて個人知識データを生成する入出力データの入出力が行われた期間を設定する(ステップS212)。続いて、期間設定データ・重み付け設定データ記憶部233から重み付け設定データを読み出し(ステップS213)、これに基づいて、実施例2において説明したように、上記設定された期間内の各入出力データの特徴値に重み付けを行う(ステップS214)。そして、この設定された期間内の入出力データであって、重み付けが加算された特徴値の単語特徴ベクトルの和を計算することにより、個人知識データを生成する(ステップS215)。なお、上記個人知識データの生成方法は一例であって、上記手法に限定されるものではない。   First, the personal knowledge generation processing unit 223 reads the period setting data from the period setting data / weighting setting storage unit 233 (step S211), and input / output of input / output data for generating personal knowledge data is performed based on the period setting data. A period is set (step S212). Subsequently, the weight setting data is read from the period setting data / weight setting data storage unit 233 (step S213), and based on this, as described in the second embodiment, each input / output data within the set period is read. The feature value is weighted (step S214). Then, the personal knowledge data is generated by calculating the sum of the word feature vectors of the feature values that are the input / output data within the set period and to which the weight is added (step S215). The method for generating the personal knowledge data is an example, and is not limited to the above method.

その後、生成された個人知識データを、個人知識データ記憶部234に保存する(ステップS205)。そして、ユーザAの個人知識データだけでなく、ユーザB,C等についても、同様に個人知識データを作成し、個人知識データ記憶部234に保存する。   Thereafter, the generated personal knowledge data is stored in the personal knowledge data storage unit 234 (step S205). Then, not only the personal knowledge data of the user A but also the personal knowledge data is created for the users B, C, etc., and stored in the personal knowledge data storage unit 234.

なお、後に、ユーザDのユーザ端末14から検索要求がなされた場合における情報管理装置202による検索処理動作は、上記実施例1と同様なので、その説明は省略する。   Note that the search processing operation by the information management apparatus 202 when a search request is made later from the user terminal 14 of the user D is the same as that in the first embodiment, and a description thereof will be omitted.

このようにすることにより、入出力データが入出力された期間と、その入出力区別が考慮された個人知識データが作成されるため、入出力データを取り扱ったユーザの特徴をより反映させることができ、後のデータの利用がさらに容易となる。特に、過去のある期間に集中的に入出力した情報を検索することができ、また、個人の関心事や専門知識をより高精度に抽出することができる。   By doing this, personal knowledge data is created in consideration of the period during which the input / output data is input / output and the input / output distinction, so that the characteristics of the user who handled the input / output data can be more reflected. This makes it easier to use the data later. In particular, information input / output intensively during a certain past period can be searched, and personal interests and expertise can be extracted with higher accuracy.

本発明は、ユーザによる入出力データを蓄積して管理すると共に、その検索を可能とするデータベースとして利用可能であるため、産業上の利用可能性を有する。   The present invention has industrial applicability because it can be used as a database for storing and managing input / output data by a user and enabling the search.

本発明の全体構成を示すブロック図である。It is a block diagram which shows the whole structure of this invention. 実施例1における情報管理装置の構成を示す機能ブロック図である。1 is a functional block diagram illustrating a configuration of an information management device in Embodiment 1. FIG. 入出力データと時間データとを記憶したときの一例を示す説明図である。It is explanatory drawing which shows an example when input / output data and time data are memorize | stored. 入出力データの特徴値を算出した時の一例を示す説明図である。It is explanatory drawing which shows an example when the feature value of input / output data is calculated. 個人知識データを生成するときの一例を示す説明図であり、図5(a)は時間的に連続する複数の入出力データの一例を示し、図5(b)は所定期間の入出力データを用いて個人知識データを生成したときの一例を示す。FIG. 5A is an explanatory diagram showing an example when generating personal knowledge data, FIG. 5A shows an example of a plurality of input / output data that are temporally continuous, and FIG. 5B shows input / output data for a predetermined period. An example when personal knowledge data is generated by using the data is shown. 実施例1における情報管理装置による情報蓄積処理の動作を示すフローチャートである。3 is a flowchart illustrating an operation of information accumulation processing by the information management apparatus according to the first exemplary embodiment. 図6のステップS3の詳細な動作を示すフローチャートである。It is a flowchart which shows the detailed operation | movement of step S3 of FIG. 図6のステップS4の詳細な動作を示すフローチャートである。It is a flowchart which shows the detailed operation | movement of step S4 of FIG. 実施例1における情報管理装置による検索処理の動作を示すフローチャートである。6 is a flowchart illustrating an operation of a search process performed by the information management apparatus according to the first embodiment. 図9のステップS43の詳細な動作を示すフローチャートである。It is a flowchart which shows the detailed operation | movement of step S43 of FIG. 図11(a),(b),(c)は、それぞれ図9のステップS44の詳細な動作を示すフローチャートである。FIGS. 11A, 11B, and 11C are flowcharts showing the detailed operation of step S44 of FIG. 9, respectively. 図6のステップS4の詳細な他の動作例を示すフローチャートである。It is a flowchart which shows the other detailed operation example of step S4 of FIG. 実施例2における情報管理装置の構成を示す機能ブロック図である。FIG. 10 is a functional block diagram illustrating a configuration of an information management device according to a second embodiment. 入出力データと入出力区別データとを記憶したときの一例を示す説明図である。It is explanatory drawing which shows an example when input / output data and input / output distinction data are memorize | stored. 個人知識データを生成するときの一例を示す説明図であり、図15(a)は入出力区別に基づいて入出力データに重み付けを付加した一例を示し、図15(b)は個人知識データを生成したときの一例を示す。It is explanatory drawing which shows an example when producing | generating personal knowledge data, FIG.15 (a) shows an example which added the weighting to input / output data based on the input / output distinction, FIG.15 (b) shows personal knowledge data. An example is shown when it is generated. 実施例2における情報管理装置による情報蓄積処理の動作を示すフローチャートである。10 is a flowchart illustrating an operation of information accumulation processing by the information management apparatus according to the second embodiment. 図16のステップS104の詳細な動作を示すフローチャートである。It is a flowchart which shows the detailed operation | movement of step S104 of FIG. 実施例3における情報管理装置の構成を示す機能ブロック図である。FIG. 10 is a functional block diagram illustrating a configuration of an information management device according to a third embodiment. 実施例3における情報管理装置による情報蓄積処理の動作を示すフローチャートである。14 is a flowchart illustrating an operation of information accumulation processing by the information management apparatus according to the third embodiment. 図19のステップS204の詳細な動作を示すフローチャートである。It is a flowchart which shows the detailed operation | movement of step S204 of FIG. 従来例における不都合を説明するための説明図である。It is explanatory drawing for demonstrating the inconvenience in a prior art example.

符号の説明Explanation of symbols

2 情報管理装置
11,12,13,14 ユーザ端末
21,121 データ入出力処理部
22,122 特徴値抽出処理部(特徴値抽出手段)
23,123 個人知識生成処理部(個人知識データ生成手段)
24,124 検索要求受付処理部(検索手段)
25,125 検索処理部(検索手段)
26,126 検索結果出力処理部(検索結果出力手段)
31,131 入出力データ記憶部(入出力データ記憶手段)
32 時間データ記憶部(入出力データ記憶手段)
33 期間設定データ記憶部
34,134 個人知識データ記憶部(情報蓄積手段)
132 入出力区別データ記憶手段(入出力データ記憶手段)
133 重み付け設定データ記憶部
2 Information management device 11, 12, 13, 14 User terminal 21, 121 Data input / output processing unit 22, 122 Feature value extraction processing unit (feature value extraction means)
23,123 Personal knowledge generation processing unit (personal knowledge data generation means)
24,124 Search request reception processing unit (search means)
25, 125 Search processing unit (search means)
26, 126 Search result output processing unit (search result output means)
31, 131 Input / output data storage unit (input / output data storage means)
32 hour data storage (input / output data storage means)
33 Period setting data storage unit 34, 134 Personal knowledge data storage unit (information storage means)
132 Input / output distinction data storage means (input / output data storage means)
133 Weight setting data storage unit

Claims (29)

ユーザにて入出力される入出力データと、この入出力データの入出力状況を表す入出力状況データと、を記憶する入出力データ記憶手段と、
前記入出力データの予め定められた基準に基づく特徴値を抽出する特徴値抽出手段と、
前記入出力データの特徴値と前記入出力状況データとに基づいて、前記入出力データを入出力した前記ユーザごとにおける前記入出力データの特徴を表す個人知識データを生成する個人知識データ生成手段と、
を備えたことを特徴とする情報管理装置。
Input / output data storage means for storing input / output data input / output by the user and input / output status data representing the input / output status of the input / output data;
Feature value extraction means for extracting feature values based on predetermined criteria of the input / output data;
Personal knowledge data generating means for generating personal knowledge data representing the characteristics of the input / output data for each of the users who input / output the input / output data based on the feature values of the input / output data and the input / output status data; ,
An information management device comprising:
前記特徴値抽出手段は、前記入出力データに含まれる各用語の出現頻度に基づいて特徴値を抽出する、ことを特徴とする請求項1記載の情報管理装置。   The information management apparatus according to claim 1, wherein the feature value extraction unit extracts a feature value based on an appearance frequency of each term included in the input / output data. 前記特徴値抽出手段は、前記入出力データに含まれる各用語の出現位置に基づいて特徴値を抽出する、ことを特徴とする請求項1又は2記載の情報管理装置。   3. The information management apparatus according to claim 1, wherein the feature value extraction unit extracts a feature value based on an appearance position of each term included in the input / output data. 前記特徴値抽出手段は、前記入出力データに含まれる各用語の強調情報に基づいて特徴値を抽出する、ことを特徴とする請求項1,2又は3記載の情報管理装置。   4. The information management apparatus according to claim 1, wherein the feature value extracting unit extracts a feature value based on emphasis information of each term included in the input / output data. 前記入出力状況データは、前記入出力データが入出力された時間を表すデータである、ことを特徴とする請求項1,2,3又は4記載の情報管理装置。   5. The information management apparatus according to claim 1, wherein the input / output status data is data representing a time when the input / output data is input / output. 前記個人知識データ生成手段は、予め定められた期間内に入出力が行われた複数の前記入出力データに基づいて前記個人知識データを生成する、ことを特徴とする請求項5記載の情報管理装置。   6. The information management according to claim 5, wherein the personal knowledge data generating means generates the personal knowledge data based on a plurality of the input / output data input / output within a predetermined period. apparatus. 前記入出力状況データは、前記入出力データの入出力の区別を表す入出力区別データである、ことを特徴とする請求項1,2,3,4,5又は6記載の情報管理装置。   7. The information management apparatus according to claim 1, wherein the input / output status data is input / output distinction data representing input / output distinction of the input / output data. 前記個人知識データ生成手段は、前記入出力区別データに応じて前記入出力データに重み付けを行って前記個人知識データを生成する、ことを特徴とする請求項7記載の情報管理装置。   The information management apparatus according to claim 7, wherein the personal knowledge data generating unit generates the personal knowledge data by weighting the input / output data according to the input / output distinction data. 前記個人知識データ生成手段は、前記入出力データのうち出力データに対して入力データよりも高い重み付けを行う、ことを特徴とする請求項8記載の情報管理装置。   9. The information management apparatus according to claim 8, wherein the personal knowledge data generating means weights the output data of the input / output data higher than the input data. 前記入出力状況データは、前記入出力データにおける他のデータの参照状況を表す参照状況データである、ことを特徴とする請求項1,2,3,4,5,6,7,8又は9記載の情報管理装置。   10. The input / output status data is reference status data representing a reference status of other data in the input / output data. The information management device described. 前記個人知識データ生成手段は、前記参照状況データに応じて前記入出力データに重み付けを行って前記個人知識データを生成する、ことを特徴とする請求項10記載の情報管理装置。   11. The information management apparatus according to claim 10, wherein the personal knowledge data generating means generates the personal knowledge data by weighting the input / output data in accordance with the reference situation data. 前記個人知識データ生成手段は、前記入出力データのうち所定のデータの参照先となるデータに対して重み付けを行う、ことを特徴とする請求項11記載の情報管理装置。   The information management apparatus according to claim 11, wherein the personal knowledge data generation unit weights data that is a reference destination of predetermined data among the input / output data. 複数の前記入出力データの特徴値間の類似度を算出する類似度算出手段を備え、
前記個人知識データ生成手段は、前記類似度が所定値以上の複数の前記入出力データに対して前記個人知識データの生成を行う、ことを特徴とする請求項1,2,3,4,5,6,7,8,9,10,11又は12記載の情報管理装置。
A similarity calculating means for calculating a similarity between feature values of the plurality of input / output data;
6. The personal knowledge data generating means generates the personal knowledge data for a plurality of the input / output data having a similarity equal to or greater than a predetermined value. , 6, 7, 8, 9, 10, 11 or 12.
前記個人知識データ生成手段にて生成された前記個人知識データを蓄積する情報蓄積手段を備えた、ことを特徴とする請求項1,2,3,4,5,6,7,8,9,10,11,12又は13記載の情報管理装置。   An information storage means for storing the personal knowledge data generated by the personal knowledge data generation means is provided, wherein the personal knowledge data is provided. 1, 2, 3, 4, 5, 6, 7, 8, 9, The information management device according to 10, 11, 12, or 13. 他のユーザから前記入出力データに対応するデータを含む検索要求データを受け付けて、当該検索要求データに基づいて前記情報蓄積手段に記憶された前記個人知識データを検索する検索手段を備えた、ことを特徴とする請求項14記載の情報管理装置。   Retrieval means for accepting search request data including data corresponding to the input / output data from another user and searching the personal knowledge data stored in the information storage means based on the search request data The information management apparatus according to claim 14. 前記検索手段は、検索した前記個人知識データに予め定められた基準にて類似する他の個人知識データを検索する、ことを特徴とする請求項15記載の情報管理装置。   16. The information management apparatus according to claim 15, wherein the search means searches for other personal knowledge data similar to the searched personal knowledge data based on a predetermined criterion. 前記検索手段にて検索した前記個人知識データを出力する検索結果出力手段を備えた、ことを特徴とする請求項15又は16記載の情報管理装置。   The information management apparatus according to claim 15 or 16, further comprising search result output means for outputting the personal knowledge data searched by the search means. 前記検索手段にて検索した前記個人知識データに対応する前記入出力データを、前記入出力データ記憶手段から読み出して出力する検索結果出力手段を備えた、ことを特徴とする請求項15,16又は17記載の情報管理装置。   The search result output means for reading out and outputting the input / output data corresponding to the personal knowledge data searched by the search means from the input / output data storage means, or 17. The information management device according to 17. 前記検索手段にて検索した前記個人知識データに対応する前記ユーザを特定するユーザ特定情報を出力する検索結果出力手段を備えた、ことを特徴とする請求項15,16,17又は18記載の情報管理装置。   19. Information according to claim 15, 16, 17 or 18, further comprising search result output means for outputting user specifying information for specifying the user corresponding to the personal knowledge data searched by the search means. Management device. ユーザにて入出力された入出力データと、この入出力データの入出力状況を表す入出力状況データと、を記憶する入出力データ記憶手段に接続されたコンピュータが実行する情報管理方法であって、
前記入出力データの特徴値を予め定められた基準に基づいて抽出する特徴値抽出工程と、
前記入出力データの特徴値と、前記入出力データ記憶手段に記憶された前記入出力状況データと、に基づいて、前記入出力データを入出力した前記ユーザごとにおける前記入出力データの特徴を表す個人知識データを生成する個人知識データ生成工程と、
を有することを特徴とする情報管理方法。
An information management method executed by a computer connected to input / output data storage means for storing input / output data input / output by a user and input / output status data representing the input / output status of the input / output data. ,
A feature value extracting step of extracting the feature value of the input / output data based on a predetermined criterion;
Based on the characteristic value of the input / output data and the input / output status data stored in the input / output data storage unit, the characteristic of the input / output data for each user who has input / output the input / output data is represented. Personal knowledge data generation process for generating personal knowledge data;
An information management method characterized by comprising:
前記特徴値抽出工程は、前記入出力データに含まれる各用語の出現頻度、出現位置、強調情報のうち少なくとも1つに基づいて特徴値を抽出する、ことを特徴とする請求項20記載の情報管理方法。   21. The information according to claim 20, wherein the feature value extracting step extracts a feature value based on at least one of an appearance frequency, an appearance position, and emphasis information of each term included in the input / output data. Management method. 前記入出力状況データは、前記入出力データが入出力された時間を表すデータであり、
前記個人知識データ生成工程は、予め定められた期間内に入出力が行われた複数の前記入出力データに基づいて前記個人知識データを生成する、ことを特徴とする請求項20又は21記載の情報管理方法。
The input / output status data is data representing the time when the input / output data was input / output,
22. The personal knowledge data generation step generates the personal knowledge data based on a plurality of the input / output data input / output within a predetermined period. Information management method.
前記入出力状況データは、前記入出力データの入出力の区別を表す入出力区別データであり、
前記個人知識データ生成工程は、前記入出力区別データに応じて前記入出力データに重み付けを行って前記個人知識データを生成する、ことを特徴とする請求項20,21又は22記載の情報管理方法。
The input / output status data is input / output distinction data representing input / output distinction of the input / output data,
23. The information management method according to claim 20, wherein the personal knowledge data generating step generates the personal knowledge data by weighting the input / output data according to the input / output distinction data. .
前記個人知識データ生成工程は、複数の前記入出力データの特徴値間の類似度を算出すると共に、当該類似度が所定値以上の複数の前記入出力データに対して前記個人知識データの生成を行う、ことを特徴とする請求項20,21,22又は23記載の情報管理方法。   The personal knowledge data generation step calculates similarity between feature values of the plurality of input / output data, and generates the personal knowledge data for the plurality of input / output data having the similarity equal to or greater than a predetermined value. 24. The information management method according to claim 20, 21, 22, or 23. ユーザにて入出力された入出力データと、この入出力データの入出力状況を表す入出力状況データと、を記憶する入出力データ記憶手段に接続されたコンピュータに、
前記入出力データの特徴値を予め定められた基準に基づいて抽出する特徴値抽出手段と、
前記入出力データの特徴値と、前記入出力データ記憶手段に記憶された前記入出力状況データと、に基づいて、前記入出力データを入出力した前記ユーザごとにおける前記入出力データの特徴を表す個人知識データを生成する個人知識データ生成手段と、
を実現するための情報管理用プログラム。
To a computer connected to input / output data storage means for storing input / output data input / output by the user and input / output status data representing the input / output status of the input / output data,
Feature value extracting means for extracting feature values of the input / output data based on a predetermined criterion;
Based on the characteristic value of the input / output data and the input / output status data stored in the input / output data storage unit, the characteristic of the input / output data for each user who has input / output the input / output data is represented. Personal knowledge data generating means for generating personal knowledge data;
Information management program for realizing
前記コンピュータに、
前記入出力データに含まれる各用語の出現頻度、出現位置、強調情報のうち少なくとも1つに基づいて特徴値を抽出する前記特徴値抽出手段、を実現するための請求項25記載の情報管理用プログラム。
In the computer,
26. For information management according to claim 25, for realizing the feature value extracting means for extracting a feature value based on at least one of appearance frequency, appearance position, and emphasis information of each term included in the input / output data. program.
前記コンピュータに、
前記入出力状況データが前記入出力データの入出力時間を表すデータである場合に、予め定められた期間内に入出力が行われた複数の前記入出力データに基づいて前記個人知識データを生成する前記個人知識データ生成手段、を実現するための請求項25又は26記載の情報管理用プログラム。
In the computer,
When the input / output status data is data representing the input / output time of the input / output data, the personal knowledge data is generated based on a plurality of the input / output data input / output within a predetermined period. 27. The information management program according to claim 25 or 26 for realizing the personal knowledge data generating means.
前記コンピュータに、
前記入出力状況データが前記入出力データの入出力の区別を表す入出力区別データである場合に、前記入出力区別データに応じて前記入出力データに重み付けを行って前記個人知識データを生成する前記個人知識データ生成手段、を実現するための請求項25,26又は27記載の情報管理用プログラム。
In the computer,
When the input / output status data is input / output distinction data representing the input / output distinction of the input / output data, the input / output distinction data is weighted to generate the personal knowledge data. 28. The information management program according to claim 25, 26 or 27 for realizing the personal knowledge data generating means.
前記コンピュータに、
複数の前記入出力データの特徴値間の類似度を算出する類似度算出手段と、
前記類似度が所定値以上の複数の前記入出力データに対して前記個人知識データの生成を行う前記個人知識データ生成手段と、を実現するための請求項25,26,27又は28記載の情報管理用プログラム。
In the computer,
Similarity calculating means for calculating the similarity between feature values of the plurality of input / output data;
29. Information according to claim 25, 26, 27, or 28, for realizing the personal knowledge data generating means for generating the personal knowledge data for a plurality of the input / output data having a similarity equal to or greater than a predetermined value. Administrative program.
JP2004336619A 2004-11-19 2004-11-19 Information management device and method, and information management program Pending JP2006146621A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004336619A JP2006146621A (en) 2004-11-19 2004-11-19 Information management device and method, and information management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004336619A JP2006146621A (en) 2004-11-19 2004-11-19 Information management device and method, and information management program

Publications (1)

Publication Number Publication Date
JP2006146621A true JP2006146621A (en) 2006-06-08

Family

ID=36626219

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004336619A Pending JP2006146621A (en) 2004-11-19 2004-11-19 Information management device and method, and information management program

Country Status (1)

Country Link
JP (1) JP2006146621A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008117134A (en) * 2006-11-02 2008-05-22 Nippon Telegr & Teleph Corp <Ntt> Period extraction device, period extraction method, period extraction program implementing the method, and recording medium storing its program
JP2017505964A (en) * 2013-11-27 2017-02-23 株式会社Nttドコモ Automatic task classification based on machine learning
WO2020079748A1 (en) * 2018-10-16 2020-04-23 株式会社島津製作所 Case searching method and case searching system
US11630824B2 (en) 2018-10-16 2023-04-18 Shimadzu Corporation Document search method and document search system

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1153394A (en) * 1997-07-29 1999-02-26 Just Syst Corp Device and method for document processing and storage medium storing document processing program
JPH1166081A (en) * 1997-08-12 1999-03-09 N T T Data:Kk Profile acquisition system, information provision system, profile acquiring method and medium
JP2000293526A (en) * 1999-04-06 2000-10-20 Ntt Data Corp Liking information collection system
JP2001306606A (en) * 2000-04-24 2001-11-02 Nippon Telegr & Teleph Corp <Ntt> Communication party selecting method and recording medium with recorded communication party selection processing program
JP2002140361A (en) * 2000-10-31 2002-05-17 Hitachi Ltd Method and device for document retrieval, and storage medium for document retrieving program
JP2002334106A (en) * 2001-05-11 2002-11-22 Fujitsu Ltd Device, method, program for extracting topic and recording medium to record the same program
JP2003256464A (en) * 2002-03-01 2003-09-12 Osaka Gas Co Ltd Display for newly-received contribution information
JP2003288342A (en) * 2002-03-28 2003-10-10 Ricoh Co Ltd Information processor
JP2004110435A (en) * 2002-09-18 2004-04-08 Ricoh Co Ltd Profile generating device and information providing device

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1153394A (en) * 1997-07-29 1999-02-26 Just Syst Corp Device and method for document processing and storage medium storing document processing program
JPH1166081A (en) * 1997-08-12 1999-03-09 N T T Data:Kk Profile acquisition system, information provision system, profile acquiring method and medium
JP2000293526A (en) * 1999-04-06 2000-10-20 Ntt Data Corp Liking information collection system
JP2001306606A (en) * 2000-04-24 2001-11-02 Nippon Telegr & Teleph Corp <Ntt> Communication party selecting method and recording medium with recorded communication party selection processing program
JP2002140361A (en) * 2000-10-31 2002-05-17 Hitachi Ltd Method and device for document retrieval, and storage medium for document retrieving program
JP2002334106A (en) * 2001-05-11 2002-11-22 Fujitsu Ltd Device, method, program for extracting topic and recording medium to record the same program
JP2003256464A (en) * 2002-03-01 2003-09-12 Osaka Gas Co Ltd Display for newly-received contribution information
JP2003288342A (en) * 2002-03-28 2003-10-10 Ricoh Co Ltd Information processor
JP2004110435A (en) * 2002-09-18 2004-04-08 Ricoh Co Ltd Profile generating device and information providing device

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008117134A (en) * 2006-11-02 2008-05-22 Nippon Telegr & Teleph Corp <Ntt> Period extraction device, period extraction method, period extraction program implementing the method, and recording medium storing its program
JP4610543B2 (en) * 2006-11-02 2011-01-12 日本電信電話株式会社 Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program
JP2017505964A (en) * 2013-11-27 2017-02-23 株式会社Nttドコモ Automatic task classification based on machine learning
WO2020079748A1 (en) * 2018-10-16 2020-04-23 株式会社島津製作所 Case searching method and case searching system
WO2020080376A1 (en) * 2018-10-16 2020-04-23 株式会社島津製作所 Case history retrieval method and case history retrieval system
JPWO2020080376A1 (en) * 2018-10-16 2021-11-04 株式会社島津製作所 Case search method and case search system
US20220035846A1 (en) * 2018-10-16 2022-02-03 Shimadzu Corporation Case search method and case search system
US11630824B2 (en) 2018-10-16 2023-04-18 Shimadzu Corporation Document search method and document search system

Similar Documents

Publication Publication Date Title
US8200667B2 (en) Method and apparatus for constructing user profile using content tag, and method for content recommendation using the constructed user profile
JP5454357B2 (en) Information processing apparatus and method, and program
KR101775742B1 (en) Contextual queries
US20090265338A1 (en) Contextual ranking of keywords using click data
US20110047161A1 (en) Query/Document Topic Category Transition Analysis System and Method and Query Expansion-Based Information Retrieval System and Method
US20110060717A1 (en) Systems and methods for improving web site user experience
JP5329540B2 (en) User-centric information search method, computer-readable recording medium, and user-centric information search system
JP6123143B1 (en) Patent requirement conformity prediction device and patent requirement conformity prediction program
KR20090087269A (en) Method and apparatus for information processing based on context, and computer readable medium thereof
JP5952711B2 (en) Prediction server, program and method for predicting future number of comments in prediction target content
Raad et al. Discovering relationship types between users using profiles and shared photos in a social network
JP2017097823A (en) Search server, terminal equipment, and search method to be used for distributed network
JP4879775B2 (en) Dictionary creation method
Kuck et al. Context-sensitive service discovery meets information retrieval
JP2006285526A (en) Information retrieval according to image data
JP2019128925A (en) Event presentation system and event presentation device
JP2006146621A (en) Information management device and method, and information management program
EP4002152A1 (en) Data tagging and synchronisation system
JP4134975B2 (en) Topic document presentation method, apparatus, and program
JPWO2015063873A1 (en) Information search system and information search method
KR101319024B1 (en) Apparatus and method for searching personalized contents using a mobile terminal
CN110147488B (en) Page content processing method, processing device, computing equipment and storage medium
JP2010015394A (en) Link destination presentation device and computer program
JP4900475B2 (en) Electronic document management apparatus and electronic document management program
Garrido et al. KGNR: A knowledge-based geographical news recommender

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101019