JP4202339B2 - 類似事例に基づく予測を行う予測装置および方法 - Google Patents
類似事例に基づく予測を行う予測装置および方法 Download PDFInfo
- Publication number
- JP4202339B2 JP4202339B2 JP2005151464A JP2005151464A JP4202339B2 JP 4202339 B2 JP4202339 B2 JP 4202339B2 JP 2005151464 A JP2005151464 A JP 2005151464A JP 2005151464 A JP2005151464 A JP 2005151464A JP 4202339 B2 JP4202339 B2 JP 4202339B2
- Authority
- JP
- Japan
- Prior art keywords
- case
- similar
- unknown
- value
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 54
- 238000000605 extraction Methods 0.000 claims description 109
- 238000004364 calculation method Methods 0.000 claims description 81
- 238000003860 storage Methods 0.000 claims description 30
- 238000011156 evaluation Methods 0.000 description 75
- 238000009826 distribution Methods 0.000 description 32
- 238000012545 processing Methods 0.000 description 31
- 230000008569 process Effects 0.000 description 23
- 238000012217 deletion Methods 0.000 description 18
- 230000037430 deletion Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 15
- 239000000284 extract Substances 0.000 description 12
- 230000004044 response Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000005070 sampling Methods 0.000 description 9
- 238000012937 correction Methods 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 7
- 238000010187 selection method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
毛利隆夫(Takao Mori), 「Nearest Neighbor法と記憶に基づく推論」, 人口知能学会誌, Vol.12 No.2, p188-p195, March 1997.
ある未知事例に関する予測を行うためには、その未知事例と各既知事例との間の類似度を計算して、類似事例を抽出しなければならない。実は、類似事例に基づく予測に要する処理時間のほとんどが、この類似度計算の時間である。従来の予測方法では、類似度計算の時間を短縮するために、既知事例に対して一定の前処理を行う必要があった(非特許文献1)。
本発明の第1の原理による予測装置は、決定手段1と予測手段2を備え、類似事例に基づく予測を行う。
類似事例抽出手段3は、1つ以上のフィールドからなる既知事例データの集合から、類似度に基づいて未知事例データに類似する1つ以上の類似事例データを抽出する。
類似度計算手段5は、上記既知事例データの集合における上記未知フィールドの値の分布と上記未知事例データの未知フィールドの値に依存する重みをフィールドごとに計算し、フィールドごとの重みを用いて類似度を計算する。
類似度条件計算手段6は、類似事例抽出条件と既に得られている暫定的な類似事例データの集合を用いて、既知事例データを暫定的な類似事例データの集合に加えるための類似度条件を計算する。
条件付き類似度計算手段7は、類似度計算の途中で、類似度条件計算手段6が出力した類似度条件が満たされないことが確定した時点で、その既知事例データは類似事例データになり得ないと判断し、計算を中止する。そして、生成手段8は、類似度計算が中止されなかった既知事例データを用いて類似事例データの集合を生成し、予測装置は、その類似事例データの集合を用いて予測を行う。
既知事例格納手段は、1つ以上のフィールドからなる既知事例データの集合を格納する。未知事例格納手段は、未知事例データを格納する。類似事例抽出手段は、既知事例データの集合から、類似度に基づいて未知事例データに類似する1つ以上の類似事例データを抽出する。類似事例集合記憶手段は、抽出された1つ以上の類似事例データを記憶する。予測結果生成手段は、抽出された1つ以上の類似事例データを用いて、未知事例データの未知フィールドの値を予測し、予測値を出力する。
類似度計算手段は、既知事例データのフィールドごとにフィールド値を複数の領域に分割し、既知事例データの集合をフィールド値により部分集合に分割し、j番目のフィールドの値がv番目の領域に含まれているときに未知フィールドの値がc番目の領域に含まれている条件付き確率p(j,v,c)と、未知フィールドの値がc番目の領域に含まれる確率p(c)と、未知フィールドの値の数N(c)とから、
q(j,v,c)=p(j,v,c)/p(c)
なる演算によりj番目のフィールドの重みw(j,v)を計算し、得られた重みw(j,v)を用いて類似度を計算する。
例えば、図1の決定手段1と予測手段2は、それぞれ、後述する図2の類似事例抽出条件決定部12と予測部13に対応し、図1の類似事例抽出手段3と類似度計算手段5は、後述する図5の類似事例抽出部41に対応し、図1の予測結果生成手段4は、図5の予測結果生成部42に対応する。また、例えば、図1の類似度条件計算手段6と条件付き類似度計算手段7は、それぞれ、後述する図6の類似度条件計算部54と条件付き類似度計算部51に対応し、図1の生成手段8は、図6の類似事例集合更新部52と類似事例集合記憶部53に対応する。
本発明では、事例間の類似度計算の際に、ある既知事例が類似事例になり得ないことが分かった時点で計算を中止する。これにより、類似事例の抽出が高速化され、既知事例集合に対する前処理を行わなくても、予測が高速化される。
a=0 or 1/k1≦a≦1 (1)
b=0 or s1≦b≦s2 (2)
ただし、a>0もしくはb>0であるものとする。k1、s1、およびs2の値は、上述したような方法で設定することができる。この場合、最大条件計算部26は、次のような条件を最大条件として出力する。
s≧s1もしくはk=k1 (3)
次に、図5は、図2の予測部13の構成図である。図5の予測部13は、類似事例抽出部41と予測結果生成部42を備える。類似事例抽出部41は、既知事例集合Aと未知事例集合Uを入力とし、類似事例抽出条件決定部12が出力する条件に合致する類似事例集合を出力する。予測結果生成部42は、類似事例抽出部41の出力を用いて予測を行い、予測結果を出力する。
図7は、図3の入力用事例生成部21の第1の例を示している。図7の入力用事例生成部21は分割部61を備え、既知事例集合Aを2つに分割して、一方を既知事例入力用事例集合Bとして出力し、もう一方を未知事例入力用事例集合Cとして出力する。分割部61における分割方法としては、例えば、ランダムサンプリング等が考えられる。
s(i)=s1+i*(s2−s1)/100 (7)
ただし、iは、0≦i≦100なる整数である。(7)式により、sは、s(0)からs(100)までの101点に離散化され、これに対応して101個の類似事例抽出条件が生成される。
例えば、図18、19、20、および21に示した類似事例集合が入力された場合、“類似事例数=1”という条件に従うと、各類似事例集合から類似度が最大の類似事例が1つずつ抽出され、図22、23、24、および25に示すような類似事例集合が生成される。
次に、条件評価部34は、未知事例入力用事例集合Cを用いて条件ごとの予測結果を評価し、各条件に対する評価値を生成する。テスト用の未知事例のクラス値は以下では、評価値の値が大きいほど良好な評価結果を表すものとして、条件評価部34のいくつかの実施形態について説明する。
(+,+)の場合 w=1.0
(+,−)の場合 w=1.0
(−,+)の場合 w=2.0
(−,−)の場合 w=1.0
そして、評価値の初期値を0とおき、各未知事例に対して、予測値と未知事例のクラス値が一致した場合には両者の組合せから得られる重みを評価値に加え、両者が一致しなかった場合にはその重みを評価値から減ずる。これにより、最終的にクラスフィールドの重みを加味した評価値が得られる。
(類推実行時間)=(既知事例数)×(フィールド数)+α×(類似事例数) (11)
(評価値)=(実行時間を加味する前の評価値)−β×(類推実行時間) (12)
(11)式において、類似事例数が類似事例抽出条件のみから定まらない場合は、条件付き類似事例抽出部32から出力された類似事例集合の事例数の平均をとればよい。また、パラメータαは、類似事例抽出条件を基に決められ、パラメータβは、ユーザが実行時間をどれほど重要と認識するかを基に決められる。
図44は、図8の事例削除部62の処理のフローチャートである。事例削除部62は、まず、未知事例入力用事例集合Cの事例の番号を表す制御変数Iを1とおき(ステップS1)、Iを未知事例入力用事例集合Cの事例数|C|と比較する(ステップS2)。ここでは、未知事例入力用事例集合Cは既知事例集合Aに一致している。
以上説明した図2の予測装置11は、任意のデータ分類処理に適用することができる。図50は、予測装置11を含むデータ分類装置の構成図である。図50のデータ分類装置は、予測装置11、既知事例データベース81、未知事例データベース82、入力装置83、分類装置84、および出力装置85を備える。
2 予測手段
3 類似事例抽出手段
4 予測結果生成手段
5 類似度計算手段
6 類似度条件計算手段
7 条件付き類似度計算手段
8 生成手段
11 予測装置
12 類似事例抽出条件決定部
13 予測部
21 入力用事例生成部
22、41 類似事例抽出部
23 類似事例削除部
24 最適条件決定部
25 条件出力部
26 最大条件計算部
27 最大条件修正部
31 条件離散化部
32 条件付き類似事例抽出部
33、42 予測結果生成部
34 条件評価部
35 最適条件選択部
51 条件付き類似度計算部
52 類似事例集合更新部
53 類似事例集合記憶部
54 類似度条件計算部
61 分割部
62 事例削除部
63 サンプリング部
71 一次予測生成部
72 予測修正部
81、82、100 データベース
83、93 入力装置
84 分類装置
85、94 出力装置
86 ネットワーク
91 CPU
95 外部記憶装置
96 媒体駆動装置
97 ネットワーク接続装置
98 バス
99 可搬記録媒体
Claims (3)
- 類似事例に基づく予測を行う予測装置であって、
1つ以上のフィールドからなる既知事例データの集合を格納する既知事例格納手段と、
未知事例データを格納する未知事例格納手段と、
前記既知事例データの集合から、類似度に基づいて前記未知事例データに類似する1つ以上の類似事例データを抽出する類似事例抽出手段と、
抽出された1つ以上の類似事例データを記憶する類似事例集合記憶手段と、
前記1つ以上の類似事例データを用いて、前記未知事例データの未知フィールドの値を予測し、予測値を出力する予測結果生成手段と、
前記既知事例データのフィールドごとにフィールド値を複数の領域に分割し、前記既知事例データの集合をフィールド値により部分集合に分割し、j番目のフィールドの値がv番目の領域に含まれているときに前記未知フィールドの値がc番目の領域に含まれている条件付き確率p(j,v,c)と、該未知フィールドの値がc番目の領域に含まれる確率p(c)と、該未知フィールドの値の数N(c)とから、
q(j,v,c)=p(j,v,c)/p(c)
なる演算によりj番目のフィールドの重みw(j,v)を計算し、得られた重みw(j,v)を用いて前記類似度を計算する類似度計算手段と
を備えることを特徴とする予測装置。 - 類似事例に基づく予測を行うコンピュータのためのプログラムを記録した記録媒体であって、
1つ以上のフィールドからなる既知事例データの集合を格納する既知事例格納手段内の該既知事例データのフィールドごとにフィールド値を複数の領域に分割し、該既知事例データの集合をフィールド値により部分集合に分割し、j番目のフィールドの値がv番目の領域に含まれているときに、未知事例格納手段に格納された未知事例データの未知フィールドの値がc番目の領域に含まれている条件付き確率p(j,v,c)と、該未知フィールドの値がc番目の領域に含まれる確率p(c)と、該未知フィールドの値の数N(c)とから、
q(j,v,c)=p(j,v,c)/p(c)
なる演算によりj番目のフィールドの重みw(j,v)を計算するステップと、
得られた重みw(j,v)を用いて各既知事例データと前記未知事例データの類似度を計算するステップと、
前記既知事例データの集合から、前記類似度に基づいて前記未知事例データに類似する1つ以上の類似事例データを抽出するステップと、
前記1つ以上の類似事例データを用いて、前記未知事例データの未知フィールドの値を予測し、予測値を生成するステップと
を含む処理を前記コンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。 - コンピュータを用いた類似事例に基づく予測方法であって、
前記コンピュータが、
1つ以上のフィールドからなる既知事例データの集合を格納する既知事例格納手段内の該既知事例データのフィールドごとにフィールド値を複数の領域に分割し、該既知事例データの集合をフィールド値により部分集合に分割し、j番目のフィールドの値がv番目の領域に含まれているときに、未知事例格納手段に格納された未知事例データの未知フィールドの値がc番目の領域に含まれている条件付き確率p(j,v,c)と、該未知フィールドの値がc番目の領域に含まれる確率p(c)と、該未知フィールドの値の数N(c)とから、
q(j,v,c)=p(j,v,c)/p(c)
なる演算によりj番目のフィールドの重みw(j,v)を計算し、
得られた重みw(j,v)を用いて各既知事例データと前記未知事例データの類似度を計算し、
前記既知事例データの集合から、前記類似度に基づいて前記未知事例データに類似する1つ以上の類似事例データを抽出し、
前記1つ以上の類似事例データを用いて、前記未知事例データの未知フィールドの値を予測する
ことを特徴とする予測方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005151464A JP4202339B2 (ja) | 2005-05-24 | 2005-05-24 | 類似事例に基づく予測を行う予測装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005151464A JP4202339B2 (ja) | 2005-05-24 | 2005-05-24 | 類似事例に基づく予測を行う予測装置および方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33250398A Division JP3762840B2 (ja) | 1998-11-24 | 1998-11-24 | 類似事例に基づく予測を行う予測装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005302054A JP2005302054A (ja) | 2005-10-27 |
JP4202339B2 true JP4202339B2 (ja) | 2008-12-24 |
Family
ID=35333396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005151464A Expired - Fee Related JP4202339B2 (ja) | 2005-05-24 | 2005-05-24 | 類似事例に基づく予測を行う予測装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4202339B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7552105B2 (en) | 2006-03-13 | 2009-06-23 | Fujitsu Limited | Importance degree calculation program, importance degree calculation method, and importance degree calculation apparatus |
JP6893323B2 (ja) * | 2016-10-04 | 2021-06-23 | パナソニックIpマネジメント株式会社 | 発電設備情報推定システムおよび発電設備情報推定方法 |
-
2005
- 2005-05-24 JP JP2005151464A patent/JP4202339B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005302054A (ja) | 2005-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3762840B2 (ja) | 類似事例に基づく予測を行う予測装置および方法 | |
US8990145B2 (en) | Probabilistic data mining model comparison | |
Ahn et al. | Bankruptcy prediction modeling with hybrid case-based reasoning and genetic algorithms approach | |
US7606784B2 (en) | Uncertainty management in a decision-making system | |
JP7365840B2 (ja) | プロジェクト加速の自動評価 | |
US11366806B2 (en) | Automated feature generation for machine learning application | |
Fan et al. | Adaptive partition intuitionistic fuzzy time series forecasting model | |
Zhou et al. | Deep learning-based intelligent multilevel predictive maintenance framework considering comprehensive cost | |
Weng et al. | Mining time series data for segmentation by using Ant Colony Optimization | |
Liu et al. | Residual useful life prognosis of equipment based on modified hidden semi-Markov model with a co-evolutional optimization method | |
Hasanpour et al. | Improving rule-based classification using Harmony Search | |
JP7488718B2 (ja) | プロジェクト予兆検知装置及びプロジェクト予兆検知方法 | |
JP4202339B2 (ja) | 類似事例に基づく予測を行う予測装置および方法 | |
CN110717537B (zh) | 训练用户分类模型、执行用户分类预测的方法及装置 | |
JP4440828B2 (ja) | 類似事例に基づく予測を行う予測装置および方法 | |
Nandal et al. | Employee Attrition: Analysis of Data Driven Models | |
KR20200112495A (ko) | 상권 분석 서비스 제공 서버 및 그 방법 | |
JP2020140521A (ja) | 人的判断の予測装置、予測プログラム及び予測方法 | |
CN113537731A (zh) | 基于强化学习的设计资源能力评估方法 | |
JP4230890B2 (ja) | モデル同定装置,モデル同定プログラム及びモデル同定装置の動作方法 | |
CN113723660A (zh) | 一种基于dnn-lstm融合模型的特定行为类型预测方法及系统 | |
Konar et al. | An introduction to time-series prediction | |
Hulianytskyi et al. | Development and analysis of genetic algorithm for time series forecasting problem | |
JP4010843B2 (ja) | 行動量生成装置、行動量生成方法および行動量生成プログラム | |
US12147463B2 (en) | Method for address matching and related electronic device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080722 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080905 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081007 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081008 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111017 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111017 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121017 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121017 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131017 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |