JP2010191589A - Action prediction apparatus, action prediction method, and program - Google Patents
Action prediction apparatus, action prediction method, and program Download PDFInfo
- Publication number
- JP2010191589A JP2010191589A JP2009034008A JP2009034008A JP2010191589A JP 2010191589 A JP2010191589 A JP 2010191589A JP 2009034008 A JP2009034008 A JP 2009034008A JP 2009034008 A JP2009034008 A JP 2009034008A JP 2010191589 A JP2010191589 A JP 2010191589A
- Authority
- JP
- Japan
- Prior art keywords
- stay
- place
- pattern
- behavior
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009471 action Effects 0.000 title claims abstract description 106
- 238000000034 method Methods 0.000 title claims description 130
- 230000008569 process Effects 0.000 claims description 74
- 238000012545 processing Methods 0.000 claims description 50
- 238000005065 mining Methods 0.000 claims description 22
- 230000007704 transition Effects 0.000 claims description 6
- 229940036051 sojourn Drugs 0.000 abstract 10
- 230000006399 behavior Effects 0.000 description 104
- 230000006870 function Effects 0.000 description 27
- 230000008859 change Effects 0.000 description 23
- 238000004364 calculation method Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 238000000605 extraction Methods 0.000 description 8
- 239000000284 extract Substances 0.000 description 7
- 238000013500 data storage Methods 0.000 description 4
- 239000006185 dispersion Substances 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
この発明は、ユーザの現在の滞在地と過去の行動パターンをもとに、当該ユーザの今後の行動を予測する行動予測装置、行動予測方法及びプログラムに関する。 The present invention relates to a behavior prediction apparatus, a behavior prediction method, and a program for predicting a future behavior of a user based on a user's current place of stay and past behavior patterns.
従来、時系列データから頻出なパターンを抽出する手法として、系列マイニングの手法が知られている。この手法は、顧客IDと購入した商品及び購入日時を記録した購買記録データベースが存在する場合に、この購買記録データベースに記録された購買データをもとに、顧客による典型的な商品購買パターンを抽出するものである。 Conventionally, a sequence mining technique is known as a technique for extracting frequent patterns from time-series data. This method extracts typical product purchase patterns by customers based on the purchase data recorded in the purchase record database when there is a purchase record database that records the customer ID, the purchased product, and the purchase date and time. To do.
また、最近では商品購買パターンの抽出用途に止まらず、ユーザの滞在地の遷移を表す行動パターンを抽出するために、上記系列マイニングの手法を適用する方法が提案されている。この方法は、例えば先ずユーザが所持する端末のGPS(Global Positioning System)受信データから、マイニング処理によってユーザが滞在した場所を抽出し、さらに滞在場所間の遷移行動をマルコフモデルとして表現して遷移確率を計算することで、ある場所に滞在しているユーザが次に滞在する場所を予測するものである(例えば、非特許文献1を参照。)。
Recently, a method of applying the above-described series mining method has been proposed in order to extract a behavior pattern representing a transition of a user's staying place, without being limited to the use of extracting a product purchase pattern. In this method, for example, first, a location where a user stays is extracted by mining processing from GPS (Global Positioning System) received data of a terminal possessed by the user, and the transition behavior between the stay locations is expressed as a Markov model. Is used to predict a place where a user staying at a certain place will stay next (see Non-Patent
ところが、上記従来の方法は滞在地間の遷移確率に基づいて行動予測を行うものとなっており、時刻を考慮していないため、予測を誤るおそれがあった。例えば、ユーザが通勤である駅を使用している場合に、朝にその駅に滞在している状況と、夜に同じ駅に滞在している状況とでは、その人が次に向かう先は異なるのが普通である。しかし、時刻を考慮せずに場所間の遷移確率のみで次の行き先を予測しようとすると、行き先の予測結果が正反対になる可能性がある。 However, the above-described conventional method performs behavior prediction based on the transition probability between the places of stay, and does not consider the time, so there is a risk of erroneous prediction. For example, when a user is using a commuting station, the destination where the person goes next differs depending on whether the user stays at the station in the morning or the situation where the user stays at the same station at night. Is normal. However, if the next destination is predicted only by the transition probability between places without considering the time, the predicted result of the destination may be opposite.
この発明は上記事情に着目してなされたもので、その目的とするところは、ユーザの滞在地と滞在時刻の両方を考慮することでユーザの行動をより高精度に予測できるようにした行動予測装置、行動予測方法及びプログラムを提供することにある。 The present invention has been made paying attention to the above circumstances, and its purpose is to predict the behavior of the user with higher accuracy by considering both the place of stay and the time of stay of the user. To provide an apparatus, a behavior prediction method, and a program.
上記目的を達成するためにこの発明の一観点は、ユーザの滞在地及びその滞在時刻を表す情報を含む滞在地データを取得してこの取得された滞在地データの集合を滞在履歴記憶部に格納する手段と、前記滞在履歴記憶部に格納された滞在地データの集合に対し系列マイニングの処理を実行して前記ユーザの特徴的な遷移行動を滞在地の系列とその滞在時刻情報により表した行動パターン情報を生成し、この生成された行動パターン情報の集合を行動パターン記憶部に格納する行動パターン生成手段と、適合行動パターン選択手段とを備える。そして、この適合行動パターン選択手段により、前記取得された滞在地データと、前記行動パターン記録部に格納された行動パターン情報の集合に基づいて、前記滞在地データに含まれる滞在地及びその滞在時刻情報と対応する滞在地及びその滞在時刻情報を含む適合行動パターン情報を前記行動パターン情報の集合の中から選択するように構成したものである。 In order to achieve the above object, one aspect of the present invention is to acquire stay place data including information indicating a stay place and a stay time of a user, and store the set of obtained stay place data in a stay history storage unit. Means for performing a series mining process on a set of stay place data stored in the stay history storage unit and expressing the characteristic transition behavior of the user by a stay place series and its stay time information Action pattern generating means for generating pattern information and storing the generated set of action pattern information in an action pattern storage unit, and adaptive action pattern selecting means are provided. Based on the acquired stay place data and the set of action pattern information stored in the action pattern recording unit, the stay place included in the stay place data and the stay time are obtained by the adapted action pattern selection unit. The adapted behavior pattern information including the stay location corresponding to the information and the stay time information is selected from the set of behavior pattern information.
したがってこの発明の一観点によれば、ユーザの現在の滞在地と、当該ユーザの過去の行動パターンの集合とから、ユーザの現在の行動形態に適合する行動パターンを探索する際に、ユーザの滞在地だけでなく当該滞在地におけるユーザの滞在時刻情報も考慮されて行動パターンが探索される。このため、滞在地のみに基づいて行動パターンを選択する場合に比べ、ユーザの現在の行動形態に適合する行動パターンを高精度に選択することが可能となる。 Therefore, according to one aspect of the present invention, when searching for an action pattern that matches a user's current action form from the user's current place of stay and a set of the user's past action patterns, the user's stay The behavior pattern is searched in consideration of not only the place but also the stay time information of the user in the stay place. For this reason, compared with the case where an action pattern is selected based only on a stay place, it becomes possible to select the action pattern which suits a user's present action form with high precision.
また、この発明の一観点では以下のような各種実施態様が考えられる。
第1の実施態様は、行動パターンを生成する際に、前記滞在時刻情報として滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散を表す値を含む行動パターン情報を生成する。そして、適合行動パターンを選択する際に、前記行動パターン記録部に格納された行動パターン情報の集合の中から前記取得された滞在地データに含まれる滞在地と地名が等しい滞在地を抽出し、この抽出された滞在地の各々について、前記取得された滞在地データに含まれる滞在地との一致の度合いを表す尤度を、前記取得された滞在地データに含まれる滞在時刻と、前記抽出された滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散を表す値とに基づいて計算し、この計算された尤度に基づいて当該尤度が予め設定した条件を満たす滞在地を前記抽出された滞在地の中から選択して、この選択された滞在地と当該滞在地を含む行動パターンを表す情報を適合行動パターン情報として出力するものである。
Moreover, the following various embodiments can be considered from one aspect of the present invention.
In the first embodiment, when the behavior pattern is generated, the behavior pattern information including a value representing the average and variance of the stay start time or the stay end time at the stay place is generated as the stay time information. And, when selecting a suitable behavior pattern, from the set of behavior pattern information stored in the behavior pattern recording unit, to extract a stay place where the place name and the place name included in the acquired stay place data is equal, For each of the extracted stay destinations, the likelihood representing the degree of coincidence with the stay place included in the acquired stay place data, the stay time included in the acquired stay place data, and the extracted Calculated based on the average and variance of the stay start time or stay end time in the stay place, and based on the calculated likelihood, the stay place that satisfies the preset condition is extracted. Information indicating the selected stay place and an action pattern including the stay place is output as the matching action pattern information.
このようにすると、滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散をもとに、ユーザの現在の滞在地と過去の行動パターン中の滞在地との一致の度合いが尤度として算出され、その算出結果をもとにユーザの現在の行動形態に適合する行動パターンが選択される。このため、ユーザの現在の滞在地及び滞在時刻と地名及び時刻が完全一致する行動パターンを選択する場合に比べ、柔軟性の高い選択が可能となる。 In this way, based on the average and variance of the stay start time or stay end time at the stay place, the degree of coincidence between the user's current stay place and the stay place in the past behavior pattern is calculated as the likelihood. Based on the calculation result, an action pattern that matches the current action form of the user is selected. For this reason, compared with the case where the user's current place of stay and stay time, and a behavior pattern whose place name and time completely match, selection with higher flexibility is possible.
第2の実施態様は、適合行動パターン選択手段により選択された適合行動パターン情報に含まれる滞在地の系列及び滞在時刻情報に基づいて、前記ユーザが以後移動する滞在地とその到着時刻を予測してその予測結果を表す情報を出力する行動予測処理手段を、さらに備えたものである。
このようにすると、ユーザが今後移動する滞在地とその到着時刻が出力され、例えば情報管理者に提示される。このため、ユーザの行動を把握しようとする場合に情報管理者は、行動パターン情報からユーザの目的地と到着時刻を予測する作業が不要となり、これにより作業性の向上と予測精度の向上を図ることができる。
In the second embodiment, based on the stay place sequence and stay time information included in the conforming action pattern information selected by the conforming action pattern selecting means, the stay place where the user will move and its arrival time are predicted. And a behavior prediction processing means for outputting information representing the prediction result.
If it does in this way, the place where a user will move from now on, and its arrival time are outputted, for example, are shown to an information manager. For this reason, when trying to grasp the user's behavior, the information manager does not need to predict the user's destination and arrival time from the behavior pattern information, thereby improving workability and prediction accuracy. be able to.
すなわちこの発明によれば、ユーザの滞在地と滞在時刻の両方を考慮することでユーザの行動をより高精度に予測できるようにした行動予測装置、行動予測方法及びプログラムを提供することができる。 That is, according to the present invention, it is possible to provide an action prediction device, an action prediction method, and a program that can predict a user's action with higher accuracy by considering both the place of stay and the stay time of the user.
以下、図面を参照してこの発明に係わる実施形態を説明する。
図1は、この発明の一実施形態に係わる行動予測装置のハードウエア及びソフトウエアの構成を示すブロック図である。
行動予測装置1は、例えばユーザが所持する携帯端末又はパーソナル・コンピュータ等のユーザ端末装置との間で、IP(Internet Protocol)網等の通信ネットワークを介して通信が可能なサーバ装置からなる。
Embodiments according to the present invention will be described below with reference to the drawings.
FIG. 1 is a block diagram showing the hardware and software configurations of an action prediction apparatus according to an embodiment of the present invention.
The
行動予測装置1は、マイクロプロセッサからなる中央処理ユニット(CPU;Central Processing Unit)11を備え、このCPU11にバス12を介してプログラムメモリ13及びデータメモリ14を接続し、さらに通信インタフェース15及び入出力インタフェース16を接続している。
The
通信インタフェース15は、CPU11の制御の下で、通信ネットワークにより規定される通信プロトコルに従い、ユーザの携帯端末からその滞在地データを受信する。通信プロトコルとしては、例えばTCP/IP(Transmission Control Protocol/Internet Protocol)が使用される。
The
入出力インタフェース16には、入力デバイス17及び出力デバイス18が接続されている。入力デバイス17は、キーボード及びマウスにより構成される。出力デバイス18はディスプレイやプリンタからなる。入出力インタフェース16は、上記入力デバイス17による操作情報をCPU11に伝えると共に、後述する行動予測処理プログラム135により得られる、ユーザの次の行動の予測結果を表す情報をCPU11の指示に従い上記出力デバイス18を用いて表示又はプリント出力させる。なお、上記ユーザの次の行動の予測結果を表す情報は、通信インタフェース15からユーザの端末装置又はユーザから許可されたサービス事業者の端末装置へ送信することも可能である。
An
データメモリ14には、この発明を実施するために必要な記憶部として、滞在履歴記憶部141と、滞在パターン記憶部142と、行動パターン記憶部143と、予測結果記憶部144が設けられている。滞在履歴記憶部141には、ユーザ端末装置から受信した、当該ユーザが滞在した滞在地とその滞在時刻を表す滞在地データの集合が蓄積される。滞在パターン記憶部142には、後述する系列マイニング実行プログラムを実行することにより得られる滞在パターンの集合が蓄積される。行動パターン記憶部143には、上記蓄積された滞在パターンの集合の中から抽出された、ユーザにとって特徴的(典型的)な行動パターンに対応する滞在パターンが記憶される。予測結果記憶部144には、上記記憶された特徴的な滞在パターンの中から選択された、ユーザの現在の滞在地及び滞在時刻と一致する度合いの高い滞在地と、当該滞在地を含む行動パターンの識別情報(行動パターンID)が記憶される。
The
プログラムメモリ13には、この発明を実施するために必要なアプリケーション・プログラムとして、滞在地入力制御プログラム131と、系列マイニング実行プログラム132と、出現頻度しきい値決定プログラム133と、行動パターン決定プログラム134と、行動予測処理プログラム135が格納されている。
In the
滞在地入力制御プログラム131は、図示しないユーザ端末装置からその滞在地データを通信ネットワークを介して通信インタフェース15により受信させ、受信された滞在地データを上記データメモリ14内の滞在履歴記憶部141に記憶させる処理を、上記CPU11に実行させる。滞在地データは、滞在地の固有名称と滞在時刻情報とから構成される。滞在地の固有名称は、例えばGPS(Global Positioning System)又はRFID(Radio Frequency IDentification)等の位置センサを用いて得たユーザ端末装置の緯度経度情報をもとに、地図データベースを検索することにより取得可能である。地図データベースはユーザ端末装置に予め記憶されているものを使用してもよいし、記憶されていない場合には地図データサーバで公開されているものを使用してもよい。また滞在時刻情報は、滞在開始時刻及び滞在終了時刻とからなる。なお、滞在地入力制御プログラム131は、メモリカード等の外部記憶媒体から滞在地データを読み込んで滞在履歴記憶部141に記憶させる処理機能も含まれる。
The stay place input control program 131 causes the
系列マイニング実行プログラム132は、上記滞在履歴記憶部141に蓄積された滞在地データの集合を読み出し、この読み出した滞在地データの集合に対し系列マイニングの手法を適用して滞在パターンの集合を作成し、この滞在パターンの集合を上記データメモリ14内の滞在パターン記憶部142に記憶させる処理を、上記CPU11に実行させる。
The sequence
出現頻度しきい値決定プログラム133は、以下のような一連の処理をCPU11に実行させる。
(1) 出現頻度しきい値の候補θを0〜1の範囲で一定量ずつ増加させるごとに、上記滞在パターン記憶部142に記憶された滞在パターンの集合から出現頻度が当該候補を超える滞在パターンを選択する処理。
(2) 上記選択された滞在パターンの集合から、当該集合に含まれる全ての滞在地を抽出する処理。
(3) 上記滞在履歴記憶部141に記憶された滞在地データの集合の中から、上記抽出された滞在地と一致する滞在地の数をカウントする処理。
(4) 上記出現頻度しきい値の各候補についてそれぞれ得られた滞在地のカウント値をもとに、出現頻度しきい値の候補の変化に対し上記カウント値が変化しない区間を求め、この区間に含まれる出現頻度しきい値の候補の中から、上記特徴的な行動パターンの抽出に用いる出現頻度しきい値を選択する処理。
The appearance frequency threshold
(1) Each time the appearance frequency threshold candidate θ is increased by a certain amount in the range of 0 to 1, a stay pattern whose appearance frequency exceeds the candidate from the set of stay patterns stored in the stay
(2) A process of extracting all stay places included in the set from the selected set of stay patterns.
(3) A process of counting the number of stay places that match the extracted stay place from the set of stay place data stored in the stay
(4) Based on the count value of the place of stay obtained for each candidate for the appearance frequency threshold, a section where the count value does not change with respect to the change of the appearance frequency threshold candidate is obtained. A process of selecting an appearance frequency threshold value used for extracting the characteristic behavior pattern from among appearance frequency threshold candidates included in.
行動パターン決定プログラム134は、以下の処理をCPU11に実行させる。
(1) 上記出現頻度しきい値決定プログラム133の実行により決定された出現頻度しきい値に基づいて、上記滞在パターン記憶部142に記憶された滞在パターンの集合から上記出現頻度しきい値を超える滞在パターンを抽出する処理。
(2) 上記抽出された滞在パターンに含まれる滞在地ごとに、平均滞在開始時刻、平均滞在終了時刻、滞在開始時刻の分散及び滞在終了時刻の分散を求める処理。
(3) 上記抽出された滞在パターンと、上記求められた平均滞在開始時刻、平均滞在終了時刻、滞在開始時刻の分散及び滞在終了時刻の分散を、パターンIDに対応付けて上記データメモリ14内の行動パターン記憶部143に記憶させる処理。
The behavior
(1) The appearance frequency threshold is exceeded from the set of stay patterns stored in the stay
(2) Processing for obtaining an average stay start time, an average stay end time, a dispersion of stay start times and a dispersion of stay end times for each stay place included in the extracted stay pattern.
(3) The extracted stay pattern, the obtained average stay start time, average stay end time, stay start time variance and stay end time variance are associated with the pattern ID in the
行動予測処理プログラム135は、以下の処理をCPU11に実行させる。
(1) 上記滞在地入力制御プログラム131の制御の下でユーザの現在の滞在地データが得られた場合に、この滞在地データに含まれる滞在地と名称が一致する滞在地を上記行動パターン記憶部143に記憶された特徴的な行動パターンから抽出する処理。
(2) 上記抽出された滞在地の各々について、上記現在の滞在地データとの一致の度合いを表す尤度を計算する処理。この尤度の計算は、平均滞在開始時刻又は平均滞在終了時刻と、滞在開始時刻の分散又は滞在終了時刻の分散の値をもとに行われる。
(3) 上記計算された尤度が予め設定した条件を満たす滞在地を、上記抽出された滞在地の中から選択する処理。
(4) 上記選択された滞在地と、この滞在地を系列に含む滞在パターンと、滞在時刻情報とをもとに、ユーザの次の目的地と当該目的地への到達時刻を予測し、その予測結果を入出力インタフェース16を介して出力デバイス18へ出力させる処理。
The behavior
(1) When the user's current stay place data is obtained under the control of the stay place input control program 131, the stay pattern whose name matches the stay place included in the stay place data is stored in the action pattern. The process which extracts from the characteristic action pattern memorize | stored in the
(2) A process of calculating a likelihood representing the degree of coincidence with the current stay place data for each of the extracted stay places. The likelihood calculation is performed based on the average stay start time or the average stay end time and the variance of the stay start times or the variance of the stay end times.
(3) Processing for selecting a staying place where the calculated likelihood satisfies a preset condition from the extracted staying places.
(4) Predicting the user's next destination and the arrival time to the destination based on the selected destination, the stay pattern including this stay, and the stay time information. A process of outputting the prediction result to the
図2は、図1に示した行動予測装置1の機能構成を示すブロック図である。行動予測装置1の機能は、入力部21と、記録部22と、処理部23と、出力部24とに大別される。
入力部21は滞在地入力手段211を備える。この滞在地入力手段211は、図1に示した滞在地入力制御プログラム131及び通信インタフェース15に対応する。
出力部24は予測結果出力手段241を備える。この予測結果出力手段241は、入出力インタフェース16、出力デバイス18及び通信インタフェース15に対応する。
FIG. 2 is a block diagram showing a functional configuration of the
The
The
記録部22は、滞在履歴記憶手段221と、滞在パターン記憶手段222と、行動パターン記憶手段223と、予測結果記憶手段224を備える。滞在履歴記憶手段221は図1の滞在履歴記憶部141に対応し、滞在パターン記憶手段222は滞在パターン記憶部142に対応する。また、行動パターン記憶手段223は図1の行動パターン記憶部143に対応し、予測結果記憶手段224は予測結果記憶部144に対応する。
The
処理部23は、行動パターン生成手段230と、行動予測処理手段234を備える。このうち行動パターン生成手段230は、系列マイニング実行手段231と、出現頻度しきい値決定手段232と、行動パターン決定手段233を含む。系列マイニング実行手段231は、図1に示した系列マイニング実行プログラム132に対応し、出現頻度しきい値決定手段232は図1に示した出現頻度しきい値決定プログラム133に対応する。行動パターン決定手段233は、図1に示した行動パターン決定プログラム134に対応する。また、行動予測処理手段234は図1に示した行動予測処理プログラム135に対応する。
The
図7は、上記出現頻度しきい値決定手段232の機能構成をさらに詳しく示すブロック図である。すなわち、出現頻度しきい値決定手段232は、出現頻度しきい値超えパターン選択手段2321と、滞在地集合計算手段2322と、滞在数カウント手段2323と、しきい値決定手段2324とから構成される。
FIG. 7 is a block diagram showing in more detail the functional configuration of the appearance frequency threshold
次に、以上のように構成された行動予測装置の動作を説明する。図6はその全体の処理手順と処理内容を示すフローチャートである。
(1)滞在地データの入力
CPU11は、ステップS51において滞在地入力制御プログラム131を起動する。そして、この滞在地入力制御プログラム131に従い、ユーザ端末装置からその滞在地データを通信ネットワークを介して通信インタフェース15により受信し、この受信された滞在地データをデータメモリ14内の滞在履歴記憶部141に記憶させる。
Next, the operation of the behavior prediction apparatus configured as described above will be described. FIG. 6 is a flowchart showing the overall processing procedure and processing contents.
(1) Input of data on the place of stay
CPU11 starts the stay place input control program 131 in step S51. Then, according to this stay place input control program 131, the stay place data is received from the user terminal device via the communication network by the
滞在地データは、ユーザが一定時間以上滞在した滞在地に関するデータであり、例えばユーザ端末装置の滞在地検出機能により生成される。滞在地検出機能は、例えばGPS又はRFIDを利用した自端末の位置を計測する機能と、この機能により計測された緯度・経度からなる位置情報をもとに地図データベースからその地点の固有名称を表す情報を検索する機能とから構成される。滞在地データは、滞在地名と、滞在開始時刻と、滞在終了時刻とから構成される。図3はこの滞在地データの一例を示すもので、「家」と「A駅」のデータを示している。 The stay place data is data related to the stay place where the user stayed for a certain period of time or more, and is generated by the stay place detection function of the user terminal device, for example. The stay location detection function represents a unique name of the point from the map database based on the function of measuring the position of the terminal using, for example, GPS or RFID, and the position information including the latitude and longitude measured by this function And a function for searching for information. The stay place data includes a stay place name, a stay start time, and a stay end time. FIG. 3 shows an example of the stay place data, and shows data of “house” and “A station”.
また、上記複数の滞在地をユーザの移動順に配列することにより、滞在系列データを生成することができる。滞在系列データは、滞在地名の列と系列番号とから構成される。このとき、滞在系列をd、系列番号をiとすると、系列番号iを持つ滞在系列diは、
ここで、uijを系列iのj番目の滞在地(又は滞在)と呼ぶ。uijの値はユーザが系列iでj番目に滞在した地名を表す。Miは系列iにおける滞在の総数である。図4は、滞在系列記憶部141に記憶されたN系列分の滞在系列データ集合の一例を示すもので、滞在系列データ集合Dは
(2)系列マイニング処理
CPU11は、続いてステップS52により系列マイニング実行プログラム132を起動する。そして、この系列マイニング実行プログラム132に従い、上記滞在履歴記憶部141から滞在系列データの集合を読み出し、この滞在系列データの集合に対し系列マイニング処理を実行して滞在パターンの集合を作成する。そして、この滞在パターンの集合を上記データメモリ14内の滞在パターン記憶部142に記憶させる。
(2) Series mining processing
Subsequently, the
系列マイニングとは、滞在系列データの集合を受け取り、この滞在系列データ集合の中から出現回数が一定回数以上、もしくは出現頻度が一定以上の全ての滞在パターンを高速に選択する手法である。なお、出現頻度とは、ある滞在パターンと滞在系列データ集合が与えられたときに、その滞在パターンが出現する滞在系列データ集合中の系列の総数と、滞在系列データ集合に含まれる系列の総数との比率である。なお、系列マイニングの処理については、以下の文献に詳しく述べられている。
Rakesh Agrawal and Ramakrishnan Srikant,“Mining Sequential Patterns”,11th International Conference on Data Engineering,pp 3−14,1995。
Sequence mining is a method of receiving a set of stay sequence data and selecting from the stay sequence data set all stay patterns whose appearance frequency is equal to or greater than a certain number or whose appearance frequency is greater than or equal to a certain speed. Note that the appearance frequency refers to the total number of sequences in the stay sequence data set in which the stay pattern appears when a certain stay pattern and stay sequence data set are given, and the total number of sequences included in the stay sequence data set. Is the ratio. The sequence mining process is described in detail in the following documents.
Rakesh Agrawal and Ramakrishnan Srikant, "Mining Sequential Patterns", 11 th International Conference on Data Engineering, pp 3-14,1995.
図5は、滞在パターン記憶部142に記憶された滞在パターンの一例を示すもので、滞在パターンはパターン番号とその出現回数と滞在の列により構成される。パターン番号は1つの滞在パターンにユニークに割り当てられる番号であり、滞在列は滞在地を並べたものである。このとき、滞在パターンをp、パターン番号をiとすると、あるパターン番号iを持つパターンpiは
出現回数は以下のように定義される。すなわち、パターンの出現は、滞在パターンと滞在系列との間で定義される概念であり、ある滞在パターンpa と滞在系列db についてそれぞれvai=ubα(i)となるような1≦α(1)<α(2)<…α(Ka)≦Mbが存在するとき、パターンpa は滞在系列db に出現するものと定義される。 The number of occurrences is defined as follows. That is, the appearance of the pattern is a concept defined between the stay pattern and stay sequence is staying pattern p a stay with sequence d b respectively for v ai = u bα (i) become such 1 ≦ alpha (1) <α (2) <... α (K a) when ≦ M b is present, the pattern p a is defined to appear in stay sequence d b.
例えば、滞在パターン<家,塾>は滞在系列<家,駅,塾>に出現するが、<家,駅,学校>には出現しない。この出現の定義を用いて出現回数を定義する。滞在パターンpj の出現回数は、滞在系列データ記憶部141に蓄積されている滞在系列データ集合に含まれる滞在系列データのうち、パターンpj が出現しているものの数を言う。パターンpi の出現回数をO(pi)と表すことにする。
For example, the stay pattern <house, school, school> appears in the stay series <house, station, school>, but does not appear in <house, station, school>. Use this occurrence definition to define the number of appearances. The number of appearances of the stay pattern p j refers to the number of the patterns in which the pattern p j appears among the stay series data included in the stay series data set accumulated in the stay series
滞在パターンの集合は以下のように定義される。すなわち、図5に示した行数(L行)は系列マイニング処理により作成された滞在パターンの総数であり、この作成された全ての滞在パターンの集合Pは、
(3)出現頻度しきい値の決定処理
CPU11は、次にステップS53により出現頻度しきい値決定プログラム133を起動し、この出現頻度しきい値決定プログラム133に従い出現頻度しきい値決定処理を実行する。この出現頻度しきい値を決定する方法には3つの方法が考えられる。
(3) Appearance frequency threshold determination processing
Next, the
(3−1)第1の方法
図8は、この出現頻度しきい値を決定する方法を実現する処理手順と処理内容を示すフローチャートである。
すなわち、CPU11は先ずステップS71により出現頻度しきい値の候補値θを最小値であるθ=0に設定する。続いてステップS72により、データメモリ14内の滞在パターン記憶部142から滞在パターン集合を読み出し、この読み出した滞在パターン集合に含まれる複数の滞在パターンの中から、上記出現頻度しきい値の候補値θを超える全ての滞在パターンを選択する。
(3-1) First method
FIG. 8 is a flowchart showing a processing procedure and processing contents for realizing the method for determining the appearance frequency threshold.
That is, the
CPU11は、次にステップS73に移行し、上記選択された滞在パターンの集合から滞在地集合を抽出する。滞在地集合は、滞在パターン記憶部142に記憶された滞在パターンの集合が与えられたとき、この集合に含まれる滞在パターンに含まれるすべての滞在地を集めた集合として定義される。図9は、その一例を示すもので、与えられた滞在パターンの集合が{<家,塾>,<家,バス停>,<家>,<バス停>}だった場合に、当該滞在パターンの集合からは滞在地集合として{家,塾,バス停}が抽出される。
Next, the
CPU11は、続いてステップS74に移行し、滞在系列記憶部141に記憶された滞在系列データの集合の中から、上記抽出された滞在地と一致する滞在地の数をカウントする処理を以下のように実行する。図10はその処理手順と処理内容を示すフローチャートである。
Subsequently, the
すなわち、CPU11は上記ステップS73により抽出された滞在地集合をステップS91において取り込むと共に、ステップS92により上記滞在系列データ記憶部142から滞在系列データの集合を取り込み、ステップS93によりカウント値countを0に初期化する。
That is, the
この状態でCPU11は、先ずステップS94において上記滞在系列データの集合に含まれる滞在系列データの1つから滞在地を1つ選択し、この選択した滞在地と等しい要素が上記滞在地集合の中に存在するか否かをステップS95で判定する。この判定の結果、選択した滞在地と等しい要素が上記滞在地集合の中に存在した場合には、ステップS96に移行してカウント値countをインクリメントする。これに対し存在しないと判定された場合には、上記カウント値のインクリメントを行わない。
In this state, the
次にCPU11は、ステップS97において上記滞在系列データの集合にまだ調べていない滞在地が残っているか否かを判定し、残っていればステップS94に戻って未選択の滞在地を1つ選択する。そして、この選択した滞在地と等しい要素が上記滞在地集合の中に存在するか否かを上記ステップS95で判定し、存在すればカウント値countをインクリメントする。以後同様に、上記滞在系列データの集合から未選択の滞在地を1つ選択するごとに、当該滞在地と等しい要素が上記滞在地集合の中に存在するか否かを判定し、存在すればカウント値countをインクリメントする処理を繰り返す。
Next, in step S97, the
そして、上記滞在系列データの集合に含まれる全ての滞在地について、上記判定処理とその結果に基づくカウント値countのインクリメント処理を終了すると、CPU11はステップS97からステップS98に移行して、上記カウント値countの値、つまり出現頻度しきい値の候補値θ=0のときの滞在地集合に含まれる各要素が上記滞在系列データ集合中に出現する回数を出力する。そして、この出力された滞在地数のカウント値を、上記出現頻度しきい値の候補値θ=0と対応付けてデータメモリ14内の滞在数カウント値記憶部(図示せず)に保存する。
When the determination process and the increment process of the count value count based on the result are completed for all the stay places included in the stay series data set, the
なお、以上述べた滞在数のカウント処理の結果を数式で表すと以下のようになる。すなわち、カウントされた滞在数を出現頻度しきい値θの関数s(θ)とすると、この関数 s(θ)は
上記出現頻度しきい値の候補値θ=0のときの滞在数カウント処理が終了すると、CPU11は出現頻度しきい値の候補値θが最大値である1に達したか否かをステップS75で判定する。この判定の結果、θが1に達していなければステップS76により出現頻度しきい値の候補値θを一定量(例えば0.01)増加させ、ステップS72に戻る。そして、今度はこの増加後の出現頻度しきい値の候補値θを用いて、上記ステップS72〜ステップS74による滞在数カウント処理を実行する。以後同様に、出現頻度しきい値の候補値θが1に達するまで、θを一定量増加させるごとにステップS72〜ステップS74による滞在数カウント処理を繰り返し実行する。
以上の滞在数カウント処理の結果、出現頻度しきい値の候補の変化に対する滞在数の変化を表す情報がデータメモリ14内の滞在数カウント値記憶部に得られる。図12はその一例を示すものである。
When the stay frequency counting process when the appearance frequency threshold candidate value θ = 0 is finished, the
As a result of the above stay count processing, information indicating the change in the stay count with respect to the change in the appearance frequency threshold candidate is obtained in the stay count count storage unit in the
上記出現頻度しきい値の候補値θが最大値である“1”に達すると、CPU11はステップS77に移行し、上記ステップS72〜ステップS74により得られた出現頻度しきい値の候補θの変化に対する滞在数の変化を表す情報に基づいて、特徴的な滞在パターンの抽出処理に用いる上で最適な出現頻度しきい値を1つ選択する処理を、以下のように実行する。図11はその処理手順と処理内容を示すフローチャートである。
When the appearance frequency threshold candidate value θ reaches “1” which is the maximum value, the
すなわち、CPU11は先ずステップS101で上記データメモリ14内の滞在数カウント値記憶部から、出現頻度しきい値の各候補θ(0〜1)についてそれぞれ得られた滞在数カウント値を読み込む。次にステップS102において、上記読み込んだ滞在地のカウント値をもとに、出現頻度しきい値の候補θの変化に対し上記滞在数カウント値が変化しない区間をすべて検出する。続いてステップS103において、上記検出されたすべての区間のうち、出現頻度しきい値の候補θ=1を含む区間を先ず削除し、残った各区間の中でθの範囲が最長となる区間を1つ選択する。そして、ステップS104において、上記選択された最長区間内のθの下限値を、特徴的な行動パターンの抽出に用いる出現頻度しきい値として決定する。
例えば、図12の例ではθ=0.1〜0.5の区間を最長区間として選択し、この最長区間中の下限値であるθ=0.1を特徴的な行動パターンの抽出に用いる出現頻度しきい値として決定する。
That is, in step S101, the
For example, in the example of FIG. 12, an interval where θ = 0.1 to 0.5 is selected as the longest interval, and θ = 0.1 which is the lower limit value in the longest interval is used for extracting a characteristic action pattern. Determine as the frequency threshold.
以上述べたように、出現頻度しきい値を決定する第1の方法では、出現頻度しきい値の候補θを0〜1の範囲で一定量ずつ増加させるごとに、滞在パターン記憶部142に記憶された滞在パターンの集合から出現頻度が当該候補を超える滞在パターンを選択して、この選択された滞在パターンの集合から当該集合に含まれる全ての滞在地を抽出し、さらに滞在系列記憶部141に記憶された滞在系列データの集合の中から上記抽出された滞在地と一致する滞在地の数をカウントする。そして、出現頻度しきい値の各候補についてそれぞれ得られた滞在地のカウント値をもとに、出現頻度しきい値の候補の変化に対し上記カウント値が変化しない区間を求め、この区間のうちθ=1を含む区間を除いた最長区間の下限値を、上記特徴的な行動パターンの抽出に用いる出現頻度しきい値として選択するようにしている。
As described above, in the first method for determining the appearance frequency threshold value, the appearance frequency threshold value candidate θ is stored in the stay
この第1の方法は以下のような利点を有する。すなわち、一般に出現頻度しきい値が低い領域では滞在数の変化が大きくなる傾向があるが、これは出現頻度しきい値以上の出現頻度をもつ滞在パターンの集合の変化が大きいことを反映している。そのような集合に含まれる滞在パターンは、ユーザの日常の行動を反映していないノイズである可能性が高く、ユーザの日常行動の評価に使用するには適さない。一方、出現頻度しきい値が高いと、それだけで得られる頻出パターンの数が少なくなり、ユーザの日常行動をその多様性を考慮して適切に評価することが困難となる。 This first method has the following advantages. In other words, there is a tendency for the number of stays to change more generally in regions where the appearance frequency threshold is low, but this reflects the large change in the set of stay patterns that have an appearance frequency equal to or greater than the appearance frequency threshold. Yes. The stay pattern included in such a set is likely to be noise that does not reflect the user's daily behavior, and is not suitable for use in evaluating the user's daily behavior. On the other hand, when the appearance frequency threshold is high, the number of frequent patterns obtained by itself becomes small, and it is difficult to appropriately evaluate the user's daily behavior in consideration of the diversity.
これに対し上記第1の方法を用いると、先に述べたように出現頻度しきい値の変化に対して滞在数が不変の最長区間、つまり出現する滞在パターンの集合が最も安定しノイズを含む可能性が低い区間から、出現頻度しきい値が選択される。このため、出現頻度しきい値を低く設定される心配がない。また、出現頻度しきい値を0から増加させた場合、出現頻度の変化に対し滞在数が急激に変化する領域の直後に滞在数が不変の最長区間が現れることが多く、本実施形態ではこの区間の下限値に出現頻度しきい値が設定される。このため、出現頻度しきい値が高い値に設定される懸念がない。 On the other hand, when the first method is used, as described above, the longest interval in which the number of stays does not change with respect to the change in the appearance frequency threshold, that is, the set of appearing stay patterns is most stable and includes noise. An appearance frequency threshold is selected from a section with a low possibility. For this reason, there is no worry that the appearance frequency threshold is set low. In addition, when the appearance frequency threshold is increased from 0, the longest interval in which the number of stays does not change often appears immediately after the region where the number of stays changes rapidly with respect to the change in the appearance frequency. An appearance frequency threshold is set as the lower limit value of the section. For this reason, there is no concern that the appearance frequency threshold is set to a high value.
すなわち、出現頻度しきい値を決定するための第1の方法によれば、出現頻度しきい値を低すぎずかつ高すぎない適切な値に設定することが可能となり、これによりノイズの影響を最小限度に抑えた上で、ユーザの日常行動を評価する上で必要な滞在パターンを十分抽出することができる。 That is, according to the first method for determining the appearance frequency threshold, it is possible to set the appearance frequency threshold to an appropriate value that is not too low and not too high, thereby reducing the influence of noise. It is possible to sufficiently extract the stay pattern necessary for evaluating the daily behavior of the user while keeping the minimum.
(3−2)第2の方法
出現頻度しきい値を決定するための第2の方法は、出現頻度しきい値の候補値θを0〜1の範囲で一定量ずつ増加させるごとに当該出現頻度しきい値の候補値θを超える滞在パターン数をカウントし、この滞在パターン数のカウント値を利用して出現頻度しきい値を決定する手段又は方法を使用するものである。
(3-2) Second method
The second method for determining the appearance frequency threshold value is to increase the appearance frequency threshold candidate value θ every time the candidate value θ of the appearance frequency threshold value is increased by a certain amount in the range of 0 to 1. Means or a method for counting the number of stay patterns exceeding and determining an appearance frequency threshold value using the count value of the number of stay patterns is used.
図13は、この出現頻度しきい値を決定する第2の方法を実施するための出現頻度しきい値決定手段の機能構成を示すブロック図である。なお、同図において前記図7と同一部分には同一符号を付して詳しい説明は省略する。また、行動予測装置のソフトウエア及びハードウエア構成については図1を、また装置全体の機能構成については図2を延用して説明を行う。 FIG. 13 is a block diagram showing a functional configuration of the appearance frequency threshold value determining means for carrying out the second method for determining the appearance frequency threshold value. In the figure, the same parts as those in FIG. Further, FIG. 1 will be described with respect to the software and hardware configuration of the behavior prediction apparatus, and FIG. 2 will be described with respect to the functional configuration of the entire apparatus.
出現頻度しきい値決定手段232は、図13に示すように出現頻度しきい値超えパターン選択手段2321と、パターン数カウント手段2325と、近似誤差計算手段2326と、誤差最小しきい値検出手段2327とから構成される。
出現頻度しきい値超えパターン選択手段2321は、出現頻度しきい値の候補θを0〜1の範囲で一定量ずつ増加させるごとに、上記滞在パターン記憶部142に記憶された滞在パターンの集合から出現頻度が当該候補を超える滞在パターンを選択する。
パターン数カウント手段2325は、上記各出現頻度しきい値の候補値θごとに、上記出現頻度しきい値超えパターン選択手段2321により選択された滞在パターンの数をカウントする。
As shown in FIG. 13, the appearance frequency threshold value determining means 232 includes an appearance frequency threshold value exceeding
The appearance frequency threshold value excess
The pattern
近似誤差計算手段2326は、上記出現頻度しきい値の候補値θの変化に対する上記滞在パターンのカウント値の変化を表す近似式を定義する。
誤差最小しきい値検出手段2327は、上記定義された近似式と上記滞在パターンのカウント値との誤差を求め、この近似誤差が最小となるときの出現頻度しきい値の候補値θを特徴的な行動パターンの抽出に用いる出現頻度しきい値として選択する。
The approximate error calculation means 2326 defines an approximate expression representing a change in the count value of the stay pattern with respect to a change in the appearance frequency threshold candidate value θ.
The error minimum threshold
次に、以上のように構成された出現頻度しきい値決定手段232によるしきい値決定処理動作を説明する。図14はその処理手順と処理内容を示すフローチャートである。なお、同図において前記図8と同一部分には同一符号を付してある。
すなわち、CPU11は先ずステップS71により出現頻度しきい値の候補値θを最小値であるθ=0に設定する。続いてステップS72により、データメモリ14内の滞在パターン記憶部142から滞在パターン集合を読み出し、この読み出した滞在パターン集合に含まれる複数の滞在パターンの中から、上記出現頻度しきい値の候補値θを超える全ての滞在パターンを選択する。次にステップS131に移行し、上記ステップS72により選択された滞在パターンの数をカウントしそのカウント値をデータメモリ14内に保存する。
Next, the threshold value determination processing operation by the appearance frequency threshold
That is, the
上記出現頻度しきい値の候補値θ=0のときの滞在パターン数の選択とその数をカウントする処理が終了すると、CPU11は出現頻度しきい値の候補値θが最大値である“1”に達したか否かをステップS75で判定する。この判定の結果、θが“1”に達していなければステップS76により出現頻度しきい値の候補値θを一定量(例えば0.01)増加させ、ステップS72に戻る。そして、今度はこの増加後の出現頻度しきい値の候補値θを用いて、上記ステップS72及びステップS131による滞在パターンの選択とその数をカウントする処理を実行する。以後同様に、出現頻度しきい値の候補値θが最大値である“1”に達するまで、出現頻度しきい値の候補値θを一定量増加させるごとに、ステップS72及びステップS131による滞在パターンの選択とその数をカウントする処理を繰り返し実行する。
When the selection of the number of stay patterns and the process of counting the number of stay patterns when the appearance frequency threshold candidate value θ = 0 is completed, the
次にCPU11は、ステップS132により別に設定した変数φを0に初期化したのち、ステップS133において関数fφ(x)を定義する。この関数fφ(x)は、上記ステップS132までに求めた、各出現頻度しきい値の候補値θに対応する滞在パターンのカウント値をR(θ)とすると、3つの点(0,R(0)),(θ,R(θ)),(1,R(1))を順に線分で結ぶ式として
続いてCPU11は、ステップS134において、上記定義した関数fφ(x)と上記θごとの滞在パターンのカウント値R(θ)との近似誤差を求める。パラメータφに対応する近似誤差G(φ)は、
この近似誤差G(φ)の意味について、図15を用いて説明する。図15は出現頻度しきい値の候補値θと滞在パターンのカウント値の関数R(θ)と、φ=0.2のときの関数fφ(x)とをプロットしたものである。図中の網掛けをした領域が、滞在パターンのカウント値の関数R(θ)を関数fφ(x)で近似したときの誤差である。滞在パターンのカウント値は、出現頻度しきい値の候補値θの変化に対して、しきい値が小さい場合には変化が大きく、反対にしきい値が大きい場合には変化が小さくなる傾向がある。このため、滞在パターンのカウント値を関数fφ(x)で近似すると、滞在パターンのカウント値の変化が大きな部分と小さな部分の境界にθがあるとき誤差は最小となる。換言すれば、誤差が小さくなるということは、パラメータφの値が滞在パターンのカウント値の関数R(θ)における傾きの変化の境界に近づいていることを意味する。
上記ステップS134において近似誤差が計算されると、CPU11はステップS135において、上記計算された近似誤差をφの値に対応付けてデータメモリ14に一時保存する。
The meaning of this approximate error G (φ) will be described with reference to FIG. FIG. 15 is a plot of the function R (θ) of the appearance frequency threshold candidate value θ and the count value of the stay pattern and the function f φ (x) when φ = 0.2. The shaded area in the figure is an error when the function R (θ) of the count value of the stay pattern is approximated by the function f φ (x). The stay pattern count value tends to be large when the threshold value is small and small when the threshold value is large, with respect to the change in the appearance frequency threshold candidate value θ. . Therefore, when the count value of the stay pattern is approximated by the function f φ (x), the error is minimized when θ is present at the boundary between the portion where the change in the count value of the stay pattern is large and the small portion. In other words, the smaller error means that the value of the parameter φ is approaching the boundary of the slope change in the function R (θ) of the count value of the stay pattern.
When the approximate error is calculated in step S134, the
上記パラメータφ=0のときの滞在数カウント処理が終了すると、CPU11はパラメータφが最大値である1に達したか否かをステップS136で判定する。この判定の結果、φが1に達していなければステップS137によりパラメータφを一定量(例えば0.01)増加させ、ステップS133に戻る。そして、今度はこの増加後のφを用いて、上記ステップS133〜ステップS135による近似誤差の計算処理を実行する。以後同様に、パラメータφが1に達するまで、パラメータφを一定量増加させるごとにステップS133〜ステップS135による近似誤差の計算処理を繰り返し実行する。
When the stay number counting process when the parameter φ = 0 is completed, the
上記近似誤差の計算処理により、0〜1までのすべてのφに対する近似誤差が計算されると、CPU11はステップS138において、上記計算されたすべてのφに対する近似誤差の中から最小となる近似誤差を選択し、この誤差が最小となるときのφを特徴パターンの抽出に使用する出現頻度しきい値として出力する。
When the approximation error for all φs from 0 to 1 is calculated by the approximation error calculation process, the
上記近似誤差が最小となるときのφを出現頻度しきい値として選択する理由は以下のようなものである。図16は、出現頻度パラメータφを変化させ、それに伴う滞在パターンのカウント値R(φ)の変化と近似誤差G(σ)の変化とを同時にプロットした図である。同図から、近似誤差G(σ)が最小となる出現頻度パラメータφは、滞在パターンのカウント値R(φ)の変化の境界に近いことが分かる。こうした領域は、滞在パターンが安定な出現頻度しきい値の下限値であると考えることができるため、このφを特徴パターンの抽出に使用する出現頻度しきい値として出力する。 The reason for selecting φ as the appearance frequency threshold when the approximation error is minimum is as follows. FIG. 16 is a diagram in which the appearance frequency parameter φ is changed and the change in the count value R (φ) of the stay pattern and the change in the approximation error G (σ) are plotted simultaneously. From the figure, it can be seen that the appearance frequency parameter φ that minimizes the approximation error G (σ) is close to the boundary of the change in the stay pattern count value R (φ). Since it can be considered that such a region is the lower limit value of the appearance frequency threshold value where the stay pattern is stable, this φ is output as the appearance frequency threshold value used for extracting the feature pattern.
以上述べたように出現頻度しきい値を決定するための第2の方法では、出現頻度しきい値の候補値θを0〜1の範囲で一定量ずつ増加させるごとに当該出現頻度しきい値の候補値θを超える滞在パターン数をカウントする。そして、別途設定した出現頻度パラメータφを0〜1の範囲で一定量ずつ増加させるごとに、上記滞在パターン数のカウント値と近似関数fφ(x)との近似誤差を求め、この近似誤差が最小となるときの出現頻度パラメータφを特徴パターンの抽出に使用する出現頻度しきい値として選択するようにしている。 As described above, in the second method for determining the appearance frequency threshold value, the appearance frequency threshold value is increased each time the candidate value θ of the appearance frequency threshold value is increased by a certain amount in the range of 0 to 1. The number of stay patterns exceeding the candidate value θ is counted. Each time the separately set appearance frequency parameter φ is increased by a certain amount in the range of 0 to 1, an approximation error between the count value of the stay pattern number and the approximation function f φ (x) is obtained. The appearance frequency parameter φ at the minimum is selected as the appearance frequency threshold value used for extracting the feature pattern.
したがって、この第2の方法においても、先に述べた第1の方法と同様に、滞在パターンが安定な出現頻度しきい値の下限値に出現頻度しきい値が設定される。このため、出現頻度しきい値を低すぎずかつ高すぎない適切な値に設定することが可能となり、これによりノイズの影響を最小限度に抑えた上で、ユーザの日常行動を評価する上で必要な滞在パターンを十分抽出することができる。 Therefore, also in the second method, as in the first method described above, the appearance frequency threshold is set to the lower limit value of the appearance frequency threshold where the stay pattern is stable. For this reason, it is possible to set the appearance frequency threshold value to an appropriate value that is not too low and not too high, thereby minimizing the influence of noise and evaluating the user's daily behavior. Necessary stay patterns can be extracted sufficiently.
(第3の方法)
出現頻度しきい値を決定するための第3の方法は、出現頻度しきい値の候補値θを0〜1の範囲で一定量ずつ増加させるごとに当該出現頻度しきい値の候補値θを超える滞在パターン数を選択して、この選択された滞在パターンの集合から当該集合に含まれる全ての滞在地を抽出すると共に、滞在系列データの集合に含まれる滞在地の総数に対する上記滞在地のカウント値の割合(被覆率)を求め、この被覆率をもとに出現頻度しきい値を決定するようにしたものである。
(Third method)
A third method for determining the appearance frequency threshold value is to increase the appearance frequency threshold candidate value θ every time the candidate value θ of the appearance frequency threshold value is increased by a certain amount in the range of 0 to 1. The number of stay patterns exceeding the selected number of stay patterns is extracted from all the stay places included in the set, and the count of the stay places relative to the total number of stay places included in the stay series data set is selected. The ratio of the values (coverage) is obtained, and the appearance frequency threshold is determined based on this coverage.
図17は、この第3の方法を実施するための出現頻度しきい値決定手段232の機能構成を示すブロック図である。なお、同図において前記図7と同一部分には同一符号を付して詳しい説明は省略する。また、本実施形態においても、行動予測装置のソフトウエア及びハードウエア構成については図1を、また装置全体の機能構成については図2を延用して説明を行う。 FIG. 17 is a block diagram showing a functional configuration of the appearance frequency threshold value determining means 232 for carrying out the third method. In the figure, the same parts as those in FIG. Also in this embodiment, FIG. 1 is used for the software and hardware configuration of the behavior prediction apparatus, and FIG. 2 is used for the functional configuration of the entire apparatus.
出現頻度しきい値決定手段232は、図17に示すように出現頻度しきい値超えパターン選択手段2321と、滞在地集合計算手段222と、滞在数カウント手段2323と、被覆率計算手段2328と、しきい値決定手段2324とから構成される。
このうち被覆率計算手段2328は、滞在系列データ記憶部142(滞在系列記憶手段221)に記憶された滞在系列データの集合に含まれる滞在地の総数に対する、上記滞在数カウント手段2323により得られた滞在地のカウント値の割合を、被覆率として計算する。
As shown in FIG. 17, the appearance frequency threshold value determination means 232 includes an appearance frequency threshold value exceeding pattern selection means 2321, a stay location set calculation means 222, a stay count counting means 2323, a coverage rate calculation means 2328, And a threshold
Of these, the coverage rate calculating means 2328 is obtained by the stay number counting means 2323 with respect to the total number of stay places included in the set of stay series data stored in the stay series data storage unit 142 (stay series storage means 221). The ratio of the count value of the staying place is calculated as the coverage.
次に、以上のように構成された出現頻度しきい値決定手段232によるしきい値決定処理動作を説明する。図18はその処理手順と処理内容を示すフローチャートである。なお、同図において前記図8と同一部分には同一符号を付してある。
すなわち、CPU11は先ずステップS71により出現頻度しきい値の候補値θを最小値であるθ=0に設定する。続いてステップS72により、データメモリ14内の滞在パターン記憶部142から滞在パターン集合を読み出し、この読み出した滞在パターン集合に含まれる複数の滞在パターンの中から、上記出現頻度しきい値の候補値θを超える全ての滞在パターンを選択する。
Next, the threshold value determination processing operation by the appearance frequency threshold
That is, the
CPU11は、次にステップS73に移行し、上記選択された滞在パターンの集合から滞在地集合を抽出する。滞在地集合は、滞在パターン記憶部142に記憶された滞在パターンの集合が与えられたとき、この集合に含まれる滞在パターンに含まれるすべての滞在地を集めた集合として定義される。続いてCPU11は、ステップS74に移行し、滞在系列記憶部141に記憶された滞在系列データの集合の中から、上記抽出された滞在地と一致する滞在地の数をカウントする。
Next, the
次にCPU11は、ステップS161において、滞在系列データ記憶部142に記憶された滞在系列データの集合に含まれる滞在地の総数に対する、上記ステップS72〜S74により得られた滞在地のカウント値の割合を被覆率として計算する。いま、被覆率をσ(θ)とすると、被覆率は
次にCPU11は、ステップS162において、上記計算された被覆率σ(θ)をもとに特徴パターンの抽出に使用する出現頻度しきい値を決定する。被覆率は、第1の方法で述べた滞在数と同様に出現頻度しきい値に対して単調非増加である。このため、出現頻度しきい値の候補値を増加させて、その被覆率が一旦ある値を下回ったならば、以降どれだけ候補値を増加させても被覆率がその値を上回ることはない。したがって、被覆率にあるしきい値を設定しておけば、出現頻度しきい値の候補値を増加させていったときに、被覆率が初めてそのしきい値以下になった点を検出することができる。
Next, in step S162, the
そこで、被覆率に対して予め例えば0.3という被覆率のしきい値を設定しておく。そして、出現頻度しきい値の候補値を増加させていって、被覆率が上記設定されたしきい値を上回ったとき、このときの出現頻度しきい値の候補値の最大値を、特徴パターンの抽出に使用する出現頻度しきい値として出力する。
このように特徴パターンの抽出に使用する出現頻度しきい値を決定することで、ユーザの滞在系列データの性質によらず、行動のカバー率が一定となるように特徴的な滞在パターンの集合を抽出することが可能となる。
For this reason, a coverage threshold value of 0.3, for example, is set in advance for the coverage. Then, when the appearance frequency threshold candidate value is increased and the coverage ratio exceeds the set threshold value, the maximum value of the appearance frequency threshold candidate value at this time is determined as a feature pattern. Is output as an appearance frequency threshold value used for extraction.
By determining the appearance frequency threshold value used for feature pattern extraction in this way, a set of characteristic stay patterns can be created so that the behavior coverage is constant regardless of the nature of the user's stay series data. It becomes possible to extract.
(4)特徴的な行動パターンの抽出処理
上記第1乃至第3の方法のいずれかの方法により出現頻度しきい値が決定されると、CPU11はステップS55に移行し、行動パターン決定プログラム134を起動する。そして、この行動パターン決定プログラム134に従い、先ず滞在パターン記憶部142から滞在パターンの集合を読み出し、この読み出した滞在パターンの集合に含まれる各滞在パターンの中から、上記決定された出現頻度しきい値を超える滞在パターンを抽出する。また、上記抽出された滞在パターンに含まれる滞在地ごとに時刻特徴量を求める。この時刻特徴量は、平均滞在開始時刻、平均滞在終了時刻、滞在開始時刻の分散及び滞在終了時刻の分散からなる。そして、上記抽出された滞在パターンと、上記求められた時刻特徴量を、パターンIDに対応付けて上記データメモリ14内の行動パターン記憶部143に記憶させる。
(4) Characteristic behavior pattern extraction processing
When the appearance frequency threshold is determined by any one of the first to third methods, the
図19は、以上のようにして行動パターン記憶手段143に記憶された行動パターン情報の一例を示すものである。なお、同図では、簡単のため2つの滞在パターンのみを例示し、また時刻特徴量については上記滞在パターン中に出現する一つ目の滞在地1に対応するもののみを示している。
FIG. 19 shows an example of behavior pattern information stored in the behavior pattern storage means 143 as described above. In the figure, for the sake of simplicity, only two stay patterns are illustrated, and only time feature amounts corresponding to the
(5)行動予測処理
さて、以上のようにユーザの特徴的な行動パターンが得られると、CPU11は次に行動予測処理プログラム135を起動し、この行動予測処理プログラム135に従いユーザの次の行動を予測するための処理を以下のように実行する。図20はその全体の処理手順と処理内容を示すフローチャートである。
(5) Behavior prediction processing
Now, when the user's characteristic behavior pattern is obtained as described above, the
CPU11は、先ずステップS201において、一定時間ごとに、或いはユーザ端末装置から受信した最新の滞在地データが滞在履歴記憶部141に記憶されている前回受信した滞在地データに対し変化した場合に、滞在履歴記憶部141から最新の滞在地データを、つまりユーザの現在の滞在地を表すデータを読み出す。この最新の滞在地データは、少なくとも滞在開始時刻を含んでいるものとする。また、それと共にCPU11は、ステップS202において、行動パターン記憶部143から行動パターン情報の集合を読み出す。この読み出された最新の滞在地データ及び行動パターン情報の集合は、データメモリ14内の作業用メモリに一旦格納される。
First, in step S201, the
次にCPU11は、ステップS203において、上記読み出した最新の滞在地データに適合する行動パターンを探索するための処理を以下のように実行する。図21はその処理手順と処理内容を示すフローチャートである。
Next, in step S203, the
(5−1)適合行動パターンの探索処理
CPU11は、先ずステップS301により作業用メモリから最新の滞在地データの滞在地名を読み出し、さらにステップS302により作業用メモリから行動パターン情報の集合を順に読み出す。そして、ステップS303において、滞在パターン中に上記最新の滞在地データの滞在地名を含む行動パターンをすべて抽出し、この抽出した行動パターン情報の集合を作業用メモリ上に作成する。例えば、最新の滞在地データの滞在地名(ユーザの現在の滞在地)が「A駅」だったならば、この「A駅」を含む滞在パターンを有する行動パターン情報をすべて抽出する。この抽出処理の結果、抽出した行動パターン情報の集合が「空」であるとステップS304で判定すると、つまり上記最新の滞在地データの滞在地名を含む行動パターン情報を抽出できなかった場合には、CPU11は適合行動パターンの探索処理を終了する。
(5-1) Search process for conforming behavior pattern
First, in step S301, the
一方、上記最新の滞在地データの滞在地名を含む行動パターン情報を抽出できると、CPU11はステップS305に移行して、上記行動パターン情報の集合から行動パターン情報を1つ取り出す。続いてステップS306により、上記取り出した行動パターン情報の滞在パターン中から上記最新の滞在地データと名前が同一の滞在地を一つ選択する。そして、ステップS307において、上記選択した滞在地に対応する滞在開始時刻の平均及び分散の値を用いて、上記最新の滞在地データに含まれる滞在開始時刻の尤度を計算する。この尤度L(t) は、現在の滞在地の滞在開始時刻をt、上記行動パターン情報の滞在パターンから選択された滞在地の滞在開始時刻の平均及び分散の値をそれぞれμ、σ2とすると、
なお、尤度計算には、現在の滞在地の滞在開始時刻に加え滞在終了時刻を用いてもよい。この場合、滞在終了時刻についても上記式により同様の計算を行い、その計算結果と上記滞在開始時刻についての計算結果との積を求め、その結果を尤度L(t) とする。
On the other hand, if the action pattern information including the stay place name of the latest stay place data can be extracted, the
In the likelihood calculation, the stay end time may be used in addition to the stay start time of the current place of stay. In this case, the same calculation is performed for the stay end time using the above formula, the product of the calculation result and the calculation result for the stay start time is obtained, and the result is defined as the likelihood L (t).
次にCPU11は、ステップS308において、上記尤度L(t) の計算結果を予め設定したしきい値と比較してしきい値以上であるか否かを判定する。そして、しきい値以上であれば、このときの尤度L(t) の値がこれまでで最大か否かを判定する。この判定の結果、上記尤度L(t) の値がしきい値以上でかつこれまでで最大だったとすれば、CPU11はステップS309により、上記尤度を計算した滞在地の番号と、当該滞在地を滞在パターン中に含む行動パターン情報のパターンIDを、ユーザの現在の滞在地が該当する行動パターン情報の候補としてデータメモリ14の作業用メモリに保存する。そして、ステップS310に移行する。
Next, in step S308, the
これに対し、上記尤度L(t) の値がしきい値未満か、或いはしきい値以上であってもこれまでで最大ではなければ、CPU11は上記行動パターン情報をユーザの現在の滞在地が該当する候補として保存せずに、ステップS310に移行する。ステップS310では、当該行動パターン情報の滞在パターン中に現在の滞在地と名前が同じ滞在地が他にもあるか否かを判定する。この判定の結果、他にもあればステップS306に戻って、現在の滞在地と名前が同じその他の滞在地を一つ選択し、以後ステップS307〜ステップS309により、尤度の計算処理とその計算結果に基づく行動パターン候補とするか否かの判定処理を実行する。
On the other hand, if the value of the likelihood L (t) is less than the threshold or greater than or equal to the threshold, the
なお、上記尤度に基づく適合行動パターン候補の探索処理では、尤度L(t) の値がしきい値以上となる滞在地が複数見つかった場合には、この滞在地名と当該滞在地を滞在パターン中に含むすべての行動パターン情報のパターンIDを、ユーザの現在の滞在地が該当する行動パターン情報として保存するようにしてもよい。また、しきい値を設けずに、尤度L(t) の値が最大となる滞在地と当該滞在地を滞在パターン中に含む1つの行動パターン情報のパターンIDを、ユーザの現在の滞在地が該当する行動パターン情報として保存するようにしてもよい。 In addition, in the search process of the candidate action pattern based on the likelihood, when a plurality of stay places where the value of the likelihood L (t) is greater than or equal to a threshold value are found, the stay place name and the stay place are stayed. The pattern IDs of all the behavior pattern information included in the pattern may be stored as behavior pattern information corresponding to the user's current place of stay. Further, without setting a threshold value, a stay place where the value of the likelihood L (t) is maximum and a pattern ID of one action pattern information including the stay place in the stay pattern are displayed as the current stay place of the user. You may make it preserve | save as applicable action pattern information.
また、上記行動パターン情報の滞在パターン中に含まれる、現在の滞在地と名前が同じすべての滞在地の選択が終了すると、CPU11はステップS310からステップS311に移行する。そして、上記ステップS303において作成した現在の滞在地を含む行動パターン情報の集合の中に、ステップS305でまだ選択されていない行動パターン情報があるか否かを判定する。この判定の結果、まだ選択されていない行動パターン情報が存在する場合には、ステップS305に戻って未選択の行動パターン情報を1つ選択する。そして、この選択した行動パターン情報について、上記ステップS306〜ステップS310による処理を同様に実行する。
When the selection of all the stay places having the same name as the current stay place included in the stay pattern of the behavior pattern information is completed, the
そうして、上記ステップS303において作成したすべての行動パターン情報について、上記ステップS305〜ステップS311による処理が完了すると、CPU11はステップS311からステップS312に移行し、上記データメモリ14内の作業用メモリに候補として最終的に保存されている、滞在地の番号と当該滞在地を滞在パターン中に含む行動パターン情報のパターンIDを、適合行動パターンの探索結果として出力する。
Then, when the processes in steps S305 to S311 are completed for all the action pattern information created in step S303, the
(5−2)目的地の予測処理
上記適合行動パターンの探索処理が終了すると、CPU11は次に図20のステップS204において、ユーザの現在の滞在地に適合する行動パターン情報が見つかったか否かを判定する。この判定の結果、見つからなければそのまま処理を終了するが、見つかるとステップS205に移行して目的地予測処理を以下のように実行する。図22はその処理手順と処理内容を示すフローチャートである。
(5-2) Destination prediction process
When the search process for the matching behavior pattern is completed, the
すなわち、CPU11は先ずステップS401により、上記適合行動パターン探索処理により最終的に得られた滞在地の番号と当該滞在地を滞在パターン中に含む行動パターン情報のパターンIDを、データメモリ14の作業用メモリから読み出す。そして、ステップS402において、上記読み出されたパターンIDをもとに行動パターン記憶部143から該当する行動パターン情報を読み出し、この行動パターン情報に含まれる滞在パターンにおける滞在地の系列と、ユーザの現在の滞在地に該当すると判定された上記滞在地の番号とをもとに、ユーザの次の目的地となる滞在地を予測する。
That is, first in step S401, the
予測の手法としては、滞在パターンのみにより予測するか、滞在パターンと滞在時刻情報を用いて予測するか、目的地として複数の滞在地の予測を許容するかといった条件に応じて、複数通りの手法が考えられる。複数の目的地の予測が許容されるのならば、単純に、入力されたすべての適合行動パターン情報に対して、その各滞在パターン上でユーザの現在の滞在地に該当する滞在地の次に位置する滞在地をそれぞれ選択し、この選択された滞在地の集合を目的地の集合とする。これに対し1つの目的地の予測しか許さない場合には、例えば上記目的地として選択された滞在地の集合から、滞在開示時刻の平均値が最も早い滞在地を目的地の予測結果とする。また、時刻情報を参照することで、例えば複数の適合行動パターン情報の各滞在パターン中で、ユーザの現在の滞在地に該当する滞在地以降に配列された滞在地のうち、滞在開始時刻の平均値が現在時刻から一定時間以内(例えば30分以内)であるものをすべて目的地の予測結果とする。この滞在地は、ユーザがパターンに沿って行動をしていると考えられるのならば、当該ユーザが滞在する可能性が高い。 As a prediction method, there are multiple methods depending on whether the prediction is based only on the stay pattern, the prediction is based on the stay pattern and the stay time information, or the prediction of multiple stay places is permitted as the destination. Can be considered. If prediction of multiple destinations is allowed, simply enter the next corresponding destination of the user's current place of stay on each of the stay patterns for all of the entered matching behavior pattern information. Each staying place is selected, and the set of the selected staying places is set as the destination set. On the other hand, when only one destination is allowed to be predicted, for example, from the set of stay destinations selected as the destination, the stay destination having the earliest average value of the stay disclosure times is set as the destination prediction result. In addition, by referring to the time information, for example, among the stay places arranged after the stay place corresponding to the current stay place of the user in each stay pattern of the plurality of conforming behavior pattern information, the average of the stay start times All values whose values are within a certain time (for example, within 30 minutes) from the current time are used as the predicted results of the destination. If it is considered that the user is acting according to the pattern, this place of stay is likely to stay by the user.
最後にCPU11は、ステップS206(ステップS403)において、上記のように予測した目的地と、この目的地における滞在開始時刻の平均値を、データメモリ14内の予測結果記憶部144に記憶させると共に、入出力インタフェース16を介して出力デバイス18から出力させる。
Finally, in step S206 (step S403), the
以上述べたようにこの実施形態では、ユーザの現在の滞在地データと、当該ユーザについて事前に作成された特徴的な行動パターンを表す情報の集合とに基づいて、この行動パターン情報の集合から、ユーザの現在の滞在地と名前が同じ滞在地を含み、かつ当該滞在地の滞在開始時刻又は終了時刻の尤度がしきい値以上でかつ最も高い滞在地と当該滞在地を含む行動パターン情報を選択する。そして、この選択した滞在地と行動パターン情報をもとに、ユーザの次の目的地を予測するようにしている。 As described above, in this embodiment, based on the current location data of the user and a set of information representing a characteristic behavior pattern created in advance for the user, from this set of behavior pattern information, Action pattern information including a stay place having the same name as the current place of stay of the user and a stay start time or an end time of the stay place having a likelihood equal to or greater than a threshold and the stay place. select. Then, the user's next destination is predicted based on the selected stay place and action pattern information.
したがって、ユーザの滞在地だけでなく当該滞在地におけるユーザの滞在時刻も考慮されて、ユーザの現在の滞在地に適合する行動パターンが探索される。このため、滞在地のみに基づいて行動パターンを選択する場合に比べ、ユーザの現在の行動形態に適合する行動パターンを高精度に選択することが可能となる。 Therefore, not only the user's place of stay but also the user's stay time at the place of stay is considered, and an action pattern that matches the user's current place of stay is searched. For this reason, compared with the case where an action pattern is selected based only on a stay place, it becomes possible to select the action pattern which suits a user's present action form with high precision.
また、滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散をもとに、ユーザの現在の滞在地と過去の行動パターン中の滞在地との一致の度合いが尤度として算出され、その算出結果をもとにユーザの現在の行動形態に適合する行動パターンが選択される。このため、ユーザの現在の滞在地及び滞在時刻と地名及び時刻が完全一致する行動パターンを選択する場合に比べ、柔軟性の高い選択が可能となる。 Further, based on the average and variance of the stay start time or stay end time at the stay place, the degree of coincidence between the user's current stay place and the stay place in the past behavior pattern is calculated as the likelihood, and the calculation Based on the result, an action pattern that matches the current action form of the user is selected. For this reason, compared with the case where the user's current place of stay and stay time, and a behavior pattern whose place name and time completely match, selection with higher flexibility is possible.
さらに、ユーザの次の目的地とその到着時刻が出力されて情報管理者に提示される。このため、ユーザの行動を把握しようとする場合に情報管理者は、適合行動パターン情報からユーザの目的地と到着時刻を予測する作業を自身で行う必要がなくなり、これにより作業性の向上と予測精度の向上を図ることができる。 In addition, the user's next destination and its arrival time are output and presented to the information manager. For this reason, when trying to grasp the user's behavior, the information manager does not need to perform the work of predicting the user's destination and arrival time from the conforming behavior pattern information, thereby improving workability and predicting. The accuracy can be improved.
また、この実施形態によれば、滞在数を求める過程で非日常的な滞在地を発見することも可能である。非日常的な滞在地とは、特徴的な滞在パターンのいずれの集合にも含まれない滞在地のことである。出現頻度がある出現頻度しきい値φ以上の出現頻度を持つパターンの集合をQφ⊆Pとすると、ある日の滞在系列diに含まれる非日常的な滞在地の集合Ei は、
なお、この発明は上記実施形態に限定されるものではない。例えば、行動予測装置としての機能をサーバ装置に設けた場合を例にとって説明したが、行動予測装置としての機能をユーザの携帯端末又はパーソナル・コンピュータ等のユーザ端末装置に設けるようにしてもよい。また、行動予測装置を構成する複数の機能、つまり行動パターン生成手段230と行動予測処理手段234とを分割して、その一部をサーバ装置に、他を携帯端末やパーソナル・コンピュータ等のユーザ端末装置に設けるようにしてもよい。すなわち、行動予測装置を構成する機能を実現する複数の手段はサーバ装置とユーザ端末装置に分散して設けるようにしてもよい。
その他、行動予測装置の種類やその構成、行動パターン生成手段230の構成とその処理手順と内容、行動予測処理手段234の構成とその処理手順と内容等についても、この発明の要旨を逸脱しない範囲で種々変形して実施できる。
The present invention is not limited to the above embodiment. For example, the case where the function as the behavior prediction device is provided in the server device has been described as an example, but the function as the behavior prediction device may be provided in the user terminal device such as the user's portable terminal or personal computer. Further, a plurality of functions constituting the behavior prediction device, that is, behavior pattern generation means 230 and behavior prediction processing means 234 are divided, part of them as server devices and others as user terminals such as portable terminals and personal computers. You may make it provide in an apparatus. That is, a plurality of means for realizing the functions constituting the behavior prediction device may be provided in a distributed manner in the server device and the user terminal device.
In addition, the type and configuration of the behavior prediction device, the configuration and processing procedure and content of the behavior pattern generation unit 230, the configuration and processing procedure and content of the behavior
要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。 In short, the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. Further, various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, you may combine suitably the component covering different embodiment.
1…行動予測装置、11…CPU、12…バス、13…プログラムメモリ、14…データメモリ、15…通信インタフェース、16…入出力インタフェース、17…入力デバイス、18…出力デバイス、131…滞在地入力制御プログラム、132…系列マイニング実行プログラム、133…出現頻度しきい値決定プログラム、134…行動パターン決定プログラム、135…行動予測処理プログラム、141…滞在履歴記録部、142…滞在パターン記録部、143…予測結果記憶部、21…入力部、211…滞在地入力手段、22…記録部、221…滞在履歴記憶手段、222…滞在パターン記録手段、223…行動パターン記憶手段、224…予測結果記憶手段、23…処理部、230…行動パターン生成手段と、231…系列マイニング実行手段、232…出現頻度しきい値決定手段、233…行動パターン決定手段、234…行動予測処理手段、2321…頻度しきい値超えパターン選択手段、2322…滞在地集合計算手段、2323…滞在数カウント手段、2324…しきい値決定手段、2325…パターン数カウント手段、2326…近似誤差計算手段、2327…誤差最小しきい値検出手段、2328…被覆率計算手段、2411…しきい値出力手段。
DESCRIPTION OF
Claims (7)
前記滞在履歴記憶部に格納された滞在地データの集合に対し系列マイニングの処理を実行して、前記ユーザの特徴的な遷移行動を滞在地の系列とその滞在時刻情報により表した行動パターン情報を生成し、この生成された行動パターン情報の集合を行動パターン記憶部に格納する行動パターン生成手段と、
前記取得された滞在地データと、前記行動パターン記録部に格納された行動パターン情報の集合に基づいて、前記滞在地データに含まれる滞在地及びその滞在時刻情報と対応する滞在地及びその滞在時刻情報を含む適合行動パターン情報を前記行動パターン情報の集合の中から選択する適合行動パターン選択手段と
を具備することを特徴とする行動予測装置。 Means for acquiring stay place data including information indicating the stay place of the user and the stay time, and storing a set of the obtained stay place data in the stay history storage unit;
A series mining process is performed on the set of stay place data stored in the stay history storage unit, and the behavior pattern information representing the characteristic transition behavior of the user by the stay place series and its stay time information. Action pattern generation means for generating and storing the set of action pattern information generated in the action pattern storage unit;
Based on the acquired stay place data and a set of action pattern information stored in the action pattern recording unit, the stay place and the stay time corresponding to the stay place and the stay time information included in the stay place data. A behavior predicting apparatus comprising: a conforming behavior pattern selecting unit that selects conforming behavior pattern information including information from the set of behavior pattern information.
前記適合行動パターン選択手段は、
前記行動パターン記録部に格納された行動パターン情報の集合の中から、前記取得された滞在地データに含まれる滞在地と地名が等しい滞在地を抽出する手段と、
前記抽出された滞在地の各々について、前記取得された滞在地データに含まれる滞在地との一致の度合いを表す尤度を、前記取得された滞在地データに含まれる滞在時刻と、前記抽出された滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散を表す値とに基づいて計算する手段と、
前記計算された尤度に基づいて、当該尤度が予め設定した条件を満たす滞在地を前記抽出された滞在地の中から選択する手段と、
前記選択された滞在地と当該滞在地を含む行動パターンを表す情報を適合行動パターン情報として出力する手段と
を備えることを特徴とする請求項1記載の行動予測装置。 The behavior pattern generation means generates behavior pattern information including a value representing an average and variance of stay start time or stay end time in the stay place as the stay time information,
The conforming behavior pattern selection means includes:
Means for extracting a stay place having the same place name as the stay place included in the acquired stay place data from the set of action pattern information stored in the action pattern recording unit;
For each of the extracted stay destinations, the likelihood representing the degree of coincidence with the stay place included in the acquired stay place data, the stay time included in the acquired stay place data, and the extracted Means for calculating on the basis of the average and variance of the stay start time or stay end time in the staying place;
Based on the calculated likelihood, means for selecting a staying place satisfying a preset condition from the extracted staying places;
The behavior prediction apparatus according to claim 1, further comprising: a unit that outputs information indicating the selected stay place and an action pattern including the stay place as matching action pattern information.
さらに具備することを特徴とする請求項1又は2記載の行動予測装置。 Based on the stay place sequence and stay time information included in the fit action pattern information selected by the fit action pattern selection means, the stay place where the user will move and its arrival time are predicted, and this prediction result is expressed. The behavior prediction apparatus according to claim 1, further comprising behavior prediction processing means for outputting information.
前記滞在履歴記憶部に格納された滞在地データの集合に対し系列マイニングの処理を実行して、前記ユーザの特徴的な遷移行動を滞在地の系列とその滞在時刻情報により表した行動パターン情報を生成し、この生成された行動パターン情報の集合を行動パターン記憶部に格納する過程と、
前記取得された滞在地データと、前記行動パターン記録部に格納された行動パターン情報の集合に基づいて、前記滞在地データに含まれる滞在地及びその滞在時刻情報と対応する滞在地及びその滞在時刻情報を含む適合行動パターン情報を前記行動パターン情報の集合の中から選択する過程と
を具備することを特徴とする行動予測方法。 A process of acquiring stay place data including information indicating the stay place of the user and the stay time, and storing a set of the acquired stay place data in the stay history storage unit;
A series mining process is performed on the set of stay place data stored in the stay history storage unit, and the behavior pattern information representing the characteristic transition behavior of the user by the stay place series and its stay time information. Generating and storing the generated set of action pattern information in the action pattern storage unit;
Based on the acquired stay place data and a set of action pattern information stored in the action pattern recording unit, the stay place and the stay time corresponding to the stay place and the stay time information included in the stay place data. A behavior prediction method comprising: selecting matching behavior pattern information including information from the set of behavior pattern information.
前記適合行動パターンを選択する過程は、
前記行動パターン記録部に格納された行動パターン情報の集合の中から、前記取得された滞在地データに含まれる滞在地と地名が一致する滞在地を抽出する手段と、
前記抽出された滞在地の各々について、前記取得された滞在地データに含まれる滞在地との一致の度合いを表す尤度を、前記取得された滞在地データに含まれる滞在時刻と、前記抽出された滞在地における滞在開始時刻又は滞在終了時刻の平均及び分散を表す値とに基づいて計算する過程と、
前記計算された尤度に基づいて、当該尤度が予め設定した条件を満たす滞在地を前記抽出された滞在地の中から選択する過程と、
前記選択された滞在地と当該滞在地を含む行動パターンを表す情報を適合行動パターン情報として出力する過程と
を備えることを特徴とする請求項4記載の行動予測方法。 The process of generating the behavior pattern information generates behavior pattern information including a value representing an average and variance of the stay start time or the stay end time in the stay place as the stay time information,
The process of selecting the conforming behavior pattern includes:
Means for extracting from the set of behavior pattern information stored in the behavior pattern recording unit a stay place whose place name matches the stay place included in the acquired stay place data;
For each of the extracted stay destinations, the likelihood representing the degree of coincidence with the stay place included in the acquired stay place data, the stay time included in the acquired stay place data, and the extracted A process of calculating based on the average and variance of the stay start time or stay end time in the stay place;
Based on the calculated likelihood, a process of selecting a staying place where the likelihood satisfies a preset condition from the extracted staying places;
5. The behavior prediction method according to claim 4, further comprising a step of outputting information indicating the selected stay place and an action pattern including the stay place as matching action pattern information.
さらに具備することを特徴とする請求項4又は5記載の行動予測方法。 The process of selecting the conforming behavior pattern predicts a staying place where the user will move and its arrival time based on a staying place sequence and staying time information included in the selected conforming behavior pattern information, 6. The behavior prediction method according to claim 4, further comprising a step of outputting information representing a prediction result.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009034008A JP5469876B2 (en) | 2009-02-17 | 2009-02-17 | Behavior prediction apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009034008A JP5469876B2 (en) | 2009-02-17 | 2009-02-17 | Behavior prediction apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010191589A true JP2010191589A (en) | 2010-09-02 |
JP5469876B2 JP5469876B2 (en) | 2014-04-16 |
Family
ID=42817590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009034008A Expired - Fee Related JP5469876B2 (en) | 2009-02-17 | 2009-02-17 | Behavior prediction apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5469876B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104833365A (en) * | 2014-02-12 | 2015-08-12 | 华为技术有限公司 | Prediction method and prediction device of user destination |
JP2016173649A (en) * | 2015-03-16 | 2016-09-29 | カシオ計算機株式会社 | Customer behavior control system and customer behavior control method |
CN112773657A (en) * | 2019-11-08 | 2021-05-11 | 上海荣泰健康科技股份有限公司 | Shoulder finding control method of massage chair |
CN114648308A (en) * | 2016-12-02 | 2022-06-21 | 微软技术许可有限责任公司 | A system for interpreting and managing imprecise temporal expressions |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001056805A (en) * | 1999-08-18 | 2001-02-27 | Sony Corp | Behavior predicting method and its device |
JP2005056022A (en) * | 2003-06-12 | 2005-03-03 | Toshiba Corp | Data extraction apparatus, data extraction method and data extraction program |
JP2005065022A (en) * | 2003-08-18 | 2005-03-10 | Honda Motor Co Ltd | Image photographing apparatus of mobile robot using portable terminal device, and method thereof |
JP2006318294A (en) * | 2005-05-13 | 2006-11-24 | Vodafone Kk | Information distribution apparatus and information distribution system |
JP2007263972A (en) * | 2002-10-10 | 2007-10-11 | Matsushita Electric Ind Co Ltd | Information presenting method and device |
JP2008123317A (en) * | 2006-11-14 | 2008-05-29 | Dainippon Printing Co Ltd | Information providing system |
JP2008158823A (en) * | 2006-12-25 | 2008-07-10 | Dainippon Printing Co Ltd | Information providing system |
JP2009036594A (en) * | 2007-07-31 | 2009-02-19 | Panasonic Corp | Destination prediction apparatus and destination prediction method |
-
2009
- 2009-02-17 JP JP2009034008A patent/JP5469876B2/en not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001056805A (en) * | 1999-08-18 | 2001-02-27 | Sony Corp | Behavior predicting method and its device |
JP2007263972A (en) * | 2002-10-10 | 2007-10-11 | Matsushita Electric Ind Co Ltd | Information presenting method and device |
JP2005056022A (en) * | 2003-06-12 | 2005-03-03 | Toshiba Corp | Data extraction apparatus, data extraction method and data extraction program |
JP2005065022A (en) * | 2003-08-18 | 2005-03-10 | Honda Motor Co Ltd | Image photographing apparatus of mobile robot using portable terminal device, and method thereof |
JP2006318294A (en) * | 2005-05-13 | 2006-11-24 | Vodafone Kk | Information distribution apparatus and information distribution system |
JP2008123317A (en) * | 2006-11-14 | 2008-05-29 | Dainippon Printing Co Ltd | Information providing system |
JP2008158823A (en) * | 2006-12-25 | 2008-07-10 | Dainippon Printing Co Ltd | Information providing system |
JP2009036594A (en) * | 2007-07-31 | 2009-02-19 | Panasonic Corp | Destination prediction apparatus and destination prediction method |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104833365A (en) * | 2014-02-12 | 2015-08-12 | 华为技术有限公司 | Prediction method and prediction device of user destination |
JP2016173649A (en) * | 2015-03-16 | 2016-09-29 | カシオ計算機株式会社 | Customer behavior control system and customer behavior control method |
CN114648308A (en) * | 2016-12-02 | 2022-06-21 | 微软技术许可有限责任公司 | A system for interpreting and managing imprecise temporal expressions |
CN112773657A (en) * | 2019-11-08 | 2021-05-11 | 上海荣泰健康科技股份有限公司 | Shoulder finding control method of massage chair |
CN112773657B (en) * | 2019-11-08 | 2022-11-22 | 上海荣泰健康科技股份有限公司 | Shoulder finding control method of massage chair |
Also Published As
Publication number | Publication date |
---|---|
JP5469876B2 (en) | 2014-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101999471B1 (en) | Information recommendation methods and devices | |
WO2018040944A1 (en) | System, method, and device for identifying malicious address/malicious purchase order | |
CN110162698B (en) | User portrait data processing method, device and storage medium | |
CN111666450B (en) | Video recall method, device, electronic equipment and computer readable storage medium | |
CN111639988B (en) | Broker recommendation method, device, electronic equipment and storage medium | |
EP3168795A1 (en) | Method and apparatus for evaluating relevance of keyword to asset price | |
US20140247997A1 (en) | Information processing system, information processing method, and computer program product | |
US10489637B2 (en) | Method and device for obtaining similar face images and face image information | |
US11620474B2 (en) | Model reselection for accommodating unsatisfactory training data | |
US20110117537A1 (en) | Usage estimation device | |
CN112508638B (en) | Data processing method and device and computer equipment | |
CN109961351B (en) | Information recommendation method and device, storage medium and computer equipment | |
CN110597965B (en) | Emotion polarity analysis method and device for article, electronic equipment and storage medium | |
JP7015927B2 (en) | Learning model application system, learning model application method, and program | |
CN117235586B (en) | Hotel customer portrait construction method, system, electronic equipment and storage medium | |
JP6029192B2 (en) | Input support system, input support method, and input support program | |
JP5469876B2 (en) | Behavior prediction apparatus and program | |
JP5235160B2 (en) | Behavior prediction device and program | |
CN115907926A (en) | Commodity recommendation method and device, electronic equipment and storage medium | |
KR101743169B1 (en) | System and Method for Searching Missing Family Using Facial Information and Storage Medium of Executing The Program | |
CN111831892A (en) | Information recommendation method, information recommendation device, server and storage medium | |
JP2010108102A (en) | Action pattern extraction device, method, and program | |
CN114186129B (en) | Package recommendation method, package recommendation device, electronic equipment and computer readable medium | |
CN115796984A (en) | Training method of item recommendation model, storage medium and related equipment | |
KR20190018807A (en) | Apparatus and method for providing information through analysis of movement patterns between stock prices |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120619 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120627 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120813 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130308 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130820 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140109 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5469876 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |