JP7634499B2 - Information processing system, method and program - Google Patents
Information processing system, method and program Download PDFInfo
- Publication number
- JP7634499B2 JP7634499B2 JP2022056450A JP2022056450A JP7634499B2 JP 7634499 B2 JP7634499 B2 JP 7634499B2 JP 2022056450 A JP2022056450 A JP 2022056450A JP 2022056450 A JP2022056450 A JP 2022056450A JP 7634499 B2 JP7634499 B2 JP 7634499B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- target user
- attribute data
- attribute
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 36
- 238000000034 method Methods 0.000 title description 25
- 238000010801 machine learning Methods 0.000 claims description 61
- 238000003066 decision tree Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 14
- 238000012549 training Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 7
- 230000003542 behavioural effect Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 208000001613 Gambling Diseases 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Description
本開示は、ユーザに関するスコアの算出等の評価を支援するための技術に関する。 This disclosure relates to technology for supporting evaluations such as calculating scores for users.
従来、ユーザの行動を示す行動情報を取得するユーザ情報取得部と、行動情報に基づいて、将来のユーザの融資に対する返済能力に関する信用度を判定する信用度判定部と、を備える判定装置が提案されている(特許文献1を参照)。また、ユーザ間の親密度に応じてユーザスコアの表示可否が決定されるシステムが提案されている(例えば、特許文献2を参照)。 Conventionally, a judgment device has been proposed that includes a user information acquisition unit that acquires behavioral information indicating the user's behavior, and a creditworthiness judgment unit that judges the user's creditworthiness regarding his or her future ability to repay loans based on the behavioral information (see Patent Document 1). Also, a system has been proposed that determines whether or not to display a user score depending on the intimacy between users (see, for example, Patent Document 2).
従来、ユーザの行動履歴に基づいてユーザの信用度等を表すユーザスコアを算出する技術が提案されている。しかし、対象ユーザの情報が欠損していたり情報の信頼性が低かったりする場合には、ユーザスコアが算出できない、又は算出されるユーザスコアの精度が不十分となる、といった問題があった。 Technology has been proposed to calculate a user score that represents a user's trustworthiness, etc., based on the user's behavioral history. However, there are problems with this technology, such as the inability to calculate a user score or the accuracy of the calculated user score being insufficient when information about the target user is missing or the information is unreliable.
本開示は、上記した問題に鑑み、対象ユーザの情報が欠損していたり情報の信頼性が低かったりする場合にも、ユーザスコアの算出等の評価を実現させ、又は評価精度を向上させることを課題とする。 In view of the above problems, the present disclosure aims to realize evaluation such as calculation of a user score, or to improve the accuracy of the evaluation, even when information on the target user is missing or the information is unreliable.
本開示の一例は、対象ユーザと互いに関係がある参照ユーザを特定する参照ユーザ特定手段と、前記対象ユーザについて特定された前記参照ユーザの属性データに基づいて、該対象ユーザの対応する属性データを生成する属性生成手段と、生成された前記対象のユーザの対応する属性データの少なくとも一部に基づいて、前記対象ユーザの対応する属性データ群を補完する属性補完手段と、補完された前記対象ユーザの対応する前記属性データ群に基づいて、該対象ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、を備える情報処理システムである。 An example of the present disclosure is an information processing system including a reference user identification means for identifying a reference user having a relationship with a target user, an attribute generation means for generating corresponding attribute data of the target user based on attribute data of the reference user identified for the target user, an attribute completion means for completing a corresponding attribute data group of the target user based on at least a portion of the generated corresponding attribute data of the target user, and a user score estimation means for estimating a user score to be set for the target user based on the completed corresponding attribute data group of the target user.
本開示は、情報処理装置、システム、コンピュータによって実行される方法又はコンピュータに実行させるプログラムとして把握することが可能である。また、本開示は、そのようなプログラムをコンピュータその他の装置、機械等が読み取り可能な記録媒体に記録したものとしても把握できる。ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的又は化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。 The present disclosure can be understood as an information processing device, a system, a method executed by a computer, or a program executed by a computer. The present disclosure can also be understood as such a program recorded on a recording medium readable by a computer or other device, machine, etc. Here, a recording medium readable by a computer, etc. refers to a recording medium that stores information such as data and programs through electrical, magnetic, optical, mechanical, or chemical action and can be read by a computer, etc.
本開示によれば、対象ユーザの情報が欠損していたり情報の信頼性が低かったりする場合にも、ユーザスコアの算出等の評価を実現させ、又は評価精度を向上させることが可能となる。 According to the present disclosure, even when information on a target user is missing or the information is unreliable, it is possible to perform evaluation such as calculating a user score, or to improve the accuracy of the evaluation.
以下、本開示に係る情報処理装置、方法及びプログラムの実施の形態を、図面に基づいて説明する。但し、以下に説明する実施の形態は、実施形態を例示するものであって、本開示に係る情報処理装置、方法及びプログラムを以下に説明する具体的構成に限定するものではない。実施にあたっては、実施の態様に応じた具体的構成が適宜採用され、また、種々の改良や変形が行われてよい。 Below, an embodiment of an information processing device, method, and program according to the present disclosure will be described with reference to the drawings. However, the embodiment described below is merely an example of an embodiment, and the information processing device, method, and program according to the present disclosure are not limited to the specific configuration described below. In implementing the present disclosure, a specific configuration according to the embodiment may be appropriately adopted, and various improvements and modifications may be made.
本実施形態では、本開示に係る技術を、ユーザに関連する何らかの尺度(例えば、信用等)を示すユーザスコアを管理するユーザスコア管理システムのために実施した場合の実施の形態について説明する。但し、本開示に係る技術は、ユーザスコアを推定するための技術について広く用いることが可能であり、本開示の適用対象は、実施形態において示した例に限定されない。 In this embodiment, an embodiment will be described in which the technology according to the present disclosure is implemented for a user score management system that manages a user score that indicates some measure related to a user (e.g., credit, etc.). However, the technology according to the present disclosure can be widely used as a technology for estimating a user score, and the application of the present disclosure is not limited to the examples shown in the embodiment.
<システムの構成>
図1は、本実施形態に係る情報処理システムの構成を示す概略図である。本実施形態に係るシステムでは、情報処理装置1と、1又は複数のサービス提供システム5と、が互いに通信可能に接続されている。ユーザは、サービス提供システム5によって提供されるサービスの利用者であり、ユーザ端末からサービス提供システム5にアクセスすることでサービスの提供を受ける。
<System Configuration>
1 is a schematic diagram showing the configuration of an information processing system according to this embodiment. In the system according to this embodiment, an
情報処理装置1は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、EEPROM(Electrically Erasable and Programmable Read Only Memory)やHDD(Hard Disk Drive)等の記憶装置14、NIC(Network Interface Card)等の通信ユニット15、等を備えるコンピュータである。但し、情報処理装置1の具体的なハードウェア構成に関しては、実施の態様に応じて適宜省略や置換、追加が可能である。また、情報処理装置1は、単一の筐体からなる装置に限定されない。情報処理装置1は、所謂クラウドや分散コンピューティングの技術等を用いた、複数の装置によって実現されてよい。
The
情報処理装置1は、ユーザ毎にユーザスコアを管理し、サービス提供システム5に対してユーザスコアを提供する。サービス提供システム5は、情報処理装置1から提供されたユーザスコアに応じて、対象ユーザに対するサービスをカスタマイズすることが可能である。
The
サービス提供システム5は、CPU、ROM、RAM、記憶装置、通信ユニット、入力装置、出力装置等(図示は省略する)を備えるコンピュータである。また、これらのシステム及び端末は、いずれも、単一の筐体からなる装置に限定されない。これらのシステム及び端末は、所謂クラウドや分散コンピューティングの技術等を用いた、複数の装置によって実現されてよい。
The
本実施形態に係るシステムでは、サービス提供システム5として、電子商取引システム40、ゴルフ場予約システム42、旅行予約システム44、及びカード管理システム46が互いに通信可能に接続されている。但し、サービス提供システム5によって提供されるサービスは本実施形態における例示に限定されない。サービス提供システム5によって提供されるサービスは、例えば、地図情報サービスやクレジットカード/後払い決済サービス、電子マネー決済サービス、オンラインショッピングサービス、オンライン予約サービス、オペレーションセンターサービス等であってよい。なお、「後払い決済」には、所謂Buy Now, Pay Later(BNPL)等と称されるサービスに限定されず、あらゆる後払いによる商品/サービスの購入が含まれるものとする。
In the system according to this embodiment, an
サービス提供システム5は、サービスの提供に際してユーザから取得された当該ユーザの属性データ群を情報処理装置1に通知する。また、情報処理装置1は、サービス提供システム5にアクセスして、対象ユーザを含む複数のユーザについてシステムに登録されているユーザ属性データを取得し属性データ群に含めることができる。ここで、ユーザの属性データには、システムを利用するユーザに関する情報であるアカウントデータ、及び当該ユーザによるサービスの利用履歴データが含まれる。サービスの利用履歴データの内容はサービスの内容に応じて様々であり、例えば、ユーザの位置情報の履歴データ、クレジットカード利用額/後払い決済利用額の支払履歴データ、電子マネー利用履歴データ、取引履歴データ、予約履歴データ、オペレーションセンターからのユーザに対するオペレーション履歴データ、位置情報の履歴データに基づいて特定された頻繁に訪れる滞在場所等が含まれてよい。また、アカウントデータには、例えば、ユーザID、氏名データ、住所データ、年齢データ、性別データ、電話番号データ、携帯電話番号データ、クレジットカード番号データ、IPアドレスデータ、通学先データ、勤務先データ等が含まれる。
The
ユーザIDは、例えば、当該コンピュータシステムにおける当該ユーザの識別情報である。氏名データは、例えば、当該ユーザの氏名(名字及び名前)を示すデータである。住所データは、例えば、当該ユーザの住所を示すデータである。当該コンピュータシステムが電子商取引システム40である場合に、住所データが、当該ユーザが購入した商品の送付先の住所を示していてもよい。年齢データは、例えば、当該ユーザの年齢を示すデータである。性別データは、例えば、当該ユーザの性別を示すデータである。電話番号データは、例えば、当該ユーザの電話番号を示すデータである。携帯電話番号データは、例えば、当該ユーザの携帯電話番号を示すデータである。クレジットカード番号データは、例えば、当該ユーザが当該コンピュータシステムでの決済において利用するクレジットカードのカード番号を示すデータである。IPアドレスデータは、例えば、当該ユーザが使用するコンピュータのIPアドレス(例えば、送信元のIPアドレス)を示すデータである。通学先データは、例えば、当該ユーザが学生である場合に、当該ユーザの通学先(教育機関名称や住所等)を示すデータである。勤務先データは、例えば、当該ユーザが社会人である場合に、当該ユーザの勤務先(企業名称や住所等)を示すデータである。
The user ID is, for example, the identification information of the user in the computer system. The name data is, for example, data indicating the name (first name and surname) of the user. The address data is, for example, data indicating the address of the user. If the computer system is an
図2は、本実施形態に係る情報処理装置1の機能構成の概略を示す図である。情報処理装置1は、記憶装置14に記録されているプログラムが、RAM13に読み出され、CPU11によって実行されて、情報処理装置1に備えられた各ハードウェアが制御されることで、グラフデータ生成部21、参照ユーザ特定部22、関係性特定部23、関係性強度決定部24、属性選択部25、属性生成部26、属性補完部27、ユーザスコア推定部28、及び機械学習部29を備える情報処理装置として機能する。なお、本実施形態及び後述する他の実施形態では、情報処理装置1の備える各機能は、汎用プロセッサであるCPU11によって実行されるが、これらの機能の一部又は全部は、1又は複数の専用プロセッサによって実行されてもよい。
FIG. 2 is a diagram showing an outline of the functional configuration of the
グラフデータ生成部21は、複数のユーザの夫々の属性データ群に基づいて互いに関係があるユーザのペアを特定することで、ユーザ間の関係性を示すグラフデータ(ソーシャルグラフネットワーク)を生成する。より具体的には、グラフデータ生成部21は、例えば、対象ユーザを含む複数のユーザにそれぞれ対応付けられるノードデータ50と、互いに関係があるユーザのペアに対応付けられるリンクデータ52と、を含むグラフデータを生成する(図4、図6、図8、及び、図9参照)。なお、グラフ生成部21は、明示的リンクで接続されたノード(ユーザ)で構成されるユーザ間関係グラフの学習(表現学習、関係学習、埋込学習、知識グラフ埋め込み)を行うことで、ユーザ間の暗示的リンクを予測し作成する。このとき、グラフ生成部21は、既知の埋め込みモデルまたはその拡張に適宜、基づき、当該学習を行ってよい。
The graph
例えば、図3に示すように、電子商取引システム40に、ユーザAの属性データ群が登録されていることとする。また、ゴルフ場予約システム42に、ユーザBの属性データ群が登録されていることとする。また、旅行予約システム44に、ユーザCの属性データが登録されていることとする。そして、電子商取引システム40に登録されているユーザAのIPアドレスデータの値、ゴルフ場予約システム42に登録されているユーザBのIPアドレスデータの値、及び、旅行予約システム44に登録されているユーザCのIPアドレスデータの値が同じであるとする。
For example, as shown in FIG. 3, suppose that a group of attribute data for user A is registered in
この場合、グラフデータ生成部21は、図4に示すように、ユーザAに対応付けられるノードデータ50a、ユーザBに対応付けられるノードデータ50b、ユーザCに対応付けられるノードデータ50c、ユーザAがユーザBと関係があることを示すリンクデータ52a、ユーザAがユーザCと関係があることを示すリンクデータ52b、ユーザBがユーザCと関係があることを示すリンクデータ52c、を含むグラフデータを生成する。IPアドレスが同じであるユーザは同じコンピュータを利用しているか又は同じ住居又は職場においてグローバルアドレスを共有しているものと推察される。そのため、本実施形態ではこのようなユーザは互いに関連付けられるようになっている。
In this case, as shown in FIG. 4, the graph
また、例えば、図5に示すように、電子商取引システム40に、ユーザD、ユーザE、及び、ユーザFの属性データ群が登録されていることとする。そして、電子商取引システム40に登録されているユーザDの住所データの値、ユーザEの住所データの値、及び、ユーザFの住所データの値が同じであるとする。
For example, suppose that attribute data groups for user D, user E, and user F are registered in
この場合、グラフデータ生成部21は、図6に示すように、ユーザDに対応付けられるノードデータ50d、ユーザEに対応付けられるノードデータ50e、ユーザFに対応付けられるノードデータ50f、ユーザDがユーザEと関係があることを示すリンクデータ52d、ユーザDがユーザFと関係があることを示すリンクデータ52e、ユーザEがユーザFと関係があることを示すリンクデータ52f、を含むグラフデータを生成する。住所が同じであるユーザは同居しているものと推察される。そのため、本実施形態ではこのようなユーザは互いに関連付けられるようになっている。
In this case, as shown in FIG. 6, the graph
また、例えば、図7に示すように、電子商取引システム40に、ユーザGの属性データ群が登録されていることとする。また、ゴルフ場予約システム42に、ユーザHの属性データ群が登録されていることとする。また、旅行予約システム44に、ユーザIの属性データ群が登録されていることとする。そして、電子商取引システム40に登録されているユーザGのクレジットカード番号データの値、ゴルフ場予約システム42に登録されているユーザHのクレジットカード番号データの値、及び、旅行予約システム44に登録されているユーザIのクレジットカード番号データの値が同じであるとする。
For example, as shown in FIG. 7, suppose that a group of attribute data for user G is registered in
この場合、グラフデータ生成部21は、図8に示すように、ユーザGに対応付けられるノードデータ50g、ユーザHに対応付けられるノードデータ50h、ユーザIに対応付けられるノードデータ50i、ユーザGがユーザHと関係があることを示すリンクデータ52g、ユーザGがユーザIと関係があることを示すリンクデータ52h、ユーザHがユーザIと関係があることを示すリンクデータ52i、を含むグラフデータを生成する。クレジットカード番号が同じであるユーザは親子等の家族であるものと推察される。そのため、本実施形態ではこのようなユーザは互いに関連付けられるようになっている。
In this case, as shown in FIG. 8, the graph
なお、互いに関係があるユーザのペアに該当するか否かの判断基準は、以上で説明したものには限定されない。ユーザのペアは、位置情報の履歴や行動履歴等、様々な基準に基づいて判断することが出来る。 The criteria for determining whether a pair of users is related to each other are not limited to those described above. A pair of users can be determined based on various criteria, such as location history and behavior history.
また、以上で説明した、互いに関係があると特定されたユーザを関連付けるリンクデータ52が示すリンクを明示的リンクと呼ぶこととする。ここで例えば、第1のユーザと明示的リンクで接続されているユーザと、第2のユーザと明示的リンクで接続されているユーザと、が所定数以上(例えば、3人以上)共通しているとする。この場合、本実施形態では例えば、グラフデータ生成部21は、当該第1のユーザが当該第2のユーザと関係があることを示すリンクデータ52を生成する。このようにして生成されるリンクデータ52が示すリンクを黙示的リンクと呼ぶこととする。
The link indicated by the link data 52 associating users identified as having a relationship with each other as described above is referred to as an explicit link. For example, a user connected to a first user via an explicit link and a user connected to a second user via an explicit link have a predetermined number of users in common (e.g., three or more). In this case, in this embodiment, for example, the graph
例えば、図9に示すように、明示的リンクを示すリンクデータ52jによって、ユーザJに対応付けられるノードデータ50jとユーザKに対応付けられるノードデータ50kとが接続されていることとする。また、明示的リンクを示すリンクデータ52kによって、ユーザJに対応付けられるノードデータ50jとユーザLに対応付けられるノードデータ50lとが接続されていることとする。また、明示的リンクを示すリンクデータ52lによって、ユーザJに対応付けられるノードデータ50jとユーザMに対応付けられるノードデータ50mとが接続されていることとする。
For example, as shown in FIG. 9, it is assumed that
また、明示的リンクを示すリンクデータ52mによって、ユーザKに対応付けられるノードデータ50kとユーザNに対応付けられるノードデータ50nとが接続されていることとする。また、明示的リンクを示すリンクデータ52nによって、ユーザLに対応付けられるノードデータ50lとユーザNに対応付けられるノードデータ50nとが接続されていることとする。また、明示的リンクを示すリンクデータ52oによって、ユーザMに対応付けられるノードデータ50mとユーザNに対応付けられるノードデータ50nとが接続されていることとする。
In addition, it is assumed that the
この場合、グラフデータ生成部21は、ユーザJがユーザNと関係があることを示すリンクデータ52p(黙示的リンクを示すリンクデータ52p)を生成する。このようにして、ユーザNが、ユーザJと関係があるユーザとして特定されることとなる。
In this case, the graph
また、例えば、第1のユーザと明示的リンク又は黙示的リンクで接続されているユーザと、第2のユーザと明示的リンク又は黙示的リンクで接続されているユーザと、が所定数以上(例えば、3人以上)共通しているとする。この場合、グラフデータ生成部21が、当該第1のユーザが当該第2のユーザと関係があることを示すリンクデータ52(黙示的リンクを示すリンクデータ52)を生成してもよい。
For example, suppose that a user connected to a first user via an explicit link or an implicit link has a predetermined number of users in common (e.g., three or more) with a second user connected to the first user via an explicit link or an implicit link. In this case, the graph
参照ユーザ特定部22は、グラフデータ生成部21によって生成されたグラフデータを参照し、当該グラフデータに含まれるユーザのうち対象ユーザと互いに関係がある他のユーザを、当該対象ユーザに対する参照ユーザとして特定する。ここで、参照ユーザ特定部22は、対象ユーザと関係があるユーザとして特定されるユーザ、及び、関係があるユーザとして特定されるユーザが所定数以上対象ユーザと共通するユーザを、参照ユーザとして特定してもよい。また、参照ユーザ特定部22は、対象ユーザの属性と、複数のユーザの属性と、に基づいて、当該複数のユーザのうちから、参照ユーザを特定してもよい。
The reference
参照ユーザ特定部22は、例えば、対象ユーザに対応付けられるノードデータ50と、明示的リンク又は黙示的リンクを示すリンクデータ52によって接続されるノードデータ50に対応付けられるユーザを、当該対象ユーザに対する参照ユーザとして特定してもよい。
The reference
関係性特定部23は、ユーザ間の関係性を特定する。ここで特定されるユーザ間の関係性は、例えば、(1)同一世帯に居住する親子関係又は夫婦関係、(2)友達関係、(3)同じ職場で働く関係、等である。但し、特定される関係性は本開示における例示に限定されない。本実施形態では、関係性特定部23は、ユーザ間の関係に対応付けられる値に基づくクラスタリングの結果に基づいて、ユーザ間の関係性を特定する。ここで、ユーザ間の関係に対応付けられる値として採用可能な値の種類は限定されないが、例えば、ユーザの氏名、IPアドレス、住所、クレジットカード番号、年齢、性別、通学先、勤務先及び滞在場所のうちの少なくとも1つが含まれてよい。
The
関係性特定部23は、対象ユーザと参照ユーザとの関係性を特定する。ここで、関係性特定部23は、対象ユーザの属性データ群と、参照ユーザの属性データ群と、に基づいて、対象ユーザと参照ユーザとの関係性を特定してもよい。また、対象ユーザの属性データ群が登録されているコンピュータシステムと参照ユーザの属性データ群が登録されているコンピュータシステムとは異なっていてもよい。例えば、電子商取引システム40に登録されている、対象ユーザの属性データ群と、ゴルフ場予約システム42に登録されている、参照ユーザの属性データ群と、に基づいて、対象ユーザと参照ユーザとの関係性を特定してもよい。
The
関係性特定部23は、例えば、リンクデータ52で接続されているノードデータ50のペアを特定する。そして、関係性特定部23は、当該ペアに対応付けられる2人のユーザのユーザ属性データ群に基づいて、当該ペアに対応付けられるペア属性データを生成する。ここで、ペア属性データには、例えば、IP共通フラグ、住所共通フラグ、クレジットカード番号共通フラグ、名字同一フラグ、年齢差データ、ペア性別データ、通学先共通フラグ、勤務先共通フラグ、滞在場所共通フラグ、等が含まれる。
The
IP共通フラグは、例えば、当該ペアのうちの一方の属性データに含まれるIPアドレスデータの値と他方の属性データに含まれるIPアドレスデータの値とが同じであるか否かを示すフラグである。例えば、IPアドレスデータの値が同じである場合はIP共通フラグの値に1が設定され、IPアドレスデータの値が異なる場合はIP共通フラグの値に0が設定されてもよい。 The IP common flag is, for example, a flag indicating whether the value of the IP address data included in one attribute data of the pair is the same as the value of the IP address data included in the other attribute data. For example, if the values of the IP address data are the same, the value of the IP common flag may be set to 1, and if the values of the IP address data are different, the value of the IP common flag may be set to 0.
住所共通フラグ、通学先共通フラグ、勤務先共通フラグ及び滞在場所共通フラグは、例えば、当該ペアのうちの一方の属性データ群に含まれる住所データ/通学先データ/勤務先データ/滞在場所データの値と他方の属性データ群に含まれる住所データ/通学先データ/勤務先データ/滞在場所データの値とが同じであるか否かを示すフラグである。例えば、住所データの値が同じである場合は住所共通フラグの値に1が設定され、住所データの値が異なる場合は住所共通フラグの値に0が設定されてもよい。 The common address flag, common school flag, common workplace flag, and common place of stay flag are flags that indicate, for example, whether the values of the address data/school data/workplace data/place of stay data included in one attribute data group of the pair are the same as the values of the address data/school data/workplace data/place of stay data included in the other attribute data group. For example, if the values of the address data are the same, the value of the common address flag may be set to 1, and if the values of the address data are different, the value of the common address flag may be set to 0.
クレジットカード番号共通フラグは、例えば、当該ペアのうちの一方の属性データ群に含まれるクレジットカード番号データの値と他方の属性データ群に含まれるクレジットカード番号データの値とが同じであるか否かを示すフラグである。例えば、クレジットカード番号データの値が同じである場合はクレジットカード番号共通フラグの値に1が設定され、クレジットカード番号データの値が異なる場合はクレジットカード番号共通フラグの値に0が設定されてもよい。 The credit card number common flag is, for example, a flag indicating whether the value of the credit card number data included in one attribute data group of the pair is the same as the value of the credit card number data included in the other attribute data group. For example, if the values of the credit card number data are the same, the value of the credit card number common flag may be set to 1, and if the values of the credit card number data are different, the value of the credit card number common flag may be set to 0.
名字同一フラグは、例えば、当該ペアのうちの一方の属性データ群に含まれる氏名データが示す名字と他方の属性データ群に含まれる氏名データが示す名字とが同じであるか否かを示すフラグである。例えば、氏名データが示す名字が同じである場合は名字同一フラグの値に1が設定され、氏名データが示す名字が異なる場合は名字同一フラグの値に0が設定されてもよい。 The same surname flag is, for example, a flag indicating whether the surname indicated by the name data included in one attribute data group of the pair is the same as the surname indicated by the name data included in the other attribute data group. For example, if the surnames indicated by the name data are the same, the value of the same surname flag may be set to 1, and if the surnames indicated by the name data are different, the value of the same surname flag may be set to 0.
年齢差データは、例えば、当該ペアのうちの一方の属性データ群に含まれる年齢データの値と他方の属性データ群に含まれる年齢データの値との差を示すデータである。 The age difference data is, for example, data indicating the difference between the value of the age data included in one attribute data group of the pair and the value of the age data included in the other attribute data group.
ペア性別データは、例えば、当該ペアのうちの一方の属性データ群に含まれる性別データの値と他方の属性データ群に含まれる性別データの値との組合せを示すデータである。 Paired gender data is, for example, data that indicates a combination of the gender data value contained in one attribute data group of the pair and the gender data value contained in the other attribute data group.
そして、関係性特定部23は、複数のペアのそれぞれに対応付けられるペア属性データ群の値に基づいて、一般的なクラスタリング手法を用いたクラスタリングを実行することで、当該複数のペアを、図10に示すような複数のクラスタ54に分類する。
Then, the
図10は、複数のペアが、5つのクラスタ54(54a、54b、54c、54d、及び、54e)に分類された様子の一例を模式的に示す図である。図10に示されているバツ印は、ペアに対応付けられる。そして、複数のバツ印のそれぞれは、当該バツ印に対応するペアのペア属性データの値に対応付けられる位置に配置されている。図10の例では、複数のペアが5つのクラスタ54に分類されているが、複数のペアが分類されるクラスタ54の数は5つには限定されず、例えば、複数のペアが4つのクラスタ54に分類されてもよい。 Figure 10 is a diagram showing a schematic example of how a plurality of pairs are classified into five clusters 54 (54a, 54b, 54c, 54d, and 54e). The crosses shown in Figure 10 correspond to pairs. Each of the plurality of crosses is placed at a position that corresponds to the value of the pair attribute data of the pair corresponding to the cross. In the example of Figure 10, the plurality of pairs are classified into five clusters 54, but the number of clusters 54 into which the plurality of pairs are classified is not limited to five, and the plurality of pairs may be classified into four clusters 54, for example.
図11は、複数のペアが4つのクラスタ54に分類された場合における、当該分類の可視化の一例を示す図である。図11に示すように、住所が同じであり、性別が同じであり、年齢差がX歳より大きく、名字が同じペアは、第1クラスタに分類されてもよい。また、住所が同じであり、性別が同じであり、年齢差がX歳以下であり、名字が同じペアは、第2クラスタに分類されてもよい。また、住所が同じであり、性別が異なり、年齢差がY歳より大きく、名字が同じペアは、第3クラスタに分類されてもよい。また、住所が同じであり、性別が異なり、年齢差がY歳以下であり、名字が同じペアは、第4クラスタに分類されてもよい。 FIG. 11 is a diagram showing an example of visualization of classification when multiple pairs are classified into four clusters 54. As shown in FIG. 11, pairs with the same address, the same gender, an age difference of more than X years, and the same last name may be classified into a first cluster. Pairs with the same address, the same gender, an age difference of X years or less, and the same last name may be classified into a second cluster. Pairs with the same address, different gender, an age difference of more than Y years, and the same last name may be classified into a third cluster. Pairs with the same address, different gender, an age difference of Y years or less, and the same last name may be classified into a fourth cluster.
この場合、第1クラスタは、例えば同性の親子に対応付けられるクラスタ54であるものと推察される。また、第2クラスタは、同性の兄弟に対応付けられるクラスタ54であるものと推察される。また、第3クラスタは、異性の親子に対応付けられるクラスタ54であるものと推察される。また、第4クラスタは、夫婦に対応付けられるクラスタ54であるものと推察される。 In this case, the first cluster is presumed to be cluster 54 associated with, for example, parents and children of the same sex. The second cluster is presumed to be cluster 54 associated with siblings of the same sex. The third cluster is presumed to be cluster 54 associated with parents and children of the opposite sex. The fourth cluster is presumed to be cluster 54 associated with a married couple.
以上で説明したようにして、関係性特定部23が、ユーザ間の関係に対応付けられる値に基づくクラスタリングの結果に基づいて、対象ユーザと参照ユーザとの関係性を特定してもよい。通学先共通フラグ、勤務先共通フラグ、滞在場所共通フラグに基づくクラスタリングによって友達関係や同じ職場で働く関係のクラスタを作成する場合の具体例については、上記説明した例と概略同様であるため、説明を省略する。また、関係性特定部23が、名字、IPアドレス、住所、クレジットカード番号、年齢差、性別、通学先、勤務先及び滞在場所のうちの少なくとも1つに基づくクラスタリングの結果に基づいて、対象ユーザと参照ユーザとの関係性を特定してもよい。
As described above, the
関係性強度決定部24は、対象ユーザと参照ユーザとの関係性に対応する判断基準に従って、当該対象ユーザと当該参照ユーザとの関係の強さを示す指標に基づいて、当該対象ユーザと当該参照ユーザとの近さを示す関係性強度(以下、「近さスコア」とも称する。)を決定する。本実施形態において、関係性強度決定部24は、対象ユーザと参照ユーザとの関係性に対応する学習済の機械学習モデルに指標を表すデータを入力した際の出力に基づいて、対象ユーザと参照ユーザとの近さを示す関係性強度(近さスコア)を決定する。
The relationship
ここで、関係性強度決定部24は、それぞれ上述のクラスタ54に対応付けられる学習済の機械学習モデルを含んでいてもよい。例えば、複数のペアが5つのクラスタ54に分類される場合には、関係性強度決定部24は、5つの機械学習モデルを含んでいてもよい。そして、関係性強度決定部24は、対象ユーザと参照ユーザとの関係性に対応する学習済の機械学習モデルに、対象ユーザと当該参照ユーザとの関係の強さを示す指標を表すデータを入力した際の出力に基づいて、対象ユーザと参照ユーザとの近さを示す近さスコアを決定してもよい。この場合、学習済の機械学習モデルにおいて実装された入出力関係が、上述の判断基準に相当する。
Here, the relationship
図12に示すように、関係性強度決定部24が、n番目の機械学習モデルである第n機械学習モデルに、第n機械学習モデルに対応付けられるクラスタ54に分類されたペアに対応する入力データを入力してもよい。例えば、関係性強度決定部24が5つの機械学習モデルを含む場合は、上述の値nは、1以上5以下の整数のうちのいずれかとなる。そして、関係性強度決定部24が、当該入力データの入力に応じて第n機械学習モデルから出力される出力データの値を、当該ペアについての近さスコアの値として決定するようにしてもよい。
As shown in FIG. 12, the relationship
ペアに対応付けられる入力データには、例えば、当該ペアに対応付けられるペア属性データの一部又は全部が含まれるようにしてもよい。また、入力データに、ペア属性データに含まれていないデータが含まれるようにしてもよい。例えば、入力データに、電子商取引システム40の利用履歴を示すデータや、関係性強度決定部24によってSNS等の他の情報源から取得されるデータ等が含まれていてもよい。より具体的には例えば、入力データに、ペア間の単位期間あたりの通話回数やメッセージのやり取りの回数、一方が他方に送ったギフトの数、ペアにおける共通のフレンドの数、等を示すデータが含まれるようにしてもよい。
The input data associated with a pair may include, for example, some or all of the pair attribute data associated with the pair. The input data may also include data that is not included in the pair attribute data. For example, the input data may include data indicating the usage history of the
また、ペアに対応付けられる入力データに含まれるデータの種類は、当該ペアが属するクラスタ54によって同じであってもよいし異なっていてもよい。例えば、第1機械学習モデルに入力される入力データに含まれるデータの種類と、第2機械学習モデルに入力される入力データに含まれるデータの種類と、が異なっていてもよい。 In addition, the type of data included in the input data associated with a pair may be the same or different depending on the cluster 54 to which the pair belongs. For example, the type of data included in the input data input to the first machine learning model may be different from the type of data included in the input data input to the second machine learning model.
本実施形態では例えば、関係性強度決定部24による近さスコアの決定に先立って、予め、第n機械学習モデルに対応付けられる所与の複数の教師データを用いた、第n機械学習モデルの学習が実行される。この教師データは、例えば、当該第n機械学習モデルに対応付けられるクラスタ54における近さスコアの決定が妥当なものとなるよう予め準備されたものである。ここで、教師データに設定される近さスコアは、ルールベースで設定された(アノテーションがなされた)近さスコアであってもよい。また、機械学習モデルによって過去に出力された後で、管理者等によって修正された近さスコアであってもよい。
In this embodiment, for example, prior to the determination of the closeness score by the relationship
ここで、第n機械学習モデルに対して、弱教師あり学習による学習が行われてもよい。例えば、教師データに、第n機械学習モデルに入力される入力データと同じ種類のデータが含まれている学習入力データと、学習入力データの入力に応じて第n機械学習モデルから出力される出力データと比較される教師データと、が含まれていてもよい。 Here, weakly supervised learning may be performed on the nth machine learning model. For example, the training data may include training input data that includes the same type of data as the input data input to the nth machine learning model, and training data that is compared with output data output from the nth machine learning model in response to the input of the training input data.
ここで例えば、上述の近さスコアが、0又は1のいずれかの値をとるとする。例えば、ペアが近い関係にある場合には、当該ペアの近さスコアの値として1が決定され、そうでない場合に、当該ペアの近さスコアの値として0が決定されるとする。この場合、教師データが、対応する学習入力データにおける妥当な近さスコアの値、及び、この値が妥当である確率を示すデータを含んでいてもよい。そして、例えば、教師データに含まれる学習入力データの入力に応じて第n機械学習モデルから出力される出力データの値と、当該教師データに含まれる教師データの値と、に基づいて、第n機械学習モデルのパラメータの値を更新する弱教師あり学習が実行されてもよい。 Here, for example, the closeness score described above takes a value of either 0 or 1. For example, if the pair is closely related, the closeness score value of the pair is determined to be 1, and if not, the closeness score value of the pair is determined to be 0. In this case, the teacher data may include a valid closeness score value for the corresponding learning input data and data indicating the probability that this value is valid. Then, for example, weakly supervised learning may be performed to update the parameter values of the nth machine learning model based on the value of the output data output from the nth machine learning model in response to the input of the learning input data included in the teacher data and the value of the teacher data included in the teacher data.
なお、上述の近さスコアは、0又は1のいずれかの値をとるバイナリデータである必要はない。例えば、上述の近さスコアが、当該ペアが近い関係にあるほど大きな値となる実数値(例えば、0以上10以下の実数値)や、多段階の整数値(例えば、1以上10以下の整数値)であっても構わない。 The above-mentioned closeness score does not have to be binary data that takes the value of either 0 or 1. For example, the above-mentioned closeness score may be a real number (e.g., a real number between 0 and 10 inclusive) that increases the closer the pair is to each other, or a multi-level integer value (e.g., an integer number between 1 and 10 inclusive).
また、機械学習モデルの学習手法は、弱教師あり学習には限定されない。一具体例として、兄弟の関係があるペアについて考察する。この場合、当該ペアに対応付けられる入力データが、兄弟という関係に対応する学習済の機械学習モデルに入力される。そして例えば、このペアについて住所データの値が同じであり、このペアの一方が他方に送ったギフトの数が50であり、このペアの今までの通話回数が1200回である場合には、値が1である出力データが出力されるような学習が実行されてもよい。また例えば、このペアについて住所データの値が異なっており、このペアの一方が他方に送ったギフトの数が2であり、このペアの今までの通話回数が30回である場合には、値が0である出力データが出力されるような学習が実行されてもよい。そして、近さスコアに対応する出力データの値が1となるか0となるかの判断基準(例えば閾値)が、機械学習モデルによって異なっていてもよい。 Furthermore, the learning method of the machine learning model is not limited to weakly supervised learning. As a specific example, consider a pair that has a sibling relationship. In this case, input data associated with the pair is input to a trained machine learning model that corresponds to the sibling relationship. For example, if the address data values for the pair are the same, one of the pair has sent 50 gifts to the other, and the number of calls between the pair has been 1200, learning may be performed to output output data with a value of 1. For example, if the address data values for the pair are different, one of the pair has sent 2 gifts to the other, and the number of calls between the pair has been 30, learning may be performed to output output data with a value of 0. The criteria (e.g., threshold) for determining whether the value of the output data corresponding to the closeness score is 1 or 0 may differ depending on the machine learning model.
属性選択部25は、対象ユーザと参照ユーザとの関係性の種類に応じて、属性生成部26によって生成される属性データの種類(補完対象の属性データの種類)を選択する。ユーザ間の関係性の種類の具体例、及び関係性の種類に応じて選択される属性データの種類としては、以下に例示するような関係性及び属性データが挙げられる。
The
(1)同一世帯に居住する親子関係又は夫婦関係
ユーザ間の関係性が同一世帯に居住する親子関係又は夫婦関係である場合、主に、金銭系の変数、世帯としての行動を示す変数は同一になると仮定できる。このため、ユーザ間に当該関係性が特定された場合、属性選択部25は、属性生成部26によって生成される属性データの種類として、例えば、世帯収入、世帯年収、居住地、(世帯としての)保険加入有無、預貯金額、金融資産、新聞購読有無、等を選択する。
(1) Parent-child or marital relationship living in the same household When the relationship between users is a parent-child or marital relationship living in the same household, it can be assumed that mainly monetary variables and variables indicating behavior as a household are the same. Therefore, when such a relationship between users is identified, the
(2)友達関係
ユーザ間の関係性が友達関係である場合、同じ性別・年齢・趣味の集団が友達になりやすいと仮定できる。このため、ユーザ間に当該関係性が特定された場合、属性選択部25は、属性生成部26によって生成される属性データの種類として、例えば、趣味、よく行く場所・地域、年齢、性別、等を選択する。
(2) Friendship Relationship When the relationship between users is a friendship relationship, it can be assumed that groups of people with the same sex, age, and hobbies are likely to become friends. Therefore, when the relationship between users is identified, the
(3)同じ職場で働く関係
ユーザ間の関係性が同じ職場で働く関係である場合、同じ教育水準、専門分野の集団が、同じ職場で働いている場合が多いと仮定できる。このため、ユーザ間に当該関係性が特定された場合、属性選択部25は、属性生成部26によって生成される属性データの種類として、例えば、購入する専門書のジャンル、教育水準、等を選択する。
(3) Relationship of working in the same workplace When the relationship between users is a relationship of working in the same workplace, it can be assumed that a group with the same educational level and specialty field often works in the same workplace. Therefore, when the relationship between users is identified, the
本実施形態では、属性選択部25がルールベースで補完対象(生成対象)の属性データの種類を選択する方法を説明したが、補完対象属性データの種類の選択方法は、本実施形態における例示に限定されない。例えば、ユーザ間の関係性の種類と近似する属性データの種類との相関性の有無や相関度を学習させた機械学習モデルを用いて、補完対象属性データの種類を選択する方法が採用されてもよい。
In this embodiment, a method has been described in which the
属性生成部26は、対象ユーザの属性データ群のうち欠損している属性データ又は信頼性の低い属性データを補完するための属性データを、対象ユーザについて特定された少なくとも1の参照ユーザに関する情報に基づいて生成する。ここで、属性生成部26は、参照ユーザに関する情報として、参照ユーザの属性データ群のうち属性選択部25によって選択された種類の属性データを参照し、参照された属性データに対応する対象ユーザの属性データを生成する。
The
具体的には、対象ユーザと参照ユーザとの間の関係性が「(1)同一世帯に居住する親子関係又は夫婦関係」である場合、属性生成部26は、世帯収入、世帯年収、居住地、(世帯としての)保険加入有無、預貯金額、金融資産、新聞購読有無、等の属性データについて参照ユーザの属性データを参照し、これに基づいて対象ユーザの対応する属性データを生成する。また、対象ユーザと参照ユーザとの間の関係性が「(2)友達関係」である場合、属性生成部26は、趣味、よく行く場所・地域、年齢、性別、等の属性データについて参照ユーザの属性データを参照し、これに基づいて対象ユーザの対応する属性データを生成する。また、対象ユーザと参照ユーザとの間の関係性が「(3)同じ職場で働く関係」である場合、属性生成部26は、購入する専門書のジャンル、教育水準、等の属性データについて参照ユーザの属性データを参照し、これに基づいて対象ユーザの対応する属性データを生成する。
Specifically, when the relationship between the target user and the reference user is "(1) parent-child relationship or marital relationship residing in the same household," the
属性生成部26は、参照ユーザの属性データのパラメータをそのまま対象ユーザの対応する属性データにコピーすることで、対象ユーザの属性データを生成してもよい。但し、属性生成部26は、参照ユーザの属性データのパラメータに対して何らかの処理を加えることで、対象ユーザの対応する属性データを生成することとしてもよい。例えば、対象ユーザの属性データの生成にあたって、属性生成部26は、参照ユーザについて決定された近さスコアを参照し、参照ユーザの属性データのパラメータと近さスコアとに基づいて、対象ユーザの属性データを生成してもよい。
The
例えば、属性生成部26は、参照ユーザの属性データのパラメータに対して、近さスコアに基づいて決定された重み付けを行うことで、対象ユーザの属性データを生成してもよい。この場合、属性生成部26は、対象ユーザと参照ユーザとの間の近さスコアがユーザ間の関係性強度が高いことを示しているほど、大きな重み付け係数を設定する。そして、参照ユーザの属性データのパラメータに対して重み付け係数を用いた処理(例えば、単純にパラメータに対して重み付け係数を積算する等)を行うことで、対象ユーザについて補完される属性データのパラメータが、参照された参照ユーザの属性データのパラメータに近くなるようにすることが出来る。
For example, the
また、ここで、参照ユーザが複数特定されている場合、複数の参照ユーザに基づいて対象ユーザの属性データが生成されてもよい。例えば、属性生成部26は、複数の参照ユーザの夫々について近さスコアと補完対象属性データのパラメータとを取得し、各参照ユーザから取得されたパラメータを近さスコアに基づいて重み付けし、参照ユーザ毎に得られた複数の重み付け済パラメータの平均(平均に限らず、中央値等その他の統計量が採用されてもよい)を、対象ユーザの対応する属性データのパラメータとしてよい。
In addition, here, when multiple reference users are identified, attribute data of the target user may be generated based on the multiple reference users. For example, the
また、例えば、属性生成部26は、補完が行われる前の対象ユーザの属性データ群の少なくとも一部のパラメータと、参照ユーザの属性データ群の少なくとも一部のパラメータと、対象ユーザ及び参照ユーザ間の近さスコアと、を入力値とし、補完される対象ユーザの属性データを出力値とする属性生成モデルを用いて、対象ユーザの属性データを生成してもよい。重み付けを採用する場合と同様、属性生成モデルを採用する場合も、属性生成モデルは、対象ユーザと参照ユーザとの間の近さスコアが高いほど、対象ユーザについて補完される属性データのパラメータが、参照された参照ユーザの属性データのパラメータに近くなるように生成及び/又は更新される。また、属性生成モデルに対して複数の参照ユーザに係る近さスコア及び属性データを入力し、対象ユーザの補完対象属性データのパラメータが出力されるようにしてもよいことも、上記重み付けを採用する場合と同様である。
For example, the
属性補完部27は、生成された属性データの少なくとも一部に基づいて、ユーザにかかる属性データ群を補完する。ユーザにかかる属性データ群には、サービス提供システム5から取得されたアカウントデータ及び利用履歴データを含む属性データが含まれるが、この際、属性補完部27は、属性生成部26によって生成された属性データの少なくとも一部を対象ユーザにかかる属性データ群の少なくとも一部として決定し、ユーザにかかる属性データ群を補完する。
The
ここで、属性補完部27によって補完される属性データには、デモグラフィック属性、ビヘイビオラル属性、又はサイコグラフィック属性が含まれてよい。デモグラフィック属性は、例えば、ユーザの性別(ジェンダー)、家族構成、年齢等であり、ビヘイビオラル属性は、例えば、キャッシング利用有無、リボ払い利用有無、所定の口座に係る入出金履歴、賭博又はくじを含む何らかの商品に係る商取引履歴(オンラインマーケットプレイス等におけるオンライン取引履歴を含んでよい)等であり、サイコグラフィック属性は、例えば、賭博又はくじに係る趣向等である。但し、利用可能なユーザの属性は、本実施形態における例示に限定されない。例えば、オペレーションセンターサービス等からの「オペレーション(架電等)に要する時間」、「クレジットカード利用額/後払い決済利用額」も、属性データとして用いられてよい。
Here, the attribute data complemented by the
ユーザスコア推定部28は、補完された属性データ群に基づいて、ユーザに設定されるユーザスコアを推定する。本実施形態において、ユーザスコア推定部28は、ユーザの属性データ群をユーザスコア推定モデルに入力することで、当該ユーザに設定されるユーザスコアを推定する。ここで、ユーザスコア推定モデルの出力値は、0を最小値、1を最大値として正規化/規格化されたユーザスコアである。ここで、ユーザスコア推定モデルに入力される対象ユーザの属性データ群には、属性生成部26によって生成された属性データが含まれる。上述の通り、属性生成部26によって生成された属性データには、例えば、世帯収入、世帯年収、居住地、(世帯としての)保険加入有無、預貯金額、金融資産、新聞購読有無、趣味、よく行く場所・地域、年齢、性別、購入する専門書のジャンル、教育水準、等が含まれてよい。
The user
機械学習部29は、ユーザスコア推定部28によるユーザスコア推定に用いられるユーザスコア推定モデルを生成及び/又は更新する。ユーザスコア推定モデルは、対象ユーザに係る1又は複数の属性データ(属性データ群)が入力された場合に、ユーザに関連する何らかの尺度(例えば、信用等)を示すユーザスコアを出力する機械学習モデルであってよく、ユーザスコアを出力可能な何らかの関数又は統計モデルであってよい。
The
ユーザスコア推定モデルの生成及び/又は更新にあたって、機械学習部29は、サービス提供システム5から取得したデータに基づいて、ユーザ毎に、当該ユーザのデモグラフィック属性を含む属性データ群を入力値とし当該ユーザに係るユーザスコアを出力値として定義した教師データを作成する。そして、機械学習部29は、当該教師データに基づいて、ユーザスコア推定モデルを作成する。上述の通り、ユーザスコア推定モデルに入力される属性データ群には、属性生成部26によって生成された属性データが含まれ、対応するユーザのユーザスコアと組み合わせられて、教師データとして機械学習部29に入力される。教師データに設定されるユーザスコアは、ルールベースで設定された(アノテーションがなされた)ユーザスコアであってもよい。また、ユーザスコア推定モデルによって過去に出力された後で、管理者等によって修正されたユーザスコアであってもよい。
When generating and/or updating the user score estimation model, the
本開示に係る技術を実装するにあたり採用可能な機械学習モデル生成のフレームワークは、例として、アンサンブル学習アルゴリズムに基づく。当該フレームワークには、例えば、勾配ブースティング決定木(Gradient Boosting Decision Tree:GBDT)に基づく機械学習フレームワーク(例えば、LightGBM)が採用されてよい。換言すると、当該フレームワークは、前後の弱学習器(弱分類器)間で正解と予測値との誤差を引き継がせるような決定木モデルに基づく機械学習フレームワークが採用されてよい。ここでの予測値とは、例として、ユーザスコアの予測値を指す。なお、当該フレームワークは、LightGBMの他、XGBoostやCatBoost等のブースティング手法を採用してよい。決定木を用いるフレームワークによれば、ニューラルネットワークを用いるフレームワークと比較して少ないパラメータ調整の手間で、比較的高い性能を有する機械学習モデルを生成することが出来る。但し、本開示に係る技術を実装するにあたり採用可能な機械学習モデル生成のフレームワークは、本実施形態における例示に限定されない。例えば、学習器として勾配ブースティング決定木に代えてランダムフォレスト等の他の学習器が採用されてよいし、ニューラルネットワーク等の所謂弱学習器とは称されない学習器が採用されてもよい。また、特にニューラルネットワーク等の所謂弱学習器とは称されない学習器が採用される場合には、アンサンブル学習が採用されなくてもよい。 A machine learning model generation framework that can be adopted when implementing the technology according to the present disclosure is based on an ensemble learning algorithm, for example. For example, a machine learning framework (for example, LightGBM) based on a gradient boosting decision tree (GBDT) may be adopted as the framework. In other words, the framework may be a machine learning framework based on a decision tree model that transfers the error between the correct answer and the predicted value between the previous and next weak learners (weak classifiers). The predicted value here refers to the predicted value of the user score, for example. In addition to LightGBM, the framework may adopt boosting methods such as XGBoost and CatBoost. According to a framework using a decision tree, a machine learning model with relatively high performance can be generated with less effort in parameter adjustment compared to a framework using a neural network. However, the machine learning model generation framework that can be adopted when implementing the technology according to the present disclosure is not limited to the examples in this embodiment. For example, instead of a gradient boosting decision tree, another learning device such as a random forest may be used as the learning device, or a learning device that is not a so-called weak learning device such as a neural network may be used. In particular, when a learning device that is not a so-called weak learning device such as a neural network is used, ensemble learning does not need to be used.
図13は、本実施形態において採用される機械学習モデルの決定木の概念を簡略化して示す図である。決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークを採用する場合、決定木の各ノードの分岐条件の最適化が行われる。具体的には、決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークでは、一つの親のノードから分岐した二つの子のノードの夫々が示す属性を有するユーザ群についてユーザスコアを夫々算出し、このユーザスコアの差分が大きくなるように(例えば、差分が最大になるように、又は所定の閾値以上になるように)、即ち、二つの子のノードがきれいに分岐するように、親のノードの分岐条件が最適化される。例えば、ノードの分岐条件として示される属性が年齢である場合、分岐の閾値に設定される年齢を変更したり、分岐条件を年齢以外の属性に変更したりしてもよい。このようにして、決定木の全ノードの分岐条件を再帰的に最適化することで、属性データ群に基づくユーザスコアの推定精度を向上させることができる。 FIG. 13 is a simplified diagram showing the concept of a decision tree in a machine learning model employed in this embodiment. When a gradient boosting machine learning framework based on a decision tree algorithm is employed, the branching conditions of each node of the decision tree are optimized. Specifically, in the gradient boosting machine learning framework based on a decision tree algorithm, a user score is calculated for each user group having attributes indicated by each of two child nodes branched from one parent node, and the branching conditions of the parent node are optimized so that the difference between these user scores is large (for example, so that the difference is maximized or is equal to or greater than a predetermined threshold), that is, so that the two child nodes branch neatly. For example, if the attribute indicated as the branching condition of the node is age, the age set as the branching threshold may be changed, or the branching condition may be changed to an attribute other than age. In this way, the branching conditions of all nodes of the decision tree are recursively optimized, thereby improving the estimation accuracy of the user score based on the attribute data group.
また、属性生成部26が属性生成モデルを用いて補完対象の属性データを生成する場合、機械学習部29は更に、属性生成部26による、対象ユーザの補完対象属性データの生成に用いられる属性生成モデルを生成及び/又は更新する。属性生成モデルは、1又は複数の参照ユーザに係る1又は複数の属性データ及び近さスコアが入力された場合に、対象ユーザに係る補完対象属性データを出力する機械学習モデルである。
In addition, when the
属性生成モデルの生成及び/又は更新にあたって、機械学習部29は、サービス提供システム5から取得したデータのうち、1又は複数の参照ユーザの属性データ及び近さスコアを入力値とし1の属性データ(対象ユーザに係る補完対象属性データ)を出力値として定義した教師データを作成する。ここで、属性生成モデルの生成及び/又は更新に用いられる教師データに設定される出力値(対象ユーザの補完対象属性データのパラメータ)は、ルールベース(例えば、上述した重み付けによる算出方法)で設定された(アノテーションがなされた)出力値であってもよい。また、属性生成モデルによって過去に出力された後で、管理者等によって修正された出力値であってもよい。
When generating and/or updating the attribute generation model, the
そして、機械学習部29は、当該教師データに基づいて、属性生成モデルを生成又は更新する。1又は複数の属性データ及び近さスコアは、対応する属性データと組み合わせて、教師データとして機械学習部29に入力される。また、属性生成モデルの生成又は更新においても、採用可能な機械学習モデル生成のフレームワークは限定されないが、決定木アルゴリズムに基づいた勾配ブースティングの機械学習フレームワークが採用されてよいことは、上記説明したユーザスコア推定モデルと同様である。
Then, the
<処理の流れ>
次に、本実施形態に係る情報処理システムによって実行される処理の流れを説明する。なお、以下に説明する処理の具体的な内容及び処理順序は、本開示を実施するための一例である。具体的な処理内容及び処理順序は、本開示の実施の形態に応じて適宜選択されてよい。
<Processing flow>
Next, a process flow executed by the information processing system according to the present embodiment will be described. Note that the specific contents and processing order of the processes described below are an example for implementing the present disclosure. The specific contents and processing order may be appropriately selected according to the embodiment of the present disclosure.
図14は、本実施形態に係る機械学習処理の流れを示すフローチャートである。本フローチャートに示された処理は、管理者によって指定されたタイミングで実行される。 Figure 14 is a flowchart showing the flow of the machine learning process according to this embodiment. The process shown in this flowchart is executed at a timing specified by the administrator.
本実施形態において、機械学習処理では、ユーザスコア推定モデルが生成及び/又は更新される。機械学習部29は、サービス提供システム5において過去に蓄積されたユーザ毎の属性データ群と、対応するユーザについて予め決定されたユーザスコアと、の組み合わせを含む教師データを作成する(ステップS101)。そして、機械学習部29は、作成された教師データをユーザスコア推定モデルに入力し、ユーザスコア推定部28によるユーザスコア推定に用いられるユーザスコア推定モデルを生成又は更新する(ステップS102)。その後、本フローチャートに示された処理は終了する。なお、属性生成部26が属性補完のために属性生成モデルを用いる場合、属性生成モデルの生成及び/又は更新も、同様の処理の流れで行われてよい。
In this embodiment, in the machine learning process, a user score estimation model is generated and/or updated. The
図15は、本実施形態に係るユーザスコア推定処理の流れを示すフローチャートである。本フローチャートに示された処理は、管理者によって指定されたタイミングで、対象となるユーザ毎に実行される。ここで、対象ユーザは、属性データに欠損があったり属性データの信頼性が低かったりするユーザである。信頼性の低い属性データの例としては、蓄積された量が十分でない履歴データに基づいて生成された属性データや、他の属性データの内容と明らかに矛盾する属性データ等が挙げられる。なお、ここでは対象ユーザを含む複数のユーザについてのグラフデータが既に生成されており、また、各機械学習モデルが既に学習済であることとする。 Figure 15 is a flowchart showing the flow of the user score estimation process according to this embodiment. The process shown in this flowchart is executed for each target user at a timing specified by the administrator. Here, the target users are users whose attribute data is missing or has low reliability. Examples of unreliable attribute data include attribute data generated based on insufficiently accumulated history data and attribute data that clearly contradicts the contents of other attribute data. Note that here, it is assumed that graph data has already been generated for multiple users including the target user, and that each machine learning model has already been trained.
ステップS201及びステップS203では、参照ユーザが特定され、対象ユーザと参照ユーザとの間の関係性が特定される。参照ユーザ特定部22は、グラフデータを参照し、対象ユーザに対応するノードデータ50と明示的リンク又は黙示的リンクで接続されているノードデータ50に対応する1又は複数の他のユーザを、参照ユーザとして特定する(ステップS201)。そして、関係性特定部23は、当該対象ユーザとステップS201で特定された1又は複数の参照ユーザとのペア毎に、ユーザ間の関係性の種類(具体的には、同一世帯に居住する親子関係/夫婦関係/友達関係/同じ職場で働く関係、等)を特定する(ステップS202)。その後、処理はステップS203へ進む。
In steps S201 and S203, the reference user is identified, and the relationship between the target user and the reference user is identified. The reference
ステップS203及びステップS204では、補完対象となる属性データの種類が選択され、ユーザ間の近さスコアが決定される。属性選択部25は、ステップS202で特定された関係性の種類に応じて、対象ユーザについて補完対象となる属性データの種類を選択する(ステップS203)。また、関係性強度決定部24は、当該対象ユーザと各参照ユーザとのペア毎に、当該ペアに対応付けられる近さスコアの値を決定する(S204)。その後、処理はステップS205へ進む。
In steps S203 and S204, the type of attribute data to be complemented is selected, and a closeness score between users is determined. The
ステップS205では、対象ユーザについて補完される属性データが生成される。属性生成部26は、補完対象の属性データに対応する参照ユーザの属性データのパラメータと、当該参照ユーザについてステップS204で決定された近さスコアとに基づいて、対象ユーザについて補完される属性データを生成する。その後、処理はステップS206へ進む。
In step S205, attribute data to be complemented for the target user is generated. The
ステップS206及びステップS207では、ユーザスコアが推定され、出力される。属性補完部27は、対象ユーザについてサービス提供システム5から取得される等して予め保持されている属性データ群に、ステップS205で生成された補完される属性データを追加することで、当該ユーザの属性データ群とする(ステップS206)。そして、ユーザスコア推定部28は、ステップS206で対象ユーザについて補完された属性データを含む属性データ群をユーザスコア推定モデルに入力し、出力された値を当該ユーザに設定されるユーザスコアとして取得する(ステップS207)。但し、ユーザスコアの推定方法は、本実施形態における例示に限定されない。例えば、ユーザスコアは、属性データ群を機械学習モデルではない所定の関数に入力して算出された値を含むものであってもよい。その後、本フローチャートに示された処理は終了する。
In steps S206 and S207, a user score is estimated and output. The
ユーザ毎に設定されたユーザスコアは、サービス提供システム5等の他のシステムに対して提供され、サービス提供システム5等の他のシステムによって対象ユーザに対して提供されるサービスのカスタマイズ等に活用される。
The user score set for each user is provided to other systems, such as the
本実施形態は、対応するノードデータ50がグラフノードに含まれていない新規の対象ユーザについてのユーザスコアの推定にも用いることができる。例えば、新規の対象ユーザのユーザ属性データに基づいて、当該対象ユーザに対応するノードデータ50、及び、当該ノードデータ50と接続される少なくとも1つのリンクデータ52が生成されてもよい。そして、リンクデータ52によって当該対象ユーザに対応するノードデータ50と接続されるユーザが、当該対象ユーザの参照ユーザとして特定されてもよい。 This embodiment can also be used to estimate a user score for a new target user whose corresponding node data 50 is not included in the graph node. For example, based on the user attribute data of the new target user, node data 50 corresponding to the target user and at least one link data 52 connected to the node data 50 may be generated. Then, a user connected to the node data 50 corresponding to the target user by the link data 52 may be identified as a reference user of the target user.
<効果>
本実施形態によれば、ユーザ間のリレーションが網羅されたソーシャルグラフネットワークからユーザの欠損属性を補完し、補完された属性群で以ってユーザスコアを推定/判定することで、対象ユーザの情報が欠損していたり情報の信頼性が低かったりする場合にも、ユーザスコアの算出を可能とし、又は算出されるユーザスコアの精度を向上させることが可能となる。また、様々なユーザ属性データを用いることで、規約や法律等によりある範囲の(例えば、クレジットカード部門の)属性データを用いることができない場合や、対象ユーザについて一部の属性データが存在しない場合であっても、精度の高いユーザスコアを算出することが可能となる。
<Effects>
According to this embodiment, missing attributes of a user are complemented from a social graph network that covers the relationships between users, and a user score is estimated/determined using the complemented attribute group, so that even when information about a target user is missing or the reliability of the information is low, it is possible to calculate a user score or improve the accuracy of the calculated user score. In addition, by using various user attribute data, it is possible to calculate a highly accurate user score even when a certain range of attribute data (for example, credit card department) cannot be used due to regulations, laws, etc., or when some attribute data does not exist for the target user.
<バリエーション>
上記説明した実施形態では、グラフデータ生成部21、参照ユーザ特定部22、関係性特定部23、関係性強度決定部24、属性選択部25、属性生成部26、属性補完部27、ユーザスコア推定部28、及び機械学習部29を備える情報処理装置の例について説明したが、これらの機能部は、本開示に係る発明を実施可能な範囲で、その一部が省略されてもよい。
<Variations>
In the embodiment described above, an example of an information processing device including a graph
例えば、上記説明した実施形態では、補完対象の属性データを生成するにあたって対象ユーザと参照ユーザとの間の関係性強度(近さスコア)が生成され、また参照されたが、補完対象の属性データを生成するにあたり、近さスコアの生成及び参照は省略されてもよい。この場合、図2を参照して説明した情報処理装置1の各機能部のうち、関係性強度決定部24は省略されてよい。また、属性生成部26は、属性データの生成に際して、近さスコアを参照した重み付け等を行わず、参照ユーザの属性データに基づいて対象ユーザの補完対象属性データを生成してよい。
For example, in the embodiment described above, the relationship strength (closeness score) between the target user and the reference user was generated and referenced when generating the attribute data to be complemented, but the generation and reference of the closeness score may be omitted when generating the attribute data to be complemented. In this case, of the functional units of the
また、例えば、属性生成部26は、参照ユーザの属性データ群の少なくとも一部のパラメータと、対象ユーザ及び参照ユーザ間の近さスコアと、を入力値とし、補完される対象ユーザの属性データを出力値とする属性生成モデルを用いて、対象ユーザの属性データを生成してもよい。このとき、属性生成モデルは入力値、出力値の態様に応じて適宜、予め学習処理が行われる。
For example, the
また、例えば、属性生成部26は、対象ユーザの属性データ群の少なくとも一部のパラメータ、及び/又は、参照ユーザの属性データ群の少なくとも一部のパラメータを、入力値とし、補完される対象ユーザの属性データを出力値とする属性生成モデルを用いて、対象ユーザの属性データを生成してもよい。このとき、属性生成モデルは入力値、出力値の態様に応じて適宜、予め学習処理が行われる。また、このとき、属性生成部26は、対象ユーザ及び参照ユーザ間の関係性及び/又は近さスコア毎に異なる複数の属性生成モデルのうち、処理の対象となる対象ユーザとその参照ユーザとの間における関係性の種類及び/又は近さスコアに応じて所定の属性生成モデルを決定し、補完される対象ユーザの属性データを生成してよい。ここで、複数の属性生成モデルの夫々は、例として、関係性の種類及び/又は近さスコアが共通又は類似する(所定の範囲内にある)教師データに基づいて予め学習処理が行われてよい。
For example, the
また、例えば、属性生成部26は、ユーザ(対象ユーザ、参照ユーザ)の属性データ群の少なくとも一部のパラメータとして、グラフデータ上のユーザの埋め込み表現(ベクトル表現、特徴表現)を入力値とし、補完される対象ユーザの属性データを出力値とする属性生成モデルを用いて、対象ユーザの属性データを生成してもよい。また、属性生成モデルは、グラフデータ上の対象ユーザ及び参照ユーザの距離又は内積等(グラフデータに基づくベクトル空間上の距離又は内積等)を入力値に含んでよい。このとき、属性生成モデルは入力値、出力値の態様に応じて適宜、予め学習処理が行われる。
For example, the
また、例えば、属性補完部27は、属性生成モデルによって出力された属性データが、補完が行われる前の対象ユーザの属性データ群における欠損値(欠損している属性データ)又は不正値(信頼性が低い属性データ)である場合、出力された属性データを対象ユーザの属性データ群の一部として決定してよい。
Furthermore, for example, if the attribute data output by the attribute generation model is a missing value (missing attribute data) or an invalid value (low-reliability attribute data) in the attribute data group of the target user before the completion, the
また、例えば、属性選択部25又は属性補完部27は、ユーザスコア推定モデル等として採用される勾配ブースティング決定木等のアンサンブル学習モデルにおいてウェイトが高い属性データを、補完対象の属性データとして扱ってよい。ここで、ウェイトが高い属性データとは、例として、ユーザスコア推定モデルにおいて所定のウェイトを上回るウェイトの木と対応する属性データであってよく、ユーザスコア推定モデルにおいて上位の(所定の順位以上の)ウェイトを示す木と対応する属性データであってよい。
Furthermore, for example, the
1 情報処理装置
1. Information processing device
Claims (16)
前記対象ユーザについて特定された前記参照ユーザの属性データに基づいて、該対象ユーザの対応する属性データを生成する属性生成手段と、
生成された前記対象のユーザの対応する属性データの少なくとも一部に基づいて、前記対象ユーザの対応する属性データ群を補完する属性補完手段と、
補完された前記対象ユーザの対応する前記属性データ群に基づいて、該対象ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、
を備える情報処理システム。 A reference user specification means for specifying a reference user having a relationship with the target user based on graph data indicating the relationship between the users;
an attribute generating means for generating corresponding attribute data of the target user based on attribute data of the reference user identified for the target user;
an attribute complementing means for complementing a group of attribute data corresponding to the target user based on at least a part of the generated attribute data corresponding to the target user;
a user score estimation means for estimating a user score to be set for the target user based on the complemented attribute data group corresponding to the target user;
An information processing system comprising:
請求項1に記載の情報処理システム。 a graph data generating means for generating the graph data by identifying pairs of users who are related to each other based on a group of attribute data of each of the users;
The information processing system according to claim 1 .
対象ユーザと互いに関係がある参照ユーザを特定する参照ユーザ特定手段と、
前記対象ユーザについて特定された前記参照ユーザの属性データに基づいて、該対象ユーザの対応する属性データを生成する属性生成手段と、
生成された前記対象のユーザの対応する属性データの少なくとも一部に基づいて、前記対象ユーザの対応する属性データ群を補完する属性補完手段と、
補完された前記対象ユーザの対応する前記属性データ群に基づいて、該対象ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、
を備える情報処理システム。 A relationship specification means for specifying a relationship between users based on a result of clustering based on at least one of the user's name, IP address, address, credit card number, age, sex, school, place of employment, and place of stay, as a value associated with the relationship between users;
A reference user identification means for identifying a reference user having a relationship with the target user;
an attribute generating means for generating corresponding attribute data of the target user based on attribute data of the reference user identified for the target user;
an attribute complementing means for complementing a group of attribute data corresponding to the target user based on at least a part of the generated attribute data corresponding to the target user;
a user score estimation means for estimating a user score to be set for the target user based on the complemented attribute data group corresponding to the target user;
An information processing system comprising:
前記属性生成手段は、少なくとも1の前記参照ユーザについての、該参照ユーザに関する情報と、該参照ユーザについて決定される前記関係性強度とに基づいて、前記対象ユーザの対応する属性データを生成する、
請求項3に記載の情報処理システム。 and a relationship strength determination means for determining a relationship strength indicating a closeness between the target user and the reference user based on an index indicating a strength of the relationship between the target user and the reference user in accordance with a judgment criterion corresponding to the relationship between the target user and the reference user,
the attribute generating means generates, for at least one of the reference users, corresponding attribute data of the target user based on information about the reference user and the relationship strength determined for the reference user;
The information processing system according to claim 3 .
請求項4に記載の情報処理システム。 The relationship strength determination means determines the relationship strength indicating the closeness between the target user and the reference user based on an output when data representing the index is input to a trained machine learning model corresponding to the relationship between the target user and the reference user.
5. The information processing system according to claim 4.
前記対象ユーザと前記参照ユーザとの関係性の種類に応じて、前記対象ユーザについて補完対象となる属性データの種類を選択する属性選択手段と、
前記対象ユーザについて特定された前記参照ユーザの属性データ群のうち、前記属性選択手段によって選択された種類の属性データに基づいて、該対象ユーザの対応する属性データを生成する属性生成手段と、
生成された前記対象のユーザの対応する属性データの少なくとも一部に基づいて、前記対象ユーザの対応する属性データ群を補完する属性補完手段と、
補完された前記対象ユーザの対応する前記属性データ群に基づいて、該対象ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、
を備える情報処理システム。 A reference user identification means for identifying a reference user having a relationship with the target user;
an attribute selection means for selecting a type of attribute data to be complemented for the target user according to a type of relationship between the target user and the reference user ;
an attribute generating means for generating attribute data corresponding to the target user based on the type of attribute data selected by the attribute selecting means from the attribute data group of the reference users identified for the target user;
an attribute complementing means for complementing a group of attribute data corresponding to the target user based on at least a part of the generated attribute data corresponding to the target user;
a user score estimation means for estimating a user score to be set for the target user based on the complemented attribute data group corresponding to the target user;
An information processing system comprising:
請求項1から6のいずれか一項に記載の情報処理システム。 The user score estimation means estimates a user score to be set for the target user by inputting a group of attribute data of the target user into a machine learning model.
The information processing system according to claim 1 .
請求項7に記載の情報処理システム。 The user score estimation means estimates the user score using a machine learning model generated using a machine learning framework based on a gradient boosting decision tree.
The information processing system according to claim 7.
請求項7又は8に記載の情報処理システム。 The user score estimation means estimates a user score to be set for the target user by using the machine learning model generated using teacher data in which a group of attribute data including demographic attributes of the user is an input value and the user score related to the user is an output value.
9. The information processing system according to claim 7 or 8.
請求項1から9のいずれか一項に記載の情報処理システム。 The attribute complementing means generates attribute data for complementing missing attribute data or low reliability attribute data among the attribute data group of the target user based on the attribute data of the reference user.
The information processing system according to any one of claims 1 to 9.
対象ユーザと互いに関係がある参照ユーザを、ユーザ間の関係性を示すグラフデータに基づいて特定する参照ユーザ特定ステップと、
前記対象ユーザについて特定された前記参照ユーザの属性データに基づいて、該対象ユーザの対応する属性データを生成する属性生成ステップと、
生成された前記対象のユーザの対応する属性データの少なくとも一部に基づいて、前記対象ユーザの対応する属性データ群を補完する属性補完ステップと、
補完された前記対象ユーザの対応する前記属性データ群に基づいて、該対象ユーザに設定されるユーザスコアを推定するユーザスコア推定ステップと、
を実行する方法。 The computer
A reference user identifying step of identifying a reference user having a relationship with the target user based on graph data indicating the relationship between the users;
an attribute generating step of generating corresponding attribute data of the target user based on attribute data of the reference user identified for the target user;
an attribute complementation step of complementing a group of attribute data corresponding to the target user based on at least a part of the generated attribute data corresponding to the target user;
a user score estimating step of estimating a user score to be set for the target user based on the complemented attribute data group corresponding to the target user;
How to do it.
ユーザ間の関係に対応付けられる値としての、前記ユーザの氏名、IPアドレス、住所、クレジットカード番号、年齢、性別、通学先、勤務先及び滞在場所のうちの少なくとも1つに基づくクラスタリングの結果に基づいて、前記ユーザ間の関係性を特定する関係性特定ステップと、
対象ユーザと互いに関係がある参照ユーザを特定する参照ユーザ特定ステップと、
前記対象ユーザについて特定された前記参照ユーザの属性データに基づいて、該対象ユーザの対応する属性データを生成する属性生成ステップと、
生成された前記対象のユーザの対応する属性データの少なくとも一部に基づいて、前記対象ユーザの対応する属性データ群を補完する属性補完ステップと、
補完された前記対象ユーザの対応する前記属性データ群に基づいて、該対象ユーザに設定されるユーザスコアを推定するユーザスコア推定ステップと、
を実行する方法。 The computer
a relationship identification step of identifying a relationship between the users based on a result of clustering based on at least one of the users' names, IP addresses, addresses, credit card numbers, ages, sexes, schools, places of employment, and places of stay as values associated with the relationships between the users;
A reference user identification step of identifying a reference user who is related to the target user;
an attribute generating step of generating corresponding attribute data of the target user based on attribute data of the reference user identified for the target user;
an attribute complementation step of complementing a group of attribute data corresponding to the target user based on at least a part of the generated attribute data corresponding to the target user;
a user score estimating step of estimating a user score to be set for the target user based on the complemented attribute data group corresponding to the target user;
How to do it.
対象ユーザと互いに関係がある参照ユーザを特定する参照ユーザ特定ステップと、
前記対象ユーザと前記参照ユーザとの関係性の種類に応じて、前記対象ユーザについて補完対象となる属性データの種類を選択する属性選択ステップと、
前記対象ユーザについて特定された前記参照ユーザの属性データ群のうち、前記属性選択ステップで選択された種類の属性データに基づいて、該対象ユーザの対応する属性データを生成する属性生成ステップと、
生成された前記対象のユーザの対応する属性データの少なくとも一部に基づいて、前記対象ユーザの対応する属性データ群を補完する属性補完ステップと、
補完された前記対象ユーザの対応する前記属性データ群に基づいて、該対象ユーザに設定されるユーザスコアを推定するユーザスコア推定ステップと、
を実行する方法。 The computer
A reference user identification step of identifying a reference user who is related to the target user;
an attribute selection step of selecting a type of attribute data to be complemented for the target user according to a type of relationship between the target user and the reference user ;
an attribute generating step of generating corresponding attribute data of the target user based on the attribute data of the type selected in the attribute selecting step from among the attribute data group of the reference users identified for the target user;
an attribute complementation step of complementing a group of attribute data corresponding to the target user based on at least a part of the generated attribute data corresponding to the target user;
a user score estimating step of estimating a user score to be set for the target user based on the complemented attribute data group corresponding to the target user;
How to do it.
対象ユーザと互いに関係がある参照ユーザを、ユーザ間の関係性を示すグラフデータに基づいて特定する参照ユーザ特定手段と、
前記対象ユーザについて特定された前記参照ユーザの属性データに基づいて、該対象ユーザの対応する属性データを生成する属性生成手段と、
生成された前記対象のユーザの対応する属性データの少なくとも一部に基づいて、前記対象ユーザの対応する属性データ群を補完する属性補完手段と、
補完された前記対象ユーザの対応する前記属性データ群に基づいて、該対象ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、
として機能させるプログラム。 Computer,
A reference user specification means for specifying a reference user having a relationship with the target user based on graph data indicating the relationship between the users;
an attribute generating means for generating corresponding attribute data of the target user based on attribute data of the reference user identified for the target user;
an attribute complementing means for complementing a group of attribute data corresponding to the target user based on at least a part of the generated attribute data corresponding to the target user;
a user score estimation means for estimating a user score to be set for the target user based on the complemented attribute data group corresponding to the target user;
A program that functions as a
ユーザ間の関係に対応付けられる値としての、前記ユーザの氏名、IPアドレス、住所、クレジットカード番号、年齢、性別、通学先、勤務先及び滞在場所のうちの少なくとも1つに基づくクラスタリングの結果に基づいて、前記ユーザ間の関係性を特定する関係性特定手段と、
対象ユーザと互いに関係がある参照ユーザを特定する参照ユーザ特定手段と、
前記対象ユーザについて特定された前記参照ユーザの属性データに基づいて、該対象ユーザの対応する属性データを生成する属性生成手段と、
生成された前記対象のユーザの対応する属性データの少なくとも一部に基づいて、前記対象ユーザの対応する属性データ群を補完する属性補完手段と、
補完された前記対象ユーザの対応する前記属性データ群に基づいて、該対象ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、
として機能させるプログラム。 Computer,
A relationship specification means for specifying a relationship between users based on a result of clustering based on at least one of the user's name, IP address, address, credit card number, age, sex, school, place of employment, and place of stay, as a value associated with the relationship between users;
A reference user identification means for identifying a reference user having a relationship with the target user;
an attribute generating means for generating corresponding attribute data of the target user based on attribute data of the reference user identified for the target user;
an attribute complementing means for complementing a group of attribute data corresponding to the target user based on at least a part of the generated attribute data corresponding to the target user;
a user score estimation means for estimating a user score to be set for the target user based on the complemented attribute data group corresponding to the target user;
A program that functions as a
対象ユーザと互いに関係がある参照ユーザを特定する参照ユーザ特定手段と、
前記対象ユーザと前記参照ユーザとの関係性の種類に応じて、前記対象ユーザについて補完対象となる属性データの種類を選択する属性選択手段と、
前記対象ユーザについて特定された前記参照ユーザの属性データ群のうち、前記属性選択手段によって選択された種類の属性データに基づいて、該対象ユーザの対応する属性データを生成する属性生成手段と、
生成された前記対象のユーザの対応する属性データの少なくとも一部に基づいて、前記対象ユーザの対応する属性データ群を補完する属性補完手段と、
補完された前記対象ユーザの対応する前記属性データ群に基づいて、該対象ユーザに設定されるユーザスコアを推定するユーザスコア推定手段と、
として機能させるプログラム。
Computer,
A reference user identification means for identifying a reference user having a relationship with the target user;
an attribute selection means for selecting a type of attribute data to be complemented for the target user according to a type of relationship between the target user and the reference user ;
an attribute generating means for generating attribute data corresponding to the target user based on the type of attribute data selected by the attribute selecting means from the attribute data group of the reference users identified for the target user;
an attribute complementing means for complementing a group of attribute data corresponding to the target user based on at least a part of the generated attribute data corresponding to the target user;
a user score estimation means for estimating a user score to be set for the target user based on the complemented attribute data group corresponding to the target user;
A program that functions as a
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022056450A JP7634499B2 (en) | 2022-03-30 | Information processing system, method and program | |
TW112111662A TW202405723A (en) | 2022-03-30 | 2023-03-28 | Information processing system, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022056450A JP7634499B2 (en) | 2022-03-30 | Information processing system, method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023148437A JP2023148437A (en) | 2023-10-13 |
JP7634499B2 true JP7634499B2 (en) | 2025-02-21 |
Family
ID=
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001319051A (en) | 2000-03-03 | 2001-11-16 | Fujitsu Ltd | Financial product design program, apparatus and method, and computer-readable recording medium storing financial product design program |
JP2002117227A (en) | 2000-10-05 | 2002-04-19 | Nissho Electronics Kk | Method and system for evaluating and rating credit of customer in new credit granting for individual |
JP2005339281A (en) | 2004-05-27 | 2005-12-08 | Ntt Communications Kk | Trustworthiness calculating apparatus, trustworthiness calculation method, and program therefor |
JP2010165097A (en) | 2009-01-14 | 2010-07-29 | Ntt Docomo Inc | Personal relationship estimation device, and personal relationship estimation method |
JP2017211924A (en) | 2016-05-27 | 2017-11-30 | 日本電信電話株式会社 | Relational data creation device, relational data creation method, and relational data creation program |
WO2020067137A1 (en) | 2018-09-25 | 2020-04-02 | ビープナウ, インコーポレイテッド | Work shift generation device, learning model, and computer program |
JP2020149363A (en) | 2019-03-13 | 2020-09-17 | ヤフー株式会社 | Information processing equipment, information processing methods and information processing programs |
JP2021026401A (en) | 2019-08-01 | 2021-02-22 | 株式会社Nttドコモ | Examination device |
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001319051A (en) | 2000-03-03 | 2001-11-16 | Fujitsu Ltd | Financial product design program, apparatus and method, and computer-readable recording medium storing financial product design program |
JP2002117227A (en) | 2000-10-05 | 2002-04-19 | Nissho Electronics Kk | Method and system for evaluating and rating credit of customer in new credit granting for individual |
JP2005339281A (en) | 2004-05-27 | 2005-12-08 | Ntt Communications Kk | Trustworthiness calculating apparatus, trustworthiness calculation method, and program therefor |
JP2010165097A (en) | 2009-01-14 | 2010-07-29 | Ntt Docomo Inc | Personal relationship estimation device, and personal relationship estimation method |
JP2017211924A (en) | 2016-05-27 | 2017-11-30 | 日本電信電話株式会社 | Relational data creation device, relational data creation method, and relational data creation program |
WO2020067137A1 (en) | 2018-09-25 | 2020-04-02 | ビープナウ, インコーポレイテッド | Work shift generation device, learning model, and computer program |
JP2020149363A (en) | 2019-03-13 | 2020-09-17 | ヤフー株式会社 | Information processing equipment, information processing methods and information processing programs |
JP2021026401A (en) | 2019-08-01 | 2021-02-22 | 株式会社Nttドコモ | Examination device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11227217B1 (en) | Entity transaction attribute determination method and apparatus | |
JP4529058B2 (en) | Distribution system | |
Kültür et al. | Hybrid approaches for detecting credit card fraud | |
US20140172708A1 (en) | Systems and methods for providing virtual currencies | |
US20220261926A1 (en) | Method and system for credit card holder identification | |
CN112330373B (en) | User behavior analysis method, device and computer-readable storage medium | |
JP2024069608A (en) | Graph data generation system, graph data generation method, and program | |
CN113706258A (en) | Product recommendation method, device, equipment and storage medium based on combined model | |
JP7634499B2 (en) | Information processing system, method and program | |
JP7345032B1 (en) | Credit screening device, method and program | |
JP2023148437A (en) | Information processing system, method and program | |
TWI837066B (en) | Information processing devices, methods and program products | |
Islam | An efficient technique for mining bad credit accounts from both olap and oltp | |
JP7302106B1 (en) | Information processing system, information processing method and program | |
JP7593984B2 (en) | Information processing system, information processing method, and program | |
TWI848819B (en) | Information processing device, information processing method and program product | |
JP7566988B2 (en) | Information processing system, information processing method, and program | |
TWI868954B (en) | Information processing system, information processing method and program product | |
JP7509858B2 (en) | Information processing system, information processing method, and program | |
TWI857405B (en) | Information processing system, information processing method and program product | |
JP2024000693A (en) | Information processing apparatus, method, and program | |
JP2024000694A (en) | Information processing apparatus, method, and program | |
TW202401337A (en) | Reviewing device, reviewing method, and program product including a first score acquisition portion, a second score acquisition portion, a user section specifying portion, and a reviewing result determination portion | |
WO2024134925A1 (en) | Credit learning device, credit learning method, credit estimation device, credit estimation method, and program | |
CN118245679A (en) | Method and device for recommending clients for agent |