CN107038511A - 一种确定风险评估参数的方法及装置 - Google Patents
一种确定风险评估参数的方法及装置 Download PDFInfo
- Publication number
- CN107038511A CN107038511A CN201610071135.6A CN201610071135A CN107038511A CN 107038511 A CN107038511 A CN 107038511A CN 201610071135 A CN201610071135 A CN 201610071135A CN 107038511 A CN107038511 A CN 107038511A
- Authority
- CN
- China
- Prior art keywords
- information
- variable
- assessment
- value
- variate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 238000012502 risk assessment Methods 0.000 title claims abstract description 80
- 230000001419 dependent effect Effects 0.000 claims description 11
- 230000008569 process Effects 0.000 description 17
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 230000006399 behavior Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000004549 pulsed laser deposition Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Educational Administration (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种确定风险评估参数的方法,包括:获取待确定风险评估参数的用户的评估信息;对所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值;根据所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数;其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。本发明实施例提供的确定风险评估参数的方法,可以提高风险评估参数的准确性。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种确定风险评估参数的方法、建立评估信息决策模型的方法及装置。
背景技术
当前很多业务与风险评估参数都是直接相关的,风险评估参数直接影响到业务申请是否能够成功。业务提供方在为用户分配业务时会根据已有的风险评估参数来评估是否为该用户分配业务。
风险评估参数可以根据评估信息来确定,但评估信息具有一定的随意性,比较容易进行人为修改。这样,根据评估信息确定的风险评估参数就会不准确。
现有技术主要通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,从而排除舞弊评估信息。但这种方法在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致风险评估参数的准确性差。
发明内容
为了解决现有技术中风险评估参数的准确性差的问题,本发明实施例提供一种确定风险评估参数的方法,可以将舞弊行为和舞弊信息也引入到决策模型中来,确保信息的全面性,从而提高风险评估参数的准确性。本发明实施例还提供了相应的装置。
本发明第一方面提供一种确定风险评估参数的方法,包括:
获取待确定风险评估参数的用户的评估信息;
对所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值;
根据所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数;
其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。
本发明第二方面提供一种建立评估信息决策模型的方法,包括:
获取大量用户的评估信息样本;
对所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量;
根据所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型;
其中,所述第一类型的变量为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量为根据是否达到舞弊决策条件确定。
本发明第三方面提供一种确定风险评估参数的装置,包括:
获取单元,用于获取待确定风险评估参数的用户的评估信息;
变量梳理单元,用于对所述获取单元获取的所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值;
确定单元,用于根据所述变量梳理单元得到的所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数;
其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。
本发明第四方面提供一种建立评估信息决策模型的装置,包括:
获取单元,用于获取大量用户的评估信息样本;
变量梳理单元,用于对所述获取单元获取的所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量;
确定单元,用于根据所述变量梳理单元得到的所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型;
其中,所述第一类型的变量为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量为根据是否达到舞弊决策条件确定。
与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致风险评估参数的准确性差。本发明实施例提供的确定风险评估参数的方法,可以将舞弊评估信息也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性,从而提高风险评估参数的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是一建模方法的建模流程示意图;
图2是本发明实施例中决策建模方法的建模流程示意图;
图3是本发明实施例中确定风险评估系数的方法的一实施例示意图;
图4是本发明实施例中建立评估信息决策模型的方法的一实施例示意图;
图5是本发明实施例中确定风险评估系数的装置的一实施例示意图;
图6是本发明实施例中建立评估信息决策模型的装置的一实施例示意图;
图7是本发明实施例中确定风险评估系数的装置的一实施例示意图;
图8是本发明实施例中建立评估信息决策模型的装置的一实施例示意图。
具体实施方式
本发明实施例提供一种确定风险评估参数的方法,可以将舞弊评估信息也引入到决策模型中来,确保信息的全面性,从而提高风险评估参数的准确性。本发明实施例还提供了相应的装置。以下分别进行详细说明。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例技术方案涉及基于计算机系统确定风险评估参数的方法。下面首先对确定风险评估参数的方法涉及到的一些术语进行简单说明。
术语“风险评分卡”是指:一种风险评估模型,例如用于评估用户信用风险高低的风险评估模型,通常有监督学习和半监督学习(如果有拒绝推断的话)两种。监督目标(即目标变量)通常是用户在一段时间内是否违约,比如用户在发放贷款后6个月内是否发生90天以上逾期。构建风险评分卡的方法通常分为两类:模型法和专家法。
术语“征信评分”:是评分机构或征信公司利用征信机构的信息开发的用于评估用户信用风险或者欺诈风险的评分模型。
术语“逻辑回归”(LR,logistic regression):目前应用比较成熟、广泛的用于开发风险评分卡的一种方法,是一种广义的线性回归方法。
术语“鲁棒性”(Robustness):指模型从开发到实施过程中的稳定性,鲁棒性高的模型实施效果更理想。
术语“KS”(Kolmogorov Smirnov):Kolmogorov和Smirnov两位前苏联数学家的名字,KS是一种衡量评分模型效果好坏的常用指标,处于0-100之间,值越大代表模型效果越好。通常情况下KS=25左右是金融机构对风险评分卡的接受标准。
术语“PSI”(Population Stability Index):是一种反映人群的物理和行为特征稳定性的指标,主要通过两个时点的数据对比计算得出,计算公式:
PSI=∑((n1i/N1)-(n2i/N2))*ln((n1i/N1)/(n2i/N2))
其中,n1i,n2i-两个时点的人群1和人群2的第i个分箱的人数,一般地i=10;
N1,N2-两个时点的人群1和人群2的总人数。
一般地PSI在0.2以上,代表人群波动很大,很不稳定,应停止使用;PSI在0.1-0.2之间,表示人群不太稳定,应查明原因并决定是否使用;PSI在0.1以下一般是可以接受的,表示人群比较稳定。
信用评分是征信评分中的一种,信用评分主要用来评估和反映用户信用风险的高低,通常高分代表风险较低,低分代表风险较高。目前的信用评分模型是一种典型的有监督学习,其目标通常是用户在一段时间内是否违约,比如用户在发放贷款后6个月内是否发生90天以上逾期。通常地,用户信用风险有两个因素决定:还款能力和还款意愿。其中,还款意愿主要取决于用户违约成本的高低,如果违约成本较低,收益较高,用户就更容易违约。反之,就更不容易违约。还款能力则主要由用户的资金实力决定。因此,对信用风险有预测能力的变量也主要分为两大类:一类和还款意愿相关,一类和还款能力相关。
本发明实施例中把评估信息引入信用评分模型,可以增加用户信用评分的广泛度,不用局限于当前在金融机构的信用记录,而且,针对在金融机构没有信用记录的用户也可以进行风险评估。但评估信息可能会遭到用户有目的性的操作,也就是说用户的评估信息中可能存在舞弊信息,在预防评估信息舞弊方面可以采用舞弊信息排除的方法。舞弊信息排除的方法可以从还款意愿和还款能力两个方面来解决。还款意愿类变量主要通过增加舞弊的时间成本来解决,还款能力类的变量主要通过增加舞弊的资金成本来。
(1)增加舞弊的时间成本
本节以变量“好友数量”为例来阐明,它主要反映用户的还款意愿。一般地,如果一个人好友数量越多,表示这个人越注重社交,违约时的社交成本相对比较高,在欠款催收时也更容易被找到,因此正常情况下,好友越多,还款意愿越高,信用风险相对越低。主要通过两种方式增加用户舞弊的时间成本。
A拉长时间:由使用较短时间的变量改为较长时间的变量。比如,当前的好友数改为过去12个月平均的好友数。
B严格条件:即增加一些限制条件。因为好友数相对来说还是比较容易添加的,甚至有专业加好友机构代加好友,比如添加200好友收费20元。并且,如果付更高费用,代加好友还能满足一些个性化条件,比如开户时长在3个月以上、每月收发信息在10条以上等。为了应对这些舞弊行为,需要识别并过滤这些恶意添加的信息。更严格条件可能是要求,1.除注册当月外,其他月份的好友是自然增长的。2.好友之间应该有一定互动。
通过上述方法处理后的变量可能是表1中的情况,比如“过去12个月开户时间在3个月以上的互动的月均好友数”,用户舞弊的成本就会高很多,相对地信息会真实、稳定很多。
表1增加舞弊时间成本
表1中的拉长时间和严格条件可以根据需求设定,而且表1只是举例说明,不限于表1所列出的几种情况。
表2增加舞弊资金成本
表2中的拉长时间和严格条件可以根据需求设定,而且表1只是举例说明,不限于表2所列出的几种情况。
本实施例中以“已结清的贷款金额”和“理财金额”为例来阐明。贷款金额和理财金额直接反映用户的还款能力,已结清代表用户的还款意愿。一般地,已结清的贷款金额越大,用户的信用风险就越低,反之,信用风险就越高。但是,不排除有些人通过重复借贷并快速还款来刷信用的可能。在互联网现金贷业务的发展过程中就出现了这种情况,有用户为了提升自己的信用评分,最多出现一个月内发生100多次借款,且当天还款。互联网借贷一般为了提升用户体验,设置贷款犹豫期,犹豫期一般在1-3天。犹豫期内还款一般是不收取借贷手续费和利息的,因此用户反复借贷并快速还款并未产生资金成本。
对于增加舞弊资金成本的实际操作,也可以通过拉长时间和严格条件两种方法来实现,结果见表2。比如“过去12个月的已结清的最大生息贷款金额”,如果用户要想舞弊,资金成本就会增加很多。
现有技术主要通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为。但这种方法在排除舞弊信息的同时也排除了一些有用的信息,排除信息意味着损失一部分信息。这种做法带来的直接后果是信用评分模型的效果受到了一定的影响。
因此,本发明实施例中,把用户的有目的性的舞弊行为也作为自变量考虑进来,用于和其他信息一起构建信用评分模型。一般地,当用户有目的性的进行舞弊行为时,信用风险相对较高。反之,信用风险较低。因此决策建摸是一种考虑了更多信息的全信息建模,模型的效果相对会更好,模型的鲁棒性也更高。
评估信息可以包括用户在社交网络的好友记录和金融记录等,当然,也可以包括其他记录,计算机系统可以对用户的评估信息进行变量梳理,变量梳理的方式可以参阅表3进行理解。
表3决策变量梳理
表3中的决策变量实际上只是对应不同舞弊决策条件的变量。例如:
过去24个月内(开户最早两个月除外)出现过一个月内新增好友超过30人的月数是否大于等于3的舞弊决策条件设为决策变量D1。
过去12个月内是否有两次以上的犹豫期退款的舞弊决策条件设为决策变量D2。
过去6个月内是否存在三次以上当天购买并第二天赎回金额在1000元以上理财的行为的舞弊决策条件设为决策变量D3。
表3只是举例说明,不限于表3所列出的几种情况。
如前所述,本发明实施例中,把变量分为两大类:一类是反映用户还款能力的变量,主要是支付、会员等和用户资金相关的支付贷款类变量;另一类是反映用户还款意愿的变量,主要指社交类型的变量。我们把用户可能针对这两类变量采取的决策(投机性的舞弊行为)进行分析梳理。决策变量梳理依赖于业务经验和数据分析,这一步工作量比较大,本文将以上述三个变量为例介绍。当然,实际决策建模和使用决策模型确定风险评估参数的过程中不限于以上三个变量,可以有更多的变量。
表3是梳理结果,可以看出,一些决策变量可作为剔除舞弊信息后的有益补充。比如上述表3所列出的几个舞弊决策条件D1、D2和D3“过去6个月内是否存在三次以上当天购买并第二天赎回金额在1000元以上理财的行为(D3)”,若用户有这种行为,很大程度上可能是因为用户想通过资金的快速进出提升信用评分,或者是用户对资金使用没有规划,这两种情况可能都是负面的信息。如果出现上述行为,用户的信用风险也相对越高,则是取1,不是取0。同理,过去24个月内(开户最早两个月除外)出现过一个月内新增好友超过30人的月数是否大于或等于3,(D1),是取1,否取0。例如:一个社交应用刚开通时可能会出现突击加好友的状况,大量同学聚会也可能会出现突击加好友的状况,所以,本发明实施例中将变量D1设定为若过去24个月内有超过或等于3个月出现突击加大量好友的状况,则认为用户是有目的性的操作,用户的信用风险也相对越高,若有,则取1,没有取0。当然,此处大于或等于3只是举例说明,也可以是其他限制条件。同理,过去12个月内是否有两次以上的犹豫期退款,是取1,否取0(D2)。
经过这种处理之后的变量的作用也是显而易见的,下面我把这些变量的缺失和分布情况通过举例的方式列出如表4。表4中是对大量用户的统计,以原始变量R1“过去12个月的月均好友数”为例,原始变量的均值为48,最大值为999。加入开户时间和好友互动两个条件后,生成变量X1“过去12个月开户时间在3个月以上的互动的月均好友数”,其均值和最大值分别为20和150,比原始变量R1小很多。主要原因是,有大约6%的人发生了“过去24个月内(开户最早两个月除外)出现过一个月内新增好友超过30人的月数大于或等于3”的操作,即D1变量的均值为6%(0.06)。
表4决策变量分布
通过表3和表4的举例示例,下面构建针对不同情况的模型:
基于逻辑回归方法,基于简单处理变量R1-R3的建模结果如(1)和(2):
Logodds=f(x)==a0+a1R1+a2R2+a3R3 (1)
Probability=exp(Logodds)/(1+exp(Logodds)) (2)
基于一般防舞弊法处理后的变量X1-X3的建模结果如(3)和(4):
LogoddsX=f(xX)==b0+b1X1+b2X2+b3X3 (3)
ProbabilityX=exp(LogoddsX)/(1+exp(LogoddsX)) (4)
基于决策建模法的建模结果则如(5)和(6):
LogoddsD=f(xD)==b0+b1X1+b2X2+b3X3+c1D1+c2D2+c3D3 (5)
ProbabilityD=exp(LogoddsD)/(1+exp(LogoddsD)) (6)
其中,所述X1…XM为第一类型的变量,M为大于3的整数,D1…D3为第二类型的变量,N为大于3的整数,b0为初始权重,b1…b3分别为X1…X3的权重,c1…c3分别为D1…D3的权重,LogoddsD为函数的因变量,ProbabilityD为用户的评估信息的风险评估参数。
参阅表4,因表4是对大量用户的统计,所以X1…X3,D1…D3都取表4中的均值的一列。
若是对单个用户进行统计,则D1…D3要么取0,要么取1。
其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。
LogoddsD的取值范围是负无穷到正无穷,ProbabilityD的取值范围是0到1。ProbabilityD的取值越大,说明风险越高。
比较上述公式,可以发现,决策建模的模型会纳入更多地考量因素,模型结果一般会更加有效、稳定。
下面,简要比较决策建模法和前两种方法在建模流程上的区别。前两种的建模流程如图1,图1是前两种建模方法的建模流程。
决策建模法则要增加一个步骤:决策变量梳理。纳入决策变量后进行建模后的建模流程如图2,图2是本发明实施例中用于确定风险评估参数的决策建模的过程。
图1所示的过程包括从存储服务器获取原始数据,然后对原始数据进行准备、清洗、变量衍生、建模宽表、变量分析、筛选、构建逻辑回归模型,得到模型结果。
上述过程中的各个环节都为现有技术,本处不做过多赘述,其中,构建逻辑回归模型为上述公式(1)和公式(2)的简单模型。
从图1和图2中可以看出,本发明实施例的建模过程增加了决策变量梳理的过程。
决策变量梳理的过程可以参阅表3和表4进行理解,在增加了决策变量梳理后所构建的逻辑回归模型即为上述公式(5)和公式(6)所描述的决策模型,从而模型结果也就相应的发生了变化。
决策建模法在对原始变量进行处理的同时,充分地考虑了用户可能采取的舞弊行为,利用更多信息进行建模,充分挖掘了所有采集数据的价值,从而使信用评分模型具有突出的效果,更强的稳定性和适应性。下面采用一些实验数据对上述三种方法的建模结果进行了对比如下,结果如表5所示。
表5弱变量组建模法的效果对比
表5显示,决策建模的入选变量更多,不但在开发和验证样本上的效果好,更重要的是,在最能预测未来实施效果的跨期检验上KS为17,明显优于其他两种方法的13和15。
表6是入选变量的PSI,其计算主要基于开发样本(2014年)和跨期检验(2015年)对应两个时段的数据进行计算。简单处理法的变量和评分PSI都比较大,模型很不稳定,这和表5中KS波动比较大是对应的。而决策建模法的变量PSI是可以被接受的,由于考量了多个维度的信息,评分相对比较稳定,评分PSI是最小的,模型最为稳定。
表6变量及模型的PSI(跨期样本和开发样本两个时段比较)
本发明实施例提及了三种建模方法,包括:简单处理法、一般防舞弊法和决策建模法。
简单处理法。这种方法在传统建模中比较常用,因为最为简单易行。此方法的不足同样明显,模型的稳定性和鲁棒性很差,一般不建议在社交数据建模上使用。
一般防舞弊法。这种方法加入了增加用户时间成本和资金成本的考量,建模的结果相对比较稳定,操作起来也比较便捷。这种方法的缺陷是,没有全面利用用户决策相关的信息,这对构建模型来说是一个损失。
决策建模的方法,即把用户为提升信用评分而采取的一些非正常的操作,比如突击加好友,短时间内有大量的贷款借还行为等,也作为自变量放入到模型中来,从而增强模型在应用中的自适应性。即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性。
参阅图3,本发明实施例提供的确定风险评估参数的方法的一实施例包括:
101、获取待确定风险评估参数的用户的评估信息。
用户的评估信息可以是用户的社交信息和网络中的金融行为信息。例如:好友数量和借贷状况等记录。
102、对所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值。
其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为是否达到舞弊决策条件确定。
达到舞弊决策条件,则取值为1,未达到舞弊决策条件,则取值为0。
该过程可以参阅表3和表4进行理解,本处不做过多赘述。
103、根据所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数。
该过程可以参阅上述决策模型的公式(5)和公式(6)进行理解。
与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致风险评估参数的准确性差相比。本发明实施例提供的确定风险评估参数的方法,可以将舞弊信息也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性,从而提高风险评估参数的准确性。
可选地,所述对所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值,可以包括:
对所述用户的评估信息进行分类,得到评估信息分类组;
针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;
针对每个第一类评估信息分类组确定一个第一类型的变量值,针对每个第二类评估信息分类组确定一个第二类型的变量值。
本发明实施例中,舞弊信息可以是指因舞弊行为导致的好友增加数量。
可选地,所述根据所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数,包括:
根据如下公式确定所述用户的评估信息的风险评估参数:
LogoddsD=b0+b1X1+b2X2+b3X3+…+bMXM+c1D1+c2D2+c3D3+…cN DN;
ProbabilityD=exp(LogoddsD)/(1+exp(LogoddsD));
其中,所述X1…XM为第一类型的变量值,M为大于3的整数,D1…DN为第二类型的变量值,N为大于3的整数,b0为初始权重,b1…bM分别为X1…XM的权重,c1…cN分别为D1…DN的权重,LogoddsD为函数的因变量值,ProbabilityD为用户的评估信息的风险评估参数。
参阅图4,本发明实施例提供的建立评估信息决策模型的方法的一实施例包括:
201、获取大量用户的评估信息样本。
202、对所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量。
其中,所述第一类型的变量为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量为根据是否达到舞弊决策条件确定。
该过程可以参阅表3和表4进行理解,本处不做过多赘述。
203、根据所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型。
该过程可以参阅上述决策模型的公式(5)和公式(6)进行理解。
与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致模型的稳定性差相比。本发明实施例提供的建立评估信息决策模型的方法,可以将舞弊行为也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性。
可选地,所述对所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量,可以包括:
对所述评估信息样本进行分类,得到评估信息分类组;
针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;
针对每个第一类评估信息分类组确定一个第一类型的变量,针对每个第二类评估信息分类组确定一个第二类型的变量。
可选地,所述根据所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型,可以包括:
建立如下公式所表示的评估信息决策模型:
LogoddsD=b0+b1X1+b2X2+b3X3+…+bMXM+c1D1+c2D2+c3D3+…cN DN;
ProbabilityD=exp(LogoddsD)/(1+exp(LogoddsD));
其中,所述X1…XM为第一类型的变量,M为大于3的整数,D1…DN为第二类型的变量,N为大于3的整数,b0为初始权重,b1…bM分别为X1…XM的权重,c1…cN分别为D1…DN的权重,LogoddsD为函数的因变量,ProbabilityD为用户的评估信息的风险评估参数。
参阅图5,本发明实施例提供的确定风险评估参数的装置30的一实施例包括:
获取单元301,用于获取待确定风险评估参数的用户的评估信息.
变量梳理单元302,用于对所述获取单元301获取的所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值。
其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。
确定单元303,用于根据所述变量梳理单元303得到的所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数.
与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致风险评估参数的准确性差相比。本发明实施例提供的确定风险评估参数的装置,可以将舞弊信息和舞弊行为也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性,从而提高风险评估参数的准确性。
可选地,所述变量梳理单元302用于:
对所述用户的评估信息进行分类,得到评估信息分类组;
针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;
针对每个第一类评估信息分类组确定一个第一类型的变量值,针对每个第二类评估信息分类组确定一个第二类型的变量值。
可选地,所述确定单元303用于:
根据如下公式确定所述用户的评估信息的风险评估参数:
LogoddsD=b0+b1X1+b2X2+b3X3+…+bMXM+c1D1+c2D2+c3D3+…cN DN;
ProbabilityD=exp(LogoddsD)/(1+exp(LogoddsD));
其中,所述X1…XM为第一类型的变量值,M为大于3的整数,D1…DN为第二类型的变量值,N为大于3的整数,b0为初始权重,b1…bM分别为X1…XM的权重,c1…cN分别为D1…DN的权重,LogoddsD为函数的因变量值,ProbabilityD为用户的评估信息的风险评估参数。
本发明实施例所提供的确定风险评估参数的装置30可以参阅上述的方法部分的描述进行理解,本处不做过多赘述。
参阅图6,本发明实施例提供的建立评估信息决策模型的装置40的一实施例包括:
获取单元401,用于获取大量用户的评估信息样本.
变量梳理单元402,用于对所述获取单元401获取的所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量。
其中,所述第一类型的变量为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量为根据是否达到舞弊决策条件确定。
确定单元403,用于根据所述变量梳理单元402得到的所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型。
与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致模型的稳定性差相比。本发明实施例提供的建立评估信息决策模型的装置,可以将舞弊信息和舞弊行为也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性。
可选地,所述变量梳理单元402用于:
对所述评估信息样本进行分类,得到评估信息分类组;
针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;
针对每个第一类评估信息分类组确定一个第一类型的变量,针对每个第二类评估信息分类组确定一个第二类型的变量。
可选地,所述确定单元403用于:
建立如下公式所表示的评估信息决策模型:
LogoddsD=b0+b1X1+b2X2+b3X3+…+bMXM+c1D1+c2D2+c3D3+…cN DN;
ProbabilityD=exp(LogoddsD)/(1+exp(LogoddsD));
其中,所述X1…XM为第一类型的变量,M为大于3的整数,D1…DN为第二类型的变量,N为大于3的整数,b0为初始权重,b1…bM分别为X1…XM的权重,c1…cN分别为D1…DN的权重,LogoddsD为函数的因变量,ProbabilityD为用户的评估信息的风险评估参数。
本发明实施例所提供的建立评估信息决策模型的装置40可以参阅上述的方法部分的描述进行理解,本处不做过多赘述。
图7是本发明实施例提供的确定风险评估参数的装置50的结构示意图。所述确定风险评估参数的装置50包括处理器510、存储器550和输入/输出I/O设备530,存储器550可以包括只读存储器和随机存取存储器,并向处理器510提供操作指令和数据。存储器550的一部分还可以包括非易失性随机存取存储器(NVRAM)。
在一些实施方式中,存储器550存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:
在本发明实施例中,通过调用存储器550存储的操作指令(该操作指令可存储在操作系统中),
获取待确定风险评估参数的用户的评估信息;
对所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值;
根据所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数;
其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。
与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致风险评估参数的准确性差相比。本发明实施例提供的确定风险评估参数的装置,可以将舞弊信息和舞弊行为也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性,从而提高风险评估参数的准确性。
处理器510控制确定风险评估参数的装置50的操作,处理器510还可以称为CPU(Central Processing Unit,中央处理单元)。存储器550可以包括只读存储器和随机存取存储器,并向处理器510提供指令和数据。存储器550的一部分还可以包括非易失性随机存取存储器(NVRAM)。的应用中确定风险评估参数的装置50的各个组件通过总线系统520耦合在一起,其中总线系统520除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统520。
上述本发明实施例揭示的方法可以应用于处理器510中,或者由处理器510实现。处理器510可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器510中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器510可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器550,处理器510读取存储器550中的信息,结合其硬件完成上述方法的步骤。
可选地,处理器510用于:
对所述用户的评估信息进行分类,得到评估信息分类组;
针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;
针对每个第一类评估信息分类组确定一个第一类型的变量值,针对每个第二类评估信息分类组确定一个第二类型的变量值。
可选地,处理器510用于:
根据如下公式确定所述用户的评估信息的风险评估参数:
LogoddsD=b0+b1X1+b2X2+b3X3+…+bMXM+c1D1+c2D2+c3D3+…cN DN;
ProbabilityD=exp(LogoddsD)/(1+exp(LogoddsD));
其中,所述X1…XM为第一类型的变量值,M为大于3的整数,D1…DN为第二类型的变量值,N为大于3的整数,b0为初始权重,b1…bM分别为X1…XM的权重,c1…cN分别为D1…DN的权重,LogoddsD为函数的因变量值,ProbabilityD为用户的评估信息的风险评估参数。
图8是本发明实施例提供的建立评估信息决策模型的装置60的结构示意图。所述建立评估信息决策模型的装置60包括处理器610、存储器650和输入/输出I/O设备630,存储器650可以包括只读存储器和随机存取存储器,并向处理器610提供操作指令和数据。存储器650的一部分还可以包括非易失性随机存取存储器(NVRAM)。
在一些实施方式中,存储器650存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:
在本发明实施例中,通过调用存储器650存储的操作指令(该操作指令可存储在操作系统中),
获取大量用户的评估信息样本;
对所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量;
根据所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型;
其中,所述第一类型的变量为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量为根据是否达到舞弊决策条件确定。
与现有技术中通过拉伸时间跨度和严格变量条件两种方式,排除用户在社交网络所作的有目的性的舞弊行为,在排除舞弊评估信息的同时也排除了一些有用的评估信息,从而导致模型的稳定性差相比。本发明实施例提供的建立评估信息决策模型的装置,可以将舞弊信息和舞弊行为也引入到决策模型中来,从而增强模型在应用中的自适应性,即评分模型已经考虑了用户可能采取的一些舞弊行为,因而模型在应用中会更加稳定,更具有鲁棒性确保信息的全面性。
处理器610控制建立评估信息决策模型的装置60的操作,处理器610还可以称为CPU(Central Processing Unit,中央处理单元)。存储器650可以包括只读存储器和随机存取存储器,并向处理器610提供指令和数据。存储器650的一部分还可以包括非易失性随机存取存储器(NVRAM)。的应用中建立评估信息决策模型的装置60的各个组件通过总线系统620耦合在一起,其中总线系统620除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统620。
上述本发明实施例揭示的方法可以应用于处理器610中,或者由处理器610实现。处理器610可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器610中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器610可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器650,处理器610读取存储器650中的信息,结合其硬件完成上述方法的步骤。
可选地,处理器610用于:
对所述评估信息样本进行分类,得到评估信息分类组;
针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;
针对每个第一类评估信息分类组确定一个第一类型的变量,针对每个第二类评估信息分类组确定一个第二类型的变量。
可选地,处理器610用于:
建立如下公式所表示的评估信息决策模型:
LogoddsD=b0+b1X1+b2X2+b3X3+…+bMXM+c1D1+c2D2+c3D3+…cN DN;
ProbabilityD=exp(LogoddsD)/(1+exp(LogoddsD));
其中,所述X1…XM为第一类型的变量,M为大于3的整数,D1…DN为第二类型的变量,N为大于3的整数,b0为初始权重,b1…bM分别为X1…XM的权重,c1…cN分别为D1…DN的权重,LogoddsD为函数的因变量,ProbabilityD为用户的评估信息的风险评估参数。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上对本发明实施例所提供的确定风险评估参数的方法、建立评估信息决策模型的方法以及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种确定风险评估参数的方法,其特征在于,包括:
获取待确定风险评估参数的用户的评估信息;
对所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值;
根据所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数;
其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。
2.根据权利要求1所述的方法,其特征在于,所述对所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值,包括:
对所述用户的评估信息进行分类,得到评估信息分类组;
针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;
针对每个第一类评估信息分类组确定一个第一类型的变量值,针对每个第二类评估信息分类组确定一个第二类型的变量值。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数,包括:
根据如下公式确定所述用户的评估信息的风险评估参数:
LogoddsD=b0+b1X1+b2X2+b3X3+…+bMXM+c1D1+c2D2+c3D3+…cN DN;
ProbabilityD=exp(LogoddsD)/(1+exp(LogoddsD));
其中,所述X1…XM为第一类型的变量值,M为大于3的整数,D1…DN为第二类型的变量值,N为大于3的整数,b0为初始权重,b1…bM分别为X1…XM的权重,c1…cN分别为D1…DN的权重,LogoddsD为函数的因变量值,ProbabilityD为用户的评估信息的风险评估参数。
4.一种建立评估信息决策模型的方法,其特征在于,包括:
获取大量用户的评估信息样本;
对所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量;
根据所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型;
其中,所述第一类型的变量为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量为根据是否达到舞弊决策条件确定。
5.根据权利要求4所述的方法,其特征在于,所述对所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量,包括:
对所述评估信息样本进行分类,得到评估信息分类组;
针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;
针对每个第一类评估信息分类组确定一个第一类型的变量,针对每个第二类评估信息分类组确定一个第二类型的变量。
6.根据权利要求5或6所述的方法,其特征在于,所述根据所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型,包括:
建立如下公式所表示的评估信息决策模型:
LogoddsD=b0+b1X1+b2X2+b3X3+…+bMXM+c1D1+c2D2+c3D3+…cN DN;
ProbabilityD=exp(LogoddsD)/(1+exp(LogoddsD));
其中,所述X1…XM为第一类型的变量,M为大于3的整数,D1…DN为第二类型的变量,N为大于3的整数,b0为初始权重,b1…bM分别为X1…XM的权重,c1…cN分别为D1…DN的权重,LogoddsD为函数的因变量,ProbabilityD为用户的评估信息的风险评估参数。
7.一种确定风险评估参数的装置,其特征在于,包括:
获取单元,用于获取待确定风险评估参数的用户的评估信息;
变量梳理单元,用于对所述获取单元获取的所述用户的评估信息进行变量梳理,得到第一类型的变量值和第二类型的变量值;
确定单元,用于根据所述变量梳理单元得到的所述第一类型的变量值、所述第二类型的变量值和具有评估信息决策功能的决策模型确定所述用户的评估信息的风险评估参数;
其中,所述第一类型的变量值为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量值为根据是否达到舞弊决策条件确定。
8.根据权利要求7所述的装置,其特征在于,
所述变量梳理单元用于:
对所述用户的评估信息进行分类,得到评估信息分类组;
针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;
针对每个第一类评估信息分类组确定一个第一类型的变量值,针对每个第二类评估信息分类组确定一个第二类型的变量值。
9.根据权利要求7或8所述的装置,其特征在于,
所述确定单元用于:
根据如下公式确定所述用户的评估信息的风险评估参数:
LogoddsD=b0+b1X1+b2X2+b3X3+…+bMXM+c1D1+c2D2+c3D3+…cN DN;
ProbabilityD=exp(LogoddsD)/(1+exp(LogoddsD));
其中,所述X1…XM为第一类型的变量值,M为大于3的整数,D1…DN为第二类型的变量值,N为大于3的整数,b0为初始权重,b1…bM分别为X1…XM的权重,c1…cN分别为D1…DN的权重,LogoddsD为函数的因变量值,ProbabilityD为用户的评估信息的风险评估参数。
10.一种建立评估信息决策模型的装置,其特征在于,包括:
获取单元,用于获取大量用户的评估信息样本;
变量梳理单元,用于对所述获取单元获取的所述评估信息样本进行变量梳理,得到第一类型的变量和第二类型的变量;
确定单元,用于根据所述变量梳理单元得到的所述第一类型的变量和所述第二类型的变量,建立评估信息决策模型;
其中,所述第一类型的变量为从所述评估信息中排除了舞弊信息得到的,所述第二类型的变量为根据是否达到舞弊决策条件确定。
11.根据权利要求10所述的装置,其特征在于,
所述变量梳理单元用于:
对所述评估信息样本进行分类,得到评估信息分类组;
针对每个评估信息分类组分别执行舞弊信息排除和是否达到舞弊决策条件确定的操作,得到第一类评估信息分类组和第二类评估信息分类组;
针对每个第一类评估信息分类组确定一个第一类型的变量,针对每个第二类评估信息分类组确定一个第二类型的变量。
12.根据权利要求10或11所述的装置,其特征在于,
所述确定单元用于:
建立如下公式所表示的评估信息决策模型:
LogoddsD=b0+b1X1+b2X2+b3X3+…+bMXM+c1D1+c2D2+c3D3+…cN DN;
ProbabilityD=exp(LogoddsD)/(1+exp(LogoddsD));
其中,所述X1…XM为第一类型的变量,M为大于3的整数,D1…DN为第二类型的变量,N为大于3的整数,b0为初始权重,b1…bM分别为X1…XM的权重,c1…cN分别为D1…DN的权重,LogoddsD为函数的因变量,ProbabilityD为用户的评估信息的风险评估参数。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610071135.6A CN107038511A (zh) | 2016-02-01 | 2016-02-01 | 一种确定风险评估参数的方法及装置 |
PCT/CN2017/071542 WO2017133456A1 (zh) | 2016-02-01 | 2017-01-18 | 一种确定风险评估参数的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610071135.6A CN107038511A (zh) | 2016-02-01 | 2016-02-01 | 一种确定风险评估参数的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107038511A true CN107038511A (zh) | 2017-08-11 |
Family
ID=59499337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610071135.6A Pending CN107038511A (zh) | 2016-02-01 | 2016-02-01 | 一种确定风险评估参数的方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107038511A (zh) |
WO (1) | WO2017133456A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108830454A (zh) * | 2018-05-08 | 2018-11-16 | 阿里巴巴集团控股有限公司 | 业务的决策方法、装置及电子设备 |
CN109584047A (zh) * | 2018-11-29 | 2019-04-05 | 北京玖富普惠信息技术有限公司 | 一种授信方法、系统、计算机设备及介质 |
WO2019222902A1 (zh) * | 2018-05-22 | 2019-11-28 | 大连理工大学 | 基于Informedness系数的信用评级最优指标组合遴选方法 |
CN111709826A (zh) * | 2020-06-11 | 2020-09-25 | 中国建设银行股份有限公司 | 目标信息确定方法和装置 |
TWI709923B (zh) * | 2018-10-03 | 2020-11-11 | 臺灣土地銀行股份有限公司 | 行為模式信評系統 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102393995B1 (ko) | 2017-12-08 | 2022-05-03 | 닝보 써니 오포테크 코., 엘티디. | 광학 어셈블리, 카메라 모듈과 카메라 모듈을 갖는 인텔리전트 설비 |
CN108959934B (zh) * | 2018-06-11 | 2023-08-22 | 平安科技(深圳)有限公司 | 安全风险评估方法、装置、计算机设备和存储介质 |
CN109191292A (zh) * | 2018-08-08 | 2019-01-11 | 平安科技(深圳)有限公司 | 异质波动率再平衡方法、系统、计算机设备和存储介质 |
CN111222994A (zh) * | 2018-11-23 | 2020-06-02 | 泰康保险集团股份有限公司 | 客户风险评估方法、装置、介质和电子设备 |
CN110135694A (zh) * | 2019-04-12 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 产品风险评估方法、装置、计算机设备和存储介质 |
CN111061948B (zh) * | 2019-11-25 | 2023-05-23 | 成都铂锡金融信息技术有限公司 | 一种用户标签推荐方法、装置、计算机设备及存储介质 |
CN113052413A (zh) * | 2019-12-26 | 2021-06-29 | 北京中科闻歌科技股份有限公司 | 一种风险旅客评估方法、装置、终端及计算机可读介质 |
CN112926879B (zh) * | 2021-03-26 | 2022-05-20 | 平安科技(深圳)有限公司 | 疾病诊断相关分组的支付方案决策方法、装置及设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060287946A1 (en) * | 2005-06-16 | 2006-12-21 | Toms Alvin D | Loss management system and method |
CN101493913A (zh) * | 2008-01-23 | 2009-07-29 | 阿里巴巴集团控股有限公司 | 一种评估网上用户信用的方法及系统 |
US8799150B2 (en) * | 2009-09-30 | 2014-08-05 | Scorelogix Llc | System and method for predicting consumer credit risk using income risk based credit score |
CN102339445A (zh) * | 2010-07-23 | 2012-02-01 | 阿里巴巴集团控股有限公司 | 对网络交易用户的可信度进行评价的方法和系统 |
CN104965844A (zh) * | 2014-12-29 | 2015-10-07 | 腾讯科技(深圳)有限公司 | 信息处理方法及装置 |
CN104616194A (zh) * | 2014-12-31 | 2015-05-13 | 腾讯科技(深圳)有限公司 | 一种数据处理方法及支付平台 |
-
2016
- 2016-02-01 CN CN201610071135.6A patent/CN107038511A/zh active Pending
-
2017
- 2017-01-18 WO PCT/CN2017/071542 patent/WO2017133456A1/zh active Application Filing
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108830454A (zh) * | 2018-05-08 | 2018-11-16 | 阿里巴巴集团控股有限公司 | 业务的决策方法、装置及电子设备 |
CN108830454B (zh) * | 2018-05-08 | 2021-12-28 | 创新先进技术有限公司 | 业务的决策方法、装置及电子设备 |
WO2019222902A1 (zh) * | 2018-05-22 | 2019-11-28 | 大连理工大学 | 基于Informedness系数的信用评级最优指标组合遴选方法 |
TWI709923B (zh) * | 2018-10-03 | 2020-11-11 | 臺灣土地銀行股份有限公司 | 行為模式信評系統 |
CN109584047A (zh) * | 2018-11-29 | 2019-04-05 | 北京玖富普惠信息技术有限公司 | 一种授信方法、系统、计算机设备及介质 |
CN109584047B (zh) * | 2018-11-29 | 2021-01-26 | 北京玖富普惠信息技术有限公司 | 一种授信方法、系统、计算机设备及介质 |
CN111709826A (zh) * | 2020-06-11 | 2020-09-25 | 中国建设银行股份有限公司 | 目标信息确定方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2017133456A1 (zh) | 2017-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107038511A (zh) | 一种确定风险评估参数的方法及装置 | |
CN109977151B (zh) | 一种数据分析方法及系统 | |
Jarosch et al. | Statistical discrimination and duration dependence in the job finding rate | |
Jones | The burden of knowledge and the “death of the renaissance man”: Is innovation getting harder? | |
CN108416664A (zh) | 基于消费信贷场景的风险评估方法及系统实现 | |
CN107025596A (zh) | 一种风险评估方法和系统 | |
CN106875206A (zh) | 信息获取、评估、问卷调查方法、装置及服务器 | |
CN110264221A (zh) | 一种针对服务商行业的全链路安全业务联合解决方案 | |
CN109300039A (zh) | 基于人工智能和大数据进行智能产品推荐的方法及系统 | |
JP2004506959A (ja) | 情報が欠けた状態での評価値予測モデル | |
CN110909984A (zh) | 业务数据处理模型训练方法、业务数据处理方法及装置 | |
CN106408325A (zh) | 基于用户支付信息的用户消费行为预测分析方法及系统 | |
Chen et al. | A combined mining-based framework for predicting telecommunications customer payment behaviors | |
Onar et al. | A fuzzy rule based inference system for early debt collection | |
CN113592287A (zh) | 风险评估方法和装置 | |
JP6587556B2 (ja) | 情報処理装置及び情報処理方法 | |
Park et al. | Recommendation of investment portfolio for peer-to-peer lending with additional consideration of bidding period | |
CN112200340A (zh) | 预测逃废债区块链系统 | |
Dawood et al. | Fintech Credit Platforms’ Perceived Risk Facets and Factors: A Systematic Literature Review | |
CN115131074A (zh) | 意向预测方法及相关装置 | |
CN114154682A (zh) | 一种客户贷款收益率等级预测方法及系统 | |
CN111932357A (zh) | 一种数据转移的处理方法、装置、计算设备及存储介质 | |
CN113450887A (zh) | 基于授信的医疗数据处理方法、装置、电子设备及介质 | |
CN111079992A (zh) | 数据处理方法、装置和存储介质 | |
Yazdani | Developing a model for validation and prediction of bank customer credit using information technology (case study of Dey Bank) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170811 |
|
RJ01 | Rejection of invention patent application after publication |