[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN117974280A - 银行金融交易风险特征库的建立方法及装置 - Google Patents

银行金融交易风险特征库的建立方法及装置 Download PDF

Info

Publication number
CN117974280A
CN117974280A CN202311634977.4A CN202311634977A CN117974280A CN 117974280 A CN117974280 A CN 117974280A CN 202311634977 A CN202311634977 A CN 202311634977A CN 117974280 A CN117974280 A CN 117974280A
Authority
CN
China
Prior art keywords
financial transaction
bank
feature
transaction risk
different
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311634977.4A
Other languages
English (en)
Inventor
阮逸松
张发波
俞泱
陈桂花
张思聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
CCB Finetech Co Ltd
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN202311634977.4A priority Critical patent/CN117974280A/zh
Publication of CN117974280A publication Critical patent/CN117974280A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Finance (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种银行金融交易风险特征库的建立方法及装置,该方法包括:对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据;基于自动特征工程技术进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系;根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库。本发明用以提升银行金融交易风险特征的生成效率、复用性和适用性。

Description

银行金融交易风险特征库的建立方法及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及银行金融交易风险特征库的建立方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
目前,银行金融交易风险特征,主要应用在构建模型的过程中,按需根据各个模型训练过程中的需要,进行特征加工和相应的特征工程操作。
举一例,如银行金融交易风险特征主要基于交易流水、账户信息、客户信息,根据各个模型构建过程中的需要,加工对应所需的特征。每个模型研发时,都需要单独进行特征设计、特征加工工作。
而在构建银行金融交易风险场景机器学习模型时,涉及的场景繁多,涉及到的风险特征复杂。目前在针对每个银行金融交易风险场景进行模型构建的过程中,均需要进行许多重复的特征设计和特征加工工作,容易导致许多重复的特征处理工作,造成了工作的冗余性,也降低了工作效率,还会导致风险特征设计覆盖不全面等问题。
发明内容
本发明实施例提供一种银行金融交易风险特征库的建立方法,用以提升银行金融交易风险特征的生成效率、复用性和适用性,该方法包括:
对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据;
基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;
确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系;
根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;
根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库。
本发明实施例还提供一种银行金融交易风险特征库的建立装置,用以提升银行金融交易风险特征的生成效率、复用性和适用性,该装置包括:
交易数据处理模块,用于对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据;
自动特征工程模块,用于基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;
特征关联关系确定模块,用于确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系;
特征的数据库所在层级确定模块,用于根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;
银行金融交易风险特征库构建模块,用于根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述银行金融交易风险特征库的建立方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述银行金融交易风险特征库的建立方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述银行金融交易风险特征库的建立方法。
本发明实施例中,对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据;基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系;根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库,与现有技术中使用银行金融交易风险特征均需对特征重新创建的技术方案相比,通过建立银行金融交易风险特征库,不仅可以能够自动化立银行金融交易风险特征,提升了银行金融交易风险特征的生成效率,为数据分析工作的开展提供新的思路,还可为不同的银行金融交易风险特征应用场景提供数据库支持,提升了银行金融交易风险特征的复用性,进而提升了银行金融交易风险特征的多场景适用性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中一种银行金融交易风险特征库的建立方法的流程示意图;
图2为本发明实施例中一种银行金融交易风险特征库的建立装置的结构示意图;
图3为本发明实施例中一种银行金融交易风险特征库的建立装置的具体示例图;
图4为本发明实施例中一种银行金融交易风险特征库的建立装置的具体示例图;
图5为本发明实施例中一种银行金融交易风险特征库的建立装置的结构示意图;
图6为本发明实施例中用于银行金融交易风险特征库的建立的计算机设备示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
本发明实施例涉及下列名词,如下进行解释:
Featuretools:Featuretools是一个执行自动特征工程的框架。它可以基于基本运算和统计值把互相关联的数据集转换为特征矩阵。可以将特征构造的操作分为两类:“转换”和“聚合”
特征工程:特征工程可以简单定义为从数据集的已有特征创建新特征的过程。其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。
自动特征工程,是自动机器学习(AutoML)的一个重要组成部分,它旨在自动化的进行特征加工、特征选择和特征优化过程,以提高特征准确覆盖银行金融交易风险的能力。
AutoML:可以被定义为一组工具,可以使机器学习解决问题的过程自动化。
目前,银行金融交易风险特征,主要应用在构建模型的过程中,按需根据各个模型训练过程中的需要,进行特征加工和相应的特征工程操作。
举一例,如银行金融交易风险特征主要基于交易流水、账户信息、客户信息,根据各个模型构建过程中的需要,加工对应所需的特征。每个模型研发时,都需要单独进行特征设计、特征加工工作。
而在构建银行金融交易风险场景机器学习模型时,涉及的银行金融交易风险场景繁多,涉及到的风险特征复杂。目前在针对每个银行金融交易风险场景进行模型构建的过程中,均需要进行许多重复的特征设计和特征加工工作,容易导致许多重复的特征处理工作,造成了工作的冗余性,也降低了工作效率,还会导致风险特征设计覆盖不全面等问题。
为了解决上述问题,本发明实施例提供了一种银行金融交易风险特征库的建立方法,用以提升银行金融交易风险特征的生成效率、复用性和适用性,参见图1,该方法可以包括:
步骤101:对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据;
步骤102:基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;
步骤103:确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系;
步骤104:根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;
步骤105:根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库。
本发明实施例中,对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据;基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系;根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库,与现有技术中使用银行金融交易风险特征均需对特征重新创建的技术方案相比,通过建立银行金融交易风险特征库,不仅可以能够自动化立银行金融交易风险特征,提升了银行金融交易风险特征的生成效率,为数据分析工作的开展提供新的思路,还可为不同的银行金融交易风险特征应用场景提供数据库支持,提升了银行金融交易风险特征的复用性,进而提升了银行金融交易风险特征的多场景适用性。
具体实施时,首先对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据。在对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据后,基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征。
实施例中创新性地引入了AutoML技术,基于金融机构海量的客户、账户、渠道、交易流水等数据,对于特征进行分级化地衍生加工,自动化地生成相应特征,节省特征加工的时间成本,实现特征加工高效化,特征覆盖全面化。
在一个实施例中,基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征,包括:
根据处理后的不同银行客户的历史金融交易数据进行,建立历史金融交易数据的多个实体集;所述实体集包括每一实体的属性信息;所述实体包括不同客户的客户基本信息和客户基础行为信息;所述属性信息包括实体的名称信息、索引信息和时间戳信息;
基于Featuretools技术,根据建立的所述多个实体集进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征。
对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征。
在一个实施例中,不同银行客户的历史金融交易数据包括:不同银行客户的客户基本信息和客户基础行为信息;所述客户基本信息包括客户年龄信息、客户性别信息、客户职业信息、客户的关联人和干系人信息以及客户账户信息的其中之一或任意组合;所述客户基础行为信息包括客户历史动态行为信息,客户账户变更行为信息、客户渠道登陆行为信息、客户历史交易行为信息、以及客户取现行为信息的其中之一或任意组合。
在一个实施例中,还包括:
对所述多个银行金融交易风险特征进行重复特征的筛查处理,得到筛查处理后的多个银行金融交易风险特征;
确定不同银行金融交易风险特征之间的关联关系,包括:
确定筛查处理后的多个银行金融交易风险特征之间的关联关系。
具体实施时,在基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征后,确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系。
具体实施时,在确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系后,根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库。
实施例中,根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库,可解决如下现有技术中的问题:在各个银行金融交易风险场景之间,入模风险特征常常存在重叠,而本实施例通过构建基于风险识别点的模型特征库,能够对其中的特征进行高效复用,减少冗余重复工作。
此外,通过分层级化的特征库设计,实现对各银行金融交易风险场景风险识别点的360°全覆盖,构建体系化的AI银行金融交易风险侦测模型特征库。
在一个实施例中,还包括:
基于预设置的对应不同数据库所在层级的标识、和预设置的位于不同数据库所在层级的银行金融交易风险特征的标识,对所述银行金融交易风险特征库进行标识的编码。
实施例中,基于分级化的特征库设计思想,可基于人行风险识别点层级化的模型特征编码,以便于对于全方位的风险特征进行编码管理。
举一实例,如:
风险特征分级化编号规则:(一级风险识别点编号)_(二级风险识别点编号)_(三级风险识别点编号)_(特征指标编号)_(对公对私特征标志)。
该实施例通过体系化、标准化的特征编码策略,能够快速定位到任意一级的风险特征组,并从该特征组中选取所需的特征指标,从而高效化地进行模型特征设计和模型构建。
在一个实施例中,还包括:
持续接收不同银行客户的历史金融交易数据;
对持续接收的不同银行客户的历史金融交易数据进行上述基于自动特征工程技术得到对应历史金融交易数据的多个银行金融交易风险特征的步骤,得到多个银行金融交易风险特征的更新数据;
以所述多个银行金融交易风险特征的更新数据,对建立的银行金融交易风险特征库进行数据库的更新处理。
实施例中,以所述多个银行金融交易风险特征的更新数据,对建立的银行金融交易风险特征库进行数据库的更新处理,可实现体系化的模型特征库管理,能够减少模型迭代、训练时特征加工的时间,保证后续模型能够快速迭代,应对银行金融交易风险快速变化的趋势。
此外,针对新增的银行金融交易风险场景模型,可通过对建立的银行金融交易风险特征库进行数据库的更新处理,能够对现有的特征库进行扩展。对于各个银行金融交易风险场景子模型,具有插件化的优势,可以单独进行模型、特征新增、删除、启用、停用、重检、更新,从而保证模型和特征兼具研发态、应用态的灵活性。
下面给出一个具体实施例,来说明本发明的方法的具体应用。
目前,银行金融交易风险特征,主要是在构建模型的过程中,按需根据各个模型训练过程中的需要,进行特征加工、特征工程。当前,银行金融交易风险特征,主要基于交易流水、账户信息、客户信息,根据各个模型构建过程中的需要,加工对应所需的特征。每个模型研发时,都需要单独进行特征设计、特征加工工作。
在探索全场景的AI银行金融交易风险控制能力提升过程中,需要构建覆盖全面的银行金融交易风险特征,但是目前银行金融交易风险特征管理体系,缺乏一种基于更具层次化、体系化的银行金融交易风险特征库构建方法,从而充分覆盖各个银行金融交易风险场景的风险特征,打造一个高效化、可复用、全方位的银行金融交易风险模型特征库。
在构建银行金融交易风险场景机器学习模型时,场景繁多,涉及到的风险特征复杂。针对每个银行金融交易风险场景进行模型构建时,需要进行许多重复的特征设计、特征加工工作,并且容易导致许多重复、冗余工作、风险特征设计覆盖不全面等问题,而本具体实施例提供了一种基于人行风险识别点的银行金融交易风险特征库构建方案,实现覆盖全方位、各场景的银行金融交易风险特征,能够提高全场景的AI银行金融交易风险特征建模效率。
针对上述问题,该实施例中提出了一种基于人行风险识别点,具有层次化、体系化、可复用的360°全覆盖的银行金融交易风险特征库管理方案。
在本具体实施例中,给出了上述应用自动特征工程技术的实施例:本实施例引入了Featuretools等自动机器学习方案,自动化地通过组合客户各维度的静态数据、动态数据,创建有效地特征,捕捉数据中潜在的模式和关联。
以下以Featuretools为例,通过自动特征工程,实现以下流程:
数据预处理:将准备好的结构化数据,进行数据加载、缺失值处理、异常值处理等;
实体定义:定义数据中的每个实体,包括实体的名称、索引、时间戳等信息;
实体关系定义:定义实体之间的关系,例如,一个实体可以是另一个实体的子集或者父实体,进一步捕捉数据之间的关联关系;
特征生成:使用FeatureTools提供的函数,自动化创建一系列特征,包括聚合、转换、时间相关特征等,将实体之间的关系和时间信息结合起来,生成具有意义的特征
特征选择:通过FeatureTools提供的特征选择功能,自动进行特征筛选,减少冗余特征,降低特征维度
特征工程管道构建:将生成的组合特征,形成特征管道,以便后续的模型训练。
此外,本实施例还基于分级化的特征库设计思想,针对性地设计了基于人行风险识别点层级化的模型特征编码,以便于对于全方位的风险特征进行编码管理。
风险特征分级化编号规则:(一级风险识别点编号)_(二级风险识别点编号)_(三级风险识别点编号)_(特征指标编号)_(对公对私特征标志)。
本发明实施例通过体系化、标准化的特征编码策略,能够快速定位到任意一级的风险特征组,并从该特征组中选取所需的特征指标,从而高效化地进行模型特征设计和模型构建。
本发明创新性地基于人行风险识别点中的银行金融交易风险描述,进行特征库的层次化、体系化设计:
一级风险识别点:身份信息、账户信息、交易信息、行为信息等;
二级风险识别点:基于一级风险识别点,进一步拆分风险维度。如针对“身份信息”一级风险识别点,拆分了如公司背景、个人背景和多头开户等;
三级风险识别点:基于二级风险识别点,进一步细化风险描述。如针对“多头开户”二级风险识别点,进一步对多头开户的风险识别点描述进行细化;
风险特征指标:将三级风险识别点,最终设计出可加工的风险特征指标。如针对身份信息-多头开户-异地开户,进一步加工出“客户名下账户开户地跨省个数”、“客户名下账户开户地跨地市个数”等风险特征指标。
通过本发明中基于风险识别点的层次化管理方法,能够对各个银行金融交易风险场景中涉及的风险特征进行全方位的覆盖,并且针对各个银行金融交易风险场景进行机器学习模型建模时,可以充分复用之前已加工完成的风险特征进行建模,并动态化地对特征库中的风险特征进行补充加工。
进一步,本发明创新性地引入了AutoML技术,基于金融机构海量的客户、账户、渠道、交易流水等数据,对于特征进行分级化地衍生加工,自动化地生成相应特征,节省特征加工的时间成本,实现特征加工高效化,特征覆盖全面化。
具体的,本具体实施例中所应用的数据可按如下方式进行获取和处理:
首先基于金融机构海量的客户、账户、渠道、交易流水等数据,根据层次化的风险识别点,预加工得到结构化的基础信息表。
之后,根据一级风险识别点,划分为两个维度:客户基本信息档案和客户基础行为档案。其中,客户基本信息,包含客户最新的静态信息,包含客户年龄、性别、职业、关联人、干系人、账户等信息;客户基础行为档案中,包含客户的历史动态信息,账户变更行为、渠道登陆行为、交易行为、大额取现行为等。
本发明的具体优势有:
体系化:通过分级化的特征库设计,实现对各银行金融交易风险场景风险识别点的360°全覆盖,构建体系化的AI银行金融交易侦测模型特征库;
可复用:各个银行金融交易风险场景之间,入模风险特征常常存在重叠,通过构建基于风险识别点的模型特征库,能够对其中的特征进行高效复用,减少冗余重复工作;
易迭代:体系化的模型特征库管理,能够减少模型迭代、训练时特征加工的时间,保证后续模型能够快速迭代,应对银行金融交易风险快速变化的趋势;
易扩展:针对新增的银行金融交易风险场景模型,能够对现有的特征库进行扩展。对于各个银行金融交易风险场景子模型,具有插件化的优势,可以单独进行模型、特征新增、删除、启用、停用、重检、更新,从而保证模型和特征兼具研发态、应用态的灵活性。
低成本:通过AutoML技术,实现特征衍生加工的自动化,降低技术门槛和时间成本。
当然,可以理解的是,上述详细流程还可以有其他变化例,相关变化例均应落入本发明的保护范围。
本发明实施例中,对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据;基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系;根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库,与现有技术中使用银行金融交易风险特征均需对特征重新创建的技术方案相比,通过建立银行金融交易风险特征库,不仅可以能够自动化立银行金融交易风险特征,提升了银行金融交易风险特征的生成效率,为数据分析工作的开展提供新的思路,还可为不同的银行金融交易风险特征应用场景提供数据库支持,提升了银行金融交易风险特征的复用性,进而提升了银行金融交易风险特征的多场景适用性。
如上述,为了解决如下问题:在构建银行金融交易风险场景机器学习模型时,银行金融交易风险场景繁多,涉及到的风险特征复杂。针对每个银行金融交易风险场景进行模型构建时,需要进行许多重复的特征设计、特征加工工作,并且容易导致许多重复、冗余工作、风险特征设计覆盖不全面等问题。本发明实施例提供了一种基于风险识别点为维度,充分覆盖各个银行金融交易风险场景的风险特征库,实现特征设计、特征加工高可复用。
本发明实施例中还提供了一种银行金融交易风险特征库的建立装置,如下面的实施例所表述的。由于该装置解决问题的原理与银行金融交易风险特征库的建立方法相似,因此该装置的实施可以参见银行金融交易风险特征库的建立方法的实施,重复之处不再赘述。
本发明实施例还提供一种银行金融交易风险特征库的建立装置,用以提升银行金融交易风险特征的生成效率、复用性和适用性,如图2所示,该装置包括:
交易数据处理模块201,用于对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据;
自动特征工程模块202,用于基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;
特征关联关系确定模块203,用于确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系;
特征的数据库所在层级确定模块204,用于根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;
银行金融交易风险特征库构建模块205,用于根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库。
在一个实施例中,基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征,包括:
根据处理后的不同银行客户的历史金融交易数据进行,建立历史金融交易数据的多个实体集;所述实体集包括每一实体的属性信息;所述实体包括不同客户的客户基本信息和客户基础行为信息;所述属性信息包括实体的名称信息、索引信息和时间戳信息;
基于Featuretools技术,根据建立的所述多个实体集进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征。
对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征。
在一个实施例中,不同银行客户的历史金融交易数据包括:不同银行客户的客户基本信息和客户基础行为信息;所述客户基本信息包括客户年龄信息、客户性别信息、客户职业信息、客户的关联人和干系人信息以及客户账户信息的其中之一或任意组合;所述客户基础行为信息包括客户历史动态行为信息,客户账户变更行为信息、客户渠道登陆行为信息、客户历史交易行为信息、以及客户取现行为信息的其中之一或任意组合。
在一个实施例中,如图3所示,还包括:
银行金融交易风险特征库编码模块301,用于:
基于预设置的对应不同数据库所在层级的标识、和预设置的位于不同数据库所在层级的银行金融交易风险特征的标识,对所述银行金融交易风险特征库进行标识的编码。
在一个实施例中,如图4所示,还包括:
银行金融交易风险特征库更新模块401,用于:
持续接收不同银行客户的历史金融交易数据;
对持续接收的不同银行客户的历史金融交易数据进行上述基于自动特征工程技术得到对应历史金融交易数据的多个银行金融交易风险特征的步骤,得到多个银行金融交易风险特征的更新数据;
以所述多个银行金融交易风险特征的更新数据,对建立的银行金融交易风险特征库进行数据库的更新处理。
在一个实施例中,如图5所示,还包括:
筛查处理模块501,用于:
对所述多个银行金融交易风险特征进行重复特征的筛查处理,得到筛查处理后的多个银行金融交易风险特征;
确定不同银行金融交易风险特征之间的关联关系,包括:
确定筛查处理后的多个银行金融交易风险特征之间的关联关系。
在一个实施例中,还包括:
特征调用指令响应模块,用于:
接收对银行金融交易风险特征库的特征调用指令;
响应于所述特征调用指令,确定所述特征调用指令对应的待调用特征的目标层级,并反馈所述目标层级对应的特征数据。
本发明实施例提供一种用于实现上述银行金融交易风险特征库的建立方法中的全部或部分内容的计算机设备的实施例所述计算机设备具体包含有如下内容:
处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现相关设备之间的信息传输;该计算机设备可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该计算机设备可以参照实施例用于实现银行金融交易风险特征库的建立方法的实施例及用于实现银行金融交易风险特征库的建立装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
图6为本申请实施例的计算机设备1000的系统构成的示意框图。如图6所示,该计算机设备1000可以包括中央处理器1001和存储器1002;存储器1002耦合到中央处理器1001。值得注意的是,该图6是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
一实施例中,银行金融交易风险特征库的建立功能可以被集成到中央处理器1001中。其中,中央处理器1001可以被配置为进行如下控制:
对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据;
基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;
确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系;
根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;
根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库。
在另一个实施方式中,银行金融交易风险特征库的建立装置可以与中央处理器1001分开配置,例如可以将银行金融交易风险特征库的建立装置配置为与中央处理器1001连接的芯片,通过中央处理器的控制来实现银行金融交易风险特征库的建立功能。
如图6所示,该计算机设备1000还可以包括:通信模块1003、输入单元1004、音频处理器1005、显示器1006、电源1007。值得注意的是,计算机设备1000也并不是必须要包括图6中所示的所有部件;此外,计算机设备1000还可以包括图6中没有示出的部件,可以参考现有技术。
如图6所示,中央处理器1001有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器1001接收输入并控制计算机设备1000的各个部件的操作。
其中,存储器1002,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器1001可执行该存储器1002存储的该程序,以实现信息存储或处理等。
输入单元1004向中央处理器1001提供输入。该输入单元1004例如为按键或触摸输入装置。电源1007用于向计算机设备1000提供电力。显示器1006用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器1002可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器1002还可以是某种其它类型的装置。存储器1002包括缓冲存储器1021(有时被称为缓冲器)。存储器1002可以包括应用/功能存储部1022,该应用/功能存储部1022用于存储应用程序和功能程序或用于通过中央处理器1001执行计算机设备1000的操作的流程。
存储器1002还可以包括数据存储部1023,该数据存储部1023用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由计算机设备使用的数据。存储器1002的驱动程序存储部1024可以包括计算机设备的用于通信功能和/或用于执行计算机设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块1003即为经由天线1008发送和接收信号的发送机/接收机1003。通信模块(发送机/接收机)1003耦合到中央处理器1001,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一计算机设备中,可以设置有多个通信模块1003,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)1003还经由音频处理器1005耦合到扬声器1009和麦克风1010,以经由扬声器1009提供音频输出,并接收来自麦克风1010的音频输入,从而实现通常的电信功能。音频处理器1005可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器1005还耦合到中央处理器1001,从而使得可以通过麦克风1010能够在本机上录音,且使得可以通过扬声器1009来播放本机上存储的声音。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述银行金融交易风险特征库的建立方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述银行金融交易风险特征库的建立方法。
本发明实施例中,对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据;基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系;根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库,与现有技术中使用银行金融交易风险特征均需对特征重新创建的技术方案相比,通过建立银行金融交易风险特征库,不仅可以能够自动化立银行金融交易风险特征,提升了银行金融交易风险特征的生成效率,为数据分析工作的开展提供新的思路,还可为不同的银行金融交易风险特征应用场景提供数据库支持,提升了银行金融交易风险特征的复用性,进而提升了银行金融交易风险特征的多场景适用性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种银行金融交易风险特征库的建立方法,其特征在于,包括:
对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据;
基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;
确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系;
根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;
根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库。
2.如权利要求1所述的方法,其特征在于,基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征,包括:
根据处理后的不同银行客户的历史金融交易数据进行,建立历史金融交易数据的多个实体集;所述实体集包括每一实体的属性信息;所述实体包括不同客户的客户基本信息和客户基础行为信息;所述属性信息包括实体的名称信息、索引信息和时间戳信息;
基于Featuretools技术,根据建立的所述多个实体集进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;
对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征。
3.如权利要求2所述的方法,其特征在于,不同银行客户的历史金融交易数据包括:不同银行客户的客户基本信息和客户基础行为信息;所述客户基本信息包括客户年龄信息、客户性别信息、客户职业信息、客户的关联人和干系人信息以及客户账户信息的其中之一或任意组合;所述客户基础行为信息包括客户历史动态行为信息,客户账户变更行为信息、客户渠道登陆行为信息、客户历史交易行为信息、以及客户取现行为信息的其中之一或任意组合。
4.如权利要求1所述的方法,其特征在于,还包括:
基于预设置的对应不同数据库所在层级的标识、和预设置的位于不同数据库所在层级的银行金融交易风险特征的标识,对所述银行金融交易风险特征库进行标识的编码。
5.如权利要求1所述的方法,其特征在于,还包括:
持续接收不同银行客户的历史金融交易数据;
对持续接收的不同银行客户的历史金融交易数据进行上述基于自动特征工程技术得到对应历史金融交易数据的多个银行金融交易风险特征的步骤,得到多个银行金融交易风险特征的更新数据;
以所述多个银行金融交易风险特征的更新数据,对建立的银行金融交易风险特征库进行数据库的更新处理。
6.如权利要求1所述的方法,其特征在于,还包括:
对所述多个银行金融交易风险特征进行重复特征的筛查处理,得到筛查处理后的多个银行金融交易风险特征;
确定不同银行金融交易风险特征之间的关联关系,包括:
确定筛查处理后的多个银行金融交易风险特征之间的关联关系。
7.如权利要求1所述的方法,其特征在于,还包括:
接收对银行金融交易风险特征库的特征调用指令;
响应于所述特征调用指令,确定所述特征调用指令对应的待调用特征的目标层级,并反馈所述目标层级对应的特征数据。
8.一种银行金融交易风险特征库的建立装置,其特征在于,包括:
交易数据处理模块,用于对不同银行客户的历史金融交易数据进行缺失值处理和异常值处理,得到处理后的不同银行客户的历史金融交易数据;
自动特征工程模块,用于基于自动特征工程技术,对处理后的不同银行客户的历史金融交易数据进行特征生成处理和特征选择处理,得到对应历史金融交易数据的多个银行金融交易风险特征;
特征关联关系确定模块,用于确定不同银行金融交易风险特征之间的关联关系;所述关联关系用于描述特征之间的从属关系;
特征的数据库所在层级确定模块,用于根据所述关联关系,确定不同银行金融交易风险特征的数据库所在层级;
银行金融交易风险特征库构建模块,用于根据位于不同数据库所在层级的银行金融交易风险特征,建立银行金融交易风险特征库。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一所述方法。
11.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一所述方法。
CN202311634977.4A 2023-11-30 2023-11-30 银行金融交易风险特征库的建立方法及装置 Pending CN117974280A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311634977.4A CN117974280A (zh) 2023-11-30 2023-11-30 银行金融交易风险特征库的建立方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311634977.4A CN117974280A (zh) 2023-11-30 2023-11-30 银行金融交易风险特征库的建立方法及装置

Publications (1)

Publication Number Publication Date
CN117974280A true CN117974280A (zh) 2024-05-03

Family

ID=90854342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311634977.4A Pending CN117974280A (zh) 2023-11-30 2023-11-30 银行金融交易风险特征库的建立方法及装置

Country Status (1)

Country Link
CN (1) CN117974280A (zh)

Similar Documents

Publication Publication Date Title
CN106681739B (zh) 一种智能合约的自动化生成方法
CN107886414B (zh) 一种订单合并方法和设备以及计算机存储介质
CN106557307B (zh) 业务数据的处理方法及处理系统
CN113242159B (zh) 应用访问关系确定方法及装置
CN113110995B (zh) 系统迁移的测试方法及装置
CN112799943B (zh) 业务系统自动化测试方法及装置
CN111435367A (zh) 知识图谱的构建方法、系统、设备及存储介质
CN117974280A (zh) 银行金融交易风险特征库的建立方法及装置
CN114841267B (zh) 实时预测方法、装置、电子设备及计算机程序产品
CN111367819A (zh) 代码扫描过滤方法及装置
CN113515447B (zh) 系统自动化测试方法及装置
CN111859041B (zh) 数据报送方法及装置
CN113419957A (zh) 基于规则的大数据离线批处理性能容量扫描方法及装置
CN113590447A (zh) 埋点处理方法和装置
CN111782641A (zh) 数据错误修复方法及系统
CN112101810A (zh) 风险事件控制方法、装置及系统
CN113609017A (zh) 接口测试案例生成方法及装置
CN114302431B (zh) 网元配置方法、装置、电子设备及存储介质
CN112116617B (zh) 不规则物体阴影检测方法及装置
CN113298538B (zh) 客服数据的处理方法及装置
CN112860655B (zh) 可视化知识模型构建方法及装置
CN116880806A (zh) 一种基于产品驱动的页面切片装配方法及系统
CN113590594A (zh) 银行数据库迁移方法及装置
CN115834773A (zh) 基于automl框架的外呼接通率提升方法和装置
CN113076098A (zh) 总账数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination