CN109002988B - 风险旅客流量预测方法、装置、计算机设备和存储介质 - Google Patents
风险旅客流量预测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN109002988B CN109002988B CN201810791448.8A CN201810791448A CN109002988B CN 109002988 B CN109002988 B CN 109002988B CN 201810791448 A CN201810791448 A CN 201810791448A CN 109002988 B CN109002988 B CN 109002988B
- Authority
- CN
- China
- Prior art keywords
- risk
- passenger flow
- model
- data
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000000694 effects Effects 0.000 claims abstract description 81
- 238000012502 risk assessment Methods 0.000 claims abstract description 55
- 238000012300 Sequence Analysis Methods 0.000 claims description 43
- 238000003066 decision tree Methods 0.000 claims description 39
- 238000005311 autocorrelation function Methods 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 35
- 238000004590 computer program Methods 0.000 claims description 25
- 238000013507 mapping Methods 0.000 claims description 25
- 238000012360 testing method Methods 0.000 claims description 24
- 238000012795 verification Methods 0.000 claims description 16
- 241001123248 Arma Species 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 claims description 10
- 230000006641 stabilisation Effects 0.000 claims description 9
- 238000011105 stabilization Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 description 9
- 230000011218 segmentation Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 6
- 238000013210 evaluation model Methods 0.000 description 6
- 238000007689 inspection Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000013112 stability test Methods 0.000 description 4
- 239000003086 colorant Substances 0.000 description 3
- 230000000087 stabilizing effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012731 temporal analysis Methods 0.000 description 2
- 238000000700 time series analysis Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012932 thermodynamic analysis Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
- G06Q50/265—Personal security, identity or safety
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种风险旅客流量预测方法、装置、计算机设备和存储介质。所述方法包括:获取旅客的身份数据,从身份数据中提取身份特征参数;查找身份特征参数对应的历史核查数据,从历史核查数据中提取核查时间参数;将身份特征参数和核查时间参数输入预设风险评估模型得到旅客风险概率;获取预设风险概率阈值,统计旅客风险概率大于预设风险概率阈值的当前旅客流量;获取历史风险旅客流量和预设风险旅客流量预测模型;根据当前旅客流量、历史风险旅客流量和预设风险旅客流量预测模型计算得到预估风险旅客流量。采用本方法能够提高安防效果。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种风险旅客流量预测方法、装置、计算机设备和存储介质。
背景技术
机场、口岸等出入境场所每天都会大量旅客通关,其中不乏一些走私客、偷渡客等具有安全风险的人员混入其中。
出入境场所需要安排安防安检人员对旅客的潜在安全风险进行检查。但是,目前每天可能出现的具有安全风险人员的数量无法预计,经常会出现安防人力不足导致风险人员漏检,或者安防人力过多造成人力资源浪费的情况,从而导致安防效果不佳。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高安防效果的风险旅客流量预测方法、装置、计算机设备和存储介质。
一种风险旅客流量预测方法,所述方法包括:
获取旅客的身份数据,从所述身份数据中提取身份特征参数;
查找所述身份特征参数对应的历史核查数据,从所述历史核查数据中提取核查时间参数;
将所述身份特征参数和所述核查时间参数输入预设风险评估模型得到旅客风险概率;
获取预设风险概率阈值,统计所述旅客风险概率大于所述预设风险概率阈值的当前旅客流量;
获取历史风险旅客流量和预设风险旅客流量预测模型;
根据所述当前旅客流量、所述历史风险旅客流量和所述预设风险旅客流量预测模型计算得到预估风险旅客流量。
在其中一个实施例中,所述预设风险评估模型的生成方式,包括:
采集样本数据,将所述样本数据划分为训练集数据和测试集数据;
从所述训练集数据中提取第一特征参数和第一目标类别;
根据所述第一特征参数和所述第一目标类别进行特征信息增益比评估,并根据特征信息增益比评估结果进行特征选择,根据所选择的特征进行分类得到初始决策树风险评估模型,根据所述训练集数据计算所述初始决策树风险评估模型中各分类节点的风险概率;
从所述测试集数据中提取第二特征参数和第二目标类别;
根据所述第二特征参数和所述第二目标类别对所述初始决策树风险评估模中各分类节点的风险概率进行验证,根据验证结果对所述初始决策树风险评估模进行调整并生成预设风险评估模型。
在其中一个实施例中,所述预设风险旅客流量预测模型的生成方式,包括:
从所述历史风险旅客流量中提取风险人数序列;
对所述风险人数序列进行平稳化处理得到平稳人数序列;
计算所述平稳人数序列的自相关函数和偏自相关函数,根据所述自相关函数和所述偏自相关函数进行时间序列分析模型识别;
当识别出的时间序列分析模型为ARMA模型时,对所述时间序列分析模型进行参数估计得到估计参数,对所述时间序列分析模型进行模型定阶得到模型阶次;
根据所述时间序列分析模型、所述估计参数和所述模型阶次构建预设风险旅客流量预测模型。
在其中一个实施例中,所述根据所述当前旅客流量、所述历史风险旅客流量和所述预设风险旅客流量预测模型计算得到预估风险旅客流量,包括:
将所述当前旅客流量和所述历史风险旅客流量输入预设风险旅客流量预测模型得到预估平稳人数;
获取所述预设风险旅客流量预测模型对应的平稳化处理的差分次数;
根据所述预估平稳人数和所述差分次数计算预估风险旅客流量。
在其中一个实施例中,方法还包括:
获取预设风险活跃等级映射数据;
分别从所述预设风险活跃等级映射数据中查找所述历史风险旅客流量对应的第一风险活跃等级、所述当前旅客流量对应的第二风险活跃等级及所述预估风险旅客流量对应的第三风险活跃等级;
根据所述第一风险活跃等级、所述第二风险活跃等级及所述第三风险活跃等级生成风险热力趋势图并输出。
在其中一个实施例中,方法还包括:
查找所述预估风险旅客流量对应的安防人力;
根据所述预估风险旅客流量和所述安防人力生成安防部署规则,将所述安防部署规则发送至安防终端。
一种风险旅客流量预测装置,所述装置包括:
身份参数提取模块,用于获取旅客的身份数据,从所述身份数据中提取身份特征参数;
时间参数提取模块,用于查找所述身份特征参数对应的历史核查数据,从所述历史核查数据中提取核查时间参数;
风险概率计算模块,用于所述身份特征参数和所述核查时间参数输入预设风险评估模型得到旅客风险概率;
旅客流量统计模块,用于获取预设风险概率阈值,统计所述旅客风险概率大于所述预设风险概率阈值的当前旅客流量;
数据获取模块,用于获取历史风险旅客流量和预设风险旅客流量预测模型;
预估流量计算模块,用于根据所述当前旅客流量、所述历史风险旅客流量和所述预设风险旅客流量预测模型计算得到预估风险旅客流量。
在其中一个实施例中,装置还包括:
风险序列提取模块,用于从所述历史风险旅客流量中提取风险人数序列;
平稳处理模块,用于对所述风险人数序列进行平稳化处理得到平稳人数序列;
模型识别模块,用于计算所述平稳人数序列的自相关函数和偏自相关函数,根据所述自相关函数和所述偏自相关函数进行时间序列分析模型识别;
模型特征获取模块,用于当识别出的时间序列分析模型为ARMA模型时,对所述时间序列分析模型进行参数估计得到估计参数,对所述时间序列分析模型进行模型定阶得到模型阶次;
流量模型构建模块,用于根据所述时间序列分析模型、所述估计参数和所述模型阶次构建预设风险旅客流量预测模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
上述风险旅客流量预测方法、装置、计算机设备和存储介质,从获取的旅客身份数据中提取出身份特征参数,并查找与提取的身份特征参数对应的历史核查数据,预先设定风险评估模型,将身份特征参数和对应的历史核查数据输入预设风险评估模型能够得到旅客的风险概率,从而能够根据旅客特征和历史数据对旅客的安全风险进行科学地计算评估,统计出风险概率超过预设阈值的当前旅客流量,根据统计出的当前旅客流量和历史风险流量对以后的风险旅客流量进行预测,从而可以根据预测结果进行更有效的安防部署。
附图说明
图1为一个实施例中风险旅客流量预测方法的应用场景图;
图2为一个实施例中风险旅客流量预测方法的流程示意图;
图3为一个实施例中预设风险旅客流量预测模型生成方式的流程示意图;
图4为一个实施例中风险旅客流量预测装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以释义本申请,并不用于限定本申请。
本申请提供的风险旅客流量预测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104接收终端102发送的旅客的身份数据,从身份数据中提取身份特征参数;查找身份特征参数对应的历史核查数据,从历史核查数据中提取核查时间参数;将身份特征参数和核查时间参数输入预设风险评估模型得到旅客风险;获取预设风险概率阈值,统计旅客风险概率大于预设风险概率阈值的当前旅客流量;获取历史风险旅客流量和预设风险旅客流量预测模型;根据当前旅客流量、历史风险旅客流量和预设风险旅客流量预测模型计算得到预估风险旅客流量,服务器104将计算得到的预估风险旅客流量返回给终端102。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种风险旅客流量预测方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
步骤210,获取旅客的身份数据,从身份数据中提取身份特征参数。
旅客的身份数据为可以唯一确定旅客身份的数据,如身份证、签证、学生证等身份证件的证件类别、证件号码等。
安防终端的工作人员可以通过身份信息采集设备如刷卡机等采集被安检的旅客的旅客身份数据,身份信息采集设备将采集的旅客的身份数据传输给安防终端,工作人员也可以在安防终端录入旅客身份数据。安防终端将获取的身份数据发送给服务器,服务器接收安防终端发送的身份数据。
身份特征参数为用于表征旅客特征的参数,身份特征参数可以包括旅客年龄、旅客籍贯、旅客性别等参数。身份数据中包括旅客的特征参数,服务器从接收的身份数据中提取身份特征参数。
在一个实施例中,服务器从身份数据中提取身份特征参数的步骤可以包括:从身份数据中提取证件号码;对证件号码进行证件格式识别,查找与格式识别结果对应的证件类型;根据证件类型对证件号码进行分词得到分词字符串;查找与各分词字符串对应的身份特征参数。
服务器从身份数据中提取证件号码。服务器对证件号码进行证件格式识别,识别出证件号码的号码长度、字母数字组成情况等证件格式。证件类型与证件格式的映射关系事先存储在服务器中,服务器查找与识别出的证件格式对应的证件类型,在实施例中,证件类别可以包括身份证、通行证、回乡证、护照等类别。
不同证件类型的证件号码中预设位置的字符串对应于某项身份特征参数,服务器获取证件类型对应的字符串预设位置和预设长度,根据字符串预设位置和预设长度对证件号码进行分词,得到分词字符串。服务器获取与证件类型对应的各预设字符串的数据转换表,数据转换表中存储了各预设字符串的具体字符串取值与身份特征参数的对应关系。服务器从数据转换表中查找与各分词字符串对应的身份特征参数。
如证件类型为身份证,对身份证号码分词后,身份证号码的前三位为一个分词字符串,并且身份证号码前三位对应的身份特征为旅客籍贯,服务器获取身份证号码前三位对应的数据转换表,如身份证号码前三位为“410”,从数据转换表中查找到的与“410”对应的旅客籍贯参数为“河南”。采用上述方法,服务器查找与所有分词字符串对应的身份特征参数。
步骤220,查找身份特征参数对应的历史核查数据,从历史核查数据中提取核查时间参数。
历史核查数据为旅客进行安全检查的历史记录数据,历史记录数据可以包括旅客历次进行安全检查时的安检时间、安检结果等数据。服务器根据旅客身份数据中的证件号码查找与旅客对应的历史核查数据。
核查时间参数可以包括旅客进出该安检场所进行安全检查的频率、每次进行安全检查的时间段,当前安检时刻所属的时间段等参数,具体地,可以将安全检查的频率设定为每日安检频率、每周安检频率及每月安检频率等,安全检查的频率可以由工作人员根据实际安检需求进行具体设定。服务器对历史核查数据进行数据统计,从中统计出各项核查时间参数
步骤230,将身份特征参数和核查时间参数输入预设风险评估模型得到旅客风险概率。
服务器获取预设风险评估模型,预设风险评估模型为预先设定的对旅客安全风险进行评估的模型。预设风险评估模型的输入为各项身份特征参数和核查时间参数,输出为旅客存在安全风险的概率。服务器将提取出的各项身份特征参数和核查时间参数输入预设风险评估模型,预设风险评估模型对各项参数进行运算处理后得到旅客风险概率。
步骤240,获取预设风险概率阈值,统计旅客风险概率大于预设风险概率阈值的当前旅客流量。
服务器获取事先存储的预设风险概率阈值,预设风险概率阈值为能够判定旅客具有安全风险的风险概率的最小值。
当前旅客流量为当前时间段内被判定为具有安全风险的旅客的总人数。当前时间段可以设定为2个小时、6个小时、1天等较短的时间范围,也可以设定为半个月、1个月等较长的时间范围,当前时间段具体根据安防人员的安防预测需求进行设置。
服务器将计算出的当前时间段内的旅客的旅客风险概率与预设风险概率阈值进行比较,统计出当前时间段内旅客风险概率大于预设风险概率阈值的旅客的总人数,将统计出的总人数作为当前旅客流量。
步骤250,获取历史风险旅客流量和预设风险旅客流量预测模型。
服务器获取已存储的历史风险旅客流量,历史风险旅客流量数据为历史时间段具有安全风险的旅客的人数,历史风险旅客流量可以包括多个连续的历史时间段的风险旅客流量数据,历史时间段的时间范围长度与当前时间段的时间范围长度一致,如设定为2个小时、6个小时、1天等较短的时间范围,也可以设定为半个月、1个月等较长的时间范围等。预设风险旅客流量预测模型为事先构建的对未来时间段内的风险旅客人数进行预测的计算模型,服务器获取事先存储的预设风险旅客流量预测模型。
步骤260,根据当前旅客流量、历史风险旅客流量和预设风险旅客流量预测模型计算得到预估风险旅客流量。
假设当前时间段为t,历史风险旅客流量包含t-1、t-2、t-3……t-n共n个时间段的风险旅客流量,服务器根据预设风险旅客流量预测模型对当前旅客流量及历史风险旅客流量共n+1个时间段的风险旅客流量进行运算处理,计算得到下一时间段t+1时间段的预估风险旅客流量,再得到t+1时间段的预估风险旅客流量后,还可以采用上述方法计算得到t+2、t+3等时间段的预估风险旅客流量。服务器可以将计算得到的预估风险旅客流量返回给安防终端,从而使得安防场所的工作人员能够根据预测结果对未来时间段内的安防人力进行合理部署。
上述风险旅客流量预测方法中,服务器从获取的旅客身份数据中提取出身份特征参数,并查找与提取的身份特征参数对应的历史核查数据,预先设定风险评估模型,将身份特征参数和对应的历史核查数据输入预设风险评估模型能够得到旅客的风险概率,从而能够根据旅客特征和历史数据对旅客的安全风险进行科学地计算评估,统计出风险概率超过预设阈值的当前旅客流量,根据统计出的当前旅客流量和历史风险流量对以后的风险旅客流量进行预测,从而可以根据预测结果进行更有效的安防部署。
在一个实施例中,预设风险评估模型的生成方式可以包括:采集样本数据,将样本数据划分为训练集数据和测试集数据;从训练集数据中提取第一特征参数和第一目标类别;根据第一特征参数和第一目标类别进行特征信息增益比评估,并根据特征信息增益比评估结果进行特征选择,根据所选择的特征进行分类得到初始决策树风险评估模型,根据训练集数据计算初始决策树风险评估模型中各分类节点的风险概率;从测试集数据中提取第二特征参数和第二目标类别;根据第二特征参数和第二目标类别对初始决策树风险评估模中各分类节点的风险概率进行验证,根据验证结果对初始决策树风险评估模进行调整并生成预设风险评估模型。
样本数据为真实的安防场所进行安全检查的历史数据,服务器采集预设时间范围内的历史安检数据,预设时间范围可以设定为1个月、3个月、半年等,服务器将采集的样本数据进行随机划分,划分为训练集数据和测试集数据,训练集数据和测试集数据中包含的样本数量可以相同也可以不同。
根据安全检查的检查结果可以将样本数据分为正样本数据和负样本数据,正样本数据为检查结果为正常的旅客的历史安检数据,负样本数据为检查结果为异常的旅客的历史安检数据。训练集数据中和测试集数据中均既包含正样本数据和负样本数据。
服务器从训练集数据的各个样本中逐个提取出第一特征参数和第一目标类别。其中,第一特征参数包括身份特征参数和核查时间参数,即第一特征参数与实际安检中从旅客身份数据中提取的身份特征参数及从旅客历史核查数据中提取的核查时间参数相对应。第一目标类别为安全检查结果的类别,第一目标类别分为安检正常和安检异常两类。
在本实施例中,构建的预设风险评估模型为决策树模型。决策树是一种由节点和有向边组成的用于对实例进行分类的树形结构,节点的类型有两种:内部节点和叶子节点。其中,内部节点表示特征或属性的测试条件,叶子节点表示分类。使用决策树模型进行分类的具体方法是:从根节点开始,对实例的某一特征进行测试,根据测试结果将实例分配到其子节点。沿该分支可能达到叶子节点或者到达另一个内部节点时,则使用新的测试条件递归执行下去,直到抵达一个叶子节点,当到达叶子节点时,则得到最终分类结果,将叶子节点作为分类节点。
在本实施例中,采用C4.5算法构建初始决策树风险评估模型,C4.5算法是对各特征进行信息增益比评估,每次选择信息增益比最大的特征参数作为判断模块建立子节点。服务器计算出第一特征参数对应的各特征的信息增益比,选取信息增益比最大的特征作为判断模块建立子节点,将子节点对应的训练集数据划分为子集数据,对子集数据以递归方式进行分支建立分支节点,直至所有分支节点对应于相同的第一目标类别为止。
服务器采用下列公式(1)计算第一特征参数对应的各特征的信息增益:
g(D,A)=H(D)-H(D|A) (1)
其中,g(D,A)为特征A对训练数据集D的信息增益,H(D)为训练数据集D的经验熵,H(D|A)为特征A对数据集D的经验条件熵。
具体地,服务器采用下列公式(2)计算训练数据集D的经验熵H(D):
其中,Ck为第一目标类别对应的样本数量,K为第一目标类别的类别数量,在本实施例中,第一目标类别分为安检正常和安检异常两种。
服务器采用下列公式(3)计算特征A对训练数据集D的经验条件熵H(D|A):
其中,value(A)是特征A所有的取值集合,i是特征A的一个取值,Di是训练数据集D中特征A取值为i的样例集合,|Di|表示取值为i的样例集合的样本数量,|D|表示进行样例集合划分前样本的总数量。如性别特征参数对应的特征A所有的取值为男和女,如男可以用0表示,女可以用1表示,value(A)为(0,1)。
服务器采用下列公式(4)计算特征A的分裂信息值:
服务器采用下列公式(5)计算特征A的信息增益比:
服务器采用递归方式建立决策树,当计算出各特征参数的信息增益并进行特征选择后,获取信息增益比最大的特征参数对应的训练集数据子集,并采用相同的方式对训练集数据子集进行特征选择,从而将训练数据集逐步划分为较纯的子集并建立决策树,在建立决策树后,采用后减枝方法对决策树进行剪枝优化得到初始决策树风险评估模型。
服务器构建出初始决策树风险评估模型后,根据训练数据集中各样本的第一特征参数和第一目标类别,从训练数据集中统计出与初始决策树风险评估模型中各分类节点对应的特征参数组合匹配的负样本数据,计算统计的负样本数据在训练数据集中总的负样本数据中所占的比例,将该比例作为中各分类节点的风险概率。
服务器从测试集数据的各个样本中逐个提取出第二特征参数和第二目标类别。其中,第二特征参数包括身份特征参数和核查时间参数,即第二特征参数与实际安检中从旅客身份数据中提取的身份特征参数及从旅客历史核查数据中提取的核查时间参数相对应。第二目标类别为安全检查结果的类别,第二目标类别分为安检正常和安检异常两类。
服务器根据测试数据集中各样本的第二特征参数和第二目标类别,从测试数据集中统计出与初始决策树风险评估模型中各分类节点对应的特征参数组合匹配的负样本数据,计算统计的负样本数据在测试数据集中总的负样本数据中所占的比例,并根据计算出的比例对决策树模型中各分类节点的风险概率进行验证。在验证时,服务器可以设定预设容错误差,当计算出的比例与风险概率的绝对差值小于预设容错误差时,验证通过,当计算出的比例与风险概率的绝对差值大于预设容错误差时,验证不通过。当验证不通过时,服务器可以将测试数据集中的样本数据加入训练数据集中,扩大样本容量对初始决策树风险评估模型进行训练,对初始决策树风险评估模型进行调整后生成预设风险评估模型。
在一个实施例中,如图3所示,预设风险旅客流量预测模型的生成方式可以包括以下步骤:
步骤201:从历史风险旅客流量中提取风险人数序列。
服务器从历史风险旅客流量中提取出各个时间段内的具有安全风险的人数并生成风险人数序列。如t-1、t-2、t-3……t-n共n个时间段的旅客风险人数构成的风险人数序列可以记为序列Y:(Y1、Y2……Yn)。
步骤203:对风险人数序列进行平稳化处理得到平稳人数序列。
服务器得到风险人数序列后,可以通过游程检验法来对风险人数序列进行平稳性检验,判断风险人数序列是否为平稳序列,当判定风险人数序列为平稳序列时,则无需对风险人数序列进行平稳化处理,风险人数序列即为平稳人数序列;当判定风险人数序列为非平稳序列时,服务器对风险人数序列进行差分处理,对经过差分的序列继续进行平稳性检验,当平稳性检验不通过时,继续对差分后的序列进行再一次的差分处理,直至差分处理后的序列通过平稳性检验为止,将最后一次差分处理后的序列作为平稳人数序列,并记录差分处理过程中总的差分次数。
步骤205:计算平稳人数序列的自相关函数和偏自相关函数,根据自相关函数和偏自相关函数进行时间序列分析模型识别。
服务器计算平稳人数序列的ACF(自相关函数,Auto Correlation Function)和PACF(偏自相关函数,Partial autocorrelation function),根据计算出的自相关函数和偏自相关函数判断平稳人数序列所满足的时间序列分析模型的类型,时间序列分析模型的类型可以包括ARMA模型(Auto-Regressive and Moving Average Model)、AR模型(autoregression model)和MA模型(moving average model)等。
步骤207:当识别出的时间序列分析模型为ARMA模型时,对时间序列分析模型进行参数估计得到估计参数,对时间序列分析模型进行模型定阶得到模型阶次。
当服务器识别出平稳人数序列满足的时间序列分析模型为ARMA模型时,服务器可以对ARMA模型中的未知参数进行参数估计,并对模型进行模型定阶。具体地,服务器可以采用样本矩估计法、最小二成估计法或极大似然估计法等估计方法,对ARMA模型中的自回归系数、滑动平均系数以及白噪声方差进行参数估计得到各未知参数的估计参数。
当服务器识别出平稳人数序列满足其他时间序列分析模型如AR模型或MA模型,可以采用识别出的模型类别对应的估计方法确定模型的参数和阶次。
步骤209:根据时间序列分析模型、估计参数和模型阶次构建预设风险旅客流量预测模型。
服务器根据ARMA模型、估计出的模型中的估计模型和模型阶次构建初始风险旅客流量预测模型,在构建出初始风险旅客流量预测模型后,服务器检验初始风险旅客流量预测模型的平稳性、可逆性及模型的残差序列是否为白噪声,若平稳性、可逆性检验不通过,或者残差序列不是白噪声时,则服务器需要重新进行时间序列分析模型的识别并重新构建预设风险旅客流量预测模型,直至构建的模型通过检验为止;当平稳性、可逆性检验通过且残差序列为白噪声时,服务器对初始风险旅客流量预测模型进行检验并优化得到最终的预设风险旅客流量预测模型。
在一个实施例中,服务器构建的ARMA模型的表达式请参见公式(6):
Yt=β0+β1Yt-1+β2Yt-2+……+βpYt-p+εt+α1εt-1+α2εt-2+……+αqεt-q
其中,Yt为预测的下一时间段的预估平稳人数,(Yt-1、Yt-2……Yt-p)为平稳人数序列,(β0、β1……βp)为自回归系数,(α1、α2……αq)为滑动平均系数,(εt、εt-1……εt-q)为白噪声方差。
在一个实施例中,根据当前旅客流量、历史风险旅客流量和预设风险旅客流量预测模型计算得到预估风险旅客流量的步骤可以包括:将当前旅客流量和历史风险旅客流量输入预设风险旅客流量预测模型得到预估平稳人数;获取预设风险旅客流量预测模型对应的平稳化处理的差分次数;根据预估平稳人数和差分次数计算预估风险旅客流量。
服务器根据当前旅客流量和历史风险旅客流量中各个时间段的风险旅客流量生成风险旅客平稳人数序列,将风险旅客平稳人数序列输入预设风险旅客流量预测模型中得到下一时间段的预估平稳人数。服务器获取预设风险旅客流量对应的平稳人数序列经过差分处理的差分次数。服务器将预估平稳人数添加至风险旅客平稳人数序列中生成新的平稳人数序列,并根据差分次数对平稳人数序列进行反向差分运算还原出差分前的风险旅客人数序列,从风险旅客人数序列中获取与预估平稳人数对应的值作为预估风险旅客流量,从而可以估算出下一时间段具有安全风险的旅客人数。
在一个实施例中,风险旅客流量预测方法还可以包括:获取预设风险活跃等级映射数据;分别从预设风险活跃等级映射数据中查找历史风险旅客流量对应的第一风险活跃等级、当前旅客流量对应的第二风险活跃等级及预估风险旅客流量对应的第三风险活跃等级;根据第一风险活跃等级、第二风险活跃等级及第三风险活跃等级生成风险热力趋势图并输出。
服务器获取事先存储的预设风险活跃等级映射数据,预设风险活跃等级映射数据中包括了风险旅客人数与风险活跃等级的对应关系,根据风险旅客人数可以查找到对应的风险活跃等级,例如,可以将风险活跃等级设置为高风险、较高风险、中等风险、低风险等。服务器分别从预设风险活跃等级映射数据中查找与历史风险旅客流量、当前旅客流量和预估风险旅客流量对应的第一风险活跃等级、第二风险活跃等级和第三风险活跃等级。其中,历史风险旅客流量包含多个时间段的风险旅客流量,第一风险活跃等级中也包括与多个时间段对应的风险活跃等级。
服务器中事先存储风险活跃等级与风险热力颜色的映射数据,例如将高风险、较高风险、中等风险、低风险四个风险活跃等级对应的颜色分别设定为红色、橙色、黄色、绿色等,上述等级划分和颜色设置只是用于举例说明,实际应用中不限于此方案。服务器分别查找与第一风险活跃等级、第二风险活跃等级及第三风险活跃等级对应的风险热力颜色,根据第一风险活跃等级、第二风险活跃等级及第三风险活跃等级对应的时间段和风险热力颜色绘制出风险热力趋势图,风险热力趋势图反映具有安全风险的旅客人数的热力变化趋势。服务器将风险热力趋势图返回给安防终端进行展示。
在一个实施例中,服务器可以收集多个安防场所的风险旅客数据,并获取多个安防场所的地理位置,根据安防场所的地理位置和风险活跃等级绘制出风险热力地图,每一个安防场所可以使用对应的热力图标在风险热力地图的相应位置进行展示。服务器可以将生成的风险热力地图发送给安防终端以进行展示,供安防人员进行参考。
风险热力地图中可以设置时间轴,用户可以通过拖动时间轴选择需要查看的时间段的热力分布情况。当安防终端获取用户选择的时间点段时,查找各安防场所相应时间段的风险活跃等级及对应的热力颜色,根据查找到的风险活跃等级、对应的热力颜色和各安防场所的地理位置生成选中时间段的风险热力地图并进行显示。从而用户可以直观地观测到不同时间段风险旅客人数的热力分布情况,实现风险旅客的热力分析和预警可视化。
在一个实施例中,风险旅客流量预测方法还可以包括:查找预估风险旅客流量对应的安防人力;根据预估风险旅客流量和安防人力生成安防部署规则,将安防部署规则发送至安防终端。
服务器事先对风险旅客流量进行区间划分,服务器查找预估风险旅客流量所属的流量区间,服务器获取流量区间与计划部署安防人力的映射数据,从映射数据中查找与所属流量区间对应的计划部署的安防人力。服务器根据查找到的安防人力和预估风险旅客流量生成安防部署规则。具体地,预估风险旅客流量可以包括未来多个时间段的预估结果,服务器查找到未来多个时间段对应的安防人力,根据各时间段的预估结果和对应的安防人力生成各时间段的安防部署计划,对各时段的安防部署计划进行整合生成安防部署规则。服务武器将生成的安防部署规则发送至安防终端。
应该理解的是,虽然图2-3流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种风险旅客流量预测装置,包括:身份参数提取模块410、时间参数提取模块420、风险概率计算模块430、旅客流量统计模块440、数据获取模块450和预估流量计算模块460,其中:
身份参数提取模块410,用于获取旅客的身份数据,从身份数据中提取身份特征参数。
时间参数提取模块420,用于查找身份特征参数对应的历史核查数据,从历史核查数据中提取核查时间参数。
风险概率计算模块430,用于身份特征参数和核查时间参数输入预设风险评估模型得到旅客风险概率。
旅客流量统计模块440,用于获取预设风险概率阈值,统计旅客风险概率大于预设风险概率阈值的当前旅客流量。
数据获取模块450,用于获取历史风险旅客流量和预设风险旅客流量预测模型。
预估流量计算模块460,用于根据当前旅客流量、历史风险旅客流量和预设风险旅客流量预测模型计算得到预估风险旅客流量。
在一个实施例中,装置还可以包括:
数据采集模块,用于采集样本数据,将样本数据划分为训练集数据和测试集数据。
第一数据提取模块,用于从训练集数据中提取第一特征参数和第一目标类别。
初始模型构建模块,用于根据第一特征参数和第一目标类别进行特征信息增益比评估,并根据特征信息增益比评估结果进行特征选择,根据所选择的特征进行分类得到初始决策树风险评估模型,根据训练集数据计算初始决策树风险评估模型中各分类节点的风险概率。
第二数据提取模块,用于从测试集数据中提取第二特征参数和第二目标类别。
风险模型生成模块,用于根据第二特征参数和第二目标类别对初始决策树风险评估模中各分类节点的风险概率进行验证,根据验证结果对初始决策树风险评估模进行调整并生成预设风险评估模型。
在一个实施例中,装置还可以包括:
风险序列提取模块,用于从历史风险旅客流量中提取风险人数序列。
平稳处理模块,用于对风险人数序列进行平稳化处理得到平稳人数序列。
模型识别模块,用于计算平稳人数序列的自相关函数和偏自相关函数,根据自相关函数和偏自相关函数进行时间序列分析模型识别。
模型特征获取模块,用于当识别出的时间序列分析模型为ARMA模型时,对时间序列分析模型进行参数估计得到估计参数,对时间序列分析模型进行模型定阶得到模型阶次。
流量模型构建模块,用于根据时间序列分析模型、估计参数和模型阶次构建预设风险旅客流量预测模型。
在一个实施例中,预估流量计算模块460可以包括:
平稳人数预估模块,用于将当前旅客流量和历史风险旅客流量输入预设风险旅客流量预测模型得到预估平稳人数。
差分次数获取模块,用于获取预设风险旅客流量预测模型对应的平稳化处理的差分次数。
流量预估模块,用于根据预估平稳人数和差分次数计算预估风险旅客流量。
在一个实施例中,装置还可以包括:
等级数据获取模块,用于获取预设风险活跃等级映射数据。
等级查找模块,用于分别从预设风险活跃等级映射数据中查找历史风险旅客流量对应的第一风险活跃等级、当前旅客流量对应的第二风险活跃等级及预估风险旅客流量对应的第三风险活跃等级。
热力图生成模块,用于根据第一风险活跃等级、第二风险活跃等级及第三风险活跃等级生成风险热力趋势图并输出。
在一个实施例中,装置还可以包括:
人力查找模块,用于查找预估风险旅客流量对应的安防人力。
建议生成模块,用于根据预估风险旅客流量和安防人力生成安防部署规则,将安防部署规则发送至安防终端。
关于风险旅客流量预测装置的具体限定可以参见上文中对于风险旅客流量预测方法的限定,在此不再赘述。上述风险旅客流量预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储风险旅客流量预测相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种风险旅客流量预测方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取旅客的身份数据,从身份数据中提取身份特征参数;查找身份特征参数对应的历史核查数据,从历史核查数据中提取核查时间参数;将身份特征参数和核查时间参数输入预设风险评估模型得到旅客风险概率;获取预设风险概率阈值,统计旅客风险概率大于预设风险概率阈值的当前旅客流量;获取历史风险旅客流量和预设风险旅客流量预测模型;根据当前旅客流量、历史风险旅客流量和预设风险旅客流量预测模型计算得到预估风险旅客流量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:采集样本数据,将样本数据划分为训练集数据和测试集数据;从训练集数据中提取第一特征参数和第一目标类别;根据第一特征参数和第一目标类别进行特征信息增益比评估,并根据特征信息增益比评估结果进行特征选择,根据所选择的特征进行分类得到初始决策树风险评估模型,根据训练集数据计算初始决策树风险评估模型中各分类节点的风险概率;从测试集数据中提取第二特征参数和第二目标类别;根据第二特征参数和第二目标类别对初始决策树风险评估模中各分类节点的风险概率进行验证,根据验证结果对初始决策树风险评估模进行调整并生成预设风险评估模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:从历史风险旅客流量中提取风险人数序列;对风险人数序列进行平稳化处理得到平稳人数序列;计算平稳人数序列的自相关函数和偏自相关函数,根据自相关函数和偏自相关函数进行时间序列分析模型识别;当识别出的时间序列分析模型为ARMA模型时,对时间序列分析模型进行参数估计得到估计参数,对时间序列分析模型进行模型定阶得到模型阶次;根据时间序列分析模型、估计参数和模型阶次构建预设风险旅客流量预测模型。
在一个实施例中,处理器执行计算机程序实现根据当前旅客流量、历史风险旅客流量和预设风险旅客流量预测模型计算得到预估风险旅客流量的步骤时还用于:将当前旅客流量和历史风险旅客流量输入预设风险旅客流量预测模型得到预估平稳人数;获取预设风险旅客流量预测模型对应的平稳化处理的差分次数;根据预估平稳人数和差分次数计算预估风险旅客流量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取预设风险活跃等级映射数据;分别从预设风险活跃等级映射数据中查找历史风险旅客流量对应的第一风险活跃等级、当前旅客流量对应的第二风险活跃等级及预估风险旅客流量对应的第三风险活跃等级;根据第一风险活跃等级、第二风险活跃等级及第三风险活跃等级生成风险热力趋势图并输出。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:查找预估风险旅客流量对应的安防人力;根据预估风险旅客流量和安防人力生成安防部署规则,将安防部署规则发送至安防终端。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取旅客的身份数据,从身份数据中提取身份特征参数;查找身份特征参数对应的历史核查数据,从历史核查数据中提取核查时间参数;将身份特征参数和核查时间参数输入预设风险评估模型得到旅客风险概率;获取预设风险概率阈值,统计旅客风险概率大于预设风险概率阈值的当前旅客流量;获取历史风险旅客流量和预设风险旅客流量预测模型;根据当前旅客流量、历史风险旅客流量和预设风险旅客流量预测模型计算得到预估风险旅客流量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:采集样本数据,将样本数据划分为训练集数据和测试集数据;从训练集数据中提取第一特征参数和第一目标类别;根据第一特征参数和第一目标类别进行特征信息增益比评估,并根据特征信息增益比评估结果进行特征选择,根据所选择的特征进行分类得到初始决策树风险评估模型,根据训练集数据计算初始决策树风险评估模型中各分类节点的风险概率;从测试集数据中提取第二特征参数和第二目标类别;根据第二特征参数和第二目标类别对初始决策树风险评估模中各分类节点的风险概率进行验证,根据验证结果对初始决策树风险评估模进行调整并生成预设风险评估模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从历史风险旅客流量中提取风险人数序列;对风险人数序列进行平稳化处理得到平稳人数序列;计算平稳人数序列的自相关函数和偏自相关函数,根据自相关函数和偏自相关函数进行时间序列分析模型识别;当识别出的时间序列分析模型为ARMA模型时,对时间序列分析模型进行参数估计得到估计参数,对时间序列分析模型进行模型定阶得到模型阶次;根据时间序列分析模型、估计参数和模型阶次构建预设风险旅客流量预测模型。
在一个实施例中,计算机程序被处理器执行时实现根据当前旅客流量、历史风险旅客流量和预设风险旅客流量预测模型计算得到预估风险旅客流量的步骤时还用于:将当前旅客流量和历史风险旅客流量输入预设风险旅客流量预测模型得到预估平稳人数;获取预设风险旅客流量预测模型对应的平稳化处理的差分次数;根据预估平稳人数和差分次数计算预估风险旅客流量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取预设风险活跃等级映射数据;分别从预设风险活跃等级映射数据中查找历史风险旅客流量对应的第一风险活跃等级、当前旅客流量对应的第二风险活跃等级及预估风险旅客流量对应的第三风险活跃等级;根据第一风险活跃等级、第二风险活跃等级及第三风险活跃等级生成风险热力趋势图并输出。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:查找预估风险旅客流量对应的安防人力;根据预估风险旅客流量和安防人力生成安防部署规则,将安防部署规则发送至安防终端。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种风险旅客流量预测方法,所述方法包括:
获取旅客的身份数据,从所述身份数据中提取身份特征参数;
查找所述身份特征参数对应的历史核查数据,从所述历史核查数据中提取核查时间参数;
将所述身份特征参数和所述核查时间参数输入预设风险评估模型得到旅客风险概率;
获取预设风险概率阈值,统计所述旅客风险概率大于所述预设风险概率阈值的当前旅客流量;
获取历史风险旅客流量和预设风险旅客流量预测模型;
根据所述当前旅客流量、所述历史风险旅客流量和所述预设风险旅客流量预测模型计算得到预估风险旅客流量;
查找所述预估风险旅客流量所属的流量区间,获取流量区间与计划部署安防人力的映射数据,从所述映射数据中查找与所述预估风险旅客流量所属的流量区间对应的安防人力;
根据所述预估风险旅客流量和所述对应的安防人力生成安防部署规则,将所述安防部署规则发送至安防终端。
2.根据权利要求1所述的方法,其特征在于,所述预设风险评估模型的生成方式,包括:
采集样本数据,将所述样本数据划分为训练集数据和测试集数据;
从所述训练集数据中提取第一特征参数和第一目标类别;
根据所述第一特征参数和所述第一目标类别进行特征信息增益比评估,并根据特征信息增益比评估结果进行特征选择,根据所选择的特征进行分类得到初始决策树风险评估模型,根据所述训练集数据计算所述初始决策树风险评估模型中各分类节点的风险概率;
从所述测试集数据中提取第二特征参数和第二目标类别;
根据所述第二特征参数和所述第二目标类别对所述初始决策树风险评估模中各分类节点的风险概率进行验证,根据验证结果对所述初始决策树风险评估模进行调整并生成预设风险评估模型。
3.根据权利要求1所述的方法,其特征在于,所述预设风险旅客流量预测模型的生成方式,包括:
从所述历史风险旅客流量中提取风险人数序列;
对所述风险人数序列进行平稳化处理得到平稳人数序列;
计算所述平稳人数序列的自相关函数和偏自相关函数,根据所述自相关函数和所述偏自相关函数进行时间序列分析模型识别;
当识别出的时间序列分析模型为ARMA模型时,对所述时间序列分析模型进行参数估计得到估计参数,对所述时间序列分析模型进行模型定阶得到模型阶次;
根据所述时间序列分析模型、所述估计参数和所述模型阶次构建预设风险旅客流量预测模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述当前旅客流量、所述历史风险旅客流量和所述预设风险旅客流量预测模型计算得到预估风险旅客流量,包括:
将所述当前旅客流量和所述历史风险旅客流量输入预设风险旅客流量预测模型得到预估平稳人数;
获取所述预设风险旅客流量预测模型对应的平稳化处理的差分次数;
根据所述预估平稳人数和所述差分次数计算预估风险旅客流量。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取预设风险活跃等级映射数据;
分别从所述预设风险活跃等级映射数据中查找所述历史风险旅客流量对应的第一风险活跃等级、所述当前旅客流量对应的第二风险活跃等级及所述预估风险旅客流量对应的第三风险活跃等级;
根据所述第一风险活跃等级、所述第二风险活跃等级及所述第三风险活跃等级生成风险热力趋势图并输出。
6.一种风险旅客流量预测装置,其特征在于,所述装置包括:
身份参数提取模块,用于获取旅客的身份数据,从所述身份数据中提取身份特征参数;
时间参数提取模块,用于查找所述身份特征参数对应的历史核查数据,从所述历史核查数据中提取核查时间参数;
风险概率计算模块,用于所述身份特征参数和所述核查时间参数输入预设风险评估模型得到旅客风险概率;
旅客流量统计模块,用于获取预设风险概率阈值,统计所述旅客风险概率大于所述预设风险概率阈值的当前旅客流量;
数据获取模块,用于获取历史风险旅客流量和预设风险旅客流量预测模型;
预估流量计算模块,用于根据所述当前旅客流量、所述历史风险旅客流量和所述预设风险旅客流量预测模型计算得到预估风险旅客流量;
人力查找模块,用于查找所述预估风险旅客流量所属的流量区间,获取流量区间与计划部署安防人力的映射数据,从所述映射数据中查找与所述预估风险旅客流量所属的流量区间对应的安防人力;
建议生成模块,用于根据所述预估风险旅客流量和所述对应的安防人力生成安防部署规则,将所述安防部署规则发送至安防终端。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
风险序列提取模块,用于从所述历史风险旅客流量中提取风险人数序列;
平稳处理模块,用于对所述风险人数序列进行平稳化处理得到平稳人数序列;
模型识别模块,用于计算所述平稳人数序列的自相关函数和偏自相关函数,根据所述自相关函数和所述偏自相关函数进行时间序列分析模型识别;
模型特征获取模块,用于当识别出的时间序列分析模型为ARMA模型时,对所述时间序列分析模型进行参数估计得到估计参数,对所述时间序列分析模型进行模型定阶得到模型阶次;
流量模型构建模块,用于根据所述时间序列分析模型、所述估计参数和所述模型阶次构建预设风险旅客流量预测模型。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:等级数据获取模块,用于获取预设风险活跃等级映射数据;
等级查找模块,用于分别从所述预设风险活跃等级映射数据中查找所述历史风险旅客流量对应的第一风险活跃等级、所述当前旅客流量对应的第二风险活跃等级及所述预估风险旅客流量对应的第三风险活跃等级;
热力图生成模块,用于根据所述第一风险活跃等级、所述第二风险活跃等级及所述第三风险活跃等级生成风险热力趋势图并输出。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810791448.8A CN109002988B (zh) | 2018-07-18 | 2018-07-18 | 风险旅客流量预测方法、装置、计算机设备和存储介质 |
PCT/CN2018/105236 WO2020015104A1 (zh) | 2018-07-18 | 2018-09-12 | 风险旅客流量预测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810791448.8A CN109002988B (zh) | 2018-07-18 | 2018-07-18 | 风险旅客流量预测方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109002988A CN109002988A (zh) | 2018-12-14 |
CN109002988B true CN109002988B (zh) | 2023-10-27 |
Family
ID=64600478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810791448.8A Active CN109002988B (zh) | 2018-07-18 | 2018-07-18 | 风险旅客流量预测方法、装置、计算机设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109002988B (zh) |
WO (1) | WO2020015104A1 (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109801491B (zh) * | 2019-01-18 | 2022-09-13 | 深圳壹账通智能科技有限公司 | 基于风险评估的智能导航方法、装置、设备及存储介质 |
CN109858970B (zh) * | 2019-02-02 | 2021-07-02 | 中国银行股份有限公司 | 一种用户行为预测方法、装置及存储介质 |
CN110060094A (zh) * | 2019-03-26 | 2019-07-26 | 上海拍拍贷金融信息服务有限公司 | 客群优劣预估方法及装置、计算机可读存储介质 |
CN110322357A (zh) * | 2019-05-30 | 2019-10-11 | 深圳壹账通智能科技有限公司 | 数据的异常评估方法、装置、计算机设备和介质 |
CN110598995B (zh) * | 2019-08-15 | 2023-08-25 | 中国平安人寿保险股份有限公司 | 智能客户评级方法、装置及计算机可读存储介质 |
CN110443657B (zh) * | 2019-08-19 | 2022-03-18 | 泰康保险集团股份有限公司 | 客户流量数据处理方法、装置、电子设备及可读介质 |
CN113052413A (zh) * | 2019-12-26 | 2021-06-29 | 北京中科闻歌科技股份有限公司 | 一种风险旅客评估方法、装置、终端及计算机可读介质 |
CN111222790B (zh) * | 2020-01-06 | 2022-07-26 | 深圳前海微众银行股份有限公司 | 风险事件发生概率的预测方法、装置、设备及存储介质 |
CN112232652A (zh) * | 2020-10-12 | 2021-01-15 | 中国民航信息网络股份有限公司 | 一种旅客风险等级分类方法、装置、电子设备及存储介质 |
CN113705382B (zh) * | 2021-08-12 | 2024-02-20 | 捻果科技(深圳)有限公司 | 一种用于旅客离机离开航空器的始终时间的自动识别方法 |
CN114898889A (zh) * | 2021-12-15 | 2022-08-12 | 南京行者易智能交通科技有限公司 | 一种基于大数据的聚集性风险控制模型的设计方法 |
CN114429308B (zh) * | 2022-02-08 | 2024-06-07 | 河南鑫安利安全科技股份有限公司 | 一种基于大数据的企业安全风险评估方法及系统 |
CN114611977A (zh) * | 2022-03-23 | 2022-06-10 | 携程旅游网络技术(上海)有限公司 | 航站楼的运行数据检测方法、系统、设备及存储介质 |
CN116978561B (zh) * | 2023-07-17 | 2024-03-22 | 北京师范大学-香港浸会大学联合国际学院 | 一种基于模糊熵的运动风险评估方法、系统、设备及介质 |
CN117240527B (zh) * | 2023-09-06 | 2024-06-25 | 深圳市常行科技有限公司 | 一种网络安全风险防范系统及方法 |
CN117610891B (zh) * | 2024-01-22 | 2024-04-02 | 湖南小翅科技有限公司 | 一种基于大数据的灵活用工接单与风险控制系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101673463A (zh) * | 2009-09-17 | 2010-03-17 | 北京世纪高通科技有限公司 | 一种基于时间序列的交通信息预测方法及装置 |
CN104464291A (zh) * | 2014-12-08 | 2015-03-25 | 杭州智诚惠通科技有限公司 | 一种交通流量预测方法和系统 |
CN107704971A (zh) * | 2017-10-27 | 2018-02-16 | 中航信移动科技有限公司 | 一种实时预测机场安检人数的数据处理方法和装置 |
CN108197616A (zh) * | 2018-03-09 | 2018-06-22 | 广州佳都数据服务有限公司 | 通过可实名注册完成地铁分类安检的方法及系统 |
CN108198116A (zh) * | 2016-12-08 | 2018-06-22 | 同方威视技术股份有限公司 | 用于安检中被检人员分级的方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874951B (zh) * | 2017-02-14 | 2020-12-25 | Tcl科技集团股份有限公司 | 一种旅客关注度评级方法及装置 |
CN107331114B (zh) * | 2017-06-09 | 2019-06-07 | 安徽富煌科技股份有限公司 | 一种基于视频客流计数的人流量预警系统 |
CN108197760A (zh) * | 2018-01-31 | 2018-06-22 | 民航成都电子技术有限责任公司 | 一种空港地面交通旅客流量预测方法 |
-
2018
- 2018-07-18 CN CN201810791448.8A patent/CN109002988B/zh active Active
- 2018-09-12 WO PCT/CN2018/105236 patent/WO2020015104A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101673463A (zh) * | 2009-09-17 | 2010-03-17 | 北京世纪高通科技有限公司 | 一种基于时间序列的交通信息预测方法及装置 |
CN104464291A (zh) * | 2014-12-08 | 2015-03-25 | 杭州智诚惠通科技有限公司 | 一种交通流量预测方法和系统 |
CN108198116A (zh) * | 2016-12-08 | 2018-06-22 | 同方威视技术股份有限公司 | 用于安检中被检人员分级的方法及装置 |
CN107704971A (zh) * | 2017-10-27 | 2018-02-16 | 中航信移动科技有限公司 | 一种实时预测机场安检人数的数据处理方法和装置 |
CN108197616A (zh) * | 2018-03-09 | 2018-06-22 | 广州佳都数据服务有限公司 | 通过可实名注册完成地铁分类安检的方法及系统 |
Non-Patent Citations (1)
Title |
---|
基于旅客分类的机场安检系统研究;赵振武等;综合运输(第03期);第37-41页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109002988A (zh) | 2018-12-14 |
WO2020015104A1 (zh) | 2020-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109002988B (zh) | 风险旅客流量预测方法、装置、计算机设备和存储介质 | |
CN109165840B (zh) | 风险预测处理方法、装置、计算机设备和介质 | |
WO2020015089A1 (zh) | 身份信息风险评定方法、装置、计算机设备和存储介质 | |
CN111177714B (zh) | 异常行为检测方法、装置、计算机设备和存储介质 | |
CN109359669B (zh) | 医保报销异常检测方法、装置、计算机设备和存储介质 | |
CN109829020B (zh) | 地点资源数据推送方法、装置、计算机设备和存储介质 | |
CN109063984B (zh) | 风险旅客方法、装置、计算机设备和存储介质 | |
Abu et al. | Ensemble learning for multidimensional poverty classification | |
CN109886554B (zh) | 违规行为判别方法、装置、计算机设备和存储介质 | |
CN109949154B (zh) | 客户信息分类方法、装置、计算机设备和存储介质 | |
CN109063921B (zh) | 客户风险预警的优化处理方法、装置、计算机设备和介质 | |
US8719191B2 (en) | Training and verification using a correlated boosted entity model | |
CN112132233A (zh) | 一种基于有效影响因子的服刑人员危险行为预测方法及系统 | |
US20170032270A1 (en) | Method for predicting personality trait and device therefor | |
CN109102159B (zh) | 旅客评级模型生成方法、装置、计算机设备和存储介质 | |
CN105677791A (zh) | 用于分析风力发电机组的运行数据的方法和系统 | |
CN111192153B (zh) | 人群关系网络构建方法、装置、计算机设备和存储介质 | |
CN112131277B (zh) | 基于大数据的医疗数据异常分析方法、装置和计算机设备 | |
CN110377846B (zh) | 社交关系挖掘方法、装置、存储介质和计算机设备 | |
CN110647676A (zh) | 基于大数据的兴趣属性挖掘方法、装置和计算机设备 | |
CN109903045B (zh) | 行为轨迹监控方法、装置、计算机设备和介质 | |
CN117151353A (zh) | 一种荔枝虫害智能识别与生态调控方法、系统及介质 | |
Alsayadi et al. | Improving the regression of communities and crime using ensemble of machine learning models | |
CN111259167B (zh) | 用户请求风险识别方法及装置 | |
CN111210158B (zh) | 目标地址确定方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |