[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN111260249A - 一种基于lstm和随机森林混合模型的电力通信业务可靠性评估预测方法及装置 - Google Patents

一种基于lstm和随机森林混合模型的电力通信业务可靠性评估预测方法及装置 Download PDF

Info

Publication number
CN111260249A
CN111260249A CN202010091057.2A CN202010091057A CN111260249A CN 111260249 A CN111260249 A CN 111260249A CN 202010091057 A CN202010091057 A CN 202010091057A CN 111260249 A CN111260249 A CN 111260249A
Authority
CN
China
Prior art keywords
data
power communication
communication service
lstm
random forest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010091057.2A
Other languages
English (en)
Other versions
CN111260249B (zh
Inventor
李石君
赵远
杨济海
李学礼
龚红霞
余伟
余放
李宇轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202010091057.2A priority Critical patent/CN111260249B/zh
Publication of CN111260249A publication Critical patent/CN111260249A/zh
Application granted granted Critical
Publication of CN111260249B publication Critical patent/CN111260249B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法,属于时序分析和分类回归的研究范畴,涉及LSTM,随机森林等技术领域,主要针对通信网络业务记录和业务告警记录,构建LSTM和随机森林混合分类模型,采用Adam优化方法进行模型训练,利用已经训练好的模型进行分类任务。本发明的优点:可以自动从过去十二个月的历史告警记录中学习训练模型,并对接下来一个月的业务可靠性做出评估和预测,提高对低可靠性业务的风险预警,及时预防和止损。

Description

一种基于LSTM和随机森林混合模型的电力通信业务可靠性评 估预测方法及装置
技术领域
本发明涉及时序分析和分类回归技术领域,具体涉及一种基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法及装置。
背景技术
电力通信业务可靠性:电力通信网作为电力系统的专用系统,其承载的通信业务主要是与电力生产、运行相关的通信业务,包括继电保护业务、安全稳定业务、调度自动化业务、调度电话业务、行政电话业务、数据通信业务和通信环境监测业务等。这些业务对通道路由可靠性有特殊要求,通道路由是否可靠会直接影响电力系统的安全稳定运行。因此,针对电力通信业务的可靠性评估和预测是十分必要的。
电力通信管理系统:是作为智能电网重要支撑的电力专用通信网络系统,是总部和省公司“两级部署”,总部、分部、省公司、市县公司“四级应用”的通信管理系统“SG—TMS”。通过标准化规范化的项目建设以及对系统实用化的大力推进,“SG—TMS”已经深度融入数万电力通信专业人员的日常工作中,并且全面采集了数万台设备几年来的建设、运行、管理数据,积累下来的海量电力通信数据和众多外部系统数据、公共数据一同形成了开展大数据分析的基础。
通信网络业务记录:智能电网通信的信息话管理系统中存储了大量的业务记录信息、业务运行状况信息和业务采用的通道信息等,其中既有规范的结构化数据,业务开通时间、运行时间、业务类别等,也有许多半结构化数据。此外,业务类别反应了业务的应用领域,但是电力网络中对业务分配的多变,特别是备用业务通道。业务总是由一个或多个通道组成,而每个通道又由多个站点相互联通。在日常的生产管理中,记录了站点的历史告警记录,包含了告警时间、告警类型、告警恢复时间等信息。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
现有的可靠性评估技术大多根据故障信息或业务重要度,分析评估当前状态下业务的可靠性,对于未来时段内业务可靠性只能给出类似于使用时间越久,可靠性越低的笼统性趋势分析。
也就是说,现有技术中存在预测结果不够精确的技术问题。
发明内容
有鉴于此,本发明提供了一种基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法及装置,用以解决或者至少部分解决现有技术中存在的预测结果不够精确的技术问题。
为了解决上述技术问题,本发明第一方面提供了一种基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法,包括:
S1:获取电力通信业务的历史告警记录信息,对历史告警记录信息进行预处理;
S2:构建LSTM网络模型,利用预处理后的历史告警记录信息对LSTM网络模型进行训练;
S3:利用训练好的LSTM网络模型对待预测的电力通信业务数据进行预测,得到时序预测结果;
S4:获取电力通信业务的基本信息,将预测得到的时序预测结果与电力通信业务的基本信息进行拼接,再对拼接后的数据进行归一化处理;
S5:将归一化处理后的数据输入随机森林模型进行训练,得到训练好的随机森林模型;
S6:利用训练好的随机森林模型对待预测的电力通信业务数据进行预测,得到可靠性评估结果,可靠性评估结果包括预测得到的电力通信业务的告警数量以及发生概率。
在一种实施方式中,S1中对历史告警记录信息进行预处理,包括:对历史告警记录信息进行数据划分、时序序列处理以及标准化处理。
在一种实施方式中,预处理后的历史告警记录信息为时序数据,该时序数据包括特征属性,S2具体包括:
S2.1:构建输入层和输出层,其中输入层的节点数与待输入时序数据的特征属性数相同,输出层的节点数为1,用于输出得到时序预测结果;
S2.2:构建隐含层,其中,隐含层为采用LSTM细胞搭建单层循环神经网络;
S2.3:将预处理后的历史告警记录信息作为训练数据,定义损失函数,采用基于梯度的优化算法对LSTM网络模型进行训练,得到训练好的LSTM网络模型。
在一种实施方式中,S2.3具体包括:
S2.3.1:按照前向传播计算LSTM细胞输出;
S2.3.2:通过反向计算每个LSTM细胞的误差项,按照时间和网络层级两个方向反向传播;再根据相应的误差项,计算每个权重的梯度;
S2.3.3:基于梯度的优化算法更新权重,其中选用平均绝对误差作为误差计算方式,训练过程中的损失函数为:
Figure BDA0002383731330000031
其中,m为训练数据长度,h(xi)为网络模型返回值,yi为样本真实值,设定损失函数最小为优化目标,给定网络初始化seed、学习率η以及训练步长steps,应用Adam优化算法不断更新网络权重,最终得到训练好的LSTM网络模型。
在一种实施方式中,电力通信业务的基本信息包括业务类型、业务带宽、接口类型,S4中将预测得到的时序预测结果与电力通信业务的基本信息进行拼接,再对拼接后的数据进行预处理,包括:
S4.1:将时序预测得到的业务时序数据拼接上业务类型、业务带宽、接口类型等业务基本信息,作为样本的特征属性;
S4.2:对样本进行归一化处理。
在一种实施方式中,S5具体包括:
S5.1:采用随机有放回的抽取样本生成子数据集,
S5.2:分别在生成子数据集上独立地训练各个子决策树,其中,在训练子决策树时,利用特征信息选取最优划分特征,具体为通过基尼系数GINI值来选择最优划分特征,其中,GINI计算公式:
Figure BDA0002383731330000032
其中,T表示样本集合D中包含的样本类别,pi表示该样本占总样本的比例,GINI(D)与样本集合D的纯度成反比;
S5.3:采用袋外错误率进行验证与分析,最终得到训练好的随机森林模型。
在一种实施方式中,所述方法还包括:
对预测得到的电力通信业务的告警数量向量A及输入数据发生概率向量P进行加权求和,得到告警数的期望值s=P·AT
对期望值进行归一化处理,得到最终可靠性评分,归一化处理公式为:
Figure BDA0002383731330000041
其中,score表示最终可靠性评分,min(A)表示告警数量向量的最小值,max(A)表示告警数量向量的最大值。
基于同样的发明构思,本发明第二方面提供了一种基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测装置,包括:
数据预处理模块,用于获取电力通信业务的历史告警记录信息,对历史告警记录信息进行预处理;
LSTM网络模型训练模块,用于构建LSTM网络模型,利用预处理后的历史告警记录信息对LSTM网络模型进行训练;
时序预测模块,用于利用训练好的LSTM网络模型对待预测的电力通信业务数据进行预测,得到时序预测结果;
数据拼接模块,用于获取电力通信业务的基本信息,将预测得到的时序预测结果与电力通信业务的基本信息进行拼接,再对拼接后的数据进行归一化处理;
随机森林模型训练模块,用于将归一化处理后的数据输入随机森林模型进行训练,得到训练好的随机森林模型;
可靠性评估模块,用于利用训练好的随机森林模型对待预测的电力通信业务数据进行预测,得到可靠性评估结果。
基于同样的发明构思,本发明第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现第一方面所述的方法。
基于同样的发明构思,本发明第四方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的方法。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本发明提供的一种基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法,首先利用训练好的LSTM网络模型对待预测的电力通信业务数据进行预测,得到时序预测结果;然后将时序预测结果与业务的基本信息进行拼接,可以将时序性的动态特征与静态特征输入随机森林模型进行训练,从而可以利用训练得到的随机森林模型对待预测的电力通信业务数据进行预测,得到预测的类别以及概率,相比于现有技术中仅能得出使用时间越久,可靠性越低的笼统性趋势分析结果而言,提高了预测的精确性,从而可以提高对低可靠性业务的风险预警,及时预防和止损。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种实施方式中基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法实现流程示意图;
图2为模型验证集结果绘制的折线图;
图3为本发明实施例中基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测装置的结构框图;
图4为本发明实施例中一种计算机可读存储介质的结构框图;
图5为本发明实施例中计算机设备的结构图。
具体实施方式
本发明目的在于提供一种基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法,来预测未来某时刻电力通信业务的告警数及发生概率,从而提高预测的精确性。
本发明的总体发明构思如下:
提供一种基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法,属于时序分析和分类回归的研究范畴,涉及LSTM,随机森林等技术领域,主要针对通信网络业务记录和业务告警记录,构建LSTM和随机森林混合分类模型,采用Adam优化方法进行模型训练,利用已经训练好的模型进行分类任务。本发明的优点:可以自动从过去十二个月的历史告警记录中学习训练模型,并对接下来一个月的业务可靠性做出评估和预测,提高对低可靠性业务的风险预警,及时预防和止损。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本实施例提供了一种基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法,该方法包括:
S1:获取电力通信业务的历史告警记录信息,对历史告警记录信息进行预处理。
具体来说,历史告警记录信息是具备典型时序性的,便于后续通过本发明训练LSTM模型对告警记录数做出时序上的预测,历史告警记录信息可以从数据库中获取。预处理可以是数据划分、标准化等。
S2:构建LSTM网络模型,利用预处理后的历史告警记录信息对LSTM网络模型进行训练。
具体来说,LSTM网络模型,又称长短记忆循环神经网络,是对循环神经网络(RNN)的一种改进,可以避免常规RNN的梯度消失、长期记忆能力不足等问题,在对时序数据分析的应用中有着优异的表现,使得循环神经网络能够真正有效地利用长距离的时序信息。
S3:利用训练好的LSTM网络模型对待预测的电力通信业务数据进行预测,得到时序预测结果。
S4:获取电力通信业务的基本信息,将预测得到的时序预测结果与电力通信业务的基本信息进行拼接,再对拼接后的数据进行归一化处理。
具体来说,该步骤是将LSTM网络模型得到的时序预测结果作为动态特征,电力通信业务的基本信息作为静态特征,为后续对森林随机模型的训练做准备。
S5:将归一化处理后的数据输入随机森林模型进行训练,得到训练好的随机森林模型。
具体来说,训练过程可以采用随机又放回的方式抽取样本生成子数据集。
S6:利用训练好的随机森林模型对待预测的电力通信业务数据进行预测,得到可靠性评估结果,可靠性评估结果包括预测得到的电力通信业务的告警数量以及发生概率。
具体来说,LSTM模型预测结果是利用时序性的预测,模型结果学习了数据在时序性上的动态特征。然后将此预测结果,作为随机森林模型的一个输入特征,和业务的其他静态特征一同训练,最终得到电力业务的告警数量(类别)及输入数据属于该类别的概率向量(发生概率)。
其中,图1为一种实施方式中基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法实现流程示意图,原始故障时间序列即从数据库中获取的历史告警记录信息,其他业务属性即业务类型、业务带宽、接口类型等业务基本信息。
在一种实施方式中,S1中对历史告警记录信息进行预处理,包括:对历史告警记录信息进行数据划分、时序序列处理以及标准化处理。
具体来说,首先基于python读取数据库中的站点历史告警记录信息,并提取其中告警发生在过去十二个月的记录,将其中的告警时间和告警数按照时序数据的形式处理(即时序序列处理)。从数据库中读取业务的通道信息和起终站点,结合SDH时隙交叉表、拓扑基类表和设备表找到业务的路由路径。然后统计得到业务的历史告警数的时序数据形式。
在一种实施方式中,预处理后的历史告警记录信息为时序数据,该时序数据包括特征属性,S2具体包括:
S2.1:构建输入层和输出层,其中输入层的节点数与待输入时序数据的特征属性数相同,输出层的节点数为1,用于输出得到时序预测结果;
S2.2:构建隐含层,其中,隐含层为采用LSTM细胞搭建单层循环神经网络;
S2.3:将预处理后的历史告警记录信息作为训练数据,定义损失函数,采用基于梯度的优化算法对LSTM网络模型进行训练,得到训练好的LSTM网络模型。
具体来说,S2.1中,待输入时序数据转化为向量形式,如下所示:
Di=(x1,x2,…,xM)T,i∈1,2,3...N
其中,M是数据的特征数。Di表示第i个记录的数据,N为输入数据条数即训练样本数。
S2.2中,采用LSTM细胞搭建单层循环神经网络,激活函数采用tanh函数。LSTM细胞包含了输入门、遗忘门、更新细胞状态、输出门等复杂的门结构,将t时刻的输入xt和t-1时刻的输出ht-1进行拼接并输入细胞中计算。依次的前向传播计算公式如下:
ft=σ(Wf·[ht-1,xt]+bf)
it=σ(Wi·[ht-1,xt]+bi)
Figure BDA0002383731330000081
Figure BDA0002383731330000082
ot=σ(Wo·[ht-1,xt]+bo)
ht=ot*tanh(Ct)
S2.3中网络训练主要针对隐含层的权重。
在一种实施方式中,S2.3具体包括:
S2.3.1:按照前向传播计算LSTM细胞输出;
S2.3.2:通过反向计算每个LSTM细胞的误差项,按照时间和网络层级两个方向反向传播;再根据相应的误差项,计算每个权重的梯度;
S2.3.3:基于梯度的优化算法更新权重,其中选用平均绝对误差作为误差计算方式,训练过程中的损失函数为:
Figure BDA0002383731330000083
其中,m为训练数据长度,h(xi)为网络模型返回值,yi为样本真实值,设定损失函数最小为优化目标,给定网络初始化seed、学习率η以及训练步长steps,应用Adam优化算法不断更新网络权重,最终得到训练好的LSTM网络模型。
在一种实施方式中,电力通信业务的基本信息包括业务类型、业务带宽、接口类型,S4中将预测得到的时序预测结果与电力通信业务的基本信息进行拼接,再对拼接后的数据进行预处理,包括:
S4.1:将时序预测得到的业务时序数据拼接上业务类型、业务带宽、接口类型等业务基本信息,作为样本的特征属性;
S4.2:对样本进行归一化处理。
具体来说,对与特征属性中的字符类型属性,如:业务带宽,做数值映射和独热编码。
在一种实施方式中,S5具体包括:
S5.1:采用随机有放回的抽取样本生成子数据集,
S5.2:分别在生成子数据集上独立地训练各个子决策树,其中,在训练子决策树时,利用特征信息选取最优划分特征,具体为通过基尼系数GINI值来选择最优划分特征,其中,GINI计算公式:
Figure BDA0002383731330000091
其中,T表示样本集合D中包含的样本类别,pi表示该样本占总样本的比例,GINI(D)与样本集合D的纯度成反比;
S5.3:采用袋外错误率进行验证与分析,最终得到训练好的随机森林模型。
具体来说,GINI(D)越小样本纯度越高即样本D中包含的类别越少,通过选择可以最大提升样本的纯度的特征进行划分,可以快速合理构建决策树模型。距离来说:以特征A划分样本集D之后得到T个子样本集{D1,D2,...,DT},则
Figure BDA0002383731330000092
其中|D|表示样本总数量,|Di|是生成的子集|Di|的样本数量。GINIi是子集的GINI(Di)值,最优特征选取就是选择使GINI(D,A)最小化的特征进行划分。
此外,若用M表示每个样本的特征维度,则在训练子决策树时,指定一个常数m<<M,随机地从M个特征中选取m个特征子集,每次特征选择时从这m个特征中选择信息增益最大的特征。此时,根据集成学习的bagging(套袋)思想,各个子决策树的训练目标就是可以在各自的特征子集上表现最优,充分拟合特征信息。因此在子决策树训练中不使用剪枝,以提高随机森林模型的抗噪能力,减少过拟合的可能。
S5.3:随机森林模型可以采用袋外错误率,来取代交叉验证以获得误差的无偏估计,其本身就是随机森林泛化误差的一个无偏估计,结果近似于需要大量计算的k折交叉验证。
在一种实施方式中,所述方法还包括:
对预测得到的电力通信业务的告警数量向量A及输入数据发生概率向量P进行加权求和,得到告警数的期望值s=P·AT
对期望值进行归一化处理,得到最终可靠性评分,归一化处理公式为:
Figure BDA0002383731330000101
其中,score表示最终可靠性评分,min(A)表示告警数量向量的最小值,max(A)表示告警数量向量的最大值。
具体来说,对预测结果的意义分析,即计算业务可靠性评分需要将模型预测得到的告警数向量A及其发生概率向量P做加权和得到告警数的期望值s=P·AT,然后代入上式归一化得到最终可靠性评分。
分析模型效用,其中使用过去十二个月份历史告警数据评估预测2018年4月的业务可靠性评分的验证集中的五十个业务,使用真实告警数计算得到的可靠性评分用线条1表示,用模型预测评估得到的可靠性评分用线条2表示,最终结果如附件说明书附图中图2所示。可以看出预测评估的结果可以清晰反应真实结果的变化趋势,可以通过预测评估得到的可靠性评分反应业务的真实可靠性即存在告警的风险。
通过随机森林分类模型可以得到待分析的业务,在未来某时刻可能的告警数A及其发生概率P(也就是归属该类的预测概率)。将得到的告警数和发生概率做加权和,再通过上面的score计算公式得到取值在[0,1]的可靠性评分。评分越接近1,表明业务在未来该时刻越可靠,发生告警的不可靠概率越低。反之,则说明业务性能不够可靠,需要高度关注。
总体来说,本发明的优点,可以自动从过去十二个月的历史告警记录中学习训练模型,并对接下来一个月的业务可靠性做出评估和预测,提高对低可靠性业务的风险预警,及时预防和止损。
实施例二
基于同样的发明构思,本实施例提供了一种基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测装置,请参见图3,该装置包括:
数据预处理模块201,用于获取电力通信业务的历史告警记录信息,对历史告警记录信息进行预处理;
LSTM网络模型训练模块202,用于构建LSTM网络模型,利用预处理后的历史告警记录信息对LSTM网络模型进行训练;
时序预测模块203,用于利用训练好的LSTM网络模型对待预测的电力通信业务数据进行预测,得到时序预测结果;
数据拼接模块204,用于获取电力通信业务的基本信息,将预测得到的时序预测结果与电力通信业务的基本信息进行拼接,再对拼接后的数据进行归一化处理;
随机森林模型训练模块205,用于将归一化处理后的数据输入随机森林模型进行训练,得到训练好的随机森林模型;
可靠性评估模块206,用于利用训练好的随机森林模型对待预测的电力通信业务数据进行预测,得到可靠性评估结果。
由于本发明实施例二所介绍的装置,为实施本发明实施例一中基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法所采用的装置,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的装置都属于本发明所欲保护的范围。
实施例三
请参见图4,基于同一发明构思,本申请还提供了一种计算机可读存储介质300,其上存储有计算机程序311,该程序被执行时实现如实施例一中所述的方法。
由于本发明实施例三所介绍的计算机可读存储介质为实施本发明实施例一中基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法所采用的计算机可读存储介质,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机可读存储介质的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的计算机可读存储介质都属于本发明所欲保护的范围。
实施例四
基于同一发明构思,本申请还提供了一种计算机设备,请参见图5,包括存储401、处理器402及存储在存储器上并可在处理器上运行的计算机程序403,处理器402执行上述程序时实现实施例一中的方法。
由于本发明实施例四所介绍的计算机设备为实施本发明实施例一中基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法所采用的计算机设备,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机设备的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的计算机设备都属于本发明所欲保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测方法,其特征在于,包括:
S1:获取电力通信业务的历史告警记录信息,对历史告警记录信息进行预处理;
S2:构建LSTM网络模型,利用预处理后的历史告警记录信息对LSTM网络模型进行训练;
S3:利用训练好的LSTM网络模型对待预测的电力通信业务数据进行预测,得到时序预测结果;
S4:获取电力通信业务的基本信息,将预测得到的时序预测结果与电力通信业务的基本信息进行拼接,再对拼接后的数据进行归一化处理;
S5:将归一化处理后的数据输入随机森林模型进行训练,得到训练好的随机森林模型;
S6:利用训练好的随机森林模型对待预测的电力通信业务数据进行预测,得到可靠性评估结果,可靠性评估结果包括预测得到的电力通信业务的告警数量以及发生概率。
2.如权利要求1所述的方法,其特征在于,S1中对历史告警记录信息进行预处理,包括:对历史告警记录信息进行数据划分、时序序列处理以及标准化处理。
3.如权利要求1所述的方法,其特征在于,预处理后的历史告警记录信息为时序数据,该时序数据包括特征属性,S2具体包括:
S2.1:构建输入层和输出层,其中输入层的节点数与待输入时序数据的特征属性数相同,输出层的节点数为1,用于输出得到时序预测结果;
S2.2:构建隐含层,其中,隐含层为采用LSTM细胞搭建单层循环神经网络;
S2.3:将预处理后的历史告警记录信息作为训练数据,定义损失函数,采用基于梯度的优化算法对LSTM网络模型进行训练,得到训练好的LSTM网络模型。
4.如权利要求3所述的方法,其特征在于,S2.3具体包括:
S2.3.1:按照前向传播计算LSTM细胞输出;
S2.3.2:通过反向计算每个LSTM细胞的误差项,按照时间和网络层级两个方向反向传播;再根据相应的误差项,计算每个权重的梯度;
S2.3.3:基于梯度的优化算法更新权重,其中选用平均绝对误差作为误差计算方式,训练过程中的损失函数为:
Figure FDA0002383731320000021
其中,m为训练数据长度,h(xi)为网络模型返回值,yi为样本真实值,设定损失函数最小为优化目标,给定网络初始化seed、学习率η以及训练步长steps,应用Adam优化算法不断更新网络权重,最终得到训练好的LSTM网络模型。
5.如权利要求1所述的方法,其特征在于,电力通信业务的基本信息包括业务类型、业务带宽、接口类型,S4中将预测得到的时序预测结果与电力通信业务的基本信息进行拼接,再对拼接后的数据进行预处理,包括:
S4.1:将时序预测得到的业务时序数据拼接上业务类型、业务带宽、接口类型等业务基本信息,作为样本的特征属性;
S4.2:对样本进行归一化处理。
6.如权利要求1所述的方法,其特征在于,S5具体包括:
S5.1:采用随机有放回的抽取样本生成子数据集,
S5.2:分别在生成子数据集上独立地训练各个子决策树,其中,在训练子决策树时,利用特征信息选取最优划分特征,具体为通过基尼系数GINI值来选择最优划分特征,其中,GINI计算公式:
Figure FDA0002383731320000022
其中,T表示样本集合D中包含的样本类别,pi表示该样本占总样本的比例,GINI(D)与样本集合D的纯度成反比;
S5.3:采用袋外错误率进行验证与分析,最终得到训练好的随机森林模型。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
对预测得到的电力通信业务的告警数量向量A及输入数据发生概率向量P进行加权求和,得到告警数的期望值s=P·AT
对期望值进行归一化处理,得到最终可靠性评分,归一化处理公式为:
Figure FDA0002383731320000023
其中,score表示最终可靠性评分,min(A)表示告警数量向量的最小值,max(A)表示告警数量向量的最大值。
8.一种基于LSTM和随机森林混合模型的电力通信业务可靠性评估预测装置,其特征在于,包括:
数据预处理模块,用于获取电力通信业务的历史告警记录信息,对历史告警记录信息进行预处理;
LSTM网络模型训练模块,用于构建LSTM网络模型,利用预处理后的历史告警记录信息对LSTM网络模型进行训练;
时序预测模块,用于利用训练好的LSTM网络模型对待预测的电力通信业务数据进行预测,得到时序预测结果;
数据拼接模块,用于获取电力通信业务的基本信息,将预测得到的时序预测结果与电力通信业务的基本信息进行拼接,再对拼接后的数据进行归一化处理;
随机森林模型训练模块,用于将归一化处理后的数据输入随机森林模型进行训练,得到训练好的随机森林模型;
可靠性评估模块,用于利用训练好的随机森林模型对待预测的电力通信业务数据进行预测,得到可靠性评估结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被执行时实现如权利要求1至7中任一项权利要求所述的方法。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7中任一项权利要求所述的方法。
CN202010091057.2A 2020-02-13 2020-02-13 一种基于lstm和随机森林混合模型的电力通信业务可靠性评估预测方法及装置 Active CN111260249B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010091057.2A CN111260249B (zh) 2020-02-13 2020-02-13 一种基于lstm和随机森林混合模型的电力通信业务可靠性评估预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010091057.2A CN111260249B (zh) 2020-02-13 2020-02-13 一种基于lstm和随机森林混合模型的电力通信业务可靠性评估预测方法及装置

Publications (2)

Publication Number Publication Date
CN111260249A true CN111260249A (zh) 2020-06-09
CN111260249B CN111260249B (zh) 2022-08-05

Family

ID=70945636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010091057.2A Active CN111260249B (zh) 2020-02-13 2020-02-13 一种基于lstm和随机森林混合模型的电力通信业务可靠性评估预测方法及装置

Country Status (1)

Country Link
CN (1) CN111260249B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215696A (zh) * 2020-09-28 2021-01-12 北京大学 基于时序归因分析的个人信用评估与解释方法、装置、设备及存储介质
CN112861093A (zh) * 2021-04-25 2021-05-28 上海派拉软件股份有限公司 访问数据的验证方法、装置、设备及存储介质
CN112966443A (zh) * 2021-03-10 2021-06-15 中国人民解放军海军航空大学 一种基于长短期记忆网络的设备可靠性与性能评估方法
CN113076239A (zh) * 2021-04-12 2021-07-06 西安交通大学 一种高性能计算机用混合神经网络故障预测方法及系统
CN113593703A (zh) * 2021-07-29 2021-11-02 甘肃省人民医院 一种构建压力性损伤风险预测模型的装置及方法
CN113872703A (zh) * 2021-09-16 2021-12-31 国科量子通信网络有限公司 对量子通信网络中多网元数据进行预测的方法及系统
CN113965467A (zh) * 2021-08-30 2022-01-21 国网山东省电力公司信息通信公司 一种基于神经网络的电力通信系统可靠性评估方法及系统
CN114266925A (zh) * 2021-12-30 2022-04-01 华北电力大学 一种基于dlstm-rf的用户窃电检测方法及系统
CN115018111A (zh) * 2022-01-24 2022-09-06 昆明理工大学 融合深度学习和自适应建模机制的风电功率预测方法、系统
CN116702059A (zh) * 2023-06-05 2023-09-05 苏州市联佳精密机械有限公司 一种基于物联网的智能生产车间管理系统
CN116910668A (zh) * 2023-09-11 2023-10-20 国网浙江省电力有限公司余姚市供电公司 一种避雷器故障预警方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107769972A (zh) * 2017-10-25 2018-03-06 武汉大学 一种基于改进的lstm的电力通信网设备故障预测方法
US20180137412A1 (en) * 2016-11-16 2018-05-17 Cisco Technology, Inc. Network traffic prediction using long short term memory neural networks
CN110750641A (zh) * 2019-09-24 2020-02-04 武汉大学 一种基于序列连接模型和二叉树模型的分类纠错方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180137412A1 (en) * 2016-11-16 2018-05-17 Cisco Technology, Inc. Network traffic prediction using long short term memory neural networks
CN107769972A (zh) * 2017-10-25 2018-03-06 武汉大学 一种基于改进的lstm的电力通信网设备故障预测方法
CN110750641A (zh) * 2019-09-24 2020-02-04 武汉大学 一种基于序列连接模型和二叉树模型的分类纠错方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
方勇 等: ""基于LSTM与随机森林混合构架的钓鱼网站识别研究"", 《工程科学与技术》 *
李旭阳 等: ""LSTM与随机森林购买行为预测模型研究"", 《青岛大学学报(工程技术版)》 *
杨济海 等: ""基于并行的F-LSTM模型及其在电力通信设备故障预测中的应用"", 《武汉大学学报(理学版)》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215696A (zh) * 2020-09-28 2021-01-12 北京大学 基于时序归因分析的个人信用评估与解释方法、装置、设备及存储介质
CN112966443B (zh) * 2021-03-10 2022-04-29 中国人民解放军海军航空大学 一种基于长短期记忆网络的设备可靠性与性能评估方法
CN112966443A (zh) * 2021-03-10 2021-06-15 中国人民解放军海军航空大学 一种基于长短期记忆网络的设备可靠性与性能评估方法
CN113076239B (zh) * 2021-04-12 2023-05-23 西安交通大学 一种高性能计算机用混合神经网络故障预测方法及系统
CN113076239A (zh) * 2021-04-12 2021-07-06 西安交通大学 一种高性能计算机用混合神经网络故障预测方法及系统
CN112861093A (zh) * 2021-04-25 2021-05-28 上海派拉软件股份有限公司 访问数据的验证方法、装置、设备及存储介质
CN113593703A (zh) * 2021-07-29 2021-11-02 甘肃省人民医院 一种构建压力性损伤风险预测模型的装置及方法
CN113965467B (zh) * 2021-08-30 2023-10-10 国网山东省电力公司信息通信公司 一种基于神经网络的电力通信系统可靠性评估方法及系统
CN113965467A (zh) * 2021-08-30 2022-01-21 国网山东省电力公司信息通信公司 一种基于神经网络的电力通信系统可靠性评估方法及系统
CN113872703A (zh) * 2021-09-16 2021-12-31 国科量子通信网络有限公司 对量子通信网络中多网元数据进行预测的方法及系统
CN113872703B (zh) * 2021-09-16 2022-09-06 国科量子通信网络有限公司 对量子通信网络中多网元数据进行预测的方法及系统
CN114266925A (zh) * 2021-12-30 2022-04-01 华北电力大学 一种基于dlstm-rf的用户窃电检测方法及系统
CN114266925B (zh) * 2021-12-30 2022-09-30 华北电力大学 一种基于dlstm-rf的用户窃电检测方法及系统
CN115018111A (zh) * 2022-01-24 2022-09-06 昆明理工大学 融合深度学习和自适应建模机制的风电功率预测方法、系统
CN116702059A (zh) * 2023-06-05 2023-09-05 苏州市联佳精密机械有限公司 一种基于物联网的智能生产车间管理系统
CN116702059B (zh) * 2023-06-05 2023-12-19 苏州市联佳精密机械有限公司 一种基于物联网的智能生产车间管理系统
CN116910668A (zh) * 2023-09-11 2023-10-20 国网浙江省电力有限公司余姚市供电公司 一种避雷器故障预警方法、装置、设备及存储介质
CN116910668B (zh) * 2023-09-11 2024-04-02 国网浙江省电力有限公司余姚市供电公司 一种避雷器故障预警方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111260249B (zh) 2022-08-05

Similar Documents

Publication Publication Date Title
CN111260249B (zh) 一种基于lstm和随机森林混合模型的电力通信业务可靠性评估预测方法及装置
CN109767312B (zh) 一种信用评估模型训练、评估方法与装置
CN114220271A (zh) 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质
CN115760484B (zh) 一种配电台区隐患辨识能力提升方法、装置、系统及存储介质
CN111008337B (zh) 一种基于三元特征的深度注意力谣言鉴别方法及装置
US11093864B1 (en) Distributable feature analysis and tree model training system
CN110750641B (zh) 一种基于序列连接模型和二叉树模型的分类纠错方法
US20090089228A1 (en) Generalized reduced error logistic regression method
Syeed et al. Flood prediction using machine learning models
Haggag et al. Infrastructure performance prediction under climate-induced disasters using data analytics
Gowtham Sethupathi et al. Efficient rainfall prediction and analysis using machine learning techniques
CN118393329B (zh) 一种用于测试ai芯片在模型训练和推理表现的系统
CN111145535A (zh) 一种复杂场景下的行程时间可靠性分布预测方法
CN115062686A (zh) 基于多角度特征的多元kpi时序异常检测方法和系统
Alam Recurrent neural networks in electricity load forecasting
CN116862658A (zh) 信用评估方法、装置、电子设备、介质和程序产品
Acula Classification of Disaster Risks in the Philippines using Adaptive Boosting Algorithm with Decision Trees and Support Vector Machine as Based Estimators
Eranga Lstm based framework for time series anomaly detection
Derras et al. Prediction of recovery time of infrastructure functionalities after an earthquake using machine learning
McDonald et al. Open-Source Modeling of Extreme Weather Impact on Distribution Networks
Kendre et al. Traffic Volume Prediction Based on Weather Parameters
CN118447459B (zh) 基于深度学习的滑坡堆积体监控方法及系统
Jodas et al. Urban tree failure probability prediction based on dendrometric aspects and machine learning models
US20240303436A1 (en) Text-based relation extraction method and device
CN113379125B (zh) 一种基于TCN和LightGBM组合模型的物流仓储销售量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant