[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN113282613B - 专变和低压用户用电分析方法、系统、设备及存储介质 - Google Patents

专变和低压用户用电分析方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN113282613B
CN113282613B CN202110411606.4A CN202110411606A CN113282613B CN 113282613 B CN113282613 B CN 113282613B CN 202110411606 A CN202110411606 A CN 202110411606A CN 113282613 B CN113282613 B CN 113282613B
Authority
CN
China
Prior art keywords
vector
user
electricity
self
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110411606.4A
Other languages
English (en)
Other versions
CN113282613A (zh
Inventor
冯小峰
郭文翀
李经儒
阙华坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Measurement Center of Guangdong Power Grid Co Ltd
Original Assignee
Measurement Center of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Measurement Center of Guangdong Power Grid Co Ltd filed Critical Measurement Center of Guangdong Power Grid Co Ltd
Priority to CN202110411606.4A priority Critical patent/CN113282613B/zh
Publication of CN113282613A publication Critical patent/CN113282613A/zh
Application granted granted Critical
Publication of CN113282613B publication Critical patent/CN113282613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/82Energy audits or management systems therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Biomedical Technology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Measurement Of Current Or Voltage (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种专变和低压用户用电分析方法及、系统、设备及存储介质,涉及用电检测技术领域。所述方法包括获取若干历史用电数据;根据历史用电数据训练并堆叠自编码器,输出降维后的用电特征;引入有监督的分类层,对自编码器的参数进行微调;采用基于随机欠采样和重采样的类别不平衡处理方法,得到随机森林分类器;采用随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度。本发明能够结合窃电排查目标,制定更加合理有效的排查策略,以克服现有窃电排查方法费时费力,且精确度不高的问题。

Description

专变和低压用户用电分析方法、系统、设备及存储介质
技术领域
本发明涉及用电检测技术领域,尤其涉及一种专变和低压用户用电分析方法及、系统、设备及存储介质。
背景技术
窃电是指用电客户采取非法的隐蔽手段或者其他违规行为实现其用电量计量比实际使用量偏少的过程。窃电危害甚广,窃电用户私自对电能表改装、对输电线路改接,极易导致电气设备故障、线路短路,甚至导致人员伤亡。窃电行为不仅在数量上规模可观,窃电人群也呈现专业化、多元化,由于窃电主体变化多样,对专变和低压用户用电进行分析是很有必要的。
发明内容
本发明目的在于,提供一种专变和低压用户用电分析方法及、系统、设备及存储介质,结合窃电排查目标,制定更加合理有效的排查策略,以克服现有窃电排查方法费时费力,且精确度不高的问题。
为实现上述目的,本发明实施例提供一种专变和低压用户用电分析方法,包括:
获取若干历史用电数据;其中,所述历史用电数据包括窃电用户的用电数据和正常用户的用电数据;
根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征;
引入有监督的分类层,对所述自编码器的参数进行微调;
采用基于随机欠采样和重采样的类别不平衡处理方法,建立n个类别平衡的训练子集,以所述训练子集为输入量,调用随机森林分类算法,对所述训练子集进行训练,得到n个训练完毕的随机森林分类器;
采用所述随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度。
优选地,所述历史用电数据采集的不同用户的用户数据采集的时间相同,且采样跨度大于1周。
优选地,所述根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征,包括:
所述自编码器包括编码阶段和解码阶段,所述编码阶段中,设输入的用户电量集合为X={x1,x2,…,xN},xi∈Rd,Rd为d维的实数向量空间,N为用户个数,xi为用户i的d维电量向量;
自编码器首先将X映射到隐藏层F={f1,f2,…,fN},设隐藏层的神经元个数为m,则fi的表达式为:
fi=s(ω1·xi+b),fi∈Rm
其中,,Rm为m维的实数向量空间,ω1和b分别为编码公式的权重向量和偏差;s为激活函数,包括sigmoid和tanh;电量向量由d维降至m维。
优选地,所述根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征,包括:
所述自编码器包括编码阶段和解码阶段,在解码阶段中,隐藏层F={f1,f2,…,fN}被映射到输出层
Figure SMS_1
表达式为:
Figure SMS_2
其中,
Figure SMS_3
Figure SMS_4
分别为解码公式的权重和偏差,s为激活函数,包括sigmoid和tanh,fi为映射到隐藏层的特征向量,
Figure SMS_5
为输出层的输出重构向量。
优选地,所述根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征,包括:
自编码器在重构输入的同时,提取隐藏层中包含的输入特征,从而实现对原始数据的降维;
将重构过程中的损失函数定义为:
Figure SMS_6
其中,N为用户个数,xi为用户i的d维电量向量,
Figure SMS_7
为输出层的输出重构向量,m为向量的维度,L2为特定常数,ω2为权重向量;第一项
Figure SMS_8
为输入向量和输出向量间的重构误差,第二项
Figure SMS_9
为L2正则范数,用以减小重构过程中的过拟合问题。
优选地,所述采用所述随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度,包括
对所述分类结果进行集成
Figure SMS_10
其中,αk为各个随机森林的集成权重,θ为分类阈值,Hk为各个子分类器的分类结果,s为子分类器的数量,sgn()为符号函数,H为最终的集成分类结果。
本发明实施例还提供一种专变和低压用户用电分析系统,用于实现所述的专变和低压用户用电分析方法,包括:
数据获取模块,用于获取若干历史用电数据;其中,所述历史用电数据包括窃电用户的用电数据和正常用户的用电数据;
用电特征获取模块,用于根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征;
微调模块,用于引入有监督的分类层,对所述自编码器的参数进行微调;
训练模块,用于采用基于随机欠采样和重采样的类别不平衡处理方法,建立n个类别平衡的训练子集,以所述训练子集为输入量,调用随机森林分类算法,对所述训练子集进行训练,得到n个训练完毕的随机森林分类器;
窃电置信度获取模块,用于采用所述随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度。
优选地,所述历史用电数据采集的不同用户的用户数据采集的时间相同,且采样跨度大于1周。
本发明实施例还提供一种计算机终端设备,包括一个或多个处理器和存储器。存储器与所述处理器耦接,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一实施例所述的专变和低压用户用电分析方法。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一实施例所述的专变和低压用户用电分析方法。
与现有技术相比,本发明具有以下有益效果:
本发明基于台区用户的排查结果,分别采集排查出的窃电用户和其他正常用户的历史电表数据,然后提取各用户的用电特征,最后通过基于随机森林的分类算法,识别出未被排查出的潜在窃电用户。
本发明对反窃电研究中固有的类别不平衡问题进行处理,首先通过对正常用户的样本集进行随机欠采样,采样数目与少数用户的样本集一致,得到多个类别平衡的组合样本集,然后考虑各个组合样本集中少数用户样本的一致性,对各组合样本集采取自助采样法进行重采样,符合后续分类算法的数据处理特点。
本发明综合考虑子分类器的分类结果,通过对分类结果的置信度分析,确定实地工作的重点排查对象。采用投票法对各随机森林分类器的分类结果进行组合,最终输出总体的分类置信度,通过对置信度进行分析,只需要重点排查分类结果中的低置信度用户,减轻了实地排查工作量,提高了排查效率。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明某一实施例提供的专变和低压用户用电分析方法的流程示意图;
图2是本发明另一实施例提供的专变和低压用户用电分析方法的流程示意图;
图3是本发明另一实施例提供的专变和低压用户用电分析方法中不平衡样本集处理方法的流程示意图;
图4是本发明某一实施例提供的专变和低压用户用电分析系统的结构示意图;
图5是本发明某一实施例提供的计算机终端设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1为本发明某一实施例提供的专变和低压用户用电分析方法的流程示意图。本实施例提供的专变和低压用户用电分析方法,包括以下步骤:
S110,获取若干历史用电数据。其中,历史用电数据包括窃电用户的用电数据和正常用户的用电数据。
S120,根据历史用电数据训练并堆叠自编码器,输出降维后的用电特征。
S130,引入有监督的分类层,对自编码器的参数进行微调。
S140,采用基于随机欠采样和重采样的类别不平衡处理方法,建立n个类别平衡的训练子集,以训练子集为输入量,调用随机森林分类算法,对训练子集进行训练,得到n个训练完毕的随机森林分类器。
S150,采用随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度。
可选的实施方式中,历史用电数据采集的不同用户的用户数据采集的时间相同,而对于其采样跨度一般至少为1周。
为了更形象的说明本发明的流程步骤,请参阅图2,图2为本发明另一实施例提供的专变和低压用户用电分析方法的流程示意图。
(1)按照用户户号,获取排查出的窃电用户以及正常用户的历史电表数据。需要获取台区下排查出的窃电用户以及正常用户的历史电表数据,电表数据应具有即时性、丰富性的基本特点,而且各用户的采集时刻应该保持相同,即历史用电数据采集的不同用户的用户数据采集的时间相同,而对于其采样跨度一般至少为1周。
(2)为了提高用电特征对分类算法的适应性,采用堆叠自编码器(stacked autoencoder,SAE)算法,首先通过训练并堆叠各个自编码器,输出降维后的用电特征,然后引入有监督的分类层,对SAE的参数进行微调,提高输出特征对分类算法的适应性;需要基于同台区用户的历史电表,采用堆叠自编码器(stacked auto encoder,SAE)算法,训练并堆叠各个自编码器,输出降维后的用电特征,SAE由多个自编码器(auto encoder,AE)堆叠而成,自编码器主要包括编码和解码两个步骤,与常规神经网络最大的不同之处在于,自编码器关注编码过程,在输出层尽可能还原输入层信息的前提下,提取隐藏层中的编码结果,作为其特征提取的输出结果。
(3)采用基于随机欠采样和重采样的类别不平衡处理方法,建立多个类别平衡的训练子集1~n,保证了子集间的多样性,减小训练过程中的过拟合问题。本实施例中,不平衡样本集处理方法如图3所示,对用户用电特征中的正常用户进行欠采样,输出各个同窃电用户数相同的正常用户子集,然后将各正常用户子集同窃电用户集合进行组合,再从中进行放回式随机采样的重采样方法,建立最终的平衡数据子集。
(4)以n个平衡的训练子集为输入量,调用随机森林分类算法,对各个训练子集进行训练,输出n个训练完毕的随机森林分类器1~n;调用随机森林分类算法对各个训练子集进行训练。
(5)采用训练好的分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,最终输出测试集上各用户的窃电置信度;对于每个随机森林分类器的分类结果进行集成,计算公式为
Figure SMS_11
其中,αk为各个随机森林的集成权重,θ为分类阈值,Hk为各个子分类器的分类结果,s为子分类器的数量,sgn()为符号函数,H为最终的集成分类结果。
获取了输出测试集上各用户的窃电置信度后,可以结合具体的窃电排查目标,制定合理的窃电排查策略。
例如,某台区下的专变用户中窃电用户为50户,正常用户为450户,窃电占比为10%,整理其中典型窃电用户及正常用户的周电表曲线,因为窃电用户相对正常用户的数量较少,因此需要对样本集进行处理,本实施例提出基于欠采样和重采样的不平衡样本集处理方法。能够获得0~1的分类置信度下,各区间内的正常用户和窃电用户的所占比例,以及其中窃电用户的占比情况。
在某一实施例中,需要基于同台区用户的历史电表,采用堆叠自编码器(stackedauto encoder,SAE)算法,训练并堆叠各个自编码器,输出降维后的用电特征,SAE由多个自编码器(auto encoder,AE)堆叠而成。根据历史用电数据训练并堆叠自编码器,输出降维后的用电特征,包括:
自编码器包括编码阶段和解码阶段,编码阶段中,设输入的用户电量集合为X={x1,x2,…,xN},xi∈Rd,Rd为d维的实数向量空间,N为用户个数,xi为用户i的d维电量向量。
自编码器首先将X映射到隐藏层F={f1,f2,…,fN},设隐藏层的神经元个数为m,则fi的表达式为:
fi=s(ω1·xi+b),fi∈Rm
其中,Rm为m维的实数向量空间,ω1和b分别为编码公式的权重向量和偏差。s为激活函数,包括sigmoid和tanh。电量向量由d维降至m维。
在某一实施例中,根据历史用电数据训练并堆叠自编码器,输出降维后的用电特征,包括:
自编码器包括编码阶段和解码阶段,在解码阶段中,隐藏层F={f1,f2,…,fN}被映射到输出层
Figure SMS_12
表达式为:
Figure SMS_13
式中:
Figure SMS_14
Figure SMS_15
分别为解码公式的权重和偏差,s为激活函数,包括sigmoid和tanh,fi为映射到隐藏层的特征向量,
Figure SMS_16
为输出层的输出重构向量。隐藏层的电量特征被还原为d维。
在某一实施例中,根据历史用电数据训练并堆叠自编码器,输出降维后的用电特征,包括:
自编码器在重构输入的同时,提取隐藏层中包含的输入特征,从而实现对原始数据的降维。
将重构过程中的损失函数定义为:
Figure SMS_17
其中,N为用户个数,xi为用户i的d维电量向量,
Figure SMS_18
为输出层的输出重构向量,m为向量的维度,L2为特定常数,ω2为权重向量;第一项
Figure SMS_19
为输入向量和输出向量间的重构误差,第二项
Figure SMS_20
为L2正则范数,用以减小重构过程中的过拟合问题。
在某一实施例中,采用随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度,包括
对分类结果进行集成
Figure SMS_21
其中,αk为各个随机森林的集成权重,θ为分类阈值,Hk为各个子分类器的分类结果,s为子分类器的数量,sgn()为符号函数,H为最终的集成分类结果。
请参阅图4,图4为本发明某一实施例提供的专变和低压用户用电分析系统的结构示意图。在本实施例中与上述实施例相同的部分,在此不再赘述。在本实施例中,专变和低压用户用电分析系统用于实现所述的专变和低压用户用电分析方法,包括:
数据获取模块210,用于获取若干历史用电数据。其中,历史用电数据包括窃电用户的用电数据和正常用户的用电数据,一种可选的实施方式中,历史用电数据采集的不同用户的用户数据采集的时间相同,且采样跨度大于1周。
用电特征获取模块220,用于根据历史用电数据训练并堆叠自编码器,输出降维后的用电特征。
微调模块230,用于引入有监督的分类层,对自编码器的参数进行微调。
训练模块240,用于采用基于随机欠采样和重采样的类别不平衡处理方法,建立n个类别平衡的训练子集,以训练子集为输入量,调用随机森林分类算法,对训练子集进行训练,得到n个训练完毕的随机森林分类器。
窃电置信度获取模块250,用于采用随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度。
请参阅图5,图5为本发明某一实施例提供的计算机终端设备的结构示意图。本实施例提供一种计算机终端设备,包括一个或多个处理器和存储器。存储器与所述处理器耦接,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任意一个实施例中的专变和低压用户用电分析方法。
处理器用于控制该计算机终端设备的整体操作,以完成上述的专变和低压用户用电分析方法的全部或部分步骤。存储器用于存储各种类型的数据以支持在该计算机终端设备的操作,这些数据例如可以包括用于在该计算机终端设备上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-OnlyMemory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-OnlyMemory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
在一示例性实施例中,计算机终端设备可以被一个或多个应用专用集成电路(Application Specific 1ntegrated Circuit,简称AS1C)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的专变和低压用户用电分析方法,并达到如上述方法一致的技术效果。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述任意一个实施例中的专变和低压用户用电分析方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由计算机终端设备的处理器执行以完成上述的专变和低压用户用电分析方法,并达到如上述方法一致的技术效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (6)

1.一种专变和低压用户用电分析方法,其特征在于,包括:
获取若干历史用电数据;其中,所述历史用电数据包括窃电用户的用电数据和正常用户的用电数据;
根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征;
所述自编码器包括编码阶段和解码阶段;
所述编码阶段中,设输入的用户电量集合为X={x1,x2,…,xN},xi∈Rd,Rd为d维的实数向量空间,N为用户个数,xi为用户i的d维电量向量;
自编码器首先将X映射到隐藏层F={f1,f2,…,fN},设隐藏层的神经元个数为m,则fi的表达式为:
fi=s(ω1·xi+b),fi∈Rm
其中,Rm为m维的实数向量空间,ω1和b分别为编码公式的权重向量和偏差;s为激活函数,包括sigmoid和tanh;电量向量由d维降至m维;在解码阶段中,隐藏层F={f1,f2,…,fN}被映射到输出层
Figure FDA0004194335220000011
表达式为:
Figure FDA0004194335220000012
其中,
Figure FDA0004194335220000013
Figure FDA0004194335220000014
分别为解码公式的权重和偏差,s为激活函数,包括sigmoid和tanh,fi为映射到隐藏层的特征向量,
Figure FDA0004194335220000015
为输出层的输出重构向量;
自编码器在重构输入的同时,提取隐藏层中包含的输入特征,从而实现对原始数据的降维;
将重构过程中的损失函数定义为:
Figure FDA0004194335220000016
其中,N为用户个数,xi为用户i的d维电量向量,
Figure FDA0004194335220000017
为输出层的输出重构向量,m为向量的维度,L2为特定常数,ω2为权重向量;第一项
Figure FDA0004194335220000018
为输入向量和输出向量间的重构误差,第二项
Figure FDA0004194335220000019
为L2正则范数,用以减小重构过程中的过拟合问题;
引入有监督的分类层,对所述自编码器的参数进行微调;
采用基于随机欠采样和重采样的类别不平衡处理方法,建立n个类别平衡的训练子集,以所述训练子集为输入量,调用随机森林分类算法,对所述训练子集进行训练,得到n个训练完毕的随机森林分类器;
采用所述随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度;对所述分类结果进行集成
Figure FDA0004194335220000021
其中,αk为各个随机森林的集成权重,θ为分类阈值,Hk为各个子分类器的分类结果,s为子分类器的数量,sgn()为符号函数,H为最终的集成分类结果。
2.根据权利要求1所述的专变和低压用户用电分析方法,其特征在于,所述历史用电数据采集的不同用户的用户数据采集的时间相同,且采样跨度大于1周。
3.一种专变和低压用户用电分析系统,其特征在于,用于实现权利要求1至2任一项所述的专变和低压用户用电分析方法,包括:
数据获取模块,用于获取若干历史用电数据;其中,所述历史用电数据包括窃电用户的用电数据和正常用户的用电数据;
用电特征获取模块,用于根据所述历史用电数据训练并堆叠自编码器,输出降维后的用电特征;
所述自编码器包括编码阶段和解码阶段;
所述编码阶段中,设输入的用户电量集合为X={x1,x2,…,xN},xi∈Rd,Rd为d维的实数向量空间,N为用户个数,xi为用户i的d维电量向量;
自编码器首先将X映射到隐藏层F={f1,f2,…,fN},设隐藏层的神经元个数为m,则fi的表达式为:
fi=s(ω1·xi+b),fi∈Rm
其中,Rm为m维的实数向量空间,ω1和b分别为编码公式的权重向量和偏差;s为激活函数,包括sigmoid和tanh;电量向量由d维降至m维;在解码阶段中,隐藏层F={f1,f2,…,fN}被映射到输出层
Figure FDA0004194335220000031
表达式为:
Figure FDA0004194335220000032
其中,
Figure FDA0004194335220000033
Figure FDA0004194335220000034
分别为解码公式的权重和偏差,s为激活函数,包括sigmoid和tanh,fi为映射到隐藏层的特征向量,
Figure FDA0004194335220000035
为输出层的输出重构向量;
自编码器在重构输入的同时,提取隐藏层中包含的输入特征,从而实现对原始数据的降维;
将重构过程中的损失函数定义为:
Figure FDA0004194335220000036
其中,N为用户个数,xi为用户i的d维电量向量,
Figure FDA0004194335220000037
为输出层的输出重构向量,m为向量的维度,L2为特定常数,ω2为权重向量;第一项
Figure FDA0004194335220000038
为输入向量和输出向量间的重构误差,第二项
Figure FDA0004194335220000039
为L2正则范数,用以减小重构过程中的过拟合问题;
微调模块,用于引入有监督的分类层,对所述自编码器的参数进行微调;
训练模块,用于采用基于随机欠采样和重采样的类别不平衡处理方法,建立n个类别平衡的训练子集,以所述训练子集为输入量,调用随机森林分类算法,对所述训练子集进行训练,得到n个训练完毕的随机森林分类器;
窃电置信度获取模块,用于采用所述随机森林分类器,分别对测试集上的各用户进行分类,通过集成各个分类器的分类结果,输出测试集上各用户的窃电置信度;对所述分类结果进行集成
Figure FDA00041943352200000310
其中,αk为各个随机森林的集成权重,θ为分类阈值,Hk为各个子分类器的分类结果,s为子分类器的数量,sgn()为符号函数,H为最终的集成分类结果。
4.根据权利要求3所述的专变和低压用户用电分析系统,其特征在于,所述历史用电数据采集的不同用户的用户数据采集的时间相同,且采样跨度大于1周。
5.一种计算机终端设备,其特征在于,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至2任一项所述的专变和低压用户用电分析方法。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至2任一项所述的专变和低压用户用电分析方法。
CN202110411606.4A 2021-04-16 2021-04-16 专变和低压用户用电分析方法、系统、设备及存储介质 Active CN113282613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110411606.4A CN113282613B (zh) 2021-04-16 2021-04-16 专变和低压用户用电分析方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110411606.4A CN113282613B (zh) 2021-04-16 2021-04-16 专变和低压用户用电分析方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113282613A CN113282613A (zh) 2021-08-20
CN113282613B true CN113282613B (zh) 2023-05-26

Family

ID=77276729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110411606.4A Active CN113282613B (zh) 2021-04-16 2021-04-16 专变和低压用户用电分析方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113282613B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107492043A (zh) * 2017-09-04 2017-12-19 国网冀北电力有限公司电力科学研究院 窃电分析方法及装置
CN107862347A (zh) * 2017-12-04 2018-03-30 国网山东省电力公司济南供电公司 一种基于随机森林的窃电行为的发现方法
CN109919520A (zh) * 2019-04-08 2019-06-21 四川大学 窃电行为检测方法及装置
CN111861786A (zh) * 2020-06-12 2020-10-30 国网浙江省电力有限公司电力科学研究院 一种基于特征选择和孤立随机森林的专变窃电识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8744172B2 (en) * 2011-06-15 2014-06-03 Siemens Aktiengesellschaft Image processing using random forest classifiers

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107492043A (zh) * 2017-09-04 2017-12-19 国网冀北电力有限公司电力科学研究院 窃电分析方法及装置
CN107862347A (zh) * 2017-12-04 2018-03-30 国网山东省电力公司济南供电公司 一种基于随机森林的窃电行为的发现方法
CN109919520A (zh) * 2019-04-08 2019-06-21 四川大学 窃电行为检测方法及装置
CN111861786A (zh) * 2020-06-12 2020-10-30 国网浙江省电力有限公司电力科学研究院 一种基于特征选择和孤立随机森林的专变窃电识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于台区识别和关联监测加权算法的窃电检测方法;熊霞;陶晓峰;叶方彬;吴竹筠;;计算机应用(第S2期);全文 *
基于改进自编码器和随机森林的窃电检测方法;邓高峰;赵震宇;王珺;严勤;李赫;;中国测试(第07期);全文 *

Also Published As

Publication number Publication date
CN113282613A (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
Wang et al. Toward the prediction level of situation awareness for electric power systems using CNN-LSTM network
Bhat et al. Identifying nontechnical power loss via spatial and temporal deep learning
Singh et al. Stock market forecasting using machine learning: Today and tomorrow
Tan et al. Representational learning approach for power system transient stability assessment based on convolutional neural network
CN113673564B (zh) 窃电样本生成方法、装置、计算机设备和存储介质
CN109507535B (zh) 变电站接地网运行阶段及运行寿命预测方法及装置
CN107422266B (zh) 一种大容量电池储能系统的故障诊断方法及装置
CN111428804B (zh) 一种优化加权的随机森林窃电用户检测方法
Cortes-Robles et al. Fast-training feedforward neural network for multi-scale power quality monitoring in power systems with distributed generation sources
CN116310425B (zh) 一种细粒度图像检索方法、系统、设备及存储介质
Yin et al. Deep learning based feature reduction for power system transient stability assessment
CN113282613B (zh) 专变和低压用户用电分析方法、系统、设备及存储介质
CN114021425A (zh) 电力系统运行数据建模与特征选择方法、装置、电子设备和存储介质
Vanderbilt et al. AN APPLIED STUDY OF RNN MODELS FOR PREDICTING CRYPTOCURRENCY PRICES.
Deng et al. Detection and classification of power quality disturbances using variational mode decomposition and convolutional neural networks
Boicea et al. A novel approach for power load forecast based on GAN data augmentation
Chen et al. Self-attention mechanism based dynamic fault diagnosis and classification for chemical processes
CN116029614A (zh) 配电网台区电能质量评估方法、装置和计算机设备
CN113092934B (zh) 基于聚类和lstm的单相接地故障判定方法及系统
GB2625165A (en) Method and system for fault diagnosis of rolling bearing
Chen et al. Electricity theft detection model for smart meter based on residual neural network
Pai et al. An enhanced support vector machines model for classification and rule generation
Tai et al. Radar HRRP target recognition based on stacked denosing sparse autoencoder
CN113887798A (zh) 台风灾害下停电网格分布预测方法、系统、设备和介质
Sreerag et al. Generalised probabilistic ranking competition model with quality inspection technique

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant