CN114519514B - 一种低压台区合理线损值测算方法、系统及计算机设备 - Google Patents
一种低压台区合理线损值测算方法、系统及计算机设备 Download PDFInfo
- Publication number
- CN114519514B CN114519514B CN202210103803.4A CN202210103803A CN114519514B CN 114519514 B CN114519514 B CN 114519514B CN 202210103803 A CN202210103803 A CN 202210103803A CN 114519514 B CN114519514 B CN 114519514B
- Authority
- CN
- China
- Prior art keywords
- line loss
- area
- indexes
- platform
- transformer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000004364 calculation method Methods 0.000 claims abstract description 36
- 238000012216 screening Methods 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000005259 measurement Methods 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000013145 classification model Methods 0.000 claims abstract description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 23
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 230000005611 electricity Effects 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 4
- 230000004913 activation Effects 0.000 description 10
- 230000009467 reduction Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 101100295776 Drosophila melanogaster onecut gene Proteins 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/10—Power transmission or distribution systems management focussing at grid-level, e.g. load flow analysis, node profile computation, meshed network optimisation, active network management or spinning reserve management
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Finance (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Mathematical Physics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Power Engineering (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
Abstract
本发明属于电力技术领域,为低压台区合理线损测值算方法、系统及计算机设备,其方法包括:获取原始数据并进行预处理;根据预处理后的数据,对每个台区提取包括容量类基础指标、运行类指标、台区类别指标和电量类指标在内的多维度特征指标,构建台区线损潜在特征指标体系;计算各维度特征指标和台区线损率之间的互信息,实现台区特征指标的重要性排序,结合各维度特征指标之间的相关性,筛选重要特征指标形成台区线损特征指标;构建低压台区分类模型,对台区进行分类;筛选各类台区典型样本用于模型训练;对每类台区,分别构建台区合理线损计算模型。本发明对台区分类并构建相应的台区合理线损计算模型,能准确计算台区理论线损。
Description
技术领域
本发明属于电力技术领域,具体涉及一种基于大数据算法的低压台区合理线损测值算方法、系统及计算机设备。
背景技术
在电力台区管理方面,线损率是电网经济运行管理水平和供电企业经济效益的综合反映,线损可以分为技术线损(理论线损)和管理线损。目前采用统一的线损率指标来评价台区线损,基本实现线损统筹管理。随着近年来线损管理水平提升,线损管理的精益化程度要求越来越高,由原有线损率值“一刀切”的评价方式改为“一台区一指标”新管理模式建设,科学指导降损。准确的理论线损计算为“一台区一指标”管理模式、制定降损措施提供重要依据。
台区线损受负载率、供电半径、三相不平衡度、用户数、负荷特性、末端电量占比、首端电压、网架结构、功率因素等影响,又由于台区供电方式多样、结构复杂,实际情况中往往无法获取准确的拓扑结构、线路参数以及运行数据,造成难以详细、精确计算低压电力网的电能损耗。
发明内容
本发明提供一种低压台区合理线损值测算方法、系统及计算机设备,提取台区线损强相关原始数据,构建台区线损特征指标,对台区分类并分别构建相应的台区合理线损计算模型,从而准确计算台区理论线损,解决现有业务模式中存在的问题。
本发明方法所采取的技术方案为:低压台区合理线损值测算方法,包括以下步骤:
S1、获取原始数据,原始数据来源包括营销业务应用系统、用电信息采集系统、电网PMS2.0系统和营销GIS系统;
S2、对获取的原始数据进行预处理;
S3、根据预处理后的数据,对每个台区提取包括容量类基础指标、运行类指标、台区类别指标和电量类指标在内的多维度特征指标,构建台区线损潜在特征指标体系;
S4、根据所构建的台区线损潜在特征指标体系,计算各维度特征指标和台区线损率之间的互信息,实现台区特征指标的重要性排序;结合各维度特征指标之间的相关性,筛选重要特征指标形成台区线损特征指标;
S5、构建低压台区分类模型,基于台区上网电量占比、网架结构、供电半径和台区供电量四个指标,采用聚类算法对台区进行分类;
S6、分析各类台区的数据样本,筛选各类台区典型样本用于模型训练;
S7、针对每类台区,利用MLP神经网络算法,分别构建台区合理线损计算模型。
本发明系统所采取的技术方案如下:低压台区合理线损值测算系统,包括:
数据获取模块,用于获取原始数据,原始数据来源包括营销业务应用系统、用电信息采集系统、电网PMS2.0系统和营销GIS系统;
预处理模块,用于对获取的原始数据进行预处理;
指标体系构建模块,用于根据预处理后的数据,对每个台区提取包括容量类基础指标、运行类指标、台区类别指标和电量类指标在内的多维度特征指标,构建台区线损潜在特征指标体系;
特征指标筛选模块,用于根据所构建的台区线损潜在特征指标体系,计算各维度特征指标和台区线损率之间的互信息,实现台区特征指标的重要性排序;结合各维度特征指标之间的相关性,筛选重要特征指标形成台区线损特征指标;
台区分类模块,用于构建低压台区分类模型,基于台区上网电量占比、网架结构、供电半径和台区供电量四个指标,采用聚类算法对台区进行分类;
样本筛选模块,用于分析各类台区的数据样本,筛选各类台区典型样本用于模型训练;
线损计算模块,用于针对每类台区,利用MLP神经网络算法,分别构建台区合理线损计算模型。
本发明的计算机设备,包括存储器、处理器以及存储在存储器并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现本发明低压台区合理线损值测算方法。
本发明与现有技术相比,具有如下优点和有益效果:
本发明基于大数据算法,提取台区线损强相关原始数据,构建台区线损特征指标,通过EM聚类算法实现台区分类,基于MLP神经网络算法分别对不同类型的台区构建相应的台区合理线损计算模型,从而准确计算台区理论线损,为“一台区一指标”管理模式、制定降损措施提供重要依据。
附图说明
图1为本发明实施例中低压台区合理线损值测算方法的流程示意图;
图2为本发明实施例中台区特征指标的重要性排序示意图;
图3为本发明实施例中采用无监督的EM聚类算法将台区进行分类的结果示意图;
图4为本发明实施例中构建的MLP神经网络结构示意图;
图5为本发明实施例中MLP神经网络预测结果。
具体实施方式
下面将结合实施例及附图对本发明的技术方案做进一步详细的描述,但本发明的实施方式不限于此。
实施例1
如图1所示,本实施例低压台区合理线损值测算方法,其过程包括数据获取、数据分析及处理、构建台区线损特征指标、构建低压台区分类模型、筛选各类台区训练样本、构建台区合理线损计算模型等步骤,具体如下:
步骤1、数据获取:从营销业务应用系统、用电信息采集系统、电网PMS2.0系统和营销GIS系统等获取原始数据。其中,从营销业务应用系统中主要提取台区、电能表、电表箱、计量点等档案类数据;从用电信息采集系统中主要提取电量、电流、电压等采集数据;从电网PMS2.0系统中主要提取线路、变压器等信息数据;从营销GIS系统中主要提取表箱和变压器坐标信息。
步骤1.1、营销业务应用系统的数据获取:获取台区档案信息,包括统计日期、单位编号、台区ID、台区编号、台区名称、台区容量、安装地址等字段;获取电能表信息,包括电能表标识、资产编号、电能表条形码、计量点标识、供电单位编号、供电区域编码、用户编号、综合倍率等字段;获取表箱信息,包括表箱ID、表箱资产编号等字段;获取计量点信息,包括计量点标识、用户标识、用户编号、台区标识、线路标识、抄表段编号、计量点分类、接线方式等字段。
步骤1.2、用电信息采集系统的数据获取:获取用户日电量明细数据,包括单位编号、用户编号、电量类型、示数类型、上次示数、本次示数、采集电量、估算电量等字段;获取用户日电压信息,包括计量点标识、供电单位、用户编号、电能表标识、A相电压、B相电压、C相电压等字段;获取台区考核表信息,包括台区标识、CT倍率、PT倍率、自身倍率、A相电压、B相电压、C相电压、A相电流、B相电流、C相电流、有功总功率、无功总功率等字段。
步骤1.3、PMS2.0系统的数据获取:提取线路信息,包括低压线路ID、线路名称、电系铭牌运行库ID、设备编码、运行编号、变压器类型、所属变压器、所属地市、运维单位、维护班组、电压等级、运行状态、线路类型、线路总长度、架空线路长度、电缆线路长度等字段;提取变压器线路信息,包括柱上变压器ID、电系铭牌运行库ID、所属线路、所属杆塔、设备名称、运行编号、电压等级、运维单位、所属地市等字段。
步骤1.4、营销GIS系统的数据获取:主要提取表箱经纬度空间坐标信息、变压器经纬度空间坐标信息。
步骤2、数据分析及处理:对获取的原始数据进行清洗等预处理,主要对数据完整性、一致性、唯一性、空值等方面进行检查。
步骤2.1、完整性和唯一性检查:对于档案类数据,首先对数据的完整性进行检查,例如对台区下的所有用户、表计和表箱档案信息进行完整性检查,若缺失记录进行档案数据补全;其次对台区、用户、表计和表箱进行唯一性检查,若出现重复记录,只取其中一条记录。
步骤2.2、一致性检查:根据每个变量的合理取值范围和相互关系检查数据是否合乎要求,剔除超出正常范围、逻辑上不合理或者相互矛盾的数据。对于数值型变量,统计变量分布情况,根据业务经验,判断正常值域范围,自动识别每个超出范围的变量值,对于超出范围的实例数据进行筛选排查。例如对于量测采集数据,存在少部分数据的跳变,甚至出现负值,对于这些异常值,直接用空值替换。
步骤2.3、空值检查:对于量测采集数据,由于数据采集频率较高,存在部分采集点丢失现象,由于采集类数据存在时间连续性,缺失数据与前后多个采样数据存在强相关性,所以对于数据缺失较少的记录,可以根据缺失数据的前后10个采样点的均值进行空值填充,对于缺失数据较多的记录,核查是否采集传输通讯出现故障,若是由于通讯原因造成的大量缺失数据,待通讯正常后重新传输数据即可。
步骤3、构建台区线损潜在特征指标体系:根据经步骤2预处理后的数据,对每个台区提取容量类基础指标、运行类指标、台区类别指标和电量类指标等多维度特征指标,构建台区线损潜在特征指标体系,各维度特征指标及指标描述如下表1所示。
表1 台区线损潜在特征指标
令εi为三相不平衡度,本实施例采用百分制的形式,则运行类指标中的三相不平衡度的计算公式如下:
式中,Imax是最大一相负荷电流,即三相负荷电流中的最大值;Iav是三相负荷电流平均值,即A相、B相、C相负荷电流平均值。
令台区总表均方根电流Irms与三相负荷电流平均值Iav的等效关系为k,并将等效关系k作为运行类指标中的负荷形状系数,则负荷形状系数的计算公式如下:
式中,T是计算周期所确定的电流测点数,i为测点电流序号;Ii为第i个测点的电流。
将台区类别指标中的供电半径定义为最远表箱到变压器的空间坐标距离,则供电半径的计算公式为:假设最远表箱、变压器这两点的经纬度(即空间坐标)分别为(lon1,lat1)、(lon2,lat2),则供电半径(即最远表箱、变压器两点间的距离)vd计算公式如下:
式中,vh为过地球中心最大圆切面弧度,vd为最远表箱、变压器之间的空间坐标距离。
步骤4、筛选台区线损特征指标
根据步骤3构建的台区线损潜在特征指标体系,计算各维度特征指标和台区线损率之间的互信息,实现台区特征指标的重要性排序,如图2所示;结合各维度特征指标之间的相关性,筛选重要特征指标形成台区线损特征指标,并作为后期模型的输入量。
互信息是信息论里的信息度量,是两个随机变量X、Y之间共享的信息,互信息越大表明变量X和变量Y的相关性越高。互信息也可以表示为由于变量X的引入而使变量Y的不确定度减少的量,减少的量越大说明变量X更有利于对变量Y的确定。互信息I(X;Y)是联合分布p(x,y)与边缘分布p(x)p(y)的相对熵,即:
本实施例利用python工具中的sklearn.feature_selection库,计算表1中的台区线损潜在特征指标与台区统计线损率之间的互信息,具体如图2所示。互信息的计算是一次性计算,本实施例主要用于确定模型的输入指标;其中,台区统计线损率根据用电信息采集系统直接获取的数据,由台区总表直接计算得到。
1)重要特征指标
损失电量、电压降、台区容量、首端电压、供电量、售电量、末端电压对台区线损率影响较大,属于重要特征指标;其中,供电量、售电量和损失电量均是表征台区的电量信息,三者之间存在线性关系,损失电量是基于供电量计算,所以该三个特征指标只需供电量作为特征指标;首端电压、末端电压、电压降用于表征台区电压信息,考虑到末端电压、电压降两个指标难以覆盖全量台区,该三个指标只需首端电压作为特征指标。
2)次要特征指标
供电半径、三相不平衡、末端电量占比、负荷形状系数、单相表计数、用户数、上网电量占比、三相表计数、网架结构、功率因素对线损率影响一般,属于次要特征指标;其中,用户数、表计数、单相表计数和三相表计数为强线性相关,属于同类特征,只需要用户数作为特征指标。
3)一般特征
户均容量、光伏用户数、光伏电量和城乡类别对线损率影响较小,属于一般特征,在后期构建模型的时候暂不考虑此类特征指标。
综上分析,最终选择首端电压、供电量、供电半径、三相不平衡度、末端电量占比、负荷形状系数、负载率、用户数、上网电量占比、网架结构、功率因素11个特征指标,作为后期模型的输入量。
步骤5、构建低压台区分类模型:基于台区上网电量占比、网架结构、供电半径和台区供电量四个指标,采用无监督的EM聚类算法将台区进行分类。
由于台区线损受到多种因数影响,通过业务经验仅可把握部分特征,难以掌握整体规律,因此本实施例利用台区上网电量占比、网架结构、供电半径和台区供电量指标数据,采用无监督的EM聚类算法将低压台区划分为多个类群,以支撑后续阶段中构建台区合理线损计算模型的工作。本实施例中将聚类数目设置为1到25,计算每个聚类数目下的BIC值,确定最佳聚类数目。
采用EM聚类的原因主要是该方法以高斯分布为基础,聚类结果在几何上是椭圆的,适用性更广。EM聚类算法主要是计算概率,用一个给定的多元高斯概率分布模型来估计出一个数据点属于一个聚类的概率,即将每一个聚类看作是一个高斯模型,主要由两步交替进行,通过E-step和M-step的不断交替来增加总的对数似然直到模型收敛。
以抽取台区上网电量占比大于零的台区(即有源台区)为例,提取台区上网电量占比、网架结构、供电半径和台区供电量指标数据,采用EM聚类算法并设置聚类数目为1到25,系统自动计算每个聚类数据下的BIC值,输出最佳聚类数目为8,台区聚类结果如图3所示,各类台区主要特征如下表2所示:
表2 各类台区主要特征表
类别 | 上网电力占比 | 网架结构 | 供电半径(米) | 台区供电量(kWh) |
1 | 小(小于5%) | 架空、混合线路 | 中(400至800) | 较大(5000至10000) |
2 | 小(小于5%) | 架空、混合线路 | 大(大于800) | 中(2000至5000) |
3 | 小(小于5%) | 电缆 | 小(小于400) | 较大(5000至10000) |
4 | 小(小于5%) | 电缆、架空、混合线路 | 小(小于400) | 超大(大于10000) |
5 | 小(小于5%) | 电缆、架空、混合线路 | 中(400至800) | 超大(大于10000) |
6 | 大(大于5%) | 电缆、架空、混合线路 | 中(400至800) | 小(小于2000) |
7 | 大(大于5%) | 混合线路 | 小(小于400) | 小(小于2000) |
8 | 小(小于5%) | 电缆、架空、混合线路 | 大(大于800) | 小(小于2000) |
步骤6、筛选各类台区训练样本:分析各类台区的数据样本,筛选各类台区典型样本用于模型训练。
抽取台区日线损和月线损数据,筛选台区日线损和月线损趋于稳定的台区为训练样本,具体筛选规则如下:1)剔除月线损率超出0%-10%范围的台区;2)剔除日线损率超出0%-10%范围的天数大于15天的台区;3)剔除日线损超0%-10%范围的天数,以剩余天数内的日线损率的均方差作为台区的日线损波动率σ;4)根据台区聚类结果,求出各类别中台区数在70%时的波动阈值,作为此类台区线损率允许波动的范围5)筛选台区日线损波动率σ<此类台区线损率允许波动的范围/>的台区,并标记为稳定台区,筛选后的稳定台区为训练样本。
步骤7、构建台区合理线损计算模型:针对每类台区,利用MLP神经网络算法,分别构建台区合理线损计算模型。
步骤7.1、模型选择:由于台区线损受到多种线损因子的综合影响,且各种线损因子对线损影响表现为非线性,同时MLP神经网络存在较强的自学习和自适应能力、泛化能力和容错能力,所以在构建台区合理线损计算模型时选择MLP神经网络模型,根据经验和多次实验,最终采用含有2个隐层的四层多输入单输出的MLP网络建立台区线损预测模型,如图4所示。
步骤7.2模型训练:
基于样本数据,首先进行归一化处理,然后对每类台区通过BP算法训练模型参数,在训练过程中,基于交叉验证的网格搜索进行参数寻优,参数设定如下表3所示:
表3 网络参数搜索范围
参数名称 | 参数范围 |
Layer1神经元个数 | range(6,100,2) |
Layer2神经元个数 | range(6100,2) |
activation激活函数 | [’relu’,’tanh’,’logistic’,’identity’] |
通过对参数进行网格搜索,计算所有参数(Layer1,Layer2,activation)的可能组合,得到每类台区合理线损计算模型的最优参数,例如对某类台区进行参数寻优,迭代过程如下所示:
0.000597 with:{′activation′:′relu′,′hidden_layer_sizes′:(6,6),′solver′:′lbfgs′}
0.000389 with:{′activation′:′relu′,′hidden_layer_sizes′:(6,6),′solver′:′sgd′}
0.000289 with:{′activation′:′relu′,′hidden_layer_sizes′:(6,6),′solver′:′adam′}
0.000420 with:{′activation′:′relu′,′hidden_layer_sizes′:(6,8),′solver′:′lbfgs′}
0.000843 with:{′activation′:′relu′,′hidden_layer_sizes′:(6,8),′solver′:′sgd′}
0.900445 with:{′activation′:′relu′,′hidden_layer_sizes′:(6,8),′solver′:′adam′}
0.000580 with:{′activation′:′relu′,′hidden_layer_sizes′:(6,10),′solver′:′lbfgs′}
通过网格搜索,得到该类台区最优模型参数为:
{activation:’relu’,hidden_layer1_sizes’:10,hidden_layer2_sizes’:8}
由此得到训练后最优的MLP四层网络模型,并对100个稳定样本台区进行预测,预测值和实际值如图5所示。
实施例2
与实施例1基于相同的发明构思,本实施例提供低压台区合理线损值测算系统,包括以下模块:
数据获取模块,用于获取原始数据,原始数据来源包括营销业务应用系统、用电信息采集系统、电网PMS2.0系统和营销GIS系统;
预处理模块,用于对获取的原始数据进行预处理;
指标体系构建模块,用于根据预处理后的数据,对每个台区提取包括容量类基础指标、运行类指标、台区类别指标和电量类指标在内的多维度特征指标,构建台区线损潜在特征指标体系;
特征指标筛选模块,用于根据所构建的台区线损潜在特征指标体系,计算各维度特征指标和台区线损率之间的互信息,实现台区特征指标的重要性排序;结合各维度特征指标之间的相关性,筛选重要特征指标形成台区线损特征指标;
台区分类模块,用于构建低压台区分类模型,基于台区上网电量占比、网架结构、供电半径和台区供电量四个指标,采用聚类算法对台区进行分类;
样本筛选模块,用于分析各类台区的数据样本,筛选各类台区典型样本用于模型训练;
线损计算模块,用于针对每类台区,利用MLP神经网络算法,分别构建台区合理线损计算模型。
其中,指标体系构建模块所构建的指标体系中,运行类指标包括三相不平衡度、负荷形状系数;其中三相不平衡度的计算公式如下:
式中,εi为三相不平衡度,Imax是三相负荷电流中的最大值;Iav是三相负荷电流平均值;
令台区总表均方根电流Irms与三相负荷电流平均值Iav的等效关系为k,并将等效关系k作为负荷形状系数,则负荷形状系数的计算公式如下:
式中,T是计算周期所确定的电流测点数,i为测点电流序号;Ii为第i个测点的电流。
此外,台区类别指标包括供电半径,供电半径定义为最远表箱到变压器的空间坐标距离,则供电半径vd的计算公式为:
式中,vh为过地球中心最大圆切面弧度,vd为最远表箱、变压器之间的空间坐标距离;最远表箱的空间坐标为(lon1,lat1),变压器的空间坐标为(lon2,lat2)。
实施例3
与实施例1基于相同的发明构思,本实施例提供相应的计算机设备,包括存储器、处理器以及存储在存储器并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现实施例1中低压台区合理线损值测算方法的各步骤。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (5)
1.一种低压台区合理线损值测算方法,其特征在于,包括以下步骤:
S1、获取原始数据,原始数据来源包括营销业务应用系统、用电信息采集系统、电网PMS2.0系统和营销GIS系统;
S2、对获取的原始数据进行预处理;
S3、根据预处理后的数据,对每个台区提取包括容量类基础指标、运行类指标、台区类别指标和电量类指标在内的多维度特征指标,构建台区线损潜在特征指标体系;
S4、根据所构建的台区线损潜在特征指标体系,计算各维度特征指标和台区线损率之间的互信息,实现台区特征指标的重要性排序;结合各维度特征指标之间的相关性,筛选重要特征指标形成台区线损特征指标;
S5、构建低压台区分类模型,基于台区上网电量占比、网架结构、供电半径和台区供电量四个指标,采用聚类算法对台区进行分类;
S6、分析各类台区的数据样本,筛选各类台区典型样本用于模型训练;
S7、针对每类台区,利用MLP神经网络算法,分别构建台区合理线损计算模型;
运行类指标包括负荷形状系数;令台区总表均方根电流Irms与三相负荷电流平均值Iav的等效关系为k,并将等效关系k作为负荷形状系数,则负荷形状系数的计算公式如下:
式中,T是计算周期所确定的电流测点数,i为测点电流序号;Ii为第i个测点的电流;
台区类别指标包括供电半径,供电半径定义为最远表箱到变压器的空间坐标距离,则供电半径vd的计算公式为:
式中,vh为过地球中心最大圆切面弧度,vd为最远表箱、变压器之间的空间坐标距离;最远表箱的空间坐标为(lon1,lat1),变压器的空间坐标为(lon2,lat2);
步骤S5中采用无监督的EM聚类算法将低压台区划分为多个类群,抽取台区上网电量占比大于零的台区,设置聚类数目,计算每个聚类数据下的BIC值,输出最佳聚类数目;
步骤S6抽取台区日线损和月线损数据,筛选台区日线损和月线损趋于稳定的台区为训练样本;对各类台区训练样本的筛选规则为:
1)剔除月线损率超出0%-10%范围的台区;
2)剔除日线损率超出0%-10%范围的天数大于15天的台区;
3)剔除日线损超0%-10%范围的天数,以剩余天数内的日线损率的均方差作为台区的日线损波动率σ;
4)根据台区分类结果,求出各类别中台区数在70%时的波动阈值,作为此类台区线损率允许波动的范围
5)筛选台区日线损波动率σ<此类台区线损率允许波动的范围的台区,并标记为稳定台区,筛选后的稳定台区为训练样本。
2.根据权利要求1所述的低压台区合理线损值测算方法,其特征在于,运行类指标包括三相不平衡度,计算公式如下:
式中,εi为三相不平衡度,Imax是三相负荷电流中的最大值;Iav是三相负荷电流平均值。
3.一种低压台区合理线损值测算系统,其特征在于,包括:
数据获取模块,用于获取原始数据,原始数据来源包括营销业务应用系统、用电信息采集系统、电网PMS2.0系统和营销GIS系统;
预处理模块,用于对获取的原始数据进行预处理;
指标体系构建模块,用于根据预处理后的数据,对每个台区提取包括容量类基础指标、运行类指标、台区类别指标和电量类指标在内的多维度特征指标,构建台区线损潜在特征指标体系;
特征指标筛选模块,用于根据所构建的台区线损潜在特征指标体系,计算各维度特征指标和台区线损率之间的互信息,实现台区特征指标的重要性排序;结合各维度特征指标之间的相关性,筛选重要特征指标形成台区线损特征指标;
台区分类模块,用于构建低压台区分类模型,基于台区上网电量占比、网架结构、供电半径和台区供电量四个指标,采用聚类算法对台区进行分类;
样本筛选模块,用于分析各类台区的数据样本,筛选各类台区典型样本用于模型训练;
线损计算模块,用于针对每类台区,利用MLP神经网络算法,分别构建台区合理线损计算模型;
运行类指标包括负荷形状系数;令台区总表均方根电流Irms与三相负荷电流平均值Iav的等效关系为k,并将等效关系k作为负荷形状系数,则负荷形状系数的计算公式如下:
式中,T是计算周期所确定的电流测点数,i为测点电流序号;Ii为第i个测点的电流;
台区类别指标包括供电半径,供电半径定义为最远表箱到变压器的空间坐标距离,则供电半径vd的计算公式为:
式中,vh为过地球中心最大圆切面弧度,vd为最远表箱、变压器之间的空间坐标距离;最远表箱的空间坐标为(lon1,lat1),变压器的空间坐标为(lon2,lat2);
台区分类模块采用无监督的EM聚类算法将低压台区划分为多个类群,抽取台区上网电量占比大于零的台区,设置聚类数目,计算每个聚类数据下的BIC值,输出最佳聚类数目;
样本筛选模块抽取台区日线损和月线损数据,筛选台区日线损和月线损趋于稳定的台区为训练样本;对各类台区训练样本的筛选规则为:
1)剔除月线损率超出0%-10%范围的台区;
2)剔除日线损率超出0%-10%范围的天数大于15天的台区;
3)剔除日线损超0%-10%范围的天数,以剩余天数内的日线损率的均方差作为台区的日线损波动率σ;
4)根据台区分类结果,求出各类别中台区数在70%时的波动阈值,作为此类台区线损率允许波动的范围
5)筛选台区日线损波动率σ<此类台区线损率允许波动的范围的台区,并标记为稳定台区,筛选后的稳定台区为训练样本。
4.根据权利要求3所述的低压台区合理线损值测算系统,其特征在于,运行类指标包括三相不平衡度、负荷形状系数;其中三相不平衡度的计算公式如下:
式中,εi为三相不平衡度,Imax是三相负荷电流中的最大值;Iav是三相负荷电流平均值。
5.计算机设备,包括存储器、处理器以及存储在存储器并可在处理器上运行的计算机程序,其特征在于,处理器执行计算机程序时,实现权利要求1或2所述低压台区合理线损值测算方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210103803.4A CN114519514B (zh) | 2022-01-27 | 2022-01-27 | 一种低压台区合理线损值测算方法、系统及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210103803.4A CN114519514B (zh) | 2022-01-27 | 2022-01-27 | 一种低压台区合理线损值测算方法、系统及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114519514A CN114519514A (zh) | 2022-05-20 |
CN114519514B true CN114519514B (zh) | 2023-09-19 |
Family
ID=81597657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210103803.4A Active CN114519514B (zh) | 2022-01-27 | 2022-01-27 | 一种低压台区合理线损值测算方法、系统及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114519514B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115473216B (zh) * | 2022-05-31 | 2023-06-06 | 云南电网有限责任公司 | 一种改进电网线损计算的方法及系统 |
CN115187881A (zh) * | 2022-09-08 | 2022-10-14 | 国网江西省电力有限公司电力科学研究院 | 电力设备铭牌识别及台区合规性自动校核系统及方法 |
CN115344567A (zh) * | 2022-10-18 | 2022-11-15 | 国网天津市电力公司营销服务中心 | 一种适用于边缘计算的低压台区数据清洗治理方法及装置 |
CN118606328B (zh) * | 2024-08-08 | 2024-10-18 | 国网四川省电力公司 | 一种电力数据存储方法、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951866A (zh) * | 2015-05-19 | 2015-09-30 | 广西大学 | 一种县级供电企业线损综合管理对标评价体系及评价方法 |
CN111260198A (zh) * | 2020-01-10 | 2020-06-09 | 广东电网有限责任公司 | 一种台区同期线损合理度评判方法、系统及终端设备 |
CN112149873A (zh) * | 2020-08-25 | 2020-12-29 | 北京合众伟奇科技有限公司 | 一种基于深度学习的低压台区线损合理区间预测方法 |
CN113159339A (zh) * | 2021-04-20 | 2021-07-23 | 国网江西省电力有限公司信息通信分公司 | 一种基于大数据的一台区一指标线损管理方法及系统 |
CN113887785A (zh) * | 2021-09-13 | 2022-01-04 | 江苏智臻能源科技有限公司 | 基于离散化采样和神经网络的台区理论线损预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9789344B2 (en) * | 2013-11-15 | 2017-10-17 | 2442033 Ontario Inc. | Method, system and use for therapeutic ultrasound |
-
2022
- 2022-01-27 CN CN202210103803.4A patent/CN114519514B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951866A (zh) * | 2015-05-19 | 2015-09-30 | 广西大学 | 一种县级供电企业线损综合管理对标评价体系及评价方法 |
CN111260198A (zh) * | 2020-01-10 | 2020-06-09 | 广东电网有限责任公司 | 一种台区同期线损合理度评判方法、系统及终端设备 |
CN112149873A (zh) * | 2020-08-25 | 2020-12-29 | 北京合众伟奇科技有限公司 | 一种基于深度学习的低压台区线损合理区间预测方法 |
CN113159339A (zh) * | 2021-04-20 | 2021-07-23 | 国网江西省电力有限公司信息通信分公司 | 一种基于大数据的一台区一指标线损管理方法及系统 |
CN113887785A (zh) * | 2021-09-13 | 2022-01-04 | 江苏智臻能源科技有限公司 | 基于离散化采样和神经网络的台区理论线损预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114519514A (zh) | 2022-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114519514B (zh) | 一种低压台区合理线损值测算方法、系统及计算机设备 | |
CN110991786B (zh) | 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法 | |
CN108376982B (zh) | 负载相序的识别方法及装置 | |
CN113267692B (zh) | 一种低压台区线损智能诊断分析方法和系统 | |
CN107169628B (zh) | 一种基于大数据互信息属性约简的配电网可靠性评估方法 | |
CN110458230A (zh) | 一种基于多判据融合的配变用采数据异常甄别方法 | |
CN107340492A (zh) | 基于大数据挖掘和场景预判的电能计量装置故障分析方法 | |
CN112149873B (zh) | 一种基于深度学习的低压台区线损合理区间预测方法 | |
CN106372747B (zh) | 基于随机森林的台区合理线损率估计方法 | |
CN109670676A (zh) | 基于支持向量数据描述的配网台区风险预警方法及系统 | |
CN113189418B (zh) | 一种基于电压数据的拓扑关系识别方法 | |
CN114610706B (zh) | 基于过采样和改进随机森林的窃电检测方法、系统及装置 | |
CN112688428A (zh) | 一种基于物联网技术的10千伏电网同期线损治理方法 | |
CN111709668A (zh) | 基于数据挖掘技术的电网设备参数风险识别方法及装置 | |
CN113379116A (zh) | 基于聚类和卷积神经网络的台区线损预测方法 | |
CN115293257A (zh) | 一种针对异常用电用户的检测方法及系统 | |
CN115563477B (zh) | 谐波数据识别方法、装置、计算机设备和存储介质 | |
CN113659564A (zh) | 基于电压波动特征聚类的低压配电网拓扑识别方法及系统 | |
CN113689079A (zh) | 基于多元线性回归和聚类分析的台区线损预测方法及系统 | |
CN113224748A (zh) | 一种低压配电台区线路损耗的计算方法 | |
CN113949079B (zh) | 基于深度学习的配电台区用户三相不平衡预测优化方法 | |
CN116307844A (zh) | 一种低压台区线损评估分析方法 | |
CN117609818A (zh) | 基于聚类与信息熵的电网关联关系发现方法 | |
CN116662840A (zh) | 一种基于机器学习的低压台区用户相位识别方法 | |
Gunsay et al. | Load profile segmentation for electricity market settlement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |