CN110147760A

CN110147760A - 一种高效电能质量扰动图像特征提取与识别新方法

Info

Publication number: CN110147760A
Application number: CN201910416221.XA
Authority: CN
Inventors: 林琳; 王影; 刘麒; 陈玲玲; 高兴泉; 韩光信; 孙明革; 张慧颖; 李鑫; 吴雪莉; 郑立军; 于波; 李佳; 邢雪
Original assignee: Jilin Institute of Chemical Technology
Current assignee: Hefei Jiuzhou Longteng Scientific And Technological Achievement Transformation Co ltd; Jiangsu Xiou Electronics Co ltd
Priority date: 2019-05-20
Filing date: 2019-05-20
Publication date: 2019-08-20
Anticipated expiration: 2039-05-20
Also published as: CN110147760B

Abstract

本公开是一种高效电能质量扰动图像特征提取与识别新方法，该方法包括：将电能质量信号转换为灰度图像，使用伽马校正、边缘检测与峰谷检测3种方法增强扰动特征后得到二值图像，提取面积、欧拉数、角二阶矩、对比度、相关性、均值、方差、逆差矩和熵9种特征构建原始特征集；以特征基尼重要度为依据进行排序，确定对分类影响最大的特征；综合考虑分类精度和效率，确定随机森林中树的个数，使用最优特征子集构建随机森林分类器对电能质量扰动信号进行识别。本公开能够实现不同噪声环境下电压暂降、电压暂升、电压中断、闪变、暂态振荡、谐波、电压切痕、电压尖峰8类常见电能质量扰动信号的高效、准确识别，并提高了扰动信号特征提取效率。

Description

一种高效电能质量扰动图像特征提取与识别新方法

技术领域

本公开涉及电气技术领域，具体而言，是一种高效电能质量扰动图像特征提取与识别新方法。

背景技术

随着各种电力电子设备、非线性负载等在现代电力系统中的大量应用，电力系统中的电能质量问题日趋严重。此外，具有间歇性、随机性等出力特性的分布式光伏、风电等新能源并网，进一步影响电能质量。电能质量问题给国民经济带来巨大损失，严重影响工业生产和居民生活。因此，电能质量问题的治理刻不容缓。电能质量扰动类型种类多且发生频繁，准确识别各类常见电能扰动类型，以便进行针对性治理是提高电力系统电能质量问题的重要前提。此外，随着目前各种传感器设备信号采样率的提高，大量监测点采集的海量高采样率信号对电能质量扰动识别的实时性提出了更高要求。

目前，虽然已有研究采用数字图像处理技术对电能质量扰动信号特征进行增强，但是特征提取不足，应用受到限制。因此，需要提供一种或多种至少能够解决上述技术问题的技术方案。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本公开的目的在于提供一种高效电能质量扰动图像特征提取与识别新方法。可实现不同噪声环境下，在图像处理技术对原始电能质量信号进行变换与增强后，对电压暂降、电压暂升、电压中断、闪变、暂态振荡、谐波、电压切痕和电压尖峰8类常见的电能质量扰动信号进行基于伽马校正（Gamma corrections）、边缘检测（Edge detection）与峰谷检测（Peaks and valley detection）三种图像增强变换。将传统一维电能质量信号转化为二值图像，并在此基础上，提取9类共45种原始特征构建原始特征集合。之后，在原始特征集合基础上，以随机森林（Random Forest，RF）为分类器，以分类准确率为决策变量，开展基于特征基尼（Gini）重要度的前向特征选择，最终确定最优特征子集与最优分类器结构。该方法实现了基于图像处理技术的电能质量信号的增强与高效特征提取，构建了完整的基于图像处理技术的电能质量信号原始图像特征集，并在此基础上，基于基尼重要度与随机森林确定了最优特征子集与最优随机森林分类器。新方法实现了高效率、高准确率的电能质量扰动识别问题，能够提高特征提取的效率。具体实现步骤如下：

1) 将电能质量信号转换为灰度图像，使用伽马校正、边缘检测与峰谷检测3种数字图像处理方法对扰动特征进行增强后得到的5类二值图像，之后，提取包括面积、欧拉数、角二阶矩、对比度、相关性、均值、方差、逆差矩和熵在内的9种特征，构建更全面的45维原始特征集合；将原始电能质量扰动信号转换为二维图像的转换规则为：

(1)

标准电能质量信号转化为灰度图像后，其灰度变化均匀，无突变。若在信号中出现扰动成分，则在其灰度图像中可以发现明显的灰度变化，即采用图像处理方法对电能质量识别扰动信号进行识别的基础。

进一步地，采用的扰动图像增强方法有伽马校正、边缘检测与峰谷检测3种，对灰度图像进行处理其公式分别为：

伽马校正公式为：

(2)

式中，y为输入灰度图像，s为校正后灰度图像，c和r均为常数；其中： r>1时，图像的高灰度区域对比度增强；r<1时，图像的低灰度区域对比度增强； r=1时，图像无变化。

在伽马校正后进一步突出扰动信号畸变特征，采用最大类间方差法选取最优阈值将灰度图像转换为二值图像，其中最大类间方差法计算图像的最佳阈值公式为：

(3)

式中，当分割阈值为t时，w0为背景比例，u0为背景均值，w1为前景比例，u1为前景均值，u为整幅图像的均值；令以上表达式值最大的t，即为分割图像的最佳阈值；

边缘检测方法采用坎尼边缘算子，使用高斯滤波器对需要处理的图像进行平滑滤波，其公式表示为：

(4)

式中，G为梯度强度，I为待平滑的图像，J为平滑后的图像；

计算平滑图像J中各个像素点的梯度方向和幅值，该过程表示为：

(5)

式中， J _x和J _y分别表示平滑图像J在x、y方向上的梯度；梯度的方向和幅值如下面公式所示：

(6)

(7)

峰谷检测方法将灰度图像看作三维图像，即x轴和y轴分别表示像素的位置，z轴表示像素强度；其中灰度值较高的位置和灰度值较低的位置相当于地形图中的山峰和低谷，即局部极大值和局部极小值。

分析以上由不同图像增强方法所得二值图像可知，由于各种图像增强方法的原理各异，因此不同的图像增强方法对各种扰动类型的增强效果不同。伽马校正方法适用于电压暂降（Sag）、电压暂升（Swell）、闪变（Flicker）等信号；峰谷检测方法对电压中断（Interruption）、电压切痕（Nocth）、电压尖峰（Spike）等信号具有较好的特征增强效果；边缘检测方法对暂态振荡（Transient)信号特征增强效果较好。考虑到在电能质量扰动识别的实际工程应用中各类扰动类型的未知性，为了全面增强未知扰动的特征，新方法在特征提取之前，使用以上3种图像增强方法同时对各类扰动信号进行处理。在此基础上，对所得二值图像提取扰动特征，由此构建信息丰富、有效的原始特征集合。

进一步地，对经过以上3种图像增强方法处理后得到的5类二值图像，包括采用伽马校正方法分别在r=0.125与r=8时所得2类二值图像、边缘检测方法所得二值图像和峰谷检测方法所得局部极小值、极大值2类二值图像。在传统的面积和欧拉数特征基础上，增加了角二阶矩、对比度、相关性、均值、方差、逆差矩和熵共9种特征，提取每类图像9种特征，共计45维特征，各特征的计算公式如下：

角二阶矩： (8)

对比度： (9)

式中，t为灰度级；

相关性： (10)

式中，与为均值，与为方差，表达式分别为：，，，

均值： (11)

方差： (12)

式中，为的均值

逆差矩： (13)

熵： (14)

其中， L为二值图像中灰度级数目，m，n分别代表灰度图像中像素点的行号和列号， P(m,n)为第m行、第n列的灰度值。

2）在随机森林训练过程中，不同特征分割节点的分类效果可以用基尼指数来衡量。以特征的基尼重要度为依据对45维特征进行降序排序，使用前项选择法（SequentialForward Selection，SFS）选取最优特征子集，最终确定其中包含对分类影响最大的15维特征，避免冗余特征对分类的影响；

随机森林（Random Forest， RF）是一种优秀的集成分类算法，它将决策树（DecisionTree，DT）与集成学习结合，构成新型分类器集合：

(15)

式中，是由CART（Classification And Regression Tree）算法生成的分类决策树元分类器；x是输入向量， k为元分类器个数；是独立同分布的随机向量。随机森林在各决策树不同节点产生随机特征子集，并选择分类效果最好的特征作为分类特征，再汇总不同决策树的分类结论最终实现准确分类。

给定分类器集合，每一个分类器的训练集都是从原始数据集（X,Y）中随机抽取所得，余量函数定义为：

(16)

式中，为示性函数，表示取平均值，Y为正确分类的向量， j为不正确分类的向量。mg(X,Y)值越大，分类性能越优秀，置信度越高。由此，得到用于评估分类器分类能力的泛化误差PE ^*：

PE*=P _X,Y(mg(X,Y)<0) (17)

式中， X，Y表示定义空间。

基于随机森林的电能质量扰动分类流程为：

从原始特征集合N中有放回地随机抽取n个样本构成自助样本集，重复L次，新方法在特征选择阶段L的取值为200；

训练过程中，从特征空间M中随机选择扰动特征作为非叶子节点分类候选特征，用每个候选特征分割节点并选择分割效果最好的特征作为该节点分割特征，重复这一过程直至每棵树的非叶子节点都分类完成，结束训练过程；

分类时，对每个元分类器分类结果采用多数投票法，确定最优分类结果。

特征的基尼指数是一种节点不纯度的度量方式。基尼重要度计算方法为：假设S是一个含有s个样本的数据集，可以分为n类，s _i表示其中第i类包含的样本数(i=1,2,…，n)，则集合S的基尼指数表示为：

(18)

式中， P _i =s _i/s，表示任意样本属于第i类的概率；当S中只包含一类时，其基尼指数为0；当S中所有类别均匀分布时，基尼指数取得最大值；当随机森林使用某个特征对节点进行划分时，可以将集合S分为m个子集(S _j, j=1,2,3,…,m)，则划分后集合S的基尼指数为：

(19)

式中，S _j为集合S中样本数，具有最小Gini _split值的特征划分效果最好。

计算特征基尼重要度排序的过程为：首先，使用原始特征集合训练随机森林分类器，计算每一个特征分割该节点后的Gini _split值，并用分割节点前节点的基尼指数减去该值，得到所有特征的基尼重要度；之后，选择基尼重要度值最大的特征作为该节点的分割特征；最后，在随机森林构建完成后，把同一个特征的所有基尼重要度进行线性叠加并降序排序，得到所有特征的基尼重要度排序。

得到原始特征集合中所有特征的基尼重要度后，即可进行基于随机森林分类器与基尼重要度的前向搜索策略。首先，按照已得的特征重要度降序排序，将特征依次加入已选特征集合Q中；每加入一个特征，则用新的特征集合Q重新训练随机森林分类器，并记录该特征集合下的分类准确率，重复以上过程直至所有特征都加入到Q中；最后，综合考虑分类准确率和集合Q的特征维数，确定最优特征子集。

3）在尽量保证最优分类结果的前提下，使用上述15维特征子集构建随机森林分类器，在保证最优分类效果的前提下，尽量减少树的个数，从而提高分类效率，最终选取森林中树的个数为90，而后建立随机森林模型对电能质量扰动信号进行识别。

在确定最优特征子集后，使用最优特征子集训练随机森林分类器用于电能质量扰动识别。随机森林是一种集成分类算法，其分类效果与森林中树的个数有关，树的个数决定了随机森林的规模。随机森林规模越大，其分类误差越小，特征的基尼重要度分析越准确。因此，在特征选择环节，随机森林中树的个数定为200棵，但是，随机森林的分类效率会随着树的个数的增加而降低。因此，在保证最优分类效果的前提下，应尽量使树的个数最小，从而提升随机森林的分类效率。

本公开示例性实施例中的关于高效电能质量扰动图像特征提取与识别新方法通过将电能质量原始信号转换为灰度图像，并通过伽马校正、边缘检测与峰谷检测3种数字图像处理方法对扰动特征进行增强，得到扰动信号二值图像。在此基础上提取扰动特征，构建原始特征集合，而后以随机森林为分类器，以分类准确率为决策变量，开展基于特征基尼重要度的前向特征选择，最终确定最优特征子集与最优分类器结构。新方法实现了基于图像处理技术的电能质量信号的增强与高效特征提取，构建了完整的基于图像处理技术的电能质量信号原始图像特征集，并在此基础上，基于基尼重要度与随机森林确定了最优特征子集与最优随机森林分类器。该方法可有效反映不同扰动类型的特点，且相较于S变换，经验模态分解等信号处理方法，新方法信号处理效率得到显著提高。另外，以特征基尼重要度衡量不同特征分类能力，并以此为依据，采用序列前向搜索方法进行特征选择实现了对特征的有效分析，去除了原始特征集合中的冗余特征，同时有效提高特征计算效率，简化分类器结构。使用随机森林分类器实现了不同噪声环境下对电能质量扰动信号的有效识别，改善了现有电能质量扰动识别研究中存在的信号处理效率低、有效特征选择分析不足等缺点，实现了高效率、高准确率的电能质量扰动识别，提高了特征提取的效率。

附图说明

图1示出了根据本公开一示例性实施例的高效电能质量扰动图像特征提取与识别新方法流程图；

图2示出了根据本公开一示例性实施例的8类扰动信号经伽马校正后由最大类间方差法确定最优阈值后所得二值图；（a）r=0.125时伽马校正后二值图；（b）r=8时伽马校正后二值图；

图3示出了根据本公开一示例性实施例的8类扰动信号经边缘检测处理后所得二值图；

图4示出了根据本公开一示例性实施例的8类扰动信号经峰谷检测处理后所得二值图；（a）局部极小值二值图；（b）局部极大值二值图；

图5示出了根据本公开一示例性实施例的特征基尼重要度降序排序及各特征子集下分类准确率图；

图6示出了根据本公开一示例性实施例的随机森林规模对分类误差的影响图。

具体实施方式

现在将参考附图更全面地描述示例实施例。然而，示例实施例能够以多种形式实施，且不应被理解为限于在此阐述的实施例；相反，提供这些实施例使得本公开将全面和完整，并将示例实施例的构思全面地传达给本领域的技术人员。

在本示例实施例中，提供了高效电能质量扰动图像特征提取与识别新方法。参考图1所示，该高效电能质量扰动图像特征提取与识别新方法可以包括以下步骤：

步骤1，将电能质量信号转换为灰度图像，而后使用伽马校正、边缘检测与峰谷检测 3种数字图像处理方法对扰动特征进行增强后得到的5类二值图像，提取包括面积、欧拉数、角二阶矩、对比度、相关性、均值、方差、逆差矩和熵9种特征，构建更全面的45维原始特征集合；

步骤2，以特征基尼重要度为依据对45维特征进行降序排序，使用前项选择策略选取最优特征子集，最终确定其中包含对分类影响最大的15维特征，避免冗余特征对分类的影响；

步骤3，在尽量保证最优分类结果的前提下，使用上述15维特征子集构建随机森林分类器，在保证最优分类效果的前提下，尽量使树的个数最小，提高分类效率；最终选取森林中树的个数为90，而后建立随机森林模型对电能质量扰动信号进行识别。

关于高效电能质量扰动图像特征提取与识别新方法通过将电能质量原始信号转换为灰度图像，并通过伽马校正、边缘检测与峰谷检测3种数字图像处理方法对扰动特征进行增强，得到扰动信号二值图像。在此基础上提取扰动特征，构建原始特征集合，而后以随机森林为分类器，以分类准确率为决策变量，开展基于特征基尼重要度的前向特征选择，最终确定最优特征子集与最优分类器结构。新方法实现了基于图像处理技术的电能质量信号的增强与高效特征提取，构建了完整的基于图像处理技术的电能质量信号原始图像特征集，并在此基础上，基于基尼重要度与随机森林确定了最优特征子集与最优随机森林分类器。可有效反映不同扰动类型的特点，相较于S变换，经验模态分解等信号处理方法，新方法信号处理效率得到显著提高。另外，以特征基尼重要度衡量不同特征分类能力，并以此为依据，采用序列前向搜索方法进行特征选择实现了对特征的有效分析，去除了原始特征集合中的冗余特征，同时有效提高特征计算效率，简化分类器结构。使用随机森林分类器实现了不同噪声环境下对电能质量扰动信号的有效识别，改善了现有电能质量扰动识别研究中存在的信号处理效率低、对有效特征选择分析不足等缺点，实现了高效率、高准确率的电能质量扰动识别，提高了特征提取的效率。

在步骤1中首先将电能质量信号转化为灰度图像，而后进行图像增强，提取原始特征集：

原始电能质量扰动信号进行按照以下规则转换为二维图像：

(1)

标准电能质量信号转化为灰度图像后，其灰度变换均匀，无突变。若在信号中出现扰动成分，则在其灰度图像中可以发现明显的灰度变化，即采用图像处理方法对电能质量识别扰动信号进行识别的基础。

扰动图像增强方法包括伽马校正、边缘检测与峰谷检测 3种，公式分别为：

伽马校正公式为：

(2)

式中，y为输入灰度图像，s为校正后灰度图像，c和r均为常数；其中： r>1时，图像的高灰度区域对比度增强；r<1时，图像的低灰度区域对比度增强； r=1时，图像无变化。为了全面刻画扰动特征，新方法分别选取参数r=0.125与r=8对灰度图像进行增强。

伽马校正后进一步突出扰动信号畸变特征，采用最大类间方差法选取最优阈值将灰度图像转换为二值图像，其中最大类间方差法计算图像的最佳阈值公式为：

(3)

式中，当分割的阈值为t时，w0为背景比例，u0为背景均值，w1为前景比例，u1为前景均值，u为整幅图像的均值；令以上表达式值最大的t，即为分割图像的最佳阈值。

边缘检测方法采用坎尼边缘算子，使用高斯滤波器对图像进行平滑滤波，其公式表示为：

(4)

式中，G为梯度强度，I为待平滑的图像，J为平滑后的图像。

(5)

式中，J _x和J _y分别表示平滑图像J在x、y方向上的梯度；梯度的方向和幅值如下面公式所示：

(6)

(7)

峰谷检测方法将灰度图像看作三维图像，即x轴和y轴分别表示像素的位置，z轴表示像素强度。其中灰度值较高的位置和灰度值较低的位置相当于地形图中的山峰和低谷，即局部极大值和局部极小值。

采用不同图像增强方法后效果分别如图2、图3和图4所示，分析不同图像增强方法所得二值图像可知，由于各种图像增强方法的原理不同，因此对各种扰动类型的增强效果也不同。伽马校正方法适用于电压暂降（Sag）、电压暂升（Swell）、闪变（Flicker）等信号；峰谷检测方法对电压中断（Interruption）、电压切痕（Nocth）、电压尖峰（Spike）等信号具有较好的特征增强效果；边缘检测方法对暂态振荡（Transient)信号特征增强效果较好。考虑到电能质量扰动识别实际工程应用中各类扰动类型的未知性，新方法在特征提取之前使用以上3种图像增强方法分别对各类扰动信号进行处理，在此基础上对所得二值图像提取扰动特征，构建信息丰富、有效的原始特征集合。

提取经图像增强技术处理过的扰动特征构建原始特征集，在传统的面积和欧拉数特征基础上，增加了角二阶矩、对比度、相关性、均值、方差、逆差矩、熵等特征，其公式表示如下：

角二阶矩： (8)

对比度： (9)

式中，t为灰度级；

相关性： (10)

式中，与为均值，与为方差，其表达式分别为：，，，

均值： (11)

方差： (12)

式中，为的均值；

逆差矩： (13)

熵： (14)

其中，L为二值图像中灰度级数目，m，n分别代表灰度图像中像素点的行号和列号， P(m,n)为第m行、第n列的灰度值。

由以上3种图像增强方法处理后得到5类二值图像，包括伽马校正方法分别在r=0.125与r=8下所得2类二值图像、边缘检测方法所得二值图像和峰谷检测方法所得局部极小值、极大值2类二值图像共5类图像，每类图像9种特征，共可提取45维特征组成原始特征集合。

在步骤2中，随机森林训练过程中，不同特征分割节点的分类效果可以用基尼指数来衡量。以特征的基尼重要度为依据对45维特征进行降序排序，使用前项选择策略选取最优特征子集，最终选取对分类影响最大的15维特征，避免冗余特征对分类的影响；

随机森林是一种优秀的集成分类算法，它将决策树与集成学习结合，构成新型分类器集合：

(15)

式中，是由CART（Classification And Regression Tree）算法生成的分类决策树元分类器；x是输入向量，k为元分类器个数；是独立同分布的随机向量。随机森林在各决策树不同节点产生随机特征子集，并选择分类效果最好的特征作为分类特征，再汇总不同决策树的分类结论最终实现准确分类。

给定分类器集合，每一个分类器的训练集都是从原始数据集(X,Y)中随机抽取所得，余量函数定义为：

(16)

式中，为示性函数，表示取平均值，Y为正确分类的向量，j为不正确分类的向量。mg(X,Y)值越大，分类性能越优秀，置信度越高。由此，得到用于评估分类器分类能力的泛化误差PE ^*：

PE*=P _X,Y(mg(X,Y)<0) (17)

式中， X，Y表示定义空间。

基于随机森林的电能质量扰动分类流程为：

① 从原始特征集合N中有放回地随机抽取n个样本构成自助样本集，重复L次，新方法在特征选择阶段L的取值为200；

② 训练过程中，从特征空间M中随机选择扰动特征作为非叶子节点分类候选特征，用每个候选特征分割节点并选择分割效果最好的特征作为该节点的分割特征。重复这一过程直至每棵树的非叶子节点都分类完成，结束训练过程；

③ 分类时，对每个元分类器分类结果采用多数投票法，确定最优分类结果。

(18)

式中， P _i =s _i/s，表示任意样本属于第i类的概率；当S中只包含一类时，其基尼指数为0；当S中所有类别均匀分布时，基尼指数取得最大值；当随机森林使用某个特征对节点进行划分时，可以将集合S分为m个子集(S _j,j=1,2,3,…,m)，则划分后集合S的基尼指数为：

(19)

特征基尼重要度排序过程为：首先，使用原始特征集合训练随机森林分类器，计算每一个特征分割该节点后的Gini _split值，并用分割节点前节点的基尼指数减去该值，得到所有特征的基尼重要度；而后，选择基尼重要度值最大的特征作为该节点的分割特征；在构建完随机森林后，把同一个特征的所有基尼重要度进行线性叠加并降序排序，即可得到所有特征的基尼重要度排序。

在得到原始特征集合中所有特征的基尼重要度后，进行基于随机森林分类器与基尼重要度的前向搜索策略。首先，按照特征重要度降序排序，将特征依次加入已选特征集合Q中；每加入一个特征后，用新的特征集合Q重新训练随机森林分类器，并记录该特征集合下的分类准确率，重复以上过程直至所有特征都加入到Q中；最后，综合考虑分类准确率和集合Q的特征维数，确定最优特征子集。

在此，仿真生成信噪比为20dB-50dB之间、具有随机参数的扰动信号每类各600组，作为训练集合，用于训练随机森林分类器。同时，在相同环境下仿真生成每类信号各200组作为验证集，用于完成特征选择工作。之后，以训练集训练随机森林分类器，计算原始特征集合中各特征的基尼重要度。按照重要度从大到小的顺序依次将各个特征加入特征子集Q中，并记录此时在Q下的随机森林分类准确率。最后，综合考虑特征重要度和特征维数，确定最优特征子集。特征基尼重要度降序排序及各特征子集下分类准确率如图5所示。

观察图5中折线图可知，在特征选择过程中，当特征维数为15维时，分类准确率达到最高值99.33%。在加入剩余特征之后，分类准确率波动不明显。在保证良好的分类准确率的前提下，减少特征维数可有效提高特征提取与分类效率、简化分类器结构。因此，综合考虑分类准确率与特征维数，新方法确定采用特征基尼重要度降序排序，并选取前15维特征组成最优特征子集。

在步骤3中，使用步骤2中确定的特征子集构建随机森林器，在保证最优分类效果和效率的前提下，确定森林中树的个数，而后建立随机森林模型对电能质量扰动信号进行识别。

随机森林是一种集成分类算法，其分类效果与森林中树的个数有关，树的个数决定了随机森林的规模，规模越大，其分类误差越小，特征的基尼重要度分析越准确。因此，在特征选择环节，随机森林中树的个数定为200，但随机森林的分类效率会随着树的个数的增加而降低。因此，在保证最优分类效果的前提下，应尽量使树的个数最小，提高随机森林的分类效率。图6示出在各噪声环境下随机森林中树的个数与分类误差对比情况。由图6分析可知，当树的个数超过90个时，在各噪声环境下随机森林的识别准确率达到稳定水平。继续增加树的个数对分类效果的贡献不明显，而分类效率会因树的个数的增加而显著降低。因此，综合考虑分类效率与分类准确率，最终选取随机森林中树的个数为90，此时，在保证随机森林良好分类效果的同时，仍具有较高的分类效率。

为了全面测试新方法在复杂噪声环境下的有效性，使用Matlab R2016b仿真生成具有随机扰动参数且信噪比分别为20dB、30dB、40dB、50dB的9类信号，每类信号各200组。分别使用随机森林(Random Forest，RF)与支持向量机（Support Vector Machine，SVM）、极限学习机（Extreme Learning Machine，ELM）、决策树(Decision Tree，DT）分类器对各组信号进行识别，其结果如表1所示：

表1 扰动信号在不同分类器下分类效果

其中C0~C8分别表示标准信号和电压暂降、电压暂升、电压中断、闪变、暂态振荡、谐波、电压切痕、电压尖峰8类常见电能质量扰动信号，由表1分析可知，采用新方法在信噪比为30dB及以上时，分类准确率可达到99.44%以上；信噪比为20dB时，由于噪声影响，准确率有明显降低，但也达到了96.22%。相较于其他分类器方法，在不同噪声环境下，新方法结合随机森林分类器均可获得较高准确率，证明了新方法在不同噪声环境下的有效性。

此外，上述附图仅是根据本发明实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解。应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明公开的范围仅由所附的权利要求来限定。

Claims

1.一种高效电能质量扰动图像特征提取与识别新方法，可实现对不同噪声环境下，在图像处理技术对原始电能质量信号进行变换与增强后，对电压暂降、电压暂升、电压中断、闪变、暂态振荡、谐波、电压切痕、电压尖峰8类常见的电能质量扰动信号进行基于伽马校正（Gamma corrections）、边缘检测（Edge detection）与峰谷检测（Peaks and valleydetection）三种图像增强变换；将传统一维电能质量信号转化为二值图像，并在此基础上，提取9类共45种原始特征构建原始特征集合；之后，在此原始特征集合基础上，以随机森林（Random Forest，RF）为分类器，以分类准确率为决策变量，开展基于特征基尼（Gini）重要度的前向特征选择，最终确定最优特征子集与最优分类器结构；新方法实现了基于图像处理技术的电能质量信号的增强与高效特征提取，构建了完整的基于图像处理技术的电能质量信号原始图像特征集，并在此基础上，基于基尼重要度与随机森林确定了最优特征子集与最优随机森林分类器；新方法实现了高效率、高准确率的电能质量扰动识别问题，能够提高特征提取的效率；具体实现步骤如下：

（1）将电能质量信号转换为灰度图像，使用伽马校正、边缘检测与峰谷检测3种数字图像处理方法对扰动特征进行增强后得到的5类二值图像，之后，提取包括面积、欧拉数、角二阶矩、对比度、相关性、均值、方差、逆差矩和熵在内的9种特征，构建更全面的45维原始特征集合；将原始电能质量扰动信号转换为二维图像的转换规则为：

（1）

采用的扰动图像增强方法有伽马校正、边缘检测与峰谷检测3种，其中，伽马校正公式为：

（2）

式中，y为输入灰度图像，s为校正后灰度图像，c和r均为常数；其中： r>1时，图像的高灰度区域对比度增强；r<1时，图像的低灰度区域对比度增强； r=1时，图像无变化；

在伽马校正后进一步突出扰动信号畸变特征，采用最大类间方差法选取最优阈值，将灰度图像转换为二值图像，其中最大类间方差法计算图像的最佳阈值公式为：

（3）

（4）

式中，G为梯度强度，I为待平滑的图像，J为平滑后的图像；

（5）

（6）

（7）

峰谷检测方法将灰度图像看作三维图像，即x轴和y轴分别表示像素的位置，z轴表示像素强度；其中灰度值较高的位置和灰度值较低的位置相当于地形图中的山峰和低谷，即局部极大值和局部极小值；

对经过以上3种图像增强方法处理后得到的5类二值图像，包括采用伽马校正方法分别在r=0.125与r=8时所得2类二值图像、边缘检测方法所得二值图像和峰谷检测方法所得局部极小值、极大值2类二值图像；在传统的面积和欧拉数特征基础上，增加了角二阶矩、对比度、相关性、均值、方差、逆差矩和熵共9种特征，提取5类图像共计45维特征；

各个特征的公式表示如下：

角二阶矩：（8）

对比度：（9）

式中，t为灰度级；