CN110348005B - 配网设备状态数据处理方法、装置、计算机设备及介质 - Google Patents
配网设备状态数据处理方法、装置、计算机设备及介质 Download PDFInfo
- Publication number
- CN110348005B CN110348005B CN201910443912.9A CN201910443912A CN110348005B CN 110348005 B CN110348005 B CN 110348005B CN 201910443912 A CN201910443912 A CN 201910443912A CN 110348005 B CN110348005 B CN 110348005B
- Authority
- CN
- China
- Prior art keywords
- processing
- neural network
- network model
- distribution network
- network equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 173
- 238000003062 neural network model Methods 0.000 claims abstract description 111
- 230000011218 segmentation Effects 0.000 claims abstract description 73
- 238000000034 method Methods 0.000 claims abstract description 61
- 238000012098 association analyses Methods 0.000 claims abstract description 59
- 238000004364 calculation method Methods 0.000 claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 48
- 238000012544 monitoring process Methods 0.000 claims abstract description 22
- 238000010219 correlation analysis Methods 0.000 claims abstract description 13
- 230000002159 abnormal effect Effects 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims description 26
- 238000001914 filtration Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012937 correction Methods 0.000 claims description 12
- 238000001514 detection method Methods 0.000 abstract description 8
- 230000000737 periodic effect Effects 0.000 abstract description 7
- 238000004422 calculation algorithm Methods 0.000 description 15
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000007621 cluster analysis Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000012423 maintenance Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J13/00—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Power Engineering (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种配网设备状态数据处理方法、装置、计算机设备及介质。其中配网设备状态数据处理方法包括:获取配网设备的历史状态数据;对历史状态数据进行分词处理,得到多个分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练;根据数据训练的输出参数更新神经网络模型的权值;根据更新后的神经网络模型监测配网设备的状态信息,并在根据状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。相较于传统的周期性检测,本发明能够更加精准、及时地对配网设备的状态进行监控及检修,而且能监控到的逻辑因素也更加丰富。
Description
技术领域
本发明涉及计算机数据处理领域,特别是涉及一种配网设备状态数据处理方法、装置、计算机设备及计算机存储介质。
背景技术
在电力系统的运行过程中,管理员需要周期性检测配电网的状态信息,以便于发现尽快配网设备状态的异常并解决,保证电力系统的正常运行。
随着电网的发展,以及用户对供电可靠性要求的逐渐提高,传统的周期性检测方式已无法满足配电网的运维需求,存在效率低、准确度不高、检测过于主观的缺点。
发明内容
基于此,有必要针对现有配网周期性检修效率低、准确度低、检测过于主观的问题,提供一种配网设备状态数据处理方法及装置。
一种配网设备状态数据处理方法,包括:获取配网设备的历史状态数据;对历史状态数据进行分词处理,得到多个分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练;根据数据训练的输出参数更新神经网络模型的权值;根据更新后的神经网络模型监测配网设备的状态信息,并在根据状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。
上述配网设备状态数据处理方法,基于神经网络算法,并根据配网设备的运行机制对神经网络算法进行优化,将优化后的算法运用于配网设备的状态参数监测。与传统的周期性检测方式对比,上述方法对电力设备进行状态监测得到的数据更加精准与及时,同时能监控到的逻辑因素也更加丰富,能够实现高效、便捷地对配网设备的状态进行监控。
在其中一个实施例中,在对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理之前,上述方法还包括:根据预设的停词库,过滤上述多个分词中的停词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对过滤后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。
在其中一个实施例中,根据预设的停词库,对上述多个分词进行过滤之后,上述方法还包括:查询预设的分词库中是否包含过滤后的分词;若预设的分词库中不包含过滤后的分词,则将过滤后的分词更新到分词库中。
在其中一个实施例中,根据预设的停词库,对上述多个分词进行过滤之后,上述方法还包括:接收修正指令;根据修正指令修正过滤后的分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对修正后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。
在其中一个实施例中,对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对上述多个分词进行文本聚类处理,得到至少一个类别;分别计算每个类别中的关键字;对每个类别中的关键字进行关联分析处理。
在其中一个实施例中,根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练,包括:初始化预设的神经网络模型的至少一个参数;根据至少一个参数及预设的训练数据计算神经网络模型的隐含层输出;根据隐含层输出计算神经网络模型的输出层输出。
在其中一个实施例中,根据数据训练的输出参数更新神经网络模型的权值,包括:将训练数据输入神经网络模型,记录神经网络模型的输出层输出;计算输出层输出与期望输出值之间的误差;根据误差更新神经网络模型的输入层到隐含层的权重。
在其中一个实施例中,提供一种配网设备状态数据处理装置,其包括:获取模块,用于获取配网设备的历史状态数据;分词模块,用于对历史状态数据进行分词处理,得到多个分词;聚类分析模块,用于对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;训练模块,用于根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练;更新模块,用于根据数据训练的输出参数更新神经网络模型的权值;监测模块,用于根据更新后的神经网络模型监听并检测配网设备的状态信息,并在根据所述状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。
上述配网设备状态数据处理装置,基于神经网络算法,并根据配网设备的运行机制对神经网络算法进行优化,将优化后的算法运用于配网设备的状态参数监测。与传统的周期性检测方式对比,上述装置对电力设备进行状态监测得到的数据更加精准与及时,同时能监控到的逻辑因素也更加丰富,能够实现高效、便捷地对配网设备的状态进行监控。
在其中一个实施例中,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现本发明任一实施例的方法的步骤。
在其中一个实施例中,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本发明任一实施例的方法的步骤。
附图说明
图1为本发明一实施例的配网设备状态数据处理方法的流程示意图;
图2为本发明另一实施例的配网设备状态数据处理方法的流程示意图;
图3为本发明又一实施例的配网设备状态数据处理方法的流程示意图;
图4为本发明一实施例的配网设备状态数据处理装置的结构示意图;
图5为本发明一实施例的配网设备状态数据处理装置中的聚类分析模块的结构示意图;
图6为本发明一实施例的配网设备状态数据处理装置中的训练模块的结构示意图;
图7为本发明一实施例的计算机设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在一个实施例中,提供一种网设备状态数据处理方法,其包括如下步骤:获取配网设备的历史状态数据;对上述历史状态数据进行分词处理,得到多个分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;根据上述关联分析处理的输出参数创建神经网络模型,并对上述神经网络模型进行数据训练;根据上述数据训练的输出参数更新上述神经网络模型的权值;根据更新后的神经网络模型监测上述配网设备的状态信息,并在根据状态信息检测到配网设备状态处于异常状态时,对配网设备进行检修。
在一个实施例中,提供一种配网设备状态数据处理方法。如图1所示,此配网设备状态数据处理方法包括如下步骤:
S101,获取配网设备的历史状态数据。
其中,获取电力系统中至少一种配网设备的历史状态数据。
在一个实施例中,获取电力系统中至少一种配网设备在不同条件下的历史状态数据。例如,获取每种配网设备在不同气候、环境、设备年限、负载情况等条件下的历史状态数据。该历史状态数据包括故障数据。
S103,对上述历史状态数据进行分词处理,得到多个分词。
在本步骤,通过分词处理,将历史状态数据中包含的文字序列切分成多个具有意义的词。其中,历史状态数据中包括故障描述信息,经过分词处理后,故障描述信息被切分成多个分词。
在一个实施例中,通过Ansj分词算法对历史状态数据进行分词处理。
S105,对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理。
其中,通过文本聚类处理,将上述多个分词划分为至少一个类别。根据预设的关键词算法分别对每个类别中的分词进行关键词计算,得出每个类别中的至少一个关键词。对同一类别中的至少一个关键词进行关联分析处理,计算出同一类别的多个关键词之间的关联度或支持度。
在一个实施例中,文本聚类处理之后,若存在不属于任何一个类别的分词,则将该分词作为噪声对象进行过滤。
在一个实施例中,如图2所示,步骤S105包括:
S1051,对上述多个分词进行文本聚类处理,得到至少一个类别。
一个实施例中,通过基于密度的聚类算法对上述多个分词进行文本聚类处理,得到至少一个类别,并且同个类别中的任意两个分词密度相连。
其中,设定邻域半径为E,核心对象的阈值为M。则以特定对象为球心,以邻域半径E为半径的球形区域成为该对象的E邻域。其中邻域半径E的界定可以采用距离、余弦相似度、Word2Vec等表征。例如本步骤可采用余弦相似度来表征。若特定对象E邻域内的对象个数大于等于M,则称该对象为核心对象或核心点。
在一个实施例中,确定一个核心点后,从该核心点出发,不断向密度可达的区域扩张,从而密度相连的最大集合,即得到一个包含核心对象和边界对象的最大化区域,区域中任意两点密度相连。
其中,密度相连指的是:给定一个对象集合D,若存在对象o属于D,使对象p和q均从o关于E和M密度可达的,那么对于对象p到q是关于E和M密度相连的。密度可达指的是:给定一个对象集合D,若存在一个对象链p1,p2,p3,...,pn,p1=q,pn=p,对于pi属于D,i属于1~n,p(i+1)是从pi关于E和M直接密度可达的,则称对象p从对象q关于E和M密度可达的。直接密度可达指的是:给定一个对象集合D,若对象p在q的E邻域内,且q是一个核心对象,则称对象p从对象q出发是直接密度可达的。
其中,给定一个对象集合D,若核心对象p中存在对象q,但是q对象自身并非核心对象,则称q为边界对象。给定一个对象集合D,若对象o既不是核心对象,也不是边界对象,则称o为噪声对象。
在一个实施例中,确定任一核心点后,寻找从该核心点出发的所有密度相连的数据点。遍历该核心点的邻域内的所有核心点,寻找与这些数据点密度相连的点,直到没有可以扩充的数据点为止,最后聚类成的簇的边界节点都是非核心数据点。在一个实施例中,寻找没有被聚类的核心点,重复上述步骤,直到数据集中没有新的核心点为止。数据集中没有包含在任何簇中的数据点则识别为异常点,即噪声对象。
S1052,分别计算每个类别中的关键字。
其中,根据每个类别中词语的统计信息计算各类别中的关键字。对于每个类别,通过预处理确定该类别的候选词集合,采用特征值来量化每个候选词的分数,根据分数从候选词中确定该类别的关键词。
可选地,上述特征值是基于词频(TF)和逆文档概率(IDF)的特征值。或者,上述特征值是基于文档位置信息的特征值。或者,上述特征值是基于词跨度计算的特征值。
S1053,对每个类别中的关键字进行关联分析处理。
其中,本步骤包括:计算每个类别中的各关键字之间的支持度。支持度指的是几个关联的数据在数据集中出现的次数占总数据集的比重,或者说是几个数据关联出现的概率。
在一个实施例中,对每个类别中的任意三个关键字X、Y和Z,根据如下公式计算关键字X、关键字Y和关键字Z之间的支持度S(X,Y,Z):其中:num(XYZ)为关键字X、关键字Y和关键字Z同时出现的次数,num(A)为关键字的总数量。
S107,根据上述关联分析处理的输出参数创建神经网络模型,并对上述神经网络模型进行数据训练。
在一个实施例中,如图3所示,步骤S107包括如下步骤:
S1071,初始化预设的神经网络模型的至少一个参数。
具体地,本步骤包括:初始化预设的神经网络模型的输入层节点个数为n、隐含层节点个数l、输出层的节点个数m、输入层到隐含层的权重ωij、隐含层到输出层的权重ωjk、输入层到隐含层的偏置aj、隐含层到输出层的偏置bk和学习速率为η;以及,初始化激励函数g(x)为
S109,根据上述数据训练的输出参数更新上述神经网络模型的权值。
在一个实施例中,步骤S109包括:将训练数据输入上述神经网络模型,记录上述神经网络模型的输出层输出。计算上述输出层输出与期望输出值之间的误差;例如,根据计算上述输出层输出与期望输出值之间的误差,其中Ok为上述神经网络模型的输出层输出,YK为期望输出值;其中,i=1…n,j=1…l,k=1…m。根据上述误差更新上述神经网络模型的输入层到隐含层的权重。
在一个实施例中,以误差函数达到最小值为条件,更新神经网络模型的输入层到隐含层的权重。具体地,根据如下公式更新上述权重:
其中,ek=Yk-Ok。
S111,根据更新后的神经网络模型监测上述配网设备的状态信息,并在根据状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。
其中,将权值更新后的神经网络模型运用在配网系统中,用于检测配网设备的状态信息,包括监测配网设备的运行状态、风险信息等。当根据状态信息检测到配网设备状态处于异常状态时,对配网设备进行检修。
上述配网设备状态数据处理方法,基于神经网络算法,并根据配网设备的运行机制对神经网络算法进行优化,将优化后的算法运用于配网设备的状态参数监测。与传统的周期性检测方式对比,上述方法对电力设备进行状态监测得到的数据更加精准与及时,同时能监控到的逻辑因素也更加丰富,能够实现高效、便捷地对配网设备的状态进行监控。本发明实施例较大程度提高了配网的供电可靠性和检修效率,为配网设备的性能支撑与运行保护工作起到很大的帮助作用。
在一个实施例中,在步骤S105之前,上述配网设备状态数据处理方法还包括如下步骤:根据预设的停词库,过滤上述多个分词中的停词。其中,停词指的是不需要处理的词,可以是标点符号或者是常见的语气词、副词、连接词等。本实施例中,预先设置了停词库,停词库中包括至少一个停词。在步骤S103之后,将得到的每个分词与停词库进行对比,若得到的分词存在于停词库中,则将该分词过滤掉。此时,步骤S105包括:对过滤后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。这样,可以减少计算量,提升计算效率。
在一个实施例中,在根据预设的停词库,过滤上述多个分词中的停词之后,上述配网设备状态数据处理方法还包括如下步骤:查询预设的分词库中是否包含过滤后的分词;若预设的分词库中不包含过滤后的分词,则将过滤后的分词更新到上述分词库中。这样,能够增加分词库中的样本数,使得分词库愈加完善,提升后续分词的准确性。
为了提升数据处理的准确性,在一个实施例中,在根据预设的停词库,对上述多个分词进行过滤之后,上述配网设备状态数据处理方法还包括如下步骤:接收修正指令;根据上述修正指令修正过滤后的分词;相应地,步骤S105包括:对修正后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。这样,当自动分词的结果不够准确时,根据修正指令对分词结果进行修正,以确保分词的准确性,从而保证后续数据处理的准确性。进一步地,还可根据修正后的分词更新分词库,以提升系统分词的准确性。
在一个实施例中,如图4所示,提供一种配网设备状态数据处理装置40,其包括获取模块401、分词模块402、聚类分析模块403、训练模块404、更新模块405及监测模块406,其中:获取模块401用于获取配网设备的历史状态数据;分词模块402用于对上述历史状态数据进行分词处理,得到多个分词;聚类分析模块403用于对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;训练模块404用于根据上述关联分析处理的输出参数创建神经网络模型,并对上述神经网络模型进行数据训练;更新模块405用于根据上述数据训练的输出参数更新上述神经网络模型的权值;监测模块406用于根据更新后的神经网络模型监测上述配网设备的状态信息,并在根据状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。
上述配网设备状态数据处理装置,基于神经网络算法,并根据配网设备的运行机制对神经网络算法进行优化,将优化后的算法运用于配网设备的状态参数监测与检修。与传统的周期性检测方式对比,上述装置对电力设备进行状态监测得到的数据更加精准与及时,同时能监控到的逻辑因素也更加丰富,能够实现高效、便捷地对配网设备的状态进行监控。本发明实施例较大程度提高了配网的供电可靠性和检修效率,为配网设备的性能支撑与运行保护工作起到很大的帮助作用。
在一个实施例中,为了可以减少计算量,提升计算效率,上述配网设备状态数据处理装置还包括过滤模块,过滤模块用于根据预设的停词库,过滤所述多个分词中的停词;此时,聚类分析模块403还用于对过滤后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。
在一个实施例中,为了完善分词库,上述配网设备状态数据处理装置还包括查询模块,用于查询预设的分词库中是否包含过滤后的分词;上述分词模块402还用于当预设的分词库中不包含过滤后的分词时,则将过滤后的分词更新到所述分词库中。这样,能够增加分词库中的样本数,使得分词库愈加完善,提升后续分词的准确性。
在一个实施例中,为了提升数据处理的准确性,上述配网设备状态数据处理装置还包括:接收模块,用于接收修正指令;修正模块,用于根据所述修正指令修正过滤后的分词;此时,上述聚类分析模块403还用于对修正后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。这样,当自动分词的结果不够准确时,根据修正指令对分词结果进行修正,以确保分词的准确性,从而保证后续数据处理的准确性。进一步地,还可根据修正后的分词更新分词库,以提升系统分词的准确性。
在一个实施例中,如图5所示,聚类分析模块403包括聚类单元4031、第一计算单元4032和关联分析单元4033,其中聚类单元4031用于对所述多个分词进行文本聚类处理,得到至少一个类别;第一计算单元4032用于分别计算每个类别中的关键字;关联分析单元4033用于对每个类别中的关键字进行关联分析处理。
在一个实施例中,关联分析单元4033还用于计算每个类别中的各关键字之间的支持度。
在一个实施例中,关联分析单元4033还用于对每个类别中的任意两个关键字X和Y,根据如下公式计算关键字X和关键字Y之间的支持度S(X,Y):其中,num(XY)为关键字X和关键字Y同时出现的次数,num(A)为关键字的总数量。
在一个实施例中,关联分析单元4033还用于对每个类别中的任意三个关键字X、Y和Z,根据如下公式计算关键字X、关键字Y和关键字Z之间的支持度S(X,Y,Z):其中,num(XYZ)为关键字X、关键字Y和关键字Z同时出现的次数,num(A)为关键字的总数量。
在一个实施例中,如图6所示,训练模块404包括初始化单元4041、第二计算单元4042和第三计算单元4043,其中初始化单元4041用于初始化预设的神经网络模型的至少一个参数;第二计算单元4042用于根据所述至少一个参数及预设的训练数据计算所述神经网络模型的隐含层输出;第三计算单元4043用于根据所述隐含层输出计算所述神经网络模型的输出层输出。
在一个实施例中,初始化单元4041还用于初始化预设的神经网络模型的输入层节点个数为n、隐含层节点个数l、输出层的节点个数m、输入层到隐含层的权重ωij、隐含层到输出层的权重ωik、输入层到隐含层的偏置aj、隐含层到输出层的偏置bk和学习速率为η;以及,初始化激励函数g(x)为
在一个实施例中,更新模块包括:记录单元、第四计算单元和权重更新单元,其中记录单元用于将训练数据输入所述神经网络模型,记录所述神经网络模型的输出层输出;第四计算单元用于计算所述输出层输出与期望输出值之间的误差;权重更新单元用于根据所述误差更新所述神经网络模型的输入层到隐含层的权重。
在一个实施例中,如图7所示,提供一种计算机设备,其包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现如下步骤:获取配网设备的历史状态数据;对历史状态数据进行分词处理,得到多个分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练;根据数据训练的输出参数更新神经网络模型的权值;根据更新后的神经网络模型监测配网设备的状态信息,并在根据状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。
在一个实施例中,在对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理之前,处理器执行计算机程序时还实现如下步骤:根据预设的停词库,过滤上述多个分词中的停词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对过滤后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。
在一个实施例中,根据预设的停词库,对上述多个分词进行过滤之后,处理器执行计算机程序时还实现如下步骤:查询预设的分词库中是否包含过滤后的分词;若预设的分词库中不包含过滤后的分词,则将过滤后的分词更新到分词库中。
在一个实施例中,根据预设的停词库,对上述多个分词进行过滤之后,处理器执行计算机程序时还实现如下步骤:接收修正指令;根据修正指令修正过滤后的分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对修正后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。
在一个实施例中,对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对上述多个分词进行文本聚类处理,得到至少一个类别;分别计算每个类别中的关键字;对每个类别中的关键字进行关联分析处理。
在一个实施例中,对每个类别中的关键字进行关联分析处理,包括:计算每个类别中的各关键字之间的支持度。
在一个实施例中,计算每个类别中的各关键字之间的支持度,包括:对每个类别中的任意两个关键字X和Y,根据如下公式计算关键字X和关键字Y之间的支持度S(X,Y):其中,num(XY)为关键字X和关键字Y同时出现的次数,num(A)为关键字的总数量。
在一个实施例中,计算每个类别中的各关键字之间的支持度,包括:对每个类别中的任意三个关键字X、Y和Z,根据如下公式计算关键字X、关键字Y和关键字Z之间的支持度S(X,Y,Z):其中,num(XYZ)为关键字X、关键字Y和关键字Z同时出现的次数,num(A)为关键字的总数量。
在一个实施例中,根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练,包括:初始化预设的神经网络模型的至少一个参数;根据至少一个参数及预设的训练数据计算神经网络模型的隐含层输出;根据隐含层输出计算神经网络模型的输出层输出。
在一个实施例中,初始化神经网络模型的至少一个参数,包括:初始化预设的神经网络模型的输入层节点个数为n、隐含层节点个数l、输出层的节点个数m、输入层到隐含层的权重ωij、隐含层到输出层的权重ωjk、输入层到隐含层的偏置aj、隐含层到输出层的偏置bk和学习速率为η;初始化激励函数g(x)为
在一个实施例中,根据数据训练的输出参数更新神经网络模型的权值,包括:将训练数据输入神经网络模型,记录神经网络模型的输出层输出;计算输出层输出与期望输出值之间的误差;根据误差更新神经网络模型的输入层到隐含层的权重。
在一个实施例中,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如下步骤:获取配网设备的历史状态数据;对历史状态数据进行分词处理,得到多个分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理;根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练;根据数据训练的输出参数更新神经网络模型的权值;根据更新后的神经网络模型监测配网设备的状态信息,并在根据状态信息检测配网设备状态处于异常状态时,对配网设备进行检修。
在一个实施例中,在对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理之前,计算机程序被处理器执行时还实现如下步骤:根据预设的停词库,过滤上述多个分词中的停词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对过滤后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。
在一个实施例中,根据预设的停词库,对上述多个分词进行过滤之后,计算机程序被处理器执行时还实现如下步骤:查询预设的分词库中是否包含过滤后的分词;若预设的分词库中不包含过滤后的分词,则将过滤后的分词更新到分词库中。
在一个实施例中,根据预设的停词库,对上述多个分词进行过滤之后,计算机程序被处理器执行时还实现如下步骤:接收修正指令;根据修正指令修正过滤后的分词;对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对修正后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。
在一个实施例中,对上述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对上述多个分词进行文本聚类处理,得到至少一个类别;分别计算每个类别中的关键字;对每个类别中的关键字进行关联分析处理。
在一个实施例中,对每个类别中的关键字进行关联分析处理,包括:计算每个类别中的各关键字之间的支持度。
在一个实施例中,计算每个类别中的各关键字之间的支持度,包括:对每个类别中的任意两个关键字X和Y,根据如下公式计算关键字X和关键字Y之间的支持度S(X,Y):其中,num(XY)为关键字X和关键字Y同时出现的次数,num(A)为关键字的总数量。
在一个实施例中,计算每个类别中的各关键字之间的支持度,包括:对每个类别中的任意三个关键字X、Y和Z,根据如下公式计算关键字X、关键字Y和关键字Z之间的支持度S(X,Y,Z):其中,num(XYZ)为关键字X、关键字Y和关键字Z同时出现的次数,num(A)为关键字的总数量。
在一个实施例中,根据关联分析处理的输出参数创建神经网络模型,并对神经网络模型进行数据训练,包括:初始化预设的神经网络模型的至少一个参数;根据至少一个参数及预设的训练数据计算神经网络模型的隐含层输出;根据隐含层输出计算神经网络模型的输出层输出。
在一个实施例中,初始化神经网络模型的至少一个参数,包括:初始化预设的神经网络模型的输入层节点个数为n、隐含层节点个数l、输出层的节点个数m、输入层到隐含层的权重ωij、隐含层到输出层的权重ωik、输入层到隐含层的偏置aj、隐含层到输出层的偏置bk和学习速率为η;初始化激励函数g(x)为
在一个实施例中,根据数据训练的输出参数更新神经网络模型的权值,包括:将训练数据输入神经网络模型,记录神经网络模型的输出层输出;计算输出层输出与期望输出值之间的误差;根据误差更新神经网络模型的输入层到隐含层的权重。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种配网设备状态数据处理方法,其特征在于,所述方法包括:
获取配网设备的历史状态数据;
对所述历史状态数据进行分词处理,得到多个分词;
对所述多个分词进行文本聚类处理,得到至少一个类别,且同类别中的任意两个分词密度相连;
对每个类别进行关键字计算处理,所述关键字计算处理的过程采用特征值来量化;
对所述每个类别中的所述关键字进行关联分析处理;
根据所述关联分析处理的输出参数创建神经网络模型,并对所述神经网络模型进行数据训练;
根据所述数据训练的输出参数更新所述神经网络模型的权值;
根据更新后的神经网络模型监测所述配网设备的状态信息,并在根据所述状态信息检测所述配网设备状态处于异常状态时,对所述配网设备进行检修。
2.根据权利要求1所述的方法,其特征在于,在对所述多个分词进行文本聚类处理、关键字计算处理及关联分析处理之前,所述方法还包括:
根据预设的停词库,过滤所述多个分词中的停词;
所述对所述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对过滤后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。
3.根据权利要求2所述的方法,其特征在于,根据预设的停词库,对所述多个分词进行过滤之后,所述方法还包括:
查询预设的分词库中是否包含过滤后的分词;
若预设的分词库中不包含过滤后的分词,则将过滤后的分词更新到所述分词库中。
4.根据权利要求2所述的方法,其特征在于,根据预设的停词库,对所述多个分词进行过滤之后,所述方法还包括:
接收修正指令;
根据所述修正指令修正过滤后的分词;
所述对所述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:对修正后的多个分词进行文本聚类处理、关键字计算处理及关联分析处理。
5.根据权利要求1至4中任一项所述的方法,其特征在于,对所述多个分词进行文本聚类处理、关键字计算处理及关联分析处理,包括:
对所述多个分词进行文本聚类处理,得到至少一个类别;
分别计算每个类别中的关键字;
对每个类别中的关键字进行关联分析处理。
6.根据权利要求1所述的方法,其特征在于,根据所述关联分析处理的输出参数创建神经网络模型,并对所述神经网络模型进行数据训练,包括:
初始化预设的神经网络模型的至少一个参数;
根据所述至少一个参数及预设的训练数据计算所述神经网络模型的隐含层输出;
根据所述隐含层输出计算所述神经网络模型的输出层输出。
7.根据权利要求1所述的方法,其特征在于,根据所述数据训练的输出参数更新所述神经网络模型的权值,包括:
将训练数据输入所述神经网络模型,记录所述神经网络模型的输出层输出;
计算所述输出层输出与期望输出值之间的误差;
根据所述误差更新所述神经网络模型的输入层到隐含层的权重。
8.一种配网设备状态数据处理装置,其特征在于,所述装置包括:
获取模块,用于获取配网设备的历史状态数据;
分词模块,用于对所述历史状态数据进行分词处理,得到多个分词;
聚类模块,用于对所述多个分词进行文本聚类处理,得到至少一个类别,且同类别中的任意两个分词密度相连;
计算模块,用于对每个类别进行关键字计算处理,所述关键字计算处理的过程采用特征值来量化;
关联模块,用于对所述每个类别中的所述关键字进行关联分析处理;
训练模块,用于根据所述关联分析处理的输出参数创建神经网络模型,并对所述神经网络模型进行数据训练;
更新模块,用于根据所述数据训练的输出参数更新所述神经网络模型的权值;
监测模块,用于根据更新后的神经网络模型监测所述配网设备的状态信息,并在根据所述状态信息检测所述配网设备状态处于异常状态时,对所述配网设备进行检修。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910443912.9A CN110348005B (zh) | 2019-05-27 | 2019-05-27 | 配网设备状态数据处理方法、装置、计算机设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910443912.9A CN110348005B (zh) | 2019-05-27 | 2019-05-27 | 配网设备状态数据处理方法、装置、计算机设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110348005A CN110348005A (zh) | 2019-10-18 |
CN110348005B true CN110348005B (zh) | 2022-02-01 |
Family
ID=68174370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910443912.9A Active CN110348005B (zh) | 2019-05-27 | 2019-05-27 | 配网设备状态数据处理方法、装置、计算机设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110348005B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112510699A (zh) * | 2020-11-25 | 2021-03-16 | 国网湖北省电力有限公司咸宁供电公司 | 一种基于大数据的变电站二次设备状态分析方法及设备 |
CN116207845B (zh) * | 2022-11-28 | 2024-05-28 | 无锡广盈集团有限公司 | 一种用于电力设备保护的自动化监控方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787809A (zh) * | 2016-03-10 | 2016-07-20 | 国家电网公司 | 一种基于数据挖掘的电网设备运行状态智能校验方法 |
CN107977710A (zh) * | 2017-12-21 | 2018-05-01 | 南方电网科学研究院有限责任公司 | 用电异常数据检测方法和装置 |
CN109726246A (zh) * | 2018-12-13 | 2019-05-07 | 贵州电网有限责任公司 | 一种基于数据挖掘和可视化的电网事故关联原因回溯方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103914735B (zh) * | 2014-04-17 | 2017-03-29 | 北京泰乐德信息技术有限公司 | 一种基于神经网络自学习的故障识别方法及系统 |
-
2019
- 2019-05-27 CN CN201910443912.9A patent/CN110348005B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787809A (zh) * | 2016-03-10 | 2016-07-20 | 国家电网公司 | 一种基于数据挖掘的电网设备运行状态智能校验方法 |
CN107977710A (zh) * | 2017-12-21 | 2018-05-01 | 南方电网科学研究院有限责任公司 | 用电异常数据检测方法和装置 |
CN109726246A (zh) * | 2018-12-13 | 2019-05-07 | 贵州电网有限责任公司 | 一种基于数据挖掘和可视化的电网事故关联原因回溯方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110348005A (zh) | 2019-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111242323B (zh) | 用于修理机器次优操作的主动自动系统和方法 | |
CN111914090B (zh) | 一种企业行业分类识别及其特征污染物识别的方法及装置 | |
US20210041862A1 (en) | Malfunction early-warning method for production logistics delivery equipment | |
JP3209163B2 (ja) | 分類装置 | |
JP2021518024A (ja) | 機械学習アルゴリズムのためのデータを生成する方法、システム | |
CN103513983A (zh) | 用于预测性警报阈值确定工具的方法和系统 | |
CN111625516A (zh) | 检测数据状态的方法、装置、计算机设备和存储介质 | |
CN105934765B (zh) | 从异常数据构造反常模型的方法 | |
Zheng et al. | Fault diagnosis method based on supervised particle swarm optimization classification algorithm | |
Zhao et al. | Probabilistic remaining useful life prediction based on deep convolutional neural network | |
US20220237407A1 (en) | Storage medium, estimation method, and information processing device, relearning program, and relearning method | |
CN113449098A (zh) | 日志的聚类方法、装置、设备及存储介质 | |
CN110348005B (zh) | 配网设备状态数据处理方法、装置、计算机设备及介质 | |
CN113657814A (zh) | 一种航空网络风险预测方法及风险等级评估方法 | |
CN114139636B (zh) | 异常作业处理方法及装置 | |
CN114637649B (zh) | 一种基于oltp数据库系统的告警根因分析方法及装置 | |
CN113447813B (zh) | 海上风力发电机组的故障诊断方法及设备 | |
CN113505818A (zh) | 改进决策树算法的熔铝炉能耗异常诊断方法和系统及设备 | |
US20240320111A1 (en) | Method and device for predicting errors in a computing system | |
CN118245264A (zh) | 服务器故障处理方法、装置、电子设备及介质 | |
CN118035757A (zh) | 一种基于大语言模型的电驱总成故障诊断方法及装置 | |
CN117909864A (zh) | 一种电力故障预测系统及方法 | |
KR101151013B1 (ko) | 타이어 성능 평가 방법 | |
Liu et al. | AutoSlicer: Scalable Automated Data Slicing for ML Model Analysis | |
CN114861753A (zh) | 一种基于大规模网络的数据分类方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200924 Address after: 510620 Tianhe District, Guangzhou, Tianhe South Road, No. two, No. 2, No. Applicant after: Guangzhou Power Supply Bureau of Guangdong Power Grid Co.,Ltd. Address before: 510620 Tianhe District, Guangzhou, Tianhe South Road, No. two, No. 2, No. Applicant before: GUANGZHOU POWER SUPPLY Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |