CN110428082A - 基于注意力神经网络的水质预测方法 - Google Patents
基于注意力神经网络的水质预测方法 Download PDFInfo
- Publication number
- CN110428082A CN110428082A CN201910466102.5A CN201910466102A CN110428082A CN 110428082 A CN110428082 A CN 110428082A CN 201910466102 A CN201910466102 A CN 201910466102A CN 110428082 A CN110428082 A CN 110428082A
- Authority
- CN
- China
- Prior art keywords
- water quality
- neural network
- layer
- attention
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 204
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 115
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 49
- 239000013598 vector Substances 0.000 claims description 95
- 239000011159 matrix material Substances 0.000 claims description 60
- 230000002457 bidirectional effect Effects 0.000 claims description 40
- 238000003062 neural network model Methods 0.000 claims description 30
- 210000004027 cell Anatomy 0.000 claims description 12
- 210000002569 neuron Anatomy 0.000 claims description 12
- 238000002759 z-score normalization Methods 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 230000002441 reversible effect Effects 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 abstract description 2
- 238000010276 construction Methods 0.000 abstract 3
- 230000008859 change Effects 0.000 description 4
- 239000003344 environmental pollutant Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 231100000719 pollutant Toxicity 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000008235 industrial water Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000008239 natural water Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A20/00—Water conservation; Efficient water supply; Efficient water use
- Y02A20/152—Water filtration
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Feedback Control In General (AREA)
Abstract
基于注意力神经网络的水质预测方法,包括如下步骤:步骤1:采集某一水质指标的数据;步骤2:将该水质指标的数据进行z‑score标准化处理;步骤3:使用处理好的该水质指标的数据构造训练集Training;步骤4:构造基于注意力神经网络的水质预测模型;步骤5:使用构造的训练集Training训练构造的基于注意力神经网络的水质预测模型;步骤6:使用训练好的基于注意力神经网络的水质预测模型预测未来时刻的该水质指标的数据。本发明提出的水质预测方法,在双向LSTM神经网络中引入注意力机制,考虑每个时刻水质指标的数据对预测结果的重要程度不同,赋予每个时刻水质指标不同的权重,从而降低了水质预测时产生的相对误差,提高了预测精确度。
Description
技术领域
本发明属于水质预测领域,具体为一种基于注意力神经网络的水质预测方法。
背景技术
近几年来,随着我国经济的快速发展,自然或人为因素导致天然的水体不断恶化,同时生活及工业用水量剧增导致陆地水逐渐枯竭,因此水问题俨然已经成为了我国最严重的环境问题。在水体中含有各种污染物,它们的浓度的高低直接影响水质的好坏,如果能够提前发现水质问题,分析原因,制定相应的预防措施,改善水体水质环境,从一定程度上可以缓解我国水资源不足问题,因此预测水质指标变化趋势的研究具有重要现实意义。
目前水质预测方法有很多,主流预测方法是神经网络方法。BP神经网络能够对水质指标的数据变化趋势进行预测,提高了水质预测精确度,但是BP神经网络容易陷入局部极小值,且收敛速度非常慢;LSTM循环神经网络解决了神经网络中的长期依赖问题,能够记住长期信息,而且预测水质指标的数据变化趋势相比于BP神经网络也更加准确。虽然LSTM在水质预测上取得较好的精确度,但是LSTM神经网络也存在一些局限性,如不同时刻水质指标对预测结果的影响程度是相同的,并没有考虑最近时刻水质指标可能会预测结果影响更大的问题。
发明内容
针对上述问题,本发明提出了一种基于注意力神经网络的水质预测方法。该方法在双向LSTM神经网络中引入注意力机制,考虑每个时刻水质指标的数据对预测结果的重要程度不同,赋予每个时刻水质指标不同的权重,从而降低了水质预测时产生的相对误差,提高了预测精确度。
基于注意力神经网络的水质预测方法,包括如下步骤:
步骤1:采集某一水质指标的数据;
步骤2:将步骤1采集到的该水质指标的数据进行z-score标准化处理;
步骤3:使用步骤2中处理好的该水质指标的数据构造训练集Training;
步骤4:构造基于注意力神经网络的水质预测模型;
步骤5:使用步骤3中构造的训练集Training训练步骤4中构造的基于注意力神经网络的水质预测模型;
步骤6:使用步骤5中训练好的基于注意力神经网络的水质预测模型预测未来时刻的该水质指标的数据。
进一步地,所述步骤1中,监测一定时间内某一水域,获得按时间排序的该水质指标的数据集合G,G={g1,g2,…gi,…gn},其中n表示该水质指标的数据集合G中元素的数量,gi为第i个时间节点的该水质指标的数据。
进一步地,所述步骤2中,使用z-score标准化方法对每个时间节点的该水质指标的数据进行标准化处理,通过下式计算
其中,gi表示z-score标准化前第i个时间节点的该水质指标的数据,表示z-score标准化后第i个时间节点的该水质指标的数据,μx与σx分别表示该水质指标的数据集合的均值与标准差;
通过对采集到的该水质指标的数据进行z-score标准化,获得z-score标准化后的该水质指标的数据集合其中n表示z-score标准化后该水质指标的数据集合G*中元素的数量,gi *为第i个时间节点z-score标准化后的该水质指标的数据。
进一步地,所述步骤3中,将处理好的该水质指标的数据集合G*用于构造训练集Training,构造训练集Training的具体步骤如下:
构造训练集Training={{xi,yi}},0<i≤m,其中,m表示水质指标训练样本数量;设置d为窗口大小,xi表示第i个训练样本的输入,其中xi中包含d个时间节点的该水质指标的数据;yi表示第i个训练样本输出,表示z-score标准化后第i+d个时间节点的该水质指标的数据。
进一步地,所述步骤4中,构造双向LSTM神经网络模型和前馈注意力模型,将二种模型构造为基于注意力神经网络的水质预测模型,具体步骤如下:
步骤4-1:构造双向LSTM神经网络模型,具体步骤如下:
步骤4-1-1:使用向前和向后两个结构相同的LSTM神经网络,输出隐状态矩阵H:
H=(h1,h2,...,hq)
其中,hq表示双向LSTM神经网络在第q个时间节点输出的隐状态向量;设置q的值等于d的值,设置单向LSTM神经网络隐状态单元数为u,hq为长度u的向量;
步骤4-1-2:设置双向LSTM神经网络输入层到隐含层的连接权重矩阵U、隐含层到隐含层的连接权重矩阵W、隐含层到输出层的连接权重矩阵V均为随机小实数;
步骤4-1-3:设置双向LSTM神经网络激活函数;将双向LSTM神经网络中的输入门、遗忘门和输出门的激活函数为sigmoid函数,候选门中的激活函数为tanh函数;
步骤4-2:构造前馈注意力模型,具体步骤如下:
步骤4-2-1:使用两层感知器作为前馈注意力模型的内部隐含层;设置两层感知器第一层单元数为da,设置两层感知器第二层单元数为1,其中,双向LSTM神经网络模型到前馈注意力模型中的第一层感知器的连接权重矩阵为wa1,wa1为大小da×u的连接权重矩阵,前馈注意力模型中的第一层感知器到第二层感知器的连接权重向量为wa2,wa2为长度da的连接权重向量;
步骤4-2-2:设置前馈注意力模型初始权重参数为随机小实数;
步骤4-3:使用全连接层作为基于注意力神经网络的水质预测模型的输出层;设置全连接层单元数为1,其中,前馈注意力模型到全连接层之间的连接权重向量为Wy,Wy是长度为μ的连接权重向量;设置全连接层初始权重参数为随机小实数;
步骤4-4:将步骤4-1构造好的双向LSTM神经网络模型和步骤4-2构造好的前馈注意力模型构造为基于注意力神经网络的水质预测模型;具体步骤如下:
步骤4-4-1:使用步骤4-1中构造好的双向LSTM神经网络模型作为基于注意力神经网络的水质预测模型的输入层,双向LSTM神经网络模型的输出为隐状态矩阵H;
步骤4-4-2:使用步骤4-2中构造好的前馈注意力模型作为基于注意力神经网络的水质预测模型的隐含层,将步骤4-4-1中输出的隐状态矩阵H作为前馈注意力模型的输入,前馈注意力模型的输出为上下文向量c;
步骤4-4-3:使用步骤4-2中构造好的全连接层作为基于注意力神经网络的水质预测模型的输出层,将步骤4-4-2中输出的上下文向量c作为全连接层的输入,全连接层的输出为预测值;
步骤4-4-4:基于注意力神经网络的水质预测模型选用均方误差作为损失函数。
进一步地,所述步骤5中,训练基于注意力神经网络的水质预测模型具体步骤如下:
步骤5-1:将训练集Training中输入到注意力神经网络的水质预测模型,通过模型得到与xi对应的实际输出
步骤5-2:使用均方误差公式计算实际预测值与期望输出值的误差;利用反向传播算法将误差反向传递给每一个神经元,然后每个神经元会采用随机梯度下降更新每条连接线的连接权重;其中,在双向LSTM神经网络模型中需要更新的连接权重矩阵为输入层到隐含层的连接权重矩阵U、隐含层到隐含层的连接权重矩阵W、隐含层到输出层的连接权重矩阵V;在前馈注意力模型中需要更新的连接权重是双向LSTM神经网络模型到前馈注意力模型中的第一层感知器的连接权重矩阵wa1和前馈注意力模型中的第一层感知器到第二层感知器的连接权重向量wa2;在全连接层中需要更新的连接权重是前馈注意力模型到全连接层之间的连接权重向量Wy;
步骤5-3:设置迭代100次,在迭代过程中不断更新基于注意力神经网络预测模型中的连接权重。
进一步地,所述步骤6中,预测未来时刻的该水质指标的数据具体步骤如下:
步骤6-1:获得该水质指标的当前数据,并将其进行z-score标准化,得到z-score标准化后该水质指标的当前数据:
步骤6-2:将输入到训练好的基于注意力神经网络的水质预测模型的输入层中,即双向LSTM神经网络模型中,其中,前向LSTM神经网络通过下式计算隐状态向量
其中,it表示该水质指标当前数据中的第t个时间节点的需要更新的信息,ft表示该水质指标当前数据中的第t个时间节点的需要丢弃的信息,ot表示该水质指标当前数据中的第t个时间节点的需要输出的信息;表示该水质指标当前数据中的第t个时间节点的候选门,候选门是备选更新内容的神经元;ct表示该水质指标当前数据中的第t个时间节点的细胞状态,细胞状态是决定了需要输出信息内容的神经元;表示该水质指标当前数据中的第t个时间节点的输出的隐状态向量,ht-1表示该水质指标当前数据中的第t-1个时间节点的输出的隐状态向量,ct-1表示该水质指标当前数据中的第t-1个时间节点的细胞状态;
xt *是长度为θ的向量,wix、wfx、wox和wcx是大小为u×θ的连接权重矩阵,其中wix、wfx、wox和wcx是输入数据分别到输入门、遗忘门、输出门和候选门的连接权重矩阵;wih、wfh、woh和woh是大小为u×u的连接权重矩阵,其中wih、wfh、woh和woh是输入门、遗忘门、输出门和候选门分别到隐层单元的连接矩阵权重;wic、wfc、woc和wcc是大小为u×u的连接权重矩阵,其中wic、wfc、woc和wcc是输入门、遗忘门、输出门和候选门分别到细胞状态的连接权重矩阵;bi、bf、bo和bc分别是输入门、遗忘门、输出门和候选门的偏置向量,bi、bf、bo和bc是长度为θ的偏置向量;
同理,通过相似前向LSTM神经网络公式计算后向LSTM神经网络隐状态向量
步骤6-3:两个单向LSTM神经网络分别得到隐状态向量和通过下式计算隐状态向量ht:
其中,表示前向LSTM神经网络的隐状态向量,表示后向LSTM神经网络的隐状态向量,表示将前向和后向的LSTM神经网络的隐状态向量进行拼接,得到长度为2u的向量,Whh是大小u×2u的连接权重矩阵;
步骤6-4:将ht输入到基于注意力神经网络的水质预测模型的隐含层中,即前馈注意力模型,通过下式计算上下文向量c;
βt=tanh(wa1ht)
et=wa2βt
at=softmax(et)
其中,wa1为大小为da×u的连接权重矩阵,wa2为长度为da的连接权重向量。ht表示第t个时间节点双向LSTM神经网络模型输出的隐状态向量,βt表示第t个时间节点第一层感知器输出的长度为da的连接权重向量,et表示第t个时间节点隐状态向量的相似度权重,at表示第t个时间节点的隐状态向量归一化后的相似度权重,C为长度u的向量;
步骤6-5:使用全连接层作为输出层,将步骤6-4输出上下文向量c作为输入,输出预测值通过下式计算:
其中,Wy表示前馈注意力模型到全连接层长度为μ的连接权重向量。
本发明达到的有益效果为:本发明针对LSTM神经网络不考虑每个时刻水质指标的数据对预测结果有着不同重要程度,即不考虑赋予每个时刻水质指标的数据不同的权重,提出一种基于注意力神经网络的水质预测方法,该方法考虑水质样本中每个时刻水质指标的数据对预测结果的重要程度不同,赋予水质样本中每个时刻水质指标的数据不同的权重,从而降低了水质预测时产生的相对误差,提高预测精确度,使得水体水质的预测具有更高实时性和广泛的实用性。
附图说明
图1为基于注意力神经网络的水质预测方法流程图。
图2为注意力神经网络的水质预测模型图。
具体实施方式
下面结合说明书附图对本发明的技术方案做进一步的详细说明。
基于注意力神经网络的水质预测方法,包括如下步骤:
步骤1:采集某一水质指标的数据。
所述步骤1中,监测一定时间内某一水域,获得按时间排序的该水质指标的数据集合G,G={g1,g2,…gi,…gn},其中n表示该水质指标的数据集合G中元素的数量,gi为第i个时间节点的该水质指标的数据。
步骤2:将步骤1采集到的该水质指标的数据进行z-score标准化处理。
所述步骤2中,使用z-score标准化方法对每个时间节点的该水质指标的数据进行标准化处理,通过下式计算
其中,gi表示z-score标准化前第i个时间节点的该水质指标的数据,表示z-score标准化后第i个时间节点的该水质指标的数据,μx与σx分别表示该水质指标的数据集合的均值与标准差。
通过对采集到的该水质指标的数据进行z-score标准化,获得z-score标准化后的该水质指标的数据集合其中n表示z-score标准化后该水质指标的数据集合G*中元素的数量,gi *为第i个时间节点z-score标准化后的该水质指标的数据。
步骤3:使用步骤2中处理好的该水质指标的数据构造训练集Training。
所述步骤3中,将处理好的该水质指标的数据集合G*用于构造训练集Training,构造训练集Training的具体步骤如下:
构造训练集Training={{xi,yi}},0<i≤m,其中,m表示水质指标训练样本数量;设置d为窗口大小,xi表示第i个训练样本的输入,其中xi中包含d个时间节点的该水质指标的数据;yi表示第i个训练样本输出,表示z-score标准化后第i+d个时间节点的该水质指标的数据。
步骤4:构造基于注意力神经网络的水质预测模型。
所述步骤4中,构造双向LSTM神经网络模型和前馈注意力模型,将二种模型构造为基于注意力神经网络的水质预测模型,具体步骤如下:
步骤4-1:构造双向LSTM神经网络模型,具体步骤如下:
步骤4-1-1:使用向前和向后两个结构相同的LSTM神经网络,输出隐状态矩阵H:
H=(h1,h2,...,hq)
其中,hq表示双向LSTM神经网络在第q个时间节点输出的隐状态向量;设置q的值等于d的值,设置单向LSTM神经网络隐状态单元数为u,hq为长度u的向量。
步骤4-1-2:设置双向LSTM神经网络输入层到隐含层的连接权重矩阵U、隐含层到隐含层的连接权重矩阵W、隐含层到输出层的连接权重矩阵V均为随机小实数。
步骤4-1-3:设置双向LSTM神经网络激活函数;将双向LSTM神经网络中的输入门、遗忘门和输出门的激活函数为sigmoid函数,候选门中的激活函数为tanh函数。
步骤4-2:构造前馈注意力模型,具体步骤如下:
步骤4-2-1:使用两层感知器作为前馈注意力模型的内部隐含层;设置两层感知器第一层单元数为da,设置两层感知器第二层单元数为1,其中,双向LSTM神经网络模型到前馈注意力模型中的第一层感知器的连接权重矩阵为wa1,wa1为大小da×u的连接权重矩阵,前馈注意力模型中的第一层感知器到第二层感知器的连接权重向量为wa2,wa2为长度da的连接权重向量。
步骤4-2-2:设置前馈注意力模型初始权重参数为随机小实数。
步骤4-3:使用全连接层作为基于注意力神经网络的水质预测模型的输出层;设置全连接层单元数为1,其中,前馈注意力模型到全连接层之间的连接权重向量为Wy,Wy是长度为μ的连接权重向量;设置全连接层初始权重参数为随机小实数。
步骤4-4:将步骤4-1构造好的双向LSTM神经网络模型和步骤4-2构造好的前馈注意力模型构造为基于注意力神经网络的水质预测模型;具体步骤如下:
步骤4-4-1:使用步骤4-1中构造好的双向LSTM神经网络模型作为基于注意力神经网络的水质预测模型的输入层,双向LSTM神经网络模型的输出为隐状态矩阵H。
步骤4-4-2:使用步骤4-2中构造好的前馈注意力模型作为基于注意力神经网络的水质预测模型的隐含层,将步骤4-4-1中输出的隐状态矩阵H作为前馈注意力模型的输入,前馈注意力模型的输出为上下文向量c。
步骤4-4-3:使用步骤4-2中构造好的全连接层作为基于注意力神经网络的水质预测模型的输出层,将步骤4-4-2中输出的上下文向量c作为全连接层的输入,全连接层的输出为预测值。
步骤4-4-4:基于注意力神经网络的水质预测模型选用均方误差作为损失函数。
步骤5:使用步骤3中构造的训练集Training训练步骤4中构造的基于注意力神经网络的水质预测模型。
所述步骤5中,训练基于注意力神经网络的水质预测模型具体步骤如下:
步骤5-1:将训练集Training中输入到注意力神经网络的水质预测模型,通过模型得到与xi对应的实际输出
步骤5-2:使用均方误差公式计算实际预测值与期望输出值的误差;利用反向传播算法将误差反向传递给每一个神经元,然后每个神经元会采用随机梯度下降更新每条连接线的连接权重;其中,在双向LSTM神经网络模型中需要更新的连接权重矩阵为输入层到隐含层的连接权重矩阵U、隐含层到隐含层的连接权重矩阵W、隐含层到输出层的连接权重矩阵V;在前馈注意力模型中需要更新的连接权重是双向LSTM神经网络模型到前馈注意力模型中的第一层感知器的连接权重矩阵wa1和前馈注意力模型中的第一层感知器到第二层感知器的连接权重向量wa2;在全连接层中需要更新的连接权重是前馈注意力模型到全连接层之间的连接权重向量Wy。
步骤5-3:设置迭代100次,在迭代过程中不断更新基于注意力神经网络预测模型中的连接权重。
步骤6:使用步骤5中训练好的基于注意力神经网络的水质预测模型预测未来时刻的该水质指标的数据。
所述步骤6中,预测未来时刻的该水质指标的数据具体步骤如下:
步骤6-1:获得该水质指标的当前数据,并将其进行z-score标准化,得到z-score标准化后该水质指标的当前数据:
步骤6-2:将输入到训练好的基于注意力神经网络的水质预测模型的输入层中,即双向LSTM神经网络模型中,其中,前向LSTM神经网络通过下式计算隐状态向量
其中,it表示该水质指标当前数据中的第t个时间节点的需要更新的信息,ft表示该水质指标当前数据中的第t个时间节点的需要丢弃的信息,ot表示该水质指标当前数据中的第t个时间节点的需要输出的信息;表示该水质指标当前数据中的第t个时间节点的候选门,候选门是备选更新内容的神经元;ct表示该水质指标当前数据中的第t个时间节点的细胞状态,细胞状态是决定了需要输出信息内容的神经元;表示该水质指标当前数据中的第t个时间节点的输出的隐状态向量,ht-1表示该水质指标当前数据中的第t-1个时间节点的输出的隐状态向量,ct-1表示该水质指标当前数据中的第t-1个时间节点的细胞状态。
xt *是长度为θ的向量,wix、wfx、wox和wcx是大小为u×θ的连接权重矩阵,其中wix、wfx、wox和wcx是输入数据分别到输入门、遗忘门、输出门和候选门的连接权重矩阵;wih、wfh、woh和woh是大小为u×u的连接权重矩阵,其中wih、wfh、woh和woh是输入门、遗忘门、输出门和候选门分别到隐层单元的连接矩阵权重;wic、wfc、woc和wcc是大小为u×u的连接权重矩阵,其中wic、wfc、woc和wcc是输入门、遗忘门、输出门和候选门分别到细胞状态的连接权重矩阵;bi、bf、bo和bc分别是输入门、遗忘门、输出门和候选门的偏置向量,bi、bf、bo和bc是长度为θ的偏置向量。
同理,通过相似前向LSTM神经网络公式计算后向LSTM神经网络隐状态向量
步骤6-3:两个单向LSTM神经网络分别得到隐状态向量和通过下式计算隐状态向量ht:
其中,表示前向LSTM神经网络的隐状态向量,表示后向LSTM神经网络的隐状态向量,表示将前向和后向的LSTM神经网络的隐状态向量进行拼接,得到长度为2u的向量,Whh是大小u×2u的连接权重矩阵。
步骤6-4:将ht输入到基于注意力神经网络的水质预测模型的隐含层中,即前馈注意力模型,通过下式计算上下文向量c:
βt=tanh(wa1ht)
et=wa2βt
at=softmax(et)
其中,wa1为大小为da×u的连接权重矩阵,wa2为长度为da的连接权重向量。ht表示第t个时间节点双向LSTM神经网络模型输出的隐状态向量,βt表示第t个时间节点第一层感知器输出的长度为da的连接权重向量,et表示第t个时间节点隐状态向量的相似度权重,at表示第t个时间节点的隐状态向量归一化后的相似度权重,C为长度u的向量。
步骤6-5:使用全连接层作为输出层,将步骤6-4输出上下文向量c作为输入,输出预测值通过下式计算:
其中,Wy表示前馈注意力模型到全连接层长度为μ的连接权重向量。
本发明针对LSTM神经网络不考虑每个时刻水质指标的数据对预测结果有着不同重要程度,即不考虑赋予每个时刻水质指标的数据不同的权重,提出一种基于注意力神经网络的水质预测方法,该方法考虑水质样本中每个时刻水质指标的数据对预测结果的重要程度不同,赋予水质样本中每个时刻水质指标的数据不同的权重,从而降低了水质预测时产生的相对误差,提高预测精确度,使得水体水质的预测具有更高实时性和广泛的实用性。
以上所述仅为本发明的较佳实施方式,本发明的保护范围并不以上述实施方式为限,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修饰或变化,皆应纳入权利要求书中记载的保护范围内。
Claims (7)
1.基于注意力神经网络的水质预测方法,其特征在于:包括如下步骤:
步骤1:采集某一水质指标的数据;
步骤2:将步骤1采集到的该水质指标的数据进行z-score标准化处理;
步骤3:使用步骤2中处理好的该水质指标的数据构造训练集Training;
步骤4:构造基于注意力神经网络的水质预测模型;
步骤5:使用步骤3中构造的训练集Training训练步骤4中构造的基于注意力神经网络的水质预测模型;
步骤6:使用步骤5中训练好的基于注意力神经网络的水质预测模型预测未来时刻的该水质指标的数据。
2.根据权利要求1所述的基于注意力神经网络的水质预测方法,其特征在于:所述步骤1中,监测一定时间内某一水域,获得按时间排序的该水质指标的数据集合G,G={g1,g2,…gi,…gn},其中n表示该水质指标的数据集合G中元素的数量,gi为第i个时间节点的该水质指标的数据。
3.根据权利要求1所述的基于注意力神经网络的水质预测方法,其特征在于:所述步骤2中,使用z-score标准化方法对每个时间节点的该水质指标的数据进行标准化处理,通过下式计算
其中,gi表示z-score标准化前第i个时间节点的该水质指标的数据,表示z-score标准化后第i个时间节点的该水质指标的数据,μx与σx分别表示该水质指标的数据集合的均值与标准差;
通过对采集到的该水质指标的数据进行z-score标准化,获得z-score标准化后的该水质指标的数据集合其中n表示z-score标准化后该水质指标的数据集合G*中元素的数量,gi *为第i个时间节点z-score标准化后的该水质指标的数据。
4.根据权利要求1所述的基于注意力神经网络的水质预测方法,其特征在于:所述步骤3中,将处理好的该水质指标的数据集合G*用于构造训练集Training,构造训练集Training的具体步骤如下:
构造训练集Training={{xi,yi}},0<i≤m,其中,m表示水质指标训练样本数量;设置d为窗口大小,xi表示第i个训练样本的输入,其中xi中包含d个时间节点的该水质指标的数据;yi表示第i个训练样本输出,表示z-score标准化后第i+d个时间节点的该水质指标的数据。
5.根据权利要求1所述的基于注意力神经网络的水质预测方法,其特征在于:所述步骤4中,构造双向LSTM神经网络模型和前馈注意力模型,将二种模型构造为基于注意力神经网络的水质预测模型,具体步骤如下:
步骤4-1:构造双向LSTM神经网络模型,具体步骤如下:
步骤4-1-1:使用向前和向后两个结构相同的LSTM神经网络,输出隐状态矩阵H:
H=(h1,h2,...,hq)
其中,hq表示双向LSTM神经网络在第q个时间节点输出的隐状态向量;设置q的值等于d的值,设置单向LSTM神经网络隐状态单元数为u,hq为长度u的向量;
步骤4-1-2:设置双向LSTM神经网络输入层到隐含层的连接权重矩阵U、隐含层到隐含层的连接权重矩阵W、隐含层到输出层的连接权重矩阵V均为随机小实数;
步骤4-1-3:设置双向LSTM神经网络激活函数;将双向LSTM神经网络中的输入门、遗忘门和输出门的激活函数为sigmoid函数,候选门中的激活函数为tanh函数;
步骤4-2:构造前馈注意力模型,具体步骤如下:
步骤4-2-1:使用两层感知器作为前馈注意力模型的内部隐含层;设置两层感知器第一层单元数为da,设置两层感知器第二层单元数为1,其中,双向LSTM神经网络模型到前馈注意力模型中的第一层感知器的连接权重矩阵为wa1,wa1为大小da×u的连接权重矩阵,前馈注意力模型中的第一层感知器到第二层感知器的连接权重向量为wa2,wa2为长度da的连接权重向量;
步骤4-2-2:设置前馈注意力模型初始权重参数为随机小实数;
步骤4-3:使用全连接层作为基于注意力神经网络的水质预测模型的输出层;设置全连接层单元数为1,其中,前馈注意力模型到全连接层之间的连接权重向量为Wy,Wy是长度为μ的连接权重向量;设置全连接层初始权重参数为随机小实数;
步骤4-4:将步骤4-1构造好的双向LSTM神经网络模型和步骤4-2构造好的前馈注意力模型构造为基于注意力神经网络的水质预测模型;具体步骤如下:
步骤4-4-1:使用步骤4-1中构造好的双向LSTM神经网络模型作为基于注意力神经网络的水质预测模型的输入层,双向LSTM神经网络模型的输出为隐状态矩阵H;
步骤4-4-2:使用步骤4-2中构造好的前馈注意力模型作为基于注意力神经网络的水质预测模型的隐含层,将步骤4-4-1中输出的隐状态矩阵H作为前馈注意力模型的输入,前馈注意力模型的输出为上下文向量c;
步骤4-4-3:使用步骤4-2中构造好的全连接层作为基于注意力神经网络的水质预测模型的输出层,将步骤4-4-2中输出的上下文向量c作为全连接层的输入,全连接层的输出为预测值;
步骤4-4-4:基于注意力神经网络的水质预测模型选用均方误差作为损失函数。
6.根据权利要求1所述的基于注意力神经网络的水质预测方法,其特征在于:所述步骤5中,训练基于注意力神经网络的水质预测模型具体步骤如下:
步骤5-1:将训练集Training中输入到注意力神经网络的水质预测模型,通过模型得到与xi对应的实际输出
步骤5-2:使用均方误差公式计算实际预测值与期望输出值的误差;利用反向传播算法将误差反向传递给每一个神经元,然后每个神经元会采用随机梯度下降更新每条连接线的连接权重;其中,在双向LSTM神经网络模型中需要更新的连接权重矩阵为输入层到隐含层的连接权重矩阵U、隐含层到隐含层的连接权重矩阵W、隐含层到输出层的连接权重矩阵V;在前馈注意力模型中需要更新的连接权重是双向LSTM神经网络模型到前馈注意力模型中的第一层感知器的连接权重矩阵wa1和前馈注意力模型中的第一层感知器到第二层感知器的连接权重向量wa2;在全连接层中需要更新的连接权重是前馈注意力模型到全连接层之间的连接权重向量Wy;
步骤5-3:设置迭代100次,在迭代过程中不断更新基于注意力神经网络预测模型中的连接权重。
7.根据权利要求1所述的基于注意力神经网络的水质预测方法,其特征在于:所述步骤6中,预测未来时刻的该水质指标的数据具体步骤如下:
步骤6-1:获得该水质指标的当前数据,并将其进行z-score标准化,得到z-score标准化后该水质指标的当前数据:
步骤6-2:将输入到训练好的基于注意力神经网络的水质预测模型的输入层中,即双向LSTM神经网络模型中,其中,前向LSTM神经网络通过下式计算隐状态向量
其中,it表示该水质指标当前数据中的第t个时间节点的需要更新的信息,ft表示该水质指标当前数据中的第t个时间节点的需要丢弃的信息,ot表示该水质指标当前数据中的第t个时间节点的需要输出的信息;表示该水质指标当前数据中的第t个时间节点的候选门,候选门是备选更新内容的神经元;ct表示该水质指标当前数据中的第t个时间节点的细胞状态,细胞状态是决定了需要输出信息内容的神经元;表示该水质指标当前数据中的第t个时间节点的输出的隐状态向量,ht-1表示该水质指标当前数据中的第t-1个时间节点的输出的隐状态向量,ct-1表示该水质指标当前数据中的第t-1个时间节点的细胞状态;
xt *是长度为θ的向量,wix、wfx、wox和wcx是大小为u×θ的连接权重矩阵,其中wix、wfx、wox和wcx是输入数据分别到输入门、遗忘门、输出门和候选门的连接权重矩阵;wih、wfh、woh和woh是大小为u×u的连接权重矩阵,其中wih、wfh、woh和woh是输入门、遗忘门、输出门和候选门分别到隐层单元的连接矩阵权重;wic、wfc、woc和wcc是大小为u×u的连接权重矩阵,其中wic、wfc、woc和wcc是输入门、遗忘门、输出门和候选门分别到细胞状态的连接权重矩阵;bi、bf、bo和bc分别是输入门、遗忘门、输出门和候选门的偏置向量,bi、bf、bo和bc是长度为θ的偏置向量;
同理,通过相似前向LSTM神经网络公式计算后向LSTM神经网络隐状态向量
步骤6-3:两个单向LSTM神经网络分别得到隐状态向量和通过下式计算隐状态向量ht:
其中,表示前向LSTM神经网络的隐状态向量,表示后向LSTM神经网络的隐状态向量,表示将前向和后向的LSTM神经网络的隐状态向量进行拼接,得到长度为2u的向量,Whh是大小u×2u的连接权重矩阵;
步骤6-4:将ht输入到基于注意力神经网络的水质预测模型的隐含层中,即前馈注意力模型,通过下式计算上下文向量c;
βt=tanh(wa1ht)
et=wa2βt
at=softmax(et)
其中,wa1为大小为da×u的连接权重矩阵,wa2为长度为da的连接权重向量。ht表示第t个时间节点双向LSTM神经网络模型输出的隐状态向量,βt表示第t个时间节点第一层感知器输出的长度为da的连接权重向量,et表示第t个时间节点隐状态向量的相似度权重,at表示第t个时间节点的隐状态向量归一化后的相似度权重,C为长度u的向量;
步骤6-5:使用全连接层作为输出层,将步骤6-4输出上下文向量c作为输入,输出预测值通过下式计算:
其中,Wy表示前馈注意力模型到全连接层长度为μ的连接权重向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910466102.5A CN110428082B (zh) | 2019-05-31 | 2019-05-31 | 基于注意力神经网络的水质预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910466102.5A CN110428082B (zh) | 2019-05-31 | 2019-05-31 | 基于注意力神经网络的水质预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110428082A true CN110428082A (zh) | 2019-11-08 |
CN110428082B CN110428082B (zh) | 2022-07-22 |
Family
ID=68408449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910466102.5A Active CN110428082B (zh) | 2019-05-31 | 2019-05-31 | 基于注意力神经网络的水质预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110428082B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110824142A (zh) * | 2019-11-13 | 2020-02-21 | 杭州鲁尔物联科技有限公司 | 一种地质灾害的预测方法、装置及设备 |
CN110852515A (zh) * | 2019-11-15 | 2020-02-28 | 北京工业大学 | 基于混合长短时记忆神经网络的水质指标预测方法 |
CN111047012A (zh) * | 2019-12-06 | 2020-04-21 | 重庆大学 | 基于深度双向长短期记忆网络的空气质量预测方法 |
CN111369078A (zh) * | 2020-02-14 | 2020-07-03 | 迈拓仪表股份有限公司 | 一种基于长短期记忆神经网络的供水水质预测方法 |
CN111915097A (zh) * | 2020-08-14 | 2020-11-10 | 南通大学 | 基于改进遗传算法优化lstm神经网络的水质预测方法 |
CN112116080A (zh) * | 2020-09-24 | 2020-12-22 | 中国科学院沈阳计算技术研究所有限公司 | 一种融合了注意力机制的cnn-gru水质预测方法 |
CN112949821A (zh) * | 2021-01-28 | 2021-06-11 | 河北师范大学 | 基于双重注意力机制的网络安全态势感知方法 |
CN113033861A (zh) * | 2019-12-25 | 2021-06-25 | 广东奥博信息产业股份有限公司 | 一种基于时间序列模型的水质预测方法及系统 |
CN113029993A (zh) * | 2021-03-24 | 2021-06-25 | 中南大学 | 一种基于注意力机制的紫外光谱快速总氮在线检测方法 |
CN114881303A (zh) * | 2022-04-21 | 2022-08-09 | 海南大学 | 一种基于双注意力机制的水质长期预测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108830487A (zh) * | 2018-06-21 | 2018-11-16 | 王芊霖 | 基于长短时神经网络的电力负荷预测方法 |
CN108846512A (zh) * | 2018-06-05 | 2018-11-20 | 南京邮电大学 | 基于择优分类的水质预测方法 |
-
2019
- 2019-05-31 CN CN201910466102.5A patent/CN110428082B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846512A (zh) * | 2018-06-05 | 2018-11-20 | 南京邮电大学 | 基于择优分类的水质预测方法 |
CN108830487A (zh) * | 2018-06-21 | 2018-11-16 | 王芊霖 | 基于长短时神经网络的电力负荷预测方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110824142A (zh) * | 2019-11-13 | 2020-02-21 | 杭州鲁尔物联科技有限公司 | 一种地质灾害的预测方法、装置及设备 |
CN110824142B (zh) * | 2019-11-13 | 2022-06-24 | 杭州鲁尔物联科技有限公司 | 一种地质灾害的预测方法、装置及设备 |
CN110852515A (zh) * | 2019-11-15 | 2020-02-28 | 北京工业大学 | 基于混合长短时记忆神经网络的水质指标预测方法 |
CN110852515B (zh) * | 2019-11-15 | 2022-05-06 | 北京工业大学 | 基于混合长短时记忆神经网络的水质指标预测方法 |
CN111047012A (zh) * | 2019-12-06 | 2020-04-21 | 重庆大学 | 基于深度双向长短期记忆网络的空气质量预测方法 |
CN113033861A (zh) * | 2019-12-25 | 2021-06-25 | 广东奥博信息产业股份有限公司 | 一种基于时间序列模型的水质预测方法及系统 |
CN111369078A (zh) * | 2020-02-14 | 2020-07-03 | 迈拓仪表股份有限公司 | 一种基于长短期记忆神经网络的供水水质预测方法 |
CN111915097A (zh) * | 2020-08-14 | 2020-11-10 | 南通大学 | 基于改进遗传算法优化lstm神经网络的水质预测方法 |
CN112116080A (zh) * | 2020-09-24 | 2020-12-22 | 中国科学院沈阳计算技术研究所有限公司 | 一种融合了注意力机制的cnn-gru水质预测方法 |
CN112949821A (zh) * | 2021-01-28 | 2021-06-11 | 河北师范大学 | 基于双重注意力机制的网络安全态势感知方法 |
CN112949821B (zh) * | 2021-01-28 | 2024-02-02 | 河北师范大学 | 基于双重注意力机制的网络安全态势感知方法 |
CN113029993A (zh) * | 2021-03-24 | 2021-06-25 | 中南大学 | 一种基于注意力机制的紫外光谱快速总氮在线检测方法 |
CN114881303A (zh) * | 2022-04-21 | 2022-08-09 | 海南大学 | 一种基于双注意力机制的水质长期预测方法 |
CN114881303B (zh) * | 2022-04-21 | 2024-06-04 | 海南大学 | 一种基于双注意力机制的水质长期预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110428082B (zh) | 2022-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110428082B (zh) | 基于注意力神经网络的水质预测方法 | |
Alaloul et al. | Data processing using artificial neural networks | |
CN109492822B (zh) | 空气污染物浓度时空域关联预测方法 | |
CN110909926A (zh) | 基于tcn-lstm的太阳能光伏发电预测方法 | |
Shukla | Neuro-genetic prediction of software development effort | |
Neal | Connectionist learning of belief networks | |
CN109583565B (zh) | 基于注意力模型长短时记忆网络的洪水预测方法 | |
CN107544904B (zh) | 一种基于深度cg-lstm神经网络的软件可靠性预测方法 | |
CN112990556A (zh) | 一种基于Prophet-LSTM模型的用户用电能耗预测方法 | |
CN110824915B (zh) | 基于ga-dbn网络的废水处理智能监控方法及系统 | |
CN108445752B (zh) | 一种自适应选择深度特征的随机权神经网络集成建模方法 | |
CN112784479B (zh) | 一种洪水流量预测的方法 | |
CN111461463A (zh) | 一种基于tcn-bp的短期负荷预测方法、系统及设备 | |
CN116451556A (zh) | 一种混凝土坝变形观测量统计模型构建方法 | |
CN110838364A (zh) | 一种基于深度学习混合模型的克罗恩病预测方法及装置 | |
CN117809742B (zh) | 一种基于深度迁移学习的调控变异预测方法 | |
CN111401547A (zh) | 一种面向乘客流分析的基于循环学习单元的htm设计方法 | |
CN113836783A (zh) | 斜拉桥主梁温致挠度监测基准值的数字回归模型建模方法 | |
CN112766603A (zh) | 一种交通流量预测方法、系统、计算机设备及存储介质 | |
CN114580262A (zh) | 一种锂离子电池健康状态估计方法 | |
CN116303786B (zh) | 一种基于多维数据融合算法的区块链金融大数据管理系统 | |
CN114386686A (zh) | 一种基于改进lstm的流域水质短期预测方法 | |
CN117391260A (zh) | 开尔文优化算法优化卷积神经网络参数的溶解氧预测方法 | |
Lu et al. | Quality-relevant feature extraction method based on teacher-student uncertainty autoencoder and its application to soft sensors | |
Spackman | Maximum likelihood training of connectionist models: comparison with least squares back-propagation and logistic regression. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |