CN113189014B

CN113189014B - 一种融合卫星遥感和地面监测数据的臭氧浓度估算方法

Info

Publication number: CN113189014B
Application number: CN202110401303.4A
Authority: CN
Inventors: 杨晓婷; 张猛; 张博
Original assignee: Xian Jiaotong University
Current assignee: Xian Jiaotong University
Priority date: 2021-04-14
Filing date: 2021-04-14
Publication date: 2023-05-02
Anticipated expiration: 2041-04-14
Also published as: CN113189014A

Abstract

本发明公开了一种融合卫星遥感和地面监测数据的臭氧浓度估算方法，属于环境监测技术领域。包括：步骤一，多源样本数据的收集、预处理与融合，得到输入参数；步骤二，基于多层映射反向传播神经网络，建立臭氧浓度估算运算基础模型；步骤三，基于影响因素、前溯时间和空间范围，探寻所得臭氧浓度估算运算基础模型的最优化输入参数组合，根据所得最优化输入参数组合对地面臭氧浓度进行准确估算，得到臭氧浓度的空间连续分布情况，实现融合卫星遥感和地面监测数据的臭氧浓度估算方法。本发明具有准确性高、可靠性强、操作简单的优点，所用到的多源样本数据均免费且开源，增强了通用性，能够快速估算臭氧浓度并绘制其在目标区域的连续分布图。

Description

一种融合卫星遥感和地面监测数据的臭氧浓度估算方法

技术领域

本发明属于环境监测技术领域，涉及一种融合卫星遥感和地面监测数据的臭氧浓度估算方法。

背景技术

随着城市化和工业化进程的加速，大气污染问题日趋严重，臭氧已经成为影响环境空气质量的首要污染物，并直接影响着人类的身心健康。因此，监测并揭示臭氧在时间和空间上连续分布的规律，对防治臭氧污染以及预防其对健康的危害具有重要意义。

目前，常见的臭氧监测方法有地面监测和遥感监测。地面监测基于监测站进行全天候连续观测，能够直接得到地表空间臭氧浓度及其随时间变化的准确信息。但是，监测站点建设成本高，数量有限，分布不均，难以实现大范围空间内连续准确的臭氧浓度监测。利用卫星遥感影像数据监测臭氧的研究始于20世纪80年代，主要包括模式比例因子法、基于物理机理的半经验法以及统计模型方法等。在过去的几十年中，上述臭氧估算方法尽管已经有了较广泛的应用，但仍存在以下问题：1)模型结构与模拟过程十分复杂，计算成本较高；2)对基础数据要求较高，而污染物排放清单往往存在较大的不确定性，这就使得估算精度有限；3)估算结果受参数设置的影响较大，这些参数不仅计算过程十分繁琐，而且在不同地域之间差异显著。

发明内容

为了克服上述现有技术的缺点，本发明的目的在于提供一种融合卫星遥感和地面监测数据的臭氧浓度估算方法，所述基于机器学习的臭氧浓度估算方法准确性高，可靠性强，操作简单，解决了现有臭氧浓度估算方法所得结论的不确定性高且计算复杂的问题。

为了达到上述目的，本发明采用以下技术方案予以实现：

本发明公开了一种融合卫星遥感和地面监测数据的臭氧浓度估算方法，包括以下步骤：

步骤一，多源样本数据的收集、预处理与融合，得到输入参数；

步骤二，基于多层映射反向传播神经网络，建立臭氧浓度估算运算基础模型；

步骤三，基于影响因素、前溯时间和空间范围三个维度，结合步骤一所得输入参数，探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合，根据所得最优化输入参数组合对地面臭氧浓度进行估算，得到臭氧浓度的空间连续分布结果，实现融合卫星遥感和地面监测数据的臭氧浓度估算方法。

优选地，步骤一中，多源样本数据包括：卫星遥感影像数据、空气质量监测数据和气象数据。

优选地，步骤一中，多源样本数据的预处理，包括去云处理和获得归一化植被指数NDVI：基于卫星遥感影像数据的云层识别与分类、云层在地面的投射影响范围和云层覆盖率，并根据不同的云层特性对遥感影像进行去云处理；对卫星遥感影像数据进行正射校正和空间位置配准，并提取卫星遥感影像数据中各波段的波段反射率，获得归一化植被指数NDVI。

优选地，步骤一中，多源样本数据的融合，包括以下操作：通过邻近分析算法获取距离环境监测站点最近的气象站点，并将该距离环境监测站点最近的气象站点监测到的气象数据，作为该环境监测站点的气象信息，实现多源样本数据的融合；其中，针对多源样本数据建立用于溯源分析的索引。

优选地，步骤二中，基于多层映射反向传播神经网络，建立得到的臭氧浓度估算运算基础模型，包括输入层、隐含层和输出层；其中，层与层之间的神经元全连接，同一层内的神经元无连接，每一层的神经元可以接收前一层神经元的信号，并产生信号输出到下一层。

进一步优选地，包含一个输入层、一个输出层和L个隐含层，其中，L≥1。

进一步优选地，隐含层的节点数通过以下操作得到：通过逐步扩大隐含层中节点的个数，对多层映射反向传播神经网络进行不断地训练对比；当预测结果与真实结果趋于一致时，得到隐含层的节点数。

优选地，步骤二中，所得臭氧浓度估算运算基础模型的输入参数包括：卫星遥感影像数据中不同波段的波段反射率、归一化植被指数和气象数据；臭氧浓度估算运算基础模型的输出数据为遥感影像成像时监测站点的臭氧浓度值。

优选地，步骤三中，基于影响因素探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合，其操作包括：

首先，采用统计学的方法，分析步骤一所得输入参数与臭氧浓度的相关性；然后，根据所得相关性的强弱以及步骤一所得输入参数本身的类别特点，进行分类与分组，将分组得到的每组输入参数据输入至步骤二所得臭氧浓度估算运算基础模型中进行训练和验证；最后，基于决定系数、平均误差和均方根误差，确定步骤二所得臭氧浓度估算运算基础模型的输入参数在影响因素维度上的最优化输入参数组合。

优选地，步骤三中，基于前溯时间探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合，其操作包括：采用循环探索的方式，以t_s小时为步长逐步增大前溯时段的范围；前溯时段每增长t_s小时，与该时段相对应的输入参数都会被增添至步骤二所得臭氧浓度估算运算基础模型的输入参数中；基于决定系数、平均误差和均方根误差，确定步骤二所得臭氧浓度估算运算基础模型的输入参数在前溯时间维度上的最优化输入参数组合；其中，5≥t_s≥1；其中，当前溯时段超越预设阈值、且步骤二所得臭氧浓度估算运算基础模型的估算结果保持不变或持续变差时，终止探索。

优选地，步骤三中，基于空间范围探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合，其操作包括：进行臭氧浓度估算运算基础模型的训练和验证，记录决定系数、平均误差和均方根误差；根据研究区内设定的步长，逐步扩大训练和验证的区域，并通过决定系数、平均误差和均方根误差，确定步骤二所得臭氧浓度估算运算基础模型的输入参数在空间范围维度上的最优化输入参数组合；其中，当臭氧浓度估算运算基础模型训练和验证区域超过预设阈值、且臭氧浓度估算结果保持不变或持续变差，终止探索。

与现有技术相比，本发明具有以下有益效果：

本发明公开了一种融合卫星遥感和地面监测数据的臭氧浓度估算方法，通过多源样本数据的收集、预处理与融合，能够得到输入参数，通过多层映射反向传播神经网络，结合机器学习，能够建立臭氧浓度估算运算基础模型，通过基于影响因素、前溯时间和空间范围三个维度，能够探索输入参数的最优化组合，进而实现地面臭氧浓度的准确估算。此外，影响因素、前溯时间以及空间范围三个维度上的寻优过程并不是相互分离、单独运行，而是综合考虑的，能够更加全面准确的找到最优的输入参数组合。因此，本发明所述基于机器学习的臭氧浓度估算方法，准确性高，可靠性强，操作简单，可以估算臭氧浓度，在环境监测工作中，能够间接获得臭氧浓度，具有较强的推广应用价值。

进一步地，所述多源样本数据均免费且开源，增强了模型的通用性，从而能够快速估算臭氧浓度并绘制其在目标区域的连续分布图。

进一步地，通过去云处理和获得归一化植被指数NDVI，能够去除云对估算结果的影响，提高模型对地面臭氧浓度估算的准确度。

进一步地，采用多源样本数据的融合，并建立其溯源分析的索引，可以将不同来源的相关数据(如卫星遥感影像数据、气象数据和空气质量数据)汇总并融合起来，便于臭氧估算模型使用。

进一步地，通过多层映射反向传播神经网络的建立，能够适应于地面臭氧浓度的分布与温度、相对湿度、大气压、风速和风向等众多因素有着非常复杂的非线性关系，而多层映射反向传播神经网络以其独特的结构，在处理和解决非线性映射问题时具备相对较大的优势。

进一步地，从影响因素维度出发，确定了该臭氧浓度估算运算基础模型的最优化输入参数组合，提高了地面臭氧浓度估算的准确性。

进一步地，在臭氧浓度估算运算的过程中，对估算值产生影响的不仅包括与卫星成像时间(记为T₀)同时刻的气象参数，还应该包括由T₀前溯至某时刻的前溯时间(记为T₁)的时间段内(即：T₀-T₁)的气象状况；因此本发明所述方法中基于前溯时间探索的方式很好的解决了这一问题，确定了最优的前溯时间，提高了地面臭氧浓度估算的准确性。其中，通过循环探索的方式，并设定步长t_s，5≥t_s≥1；若t_s＜1，不仅样本数据难以获取，而且过多的数据量还会使预测过程变得十分复杂；若t_s＞5，则会使最优前溯时段的误差增大，从而使模型的准确率大大降低。

进一步地，当研究区内的监测站点较少，但在该研究区周边却布有一定数量的地面监测站时，用于模型训练和验证的最佳空间范围将很有可能大于该研究区域；因此本发明所述方法中通过空间范围探索克服了空间范围对估算结果的影响，确定了最优的空间范围，提高了地面臭氧浓度估算的准确性。

附图说明

图1为本发明所述一种融合卫星遥感和地面监测数据的臭氧浓度估算方法的流程示意图；

图2为本发明实施例提供的多层映射反向传播神经网络建立的臭氧浓度估算运算基础模型示意图；

图3为本发明实施例提供的臭氧浓度估算运算基础模型训练、验证以及测试的最佳空间范围示意图；其中，(a)最佳空间范围等于研究区域；(b)最佳空间范围大于研究区域；

图4为本发明实施例提供的北京市地面臭氧浓度估算值和监测值之间的相关性拟合图；

图5为本发明实施例提供的北京市模型估算的地面臭氧浓度与监测站的监测值对比；

图6为本发明实施例提供的不同时刻北京臭氧浓度的空间分布图：(a)2018年10月1日UTC 2:53；(b)2019年3月26日UTC 2:53。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

下面结合附图对本发明做进一步详细描述：

参见图1，可知本发明所述一种基于机器学习且融合卫星遥感和地面监测数据的臭氧浓度估算方法，步骤如下：

步骤一，多源样本数据的收集、预处理与融合，得到输入参数。

其中，多源样本数据主要包括：卫星遥感影像数据(Landsat 8，MODIS等)、空气质量监测数据(O₃)以及气象数据(风速，风向，湿度，气温，气压等)

具体地，在本发明的某一具体实施方式中，卫星遥感影像数据收集自GoogleEarth Engine(GEE)，空气质量监测数据收集自中国环境监测总站(CNEMC)，气象数据收集自美国国家海洋和大气管理局(NOAA)。

其中，多源样本数据的预处理，包括：基于Google Earth Engine(GEE)所提供的API及其它相关开源程序，实现研究区内卫星遥感影像数据的云层识别与分类、云层在地面的投射影响范围和云层覆盖率的计算，并根据不同的云层特性采用相应的算法对遥感影像进行去云处理；对研究区内的卫星遥感影像数据进行正射校正和空间位置配准，同时提取遥感影像中各波段的波段反射率，通过下述公式计算获得归一化植被指数NDVI：

NDVI＝(NIR-R)/(NIR+R)；其中，NIR为近红外波段的反射值，R为红光波段的反射值。

其中，多源样本数据的融合，包括：建立样本数据的索引，便于对估算结果进行溯源分析。通过邻近分析算法获取距离环境监测站点最近的气象站点，并将其监测的气象数据作为该环境监测站点的气象信息，实现多源样本数据的融合。

步骤二，基于多层映射反向传播神经网络，建立臭氧浓度估算运算基础模型。

本发明所构建的臭氧浓度估算运算基础模型由一个输入层，L个隐含层(L≥1)和一个输出层组成。其中，层与层之间的神经元全连接，同一层内的神经元无连接。每一层的神经元可以接收前一层神经元的信号，并产生信号输出到下一层。当一组样本数据被提供给该臭氧浓度估算运算基础模型时，输入信号从输入层经隐含层逐层向后传播，直至输出层；如果输出层得不到期望的输出结果，那么则会沿着减少误差的方向，从输出层经过中间各层逐层向前修正网络的连接权值，直至到达输入层；前向计算过程和反向传播过程反复进行，不断调整各层的权值和阈值，从而使反向传播神经网络的预测输出不断逼近期望输出。该臭氧浓度估算运算基础模型采用tansig函数作为不同隐藏层之间的传递函数，采用purelin函数作为最后一个隐藏层与输出层之间的传递函数，网络训练过程则采用Levenberg-Marquardt(LM)算法的trainlm函数计算。对于神经网络隐含层中节点数的确定，本发明根据柯尔莫哥罗夫定理，通过逐步扩大隐含层中节点的个数，并对网络进行不断地训练对比，从而选取最合适的网络结构。其中，该臭氧浓度估算运算基础模型的输入参数主要包括：卫星遥感影像数据中不同波段的波段反射率、归一化植被指数以及相关的气象数据，该臭氧浓度估算运算基础模型的输出数据为遥感影像成像时地面监测站点的臭氧浓度值。

具体地，在本发明的某一具体实施方式中，本发明所构建的臭氧浓度估算运算基础模型由一个输入层，L个隐含层(L＝2)和一个输出层组成。

本发明选用平均误差(ME)、均方根误差(RMSE)和决定系数(R²)对臭氧浓度估算运算基础模型进行全面、客观地评价。

其中，O_3G为神经网络的臭氧浓度估算值，O_3S为臭氧浓度实测值，N为样本数目。

步骤三，从影响因素、前溯时间和空间范围三个不同的维度出发，探寻臭氧浓度估算运算基础模型的最优化输入参数组合，根据所得最优化输入参数组合对地面臭氧浓度进行准确估算，得到臭氧浓度的空间连续分布结果，并能够快速估算臭氧浓度并绘制其在目标区域的连续分布图，实现基于机器学习的臭氧浓度估算方法。

探寻影响因素的最优化组合，其操作包括：首先，采用统计学的方法，分析步骤一所得输入参数与臭氧浓度的相关性；然后，根据相关性的强弱以及步骤一所得输入参数本身的类别特点，对所有可能的输入参数进行分类与分组，分组得到的每组输入参数据都将被输入至臭氧浓度估算运算基础模型中进行训练和验证。通过对R²、ME和RMSE三个参数的综合评判，确定臭氧浓度估算运算基础模型的输入数据在影响因素维度上的最优化组合。

探寻前溯时间的最优化组合，其操作包括：采用循环探索的方式，以1～5小时为步长(t_s)逐步增大前溯时段的范围。前溯时段每增长1～5小时，与该时段相对应的输入参数都会被增添至臭氧浓度估算运算基础模型的输入参数中，并通过对R²、ME和RMSE三个参数的综合评判来确定臭氧浓度估算运算基础模型的输入参数在前溯时间维度上的最优化输入参数组合。该探索过程的终止可依据两个原则加以控制：1)前溯时段足够长，即前溯时段超越预设阈值；2)臭氧浓度估算运算基础模型的估算结果保持不变或持续变差。

具体地，在本发明的某一具体实施方式中，以3小时为步长逐步增大前溯时段的范围。探寻空间范围的最优化组合：首先在研究区内进行臭氧浓度估算运算基础模型的训练和验证，记录其R²、ME和RMSE。然后逐步扩大训练和验证区域，直至有一个或多个新的监测站点出现在研究区内，通过R²、ME和RMSE三个特征值来综合评判相应估算结果的优劣，确定臭氧浓度估算运算基础模型的输入参数在空间范围维度上的最优化输入参数组合。该探索过程的终止可依据两个原则加以控制：1)臭氧浓度估算运算基础模型训练和验证区域足够大，超过预设阈值；2)臭氧浓度估算结果保持不变或持续变差。

其中，本发明在影响因素、前溯时间以及空间范围三个维度上的寻优过程并不是相互分离、单独运行的，而是会被结合在一起综合考虑，去探寻臭氧浓度估算运算基础模型输入参数的最优化组合，从而得到在已有样本数据条件支持下的最佳估算结果。

本发明基于反向传播神经网络所创建的臭氧浓度估算运算基础模型准确性高，可靠性强，可以在一定程度上估算臭氧浓度，具有较强的应用潜力。同时，由于该模型估算过程中所用到的数据均免费且开源，这增强了模型的通用性。此外，本发明所选用的反向传播神经网络模型非常适合采用分布式并行计算的处理方法，这可以在很大程度上提高运算效率，从而使快速估算臭氧浓度在空间上的连续分布成为可能。

为了说明本发明所述的技术方案，下面以北京市为具体实施案例来进行说明。

在本实施例中，通过Google Earth Engine(GEE,https://earthengine.google.com/)收集2014年5月1日至2019年10月1日北京市的Landsat 8遥感影像数据；通过中国环境监测总站(CNEMC,http://www.cnemc.cn/)收集同时间北京市的地面臭氧浓度数据；通过美国国家海洋和大气管理局(NOAA,https://gis.ncdc.noaa.gov/maps/ncei/cdo/hourly)收集同时间北京市的气象数据，包括：风速、风向、湿度、气温、气压等。

基于Google Earth Engine(GEE)所提供的API及其它相关开源程序，实现研究区内卫星遥感影像数据的云层识别与分类、云层在地面的投射影响范围和云层覆盖率的计算，并根据不同的云层特性采用相应的算法对遥感影像进行去云处理。对研究区内的卫星遥感影像数据进行正射校正和空间位置配准，同时提取遥感影像中各波段的波段反射率，通过下述公式计算获得归一化植被指数NDVI：

NDVI＝(band5–band4)/(band5+band4)

其中band5为Landsat 8遥感影像波段5的反射率，band4为Landsat 8遥感影像波段4的反射率。

建立样本数据的索引，便于对臭氧浓度估算结果进行溯源分析。提取中国环境监测站点方圆15米缓冲区内的波段反射率以及NDVI数据，并将均值赋予到对应的中国环境监测站，实现Landsat 8遥感影像数据与空气质量数据的融合。其次，通过邻近分析算法获取距离中国环境监测站点最近的气象监测站点，并将其监测的气象数据作为该中国环境监测站点的气象信息。

步骤二，基于多层映射反向传播神经网络建立臭氧浓度估算运算的基础模型。

如图2所示，本实施例所构建的臭氧浓度估算运算基础模型由一个输入层，两个隐含层和一个输出层组成。其中，层与层之间的神经元全连接，同一层内的神经元无连接。每一层的神经元可以接收前一层神经元的信号，并产生信号输出到下一层。当一组样本数据被提供给该模型时，输入信号从输入层经隐含层逐层向后传播，直至输出层。如果输出层得不到期望的输出结果，那么则会沿着减少误差的方向，从输出层经过中间各层逐层向前修正网络的连接权值，直至到达输入层。前向计算过程和反向传播过程反复进行，不断调整各层的权值和阈值，从而使臭氧浓度估算运算基础模型的预测输出不断逼近期望输出。

图2中，X₁，X₂，…，X_m是臭氧浓度估算运算基础模型的输入参数，在本实例中主要包括Landsat 8遥感影像数据中不同波段的波段反射率、NDVI以及相关的气象数据，如：风速、风向、湿度、气温、气压等。Y是该模型的估算值，即Landsat 8遥感影像成像时地面监测站点的臭氧浓度值。

表示从l-1层的第j个神经元到l层的第i个神经元的连接上的权重，

表示在l层第i个神经元的偏置，

表示l层第i个神经元的激活值。该臭氧浓度估算运算基础模型采用tansig函数作为不同隐藏层之间的传递函数，采用purelin函数作为最后一个隐藏层与输出层之间的传递函数，网络训练过程则采用Levenberg-Marquardt(LM)算法的trainlm函数计算。

此外，对于神经网络隐含层中节点数的确定，本发明根据柯尔莫哥罗夫定理，通过逐步扩大隐含层中节点的个数，并对多层映射反向传播神经网络进行不断地训练对比，从而选取最合适的网络结构。最终确定[15,15]为本实施例该多层映射反向传播神经网络的最优节点个数。

本实施例采用机器学习模型评估中常用的留出法，通过多次随机取样的方式选取训练数据集与验证测试数据集，其中训练集占比80％，验证测试集占比20％。根据确定的神经网络结构和传递函数，最大训练次数设置为500，网络训练精度设置为0.001，学习速率为0.1。每组实验重复300次取平均值作为模型评估的最终结果。最后选用平均误差(ME)、均方根误差(RMSE)和决定系数(R²)对臭氧浓度估算运算基础模型进行全面、客观地评价。

其中，O_3G为臭氧浓度的估算值，O_3S为臭氧浓度的实测值，N为样本数目。

步骤三，从影响因素、前溯时间和空间范围三个不同的维度出发，探寻臭氧浓度估算运算基础模型的最优化输入参数组合。

探寻影响因素的最优化组合：采用统计学的方法，分析各类数据与臭氧浓度的相关性。根据相关性的强弱以及数据本身的类别特点，对所有可能的输入数据进行分类与分组。在本实施例中，根据与臭氧相关性的强弱以及不同的数据来源和特征，17个备选输入影响因素被分为以下三组，即：

(1)Landsat 8OLI/TIRS中波段1、波段2和波段3的反射率，它们与臭氧浓度有很强的相关性；

(2)其他波段的反射率，以及根据Landsat 8OLI的波段4和波段5计算出的NDVI；

(3)气象参数，风速、风向、湿度、气温和气压。

由于(1)组中的参数与臭氧浓度有较强的相关性，因此将波段1、波段2和波段3的反射率作为臭氧估算的依据，从而在整个过程中一直采用这些参数来探索备选输入影响因素的最佳组合。将这三组不同的参数分步输入到模型中进行训练、学习和验证，根据ME、RMSE和R²可以比较不同的备选输入参数组合所产生的训练结果，从而实现输入参数与各种影响因素的最优化输入参数组合。

探寻前溯时间的最优化输入参数组合：由于气象条件会随着时间的推移而发生明显的变化，不论是卫星成像时的气象参数，还是之前的气象条件都会对臭氧浓度的估算精度产生明显影响。对于一个特定的研究区域(如一个城市)，探索最佳前溯时间的过程可以通过以下六个步骤来描述：

第一步：以T₀代表卫星成像时间，T₁代表前溯时间，t_s代表时间步长。

第二步：设T₁＝T₀并评价臭氧浓度估算运算基础模型的O₃估算性能，记为P₀。

第三步：由于气象参数由地面监测站每3小时采集一次，故设t_s＝3h，T₁＝T₀-n×t_s，其中n为大于零的整数。

第四步：将[T₀,T₁]时间段内的所有气象参数输入到臭氧浓度估算运算基础模型中，评估臭氧浓度估算运算基础模型的O₃估算性能，记录为

第五步：如果当前性能

优于之前的P₀，设

n＝n+1。

第六步：反复重复第三步～第五步，直到

连续比P₀差，或[T₀,T₁]时间段变得足够长，例如大于经验上确定的阈值。

由上述迭代过程所探索出的[T₀,T₁]将作为多层映射反向传播神经网络训练的最佳前溯时间。

探寻空间范围的最优化组合：根据经验，多层映射反向传播神经网络训练的最佳空间范围不一定要与研究区域的最小包围矩形相同。实际情况下，它与监测站的分布有关，可以大于研究区域的最小包围矩形，见图3。对于一个特定的研究区域(如一个城市)，探索最佳空间范围的过程可以通过以下六个步骤来描述：

第一步：以S₀和

分别代表研究区域的最小包围矩形和神经网络训练的空间范围。

第二步：设

并评价臭氧浓度估算运算基础模型的O₃估算性能，记为P₀。

第三步：沿经度和纬度两个方向逐步扩大

直到有一个或多个新的监测站落在

内。

第四步：评估臭氧浓度估算运算基础模型的O₃估算性能，记录为

第五步：如果当前性能

优于之前的P₀，设

第六步：反复重复第三步～第五步，直到面积

变得足够大，例如

大于经验上确定的阈值。

由上述迭代过程所探索出的

将作为神经网络训练的最佳空间范围。

本实施例在影响因素、前溯时间以及空间范围三个维度上的寻优过程并不是相互分离、单独运行的，而是会被结合在一起综合考虑，去探寻臭氧浓度估算运算基础模型输入参数的最优化组合，从而得到在已有样本数据条件支持下的最佳估算结果。

图4显示了北京市地面臭氧浓度估算值和监测值之间的相关性，其中R²为0.91，ME为1.2μg/m³，RMSE为18.4μg/m³。拟合直线的斜率趋近于1，相关性十分显著。图5比较了北京市模型估算的地面臭氧浓度与监测站的监测值，其中红色线表示实际观测到的臭氧浓度值，蓝色线表示估算的臭氧浓度值。大多情况下，估算数据与监测数据的趋势基本一致。因此，本发明建立的臭氧浓度估算运算基础模型具备准确估算地面臭氧浓度的能力，有望成为大气污染变化监测与区域分析的一个新的重要手段。

图6(a)和图6(b)分别显示了2018年10月1日UTC 2:53和2019年3月26日UTC 2:53时刻北京地区臭氧浓度的空间分布，其空间分辨率高达30m。这两个时刻地面臭氧浓度均呈现出从东南至西北逐渐递减的趋势，与北京西北高、东南低的地势以及工业化和人口密度特征相一致。

以上所述，仅是用以说明本发明的具体实施案例而已，并非用以限定本发明的可实施范围，举凡本领域熟练技术人员在未脱离本发明所指示的精神与原理下所完成的一切等效改变或修饰，仍应由本发明权利要求的范围所覆盖。

Claims

1.一种融合卫星遥感和地面监测数据的臭氧浓度估算方法，其特征在于，包括以下步骤：

多源样本数据包括：卫星遥感影像数据、空气质量监测数据和气象数据；

多源样本数据的预处理，包括去云处理和获得归一化植被指数NDVI：基于卫星遥感影像数据的云层识别与分类、云层在地面的投射影响范围和云层覆盖率，并根据不同的云层特性对遥感影像进行去云处理；对卫星遥感影像数据进行正射校正和空间位置配准，并提取卫星遥感影像数据中各波段的波段反射率，获得归一化植被指数NDVI；

多源样本数据的融合，包括以下操作：通过邻近分析算法获取距离环境监测站点最近的气象站点，并将该距离环境监测站点最近的气象站点监测到的气象数据，作为该环境监测站点的气象信息，实现多源样本数据的融合；

其中，针对多源样本数据建立用于溯源分析的索引；

输入参数包括：卫星遥感影像数据中不同波段的波段反射率、归一化植被指数NDVI以及相关的气象数据；气象数据包括风速、风向、湿度、气温和气压；

步骤三，基于影响因素、前溯时间和空间范围三个维度，结合步骤一所得输入参数，探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合，根据所得最优化输入参数组合对地面臭氧浓度进行估算，得到臭氧浓度的空间连续分布结果，实现融合卫星遥感和地面监测数据的臭氧浓度估算方法；

步骤三中，基于空间范围探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合，其操作包括：

首先在研究区内进行臭氧浓度估算运算基础模型的训练和验证，记录决定系数、平均误差和均方根误差；然后根据设定的步长，逐步扩大训练和验证区域，直至有一个或多个新的监测站点出现在研究区内，通过决定系数、平均误差和均方根误差三个特征值来综合评判相应估算结果的优劣，确定臭氧浓度估算运算基础模型的输入参数在空间范围维度上的最优化输入参数组合；

其中，当臭氧浓度估算运算基础模型训练和验证区域超过预设阈值、且臭氧浓度估算结果保持不变或持续变差，终止探索。

2.根据权利要求1所述的一种融合卫星遥感和地面监测数据的臭氧浓度估算方法，其特征在于，步骤二中，基于多层映射反向传播神经网络，建立得到的臭氧浓度估算运算基础模型，包括输入层、隐含层和输出层；其中，层与层之间的神经元全连接，同一层内的神经元无连接，每一层的神经元可以接收前一层神经元的信号，并产生信号输出到下一层。

3.根据权利要求2所述的一种融合卫星遥感和地面监测数据的臭氧浓度估算方法，其特征在于，包含一个输入层、一个输出层和L个隐含层，其中，L≥1。

4.根据权利要求2所述的一种融合卫星遥感和地面监测数据的臭氧浓度估算方法，其特征在于，隐含层的节点数通过以下操作得到：通过逐步扩大隐含层中节点的个数，对多层映射反向传播神经网络进行不断地训练对比；当预测结果与真实结果趋于一致时，得到隐含层的节点数。

5.根据权利要求1所述的一种融合卫星遥感和地面监测数据的臭氧浓度估算方法，其特征在于，步骤三中，基于影响因素探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合，其操作包括：

首先，采用统计学的方法，分析步骤一所得输入参数与臭氧浓度的相关性；

然后，根据所得相关性的强弱以及步骤一所得输入参数本身的类别特点，进行分类与分组，将分组得到的每组输入参数据输入至步骤二所得臭氧浓度估算运算基础模型中进行训练和验证；

最后，基于决定系数、平均误差和均方根误差，确定步骤二所得臭氧浓度估算运算基础模型的输入参数在影响因素维度上的最优化输入参数组合。

6.根据权利要求1所述的一种融合卫星遥感和地面监测数据的臭氧浓度估算方法，其特征在于，步骤三中，基于前溯时间探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合，其操作包括：

采用循环探索的方式，以t_s小时为步长逐步增大前溯时段的范围；前溯时段每增长t_s小时，与该时段相对应的输入参数都会被增添至步骤二所得臭氧浓度估算运算基础模型的输入参数中；基于决定系数、平均误差和均方根误差，确定步骤二所得臭氧浓度估算运算基础模型的输入参数在前溯时间维度上的最优化输入参数组合；

其中，5≥t_s≥1；

其中，当前溯时段超越预设阈值、且步骤二所得臭氧浓度估算运算基础模型的估算结果保持不变或持续变差时，终止探索。