[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN113189014B - 一种融合卫星遥感和地面监测数据的臭氧浓度估算方法 - Google Patents

一种融合卫星遥感和地面监测数据的臭氧浓度估算方法 Download PDF

Info

Publication number
CN113189014B
CN113189014B CN202110401303.4A CN202110401303A CN113189014B CN 113189014 B CN113189014 B CN 113189014B CN 202110401303 A CN202110401303 A CN 202110401303A CN 113189014 B CN113189014 B CN 113189014B
Authority
CN
China
Prior art keywords
ozone concentration
layer
remote sensing
concentration estimation
basic model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110401303.4A
Other languages
English (en)
Other versions
CN113189014A (zh
Inventor
杨晓婷
张猛
张博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202110401303.4A priority Critical patent/CN113189014B/zh
Publication of CN113189014A publication Critical patent/CN113189014A/zh
Application granted granted Critical
Publication of CN113189014B publication Critical patent/CN113189014B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • G01S17/89Lidar systems specially adapted for specific applications for mapping or imaging
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • G01S17/95Lidar systems specially adapted for specific applications for meteorological use
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N2021/1765Method using an image detector and processing of image signal
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N2021/1793Remote sensing
    • G01N2021/1795Atmospheric mapping of gases
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Electromagnetism (AREA)
  • Remote Sensing (AREA)
  • Software Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种融合卫星遥感和地面监测数据的臭氧浓度估算方法,属于环境监测技术领域。包括:步骤一,多源样本数据的收集、预处理与融合,得到输入参数;步骤二,基于多层映射反向传播神经网络,建立臭氧浓度估算运算基础模型;步骤三,基于影响因素、前溯时间和空间范围,探寻所得臭氧浓度估算运算基础模型的最优化输入参数组合,根据所得最优化输入参数组合对地面臭氧浓度进行准确估算,得到臭氧浓度的空间连续分布情况,实现融合卫星遥感和地面监测数据的臭氧浓度估算方法。本发明具有准确性高、可靠性强、操作简单的优点,所用到的多源样本数据均免费且开源,增强了通用性,能够快速估算臭氧浓度并绘制其在目标区域的连续分布图。

Description

一种融合卫星遥感和地面监测数据的臭氧浓度估算方法
技术领域
本发明属于环境监测技术领域,涉及一种融合卫星遥感和地面监测数据的臭氧浓度估算方法。
背景技术
随着城市化和工业化进程的加速,大气污染问题日趋严重,臭氧已经成为影响环境空气质量的首要污染物,并直接影响着人类的身心健康。因此,监测并揭示臭氧在时间和空间上连续分布的规律,对防治臭氧污染以及预防其对健康的危害具有重要意义。
目前,常见的臭氧监测方法有地面监测和遥感监测。地面监测基于监测站进行全天候连续观测,能够直接得到地表空间臭氧浓度及其随时间变化的准确信息。但是,监测站点建设成本高,数量有限,分布不均,难以实现大范围空间内连续准确的臭氧浓度监测。利用卫星遥感影像数据监测臭氧的研究始于20世纪80年代,主要包括模式比例因子法、基于物理机理的半经验法以及统计模型方法等。在过去的几十年中,上述臭氧估算方法尽管已经有了较广泛的应用,但仍存在以下问题:1)模型结构与模拟过程十分复杂,计算成本较高;2)对基础数据要求较高,而污染物排放清单往往存在较大的不确定性,这就使得估算精度有限;3)估算结果受参数设置的影响较大,这些参数不仅计算过程十分繁琐,而且在不同地域之间差异显著。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种融合卫星遥感和地面监测数据的臭氧浓度估算方法,所述基于机器学习的臭氧浓度估算方法准确性高,可靠性强,操作简单,解决了现有臭氧浓度估算方法所得结论的不确定性高且计算复杂的问题。
为了达到上述目的,本发明采用以下技术方案予以实现:
本发明公开了一种融合卫星遥感和地面监测数据的臭氧浓度估算方法,包括以下步骤:
步骤一,多源样本数据的收集、预处理与融合,得到输入参数;
步骤二,基于多层映射反向传播神经网络,建立臭氧浓度估算运算基础模型;
步骤三,基于影响因素、前溯时间和空间范围三个维度,结合步骤一所得输入参数,探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合,根据所得最优化输入参数组合对地面臭氧浓度进行估算,得到臭氧浓度的空间连续分布结果,实现融合卫星遥感和地面监测数据的臭氧浓度估算方法。
优选地,步骤一中,多源样本数据包括:卫星遥感影像数据、空气质量监测数据和气象数据。
优选地,步骤一中,多源样本数据的预处理,包括去云处理和获得归一化植被指数NDVI:基于卫星遥感影像数据的云层识别与分类、云层在地面的投射影响范围和云层覆盖率,并根据不同的云层特性对遥感影像进行去云处理;对卫星遥感影像数据进行正射校正和空间位置配准,并提取卫星遥感影像数据中各波段的波段反射率,获得归一化植被指数NDVI。
优选地,步骤一中,多源样本数据的融合,包括以下操作:通过邻近分析算法获取距离环境监测站点最近的气象站点,并将该距离环境监测站点最近的气象站点监测到的气象数据,作为该环境监测站点的气象信息,实现多源样本数据的融合;其中,针对多源样本数据建立用于溯源分析的索引。
优选地,步骤二中,基于多层映射反向传播神经网络,建立得到的臭氧浓度估算运算基础模型,包括输入层、隐含层和输出层;其中,层与层之间的神经元全连接,同一层内的神经元无连接,每一层的神经元可以接收前一层神经元的信号,并产生信号输出到下一层。
进一步优选地,包含一个输入层、一个输出层和L个隐含层,其中,L≥1。
进一步优选地,隐含层的节点数通过以下操作得到:通过逐步扩大隐含层中节点的个数,对多层映射反向传播神经网络进行不断地训练对比;当预测结果与真实结果趋于一致时,得到隐含层的节点数。
优选地,步骤二中,所得臭氧浓度估算运算基础模型的输入参数包括:卫星遥感影像数据中不同波段的波段反射率、归一化植被指数和气象数据;臭氧浓度估算运算基础模型的输出数据为遥感影像成像时监测站点的臭氧浓度值。
优选地,步骤三中,基于影响因素探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合,其操作包括:
首先,采用统计学的方法,分析步骤一所得输入参数与臭氧浓度的相关性;然后,根据所得相关性的强弱以及步骤一所得输入参数本身的类别特点,进行分类与分组,将分组得到的每组输入参数据输入至步骤二所得臭氧浓度估算运算基础模型中进行训练和验证;最后,基于决定系数、平均误差和均方根误差,确定步骤二所得臭氧浓度估算运算基础模型的输入参数在影响因素维度上的最优化输入参数组合。
优选地,步骤三中,基于前溯时间探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合,其操作包括:采用循环探索的方式,以ts小时为步长逐步增大前溯时段的范围;前溯时段每增长ts小时,与该时段相对应的输入参数都会被增添至步骤二所得臭氧浓度估算运算基础模型的输入参数中;基于决定系数、平均误差和均方根误差,确定步骤二所得臭氧浓度估算运算基础模型的输入参数在前溯时间维度上的最优化输入参数组合;其中,5≥ts≥1;其中,当前溯时段超越预设阈值、且步骤二所得臭氧浓度估算运算基础模型的估算结果保持不变或持续变差时,终止探索。
优选地,步骤三中,基于空间范围探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合,其操作包括:进行臭氧浓度估算运算基础模型的训练和验证,记录决定系数、平均误差和均方根误差;根据研究区内设定的步长,逐步扩大训练和验证的区域,并通过决定系数、平均误差和均方根误差,确定步骤二所得臭氧浓度估算运算基础模型的输入参数在空间范围维度上的最优化输入参数组合;其中,当臭氧浓度估算运算基础模型训练和验证区域超过预设阈值、且臭氧浓度估算结果保持不变或持续变差,终止探索。
与现有技术相比,本发明具有以下有益效果:
本发明公开了一种融合卫星遥感和地面监测数据的臭氧浓度估算方法,通过多源样本数据的收集、预处理与融合,能够得到输入参数,通过多层映射反向传播神经网络,结合机器学习,能够建立臭氧浓度估算运算基础模型,通过基于影响因素、前溯时间和空间范围三个维度,能够探索输入参数的最优化组合,进而实现地面臭氧浓度的准确估算。此外,影响因素、前溯时间以及空间范围三个维度上的寻优过程并不是相互分离、单独运行,而是综合考虑的,能够更加全面准确的找到最优的输入参数组合。因此,本发明所述基于机器学习的臭氧浓度估算方法,准确性高,可靠性强,操作简单,可以估算臭氧浓度,在环境监测工作中,能够间接获得臭氧浓度,具有较强的推广应用价值。
进一步地,所述多源样本数据均免费且开源,增强了模型的通用性,从而能够快速估算臭氧浓度并绘制其在目标区域的连续分布图。
进一步地,通过去云处理和获得归一化植被指数NDVI,能够去除云对估算结果的影响,提高模型对地面臭氧浓度估算的准确度。
进一步地,采用多源样本数据的融合,并建立其溯源分析的索引,可以将不同来源的相关数据(如卫星遥感影像数据、气象数据和空气质量数据)汇总并融合起来,便于臭氧估算模型使用。
进一步地,通过多层映射反向传播神经网络的建立,能够适应于地面臭氧浓度的分布与温度、相对湿度、大气压、风速和风向等众多因素有着非常复杂的非线性关系,而多层映射反向传播神经网络以其独特的结构,在处理和解决非线性映射问题时具备相对较大的优势。
进一步地,从影响因素维度出发,确定了该臭氧浓度估算运算基础模型的最优化输入参数组合,提高了地面臭氧浓度估算的准确性。
进一步地,在臭氧浓度估算运算的过程中,对估算值产生影响的不仅包括与卫星成像时间(记为T0)同时刻的气象参数,还应该包括由T0前溯至某时刻的前溯时间(记为T1)的时间段内(即:T0-T1)的气象状况;因此本发明所述方法中基于前溯时间探索的方式很好的解决了这一问题,确定了最优的前溯时间,提高了地面臭氧浓度估算的准确性。其中,通过循环探索的方式,并设定步长ts,5≥ts≥1;若ts<1,不仅样本数据难以获取,而且过多的数据量还会使预测过程变得十分复杂;若ts>5,则会使最优前溯时段的误差增大,从而使模型的准确率大大降低。
进一步地,当研究区内的监测站点较少,但在该研究区周边却布有一定数量的地面监测站时,用于模型训练和验证的最佳空间范围将很有可能大于该研究区域;因此本发明所述方法中通过空间范围探索克服了空间范围对估算结果的影响,确定了最优的空间范围,提高了地面臭氧浓度估算的准确性。
附图说明
图1为本发明所述一种融合卫星遥感和地面监测数据的臭氧浓度估算方法的流程示意图;
图2为本发明实施例提供的多层映射反向传播神经网络建立的臭氧浓度估算运算基础模型示意图;
图3为本发明实施例提供的臭氧浓度估算运算基础模型训练、验证以及测试的最佳空间范围示意图;其中,(a)最佳空间范围等于研究区域;(b)最佳空间范围大于研究区域;
图4为本发明实施例提供的北京市地面臭氧浓度估算值和监测值之间的相关性拟合图;
图5为本发明实施例提供的北京市模型估算的地面臭氧浓度与监测站的监测值对比;
图6为本发明实施例提供的不同时刻北京臭氧浓度的空间分布图:(a)2018年10月1日UTC 2:53;(b)2019年3月26日UTC 2:53。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面结合附图对本发明做进一步详细描述:
参见图1,可知本发明所述一种基于机器学习且融合卫星遥感和地面监测数据的臭氧浓度估算方法,步骤如下:
步骤一,多源样本数据的收集、预处理与融合,得到输入参数。
其中,多源样本数据主要包括:卫星遥感影像数据(Landsat 8,MODIS等)、空气质量监测数据(O3)以及气象数据(风速,风向,湿度,气温,气压等)
具体地,在本发明的某一具体实施方式中,卫星遥感影像数据收集自GoogleEarth Engine(GEE),空气质量监测数据收集自中国环境监测总站(CNEMC),气象数据收集自美国国家海洋和大气管理局(NOAA)。
其中,多源样本数据的预处理,包括:基于Google Earth Engine(GEE)所提供的API及其它相关开源程序,实现研究区内卫星遥感影像数据的云层识别与分类、云层在地面的投射影响范围和云层覆盖率的计算,并根据不同的云层特性采用相应的算法对遥感影像进行去云处理;对研究区内的卫星遥感影像数据进行正射校正和空间位置配准,同时提取遥感影像中各波段的波段反射率,通过下述公式计算获得归一化植被指数NDVI:
NDVI=(NIR-R)/(NIR+R);其中,NIR为近红外波段的反射值,R为红光波段的反射值。
其中,多源样本数据的融合,包括:建立样本数据的索引,便于对估算结果进行溯源分析。通过邻近分析算法获取距离环境监测站点最近的气象站点,并将其监测的气象数据作为该环境监测站点的气象信息,实现多源样本数据的融合。
步骤二,基于多层映射反向传播神经网络,建立臭氧浓度估算运算基础模型。
本发明所构建的臭氧浓度估算运算基础模型由一个输入层,L个隐含层(L≥1)和一个输出层组成。其中,层与层之间的神经元全连接,同一层内的神经元无连接。每一层的神经元可以接收前一层神经元的信号,并产生信号输出到下一层。当一组样本数据被提供给该臭氧浓度估算运算基础模型时,输入信号从输入层经隐含层逐层向后传播,直至输出层;如果输出层得不到期望的输出结果,那么则会沿着减少误差的方向,从输出层经过中间各层逐层向前修正网络的连接权值,直至到达输入层;前向计算过程和反向传播过程反复进行,不断调整各层的权值和阈值,从而使反向传播神经网络的预测输出不断逼近期望输出。该臭氧浓度估算运算基础模型采用tansig函数作为不同隐藏层之间的传递函数,采用purelin函数作为最后一个隐藏层与输出层之间的传递函数,网络训练过程则采用Levenberg-Marquardt(LM)算法的trainlm函数计算。对于神经网络隐含层中节点数的确定,本发明根据柯尔莫哥罗夫定理,通过逐步扩大隐含层中节点的个数,并对网络进行不断地训练对比,从而选取最合适的网络结构。其中,该臭氧浓度估算运算基础模型的输入参数主要包括:卫星遥感影像数据中不同波段的波段反射率、归一化植被指数以及相关的气象数据,该臭氧浓度估算运算基础模型的输出数据为遥感影像成像时地面监测站点的臭氧浓度值。
具体地,在本发明的某一具体实施方式中,本发明所构建的臭氧浓度估算运算基础模型由一个输入层,L个隐含层(L=2)和一个输出层组成。
本发明选用平均误差(ME)、均方根误差(RMSE)和决定系数(R2)对臭氧浓度估算运算基础模型进行全面、客观地评价。
Figure BDA0003020440730000081
其中,O3G为神经网络的臭氧浓度估算值,O3S为臭氧浓度实测值,N为样本数目。
步骤三,从影响因素、前溯时间和空间范围三个不同的维度出发,探寻臭氧浓度估算运算基础模型的最优化输入参数组合,根据所得最优化输入参数组合对地面臭氧浓度进行准确估算,得到臭氧浓度的空间连续分布结果,并能够快速估算臭氧浓度并绘制其在目标区域的连续分布图,实现基于机器学习的臭氧浓度估算方法。
探寻影响因素的最优化组合,其操作包括:首先,采用统计学的方法,分析步骤一所得输入参数与臭氧浓度的相关性;然后,根据相关性的强弱以及步骤一所得输入参数本身的类别特点,对所有可能的输入参数进行分类与分组,分组得到的每组输入参数据都将被输入至臭氧浓度估算运算基础模型中进行训练和验证。通过对R2、ME和RMSE三个参数的综合评判,确定臭氧浓度估算运算基础模型的输入数据在影响因素维度上的最优化组合。
探寻前溯时间的最优化组合,其操作包括:采用循环探索的方式,以1~5小时为步长(ts)逐步增大前溯时段的范围。前溯时段每增长1~5小时,与该时段相对应的输入参数都会被增添至臭氧浓度估算运算基础模型的输入参数中,并通过对R2、ME和RMSE三个参数的综合评判来确定臭氧浓度估算运算基础模型的输入参数在前溯时间维度上的最优化输入参数组合。该探索过程的终止可依据两个原则加以控制:1)前溯时段足够长,即前溯时段超越预设阈值;2)臭氧浓度估算运算基础模型的估算结果保持不变或持续变差。
具体地,在本发明的某一具体实施方式中,以3小时为步长逐步增大前溯时段的范围。探寻空间范围的最优化组合:首先在研究区内进行臭氧浓度估算运算基础模型的训练和验证,记录其R2、ME和RMSE。然后逐步扩大训练和验证区域,直至有一个或多个新的监测站点出现在研究区内,通过R2、ME和RMSE三个特征值来综合评判相应估算结果的优劣,确定臭氧浓度估算运算基础模型的输入参数在空间范围维度上的最优化输入参数组合。该探索过程的终止可依据两个原则加以控制:1)臭氧浓度估算运算基础模型训练和验证区域足够大,超过预设阈值;2)臭氧浓度估算结果保持不变或持续变差。
其中,本发明在影响因素、前溯时间以及空间范围三个维度上的寻优过程并不是相互分离、单独运行的,而是会被结合在一起综合考虑,去探寻臭氧浓度估算运算基础模型输入参数的最优化组合,从而得到在已有样本数据条件支持下的最佳估算结果。
本发明基于反向传播神经网络所创建的臭氧浓度估算运算基础模型准确性高,可靠性强,可以在一定程度上估算臭氧浓度,具有较强的应用潜力。同时,由于该模型估算过程中所用到的数据均免费且开源,这增强了模型的通用性。此外,本发明所选用的反向传播神经网络模型非常适合采用分布式并行计算的处理方法,这可以在很大程度上提高运算效率,从而使快速估算臭氧浓度在空间上的连续分布成为可能。
为了说明本发明所述的技术方案,下面以北京市为具体实施案例来进行说明。
步骤一,多源样本数据的收集、预处理与融合,得到输入参数。
在本实施例中,通过Google Earth Engine(GEE,https://earthengine.google.com/)收集2014年5月1日至2019年10月1日北京市的Landsat 8遥感影像数据;通过中国环境监测总站(CNEMC,http://www.cnemc.cn/)收集同时间北京市的地面臭氧浓度数据;通过美国国家海洋和大气管理局(NOAA,https://gis.ncdc.noaa.gov/maps/ncei/cdo/hourly)收集同时间北京市的气象数据,包括:风速、风向、湿度、气温、气压等。
基于Google Earth Engine(GEE)所提供的API及其它相关开源程序,实现研究区内卫星遥感影像数据的云层识别与分类、云层在地面的投射影响范围和云层覆盖率的计算,并根据不同的云层特性采用相应的算法对遥感影像进行去云处理。对研究区内的卫星遥感影像数据进行正射校正和空间位置配准,同时提取遥感影像中各波段的波段反射率,通过下述公式计算获得归一化植被指数NDVI:
NDVI=(band5–band4)/(band5+band4)
其中band5为Landsat 8遥感影像波段5的反射率,band4为Landsat 8遥感影像波段4的反射率。
建立样本数据的索引,便于对臭氧浓度估算结果进行溯源分析。提取中国环境监测站点方圆15米缓冲区内的波段反射率以及NDVI数据,并将均值赋予到对应的中国环境监测站,实现Landsat 8遥感影像数据与空气质量数据的融合。其次,通过邻近分析算法获取距离中国环境监测站点最近的气象监测站点,并将其监测的气象数据作为该中国环境监测站点的气象信息。
步骤二,基于多层映射反向传播神经网络建立臭氧浓度估算运算的基础模型。
如图2所示,本实施例所构建的臭氧浓度估算运算基础模型由一个输入层,两个隐含层和一个输出层组成。其中,层与层之间的神经元全连接,同一层内的神经元无连接。每一层的神经元可以接收前一层神经元的信号,并产生信号输出到下一层。当一组样本数据被提供给该模型时,输入信号从输入层经隐含层逐层向后传播,直至输出层。如果输出层得不到期望的输出结果,那么则会沿着减少误差的方向,从输出层经过中间各层逐层向前修正网络的连接权值,直至到达输入层。前向计算过程和反向传播过程反复进行,不断调整各层的权值和阈值,从而使臭氧浓度估算运算基础模型的预测输出不断逼近期望输出。
图2中,X1,X2,…,Xm是臭氧浓度估算运算基础模型的输入参数,在本实例中主要包括Landsat 8遥感影像数据中不同波段的波段反射率、NDVI以及相关的气象数据,如:风速、风向、湿度、气温、气压等。Y是该模型的估算值,即Landsat 8遥感影像成像时地面监测站点的臭氧浓度值。
Figure BDA0003020440730000111
表示从l-1层的第j个神经元到l层的第i个神经元的连接上的权重,
Figure BDA0003020440730000112
表示在l层第i个神经元的偏置,
Figure BDA0003020440730000113
表示l层第i个神经元的激活值。该臭氧浓度估算运算基础模型采用tansig函数作为不同隐藏层之间的传递函数,采用purelin函数作为最后一个隐藏层与输出层之间的传递函数,网络训练过程则采用Levenberg-Marquardt(LM)算法的trainlm函数计算。
此外,对于神经网络隐含层中节点数的确定,本发明根据柯尔莫哥罗夫定理,通过逐步扩大隐含层中节点的个数,并对多层映射反向传播神经网络进行不断地训练对比,从而选取最合适的网络结构。最终确定[15,15]为本实施例该多层映射反向传播神经网络的最优节点个数。
本实施例采用机器学习模型评估中常用的留出法,通过多次随机取样的方式选取训练数据集与验证测试数据集,其中训练集占比80%,验证测试集占比20%。根据确定的神经网络结构和传递函数,最大训练次数设置为500,网络训练精度设置为0.001,学习速率为0.1。每组实验重复300次取平均值作为模型评估的最终结果。最后选用平均误差(ME)、均方根误差(RMSE)和决定系数(R2)对臭氧浓度估算运算基础模型进行全面、客观地评价。
Figure BDA0003020440730000121
其中,O3G为臭氧浓度的估算值,O3S为臭氧浓度的实测值,N为样本数目。
步骤三,从影响因素、前溯时间和空间范围三个不同的维度出发,探寻臭氧浓度估算运算基础模型的最优化输入参数组合。
探寻影响因素的最优化组合:采用统计学的方法,分析各类数据与臭氧浓度的相关性。根据相关性的强弱以及数据本身的类别特点,对所有可能的输入数据进行分类与分组。在本实施例中,根据与臭氧相关性的强弱以及不同的数据来源和特征,17个备选输入影响因素被分为以下三组,即:
(1)Landsat 8OLI/TIRS中波段1、波段2和波段3的反射率,它们与臭氧浓度有很强的相关性;
(2)其他波段的反射率,以及根据Landsat 8OLI的波段4和波段5计算出的NDVI;
(3)气象参数,风速、风向、湿度、气温和气压。
由于(1)组中的参数与臭氧浓度有较强的相关性,因此将波段1、波段2和波段3的反射率作为臭氧估算的依据,从而在整个过程中一直采用这些参数来探索备选输入影响因素的最佳组合。将这三组不同的参数分步输入到模型中进行训练、学习和验证,根据ME、RMSE和R2可以比较不同的备选输入参数组合所产生的训练结果,从而实现输入参数与各种影响因素的最优化输入参数组合。
探寻前溯时间的最优化输入参数组合:由于气象条件会随着时间的推移而发生明显的变化,不论是卫星成像时的气象参数,还是之前的气象条件都会对臭氧浓度的估算精度产生明显影响。对于一个特定的研究区域(如一个城市),探索最佳前溯时间的过程可以通过以下六个步骤来描述:
第一步:以T0代表卫星成像时间,T1代表前溯时间,ts代表时间步长。
第二步:设T1=T0并评价臭氧浓度估算运算基础模型的O3估算性能,记为P0
第三步:由于气象参数由地面监测站每3小时采集一次,故设ts=3h,T1=T0-n×ts,其中n为大于零的整数。
第四步:将[T0,T1]时间段内的所有气象参数输入到臭氧浓度估算运算基础模型中,评估臭氧浓度估算运算基础模型的O3估算性能,记录为
Figure BDA0003020440730000131
第五步:如果当前性能
Figure BDA0003020440730000132
优于之前的P0,设
Figure BDA0003020440730000133
n=n+1。
第六步:反复重复第三步~第五步,直到
Figure BDA0003020440730000134
连续比P0差,或[T0,T1]时间段变得足够长,例如大于经验上确定的阈值。
由上述迭代过程所探索出的[T0,T1]将作为多层映射反向传播神经网络训练的最佳前溯时间。
探寻空间范围的最优化组合:根据经验,多层映射反向传播神经网络训练的最佳空间范围不一定要与研究区域的最小包围矩形相同。实际情况下,它与监测站的分布有关,可以大于研究区域的最小包围矩形,见图3。对于一个特定的研究区域(如一个城市),探索最佳空间范围的过程可以通过以下六个步骤来描述:
第一步:以S0
Figure BDA0003020440730000135
分别代表研究区域的最小包围矩形和神经网络训练的空间范围。
第二步:设
Figure BDA0003020440730000136
并评价臭氧浓度估算运算基础模型的O3估算性能,记为P0
第三步:沿经度和纬度两个方向逐步扩大
Figure BDA0003020440730000137
直到有一个或多个新的监测站落在
Figure BDA0003020440730000141
内。
第四步:评估臭氧浓度估算运算基础模型的O3估算性能,记录为
Figure BDA0003020440730000142
第五步:如果当前性能
Figure BDA0003020440730000143
优于之前的P0,设
Figure BDA0003020440730000144
第六步:反复重复第三步~第五步,直到面积
Figure BDA0003020440730000145
变得足够大,例如
Figure BDA0003020440730000146
大于经验上确定的阈值。
由上述迭代过程所探索出的
Figure BDA0003020440730000147
将作为神经网络训练的最佳空间范围。
本实施例在影响因素、前溯时间以及空间范围三个维度上的寻优过程并不是相互分离、单独运行的,而是会被结合在一起综合考虑,去探寻臭氧浓度估算运算基础模型输入参数的最优化组合,从而得到在已有样本数据条件支持下的最佳估算结果。
图4显示了北京市地面臭氧浓度估算值和监测值之间的相关性,其中R2为0.91,ME为1.2μg/m3,RMSE为18.4μg/m3。拟合直线的斜率趋近于1,相关性十分显著。图5比较了北京市模型估算的地面臭氧浓度与监测站的监测值,其中红色线表示实际观测到的臭氧浓度值,蓝色线表示估算的臭氧浓度值。大多情况下,估算数据与监测数据的趋势基本一致。因此,本发明建立的臭氧浓度估算运算基础模型具备准确估算地面臭氧浓度的能力,有望成为大气污染变化监测与区域分析的一个新的重要手段。
图6(a)和图6(b)分别显示了2018年10月1日UTC 2:53和2019年3月26日UTC 2:53时刻北京地区臭氧浓度的空间分布,其空间分辨率高达30m。这两个时刻地面臭氧浓度均呈现出从东南至西北逐渐递减的趋势,与北京西北高、东南低的地势以及工业化和人口密度特征相一致。
以上所述,仅是用以说明本发明的具体实施案例而已,并非用以限定本发明的可实施范围,举凡本领域熟练技术人员在未脱离本发明所指示的精神与原理下所完成的一切等效改变或修饰,仍应由本发明权利要求的范围所覆盖。

Claims (6)

1.一种融合卫星遥感和地面监测数据的臭氧浓度估算方法,其特征在于,包括以下步骤:
步骤一,多源样本数据的收集、预处理与融合,得到输入参数;
多源样本数据包括:卫星遥感影像数据、空气质量监测数据和气象数据;
多源样本数据的预处理,包括去云处理和获得归一化植被指数NDVI:基于卫星遥感影像数据的云层识别与分类、云层在地面的投射影响范围和云层覆盖率,并根据不同的云层特性对遥感影像进行去云处理;对卫星遥感影像数据进行正射校正和空间位置配准,并提取卫星遥感影像数据中各波段的波段反射率,获得归一化植被指数NDVI;
多源样本数据的融合,包括以下操作:通过邻近分析算法获取距离环境监测站点最近的气象站点,并将该距离环境监测站点最近的气象站点监测到的气象数据,作为该环境监测站点的气象信息,实现多源样本数据的融合;
其中,针对多源样本数据建立用于溯源分析的索引;
输入参数包括:卫星遥感影像数据中不同波段的波段反射率、归一化植被指数NDVI以及相关的气象数据;气象数据包括风速、风向、湿度、气温和气压;
步骤二,基于多层映射反向传播神经网络,建立臭氧浓度估算运算基础模型;
步骤三,基于影响因素、前溯时间和空间范围三个维度,结合步骤一所得输入参数,探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合,根据所得最优化输入参数组合对地面臭氧浓度进行估算,得到臭氧浓度的空间连续分布结果,实现融合卫星遥感和地面监测数据的臭氧浓度估算方法;
步骤三中,基于空间范围探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合,其操作包括:
首先在研究区内进行臭氧浓度估算运算基础模型的训练和验证,记录决定系数、平均误差和均方根误差;然后根据设定的步长,逐步扩大训练和验证区域,直至有一个或多个新的监测站点出现在研究区内,通过决定系数、平均误差和均方根误差三个特征值来综合评判相应估算结果的优劣,确定臭氧浓度估算运算基础模型的输入参数在空间范围维度上的最优化输入参数组合;
其中,当臭氧浓度估算运算基础模型训练和验证区域超过预设阈值、且臭氧浓度估算结果保持不变或持续变差,终止探索。
2.根据权利要求1所述的一种融合卫星遥感和地面监测数据的臭氧浓度估算方法,其特征在于,步骤二中,基于多层映射反向传播神经网络,建立得到的臭氧浓度估算运算基础模型,包括输入层、隐含层和输出层;其中,层与层之间的神经元全连接,同一层内的神经元无连接,每一层的神经元可以接收前一层神经元的信号,并产生信号输出到下一层。
3.根据权利要求2所述的一种融合卫星遥感和地面监测数据的臭氧浓度估算方法,其特征在于,包含一个输入层、一个输出层和L个隐含层,其中,L≥1。
4.根据权利要求2所述的一种融合卫星遥感和地面监测数据的臭氧浓度估算方法,其特征在于,隐含层的节点数通过以下操作得到:通过逐步扩大隐含层中节点的个数,对多层映射反向传播神经网络进行不断地训练对比;当预测结果与真实结果趋于一致时,得到隐含层的节点数。
5.根据权利要求1所述的一种融合卫星遥感和地面监测数据的臭氧浓度估算方法,其特征在于,步骤三中,基于影响因素探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合,其操作包括:
首先,采用统计学的方法,分析步骤一所得输入参数与臭氧浓度的相关性;
然后,根据所得相关性的强弱以及步骤一所得输入参数本身的类别特点,进行分类与分组,将分组得到的每组输入参数据输入至步骤二所得臭氧浓度估算运算基础模型中进行训练和验证;
最后,基于决定系数、平均误差和均方根误差,确定步骤二所得臭氧浓度估算运算基础模型的输入参数在影响因素维度上的最优化输入参数组合。
6.根据权利要求1所述的一种融合卫星遥感和地面监测数据的臭氧浓度估算方法,其特征在于,步骤三中,基于前溯时间探索步骤二所得臭氧浓度估算运算基础模型的最优化输入参数组合,其操作包括:
采用循环探索的方式,以ts小时为步长逐步增大前溯时段的范围;前溯时段每增长ts小时,与该时段相对应的输入参数都会被增添至步骤二所得臭氧浓度估算运算基础模型的输入参数中;基于决定系数、平均误差和均方根误差,确定步骤二所得臭氧浓度估算运算基础模型的输入参数在前溯时间维度上的最优化输入参数组合;
其中,5≥ts≥1;
其中,当前溯时段超越预设阈值、且步骤二所得臭氧浓度估算运算基础模型的估算结果保持不变或持续变差时,终止探索。
CN202110401303.4A 2021-04-14 2021-04-14 一种融合卫星遥感和地面监测数据的臭氧浓度估算方法 Active CN113189014B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110401303.4A CN113189014B (zh) 2021-04-14 2021-04-14 一种融合卫星遥感和地面监测数据的臭氧浓度估算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110401303.4A CN113189014B (zh) 2021-04-14 2021-04-14 一种融合卫星遥感和地面监测数据的臭氧浓度估算方法

Publications (2)

Publication Number Publication Date
CN113189014A CN113189014A (zh) 2021-07-30
CN113189014B true CN113189014B (zh) 2023-05-02

Family

ID=76975794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110401303.4A Active CN113189014B (zh) 2021-04-14 2021-04-14 一种融合卫星遥感和地面监测数据的臭氧浓度估算方法

Country Status (1)

Country Link
CN (1) CN113189014B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113821987B (zh) * 2021-11-19 2022-03-25 浙江甲骨文超级码科技股份有限公司 复杂地形气象数据预测方法、系统和装置
CN115855761B (zh) * 2022-11-03 2023-09-26 生态环境部卫星环境应用中心 五基协同天空地一体化大气环境立体遥感监测系统及方法
CN115825338A (zh) * 2022-11-03 2023-03-21 浙江时空智子大数据有限公司 臭氧监测降尺度方法、装置、设备及计算机可读存储介质
CN116486278B (zh) * 2023-04-24 2023-11-21 河南大学 基于时空信息镶嵌的小时级臭氧估算方法
CN117216480B (zh) * 2023-09-18 2024-06-28 宁波大学 一种深度耦合地理时空信息的近地表臭氧遥感估算方法
CN117592005B (zh) * 2024-01-19 2024-04-26 中国科学院空天信息创新研究院 Pm2.5浓度卫星遥感估算方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909722A (zh) * 2017-02-10 2017-06-30 广西壮族自治区气象减灾研究所 一种近地面气温的大面积精准反演方法
CN110595968A (zh) * 2019-08-02 2019-12-20 中国科学院遥感与数字地球研究所 一种基于静止轨道卫星的pm2.5浓度估算方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102011081197A1 (de) * 2011-08-18 2013-02-21 Siemens Aktiengesellschaft Verfahren zur rechnergestützten Modellierung eines technischen Systems
CN110595960B (zh) * 2019-08-02 2021-05-14 中国科学院遥感与数字地球研究所 一种基于机器学习的pm2.5浓度遥感估算方法
CN111310386B (zh) * 2020-02-13 2023-04-21 北京中科锐景科技有限公司 一种近地面臭氧浓度估算方法
AU2020101095A4 (en) * 2020-06-23 2020-07-23 Tarim University A Satellite Remote Sensing Monitoring Method for the Content of Chlorophyll A in the Canopy of Jujube Trees
CN112052627A (zh) * 2020-08-21 2020-12-08 海南星瞰信息咨询中心(有限合伙) 近地面臭氧空间分布的估算方法、装置、介质及设备
CN112163375B (zh) * 2020-09-28 2024-05-10 中国科学院空天信息创新研究院 一种基于神经网络的长时间序列近地面臭氧反演方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909722A (zh) * 2017-02-10 2017-06-30 广西壮族自治区气象减灾研究所 一种近地面气温的大面积精准反演方法
CN110595968A (zh) * 2019-08-02 2019-12-20 中国科学院遥感与数字地球研究所 一种基于静止轨道卫星的pm2.5浓度估算方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Sarah Safieddine等.Tropospheric ozone variability during the East Asian summer monsoon as observed by satellite (IASI), aircraft (MOZAIC) and ground stations.《Atmospheric Chemistry and Physics》.2016,10489-10500. *

Also Published As

Publication number Publication date
CN113189014A (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
CN113189014B (zh) 一种融合卫星遥感和地面监测数据的臭氧浓度估算方法
CN111639747B (zh) 一种基于bp神经网络的gnss-r海面风速反演方法及系统
CN110174359B (zh) 一种基于高斯过程回归的航空高光谱影像土壤重金属浓度评估方法
CN110865040A (zh) 天空地一体化高光谱水质监测分析方法
CN111639746B (zh) 一种基于cnn神经网络的gnss-r海面风速反演方法及系统
CN109782274A (zh) 一种基于探地雷达信号时频统计特征的水损害识别方法
CN107230197B (zh) 基于卫星云图和rvm的热带气旋客观定强方法
CN110595968B (zh) 一种基于静止轨道卫星的pm2.5浓度估算方法
CN114460013B (zh) 滨海湿地植被地上生物量gan模型自学习遥感反演方法
CN105787184A (zh) 一种基于pm2.5的大气气溶胶光学厚度估计方法
CN116879297B (zh) 土壤水分协同反演的方法、装置、设备和介质
CN115690632A (zh) 一种内陆河流水体的水环境监测方法
CN110110025B (zh) 基于特征向量空间滤值的区域人口密度模拟方法
Barkataki et al. Classification of soil types from GPR B scans using deep learning techniques
CN110321528B (zh) 一种基于半监督地理空间回归分析的高光谱影像土壤重金属浓度评估方法
Machap et al. IoT audio sensor networks and decision trees for enhanced rain sound classification
CN114254692B (zh) 基于多源闪电数据的多尺度的雷暴智能分类与识别方法
CN114371519B (zh) 一种基于无偏差亮温的地基微波辐射计大气温湿廓线反演方法
CN118396482B (zh) 面向气候变化的耕地质量动态监测方法
CN114972984A (zh) 基于随机森林的积雪时空分析与预测方法
CN114005027A (zh) 一种基于无人机影像的城市单木检测系统及方法
CN116466368B (zh) 基于激光雷达和卫星资料的沙尘消光系数廓线估算方法
CN115840908B (zh) 基于lstm模型的微波链路构建pm2.5三维动态监测场的方法
CN117456342A (zh) 一种基于街景影像的交通事故风险评估方法及系统
Qian et al. Deep Learning-Augmented Stand-off Radar Scheme for Rapidly Detecting Tree Defects

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant