CN109543906B - 一种大气能见度预测的方法及设备 - Google Patents
一种大气能见度预测的方法及设备 Download PDFInfo
- Publication number
- CN109543906B CN109543906B CN201811405060.6A CN201811405060A CN109543906B CN 109543906 B CN109543906 B CN 109543906B CN 201811405060 A CN201811405060 A CN 201811405060A CN 109543906 B CN109543906 B CN 109543906B
- Authority
- CN
- China
- Prior art keywords
- data
- visibility
- training set
- sample
- set data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012549 training Methods 0.000 claims abstract description 53
- 238000013145 classification model Methods 0.000 claims abstract description 21
- 238000012952 Resampling Methods 0.000 claims abstract description 20
- 238000012544 monitoring process Methods 0.000 claims abstract description 17
- 238000012360 testing method Methods 0.000 claims abstract description 12
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000012795 verification Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 45
- 230000015654 memory Effects 0.000 claims description 18
- 239000000356 contaminant Substances 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 5
- 239000003344 environmental pollutant Substances 0.000 claims description 3
- 231100000719 pollutant Toxicity 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims description 3
- RAHZWNYVWXNFOC-UHFFFAOYSA-N Sulphur dioxide Chemical compound O=S=O RAHZWNYVWXNFOC-UHFFFAOYSA-N 0.000 claims 2
- MGWGWNFMUOTEHG-UHFFFAOYSA-N 4-(3,5-dimethylphenyl)-1,3-thiazol-2-amine Chemical compound CC1=CC(C)=CC(C=2N=C(N)SC=2)=C1 MGWGWNFMUOTEHG-UHFFFAOYSA-N 0.000 claims 1
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 claims 1
- CBENFWSGALASAD-UHFFFAOYSA-N Ozone Chemical compound [O-][O+]=O CBENFWSGALASAD-UHFFFAOYSA-N 0.000 claims 1
- 229910002091 carbon monoxide Inorganic materials 0.000 claims 1
- JCXJVPUVTGWSNB-UHFFFAOYSA-N nitrogen dioxide Inorganic materials O=[N]=O JCXJVPUVTGWSNB-UHFFFAOYSA-N 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 2
- 238000003860 storage Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000005291 magnetic effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012412 chemical coupling Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请的目的是提供一种大气能见度预测的方法及设备,本申请通过获取目标特征数据,其中,所述目标特征数据包括高空预报数据、地表预报数据及历史监测数据;对所述目标特征数据进行特征提取,得到包括基本特征、空间特征及时间特征的样本数据;将所述样本数据按照预设比例进行切分,得到训练集数据、验证集数据及测试集数据,以对所述训练集数据进行重采样,得到重采样训练集数据;根据二分类模型、回归模型及所述重采样训练集数据建立能见度预测模型。通过多种特征提取和预判结果的处理,建立能见度预测模型,以得到精确度更高的预报结果。
Description
技术领域
本申请涉及计算机领域,尤其涉及一种大气能见度预测的方法及设备。
背景技术
由于气象环境因素较为复杂,大气能见度的指标预测一直以来都是一个比较复杂的问题。目前,常用的预测方法有基于大气化学传输模型的机理预报方法与基于机器学习模型的统计预报方法。前者在实际工程中得到了广泛的运用,然而由于大气是一个非常复杂的系统,从理论上难以运行完全量化,因此机理预报方法存在较大的误差。
目前,国内气象局对大气能见度的预报采用大气化学耦合模式(WRF-Chem)结合多元线性回归模型订正后得到。由于数值模式计算、排放源清单数据存在不同程度的误差,回归模型也存在一定的局限性,因此现有的对大气能见度的预测效果并不理想。
发明内容
本申请的一个目的是提供一种大气能见度预测的方法及设备,解决现有技术中能见度预测效果差,不准确的问题。
根据本申请的一个方面,提供了一种大气能见度预测的方法,该方法包括:
获取目标特征数据,其中,所述目标特征数据包括高空预报数据、地表预报数据及历史监测数据;
对所述目标特征数据进行特征提取,得到包括基本特征、空间特征及时间特征的样本数据;
将所述样本数据按照预设比例进行切分,得到训练集数据、验证集数据及测试集数据,以对所述训练集数据进行重采样,得到重采样训练集数据;
根据二分类模型、回归模型及所述重采样训练集数据建立能见度预测模型。
进一步地,获取目标特征数据,包括:
将获取到的目标区域中站点采集到的数据以及所述目标区域周围站点采集到的数据作为目标特征数据。
进一步地,对所述目标特征数据进行特征提取,包括:
将所述高空预报数据、地表预报数据进行拆分,得到基本特征数据;
将同一特征在同一时刻时对应的高空预报数据与地表预报数据的值进行差运算,生成空间特征数据;
将起报时间之前预设单位时间内的历史监测数据,以及在所述预设单位时间内两个相邻时刻对应的历史监测数据的差值作为时间特征数据。
进一步地,对所述训练集数据进行重采样,得到重采样训练集数据,包括:
根据所述训练集数据中样本的能见度分布比例,对占比相对少的样本数据进行复制,得到重采样训练集数据。
进一步地,根据二分类模型、回归模型及所述重采样训练集数据建立能见度预测模型,包括:
根据二分类模型进行能见度预判,得到预判结果,根据所述预判结果确定调整所述回归模型的损失函数;
根据所述回归模型的损失函数及所述重采样训练集数据建立能见度预测模型。
进一步地,所述方法包括:
若所述预设结果为所述预判预设时间段内的能见度大于或等于所述预设能见度阈值,则确定调整所述回归模型的损失函数为第一损失函数;
若所述预设结果为所述预判预设时间段内的能见度小于所述预设能见度阈值,则确定调整所述回归模型的损失函数为第二损失函数。
进一步地,所述第一损失函数满足以下条件:
其中,Loss1表示均方误差,N为样本数据的数量,yi为第i个样本的真实值,为第i个样本的预测值,j为常数,1≤i≤n。
进一步地,所述第二损失函数满足以下条件:
其中,Loss2表示带有样本权重的均方误差,N为样本数据的数量,yi为第i个样本的真实值,为第i个样本的预测值,j为常数,1≤i≤N。
进一步地,所述方法包括:
通过所述验证集数据调整所述第一损失函数及所述第二损失函数中的样本数据。
根据本申请再一个方面,还提供了一种大气能见度预测的设备,其中,所述设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行前述的方法的操作。
根据本申请另一个方面,还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现前述一种大气能见度预测的方法。
与现有技术相比,本申请通过获取目标特征数据,其中,所述目标特征数据包括高空预报数据、地表预报数据及历史监测数据;对所述目标特征数据进行特征提取,得到包括基本特征、空间特征及时间特征的样本数据;将所述样本数据按照预设比例进行切分,得到训练集数据、验证集数据及测试集数据,以对所述训练集数据进行重采样,得到重采样训练集数据;根据二分类模型、回归模型及所述重采样训练集数据建立能见度预测模型。通过多种特征提取和预判结果的处理,建立能见度预测模型,以得到精确度更高的预报结果。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出根据本申请的一个方面提供的一种大气能见度预测的方法流程示意图;
图2示出本申请一实施例中能见度预测模型的建立框架图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本申请作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
图1示出根据本申请的一个方面提供的一种大气能见度预测的方法流程示意图,该方法包括:步骤S11~步骤S14,
在步骤S11中,获取目标特征数据,其中,所述目标特征数据包括高空预报数据、地表预报数据及历史监测数据;在此,目标特征数据为大气相关的数据,可从气象局中获得,包括高空WRF-Chem预报数据、地表WRF-Chem预报数据以及历史监测数据,其中,历史监测数据包括真实的气象数据和真实的污染物数据;获得的目标特征数据可以以数据字典的形式存储,其中,高空WRF-Chem预报数据的存储格式如表1所示:
字段名 | 含义 |
forecastdate | 起报时间 |
lst | 预报时间 |
siteid | 站点编号 |
sitename | 站点名称 |
lon | 经度 |
lat | 纬度 |
height | 高度 |
z | 位势 |
win_s | 风速 |
win_d | 风向 |
rh | 相对湿度 |
tc | 温度 |
td | 露点温度 |
表1
地表WRF-Chem预报数据的存储格式如表2所示:
表2
真实气象数据的存储格式如表3所示:
字段名 | 含义 |
datetime | 时间 |
siteid | 站点编号 |
sitename | 站点名称 |
lon | 经度 |
lat | 纬度 |
tem | 温度 |
vis | 能见度 |
rhu | 相对湿度 |
prs | 气压 |
pre | 降水量 |
win_s | 风速 |
win_d | 风向 |
表3
真实污染物数据如表4所示:
字段名 | 含义 |
datetime | 时间 |
siteid | 站点编号 |
sitename | 站点名称 |
lon | 经度 |
lat | 纬度 |
pm25 | PM2.5浓度 |
pm10 | PM10浓度 |
so2 | so2浓度 |
o3 | o3浓度 |
co | co浓度 |
no2 | no2浓度 |
表4
在步骤S12中,对所述目标特征数据进行特征提取,得到包括基本特征、空间特征及时间特征的样本数据;在此,需要对从气象局获得的目标特征数据进行特征提取,以确定用于建立能见度预测模型的样本数据,其中,特征提取包括基本数据、空间特征以及时间特征的提取,从而使得建立的预测模型预报结果更接近真实数据,更有参考价值,预报精度更准确。
在步骤S13中,将所述样本数据按照预设比例进行切分,得到训练集数据、验证集数据及测试集数据,以对所述训练集数据进行重采样,得到重采样训练集数据;在此,对所述目标特征数据进行特征提取,得到包括基本特征、空间特征及时间特征的样本数据之后,将所述样本数据按照预设比例进行切分,得到训练集数据、验证集数据及测试集数据;从而对所述训练集数据进行重采样,得到重采样训练集数据。
在步骤S14中,根据二分类模型、回归模型及所述重采样训练集数据建立能见度预测模型;在此,对获取到的目标特征数据进行特征提取后,进行划分训练集、测试集以及验证集,并对训练集进行重采样,以通过重采样后的训练集对二分类模型进行训练,以确定用于调整回归模型的损失函数,从而实现多模型融合建立能见度预测模型。
在本申请一实施例中,在步骤S13中,根据所述训练集数据中样本的能见度分布比例,对占比相对少的样本数据进行复制,得到重采样训练集数据;在此,根据重采样后的训练集中样本的能见度分布比例对占比较少的样本进行复制,使得各个能见度范围内的样本数量均衡,提高能见度预测的准确性。从而在步骤S14中,根据二分类模型进行能见度预判,得到预判结果,根据所述预判结果确定调整所述回归模型的损失函数;根据所述回归模型的损失函数及所述重采样训练集数据建立能见度预测模型。在此,使用重采样后的训练集数据对二分类模型进行训练,以确定选择第一类损失函数还是第二类损失函数。
进一步地,若所述预设结果为所述预判预设时间段内的能见度大于或等于所述预设能见度阈值,则确定调整所述回归模型的损失函数为第一损失函数;若所述预设结果为所述预判预设时间段内的能见度小于所述预设能见度阈值,则确定调整所述回归模型的损失函数为第二损失函数。在此,低能见度对生产生活的影响更大,因此模型对低能见度的预测准确性比高能见度的预测准确性更加重要。根据对未来能见度的二分类预判结果确定使用的损失函数的类型。其中,低能见度为能见度值小于预设能见度阈值,高能见度为能见度值大于或等于预设能见度阈值,避免对低能见度漏报的情况,对高能见度和低能见度的情况分别使用不同的损失函数进行调整。在本申请一实施例中,先对能见度进行归类,随后进行预判,以根据预判结果调整建立的回归模型,以避免样本数据发生严重倾斜,偏向低能见度或高能见度。二分类模型可以采用XGBoost二分类模型,预设能见度阈值可为10km,预判预设时间段内为未来48小时;采用XGBoost二分类模型对未来48小时的能见度是否大于10km进行预判;回归模型为XGBoost回归模型,根据二分类预判结果调整回归模型的损失函数,训练完成之后可以输出能见度数值大小。
在本申请一实施例中,在步骤S11中,将获取到的目标区域中站点采集到的数据以及所述目标区域周围站点采集到的数据作为目标特征数据。在此,因大气流动对污染物的迁移具有非常大的作用,因此对于某个站点,该站点的污染物并不仅仅来自于站点所在区域,还需要考虑到周围站点或该站点所在区域的周边的污染物浓度和气象状况。获取目标特征数据时,可以获取单个站点的数据的同时也获取该站点周围附近站点的数据,比如以上海徐汇区为例,将距离其最近的四个站点:嘉定、宝山、闵行及浦东四个站点的一些关键因子(比如将湿度、PM2.5)也作为徐汇区站点的特征。
在本申请一实施例中,在步骤S12中,进行特征提取时,将所述高空预报数据、地表预报数据进行拆分,得到基本特征数据;将同一特征在同一时刻时对应的高空预报数据与地表预报数据的值进行差运算,生成空间特征数据;将起报时间之前预设单位时间内的历史监测数据,以及在所述预设单位时间内两个相邻时刻对应的历史监测数据的差值作为时间特征数据。在此,通过相关性分析,大气能见度与当前时刻的湿度、污染物浓度等因素密切相关,在本申请所述实施例中,对于基本特征数据:将地表和高空的WRF-Chem预报结果作为基本特征参与建模,将不同高度上的WRF-Chem预报结果进行拆分后可以提取到多个基本特征,比如不同高度上的湿度、温度、风速、风向、位势等。对于空间特征数据:在不同高度之间各个因素的分布情况往往可以体现出大气的对流状态,而对流状态直接影响污染物的扩散或者聚集情况。因此,在本申请所述的实施例中,对不同高度上(地表和高空)的数据进行组合,首先将同一特征在相邻高度层上的值进行做差生成新的特征,以描述各个因素在垂直方向的变化。同时将站点周围的站点的数据作为新的特征加入到该站点的特征数据中,使得样本数据更加准确和丰富。对于时间特征数据:通过对能见度的变化规律分析,可知能见度在一年内具有明显的季节效应,在一天内也具有明显的周期性。因此,在本申请所述的实施例中,将预报时间对应的月份和一天中对应的时刻作为特征。由于能见度是随时间变化的序列,因此仅仅对某个时间点进行分析则无法体现出每个时刻之间的关联性,可通过以下方式实现关联性,将起报时间之前24小时的历史真实监测数据作为特征,同时将这24小时之内两个相邻时刻真实值的差值作为新的特征,来反映预测目标的变化趋势。将过去24,48,72,96小时的真实数据作为特征来反映预测目标在过去多天的变化规律。
具体地,所述第一损失函数满足以下条件:
其中,Loss1表示均方误差,N为样本数据的数量,yi为第i个样本的真实值,为第i个样本的预测值,j为常数,1≤i≤n。
在此,当预判结果为高能见度的情况时,使用均方误差损失函数,与二分类模型XGBoost进行融合用于建立能见度预测模型。
所述第二损失函数满足以下条件:
其中,Loss2表示带有样本权重的均方误差,N为样本数据的数量,yi为第i个样本的真实值,为第i个样本的预测值,j为常数,1≤i≤N。当能见度为低能见度的情况时,可使用更加关注低能见度的新的损失函数,当能见度越小损失权重项/>越大,从而使得模型更加倾向于去提高低能见度的精度。j的不同取值代表对低能见度情况的不同重视程度。
为了更好的兼顾对低能见度和高能见度的预测效果,在本申请所述实施例中,采用多模型结合的方法,先采用XGBoost二分类模型对未来48小时的能见度是否大于10km进行预判,根据预判结果,对于能见度大于10km的情况采用均方误差损失函数(第一损失函数)对XGBoost模型进行训练并预测;对于小于10km的情况采用新的损失函数(第二损失函数)对XGBoost模型进行训练并预测。
在本申请一实施例中,通过所述验证集数据调整所述第一损失函数及所述第二损失函数中的样本数据。在此,使用验证集迭代验证模型的预报效果的好坏,若效果不好,则调整上述各模型中的样本数据。使用测试集测试建立起的能见度预测模型的准确性。
如图2所示的能见度预测模型的建立框架图,对获取到的地表预报数据、高空预报数据以及监测数据进行特征提取,并对特征提取后的数据进行切分,切分为训练集、验证集及测试集,并对训练集进行重采样,使用重采样后的数据集并融合多模型(二分类模型、回归模型)建立能见度的预测模型,其中,回归模型可包括低能见度预报模型以及高能见度预报模型,其中,低能见度预报模型是通过第二损失函数对二分类模型训练得到,高能见度预报模型是通过第一损失函数对二分类模型训练得到。使用验证集对上述多模型进行调参,以建立更精确的能见度预测模型,并使用测试集对建立的能见度预测模型进行验证。模型预测的均方根误差(RMSE)如表5所示:
表5
上述表5中,各个模型预测结果的均方根误差进行了比对,多模型融合的预测结果整体预测误差比WRF-Chem预报结果降低了约15%,对于小于5000的情况,误差降低了约35%。通过本申请所述的能见度的预测方法,明显提高预测结果的精确度。
在本申请的实施例中,可以每天采集最新的数据对各个模型进行训练和更新,以保证模型的时效性,同时随着数据量的增加,提高模型的预测效果。并可定时读取气象局的数据库中的数据进行模型训练、模型评估或结果预测,将训练完成的模型或运行日志进行保存,将预测结果重新输入到本地数据库中,以为气象局提供预报数据。
此外,本申请实施例还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现前述的大气能见度预测的方法。
根据本申请再一个方面,还提供了一种大气能见度预测的设备,其中,所述设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行前述的方法的操作。
例如,计算机可读指令在被执行时使所述一个或多个处理器:
获取目标特征数据,其中,所述目标特征数据包括高空预报数据、地表预报数据及历史监测数据;
对所述目标特征数据进行特征提取,得到包括基本特征、空间特征及时间特征的样本数据;
将所述样本数据按照预设比例进行切分,得到训练集数据、验证集数据及测试集数据,以对所述训练集数据进行重采样,得到重采样训练集数据;
根据二分类模型、回归模型及所述重采样训练集数据建立能见度预测模型。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
Claims (5)
1.一种大气能见度预测的方法,其中,所述方法包括:
将获取到的目标区域中站点采集到的数据以及所述目标区域周围站点采集到的数据作为目标特征数据,其中,所述目标特征数据包括高空WRF-Chem预报数据、地表WRF-Chem预报数据及历史监测数据,其中,所述历史监测数据包括真实的气象数据和真实的污染物数据;
所述真实的污染物数据包括PM2.5浓度、PM10浓度、二氧化氮浓度、臭氧浓度、一氧化碳浓度、二氧化硫浓度;
对所述目标特征数据进行特征提取,得到包括基本特征、空间特征及时间特征的样本数据;
将所述样本数据按照预设比例进行切分,得到训练集数据、验证集数据及测试集数据,以对所述训练集数据进行重采样,得到重采样训练集数据;
根据二分类模型、回归模型及所述重采样训练集数据建立能见度预测模型;
其中,对所述目标特征数据进行特征提取,包括:
将所述高空WRF-Chem预报数据、地表WRF-Chem预报数据进行拆分,得到基本特征数据;
将同一特征在同一时刻时对应的高空WRF-Chem预报数据与地表WRF-Chem预报数据的值进行差运算,生成空间特征数据;
将起报时间之前预设单位时间内的历史监测数据,以及在所述预设单位时间内两个相邻时刻对应的历史监测数据的差值作为时间特征数据;
根据二分类模型、回归模型及所述重采样训练集数据建立能见度预测模型,包括:
根据二分类模型进行能见度预判,得到预判结果,根据所述预判结果确定调整所述回归模型的损失函数;
根据所述回归模型的损失函数及所述重采样训练集数据建立能见度预测模型;
若所述预判结果为预判预设时间段内的能见度大于或等于预设能见度阈值,则确定调整所述回归模型的损失函数为第一损失函数;
若所述预判结果为所述预判预设时间段内的能见度小于所述预设能见度阈值,则确定调整所述回归模型的损失函数为第二损失函数;
所述第一损失函数满足以下条件:
其中,Loss1表示均方误差,N为样本数据的数量,yi为第i个样本的真实值,为第i个样本的预测值,j为常数,1≤i≤n;
所述第二损失函数满足以下条件:
其中,Loss2表示带有样本权重的均方误差,N为样本数据的数量,yi为第i个样本的真实值,为第i个样本的预测值,j为常数,1≤i≤n。
2.根据权利要求1所述的方法,其中,对所述训练集数据进行重采样,得到重采样训练集数据,包括:
根据所述训练集数据中样本的能见度分布比例,对占比相对少的样本数据进行复制,得到重采样训练集数据。
3.根据权利要求1至2中任一项所述的方法,其中,所述方法包括:通过所述验证集数据调整所述第一损失函数及所述第二损失函数中的样本数据。
4.一种大气能见度预测的设备,其中,所述设备包括:一个或多个处理器;以及存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如权利要求1至3中任一项所述方法的操作。
5.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至3中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811405060.6A CN109543906B (zh) | 2018-11-23 | 2018-11-23 | 一种大气能见度预测的方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811405060.6A CN109543906B (zh) | 2018-11-23 | 2018-11-23 | 一种大气能见度预测的方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109543906A CN109543906A (zh) | 2019-03-29 |
CN109543906B true CN109543906B (zh) | 2024-04-16 |
Family
ID=65849370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811405060.6A Active CN109543906B (zh) | 2018-11-23 | 2018-11-23 | 一种大气能见度预测的方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109543906B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110333554B (zh) * | 2019-07-10 | 2021-10-22 | 南京恩瑞特实业有限公司 | Nriet暴雨智能相似分析方法 |
CN111028260A (zh) * | 2019-12-17 | 2020-04-17 | 上海眼控科技股份有限公司 | 图像预测方法、装置、计算机设备和存储介质 |
CN111242374A (zh) * | 2020-01-10 | 2020-06-05 | 上海眼控科技股份有限公司 | 雷电预测方法、装置、计算机设备和计算机可读存储介质 |
CN111398109A (zh) * | 2020-03-10 | 2020-07-10 | 上海眼控科技股份有限公司 | 大气能见度测量方法、传感器模组、系统和存储介质 |
CN111832230A (zh) * | 2020-07-20 | 2020-10-27 | 南京信大气象科学技术研究院有限公司 | 基于相关性分析和数据均衡的能见度分层预测模型 |
CN112180472A (zh) * | 2020-09-28 | 2021-01-05 | 南京北极光智能科技有限公司 | 一种基于深度学习的大气能见度集成预报方法 |
CN112560790A (zh) * | 2020-12-28 | 2021-03-26 | 广州数鹏通科技有限公司 | 一种基于摄像头视频图像智能识别能见度的方法 |
CN113378907B (zh) * | 2021-06-04 | 2024-01-09 | 南京大学 | 增强数据预处理过程的自动化软件可追踪性恢复方法 |
CN113742193A (zh) * | 2021-09-13 | 2021-12-03 | 上海晓途网络科技有限公司 | 一种数据分析方法、装置、电子设备及存储介质 |
CN114386654A (zh) * | 2021-11-29 | 2022-04-22 | 国家气象中心(中央气象台) | 一种多尺度数值天气预报模式融合的天气预报方法及装置 |
CN115204507B (zh) * | 2022-07-26 | 2023-05-23 | 北京中科三清环境技术有限公司 | 大气能见度的预测方法、装置、设备及存储介质 |
CN116306787B (zh) * | 2023-05-22 | 2023-08-22 | 江西省气象灾害应急预警中心(江西省突发事件预警信息发布中心) | 能见度预警模型构建方法、系统、计算机及可读存储介质 |
CN117390592B (zh) * | 2023-12-11 | 2024-03-22 | 江西省气象服务中心(江西省专业气象台、江西省气象宣传与科普中心) | 一种特色景观预报模型构建方法及系统 |
CN117609738B (zh) * | 2024-01-19 | 2024-08-23 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 集合多因素的大气能见度预测方法、计算机设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107273995A (zh) * | 2016-04-08 | 2017-10-20 | 株式会社日立制作所 | 空气质量预报方法 |
CN107942411A (zh) * | 2017-11-30 | 2018-04-20 | 南京理工大学 | 一种大气能见度预测方法 |
CN108205164A (zh) * | 2017-12-04 | 2018-06-26 | 国网江苏省电力有限公司电力科学研究院 | 一种基于WRF-Chem的大气能见度参数化预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2630193C1 (ru) * | 2016-04-18 | 2017-09-05 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для создания прогноза погоды |
-
2018
- 2018-11-23 CN CN201811405060.6A patent/CN109543906B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107273995A (zh) * | 2016-04-08 | 2017-10-20 | 株式会社日立制作所 | 空气质量预报方法 |
CN107942411A (zh) * | 2017-11-30 | 2018-04-20 | 南京理工大学 | 一种大气能见度预测方法 |
CN108205164A (zh) * | 2017-12-04 | 2018-06-26 | 国网江苏省电力有限公司电力科学研究院 | 一种基于WRF-Chem的大气能见度参数化预测方法 |
Non-Patent Citations (5)
Title |
---|
Efficient Prediction of Low-Visibility Events at Airports Using Machine-Learning Regression;L.Cornejo-Bueno等;《Boundary-Layer Meteorology》;全文 * |
刘嘉麒.《浙江沿海及海岛综合开发战略研究 地质气象卷 浙江沿海及海岛地区地质与气象环境研究》.浙江人民出版社,2012,第29页. * |
基于深度学习的能见度预测系统的研究;赵亚;《中国优秀硕士论文 工程科技Ⅰ辑》;全文 * |
天津港秋冬季低能见度数值释用预报研究;吴彬贵;张建春;李英华;王亚男;徐梅;陈靖;王雪莲;郭晓军;邱晓滨;;气象(07);全文 * |
运用支持向量机方法对数值模拟结果的初步释用;邓小花;魏立新;黄焕卿;张润宇;;海洋预报(02);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109543906A (zh) | 2019-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109543906B (zh) | 一种大气能见度预测的方法及设备 | |
CN110705115B (zh) | 一种基于深度置信网络的气象预报方法和系统 | |
US11206555B2 (en) | Method for implementing antenna azimuth correction based on user data | |
CN106651036A (zh) | 空气质量预报系统 | |
Hong et al. | Basis for recommending an update of wind velocity pressures in Canadian design codes | |
US10330655B2 (en) | Air quality forecasting based on dynamic blending | |
CN112308292A (zh) | 一种火灾风险等级分布图的绘制方法 | |
CN116205541B (zh) | 评估本地污染源对环境空气质量影响的方法及装置 | |
Ha et al. | Error Correction of Meteorological Data Obtained with Mini‐AWSs Based on Machine Learning | |
CN105868443B (zh) | 一种微地形微气象要素场的构建方法 | |
CN117371303A (zh) | 一种海浪下有效波高的预测方法 | |
CN115018022B (zh) | 网格化环境监测数据的质量控制方法、装置、设备及介质 | |
Agarwal et al. | Forecasting PM2. 5 concentrations using statistical modeling for Bengaluru and Delhi regions | |
CN113744888B (zh) | 区域流行病趋势预测预警方法及系统 | |
Dawkins et al. | Quantification of extremal dependence in spatial natural hazard footprints: independence of windstorm gust speeds and its impact on aggregate losses | |
CN112561171B (zh) | 一种滑坡的预测方法、装置、设备及存储介质 | |
CN115983329A (zh) | 空气质量及气象条件的预测方法、装置、设备及存储介质 | |
CN115391746A (zh) | 针对气象要素数据的插值方法、装置、电子设备及介质 | |
CN115239027A (zh) | 空气质量格点化集合预报的方法及装置 | |
Assis et al. | A model-based site selection approach associated with regional frequency analysis for modeling extreme rainfall depths in Minas Gerais state, Southeast Brazil | |
WO2020105151A1 (ja) | 設備保守点検支援システム及び点検順序決定方法 | |
Neydorf et al. | Aerostatic Aircraft Flight Environment Modeling and Investigation | |
CN117216507B (zh) | 一种基于地理分区的深度神经网络模型可迁移性度量方法 | |
CN116631530B (zh) | 污染物扩散风险识别方法、装置及设备 | |
CN111988813A (zh) | 移动通信网络中弱覆盖小区的确定方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |