[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN118312925B - 一种雷暴大风识别方法、系统、设备及介质 - Google Patents

一种雷暴大风识别方法、系统、设备及介质 Download PDF

Info

Publication number
CN118312925B
CN118312925B CN202410734176.3A CN202410734176A CN118312925B CN 118312925 B CN118312925 B CN 118312925B CN 202410734176 A CN202410734176 A CN 202410734176A CN 118312925 B CN118312925 B CN 118312925B
Authority
CN
China
Prior art keywords
feature
wind
thunderstorm
time sequence
wind speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410734176.3A
Other languages
English (en)
Other versions
CN118312925A (zh
Inventor
张小雯
盛杰
杨波
夏景明
陆冰鉴
郑永光
韩丰
罗玲
方翀
关良
曹艳察
王丽颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Meteorological Center Central Meteorological Station
Original Assignee
National Meteorological Center Central Meteorological Station
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Meteorological Center Central Meteorological Station filed Critical National Meteorological Center Central Meteorological Station
Priority to CN202410734176.3A priority Critical patent/CN118312925B/zh
Publication of CN118312925A publication Critical patent/CN118312925A/zh
Application granted granted Critical
Publication of CN118312925B publication Critical patent/CN118312925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • G06F18/256Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/02Instruments for indicating weather conditions by measuring two or more variables, e.g. humidity, pressure, temperature, cloud cover or wind speed
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2337Non-hierarchical techniques using fuzzy logic, i.e. fuzzy clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Atmospheric Sciences (AREA)
  • Environmental Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Fuzzy Systems (AREA)
  • Automation & Control Theory (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明提出一种雷暴大风识别方法、系统、设备及介质,属于气象智能识别领域。方法包括:构建雷暴大风识别模型;将风速时序输入站点时序特征编码器,得到风速时序编码特征;将格点资料数据输入多源格点资料编码器,得到格点资料编码特征;将风速时序编码特征和格点资料编码特征输入多模态特征融合模块进行特征融合后得到解码,得到有无雷暴大风的二分类结果;通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_LOSS损失函数;根据TS_ LOSS损失函数和BCE_LOSS损失函数,得到TG_ LOSS损失函数训练雷暴大风识别模型。本发明提出的方案能够精确地识别雷暴大风,其命中率更高,空报和漏报更少。

Description

一种雷暴大风识别方法、系统、设备及介质
技术领域
本发明属于气象智能识别领域,尤其涉及一种雷暴大风识别方法、系统、设备及介质。
背景技术
雷暴大风突发性强、破坏力大,给工农业生产甚至人民生命安全造成极大威胁,近年来强雷暴大风灾害事件引发广泛关注,因此实现精细化的雷暴大风识别具有极其重要的意义。现有雷暴大风识别技术主要依赖单一观测资料,如地面加密自动站风速数据或雷达数据,存在识别准确率低、虚警率高的问题。地面加密自动站、雷达、卫星等观测资料在雷暴大风识别领域起到一定的作用,但仅凭单一观测资料,雷暴大风识别效果有限,比如部分地区存在天气雷达观测盲区,雷暴大风难以捕获,需要加强多源资料的融合应用。
雷暴大风事件发生时,地面加密自动站的风速有明显的时序特性(Wang L.,andA.Kareem,2004:Modeling of non-stationary winds in gale fronts. 9th ASCESpecialty Conference on Probabilistic Mechanicsand Structural Reliability)。同时雷达观测中,单体中心高度、VIL含量(刁秀广.CINRAD/SA雷达风暴趋势产品在冰雹和大风预警中的应用[J].气象科技,2009,37(02):230-233+259-260.DOI:10.19517/j.1671-6345.2009.02.024)、弓状回波和中层径向辐合(俞小鼎,周小刚,王秀明.雷暴与强对流临近天气预报技术进展[J].气象学报,2012,70(03):311-337)等产品都有很好的指示意义。依据这些分析结果,(廖玉芳,潘志祥,郭庆.基于单多普勒天气雷达产品的强对流天气预报预警方法[J].气象科学,2006(05):564-571)基于常德新一代天气雷达产品分析雷暴大风天气,确定了强度回波形状、垂直积分液态水含量VIL、速度回波特征等特征,并通过特征集的阈值评估,实现雷暴大风预警。(李国翠,刘黎平,张秉祥,于楠,常山英.基于雷达三维组网数据的对流性地面大风自动识别[J].气象学报,2013,71(06):1160-1171;李国翠,刘黎平,连志鸾,周淼,李哲.利用雷达回波三维拼图资料识别雷暴大风统计研究[J].气象学报,2014,72(01):168-181)基于雷达资料,确定了6个识别指标及其对应的权重系数,采用模糊逻辑算法实现了块状回波、带状回波和片状回波大风过程识别,实验表明,识别出的大风范围和实况风场基本吻合,但由于VIL偏低和回波偏弱,使得片状类型的雷暴大风命中率较低。
(杨璐,韩丰,陈明轩,孟金平.基于支持向量机的雷暴大风识别方法[J].应用气象学报,2018,29(06):680-689)基于雷达资料的9个因子,采用支持向量机算法建立雷暴大风识别模型,实验表明,仅靠雷达特征因子,易出现误判,仍需结合其他天气实况干预判断。
(Chen,G.,&Lombardo,F.T.(2020).An automated classification method ofthunderstorm andnon-thunderstorm wind data based on a convolutional neuralnetwork.Journal of Wind Engineering and Industrial Aerodynamics,207,104407)仅用风速时序数据,通过一维卷积神经网络(1D-CNN)进行雷暴大风自动分类,该模型通过地面加密自动站观测资料的时序特征进行识别,能够降低因其他资料稀疏或缺失引起的误分类问题。但是仅凭风速时序特性难以区分冷空气大风、台风大风等非强对流大风。因此,一部分学者加入了温度、降水、闪电(Riera J.D.,and L. F.Nanni,1989:Pilot studyofextreme wind velocities in a mixed climate considering windorientation.Journal of Wind Engineering&Industrial Aerodynamics,32(1-2),11-20,;Choi E.,1999:Extreme wind characteristics over Singapore–an area in theequatorial belt. Journal of WindEngineering&Industrial Aerodynamics,83(1),61-69、人工观测的雷暴时间(Lombardo F.T.,J.A.Main,and E.Simiu,2009:Automatedextraction and classification of thunderstorm andnon-thunderstorm wind datafor extreme-value analysis.Journal of Wind Engineering&IndustrialAerodynamics,97(3-4),120-131)、卫星等数据。如(周康辉,郑永光,王婷波,蓝渝,林建.基于模糊逻辑的雷暴大风和非雷暴大风区分方法[J].气象,2017,43(07):781-791)基于自动气象观测站、雷达、卫星、闪电等多源资料,利用模糊逻辑建立了全国范围雷暴大风识别算法。
进行多源资料融合时,通常是多源资料叠加的数据级融合,不仅会产生数据冗余问题,还抑制了模态间的相互作用。模态深度学习融合模型已经在视觉问答、图文摘要等多个问题上表现出较好的特征对齐、特征融合的性能,在各自的任务中取得了较好的效果。多模态数据融合主要有三种融合方式:早期融合、后期融合和深度融合。早期融合是在数据处理阶段,将多个独立的数据融合成一个多维特征向量。这种融合方式往往无法充分利用多个模态数据间的互补性,且包含大量的冗余信息。后期融合则是将不同模态数据分别分类的输出(决策)进行融合,但这种融合方式难以提取不同模态的相互关系。深度融合是先将不同的模态数据先转化为高维特征,再于深度网络模型的中间层进行融合,这种深度特征融合方式能够充分利用模态内或模态间的相互作用,更好地捕捉整体信息,消除模态之间的偏差,从而获得更好的性能。
发明内容
为解决上述技术问题,本发明提出一种雷暴大风识别方法、系统、设备及介质的技术方案,以解决上述技术问题。
本发明第一方面公开了一种雷暴大风识别方法,所述方法包括:
步骤S1、根据地面加密自动站的分钟观测数据,标定站点的雷暴大风标签;根据雷达速度场上是否具有中层辐合和低层辐散的下击暴流特征,形成1km*1km的网格化雷暴大风标签;
步骤S2、采集地面加密自动站站点历史1h的风速时序;采集格点资料数据;所述格点资料数据包括:地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据;
步骤S3、构建雷暴大风识别模型;所述雷暴大风识别模型包括:站点时序特征编码器、多源格点资料编码器和多模态特征融合模块;将所述风速时序输入所述站点时序特征编码器,得到风速时序编码特征;将所述格点资料数据输入多源格点资料编码器,得到格点资料编码特征;将所述风速时序编码特征和格点资料编码特征输入所述多模态特征融合模块进行特征融合,得到多模态融合特征;多模态特征融合模块将所述多模态融合特征解码,得到有无雷暴大风的二分类结果;
步骤S4、通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_ LOSS损失函数;根据所述TS_LOSS损失函数和BCE_LOSS损失函数,得到TG_LOSS损失函数;应用所述TG_LOSS损失函数训练雷暴大风识别模型。
邻域卷积在所述步骤S3中,将所述风速时序输入所述站点时序特征编码器,得到风速时序编码特征的方法包括:
基于风速时序构建对流特征字典;采用欧氏距离计算方法,分别计算风速时序与对流特征字典中的对流特征的最小距离;应用多个站点计算出的对流特征的最小距离,构建表示矩阵;
计算所述表示矩阵每行的最小值,并对所述每行的最小值进行归一化,得到具有对流大风形状的站点特征值;再根据多个站点的经纬度信息,将所述站点特征值映射到1km分辨率的格点上,没有站点的格点的值设为1;应用地面10分钟观测的站点风速最大值与1km分辨率的格点上的站点特征值对应的风速进行比较,即对1km分辨率的格点上的站点特征值进行mask(阈值掩码判断),滤除风速小于所述风速最大值的站点特征值;再采用4层R2U-Net编码器对mask后的站点特征值进行特征编码,得到风速时序编码特征。
邻域卷积在所述步骤S3中,所述基于风速时序构建对流特征字典构建对流特征字典的方法包括:
应用卡尔曼滤波算法对风速时序进行去噪,去除风速时序中的小于第一预设值的波动;在去噪后的风速时序中,利用10分钟、20分钟和30分钟的时间窗,按照5分钟的间隔框选出雷暴大风发生过程的时序;再分别对10分钟、20分钟和30分钟三种长度的雷暴大风发生过程的时序进行FCM(fuzzy c-means algorithm模糊C均值聚类算法)聚类,选择每类中的10%共同组建对流特征字典。
邻域卷积在所述步骤S3中,所述将所述格点资料数据输入多源格点资料编码器,得到格点资料编码特征的方法包括:
采用三层膨胀因子分别对地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据中的每个参数的格点数据进行膨胀卷积计算,所述三层膨胀因子的膨胀卷积计算具有连通性;将每一层膨胀卷积计算的结果进行拼接,得到拼接特征;通过ConvLSTM(卷积长短期记忆神经网络)对所述拼接特征进行特征提取,得到格点资料膨胀卷积特征;
采用4层R2U-Net编码器对格点资料膨胀卷积特征进行特征编码,得到格点资料编码特征。
邻域卷积在所述步骤S3中,所述将所述风速时序编码特征和格点资料编码特征输入所述多模态特征融合模块进行特征融合,得到多模态融合特征的方法包括:
将所述风速时序编码特征和格点资料编码特征分别依次通过由双头自注意力和MLP (多层感知器网络)构建的特征增强器,提取风速时序有效通道特征和格点资料有效通道特征;利用双头交叉注意力对所述风速时序有效通道特征和格点资料有效通道特征进行特征融合,得到初步融合特征;其中风速时序编码特征提供双头交叉注意力的Q值,格点资料编码特征提供双头交叉注意力的K和V值;
将所述初步融合特征再依次经双头自注意力和MLP进行强化,得到多模态融合特征;
所述多模态特征融合模块将所述多模态融合特征解码,得到有无雷暴大风的二分类结果的方法包括:
通过4层R2U-Net解码器对所述多模态融合特征进行解码,得到解码特征;通过1×1的卷积对所述解码特征进行通道合并,并经Sigmoid函数,得到有无雷暴大风的二分类结果。
邻域卷积在所述步骤S4中,所述通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_LOSS损失函数的方法包括:
其中,为第i个样本的命中;为第i个样本的空报;为第i个样本的漏报;N是样本总个数;
其中,ab是每个样本的格点位置;为发生雷暴大风的格点,为未发生雷暴大风的格点;a,b格点位置处的标签;a,b格点位置处的模型输出值;是将预报结果通过5×5的卷积计算到5km邻域范围预报;
其中,为邻域卷积;表示卷积核设置为5×5。
根据本发明第一方面的方法,在所述步骤S4中,所述根据所述TS_LOSS损失函数和BCE_LOSS损失函数,得到TG_LOSS损失函数的方法包括:
将所述TS_LOSS损失函数和BCE_LOSS损失函数加权求和,得到TG_LOSS损失函数;具体公式为:
其中,为权重,其通过在0-1之间隔0.1的方式依次取值进行实验,最终确定,雷暴大风识别模型效果最佳。
本发明第二方面公开了一种雷暴大风识别系统,所述系统包括:
第一处理模块,被配置为,根据地面加密自动站的分钟观测数据,标定站点的雷暴大风标签;根据雷达速度场上是否具有中层辐合和低层辐散的下击暴流特征,形成1km*1km的网格化雷暴大风标签;
第二处理模块,被配置为,采集地面加密自动站站点历史1h的风速时序;采集格点资料数据;所述格点资料数据包括:地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据;
第三处理模块,被配置为,构建雷暴大风识别模型;所述雷暴大风识别模型包括:站点时序特征编码器、多源格点资料编码器和多模态特征融合模块;将所述风速时序输入所述站点时序特征编码器,得到风速时序编码特征;将所述格点资料数据输入多源格点资料编码器,得到格点资料编码特征;将所述风速时序编码特征和格点资料编码特征输入所述多模态特征融合模块进行特征融合,得到多模态融合特征;多模态特征融合模块将所述多模态融合特征解码,得到有无雷暴大风的二分类结果;
第四处理模块,被配置为,通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_LOSS损失函数;根据所述TS_LOSS损失函数和BCE_LOSS损失函数,得到TG_ LOSS损失函数;应用所述TG_LOSS损失函数训练雷暴大风识别模型。
本发明第三方面公开了一种电子设备。电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时,实现本公开第一方面中任一项的一种雷暴大风识别方法中的步骤。
本发明第四方面公开了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现本公开第一方面中任一项的一种雷暴大风识别方法中的步骤。
综上,本发明提出的方案能够精确地识别雷暴大风,其命中率更高,空报和漏报更少,识别效果更好。同时,多源资料融合格点识别可以填充没有地面加密自动站的区域雷暴大风信息。这无疑将为雷暴大风早期预警提供依据,模型显著提高了雷暴大风识别的时间精度和准确率,进一步完善了强对流监测业务系统。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例的一种雷暴大风识别方法的流程图;
图2为根据本发明实施例的一种雷暴大风识别系统的结构图;
图3为根据本发明实施例的一种电子设备的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明第一方面公开了一种雷暴大风识别方法。图1为根据本发明实施例的一种雷暴大风识别方法的流程图,如图1所示,所述方法包括:
步骤S1、根据地面加密自动站的分钟观测数据,标定站点的雷暴大风标签;根据雷达速度场上是否具有中层辐合和低层辐散的下击暴流特征,形成1km*1km的网格化雷暴大风标签;
步骤S2、采集地面加密自动站站点历史1h的风速时序;采集格点资料数据;所述格点资料数据包括:地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据;
步骤S3、构建雷暴大风识别模型;所述雷暴大风识别模型包括:站点时序特征编码器、多源格点资料编码器和多模态特征融合模块;将所述风速时序输入所述站点时序特征编码器,得到风速时序编码特征;将所述格点资料数据输入多源格点资料编码器,得到格点资料编码特征;将所述风速时序编码特征和格点资料编码特征输入所述多模态特征融合模块进行特征融合,得到多模态融合特征;多模态特征融合模块将所述多模态融合特征解码,得到有无雷暴大风的二分类结果;
步骤S4、通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_ LOSS损失函数;根据所述TS_LOSS损失函数和BCE_LOSS损失函数,得到TG_LOSS损失函数;应用所述TG_LOSS损失函数训练雷暴大风识别模型。
在步骤S1,根据地面加密自动站的分钟观测数据,标定站点的雷暴大风标签;根据雷达速度场上是否具有中层辐合和低层辐散的下击暴流特征,形成1km*1km的网格化雷暴大风标签。
具体地,标定站点的雷暴大风标签,
根据地面加密自动站的分钟观测数据,确定瞬时风速大于17.2m/s的观测样本,判断该样本发生前半小时内,周边5公里范围内是否有闪电、大于35dbz的对流回波或者卫星TBB亮温小于0,满足上述条件时,将该样本作为雷暴大风站点标签。
1km分辨率网格雷暴大风标签标定,
由于站点观测的空间离散性,判断距离标签站点最近的雷达回波(>50dBZ)在雷达速度场上是否具有中层辐合、低层辐散的下击暴流特征,如果有,则认为该单体具有雷暴大风属性(只是没有观测到),将该单体记录为1;如果没有下击暴流特征,则在标签5公里范围内查找下一个距离次近的单体,通过速度场性质来判断标签属性,以此类推,形成1km*1km的网格化雷暴大风标签,该大风标签不仅保留了站点信息,也包含了造成雷暴大风的单体信息,样本数远大于站点观测,丰富了正样本数量,有利于对雷暴大风这类小样本天气进行模型训练。
在步骤S2,采集地面加密自动站站点历史1h的风速时序;采集格点资料数据;所述格点资料数据包括:地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据。
具体地,模型的输入主要包含两大类,一类是站点资料,包含地面加密自动站站点历史1h风速时序;另一类是格点资料,包括:雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据,如表1。
表1
地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据分别通过反距离权重插值算法将空间分辨率统一成1km分辨的格点场。分别计算整10分钟内风速最大值,风向最大值,温度最小值、降水累计值、海平面气压最大值、相对湿度最大值、闪电累计值,将地面加密自动站格点和闪电格点的时间分辨率处理为10分钟。再采用时间最邻近算法将雷达、卫星资料的时间分辨率处理为10分钟。
在步骤S3,构建雷暴大风识别模型;所述雷暴大风识别模型包括:站点时序特征编码器、多源格点资料编码器和多模态特征融合模块;将所述风速时序输入所述站点时序特征编码器,得到风速时序编码特征;将所述格点资料数据输入多源格点资料编码器,得到格点资料编码特征;将所述风速时序编码特征和格点资料编码特征输入所述多模态特征融合模块进行特征融合,得到多模态融合特征;多模态特征融合模块将所述多模态融合特征解码,得到有无雷暴大风的二分类结果。
在一些实施例中,在所述步骤S3中,将所述风速时序输入所述站点时序特征编码器,得到风速时序编码特征的方法包括:
基于风速时序构建对流特征字典;采用欧氏距离计算方法,分别计算风速时序与对流特征字典中的对流特征的最小距离;应用多个站点计算出的对流特征的最小距离,构建表示矩阵;
其中,代表风速时序;表示各对流特征;r表示对流特征个数,m表示站点个数;
计算所述表示矩阵每行的最小值,并对所述每行的最小值进行归一化,得到具有对流大风形状的站点特征值;再根据多个站点的经纬度信息,将所述站点特征值映射到1km分辨率的格点上,没有站点的格点的值设为1;以上步骤可以得到从站点风速时序变化筛选出对流大风形状特征的样本,特征不一定能够达到雷暴大风的标准17.2m/s;应用地面10分钟观测的站点风速最大值与1km分辨率的格点上的站点特征值对应的风速进行比较,即对1km分辨率的格点上的站点特征值进行mask,滤除风速小于所述风速最大值的站点特征值;这样就得到了具有对流特征且风速大于8级大风的站点特征值,也就是雷暴大风的的站点特征值;再采用4层R2U-Net编码器对mask后的站点特征值进行特征编码,得到风速时序编码特征。站点风速最大值为雷暴大风的标准17.2m/s。
所述基于风速时序构建对流特征字典构建对流特征字典的方法包括:
应用卡尔曼滤波算法对风速时序进行去噪,去除风速时序中的小于第一预设值的波动;在去噪后的风速时序中,利用10分钟、20分钟和30分钟的时间窗,按照5分钟的间隔框选出雷暴大风发生过程的时序;再分别对10分钟、20分钟和30分钟三种长度的雷暴大风发生过程的时序进行FCM聚类,选择每类中的10%共同组建对流特征字典,这是为了去除相近的冗余特征,减少计算量。
所述将所述格点资料数据输入多源格点资料编码器,得到格点资料编码特征的方法包括:
采用三层膨胀因子分别对地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据中的每个参数的格点数据进行膨胀卷积计算,所述三层膨胀因子的膨胀卷积计算具有连通性;将每一层膨胀卷积计算的结果进行拼接,得到拼接特征;通过ConvLSTM对所述拼接特征进行特征提取,得到格点资料膨胀卷积特征;
采用4层R2U-Net编码器对格点资料膨胀卷积特征进行特征编码,得到格点资料编码特征,保证格点资料编码特征的特征空间与风速时序编码特征的特征空间一致。
所述将所述风速时序编码特征和格点资料编码特征输入所述多模态特征融合模块进行特征融合,得到多模态融合特征的方法包括:
将所述风速时序编码特征和格点资料编码特征分别依次通过由双头自注意力和MLP构建的特征增强器,提取风速时序有效通道特征和格点资料有效通道特征;利用双头交叉注意力对所述风速时序有效通道特征和格点资料有效通道特征进行特征融合,得到初步融合特征;其中风速时序编码特征提供双头交叉注意力的Q值,格点资料编码特征提供双头交叉注意力的K和V值;以此方式将风速时序编码特征融合到格点资料编码特征中;
将所述初步融合特征再依次经双头自注意力和MLP进行强化,得到多模态融合特征;
所述多模态特征融合模块将所述多模态融合特征解码,得到有无雷暴大风的二分类结果的方法包括:
通过4层R2U-Net解码器对所述多模态融合特征进行解码,得到解码特征;通过1×1的卷积对所述解码特征进行通道合并,并经Sigmoid函数,得到有无雷暴大风的二分类结果。
在步骤S4,通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_ LOSS损失函数;根据所述TS_LOSS损失函数和BCE_LOSS损失函数,得到TG_LOSS损失函数;应用所述TG_LOSS损失函数训练雷暴大风识别模型。
在一些实施例中,在所述步骤S4中,所述通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_LOSS损失函数的方法包括:
其中,为第i个样本的命中;为第i个样本的空报;为第i个样本的漏报;N是样本总个数;
其中,ab是每个样本的格点位置;为发生雷暴大风的格点,为未发生雷暴大风的格点;a,b格点位置处的标签;a,b格点位置处的模型输出值;是将预报结果通过5×5的卷积计算到5km邻域范围预报;
其中,表示卷积核设置为5×5。
所述根据所述TS_LOSS损失函数和BCE_LOSS损失函数,得到TG_LOSS损失函数的方法包括:
将所述TS_LOSS损失函数和BCE_LOSS损失函数加权求和,得到TG_LOSS损失函数;具体公式为:
其中,为权重,其通过在0-1之间隔0.1的方式依次取值进行实验,最终确定,雷暴大风识别模型效果最佳。
具体地,模型输入为:
其中为第i个样本的j个站点的过去60分钟逐分钟的风速时序;为第i个样本的7个地面格点要素;为第i个样本的6个雷达要素;为第i个样本的4个卫星通道数据;DEM为地形数据。
将所述TS_LOSS损失函数和BCE_LOSS损失函数加权求和,得到TG_LOSS损失函数;具体公式为:
其中,为权重,其通过在0-1之间隔0.1的方式依次取值进行实验,最终确定,雷暴大风识别模型效果最佳。
BCE-LOSS公式如下,
是第i个样本,N是样本总个数;是第i个样本的模型输出(Sigmoid函数前一步的结果);i样本的标签。
TS评分是基于二分类表,针对预报和观测发生和未发生有四种可能的情况计算模式与实况匹配的程度。传统点对点检验是对比预报格点和观测格点重合程度,给出总体评分。TS评分综合考虑了命中(TP)、空报(FP)和漏报(FN)的情况,计算公式如下:
考虑雷暴大风空间尺度小,因此设计了邻域法TS,也就是以这个点周边5×5为范围为研究对象,在这个区域中计算TS评分,从而避免了因为轻微位置偏差导致TS评分“双惩罚”的问题。在此基础上,改进了第i个样本的的计算方式,通过5×5的卷积计算的方式得到。
通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_LOSS损失函数的方法包括:
其中,为第i个样本的命中;为第i个样本的空报;为第i个样本的漏报;N是样本总个数;
其中,ab是每个样本的格点位置;为发生雷暴大风的格点,为未发生雷暴大风的格点;a,b格点位置处的标签;a,b格点位置处的模型输出值;是将预报结果通过5×5的卷积计算到5km邻域范围预报;
其中,表示卷积核设置为5×5。
实施个例
为量化本发明的识别能力,更好的展示实验结果,本实施例采用临界成功指数(CSI)、命中率(POD)、误警率(FAR)、漏报率(MAR)和Heidke skill score(HSS)来评估本研究模型的识别效果(Xiao H,et al,2023)。其中,临界成功指数用于评估模型对于雷暴大风的识别效果,HSS用于评估模型对雷暴大风与非雷暴大风的整体判别能力。以下是评估指标的计算公式:
二分类矩阵如表2所示,
表2
本实施例将雷暴大风标签设为1,非雷暴大风标签设为0。上表及上式中:TN为非雷暴大风命中个数,代表实际为0,识别为0;TP为雷暴大风命中个数,代表实际为1,识别为1;FN为雷暴大风空报个数,代表实际为0,识别为1;FP为雷暴大风漏报个数,代表实际为1,识别为0。雷暴大风识别模型效果越好,CSI、POD、HSS越高,FAR、MAR越低。
本实施例采用2021-2022年4-7月的数据进行实验,以2022年7月15日-2022年7月31日数据作为测试集,其余数据作为训练集。
为了验证多源观测资料在雷暴大风识别上的有效性,表3对比了单一观测资料与多源观测资料在雷暴大风识别上的效果。
表3
从表3中四种评估指标来看,可以得到以下结论:
(1)采用单一地面观测资料识别雷暴大风,POD不高,FAR较高。与其他多源资料的组合结果来看,地面观测资料在雷暴大风命中判断上起到主要作用,而雷达、卫星等资料主要作用降低雷暴大风识别虚警率,其次也能提升部分命中率。
(2)融入多源观测资料后,模型识别性能有了明显改善。其中,CSI指标提升了17.37%,POD提升了5.97%,FAR降低了70.01%。可见,采用多源观测资料有效提升雷暴大风识别性能。
为了验证TG_Net模型在雷暴大风识别上有效性,与shapelet(Arul M, KareemA.2021)、U-net(Ronneberger,etal,2015)及R2Unet(Alom M Z,et al,2018)等模型识别的雷暴大风进行对比分析,由于深度学习模型识别的结果是格点,这里将格点识别结果以最邻近算法插值到站点进行检验评估。表4给出了三种模型在CSI、POD、MAR、FAR和HSS指标上的雷暴大风站点识别效果。
表4
从表4各项指标对比来看,可以得到以下结论:
(1)shapelet模型较高的POD,表征了风速时序形状对于识别雷暴大风的正向作用,但97.43%空报率说明模型存在一定缺陷,当风速出现突变,但是风力没有达到8级时,模型会出现空报。加入了循环残差结构的R2Unet识别效果整体优于U-net,POD、CSI、HSS分别提升了6.56%、1.25%、2.56%,MAR、FAR分别降低了5%、14.29%,验证了R2Unet在进行小样本事件空间特征融合时的有效性,该结论与医学图像分割的结论一致(Alom M Z,et al,2018)。
(2)相比其它几个模型,TG_Net采用多源观测资料,并基于深度神经网络挖掘潜在特征,通过模型有效融合多源观测资料的空间特征和风速时序的形状特征,弥补了shapelet模型的缺陷,融合了更丰富的雷暴大风空间多维度判识信息,CSI提升了27.86%~67.05%,FAR下降了37.42%~77.84%,有效提升了雷暴大风识别的准确率、减少了空报率。可见,通过多源观测资料空间特征与风速时序特征深度融合的方式,能够更加有效的捕捉雷暴大风特征。在多项指标上,TG-Net都表现出正向的结果。
从典型个例可以看到,TG-Net模型能够有选择地融合多源数据的特征,有效提升提高特征融合的效果,相对于传统深度学习模型,TG-Net准确性更高,空报和漏报更少,具有较好的识别效果。
综上,本发明为基于多模态融合的雷暴大风智能识别技术,本方法使用多模态数据作为输入,可以实现分钟级的雷暴大风分类,具体的,在获取雷暴大风数据时,我们使用了创新的判定方法,更好的区分了雷暴大风数据,利用时序对流特征编码器,更好的获取雷暴大风事件的风速时序特性,通过多源格点特征编码器,我们可以提取卫星、雷达等多源资料的空间特性。站点-格点特征融合编码器实现了两种模态特征的对齐与增强。在模型训练过程中,我们使用TG-LOSS,有助于模型达到更好的训练效果。
本发明第二方面公开了一种雷暴大风识别系统。图2为根据本发明实施例的一种雷暴大风识别系统的结构图;如图2所示,所述系统100包括:
第一处理模块101,被配置为,根据地面加密自动站的分钟观测数据,标定站点的雷暴大风标签;根据雷达速度场上是否具有中层辐合和低层辐散的下击暴流特征,形成1km*1km的网格化雷暴大风标签;
第二处理模块102,被配置为,采集地面加密自动站站点历史1h的风速时序;采集格点资料数据;所述格点资料数据包括:地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据;
第三处理模块103,被配置为,构建雷暴大风识别模型;所述雷暴大风识别模型包括:站点时序特征编码器、多源格点资料编码器和多模态特征融合模块;将所述风速时序输入所述站点时序特征编码器,得到风速时序编码特征;将所述格点资料数据输入多源格点资料编码器,得到格点资料编码特征;将所述风速时序编码特征和格点资料编码特征输入所述多模态特征融合模块进行特征融合,得到多模态融合特征;多模态特征融合模块将所述多模态融合特征解码,得到有无雷暴大风的二分类结果;
第四处理模块104,被配置为,通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_LOSS损失函数;根据所述TS_LOSS损失函数和BCE_LOSS损失函数,得到TG_LOSS损失函数;应用所述TG_LOSS损失函数训练雷暴大风识别模型。
根据本发明第二方面的系统,所述第一处理模块101具体被配置为,标定站点的雷暴大风标签,根据地面加密自动站的分钟观测数据,确定瞬时风速大于17.2m/s的观测样本,判断该样本发生前半小时内,周边5公里范围内是否有闪电、大于35dbz的对流回波或者卫星TBB亮温小于0,满足上述条件时,将该样本作为雷暴大风站点标签。
1km分辨率网格雷暴大风标签标定,由于站点观测的空间离散性,判断距离标签站点最近的雷达回波(>50dBZ)在雷达速度场上是否具有中层辐合、低层辐散的下击暴流特征,如果有,则认为该单体具有雷暴大风属性(只是没有观测到),将该单体记录为1;如果没有下击暴流特征,则在标签5公里范围内查找下一个距离次近的单体,通过速度场性质来判断标签属性,以此类推,形成1km*1km的网格化雷暴大风标签,该大风标签不仅保留了站点信息,也包含了造成雷暴大风的单体信息,样本数远大于站点观测,丰富了正样本数量,有利于对雷暴大风这类小样本天气进行模型训练。
根据本发明第二方面的系统,所述第二处理模块102具体被配置为,模型的输入主要包含两大类,一类是站点资料,包含地面加密自动站站点历史1h风速时序;另一类是格点资料,包括:雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据,如表1。
地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据分别通过反距离权重插值算法将空间分辨率统一成1km分辨的格点场。分别计算整10分钟内风速最大值,风向最大值,温度最小值、降水累计值、海平面气压最大值、相对湿度最大值、闪电累计值,将地面加密自动站格点和闪电格点的时间分辨率处理为10分钟。再采用时间最邻近算法将雷达、卫星资料的时间分辨率处理为10分钟。
根据本发明第二方面的系统,所述第三处理模块103具体被配置为,所述将所述风速时序输入所述站点时序特征编码器,得到风速时序编码特征包括:
基于风速时序构建对流特征字典;采用欧氏距离计算方法,分别计算风速时序与对流特征字典中的对流特征的最小距离;应用多个站点计算出的对流特征的最小距离,构建表示矩阵;
其中,代表风速时序;表示各对流特征;r表示对流特征个数,m表示站点个数;
计算所述表示矩阵每行的最小值,并对所述每行的最小值进行归一化,得到具有对流大风形状的站点特征值;再根据多个站点的经纬度信息,将所述站点特征值映射到1km分辨率的格点上,没有站点的格点的值设为1;以上步骤可以得到从站点风速时序变化筛选出对流大风形状特征的样本,但具有对流大风特征不一定能够达到雷暴大风的标准17.2m/s;应用地面10分钟观测的站点风速最大值与1km分辨率的格点上的站点特征值对应的风速进行比较,即对1km分辨率的格点上的站点特征值进行mask,滤除风速小所述风速最大值的站点特征值;这样就得到了具有对流特征且风速大于8级大风的站点特征值,也就是雷暴大风的的站点特征值;再采用4层R2U-Net编码器对mask后的站点特征值进行特征编码,得到风速时序编码特征。站点风速最大值为雷暴大风的标准17.2m/s。
所述基于风速时序构建对流特征字典构建对流特征字典包括:
应用卡尔曼滤波算法对风速时序进行去噪,去除风速时序中的小于第一预设值的波动;在去噪后的风速时序中,利用10分钟、20分钟和30分钟的时间窗,按照5分钟的间隔框选出雷暴大风发生过程的时序;再分别对10分钟、20分钟和30分钟三种长度的雷暴大风发生过程的时序进行FCM聚类,选择每类中的10%共同组建对流特征字典,这是为了去除相近的冗余特征,减少计算量。
所述将所述格点资料数据输入多源格点资料编码器,得到格点资料编码特征包括:
采用三层膨胀因子分别对地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据中的每个参数的格点数据进行膨胀卷积计算,所述三层膨胀因子的膨胀卷积计算具有连通性;将每一层膨胀卷积计算的结果进行拼接,得到拼接特征;通过ConvLSTM对所述拼接特征进行特征提取,得到格点资料膨胀卷积特征;
采用4层R2U-Net编码器对格点资料膨胀卷积特征进行特征编码,得到格点资料编码特征,保证格点资料编码特征的特征空间与风速时序编码特征的特征空间一致。
所述将所述风速时序编码特征和格点资料编码特征输入所述多模态特征融合模块进行特征融合,得到多模态融合特征包括:
将所述风速时序编码特征和格点资料编码特征分别依次通过由双头自注意力和MLP构建的特征增强器,提取风速时序有效通道特征和格点资料有效通道特征;利用双头交叉注意力对所述风速时序有效通道特征和格点资料有效通道特征进行特征融合,得到初步融合特征;其中风速时序编码特征提供双头交叉注意力的Q值,格点资料编码特征提供双头交叉注意力的K和V值;以此方式将风速时序编码特征融合到格点资料编码特征中;
将所述初步融合特征再依次经双头自注意力和MLP进行强化,得到多模态融合特征;
所述多模态特征融合模块将所述多模态融合特征解码,得到有无雷暴大风的二分类结果的方法包括:
通过4层R2U-Net解码器对所述多模态融合特征进行解码,得到解码特征;通过1×1的卷积对所述解码特征进行通道合并,并经Sigmoid函数,得到有无雷暴大风的二分类结果。
根据本发明第二方面的系统,所述第四处理模块104具体被配置为,所述通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_LOSS损失函数的方法包括:
其中,为第i个样本的命中;为第i个样本的空报;为第i个样本的漏报;N是样本总个数;
其中,ab是每个样本的格点位置;为发生雷暴大风的格点,为未发生雷暴大风的格点;a,b格点位置处的标签;a,b格点位置处的模型输出值;是将预报结果通过5×5的卷积计算到5km邻域范围预报;
其中,表示卷积核设置为5×5。
所述根据所述TS_LOSS损失函数和BCE_LOSS损失函数,得到TG_LOSS损失函数的方法包括:
将所述TS_LOSS损失函数和BCE_LOSS损失函数加权求和,得到TG_LOSS损失函数;具体公式为:
其中,为权重,其通过在0-1之间隔0.1的方式依次取值进行实验,最终确定,雷暴大风识别模型效果最佳。
具体地,模型输入为:
其中为i个样本的j个站点的过去60分钟逐分钟的风速时序;为第i个样本的7个地面格点要素;为第i个样本的6个雷达要素;为第i个样本的4个卫星通道数据;DEM为地形数据。
将所述TS_LOSS损失函数和BCE_LOSS损失函数加权求和,得到TG_LOSS损失函数;具体公式为:
其中,为权重,其通过在0-1之间隔0.1的方式依次取值进行实验,最终确定,雷暴大风识别模型效果最佳。
BCE-LOSS公式如下,
是第i个样本,N是样本总个数;是第i个样本的模型输出(Sigmoid函数前一步的结果);i样本的标签。
TS评分是基于二分类表,针对预报和观测发生和未发生有四种可能的情况计算模式与实况匹配的程度。传统点对点检验是对比预报格点和观测格点重合程度,给出总体评分。TS评分综合考虑了命中(TP)、空报(FP)和漏报(FN)的情况,计算公式如下:
考虑雷暴大风空间尺度小,因此设计了邻域法TS,也就是以这个点周边5×5为范围为研究对象,在这个区域中计算TS评分,从而避免了因为位子轻微偏差导致TS评分“双惩罚”的问题。在此基础上,改进了第i个样本的TP i FP i 的计算方式,通过5×5的卷积计算的方式得到。
通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_LOSS损失函数的方法包括:
其中,为第i个样本的命中;为第i个样本的空报;为第i个样本的漏报;N是样本总个数;
其中,ab是每个样本的格点位置;为发生雷暴大风的格点,为未发生雷暴大风的格点;a,b格点位置处的标签;a,b格点位置处的模型输出值;是将预报结果通过5×5的卷积计算到5km邻域范围预报;
其中,表示卷积核设置为5×5。
本发明第三方面公开了一种电子设备。电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时,实现本发明公开第一方面中任一项的一种雷暴大风识别方法中的步骤。
图3为根据本发明实施例的一种电子设备的结构图,如图3所示,电子设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、近场通信(NFC)或其他技术实现。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本公开的技术方案相关的部分的结构图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本发明第四方面公开了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现本发明公开第一方面中任一项的一种雷暴大风识别方法中的步骤中的步骤。
请注意,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种雷暴大风识别方法,其特征在于,所述方法包括:
步骤S1、根据地面加密自动站的分钟观测数据,标定站点的雷暴大风标签;根据雷达速度场上是否具有中层辐合和低层辐散的下击暴流特征,形成1km*1km的网格化雷暴大风标签;
步骤S2、采集地面加密自动站站点历史1h的风速时序;采集格点资料数据;所述格点资料数据包括:地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据;
步骤S3、构建雷暴大风识别模型;所述雷暴大风识别模型包括:站点时序特征编码器、多源格点资料编码器和多模态特征融合模块;将所述风速时序输入所述站点时序特征编码器,得到风速时序编码特征;将所述格点资料数据输入多源格点资料编码器,得到格点资料编码特征;将所述风速时序编码特征和格点资料编码特征输入所述多模态特征融合模块进行特征融合,得到多模态融合特征;多模态特征融合模块将所述多模态融合特征解码,得到有无雷暴大风的二分类结果;
步骤S4、通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_LOSS损失函数;根据所述TS_LOSS损失函数和BCE_LOSS损失函数,得到TG_LOSS损失函数;应用所述TG_LOSS损失函数训练雷暴大风识别模型。
2.根据权利要求1所述的一种雷暴大风识别方法,其特征在于,在所述步骤S3中,所述将所述风速时序输入所述站点时序特征编码器,得到风速时序编码特征的方法包括:
基于风速时序构建对流特征字典;采用欧氏距离计算方法,分别计算风速时序与对流特征字典中的对流特征的最小距离;应用多个站点计算出的对流特征的最小距离,构建表示矩阵;
计算所述表示矩阵每行的最小值,并对所述每行的最小值进行归一化,得到具有对流大风形状的站点特征值;再根据多个站点的经纬度信息,将所述站点特征值映射到1km分辨率的格点上,没有站点的格点的值设为1;应用地面10分钟观测的站点风速最大值与1km分辨率的格点上的站点特征值对应的风速进行比较,即对1km分辨率的格点上的站点特征值进行mask,滤除风速小于所述风速最大值的站点特征值;再采用4层R2U-Net编码器对mask后的站点特征值进行特征编码,得到风速时序编码特征。
3.根据权利要求2所述的一种雷暴大风识别方法,其特征在于,在所述步骤S3中,所述基于风速时序构建对流特征字典构建对流特征字典的方法包括:
应用卡尔曼滤波算法对风速时序进行去噪,去除风速时序中的小于第一预设值的波动;在去噪后的风速时序中,利用10分钟、20分钟和30分钟的时间窗,按照5分钟的间隔框选出雷暴大风发生过程的时序;再分别对10分钟、20分钟和30分钟三种长度的雷暴大风发生过程的时序进行FCM聚类,选择每类中的10%共同组建对流特征字典。
4.根据权利要求1所述的一种雷暴大风识别方法,其特征在于,在所述步骤S3中,所述将所述格点资料数据输入多源格点资料编码器,得到格点资料编码特征的方法包括:
采用三层膨胀因子分别对地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据中的每个参数的格点数据进行膨胀卷积计算,所述三层膨胀因子的膨胀卷积计算具有连通性;将每一层膨胀卷积计算的结果进行拼接,得到拼接特征;通过ConvLSTM对所述拼接特征进行特征提取,得到格点资料膨胀卷积特征;
采用4层R2U-Net编码器对格点资料膨胀卷积特征进行特征编码,得到格点资料编码特征。
5.根据权利要求1所述的一种雷暴大风识别方法,其特征在于,在所述步骤S3中,将所述风速时序编码特征和格点资料编码特征输入所述多模态特征融合模块进行特征融合,得到多模态融合特征的方法包括:
将所述风速时序编码特征和格点资料编码特征分别依次通过由双头自注意力和MLP构建的特征增强器,提取风速时序有效通道特征和格点资料有效通道特征;利用双头交叉注意力对所述风速时序有效通道特征和格点资料有效通道特征进行特征融合,得到初步融合特征;其中风速时序编码特征提供双头交叉注意力的Q值,格点资料编码特征提供双头交叉注意力的K和V值;
将所述初步融合特征再依次经双头自注意力和MLP进行强化,得到多模态融合特征;
所述多模态特征融合模块将所述多模态融合特征解码,得到有无雷暴大风的二分类结果的方法包括:
通过4层R2U-Net解码器对所述多模态融合特征进行解码,得到解码特征;通过1×1的卷积对所述解码特征进行通道合并,并经Sigmoid函数,得到有无雷暴大风的二分类结果。
6.根据权利要求1所述的一种雷暴大风识别方法,其特征在于,在所述步骤S4中,所述通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_LOSS损失函数的方法包括:
其中,为第i个样本的命中;为第i个样本的空报;为第i个样本的漏报;N是样本总个数;
其中,ab是每个样本的格点位置;为发生雷暴大风的格点,为未发生雷暴大风的格点;格点位置处的标签;为格点位置处的模型输出值;是将预报结果通过5×5的卷积计算到5km邻域范围预报;
其中,表示卷积核设置为5×5。
7.根据权利要求1所述的一种雷暴大风识别方法,其特征在于,在所述步骤S4中,所述根据所述TS_LOSS损失函数和BCE_LOSS损失函数,得到TG_LOSS损失函数的方法包括:
将所述TS_LOSS损失函数和BCE_LOSS损失函数加权求和,得到TG_LOSS损失函数;具体公式为:
其中,为权重,其通过在0-1之间隔0.1的方式依次取值进行实验,最终确定,雷暴大风识别模型效果最佳。
8.一种雷暴大风识别系统,其特征在于,所述系统包括:
第一处理模块,被配置为,根据地面加密自动站的分钟观测数据,标定站点的雷暴大风标签;根据雷达速度场上是否具有中层辐合和低层辐散的下击暴流特征,形成1km*1km的网格化雷暴大风标签;
第二处理模块,被配置为,采集地面加密自动站站点历史1h的风速时序;采集格点资料数据;所述格点资料数据包括:地面加密自动站观测数据、雷达观测数据、卫星观测数据、闪电观测数据和地理高程数据;
第三处理模块,被配置为,构建雷暴大风识别模型;所述雷暴大风识别模型包括:站点时序特征编码器、多源格点资料编码器和多模态特征融合模块;将所述风速时序输入所述站点时序特征编码器,得到风速时序编码特征;将所述格点资料数据输入多源格点资料编码器,得到格点资料编码特征;将所述风速时序编码特征和格点资料编码特征输入所述多模态特征融合模块进行特征融合,得到多模态融合特征;多模态特征融合模块将所述多模态融合特征解码,得到有无雷暴大风的二分类结果;
第四处理模块,被配置为,通过将5km邻域命中、5km邻域漏报和5km邻域空报带入TS评分,构建TS_LOSS损失函数;根据所述TS_LOSS损失函数和BCE_LOSS损失函数,得到TG_LOSS损失函数;应用所述TG_LOSS损失函数训练雷暴大风识别模型。
9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时,实现权利要求1至7中任一项所述的一种雷暴大风识别方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1至7中任一项所述的一种雷暴大风识别方法中的步骤。
CN202410734176.3A 2024-06-07 2024-06-07 一种雷暴大风识别方法、系统、设备及介质 Active CN118312925B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410734176.3A CN118312925B (zh) 2024-06-07 2024-06-07 一种雷暴大风识别方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410734176.3A CN118312925B (zh) 2024-06-07 2024-06-07 一种雷暴大风识别方法、系统、设备及介质

Publications (2)

Publication Number Publication Date
CN118312925A CN118312925A (zh) 2024-07-09
CN118312925B true CN118312925B (zh) 2024-08-06

Family

ID=91730428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410734176.3A Active CN118312925B (zh) 2024-06-07 2024-06-07 一种雷暴大风识别方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN118312925B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113296072A (zh) * 2021-05-24 2021-08-24 伍志方 一种基于YOLOv3模型的雷暴大风自动识别方法及系统
CN113850233A (zh) * 2021-11-10 2021-12-28 湖南省气象台 一种基于要素的雷暴大风的识别方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114019514B (zh) * 2021-11-25 2022-11-01 浙江省气象台 一种雷暴大风预警方法、系统、设备及终端
CN114764602A (zh) * 2022-05-07 2022-07-19 东南大学 基于时空注意力和数据融合的短临降水预测方法
KR20240056082A (ko) * 2022-10-21 2024-04-30 한국과학기술원 지상관측 자료와 레이더 반사도를 활용한 심층학습 기반 초단기 강수 예측을 위한 방법, 컴퓨터 장치, 및 컴퓨터 프로그램
CN115792918B (zh) * 2022-12-07 2023-09-05 中国民用航空飞行学院 基于多源数据融合的配料法识别航空对流风险区的方法
CN116106856B (zh) * 2023-04-13 2023-08-18 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 雷暴大风的识别模型建立方法、识别方法及计算设备
CN117113680A (zh) * 2023-08-24 2023-11-24 南京航空航天大学 一种大范围雷暴大风事件的检验分析方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113296072A (zh) * 2021-05-24 2021-08-24 伍志方 一种基于YOLOv3模型的雷暴大风自动识别方法及系统
CN113850233A (zh) * 2021-11-10 2021-12-28 湖南省气象台 一种基于要素的雷暴大风的识别方法

Also Published As

Publication number Publication date
CN118312925A (zh) 2024-07-09

Similar Documents

Publication Publication Date Title
US11488069B2 (en) Method for predicting air quality with aid of machine learning models
CN113496104A (zh) 基于深度学习的降水预报订正方法及系统
Zhang et al. Weather visibility prediction based on multimodal fusion
US12013900B2 (en) Teleconnection pattern-oriented spatial association clustering method
CN114298162B (zh) 融合卫星雷达多源数据的降水质量控制与评估方法及应用
CN115220133A (zh) 一种多气象要素降雨预测方法、装置、设备及存储介质
CN116106856B (zh) 雷暴大风的识别模型建立方法、识别方法及计算设备
Chen et al. A cellular automata approach of urban sprawl simulation with Bayesian spatially-varying transformation rules
CN116819472A (zh) 一种基于雷达数据信息的雷电预警方法及系统
CN111766641A (zh) 一种基于深度神经网络的强对流天气识别方法
CN115598738A (zh) 一种冰雹预警方法和装置
CN118312925B (zh) 一种雷暴大风识别方法、系统、设备及介质
CN107403004A (zh) 一种基于地形数据的遥测雨量站点可疑数值检验方法
CN118396482B (zh) 面向气候变化的耕地质量动态监测方法
CN118413265B (zh) 一种卫星在线状态监测系统及方法
CN118051878B (zh) 基于多模态融合改进深度学习的极端降水次季节预报方法
CN117688464B (zh) 一种基于多源传感器数据的隐患分析方法及系统
Zhang et al. PM2. 5 concentration prediction based on Markov Blanke feature selection and hybrid kernel support vector regression optimized by particle swarm optimization
CN115619013A (zh) 多传感器信息融合火灾预测算法、系统、电子设备及介质
CN114897395A (zh) 一种风暴潮风险评估与减灾方法
CN115236676B (zh) 一种基于滑动时空匹配的冰雹数据集生成方法和装置
CN117434624B (zh) 一种基于语义分割的强对流天气识别和发展预判方法
CN118551187B (zh) 一种智能识别东北冷涡系统的方法及系统
Minßen et al. Predicting Vessel Tracks in Waterways for Maritime Anomaly Detection
CN117494026B (zh) 寒潮气象下输电线路覆冰故障定位方法、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant