气象科技前沿

深度前沿·精选前沿·动向

深度

首页 > 气象科技前沿（原科技信息快递） >2023年>第四期>深度

人工智能短临降水预报前沿案例发布日期：2026-01-05

⬛ 赵阳薛建军（气象干部培训学院，特约）

　　20世纪80年代以来，人工智能技术就已经在气象领域进行了较多的探索性应用研究与实践，从气象资料的处理分析到预报产品的制作都有涉及。近年来，作为人工智能技术的重要分支，基于数据驱动的机器学习、深度学习等技术在气象领域取得突破性应用成果。例如在一定的模型框架下，通过大量输入样本的数据，学习其结构和内在规律，建立输入数据与标签数据间的特定关联，从而实现对新样本进行识别和对未来进行预测。特别是在数值模式尚不能解决的一些中小尺度的强对流天气的预报问题中，人工智能方法被赋予了更多期待和重任。

　　本研究主要关注的是强对流天气预报中的短临降水预报。其中，0～2 h预报称为临近预报，2～12 h预报称为短时预报。以深度学习为代表的机器学习算法的兴起，有效结合大量观测或模式模拟数据的“数据驱动”方法已经成为短临降水预报的有效补充手段。下文梳理了Google、DeepMind等商业公司和牛津大学、清华大学、中山大学等国内外高校，近年来将人工智能技术应用于短临降水预报中的12个典型案例（表1）。

表1　人工智能技术在短临降水预报中的应用案例情况

　　（1）Google MetNet、MetNet2

　　Casper Kaae Sønderby等人^[1]于2020年发布了MetNet，可以以1平方公里、2分钟的精度预测未来8小时的降水量。MetNet使用MRMS雷达和GOES-16卫星数据以及预测提前时间作为输入，使用轴向自注意力机制构建深度神经网络模型，可对美国大陆范围（7000 km×2500 km）进行7～8小时、优于HRRR模式的降水预报。训练采用了256块谷歌TPU。

　　在此基础之上，Lasse Espeholt等人^[2]于2021年发布了MetNet2，在提前12小时进行降雨预报时优于美国最先进的HREF集合预报模式。MetNet2采用MRMS雷达数据、GOES卫星图像、HRRR同化数据、地理信息、NWP降水预报作为输入数据，通过LSTM、卷积残差块构建模型（图1），在64个TPU芯片（128个TPU核心）上并行训练。

图1　MetNet2架构说明

　　（2）DeepMind DGMR

　　Suman Ravuril等人^[3]探索了用于雷达降水概率预报的深度生成模型DGMR，可通过20分钟雷达图预测未来5～90分钟的临近预报，最大预测范围可达1536×1280公里。训练数据采用英国地区雷达数据，考察了CSI、PSD、CRPS等评价指标。对比MetNet、UNet、PySTEPS等模型，在降雨以及环流结构和强度的预测上，DGMR与雷达数据最为接近（图2）。面对强降雨事件，DGMR在预测降水的强度和范围上的综合表现也最好。只需要约1.3秒就可以在一块Nvidia V100 GPU上完成模型推理预报。

图2　DGMR 模型架构及预报试验

　　（3）牛津大学RainBench、CorrectorGAN

　　Christian Schroeder de Witt等人^[4]于2021年发布了多模式基准数据集RainBench，旨在为机器学习模型提供全球降水预测的必要数据。研究探讨了基于数据驱动的极端降水预测面临的挑战，包括类别不平衡等问题，并提出了解决方案。同时还发布了用于高效处理大规模降水数据集的PyRain库。

　　2022年，Ilan Price等人^[5]提出了CorrectorGAN模型，其使用一种生成对抗网络（GAN）来纠正和降低全球集合预报的分辨率，以进一步精细化改进预测结果。全球数值天气预报模式由于分辨率低，无法捕捉小尺度空气运动引起的降雨，使得精确预测变得更加困难。作者利用深度生成模型来提高全球预报模型的准确性和分辨率，改善了传统方法在数据缺乏的区域无法准确地预测降雨情况（图3）。

图3　CorrectorGAN 的6小时降水量预报

　　（4）马斯特里赫特大学AA-TransUNet、WF-UNet

　　Yimin Yang等人^[6]于2022年提出了AA-TransUNet模型，即在医学语义分割模型TransUNet的基础上，增加了卷积块注意力模块CBAM、深度可分离卷积DSC模块、注意力增强模块（图4）。数据集采用荷兰地区降水图与法国地区云量覆盖图，其中降雨预测使用过去1小时的降雨图预测未来0.5小时的降雨图。对比UNet、SmaAtUNet等模型，所提出的模型在准确率、召回率、F1系数等指标上优于其他测试模型。训练采用1块Nvidia P100 GPU。

图4　AA-TransUNet模型架构

　　Christos Kaparakis等人^[7]于2023年提出了基于三维卷积神经网络的WF-UNet降水预报模型（图5）。该模型可以将过去多个天气变量（如降水和风速）作为输入，预测未来3小时的降水。模型使用ERA5制作子训练集EU-50和EU-20，使用一块NVIDIA Tesla V100进行训练。通过在EU-50和EU-20上进行测试，对比其他四个模型（BroadU-Unet等），WF-UNet在MSE、准确率、召回率等指标上是最优的。

图5　WF-UNet模型架构

　　（5）中山大学IC-MLNet、PTCT

　　Fengyang Xu等人^[8]提出了一种基于多层结构的集成降水预报后处理模型（图6），采用了一种新的多层结构，能够在单独的层中分别处理不同降水强度类别，并使用跨网格信息合并为质量确定性预测，这与以前的统计后处理方法有很大不同。通过对比两种最先进的集合定量降水预报（QPF）后处理方法，其模型在降水量预测和降水强度类别预测方面都优于比较基线。

图6　IC-MLNet 模型架构

　　Ziao Yang等人^[9]于2022年提出了基于3D时域卷积的Transformer网络PTCT（图7），在广州雷达数据和HKO-7雷达回波数据集上分别训练和预测未来2小时和1小时的雷达回波图，训练采用4块Nvidia V100 GPU。对比PredRNN、ConvLSTM等经典算法，在SSIM、CSI和POD上都取得了更好的效果。

图7　PTCT模型架构

　　（6）上海交通大学PredRNNv2

　　Yunbo Wang等人^[10]于2022年提出了新的时间序列模型PredRNNv2，基于时空记忆流机制、ST-LSTM模块、反向计划采样训练等，以解决过往卷积、RNN类时间序列预测模型的缺陷。在1小时广州雷达回波外推任务中，其CSI要显著优于ConvLSTM、MIM等经典时空序列预测模型（图8）。

图8　PredRNNv2与其他模型的效果对比

　　（7）香港科技大学Earthformer

　　Zhihan Gao等人^[11]于2022年提出了Earthformer——一种基于长方体注意力模块的层次化Transformer编解码模型（图9），可以用于降雨预报和气候预测。其长方体注意力模块包含了诸如轴向注意力、视频SwinTransformer、分割时空注意力等机制模式，可以内部分发、收集全局观测数据的关键信息，并解决Transformer架构在获取高维时空观测数据应用的高复杂度问题。训练采用多块Nvidia V100 GPU。相对于ConvLSTM、PredRNN、UNet等模型，Earthformer在麻省理工学院的风暴事件数据集（SEVIR）上取得了最好的CSI指标。

图9　Earthformer 架构

　　（8）清华大学&中国气象局NowcastNet

　　Yuchen Zhang等人^[12]于2023年提出了NowcastNet，结合了深度学习与物理演化规律进行降水临近预报，并且首次将降水临近预报时效延长到了3小时。NowcastNet模型结构如图10：输入雷达数据，通过Evolution network得到经过物理规律计算之后的预测雷达数据，之后将原始的雷达数据和预测之后得到的雷达数据结合输入NowcastNet encoder得到3小时的预测结果。Evolution network中的Evolution operator则是负责雷达数据物理演化部分的算子。NowcastNet模型是一个深度生成模型，在美国MRMS数据（2016—2020年）上进行预训练，并在中国雷达数据（2019—2021年）上进行微调训练。作者对比了同为生成模型的DGMR，以及PredRNN、PySTEPS等方法，评价指标采用CSI和PSD，NowcastNet在约70%的案例上均优于其他方法。

图10　NowcastNet架构