□ 田 奇 毕恺峰 谢凌曦
编者按 日前,国家自然科学基金委员会发布2023年度中国科学十大进展,人工智能大模型为精准天气预报带来新突破、揭示人类基因组暗物质驱动衰老的机制、发现大脑“有形”生物钟的存在及其节律调控机制等10项重大科学成果脱颖而出。为让读者深入了解我国基础研究取得的成就,本报将陆续刊发由十大进展完成人撰写的解读文章,增进大家对这些成果的创新性、战略性和引领性的认识。
============================================================
天气预报,旨在研究地球大气系统的演变来预报未来天气。天气预报是国家重大战略需求,也是国际科学前沿课题,提升天气预报精度,对社会生产、人民生活、防灾减灾具有重要意义。在全球变暖的大背景下,极端气象灾害发生的频率比以往更高。通过普及早期预警,全球可以每年额外避免百亿美元的财产损失,挽救数万人的生命。
数值天气预报的历史和局限性
现有的数值天气预报理论起源于20世纪初。1904年,挪威科学家皮叶克尼斯提出通过求解描述大气运动变化的数学物理方程来预知未来天气。1922年,英国气象学家理查德森组织大量人力,以纸笔计算的方式,花费6个星期完成了6小时天气预报。1950年,美国气象学家查尼利用电子计算机花费24小时完成了24小时天气预报而轰动一时。随着计算机运算速度的不断提升,数值天气预报日趋成熟,不仅预报时长从1天增长至5—7天,预报分辨率也从几百公里降至几公里。
数值天气预报的基本原理,是将多种观测资料包括雷达、卫星等,整合为网格化的温度、气压、湿度、风速等气象变量,再求解基于大气动力学的方程。然而,近年来,这种数值预报方法遇到许多问题,这是因为数值方法依赖于大气系统的偏微分方程,而这些方程往往包含近似和参数化。与此同时,数值天气预报方法往往需要大量算力,这也使得欠发达国家难以建立数值天气预报系统。
深度神经网络用于数值天气预报
近年来,人工智能尤其深度学习理论蓬勃发展,在各个领域取得广泛应用。本研究改进了基于人工智能的数值天气预报方法,训练了一个三维神经网络模型。该模型沿用了Transformer网络结构。其中高空层和地表层输入变量,经过独立编码后连接起来,使编码器—解码器架构得到输出变量。该神经网络模型具有约6400万个参数。
与同期英伟达、谷歌等公司提出的方法相比,本研究通过采用三维神经网络模型,使得模型能够同时考虑多个高空层和地表层的气象要素,以更好地捕捉扩散、对流等气象过程。为了提升该模型的训练和推理效率,本研究还提出地球位置编码和层次化时域聚合技术,达到了缩短推理间隔、减少迭代误差、节省推理时间的多重益处。配备了上述技术的人工智能模型,被团队命名为盘古气象大模型。
盘古气象大模型在欧洲气象中心第5代再分析场数据(ERA5)上训练,选取了1979—2021年的气象数据,并选定其中69个关键气象变量进行研究。盘古气象大模型共有4个不同预测时效的神经网络模型,每个模型需要在192块GPU(图形处理单元)上训练16天。盘古气象大模型的单步推理只需要在单个GPU上运行1.4秒。这意味着,盘古气象大模型仅需不到10秒,即可完成全球7天高分辨率数值天气预报,比传统数值方法快了1万倍以上。
人工智能算法在数值气象预报上的优越性
盘古气象大模型在2018年全年的ERA5数据上进行了测试, 结果表明,确定性预报精度超越了欧洲气象中心的集成预报系统。综合各气象要素的测试结果表明,盘古气象大模型将集成预报系统的预报时效增加了0.6天,而传统数值天气预报的时效每10年才能增加1天。
盘古气象大模型还可以通过寻找平均海面气压的极小值,对台风路径进行预报。盘古气象大模型在2018年全球88个命名台风上进行了测试,结果表明,对台风眼位置3天和5天预测的绝对位置,误差比欧洲气象中心高分辨率系统降低了26%和28%。2023年夏秋季,盘古气象大模型还对多个台风过程进行了实时预报,表现优异。盘古气象大模型能够提前5天判断出台风玛娃将在台湾岛东部海域转向,对于中国大陆没有显著影响,也能够在台风苏拉编号之前,即判断其将在菲律宾东部海域逆时针绕圈并登陆中国华南沿海。
(田奇系华为云计算有限公司人工智能领域首席科学家,毕恺峰系华为云计算有限公司高级研究员,谢凌曦系华为云计算有限公司高级研究员)