2020年

  1. 2025年
  2. 2024年
  3. 2023年
  4. 2022年
  5. 2021年
  6. 2020年
  7. 2019年
  8. 2018年
  9. 2017年
  10. 2016年
  11. 2015年
  12. 2014年

第五期

  1. 第一期
  2. 第二期
  3. 第三期
  4. 第四期
  5. 第五期
  6. 第六期
  7. 第七期

专题报告

首页 > 《科技信息快递》 >2020年>第五期>专题报告
气象和大气科学领域人工智能科学研究的国际和国内态势分析 发布日期 :2026-01-05  
♦吴灿
  随着人工智能技术的快速发展,人工智能在气象行业的发展和应用也日益受到关注。2016 年美国《国家人工智能研究和发展战略计划》中提出:利用人工智能自动预判天气、交通和突发事件对物流的影响,改进供应链管理。2017 年,国务院印发的《新一代人工智能发展规划》中明确提出:加强人工智能对自然灾害的有效监测,围绕地震灾害、地质灾害、气象灾害、水旱灾害和海洋灾害等重大自然灾害,构建智能化监测预警与综合应对平台。2019 年全国气象科技创新工作会议上,也强调了人工智能与气象的融合创新。
  快速崛起的人工智能新技术为解决很多难题提供了一种全新的思路。随着大数据和人工智能的发展,海量数据深度学习、复杂神经网络等逐步应用,大气科学研究的诸多领域开展了大量地人工智能预报天气的研究。在未来整合基于物理模式的数值预报和数据驱动的方法,将会给天气预报带来新的机会。在这一背景下可以预见,人工智能将成为气象行业未来的关键赛场,竞争将异常激烈。要更好地抓住机遇,加快实现人工智能与气象的融合创新发展,调研分析国际主要发展态势是非常必要的。
  本报告针对气象和大气科学领域人工智能研究这一主题,从科技论文的角度出发,通过文献计量的方法,系统分析过去 10 年(2000—2019 年)气象和大气科学领域人工智能的研究文献,对该领域人工智能研究的进展进行全面、系统地梳理,开展国别研究,定量评估各国气象和大气科学领域人工智能研究的发展水平,厘清该领域人工智能研究的国内外最新进展。
1 分析方法与数据来源
1.1 研究方法与分析工具
  采用文献计量的方法,利用各种数理统计方法和比较、抽象、概括等逻辑方法,对该领域的研究论文、发文国家、研究机构、学术期刊和作者等对象及被引用的情况进行统计分析。
  InCites 是一个基于 Web of Science(WOS)引文数据建立的、经过数据清理与机构名称规范化处理生成的分析评估型数据库,收录了全球 11,000 多种权威期刊文献数据,时间跨度为 30 年。InCites 具有强大和全面的评价功能,可以进行多角度的数据挖掘和全景分析,侧重基于检索的评价结果呈现。CiteSpace 软件是一款免费知识图谱绘制工作,采用计量地图技术通过共现矩阵的相似矩阵,实现二维关联数据的网络可视化分析,可用来研究科研作者、论文、机构和关键词之间共现与引用关系。
1.2 数据来源与检索
  本报告以 WOS 的 SCIE 数据库为来源,以人工智能在气象和大气科学领域应用的方法入手,制定关键检索词。检索策略为从主题字段检索关键检索词,从年代角度限定发文起始时间为 2010—2019 年,再从研究领域和 WOS 分类筛选气象和大气科学领域,选择文献类型为“Article”、“Review”、“Letter”和“Editorial Material”。编制检索式:TS=("artificial intelligen*" OR "artificial intellect*" OR "machine learning" OR "deep learning" OR "neural Network" OR "decision tree" OR "fuzzy logic" OR "hierarchical clustering" OR "k-means clustering" OR "support vector machine" OR "logistic regression" OR "ridge regression" OR "elastic nets" OR "random forests" OR "gradient boosted regression tree" OR "natural language processing" OR "Deep Belief Nets" OR "Deep Boltzmann Machine" OR "Long Short-Term Memory" OR "evolutionary programming" OR "analog ensembles" OR "nonlinear principal component analysis" OR "NLPCA" OR "Genetic Algorithm" OR "advancing forecasting" OR "expert system*") 。最终,从 WOS 数据库的 SCIE 分库中检索得到 2672 条有效数据进行分析。WOS数据库的检索时间为 2020 年 6 月 25 日。
  借助 InCites 数据库,将本文分析的 2672 篇文献导入该数据库,结合人工判读,对发文国家、研究机构和关键词等字段进行清洗,最终处理得到经过归类汇总的待分析基础数据。以这些文献为基础,采用科学的定性定量分析方法,运用大数据处理与可视化分析软件,对近10 年气象和大气科学领域人工智能研究的论文产出进行定量分析,为科研学者和科技政策制定者提供一定的数据支持和定量参考。
2 气象和大气科学领域人工智能科学研究的国际态势分析
2.1 整体发文态势分析
2.1.1 论文数量的年代分布
  数据显示,2010—2019 年气象和大气科学领域人工智能研究经历了从平缓开展到迅速增加的显著变化(图 1)。本报告共收集整理学术成果 2672 篇。其中,2016 年前气象和大气科学领域人工智能学术研究成果数量总体稳定,年均维持在接近 200 篇。而到了 2016 年,随着Deep Mind 推出的阿尔法狗战胜人类围棋冠军李世石等事件的发生,全球人工智能第三次热潮到来,当年气象和大气科学领域人工智能研究成果数量迅速增加到了 290 篇。而到了 2017 年,随着人工智能“落地年”(大量人工智能产品问世)的到来,相关研究成果的数量呈“井喷式”增长,该年气象和大气科学领域人工智能研究成果数量突破 300 篇,到 2019 年已突破 500 篇,2017—2019 年 3 年间发表的学术成果数量和前 7 年(2010—2016 年)发表的学术成果数量相当,且这一趋势还在继续。对 2020 年前半年的文献发表数据统计显示,气象和大气科学领域人工智能研究学术成果数量仍维持在高位。

2.1.2 主要发文国家分布
  发文量的多少可以凸显一个国家在某一领域的科研体量,同时也是科研实力的一种体现。近 10 年全球气象和大气科学领域人工智能研究的论文产出来自于 110 个国家。在 TOP15 发文国家中,欧洲国家共有 6 个,另有 6 个亚洲国家(中国、伊朗、印度、韩国、日本和土耳其)、2 个美洲国家(美国、加拿大)和 1 个大洋洲国家(澳大利亚)。发文地域分布见图 2,颜色越深的国家其发文量越高。从图 3 中 TOP15 国家的历年发文变化来看,美国一直处于气象和气科学领域人工智能研究的领先地位,2013 年以后中国脱颖而出,成为和美国并驾齐驱的领跑国。
 

  图 4 展示了 TOP15 国家的第一作者发文情况。由图可知,中国(554 篇)、美国(489 篇)和印度(163 篇)是第一作者发文量排在前 3 位的国家。从第一作者发文占比来看,TOP15国家的第一作者发文量均超过了各自总发文量的 50%。中国的第一作者发文占比最高,达89.79%, 紧随其后的是印度、伊朗和意大利,均达 70%以上,美国、加拿大和德国处于第二梯队,这三个国家的第一作者发文占比在 60%~70%之间,其余国家处于第三梯队,其第一作者发文占比在 50%~60%之间。

2.1.3 主要发文机构分布
  在气象和大气科学领域人工智能研究方面发文量最大的 TOP20 机构见表 1。TOP20 机构中,美国机构共有 10 家,占据了半壁江山,优势明显;另有 5 家中国机构、2 家法国机构、2 家印度机构和 1 家德国机构。中国气象局以 36 篇的发文量位居第 15 位。从入选机构的数量可以看出,人工智能在气象和大气科学领域的应用研究在美国开展得最为广泛。


  从 TOP20 机构的发文情况来看,在总发文和第一作者发文方面,前 3 位的机构相同,均为中国科学院、美国国家海洋与大气管理局和法国国家科学研究中心,且中国科学院以显著的优势遥遥领先于其他机构。此外,在第一作者发文方面中国机构的表现整体优于其他国家。以第一作者发文占比来看,5 家中国机构北京师范大学(82.86%)、南京信息工程大学(69.81%)、中科院大学(64%)、中国科学院(59.2%)和中国气象局(52.78%)分别位居第 1、第 4、第5、第 7、第 11 位。
2.2 研究影响力与合作分析
2.2.1 主要国家影响力分布与合作网络
  从发文的被引频次(总被引频次和篇均被引频次)、使用频次(通过文章引用率体现)与发文新颖度(通过近 3 年发文占比体现)等方面(表 2),可以衡量出各国在气象和大气科学领域人工智能研究的影响力情况。经过统计,全部 2672 篇文献总被引频次为 39559 次,篇均被引达 14.8 次/篇。

  美国在总被引频次上远远领先于其他国家,且篇均被引频次也表现良好,位列第 4,反映了其学术影响力优势明显,但在近 3 年发文占比上优势不明显,受到了其他国家的冲击。中国的总被引频次排名第 2,但由于发文表现优于引用表现,因此,篇均被引频次排名不佳,此外文章引用率排名也表现平平,反映出我国仍需在学术影响力方面努力提升。但可喜的是,我国在近 3 年发文占比方面表现良好,位列第 4 位。
  此外,德国、法国、英国、意大利和澳大利亚无论是在论文被引频次方面,还是在使用频次方面均表现良好,说明这些国家在该领域研究的学术实力不容小觑。在亚洲国家中,伊朗和土耳其的表现值得关注,其篇均被引频次和文章引用率均超过了中国,说明他们在该领域拥有不俗的学术影响力表现且他们的研究也有较高的关注度。在发文新颖度方面,表现良好的国家除中国外,还有荷兰、澳大利亚、日本和英国,说明这些国家近年来在该领域也保持了较高的活跃度。
  通过国家的合作网络分析,能够识别出气象和大气科学领域人工智能研究国家之间的合作关系。从 TOP20 国家之间的合作网络来看(图 5),图中节点的大小反映了各国的发文数量,节点越大,表示发文量越大。节点中带有紫色外圈年轮的表示该节点的 Centrality(中心性)高。紫色外圈越粗,节点的中心性越高,说明其在整个合作网络中的重要性和影响力越高。从 Centrality 值可知,美国、德国和法国是整个合作网络的中心性国家(其 Centrality 值分别为 0.26、0.25 和 0.23),意大利、加拿大和日本为次中心国家(其 Centrality 值分别为 0.11、10和 0.10)。这些中心和次中心国家,除日本为亚洲国家外,其余均分布在欧洲和北美洲,说明气象和大气科学领域人工智能研究的国际合作主要还是集中在欧洲和北美地区,这些地区的国家在国际合作网络中占据了主导地位,拥有较高的影响力。
 

  中国的 Centrality 值为 0.07,但由于发文量最大(仅次于美国位居第二),因此在合作网络中也是最重要的桥梁性国家,除中国外,合作网络中的桥梁性国家也多为亚洲国家,如韩国、印度、马来西亚、土耳其、伊朗等。
2.2.2 主要机构影响力分布与合作网络
  采用同样的方法和指标,对 TOP20 机构的影响力进行分析,见表 3。由表可知,在总被引频次和篇均被引频次方面,美国国家海洋与大气管理局和美国国家大气研究中心遥遥领先于其他机构,稳居第 1 和第 2 位,其学术影响力优势十分显著。除这两家机构外,在引用频次方面表现良好的机构还有法国国家科学研究中心和美国加州大学系统。

  中国机构发表论文的引用表现整体平平,少数机构的总被引频次较高(如中国科学院),这是由于其拥有较大的发文量;若按篇均被引频次来看,中国机构的排名普遍靠后。在 5 家中国机构中,中国气象局的篇均被引频次最高,为 15.19 次/篇,是在上榜的中国机构中唯一超过全球平均水平 14.8 次/篇的。
  在文章引用率方面,印度理工学院系统、法国索邦大学和德国亥姆霍兹联合会的文章引用率较高,说明其开展的研究获得了较高的同行关注。在近 3 年发文表现方面,中国科学院大学、北京师范大学和德国亥姆霍兹联合会的近 3 年发文较多,说明这些机构近年来在该领域拥有较高的研究活力。
2.2.3 ESI 高被引论文分布与合作网络
  2.2.1 节从论文整体水平的角度出发,对各国发表论文的学术影响力进行了分析。而针对最优秀的前 1%的论文,即被引频次位于该学科所有论文的前 1%的论文(也称为 ESI 高被引论文),其数量特征也可以在宏观上从一个方面反映学术实体的学科影响力和竞争力。本报告收集整理的 2672 篇学术成果中,有 36 篇学术成果被选为 ESI 高被引论文。从 ESI 高被引论文的产出国家分布来看,在 ESI 高被引论文数产出 TOP15 的国家中,有 7 个为亚洲国家,且亚洲国家的第一作者或通讯作者论文数占总论文数的比例也普遍较高。这些结果说明,在气象和大气科学领域人工智能研究中,亚洲国家的研究实力逐步提升,且主导型学术论文的占比也在提高。但结合之前的分析结果可以看出,虽然亚洲国家在该领域拥有较大的研究体量,也有一定的高质量的研究积累,但其整体文章质量依然不均衡。
2.3 研究方向与热点前沿分析
2.3.1 主要研究方向布局
  从发文所属的研究领域来看(图 6),气象和大气科学领域人工智能研究的主要交叉领域为地质学、水资源学和环境科学,其论文占比分别为 29.4%、22.8%和 17.2%。从 TOP20 国家发文的主要交叉领域分布来看,美国、德国、英国、加拿大和澳大利亚更侧重于与环境科学领域的交叉,而中国等亚洲国家以及法国、意大利等少数欧洲国家则更偏重于与地质学领域的交叉。

  从发文内容来看,通过标题与摘要关键词聚类分析,可以得出气象和大气科学领域人工智能研究 SCI 论文的研究内容(图 7),大致可以分为四类:(1)蓝色聚类为气象和大气科学领域人工智能技术的理论研究,主要关键词包括人工神经网络、随机森林、遗传算法、机器学习、支持向量机、主成分分析等。这一聚类相对分散,比其他聚类交叉性较大,这与其研究涉及多学科科学的实际相符;(2)橘色聚类为人工智能技术在预报业务中的应用,主要关键词包括数值天气预报、预报验证、统计预报、集合预报、概率预报、模型、预报技巧等词汇;(3)浅橙色聚类为观测技术中人工智能的融入,主要关键词包括卫星观测、雷达以及数据分类、最小化、降尺度等与数据处理有关的词汇;(4)浅蓝色聚类为陆面遥感及灾害管理,主要关键词有滑坡、洪水、灾害评估、GIS 等词汇。

2.3.2 研究热点前沿分析
  将气象和大气科学领域人工智能研究 SCI 论文的研究内容进行归类、整理,通过高频关键词(论文中使用频次较高的关键词,图 8)分析可以得到,气象和大气科学领域人工智能研究中,天气和气候预报模式、天气系统及灾害性天气的识别是最主要的研究对象,其次是气象探测技术、生态和大气质量监测。第三类是可再生能源、航空预报。第四类研究对象为智能决策辅助系统。从关键词体现的研究方向来看,数值模式资料同化、数值模式参数计算(如云和对流参数化)、模式产品后处理、临近预报、定量降水客观预报和台风集合预报、霾预报、数值预报订正、精细化预报、超分辨率处理(气候模式降尺度)等天气、气候预报模式的研发和方法改进研究是最主要的研究方向,其次是气象探测设备的自适应(具有自检测、自标校、自校准、自补偿能力)、广泛分布所产生海量数据的大数据挖掘技术应用、基于非气象观测设备的气象信息反演技术等智能气象观测技术研究。此外,人机互动的预报智能编辑和基于自然语言生成的预报产品智能生成等智能决策辅助系统研究也是一大研究方向。

  美国气象学会为其百年诞辰准备的学科综述文集对气象和大气科学领域人工智能的发展进行了回顾和述论,其分析指出,随着更高分辨模式的出现,新观测仪器的部署以及更多遥感方法的实施,观测数据开始迅猛增长。基于数据的天气预报技术研究成为人工智能技术在气象和大气科学领域中最普遍的研究之一。其次是概率预报研究。目前,已研究出了多种可同时处理多个 NWP 系统和多套历史数据的人工智能方法。第三是气候应用研究。如利用人工智能技术模拟大西洋振荡、太平洋-北美遥相关、厄尔尼诺-南方涛动、准两年振荡、季节内振荡等气候变率的主要模式,或利用人工智能技术对气候信息进行后处理。第四是仿真研究。现代预测模型大都是基于从基本原理推导的偏微分方程加上一系列物理参数化,这些物理参数化只是对物理过程的部分理解,因此人工智能是否能够有效地模拟这些过程,并形成混合模型,成为了该领域研究的关键问题。第五是图像识别和处理研究。图像分析识别在雷达、卫星图像广为应用。从被引频次较多的高被引论文,以及经典的综述性文章来看,近年来诸如卷积神经网络(CNN)、生成式对抗网络(GAN)、递归神经网络(RNN)等深度学习方法是目前该方向的研究热点。本报告研究结论与此基本一致。
3 气象和大气科学领域人工智能科学研究的国内态势分析
3.1 整体发文态势分析
3.1.1 论文数量的年代分布
  通过国别筛选,本报告收集的 2672 篇学术成果中,国内学者参与发表的共计 628 篇。数据显示,2010—2019 年国内气象和大气科学领域人工智能研究基本呈现前期平稳增加,后期加速发力的增长变化态势(图 9)。该 10 年期间,发文量从最初的 18 篇增长到了近年的 160篇左右,呈现出了发文量近 9 倍的增长规模。期间,2010—2014 年的前 5 年间年均发文量大约为 34 篇/年。到 2015 年之后,全球人工智能第三次热潮的到来也带动了国内气象和大气科学领域人工智能研究成果的迅速增多,2015—2019 年的后 5 年间,年均发文量增至 92 篇/年,且近 5 年的发文量占总发文量的 72.9%。由此可见,国内在该领域的科研产出在未来还将呈现进一步发展的态势。

3.1.2 主要发文机构分布
  表 4 列出了国内气象和大气科学领域人工智能研究的主要发文机构。从表中机构的总发文量(论文所有作者中有来自该机构的,则该篇论文计入该机构的总发文量)来看,中国气象局、南京信息工程大学、中科院大学、北京师范大学和武汉大学是发文最多的前五名机构。在发文量超过 10 篇的 23 家机构中,中科院系统机构有 4 家(含中科院大学), 部委系统机构有 2 家,其余 17 家为高校。
 
     
  从第一作者发文情况来看,发文最多的前五家机构依次是南京信息工程大学、中科院大学、中国气象局、北京师范大学和武汉大学。从第一机构发文占比来看,解放军理工大学、国防科学技术大学、中国矿业大学和重庆大学表现良好,第一机构发文占比达到 90%以上,第一机构发文表现优于机构总发文。
3.2 研究影响力与合作分析
3.2.1 主要发文机构的影响力指标分析
  表 5 基于国内气象和大气科学领域人工智能研究的主要发文机构,发表的主导论文(第一作者论文和通讯作者论文),给出了上述机构的影响力指标。由表可知,在总被引频次方面,北京大学和中国气象局列前二,且远高于其他机构;在篇均被引频次方面,北京大学、兰州大学和中国气象局位列前三。近 3 年发文占比展示了机构在该领域的研究活力和持续度。从数据来看,近 3 年发文占比最高的前三家机构分别为南京师范大学、中山大学和中国气象局。文章引用率展示了机构开展的研究获得同行关注的情况,其引用率越高,表明其获得的关注越高,由表可知,上述机构中,清华大学、南京师范大学、西北农林科技大学、中科院遥感地球所、中国地震局、华中科技大学、兰州大学和解放军理工大学的文章引用率较高。


3.2.2 中国高被引论文分布
  628 篇论文中有 12 篇高被引论文进入了 ESI 高被引论文,约占论文总量的 1.9%,其中 6篇为国际合作论文。将论文第一作者的第一责任机构视为论文的主导机构,上述 12 篇 ESI 高被引论文的主导机构分布见表 6

  从被引频次最高的 Top50 论文的主要研究内容看,人工智能方法在地质气象灾害——滑坡预测评估中的应用是主要的研究方向之一。滑坡是地质灾害中受气象因素影响最大的灾害类型之一。以 2017 年的高被引论文为例,其前 10 位的高被引论文中有 5 篇围绕这一主题。其他主题,如干旱(11 篇)、生态系统(10 篇,植被指数、碳收支、土壤蒸散量等)、大气化学(9 篇,如 PM2.5、O3、气溶胶光学厚度等)、GIS 数据结合人工智能(7 篇)、卫星降水(6篇)等也是高被引论文的主要研究方向。从高被引论文的被引频次年变化来看,引用量增长最大的文章的研究方向为滑坡敏感性(增长 133.3%)和陆地蒸散量(增长 112.5%),其超过100%的增长体现了研究的长生命周期,此外论文被引频次的高增长也体现了在该研究方向上,中国科研的认可度及其持续影响力。
  同时值得指出的是,在高被引论文中,针对机理研究,特别是推动天气/气候系统分析、模式优化和数据处理以及提高预报准确率等方面的研究成果相对贫乏,以 2017 年的高被引论文为例,我们通过逐篇阅读的方式,梳理了引用率最高的前 100 篇论文的研究内容发现,仅约 10%的文章侧重于应用人工智能方法开展天气、气候机理研究。
3.3 中美差异
  就气象和大气科学领域人工智能研究来看,按照论文刊载期刊影响因子从高到低分为Q1~Q4 区,每个区覆盖该领域 25%的期刊,对比全球及中美两国在各区的论文占比情况(表 8)。由表可知,美国研究水平远远高于全球平均水平,其发表在 Q1 区的论文已超过 50%,Q1 和 Q2 区的论文百分比已达到 80%以上,说明其论文影响力稳居世界前列,研究实力和影响力水平优势明显;对比我国,我国水平略低于全球整体水平,我国在该领域发表论文的整体学术影响力还不高:Q1 和 Q2 区的论文占比接近 50%,在 Q3 区的论文较多,占 49.2%,未来如果这部分研究的水平能再进一步,纳入 Q1 和 Q2 区,那么中国在此领域的发展潜力和提升空间也是可观的。

  此外,我国人工智能在应用气象领域优势明显,但在理论性、突破性研究上任重道远,且研究成果尚未覆盖大气科学全领域。通过逐篇阅读,我们分析对比了中美两国在气象和大气科学领域人工智能研究的成果产出差异:我国的成果产出以天气业务为主,理论性、突破性研究成果较少。如发表的相关论文中,有 70%均为方法学应用研究,而这一比例在美国则约在 20%左右。另一方面,我国在相关理论研究以及面向业务需求有针对性的研发还不够深入,研究成果尚未覆盖大气科学全链条(表 9)。具体体现为:人工智能技术应用集中在短时临近预报上,而对于天气预报业务的全链条,如数据质量控制、天气气候分析以及应用气象等的支撑还远不足。

  此外,在应用气象领域,美国的研究更为广泛,研究主题涉及健康、生态、仪器分析及水资源等众多领域。如:在环境监测、预报和分析研究方面,辛辛那提大学的 Brokamp 等利用回归法和随机森林法,建立针对城市大气颗粒物元成分的暴露评估模型,进行人群暴露风险评估;针对碳循环研究,加州大学的 Oikawa]结合新型测量技术,评估了基于不同人工智能技术建立的生物物理模型对生态系统中 CO2 净交换量(NEE)的模拟性能,以探讨这些差异对陆地碳收支模拟的影响;在臭氧观测和研究方面,Di 等采用一种混合模型,将基于卫星获取的臭氧观测数据,与化学传输模型模拟、土地使用措施及其他辅助变量相结合,估算地面臭氧的时空分布。康奈尔大学的 Mahowald,等利用人工智能算法,评估人类土地利用和土地覆盖变化对陆地碳收支的影响。就仪器分析领域,麻省理工学院的 Zawadowicz 等通过利用机器学习统计技术,区分含磷矿物粉尘(如粉煤灰)产生的质谱峰与通常用作生物气溶胶标记的质谱峰,以改进成分测量的准确性,并以此开发了一种利用单粒子质谱仪测定生物气溶胶化学成分的方法。Garimella 等针对连续流动扩散室(CFDC)测量冰核颗粒(INP)浓度和晶体尺寸这一技术,采用机器学习方法调查了该过程可能造成测量不准确的主要因素及影响机理,并基于机器学习方法研究了减少不确定性的方法。伊利诺伊大学的 Zeng 等基于机器学习技术和多源数据集,在全球范围内评估了水库在水力发电和灌溉两者功能分配上的关系,并进一步分析了气候变化对水电与灌溉之间关系的影响。在数据处理方面,Tao 等基于卫星数据获取降水产品,通过深度机器学习从卫星数据中提取有用信息,用于降水估测并对这一方法进行了验证;Karbalaee 等开发了被动微波降水估算方法,利用遥感数据通过人工神经网络云分类识系统去调整降水估测的时空分布,检验表明估测效果得到了明显改善。
  与之相对比,中国利用人工智能技术在应用气象领域的研究则相对较为局限,大部分的研究集中在自然灾害的预警和防治,以及数据处理方面。如西安科技大学的 Chen 等基于多种人工智能算法模型,进行了滑坡敏感性分析;南京信息工程大学的 Hong 等评估了频数比(FR)、logistic 回归(LR)和证据权重(WoE)三种方法在绘制中国洪水易感度分布地图中的预报性能;北京师范大学的 Yao 等利用支持向量机优化三种算法,来改进对全球陆地蒸散量的估测效果;Jin 等研究证明结合多种卫星资料和粒子群-支持向量机有效提高了对土壤有机质含量的估算精度。这也在一定程度上反映出,中国的研究以应用开发为主,相关理论研究以及面向业务需求有针对性的研发还不够。
4 总结与展望
4.1 研究结论
  通过计量分析发现,全球在气象和大气科学领域人工智能的研究一直保持着稳步发展态势,且发展速度有着明显的加快趋势,在 2010—2019 年的近 10 年中,2017—2019 年最近 3年发表的学术成果数量与前 7 年(2010—2016 年)发表的学术成果数量相当,通过对 2020 年前半年的文献发表数据统计显示,这一趋势还在继续。
  从国家角度来看,美国在该领域的研究遥遥领先于其他国家,其在总被引频次、篇均被引频次和高被引方面均表现优异, 但近 3 年发文占比优势不明显, 这与其在该领域的研究历史长、研究体量大有关。中国、伊朗、印度等亚洲国家是该领域的后起之秀,近 3 年的发文较多,虽然这些后起之秀在该领域拥有较大的研究体量,也有一定的高质量的研究积累,但其整体文章质量不均衡。英国、德国和法国在该领域的研究发展处于稳定状态,各项指标均表现良好。从合作角度来看,气象和大气科学领域人工智能研究的国际合作主要集中在欧洲和北美地区,这些地区的国家在国际合作网络中占据主导地位,拥有较高的影响力。中国等亚洲国家虽然在该领域拥有较大的发文量,但大部分均来自国内,国际合作的参与度较低,未来可期。
  从机构角度来看,美国与中国机构居多。中国科学院在总发文、第一作者发文和通讯作者发文方面,都位列第 1 位,并以显著的优势遥遥领先于其他机构。其次是美国国家海洋与大气管理局和法国国家科学研究中心。北京师范大学、印度理工学院虽然发文量不算多,但第一作者发文占比较高。机构影响力方面,美国国家海洋与大气管理局和美国国家大气研究中心各类指标均表现突出,领先于其他机构,其学术影响力优势显著。其次,在引用频次方面表现良好的机构还有法国国家科学研究中心和美国加州大学系统。中国科学院的被引情况表现不及发文量表现,影响力方面排名稍弱。
  从研究方向来看,气象和大气科学领域人工智能研究的主要交叉领域为地质学、水资源学和环境科学。从关键词聚类来看,研究主要以人工智能技术与天气预报业务的全链条的融合为主,其次是陆面遥感及灾害管理研究。从高频关键词分析来看,主要研究对象有:(1)天气和气候预报模式、天气系统及灾害性天气的识别是最;(2)气象探测技术、生态和大气质量监测;(3)可再生能源、航空预报;(4)智能决策辅助系统。从代表性高被引论文来看,该领域的全球研究主要有 5 个方向,分别是人工智能技术在天气预报、概率预报、气候应用研究、仿真研究和图像识别和处理研究中的应用。
  近年来,中国在气象和大气科学领域人工智能研究中渐渐崛起,成为与美国并驾齐驱的强国之一,但两国在技术的发展上各有所长。美国在理论及算法研究方面,成果产出明显较多,中国的成果产出以天气业务为主。在应用气象领域,中国有一定优势,产出了一批高质量、高影响的研究成果,但研究涉及的主题不及美国广泛。总体来说,中国在气象和大气科学领域人工智能研究中呈现出良好的发展态势,虽论文整体影响力仍有待提高,但科研论文产出数量可观,在国际合作影响力方面还有较大上升空间。此外,虽然我国人工智能在应用气象领域有一定的优势,但在理论性、突破性研究上任重道远,且研究成果尚未覆盖大气科学全领域。具体体现为:人工智能技术应用集中在短时临近预报上,而对于天气预报业务的全链条,如数据质量控制、天气气候分析以及应用气象等的支撑还远不足。
4.2 展望与建议
  从国家层面来看,除了中美在气象和大气科学领域人工智能研究中的领先优势外,亚洲国家整体有着令人欣喜的表现:亚洲国家发文量多,对气象和大气科学领域人工智能的研究有较高的热度,伊朗、印度、马来西亚等亚洲国家成为该领域的新兴力量。如伊朗虽然在传统气象学领域并无突出表现,但近三年来,伊朗的信息科技市场发生了很大的变化,所以伊朗在这一领域内已有不少的人才储备。因此,该国在气象和大气科学领域人工智能研究方面的论文表现令人瞩目。印度是全球人工智能领域的后起之秀。目前其国内有 800 多家公司已经或正在部署人工智能,拥有近 2.9 万名人工智能专业人才。2018 年印度发布的《人工智能的国家战略》还部署了该国未来将在人工智能领域优先布局的五个领域。东南亚在人工智能领域充满活力,各国大多表现出了积极发展人工智能产业技术的意愿,部分国家特别是东南亚传统的领先国家新加坡和马来西亚已经在政府政策层面上推出一些鼓励人工智能发展的战略,比如新加坡的《AI 新加坡》、马来西亚的《国家大数据分析框架》,并在相关学术研究领域占据优势。此外,其它国家也不甘落后,如越南以及印尼、泰国等国在应用领域,均在积极探索。但值得指出的是,虽然亚洲国家(包括中国在内)作为该领域的后起之秀,近年来在该领域拥有较大的研究体量,也有一定的高质量的研究积累,但其整体文章质量仍不均衡。
  与上述国家形成对比的是英德法日等传统气象强国,在该领域表现相对平平。如英国是人工智能领域的传统强国。政策支持、人才聚集、不断完善的数字生态系统,以及善于将数据资源社会化等因素决定了其在人工智能领域的独特优势。然而,在气象和大气科学领域,似乎没无特别建树。欧洲国家普遍面临人工智能人才流失的境况,但其在气象和大气科学领域拥有深厚研究基础和领先优势,在数据比较和反演特别是图像智能识别领域也有很强实力。因此,这些地区的气象和大气科学领域人工智能研究也不容忽视。
  人工智能被认为是较为适合处理气象预报预测的有效方法。气象数据具有海量、多源、开放、不同类型、多时空尺度、高质量的特点。这些是人工智能方法和技术在气象领域应用的有利条件,也是先发优势。展望未来,人工智能在气象和大气科学领域的应用的发展,可能会在图像识别(如极端天气型分类和异常检测)、超分辨率处理(气候模式降尺度)、时间预测和空间预测等方面取得较大进展。为此,建议相关科技管理部门应加大对这些研究方向的扶持力度,并引导研究成果向业务应用的转换。
  此外,培养和吸引顶尖人才,加强高层次人才储备是必不可少的。麦肯锡 2018 年发布的报告《人工智能的未来之路》指出,中国的核心算法领域远远落后于英美同行的一个主要原因是缺乏顶尖的人才。而在大气科学领域也同样面临相同的困境:目前大部分人工智能技术方法研发还是以大气科学专业背景人员为主,需要统计学、计算科学、大数据挖掘等专业背景的科学家加入,尤其是同时精通大气科学和人工智能的人才,才能在核心基础领域实现突破。建议对已在相关研究领域和前沿方向中取得相当科研成果的科学家和工程师长期跟踪、关注发展,择机引进。此外,对后起之秀国家的研究人员,也可以保持关注,寻求多种形式的合作。
  同时还应加强合作。2018 年以来,各国人工智能战略布局进一步升级,人工智能正在从少数大国关注走向全球布局的新格局。未来,中国应注意加强与相关方的合作。一方面应注意与传统气象强国合作的优先着眼点,如美国在机理分析方面的合作,与欧洲在数据反演方面加强合作等,另一方面应注意与亚洲国家以及一带一路战略中表现活跃国家的合作(如中国与马来西亚共建该国首个人工智能产业园),并关注伊朗、印度等国发展等,取长补短,借助各自的优势谋求共同发展。
  相信假以时日,从量变到质变,我国在气象大气科学领域人工智能的研究将更坚实地进入国际领先水平行列,为保障国家的应急防灾减灾能力、保障民生提供更有力的支持。