图1:《2020s年代天文学与天体物理学的发现之路》
近日,美国科学院发布了《2020s年代天文学与天体物理学的发现之路》,为美国未来十年的天文发展描绘了清晰的蓝图。其中4.5节和附录H的小组报告有很大一部分关于天文信息学的内容。该报告指出,天文学正上演着第二次数据革命,并极大地改变了天文学的研究方式——望远镜设施主要致力于生产档案数据,天文学家则利用这些公开的数据集进行科学研究。为了助力研究转型,提高科学产出,报告从数据管理、软件开发和维护、高性能计算(HPC)和高吞吐计算(HTC)、数据科学等几个角度分析了当前状况和未来发展趋势,并给出了政策建议。这些内容对天文信息学和虚拟天文台从业人员具有很好的指导和参考价值,因此,国家天文科学数据中心的部分研究生对相关章节进行翻译,并提炼出了内容要点。如果您想了解更多详情,可点击文末链接查看翻译原文。
图2:哈勃空间望远镜的科学产出历史,紫色部分表示使用纯档案数据的研究成果。
数据管理
天文观测产生的数据集在很长时间内都具有科学价值,但由于现有的数据中心是由多个不同的机构资助运营,有着不同的政策和科学目标,这阻碍了它们之间的协调。因此,小组建议建立一个天文数据档案系统(ADAS)来有效协调这些数据中心。
软件开发和维护
由于天文问题的日益复杂和硬件平台的多样化,软件正成为天文学中不可或缺的部分,但目前并没有得到足够的重视。这需要在开发人员的待遇和职业发展路径、软件持续可用性、开放性、可复制性和可再现性、软件开发培训等方面予以投入,以及与计算机科学相关部门开展战略合作。
高性能计算和高吞吐计算
高性能计算和高吞吐计算是执行大型数值模拟和大数据分析的基础,相比于传统上托管大量硬件资源,使用公有云是更加经济的方案。因此,小组建议资助机构持续挖掘云计算的使用潜能并在使用云计算设施的培训上予以投资。
数据科学与机器学习
以机器学习为代表的数据科学是天文学研究的新工具。它在异常数据识别方面已经发挥了重要作用,未来在天文数据挖掘、多尺度天文过程模拟等方面有广阔应用前景。因此小组建议投资于对天文学家应用机器学习的培训。
总结
天文信息学在天文学研究转型中发挥着重要的作用。该报告通过分析现有政策和未来趋势,给美国的天文学发展提出了诸多建议:包括建立联合的数据中心、提高软件开发人员待遇、加大软件持续可用性方面的投入,与其他部门开展合作,以及在天文社区投资开展软件开发、云计算、机器学习方面的培训等,对我国天文信息学和虚拟天文台的发展同样有着参考价值。
点击这里,获得相关章节的翻译原文。(翻译:张震 王培培 吴莹 杨嘉宁 于洋 张琦乾)