近日,国家天文台张彦霞研究员、赵永恒研究员和北京大学吴学兵教授基于中国郭守敬望远镜(LAMOST)和美国斯隆数字巡天(SDSS)的光谱数据,结合欧洲航天局的X射线牛顿天文望远镜(XMM-Newton)数据、广域红外巡天探测器(WISE)数据及SDSS可见光测光数据,通过交叉证认方法获取了具有不同波段信息的多个已知样本。基于此,研究人员通过机器学习方法构建了适合不同波段样本的最优分类器,为X射线牛顿天文望远镜第九次发布数据(DR9)提供了分类预测和概率。该成果是天文信息技术在国际多个大型多波段巡天项目融合数据中的应用典范,为进一步开展X射线源的细致分析和研究工作具有重要的研究价值。该成果已在国际知名天文期刊英国《皇家天文学会月刊》(MNRAS)上发表。论文链接:点击这里。
二十世纪以来,随着各类地基和空间大型天文观测设备的研制和运行,天文观测覆盖了从射电、红外、可见光、紫外至X射线和γ射线的全电磁波段。天文学迎来了全新的发展阶段,即全波段-大样本-海量信息时期,这为探索各类天体和天文现象的物理本质提供了强有力的数据资源。从海量复杂的天文数据中挖掘信息和知识为天文学家提供了新的机遇和挑战。
交叉证认在多波段天文学研究中起着至关重要的作用,是多波段天文数据融合的关键技术和方法。通过对某一天体的多波段证认,可以获得该天体的不同波段信息,进而可以揭露更多的物理本质。近年来随着观测仪器和观测技术的大幅提升,天文数据的搜集能力大大加强,天文学步入大数据时代。
图1:XMM-Newton望远镜(图源:ESA)
欧洲航天局(ESA)于1999年发射的X射线牛顿天文望远镜(XMM-Newton),具有极高的光谱分辨能力,其目的是对宇宙天体进行高质量的X射线观测,为研究黑洞、中子星和脉冲星、星系团、活动星系核等高能现象的X射线发射源提供极具价值的数据资源,成为ESA历史上科学产出傲人的项目之一。2019年12月,该项目对外发布了第九次高质量数据集(DR9),该批数据的观测日期从2000年2月至2019年2月,观测的独立源数量达到55万。
张彦霞等人首先利用LAMOST光谱数据和SDSS光谱数据,获得已知天体的分类信息,而后与XMM-Newton项目的X射线数据、WISE近红外数据以及SDSS可见光数据交叉证认,获取了包含7203个星系、3558颗恒星、21040个类星体的已知样本,该样本仅占X射线牛顿天文望远镜第九次发布总观测数据的5.78%,这就意味着X射线牛顿天文望远镜DR9数据集的绝大多数X射线观测数据仍为未知天体。
图2:星系、类星体和恒星在二维参数空间中的分布
研究人员通过数据融合提取了已知样本分别在不同波段的特征信息。接着,利用机器学习方法针对不同波段的已知样本分别构建了不同的分类器,从中挑选出最优分类器对X射线牛顿天文望远镜DR9数据中的未知源给出了分类预测和概率。
该成果充分体现了机器学习方法在多个大型多波段巡天项目融合数据中的应用价值,其分类结果为进一步细致分析和研究X射线源具有非常重要的科学应用前景。
国家天文科学数据中心为天文观测设备和研究计划提供数据与技术服务。