天文学自古以来就是数据和发现驱动的科学。随着大型观测设备的研制和使用,天文学成为大数据科学的典型代表。在天文大数据矿产中淘金,必须借助人工智能技术。也正是在人工智能技术的推动下,天文新发现层出不穷。
类星体是迄今为止人们发现的最遥远的一类天体,被称为“宇宙探针”,具有高光度、大红移等特征,对于宇宙学的研究具有重要意义。因此,类星体的搜寻工作尤为重要。但是由于类星体的形态与恒星很相似,这大大加大了类星体搜寻的难度。
图1:类星体示意图(源自网络)
近期,国家天文台科研人员李长华、张彦霞、崔辰州等人基于北京-亚利桑那巡天(BASS)大型测光数据、LAMOST和SDSS的光谱巡天数据,通过多种机器学习方法,设计了二分及多分两种不同的分类策略。基于不同的特征组合,构建了多种分类器,最终选出性能最优的分类器应用在BASS DR3数据上。采用光学与红外的特征组合,分类结果在准确度、精度、召回率等指标上都超过了95%。最终从BASS DR3数据中挑选出了79万个高置信度的类星体侯选体,为后续光谱巡天搜寻观测提供了可靠的输入星表。相关成果已发表在英国皇家天文学会月刊(2021,MNRAS,506,1651-1664)。论文链接:点击这里。
在类星体候选体筛选出来后,测定其测光红移又成为一项基本任务。李长华等人基于机器学习方法,研究了一步模型(对样本整体预测)和两步模型(对样本先分类,再预测)来测算样本的测光红移。经对比两种模型在测算红移时的性能,发现两步模型优于一步模型,而且,两步模型对于挑选高红移类星体具有明显优势。应用所建立的模型,对前文挑选出的类星体侯选体完成了红移测算,为类星体的统计研究及充实高红移类星体样本提供了丰富的素材。该成果已发表在英国皇家天文学会月刊(2022,MNRAS,509,2289-2303)。论文链接:点击这里。
值得一提的是,上述两项研究工作中所有计算均在国家天文科学数据中心的云资源平台环境下完成。国家天文科学数据中心为天文观测设备和研究计划提供数据技术与服务。