近几年,科学技术进步推动的天文数据呈现指数增长,天文大数据时代已经到来。科学家们曾经使用的光谱分类方法,难以应对十亿计的测光巡天数据。
曾经使用的多色分类方法,也随着颜色的增多而变得非常复杂,无法给出函数表达式,分类准确率低,污染严重。
然而,二十世纪中叶发展起来的机器学习方法,能够有效的探测多维参数空间中隐藏的规律,帮助天文学家进行决策和预测。它的核心思想是教会计算机通过“经验”,而不是判据,对未知数据进行判断。
这里的“经验”,是指开发模型所需要的训练数据,它的准确性直接关系到最后产出的正确率。所以,光谱巡天数据被认为是理想的“经验”数据。
首先,科研人员合并LAMOST和SDSS的光谱分类结果;其次,结合可见光和红外巡天数据,获取这些天体的多色数据库;再次,测试不同的机器学习方法,找出效率最高的算法并开发天体分类器,通过不同巡天数据对分类器进行盲测 ...