一百万天体在现代天文观测数量上并不算多。目前在中国虚拟天文台主节点上包括郭守敬望远镜(LAMOST)观测数据在内,就有十亿天体的总体量。
但是一百万天体到了天文学家手里,仍然是一个相对庞大的工作量。这一百万天体杂乱无章,有恒星、类星体,还有星系或星云,不同的研究方向就只会专注于其中一种天体。
所以拿到一百万天体,天文学家要做光谱分类。不同天体的光谱是由其组成成分和物理环境双重的差异共同造成的,可以说是独一无二的。光谱对于天体来说就是身份识别的指纹,而光谱分类就是天文学家手中的“星辰整理术”。
比如这张太阳色球照片和左下角的太阳光谱,就是它独一无二的“身份证”。
太阳紫外照片与太阳可见光光谱
图片来源:NASA/美国大学天文联盟(AURA)
提到恒星光谱分类,今天天文学所采用的方法由19世纪末提出的“哈佛光谱分类法”发展而来,该方法起初以氢谱线的强弱作为标准。哈佛天文台的女天文学家们按照ABC字母顺序对大量恒星光谱的照相底片进行了测量分类,但在研究中她们并未意识到这是错误的。
直到“星辰整理术大师”安妮·坎农出现,人们才找到更加准确的分类方法。坎农对原先的分类法做了重要的修正,根据当时最时髦的量子物理理论,她将恒星按照表面温度递减的规律,重新排列了原有字母的顺序,得到了最主要的恒星光谱型——OBAFGKM。直到今天我们仍在使用的MK分类法,正是以此为基础的。
美国女天文学家坎农在她的办公桌前,照片左边打开的抽屉中尽是一张张天体光谱底片。利用身前的透光台,坎农可以靠肉眼对天体光谱进行识别和分类。
图片来源:Smithsonian Institution from United States
相当长的一段时间里,天文学家们都要像坎农那样靠肉眼对天体光谱进行识别和分类,效率低、周期长。随着计算机的应用,天文学家依靠数据处理技术进行光谱分类,仍然需要不断提高效率。
在今天,这项工作即将由人工智能来完成。
国家天文台与阿里云合作举办了天文数据挖掘“天池大赛”,主题就是天文光谱智能分类。参赛者对郭守敬望远镜观测获得的上千维光谱数据进行分类,设计出高效高准确率的天体分类算法。在新的算法上,将省去很多繁重的人工筛选的任务量,使得天文学家能够集中精力进行数据分析。
截至2018年3月12日初赛结束,全球共计近千人报名参赛,他们当中有的是在校学生,有的是计算机公司职员,很多人都是第一次接触天文光谱数据,因为热爱天文学而踊跃报名。
这意味着此次大赛产生的算法不只能够让天文学行业受益,也不只能够让中国约3000人的职业天文学家们受益——还可以让更多人尝试接触天文科研和机器学习等新领域。
5月4日,也就是明天,来自不同行业的五支决赛队伍,将在国家天文台进行论文答辩。赛后,决赛团队将获得参观国家天文台加兴隆观测站和明安图观测站的珍贵机会,体验神奇的天文之旅。
从现在起,这项“星辰整理术”不再是天文学家手中的秘术了。
天文数据挖掘大赛,聚焦天体光谱智能分类,集全球天文数据开发者,于5月4日(周五)8:30-12:00在北京国家天文台A座一层多功能厅举行决赛答辩,组委会诚挚的邀请你现场观战。