237年前的1781年3月13日晚,英国天文学家赫歇尔像往常一样,用自制的15厘米口径反射望远镜观测星空,他注意到双子座附近有一颗星图上查不到的星星,改用900多倍的目镜再次观测之后,赫歇尔肯定了这不是一颗恒星,而是一颗行星——天王星。
天文学是一门历史悠久的科学,随着科学技术的发展,天文观测和数据共享能力不断实现跨越式发展,不论是天文学家还是普通民众,每个人都有可能成为下一个赫歇尔。
2月6日,国家天文台-阿里云天文大数据联合研究中心启动了“天文数据挖掘”天池大赛,面向公众开放天文科学探索课题,为选手提供云计算、人工智能技术,分析望远镜收集的真实天文数据。
“我从小就对天文很感兴趣,大学报考了航空航天专业,就是希望能够在有限的生命里探索无限的宇宙。” 正如一名选手所说,这次大赛给了普通人一个近距离接触天文数据的圆梦机会,借助互联网新技术,“民间天文科考队”的阵容越来越强大。
截至3月12日初赛结束,全球共计近千支队伍报名参赛,覆盖中国大陆、中国香港、中国台湾、美国、澳大利亚等多个国家和地区。
本次大赛以郭守敬望远镜(LAMOST)巡天光谱分类为课题,通过阿里云天池数据众智平台征集高效、高准确率的自动化算法,解决这个天文研究中的实际问题。有意思的是,选手中很多都是第一次接触天文光谱数据,并且四分之一是普通公司职员,借助国家天文台与阿里云提供的数据开放平台,更多人可以尝试接触天文科研、机器学习等新领域。
虽然我国专业从事天文工作的科学家仅有不到3000人,但普通民众中不乏天文爱好者。作为国内首个参与天文科研的云计算厂商,阿里云早在2016年10月就与国家天文台达成了战略合作,将LAMOST 、FAST等天文观测数据同步到云端的虚拟天文台开放给大众。
3月16日,大赛将进入复赛阶段,阿里云将为参赛选手提供机器学习PAI平台,其支持主流的深度学习框架,包含tensorflow、caffe、MXNET。PAI可以通过托拉拽的方式,实现算法组件的拼接,并提供完整的数据挖掘链路,背靠的阿里云分布式计算引擎可支持百亿特征千亿样本的数据并行化计算,为复赛选手提供强大的计算支撑。