近日,郭守敬望远镜(LAMOST)数据发布系统被评为“2018年度中国科学院信息化优秀案例”。
中科院为“年度信息化优秀案例”颁发的荣誉证书
关于LAMOST
国家重大科技基础设施郭守敬望远镜(LAMOST,大天区面积多目标光纤光谱天文望远镜)是世界上光谱获取率最高的望远镜,在大规模光学光谱观测和大视场天文学研究方面,居于国际领先的地位。
LAMOST第六次释放数据(LAMOST DR6)共包括4902个观测天区(天区覆盖图如图1),发布1125万条光谱,低分辨率光谱总数991万,中分辨率非时域光谱数据50万,中分辨率时域数据84万。其中DR6高质量光谱数(S/N>10)达到了937万条,约是国际上其他巡天项目发布光谱数之和的2倍。同时,DR6发布数据中还包括一个636万组恒星光谱参数星表,成为目前全世界最大的恒星参数星表。更多更好的科学结果即将呈现。
LAMOST先导巡天和正式巡天六年的天区覆盖图
然而,海量增长的科学数据需要匹配行之有效的管理系统才能更高效地发挥其在研究工作中的作用。为此,国家天文台信息与计算中心中国虚拟天文台团队为LAMOST设计开发了数据发布系统。
该系统在用户权限管理、开放应用接口、使用界面优化、云服务整合、数据检索、数据融合、在线数据分析、国际化开放共享等方面进行了全面创新,通过信息化手段大大推进了科研及项目管理工作。
系统特点
1.界面简洁,所见即所得
检索界面可查询数据库中的所有项目;界面中每一单项都有对应的帮助文档描述其功能,用户在不清楚其意义时点击标题即可查看;查询结果排序、文件下载,简单点击即可实现。
2.打通系统与云平台的通道
检索结果可直接导入到天文领域云存储上,用户通过其在云平台上的虚拟机即可使用,并在线处理光谱文件及星表。
3.数据融合,获取天体更多信息
LAMOST只有光谱数据,而天文学家想要了解其更多特性,还需要与天体在光学、红外、紫外、射电等其它类型数据进行数据融合。在每一版本的数据释放前,数据发布系统都预先做好40余个常用星表与LAMOST数据的融合工作并提供检索服务,使天文学家更高效地开展科研工作。
2018年4月25日,欧空局发布了GAIA卫星第二版观测数据。数据发布系统先期就主动做好了准备,在数据释放的第一时间对数据进行镜像,并将LAMOST最新的数据与其进行了融合。这极大方便了天文学家的工作,已协助产出了一批新的成果,得到天文学家的好评。
4.在线数据分析,自如处理更便利
为了方便天文学家和其他用户快速查看某个目标的光谱,发布系统提供了基于HTML5的在线光谱查看功能。通过检索系统找到特定的目标之后,就可以直接在浏览器中对光谱进行显示和分析。即使在手机上也可以很方便地查看光谱曲线和数据。除查看缩略图外,用户还可以放大、缩小光谱曲线,查看光谱基本信息及分类、修改红移值、自定义光谱发射线及吸收线,寻找自己需要的光谱特征。
5.全新权限管理及授权机制,数据可控开放
根据国际惯例,郭守敬望远镜数据首先面向国内合作用户开放,18个月后将面向国际公开发布。至今,郭守敬望远镜数据发布系统已经实现了4个版本数据的国际公开,当前还有2个版本数据在面向国内发布中。
6.系统加入令牌(Token)机制,实现了应用接口的开放,更好地支持用户扩展功能
每个用户在获得授权之后,都会得到一个令牌,通过该令牌即可使用Python、Java等语言调用系统的服务,从而实现LAMOST数据系统与用户现有软件的无缝整合,方便科学家的批量数据分析工作,大大提高了科研效率。
7.开放共享,数据传播、使用国际化
数据发布系统实现了国际虚拟天文台联盟制定的锥形检索、光谱检索等数据访问协议。国际用户可以在国际虚拟天文台联盟相关平台上搜索到LAMOST服务并访问已公开的数据,也可方便地与其他遵守虚拟天文台协议的软件协同工作。拓宽了LAMOST数据的传播、使用渠道,实现了LAMOST数据的国际化开放共享。
8.增值数据服务,促进深化研究
部分使用了LAMOST数据发表的工作会在LAMOST星表产品的基础进行进一步的处理,比如根据其他星表信息为LAMOST观测目标加上天体自行数据,这些数据最后会生成一个增值星表。LAMOST产生的增值星表,也都统一在LAMOST数据发布网站上进行发布,以方便其他研究者参考及深化研究工作。
应用成效
郭守敬望远镜数据发布系统以信息化的技术手段有效促进科研的进行,同时为科研管理提供了便利。截至2018年底,LAMOST专业用户已达到867人,囊括了中国所有的天文研究、教学单位。根据LAMOST用户政策,部分国外科研人员在有国内合作者的情况下也获利访问保护期内数据的授权。精心设计的用户权限控制系统很好地为这些合作用户提供了服务。国际虚拟天文台协议的实现,也吸引到了一批非LAMOST合作用户对公开数据进行研究,实现了数据的国际化开放共享。
LAMOST DR5数据发布系统首页
截至2019年4月,LAMOST数据发布系统已为科学用户提供了1,067,719次检索服务,以及近60TB的数据下载流量,产出了近400篇科学论文。其中,2018年度,系统访问达到68,727人次,产生数据检索36,572人次,数据在线下载超过10TB,产出SCI论文114篇,科学成果节节攀升。
培训与支持
2018年度,中国虚拟天文台研发团队为LAMOST用户进行了多次使用培训,并基于LAMOST-GAIA交叉证认工作很好地支持了LAMOST-GAIA研讨会。
LAMOST光谱在线分析界面
此外,还在微信群及E-mail对用户反馈进行了快速反馈,得到用户的好评。贵州大学等单位专门邀请系统开发人员对相关科研人员进行了专题培训,并对多个课题的开展进行了探讨。
亮点与展望
LAMOST数据发布系统完善的用户权限管理机制,成功保护了国内天文学家对数据的优先使用权。通过虚拟天文台数据访问协议的实现,进一步拓宽了LAMOST数据的传播、使用渠道,实现了公开数据的国际化开放共享。发布系统在开放应用接口、在线数据分析等工作也大大地促进了天文学家工作的信息化。China-VO还积极把LAMOST公开发布的数据向国际同行推荐,多批数据已被法国斯特拉斯堡天文数据中心(CDS)的VizieR系统收录,提升了国产数据的国际影响力。
系统还在GAIA DR2数据公布的第一时间就对其进行了国内镜像,并将LAMOST数据与之进行数据融合。不仅让国内天文学家更快捷便利流畅地利用 GAIA 数据获取科研成果,更拓宽了国内外天文学家的研究思路,并已开始在多个领域产生深远的影响。
该系统的成功应用,推动南极AST3望远镜、北京-亚利桑那巡天等项目也将其数据发布工作交予中国虚拟天文台研发团队实施。研发团队还基于LAMOST的数据管理经验,对数据归档标准、文件格式标准、数据质量管理等内容进行经验总结和标准化,这些都将帮助各数据系统以更加优化的功能和清晰的界面,最大化发挥其在科研工作中的效用。