NADC面向AI4S的天文数智化服务体系构建与实践系列:LAMOST光谱数据库
发布时间:
2026-04-14 14:20
修改时间:
2026-04-14 14:25
文章类别:
阅读次数:
42


写在前面

天文学已全面步入数据密集型科学发现时代,而人工智能驱动的科学研究(AI4S)范式的兴起,对作为国家战略科技力量组成部分的科学数据中心提出了前所未有的能力提升需求。国家天文科学数据中心(NADC)面对海量异构数据的治理压力、传统数据服务模式的效率瓶颈以及支撑前沿AI4S创新的使命,系统性地规划构建了以“数智化”为核心特征的下一代天文数据服务体系。

最近,NADC提交的学术论文《面向AI4S的天文数智化服务体系构建与实践——以国家天文科学数据中心为例》已被《数据与计算发展前沿》接收录用并在知网优先发表。该刊是由中国科学院主管、中国科学院计算机网络信息中心主办的学术性专业期刊。下面摘录论文的部分内容。论文链接:点击这里。

 

LAMOST遵循国际天文数据开放共享惯例,每年面向全球公开释放脱离保护期的观测数据。2025年9月释放的LAMOST DR11是目前最新的国际释放版本,天体光谱数超2500万条。2026年3月,LAMOST DR13(v1.0 版本)数据集正式面向国内天文学家与国际合作者发布。LAMOST DR13(v1.0 版本)数据集包含光谱总数3082 万余条,这标志着 LAMOST 发布光谱总数首次突破 3000 万条,继续稳居国际上发布光谱数量最多的巡天项目。

NADC为LAMOST构建了分层递进的数智化服务体系,依次涵盖基础服务、IVOA接口、开放API、专用Python工具包及MCP智能服务,既实现了与国际天文数据生态的无缝兼容与互操作,又通过智能化服务降低了天文数据的使用门槛,充分践行FAIR原则与AI-ready理念,为数据的高效复用、深度挖掘及跨学科创新应用提供了标准化、智能化的解决方案。

 

1、基础服务

基础服务以Web门户为核心载体,面向全类型用户提供便捷、直观的光谱数据访问能力,是LAMOST光谱数据库的普惠性服务入口。功能覆盖光谱数据检索、多条件筛选、在线可视化、批量下载及数据说明查询等核心场景,适配科研人员、学生及天文爱好者等不同群体的使用需求。


图1  LAMOST DR11低分辨率光谱在线可视化界面

Low-Resolution Spectra Online Visualization Interface for LAMOST DR11

 

2、IVOA接口

LAMOST光谱数据库构建了标准化的数据访问接口, 全面兼容IVOA核心互操作标准,可被TOPCAT、Aladin、DS9等国际主流天文软件直接调用,同时可与Gaia、SDSS、DESI等国际知名天文数据集实现跨源协同检索。同时,相关服务已完成VO Registry注册,可被全球用户通过VO Registry查找发现。LAMOST DR11支持的IVOA互操作标准及对应用途如表1所示。

表1 LAMOST DR11数据服务支持的IVOA互操作标准
Table 1 IVOA Specifications supported by LAMOST DR11

协议名称 主要用途
VOTable IVOA标准数据交换格式,用于存储和传输LAMOST星表、光谱元数据与观测参数,支持多平台、多软件的数据互通与解析,保障数据结构的标准化与可重用性。
SAMP 简单应用消息协议,用于天文软件的互操作,支持LAMOST数据在TOPCAT、Aladin等主流天文软件间的实时数据共享与协同分析,实现检索结果的跨软件同步可视化。
ConeSearch 天球锥形区域检索协议,支持用户通过指定赤经、赤纬与搜索半径,快速检索目标天区内的LAMOST天体数据。
SSAP 简单光谱访问协议,专门用于光谱数据的标准化检索与访问,返回光谱数据及配套元信息。
TAP 数据表访问协议,支持用户通过天文数据查询语言ADQL语句对LAMOST光谱数据库进行复杂检索,可实现多条件组合筛选、跨表关联查询,满足深度数据挖掘需求。

 

3、开放API(OpenAPI)

面向大规模数据处理、自动化科研流程编排等进阶需求,LAMOST光谱数据库构建了符合OpenAPI 3.0规范的RESTful API集,涵盖数据版本查询、表结构检索、SQL查询、光谱文件下载、光谱参数提取等功能。LAMOST DR11开放的核心API详细信息如表2所示。

表2 LAMOST DR11数据服务支持的核心API访问接口
Table 2 Core API interfaces supported by LAMOST DR11

API名称 功能描述 访问方式 访问地址(URL)
数据版本查询 获取LAMOST所有已公开的数据版本列表 GET请求 https://www.lamost.org/openapi/dr_versions
表数据查询 针对指定数据表执行结构化条件查询 POST请求

https://www.lamost.org/openapi/{dr_version}/

{sub_version}/query/{table_name}

SQL语句查询 支持通过ADQL/SQL语句执行复杂的自定义查询 GET请求

https://www.lamost.org/openapi/{dr_version}/

{sub_version}/sql

星表文件下载 下载指定分辨率光谱的全量星表文件 GET请求

https://www.lamost.org/openapi/{dr_version}/{sub_version}/

{resolution}/catalog

光谱FITS获取 获取指定天体的光谱数据FITS文件 GET请求

https://www.lamost.org/openapi/{dr_version}/{sub_version}/

{resolution}/spectrum/fits

光谱CSV转换 将光谱数据转换为CSV格式 GET请求

https://www.lamost.org/openapi/{dr_version}/

{sub_version}/{resolution}/spectrum/fits2csv

访问地址(URL)参数说明:

* {dr_version}:数据版本号,LAMOST DR11 对应取值为dr11;

* {sub_version}:数据子版本号,如 v2.0;

* {resolution}:光谱分辨率,取值为 lrs(低分辨率)或 mrs(中分辨率);

* {table_name}:数据表名称,需与LAMOST DR11数据字典中定义的表名一致。

 

4、Python工具包(pylamost)

为进一步降低程序化数据处理门槛,适配天文学与数据科学领域的主流开发场景, NADC开发了LAMOST专属Python工具包pylamost,无缝衔接Astropy、NumPy、Matplotlib等天文学与数据科学主流工具包。依托pylamost的核心封装能力与天文场景适配优势,正构建astroquery扩展包,将LAMOST和NADC更多数据服务无缝融入astroquery天文数据统一访问生态。NADC计划今年上半年正式发布astroquery.nadc包,敬请期待!

 

5、MCP智能服务(lamost-mcp-server)

LAMOST MCP Server实现自然语言意图解析、数据查询指令生成、检索结果反馈的全流程自动化,将复杂的数据查询语法、LAMOST数据结构逻辑封装为自然语言可解释的工具能力,形成独立完整的数据检索与结果反馈闭环。

LAMOST天体光谱数据库通过五级服务体系的协同联动,形成了覆盖“普惠性访问-标准化互操作-程序化开发-智能化调用”的全场景服务能力。

截止目前,来自中国、美国、德国、比利时、丹麦等国家和地区的278所科研机构的1900多位用户正在利用LAMOST数据开展研究工作,已发表高质量论文2200余篇,引用20000余次。近年来,LAMOST年均发表论文数超过300篇,其中国外天文学家发表的科学论文占40%以上,充分彰显了 LAMOST 数据开放共享的国际影响力与科学价值。

 

)
Yang Hanxi
(文章编辑:
我们使用cookies为您提供更好的体验。继续使用本网站,即表示您同意按照我们的Cookie 政策使用cookie。
接受