当代天文学是典型的数据密集型科学研究领域。天文大数据构成的数字宇宙为天文学家提供了广阔的挖掘空间,同时也带来很多技术挑战。要想在浩瀚的数字宇宙中精准淘金,信息技术与天文学深度交叉成为必然。近年来,在天文信息技术和信息化领域涌现出一批优秀的青年骨干。贾鹏就是其中一员。2008年,他毕业于南京理工大学光电信息工程专业,2013年在南京大学天文系获得博士学位,同年进入太原理工大学物理与光电工程学院工作。2016-2018年期间,他进入英国杜伦(Durham)大学高等仪器研究中心(CFAI)开展博士后研究,主要研究内容为应用于大口径望远镜的近地层自适应光学系统(Ground Layer Adaptive Optics System)及数据后处理方法。目前,他主要研究方向为融合数据处理方法和仪器设计的智能光学系统,包括以光学系统点扩散函数(PSF)为接入点的各类光学仪器标定和数据后处理方法、基于数字孪生技术的光电系统模拟和状态估计方法和基于科学数据质量的光电系统自主控制方法。
图1:贾鹏在中国天文学会信息化工作委员会2020年工作会议上做报告
2013年博士毕业之后,贾鹏回到了他家乡的太原理工大学。当时,唯一的“战斗伙伴”就是一台工作站和一个办公桌。所幸,工作单位提供的工作站结合虚拟天文台提供的共享数据足以让他利用天文光学技术的最新资料和观测数据,进行数据处理和仪器模拟研究。更重要的是,博士阶段导师的教诲,科研和学术训练,使他注重思考并积累了一定的数学、物理和天文基础。
图2:2016年博士后研究期间,研究设备:一桌、一椅和一台计算机。
大光学望远镜是天文学的观测利器。工作后,贾鹏通过思考发现,随着光学望远镜口径增加及自适应光学、成像光谱仪等新技术的引入,除了天文仪器的观测数据,也让科学家获得了大量仪器测控数据。通过数值模拟,结合测控数据与科学数据进行技术研究,一方面,能加深科学家对仪器的理解,进一步提升仪器性能;另一方面,仪器测控数据可用于科学数据处理,提升数据价值。
在这一思想驱使下,他组建了智能光学成像团队,在光学望远镜和图像处理领域开展了自由探索。针对大气湍流对望远镜的影响,团队成员研究了高速高精度大气湍流模拟方法和基于聚类的大气湍流廓线分类和建模方法,建立了台址测量数据和望远镜性能模拟和估计的通道。点扩散函数(PSF)是光学仪器对点状目标的响应。他们利用深度学习技术,建立了存在大气扰动和望远镜状态误差时,望远镜不同视场PSF的建模方法,并将其用于图像复原和望远镜状态估计。
人类总是在一定先验知识下进行天文观测。
”先验知识“是智能成像中”智能“的重要组成部分,可提升大光学望远镜数据质量。在观测中,一个经验丰富的天文学家,通过观看海量天文图片,能够猜测出模糊前图片的形态。能够实现的原因,可能是一类天文目标相似的物理过程产生相似的图像。在这一假设下,贾鹏带领课题组建立了数据驱动的图像重建方法,即用少量的高分辨率图像作为参考,改善图像质量。
此外,他所带领的小组也实现了一些天文图像自动识别、定位和分割的算法软件。为更好地服务于科学研究和公众科学传播,上述软件已开源,并通过国家天文数据科学中心开放下载。
图3:有噪声及PSF影响时的模糊星系图像(Degraded),原始星系图像(Original),有参考的图像复原结果(GalaxyGAN),几种低参考图像复原结果(DIROL及CycleGAN)。本例中,参考图像较少,本课题组提出的DIROL-P能够提升图像质量,同时不会产生虚假结构。
作为高校教师,研究不仅需要服务学术界,也要能够为高校教学服务。为此,贾鹏将望远镜作为光学设计课程的例子,利用虚拟现实技术(VR)设计了光学设计教学辅助软件,帮助学生形象地掌握光学设计知识。这一工作在第一届全国虚拟现实课件设计大赛上,获得了全国一等奖。
同时,由于多数天文数据可以从互联网免费获得,这就给课堂教学带来了非常好的原始数据。他将天文数据作为数字图像处理、科技文献检索及利用等课程的背景资料和材料,设计了”太原理工大学数据标注平台“等校内教学服务网站,组织学生开展教学科研结合的早期训练,开拓了学生的眼界。
图4:本课题组建立的光学望远镜模拟及虚拟现实互动平台操作截图,可通过虚拟现实设备对望远镜进行直接操作。
随着海量天文观测数据的积累,公众和科学家能够通过国家天文数据科学中心获取这些观测数据。基于这些优质资源,贾鹏和他的智能成像小组也逐渐明确了未来的工作方向:
一方面要利用机器学习和数值模拟技术,考虑将实测数据导入光电系统模拟中,实现望远镜系统的数字孪生,为仪器数据规整和汇集提供条件。另一方面要提升现有智能应用算法的性能,降低人工干预和标记数据的需求,同时提升算法的工程化水平。在数据上云的基础上,将算法转变为服务,为全民普及的科学研究做出贡献。