2023年,人们终于可以回到正常的生活当中,重拾对未来的憧憬。天文研究者的工作也在走出疫情的影响。2023年传到论文预印本网站arXiv上的天文学论文总数第一次超过了此前最高的2020年(共有17283篇,其中以天文为主分类的有14834篇),创下新高,达到17932篇(若只算首个分类为天文的论文,则有15255篇)。其中增长最大的分支是高能天体物理(HE),比前2022年足足多了520篇。
图1 预印本网站arXiv上每年提交的天文学论文总数
我们还统计了第一作者的国别,可以看到美国研究者贡献了超过五分之一的天文学论文,中国研究者以超过十分之一的占比位于第二,英国、德国、意大利等国的文章数比较接近。排名第十位以后的国家也一起贡献了与美国相当的论文数,这可以在一定程度上反映天文学科的国际发展水平。不过还有约7%的论文无法有效地确定国别,主要原因是tex源文件的通讯地址写法多种多样。作者邮箱也不固定,有8.6%的通讯作者留的是gmail邮箱。
图2 第一作者的国家分布
如果按照第一通讯作者的邮箱地址来统计单位,除去gmail这样的商业邮箱之后,排在第一位的是意大利国家天体物理研究所(INAF),有260篇论文作者使用inaf.it的邮箱。其次是中国科学院国家天文台(120篇),美国加州理工(99篇),剑桥大学(92篇),紫金山天文台(91篇),美国亚利桑那大学(91篇),牛津大学物理系(90篇),北京大学(88篇),哈佛史密松天体物理中心(88篇),以及南京大学(86篇)。
如果按照时间查看近20年里的各国天文学家的论文贡献,可以清楚地看到我国天文学研究近年来的飞速发展态势。
图3 各国论文提交数量逐年变化
我们照例统计了这些论文中的热门术语。根据包含相关术语的论文总数,只考虑在正文中反复提到(大于5次)相关概念的文章,排名前10的关键术语和2022年相似:
图4 天文学arXiv论文热门词云
- magnetic field(磁场,1222篇)
- light curve(光变曲线,1016篇)
- stellar mass(恒星质量,1009篇)
- star formation(恒星形成,707篇)
- black hole(黑洞,685篇)
- power spectrum(功率谱,649篇)
- dark matter(暗物质,491篇)
- emission line(发射线,441篇)
- host galaxy (宿主星系,419篇)
- orbital period(轨道周期,402篇)
其中最大的变化是 host galaxy ,从去年的第11位(376篇)跃升至第9位(419篇),而 neutron star从去年的第10位(392篇)掉至第12位(367篇)。如果我们考察相关论文数的和去年的差值,可以得到变化最大的关键字排名:
- black hole, 增加 100篇
- Bayes factor, 增加 74篇
- stellar mass, 增加 72篇
- core mass, 增加 46篇
- binary system, 增加 45篇
- star formation, 减少 74篇
- magnetic field, 减少 49 篇
- kinetic energy, 减少 43 篇
- dark energy, 减少 41篇
- molecular gas, 减少 36 篇
如果我们不用论文数,而采用信息领域的常用指标TF-IDF(频率-逆文档频率指数)指标,考察术语在文章中的出现次数,以及在语料库的出现次数。排名前十的术语则变为:
- flux rope,磁流绳,188篇
- SNe Ia,Ia型超新星,304篇
- Be star, B型发射星,132篇
- dark photon,暗光子,158篇
- sterile neutrino,惰性中微子,132篇
- Sgr A*,人马座A*,200篇
- debris disk,碎屑盘,154篇
- transmission spectrum,透射光谱,221篇
- lens model,透镜模型,159篇
- current sheet,电流片,246篇
统计在正文中反复提到(大于5次)的相关缩略词,排名前十的缩略词如下,基本与去年一致。
- 活动星系核 AGN 1107篇
- 引力波 GW 982篇
- 能谱分布 SED 884 篇
- 暗物质 DM 740篇
- 宇宙微波背景 CMB 710篇
- 信噪比 SNR 683篇
- 黑洞 BH 637篇
- 恒星形成率SFR 607篇
- 星际介质 ISM 604篇
- 超大质量黑洞 SMBH 465篇
此外,我们还人工挑选了一些重点关键词查询它们近两年的相关论文数目变化。可以看出SDSS的影响力仍然很大。Gaia DR3的产出稳步上升。JWST也进入稳定的高产阶段。值得一提的是,2023年6月,多个国际研究团队发表了一系列论文,宣布利用脉冲星计时阵(PTA)找到了纳赫兹引力波存在的证据,引起了广泛关注。
图5 代表性研究计划的论文(1)
图6 代表性研究计划的论文(2)
对于常见的射电望远镜,ALMA和VLA的产出相当,VLBI次之,FAST的影响力还在提升之中。在软件技术方面,近年火热的卷积神经网络(CNN)、机器学习(ML)均已占有一席之地,不过距离MCMC这样的通用算法还有一定差距。Python的应用早已十分广泛,明确提到它的天文论文数堪比JWST和ALMA这样的明星项目。
图7:代表性软件技术相关论文
透过这些数据,我们可以清楚地看到新的设备和技术总是能够带来新的发现。2023年的总结分析就是这些,祝大家在新的一年里取得新的成果和突破。