2021年总算过去了。虽然疫情还没有结束的迹象,但是人们已经开始习惯新冠环伺的生活。疫情对社会带来的长期影响也在慢慢显现。2021年全世界天文学家提交到论文预印本arXiv上的天文学论文数量只有13243篇,比2020年少了1577 篇(下降10.6%,甚至少于2018年的提交数)。这是自1994年arXiv开设天文学学科分类以来年度提交论文总数的第一次下降。我们在疫情的影响下被迫放慢了探索宇宙的脚步,但并未停止前进,毕竟连推迟了14年的韦布空间望远镜都发射成功了。
图1:arXiv论文提交数量趋势变化
我们统计了这些论文中的热门术语,回顾2021年天文学的热点与主题。根据包含相关术语的论文总数,排名前10的关键术语有:
- 磁场(magnetic field,3616篇)
- 黑洞(black hole,2673篇)
- 恒星形成(star formation,2660篇)
- 数值模拟(numerical simulation,2498篇)
- 暗物质(dark matter,2488篇)
- 银河系(Milky Way,2349篇)
- 星际介质(interstellar medium,1950篇)
- 大质量恒星(massive star,1932篇)
- 中子星(neutron star,1875篇)
- 引力波(gravitational wave,1711篇)
图2:2021天文学热词
如果我们剔除那些只是简单提到这些名词的论文,只考虑在正文中反复提到(大于5次)相关概念的文章,那么排名前10的关键术语可修正为:
- 磁场(magnetic field, 1234篇)
- 活动星系核(active galactic nucleus, 990篇)
- 引力波(gravitational wave, 732篇)
- 能谱分布(spectral energy distribution, 724篇)
- 恒星形成(star formation, 677篇)
- 宇宙微波背景辐射(cosmic microwave background, 676篇)
- 暗物质(dark matter, 674篇)
- 功率谱(power spectrum, 602篇)
- 黑洞(black hole, 582篇)
- 星际介质(interstellar medium, 527篇)
它们在一定程度上代表了天文学的主流方向和热门话题。
排名前十的缩略词分别是:
- 活动星系核(AGN,1589篇)
- 能谱分布(SED,1358篇)
- 信噪比(S/N,1320篇)
- 宇宙微波背景辐射(CMB,1256篇)
- 星际介质(ISM,1072篇)
- 马尔可夫链蒙特卡洛方法(MCMC,1053篇)
- 点扩散函数(PSF,938篇)
- 引力波(GW,879篇)
- 暗物质(DM,823篇)
- 恒星形成率(SFR,741篇)
这些词对于天文工作者来说都是比较熟悉的,因为使用频率高,而全称又比较长,所以大家习惯用缩写代替。如果剔除这类常见(天文名词数据库中已收录)的条目,出现频率最高的五个新缩略词是:
- 暗能量巡天(dark energy survey,DES,268篇)
- 恒星形成历史(star formation history,SFH,246篇)
- 双黑洞(binary black hole,BBH,211篇)
- 卷积神经网络(convolutional neural network,CNN,200篇)
- 双中子星(binary neutron star,BNS,184篇)
而频率上升最快的缩略词当属 “盖娅第三批早期数据”(Gaia early data release 3,EDR3,123篇)。它指的是欧洲空间局天体测量卫星“盖娅”在2020年12月释放的第三批早期数据。得益于其高质量的数据,在一年时间里就有超过一百篇相关论文的热度,产出相当可观。这些文章的发布时间如图所示:
图3:EDR3相关文章2021年发布情况
现代科研论文的写作格式和风格是程式化的,有固定的表达方式和风格。我们也统计了论文中的常用词组,大家看看是不是很熟悉?
- other hand (7809篇)
- right panel (4354篇)
- wide range(3822篇)
- large number(3745篇)
- free parameter(3494篇)
- previous study(3467篇)
- parameter space(3414篇)
- bottom panel(3411篇)
- good agreement(3373篇)
- future work (3266篇)
现代天文学研究方向众多,发展迅速,想要全面了解整个学科的前沿进展变得越来越困难。由于技术条件的限制,本文只做了简单的词频分析和统计。有关这些术语词频的详细信息可浏览页面 https://nadc.china-vo.org/arxivterm/。而要想让机器自动识别热点问题和科研动向,我们还需要新的算法和工具。