2022年天文学研究热门术语:利用arxiv论文的术语提取结果追踪天文学研究趋势
发布时间:
2023-01-09 16:56
修改时间:
2023-01-09 16:56
文章类别:
阅读次数:
2647

2022年,疫情仍没有消失,人们都在努力回到正常的生活之中。但天文学家们的工作效率似乎并没有明显起色。论文预印本网站Arxiv上的天文学论文数量仍在下降,2022年全年共收到13393篇,比2021年的文章数少了1054 篇,下降约7%(今年统计的2021年文章总数为14447,和2022年1月统计的数目13243相差1204篇,怀疑arxiv系统将2022年提交的2021年文章的更新版本也计入在内)。虽然没有大家所期待的触底反弹,但下降的势头无疑有所放缓。随着各国形势逐渐恢复正常,希望天文界的科研交流和产出也能在今年逐渐恢复吧。

图1  近年来arxiv天文学论文数量趋势

 

我们照例统计了这些论文中的热门术语,回顾2022年天文学的热点与主题。根据包含相关术语的论文总数,只考虑在正文中反复提到(大于5次)相关概念的文章,排名前10的关键术语有:

  1. magnetic field(磁场,1271篇)
  2. light curve(光变曲线,972篇)
  3. stellar mass (恒星质量,937篇)
  4. star formation (恒星形成,781篇)
  5. power spectrum (功率谱,665篇)
  6. black hole (黑洞,585篇)
  7. dark matter (暗物质,503篇)
  8. orbital period (轨道周期,400篇)
  9. emission line (发射线,397篇)
  10. neutron star (中子星,392篇)

图2  2022年度关键术语词云

 

排名前十的缩略词和去年类似,这里考虑在正文中反复提到(大于5次)相关缩略词的文章:

  1. 活动星系核(AGN,1061篇),
  2. 能谱分布(SED,831篇),
  3. 引力波(GW,758篇),
  4. 暗物质(DM,739篇),
  5. 宇宙微波背景辐射(CMB,678篇),
  6. 星际介质(ISM,628篇),
  7. 信噪比(S/N,617篇),
  8. 恒星形成率(SFR,594篇)
  9. 黑洞(BH,578篇)
  10. 超新星(SN,472)

今年的焦点无疑是接替哈勃的“韦布”空间望远镜。它在去年12月底成功发射升空,并于2022年7月12日公布首批彩色图像和光谱数据。相应的论文在此后集中发表,形成一个高峰,全年论文总数超过300篇。而作为去年热点的“盖娅”第三批早期数据(EDR3),在2022年6月13日的第三批正式数据(Gaia DR3)释放之后,基于旧数据的论文数明显下降,基于新数据的论文平滑衔接。两个标签加起来也将近300篇。

图3  部分热点数据相关论文年产出数量

 

我们也照例统计了论文中的常见词组,列表如下:

  • other hand (7957篇)
  • right panel (4521篇)
  • upper limit (4409篇)
  • left panel (4124篇)
  • wide range(4011篇)
  • standard deviation (3961篇)
  • large number(3840篇)
  • future work (3545篇)
  • bottom panel(3541篇)
  • free parameter(3539篇)
  • previous study(3424篇)
  • parameter space(3430篇)
  • good agreement(3376篇)

这里统计这些常见词组并不是因为它们很重要。而是由于它们的出现频率实在太高,很难将它们和真正的专业术语区分开来。如何设计算法自动识别术语至今仍是尚未解决的问题,也许机器学习在此也有用武之地。

)
Yang Hanxi
(文章编辑:
我们使用cookies为您提供更好的体验。继续使用本网站,即表示您同意按照我们的Cookie 政策使用cookie。
接受