它按照某种预设的度量来量化数据之间的距离,并将距离用树状图呈现。层次聚类不只提供最终的聚类结果,也能呈现数据点之间的层次关系。
因而,层次聚类非常适合呈现宇宙中的等级化结构。
早在1978年就已被引入天文学领域,用来识别临近星系中的星系群。如今这个算法在天文学的各个分支都有广泛应用。
星系团
星系团既是大尺度结构的结点枢纽,也是星系形成和演化的重要场所。
对于单一天体,以星系间的束缚能作为层次聚类的度量能够将星系团内的子结构直观地显示出来;根据弥散速度平台切割树状图可以方便地识别团成员和子结构。
对于大视场多目标,花树算法综合考虑各节点的特性来决定是否切割分支,极大减少了分析过程中的人工干预。
图1 左图为模拟数据的星系团的树状图;右图为该主干对应的速度弥散轮廓.
只利用恒星的运动学信息,以投影束缚能为度量进行聚类,可以将疏散双星团的结构区分开来。
图3 左图为英仙双星团的树状图.右图为算法给出的两个子团成员的空间分布.