摘要:针对密度峰值聚类算法选择密度峰值点困难以及误分配的问题,基于流形的连通性,本文提出了一种改进的密度峰值聚类算法。首先,通过使用三支密度峰值聚类算法,得到初始聚类结果与簇的边界点。再根据这些边界点之间的连通性来判断初始聚类之间的连接情况,并利用这些信息来进行聚类结果的融合。重复上述过程,并在每一次迭代中,在剩余的数据里寻找密度峰值候选点,并将其纳入聚类过程。最终得到一种对流形数据友好的聚类算法。结果表明,本算法在人工数据集和真实数据集上均有较好的表现,其聚类准确度相较现有算法更高,可以在不计算路径距离的前提下,有效识别流形数据,大大降低了计算成本。