摘要:针对Chameleon算法在参数敏感性、噪声鲁棒性及计算效率上的不足,提出一种基于最小生成树与统计特征的层次聚类算法。采用最小生成树构建稀疏图,消除人工参数干预,利用最小生成树的全局最优性避免跨簇伪连接;设计动态统计合并策略,结合局部距离阈值过滤噪声,并通过簇间连通性检验,迭代合并子簇,确保簇内紧密性与簇间分离性。在20个人工数据集与10个真实数据集上的实验表明,SHCA的聚类性能优于对比算法;针对部分数据集表现下降的情况,分析发现流形重叠是主要影响因素。SHCA有效提升了聚类精度与结果稳定性,为后续大规模、复杂流形数据的聚类研究提供参考。