摘要:文献计量学是使用数学和统计学方法对文献知识单元进行定量分析,以揭示文献内部知识内容。共现分析是文献计量研究中一种常用的分析文献特征项数据关系的可视化方法。根据被分析数据类型数量可分为单重共现分析和多重共现分析。多重共现分析相较于单重共现分析增加了特征项维度,可以对文献知识内容进行深入分析。但是由于被分析特征项维度增加,导致共现网络中节点数量增多,节点间连线重合度和交叉频率过大,降低文献计量可视化效果。因此,目前文献计量共现分析主要以单重共现为主,多重共现分析的可视化效果尚有待提升。 为解决多重共现网络中节点过多、连线密度过大,不利用发现数据的价值,可视化效果较低等问题,引入LDA主题模型,采用空间划分的方法,通过主题聚类将特征项全域的可视化问题转化子空间的可视化问题,并通过子空间叠加实现多重共现分析系统重构,从而完成可视化系统的结构化表达。以SATI文献题录信息分析软件抽取的文献关键词做为实验数据,使用Python构建主题模型对目标文献集合进行主题聚类分析,并使用Ucinet软件对不同主题子空间文献分别进行多重共现分析。结果表明:基于LDA主题模型的多重共现可视化改进方法相较于原多重共现分析可视化方法,在内容呈现等价的前提下,由于缩小了多重共现分析系统的规模,即子空间文献数量与特征词数目,从而降低了共现网络中节点数量和节点间联系密度,使得多重共现可视化系统的结构更清晰,增加了数据的可读性,突出了数据价值,有效提升多重共现可视化效果。