后缀树算法在舆情聚类中的应用
CSTR:
作者:
作者单位:

(1.河北科技大学信息科学与工程学院, 河北石家庄 050018;2.河北经贸大学信息技术学院,河北石家庄 050061;3.河北科技大学教务处,河北石家庄 050018)

作者简介:

彭 静(1970-),女,河北定州人,副教授,硕士,主要从事文本挖掘方面的研究

通讯作者:

中图分类号:

基金项目:

河北省科技支撑计划项目(10213557)


Application of STC algorithm to internet public opinions clustering
Author:
Affiliation:

(1.College of Information Science and Engineering, Hebei University of Science and Technology, Shijiazhuang Hebei 050018, China;2.College of Information Technology, Hebei University of Economics and Bussiness, Shijiazhuang Hebei 050061, China;3.Department of Teaching Affairs, Hebei University of Science and Technology, Shijiazhuang Hebei 050018, China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对网络舆情分析的需求背景,研究了通过后缀树算法发现文本文档之间的公共短语串,按公共短语串实现文档聚类。网页文档的标题和摘要能代表文档的主要思想,应用后缀树算法实现对标题和摘要自动聚类,从而实现舆情信息自动聚类。

    Abstract:

    In answer to the requirement of internet opinions analysis, this paper discusses the STC algorithm for text clustering, in order to discover common phrases that can assign documents and form document clusters. Because web document titles and abstracts can express the main ideas, web document clusters are created by STC algorithm, and clusters of internet public opinions information are created by using this method.

    参考文献
    相似文献
    引证文献
引用本文

彭 静,翟 英,冯 爽.后缀树算法在舆情聚类中的应用[J].河北科技大学学报,2012,33(1):65-68

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2011-06-27
  • 最后修改日期:2011-11-17
  • 录用日期:
  • 在线发布日期: 2013-08-29
  • 出版日期:
文章二维码