基于云计算的商业情报采集系统
CSTR:
作者:
作者单位:

(1.河北科技大学信息科学与工程学院,河北石家庄 050018;2.河北省通信建设有限公司,河北石家庄 050021)

作者简介:

许云峰(1980-),男,河北沧州人,讲师,硕士,主要从事网络安全、神经网络等方面的研究

通讯作者:

中图分类号:

基金项目:

河北省科技支撑计划资助项目(10213588)


Cloud-based business intelligence gathering system
Author:
Affiliation:

(1.College of Information Science and Engineering, Hebei University of Science and Technology, Shijiazhuang Hebei 050018, China;2.Hebei Communication Construction Company Limited, Shijiazhuang Hebei 050021, China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    商业情报采集系统不同于传统的搜索引擎系统,情报具有时效性、针对性等特点,传统搜索引擎中的数据分类和聚类技术不能完全满足商业情报采集过程中对时效性和针对性的特殊需求。提出一种商业情报采集解决方案,在云计算环境中采用贝叶斯分类算法和多种网页去重、提取等算法,实现对互联网数据的实时性抓取、分析、分类、聚类,形成对用户全方位立体化的情报本体,抓取的海量数据采用分布式文件系统存储,采集的情报用基于云的数据库CouchDB存储。

    Abstract:

    The business intelligence gathering system is different from the traditional search engine system. The data classification and clustering techniques of the traditional search engine can not fully meet the special needs of timeliness and pertinence in the business intelligence gathering process. This paper presents a solution to business intelligence gathering, by using Bayesian classification algorithm and deleting duplicated web pages algorithms in the cloud computing environment to achieve internet data''s real-time capturing, analysis, classification and clustering, and form the omnibearing and three-dimensional intelligence noumenon of users. The amount of data captured is stored in a distributed file system. The gathered information is stored in the cloud database CouchDB.

    参考文献
    相似文献
    引证文献
引用本文

许云峰,张 妍,赵铁军.基于云计算的商业情报采集系统[J].河北科技大学学报,2012,33(2):161-165

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2011-11-04
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2013-08-29
  • 出版日期:
文章二维码