基于最大熵算法的全文检索研究
CSTR:
作者:
作者单位:

(河北科技大学信息科学与工程学院,河北石家庄 050018)

作者简介:

张立岩(1970-),女,河北藁城人,讲师,硕士,主要从事分布式应用开发方面的研究

通讯作者:

中图分类号:

基金项目:


Rsearch of Chinese full text information retrivial system based on maximum entropy principle
Author:
Affiliation:

(College of Information Science and Engineering,Hebei University of Science and Technology,Shijiazhuang Hebei 050018,China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    全文检索是一种有效的信息检索技术,改进最大熵模型的应用研究在自然语言处理领域中受到关注。笔者利用语料库中词性标注和词频标注的上下文信息,建立基于互信息的最大熵方法的检索系统,研究的重点在于提出一种中文分词算法,并从实际问题出发,采用面向对象和模型驱动的设计方法,将该算法应用于实际的全文检索系统的设计中。

    Abstract:

    Chinese full text information retrivial is one of the efficient technologicies of information retrivial,and a lot of researches have been made on the application of the maximum entropy modeling in the natural language processing during recent years. This paper presents a retrivial system based on maximum entropy principle. The context of speech tagging and word frequencytagging included in database are considered,and Chinese word segmentation algorithm is put forward.By adopting object-oriented and the model driven programming method the algorithm can be used in a system design.

    参考文献
    相似文献
    引证文献
引用本文

张立岩,吕 玲,王井阳.基于最大熵算法的全文检索研究[J].河北科技大学学报,2009,30(2):112-115

复制
分享
相关视频

文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2009-03-09
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2013-08-19
  • 出版日期:
文章二维码