我有兴趣做一个关于文档分类的项目,并且一直在寻找可能对与此相关的文本挖掘中的理论部分有用的书籍,或者描述从训练数据与分类(带有子类别)文档到的过程的文章示例预测文档类别的系统。似乎有一些(相当昂贵的!)标题可用,但这些是会议论文集,其中包含关于较小的非常具体的主题的文章。有人可以从数据挖掘文献中推荐书籍,为文本挖掘项目提供良好的理论基础,特别是文档分类或概述此过程的文章?
问问题
238 次
1 回答
1
Christopher D. Manning、Prabhakar Raghavan 和 Hinrich Schütze 有一本免费的信息检索书。尝试第 13 章 - 文本分类和朴素贝叶斯。
另请参阅 Manning 和 Schütze 的nlp 书籍的配套站点,特别是文本分类章节的链接。
Fabrizio Sebastiani 写了一篇关于文本分类的有用教程 (PDF)和机器学习的文本分类评论论文 (PDF)。
于 2011-03-09T14:33:19.307 回答