2

嗨,我是数据挖掘的新手。我的任务是使用 n-gram 方法对文本文档进行自动分类。

我找不到关于这个主题的合适资源,请帮助我如何继续这个主题,我在哪里可以找到基于 n-gram 分类的教程。

为了我的理解,我需要关于这个主题的 java 源代码。

提前致谢。

4

2 回答 2

3

我强烈推荐 Dan Jurafsky 和 ​​Chris Manning的斯坦福在线 NLP 课程。第 4 章讨论 n-gram,但之前的所有章节都提供了很好的背景知识。

斯坦福大学也有一些很棒的开源软件,可用于文本分类,从分词到词性标注。

于 2013-11-13T08:58:21.913 回答
2

我在文档中找到了更好的教程

http://textcat.sourceforge.net/README.txt

http://textcat.sourceforge.net/doc/index.html

于 2013-11-18T11:00:02.907 回答