嗨,我是数据挖掘的新手。我的任务是使用 n-gram 方法对文本文档进行自动分类。
我找不到关于这个主题的合适资源,请帮助我如何继续这个主题,我在哪里可以找到基于 n-gram 分类的教程。
为了我的理解,我需要关于这个主题的 java 源代码。
提前致谢。
嗨,我是数据挖掘的新手。我的任务是使用 n-gram 方法对文本文档进行自动分类。
我找不到关于这个主题的合适资源,请帮助我如何继续这个主题,我在哪里可以找到基于 n-gram 分类的教程。
为了我的理解,我需要关于这个主题的 java 源代码。
提前致谢。
我强烈推荐 Dan Jurafsky 和 Chris Manning的斯坦福在线 NLP 课程。第 4 章讨论 n-gram,但之前的所有章节都提供了很好的背景知识。
斯坦福大学也有一些很棒的开源软件,可用于文本分类,从分词到词性标注。
我在文档中找到了更好的教程