0

我正在尝试开发一个非常简单的程序,用于使用各种算法对文档进行分类和分类。我的问题是,因为我是初学者,所以我找不到好的文章或网站来获取有关如何开始使用它的简单教程。我已经阅读了很少的资源,并且学到了很多东西,但是我阅读的每个文档、站点等都使用不同的技术,它以不同的方式分析问题,提出不同的解决方案等,所以我感到困惑。为了开始实际实施,您可以指出我的任何好的资源吗?

此外,我正在寻找实际的测试数据,特别是分类的文档,以便我可以“提供”我的算法。任何帮助表示赞赏。谢谢。

4

1 回答 1

1

对于 Python,请查看关于文本分类的 scikit-learn 教程。另请参阅其演示脚本,该脚本在20 个新闻组基准数据集上运行数十种不同的文本分类算法(包括朴素贝叶斯和 SVM) 。[免责声明:我合写了这些东西。]

对于 Weka,这里有一个教程

于 2011-11-24T22:32:43.193 回答