我刚刚开始了一个文本分类的应用程序,我已经阅读了很多关于这个主题的论文,但是直到现在我不知道如何开始,我觉得我没有得到完整的图像。我已经获得了训练数据集并阅读了它的描述,并获得了 SVM 算法 (SVM.Net) 的一个很好的实现,但我不知道如何在这个实现中使用该数据集。我知道我应该从数据集的文本中提取特征并将这些特征用作 SVM 的输入,所以任何人都可以告诉我有关如何提取文本特征并将它们用作 SVM 算法的输入的详细教程,然后使用这个算法对新文本进行分类?如果有一个关于使用 SVM 进行文本分类的完整示例,那就太好了。
任何帮助,将不胜感激。提前致谢。