我正在尝试编写 SVM 或 KNN 程序来对文本文档进行分类。我掌握了两者的概念,但我希望看到一些很好的代码示例,专门演示如何将文本/单词表示为向量。有人知道好的教程/文章/讲座/任何带有代码示例的东西吗?即使是我可以自己单步执行的代码也会很好。我最擅长 ruby 和 java,虽然我能理解 python、javascript、c++。我会用任何语言举例。
问问题
1681 次
1 回答
0
这取决于您的 SVM 库输入文件格式。例如,libsvm 文件格式要求每个特征编码为整数,此外,特征索引按升序排列。
更多信息在这里:http ://www.csie.ntu.edu.tw/~cjlin/libsvm/faq.html#/Q3:_Data_preparation
于 2011-10-06T11:12:20.727 回答