我有两个不同的文件夹,一个用于正类,另一个用于负类。每个文件夹都包含一组文档。是否有任何实用程序可以将此训练数据集转换为 LibSVM 格式?
问问题
104 次
1 回答
2
您可以使用 scikit-learn 编写一个 python 脚本来执行此操作。您可以使用以下实用程序:
load_files加载文本文件,
TfIdfVectorizer提取文本特征作为
scipy.sparse
内存矩阵,dump_svmlight使用 svmlight 格式将生成的稀疏矩阵保存在磁盘上。
于 2012-10-04T10:13:21.010 回答