machine-learning - 对 LibSVM 格式的文件使用 LibShortText

Question

我正在尝试使用LibShortText，但我并不完全了解它是如何工作的。

从README看来，它的功能是针对文本文件的。但是，我需要对已经是 LibSVM 格式的文件进行分类，所以我认为函数就像text-train.py并且text-predict.py不会......？

README还指出：

If a preprocessor directory is given instead, then it is assumed that the 
training data is already in LIBSVM format.

有谁知道什么preprocessor directory是...？

从LibShortText 文档中，我看到有一个“中级分类模型 - 学习者”适用于我的文件。但是，我不明白它是如何工作的！例如，它没有 LIBSVM 所具有的所有参数......而且我还没有成功找到如何保存或理解结果（权重和预测在哪里？）。

如果有人能解释这件事的话，我会非常感激（我已经测试了好几个小时了）......谢谢！

score 1 · Accepted Answer

但是，如果您已经获得了 libsvm 格式的数据，则可以直接使用 liblinear（libshorttext 底层库）。

如果你有一个 libshorttext 的发行版，你就已经有了 liblinear。您可以通过 cd'ing 编译和运行（从您解压 libshorttext 的任何地方），如下所示：

$ cd libshorttext/classifier/learner/liblinear $ make $ ./train train_file.svm $ ./predict test_file.svm model_file output_file

这里的参考是 liblinear README：https ://github.com/ninjin/liblinear/blob/master/README ，我发现它非常方便。

1 回答 1