1

我正在尝试使用LibShortText,但我并不完全了解它是如何工作的。

README看来,它的功能是针对文本文件的。但是,我需要对已经是 LibSVM 格式的文件进行分类,所以我认为函数就像text-train.py并且text-predict.py不会......?

README还指出:

If a preprocessor directory is given instead, then it is assumed that the 
training data is already in LIBSVM format.

有谁知道什么preprocessor directory是...?

LibShortText 文档中,我看到有一个“中级分类模型 - 学习者”适用于我的文件。但是,我不明白它是如何工作的!例如,它没有 LIBSVM 所具有的所有参数......而且我还没有成功找到如何保存或理解结果(权重和预测在哪里?)。

如果有人能解释这件事的话,我会非常感激(我已经测试了好几个小时了)......谢谢!

4

1 回答 1

1

根据文档(http://www.csie.ntu.edu.tw/~cjlin/libshorttext/doc/libshorttext.html#quick-start),您可以使用 -A 选项附加 .svm 文件。

但是,如果您已经获得了 libsvm 格式的数据,则可以直接使用 liblinear(libshorttext 底层库)。

如果你有一个 libshorttext 的发行版,你就已经有了 liblinear。您可以通过 cd'ing 编译和运行(从您解压 libshorttext 的任何地方),如下所示:

$ cd libshorttext/classifier/learner/liblinear $ make $ ./train train_file.svm $ ./predict test_file.svm model_file output_file

这里的参考是 liblinear README:https ://github.com/ninjin/liblinear/blob/master/README ,我发现它非常方便。

于 2014-03-10T21:02:01.933 回答