3

我想使用 libsvm 进行分类。我有 9 个训练集,每组有 144000 个标记实例,每个实例具有可变数量的特征。训练一组大约需要 12 个小时(带有概率估计的 ./svm-train )。由于我没有太多时间,我想一次跑多组。我不确定我是否能做到这一点。我可以在不同的终端同时运行所有 9 个进程吗?

./svm-train -b 1 feat1.txt
./svm-train -b 1 feat2.txt
      .
      .
      .
./svm-train -b 1 feat9.txt

(我正在使用 Fedora 核心 5)

4

3 回答 3

7

您可以告诉 libsvm 使用 openmp 进行并行化。看看这个 libsvm 常见问题解答条目:http ://www.csie.ntu.edu.tw/~cjlin/libsvm/faq.html#f432

于 2010-07-21T17:06:04.860 回答
3

正如亚当所说,这取决于您的系统有多少内核和处理器可用。如果这还不够,为什么不启动几个 EC2 实例来运行呢?

Infochimps MacchetEC2 公共 AMI 附带您需要的大部分工具:http: //blog.infochimps.org/2009/02/06/start-hacking-machetec2-released/

于 2010-03-11T14:25:21.303 回答
2

是的。但除非您拥有多核或多处理器系统,否则它可能不会为您节省那么多时间。

于 2010-03-10T15:38:45.097 回答