1

我有一个 svmlight 格式的文件,其值如下:

92.91 18256731:1 71729421:1 72329637:1 83328561:1 118265976:1 134892759:1 198163358:1 352348616:1 526943048:1 5.30 102156934:1 134892759:1 198163358:1 254112843:1 262373758:1 512748316:1 526943048:1 22.00 32172600:1 72329637:1 118265976:1 134892759:1 198163358:1 411824213:1 443226486:1 445371412:1 526943048:1

我正在尝试在 h2o 中使用h2o.import_file(fname.svmlight)

h2o 是否支持高维稀疏二元特征?

我是否需要转换某些索引中的散列值才能使其正常工作?

4

1 回答 1

0

你这三行svmlight就像病毒一样!根据topjava进程是尽可能接近800%的CPU(8核机)。经过 45m 的 cpu 努力(5-6 分钟的挂钟),我不得不用kill -9它来恢复我的机器。

即使您的文件类型不受官方支持,我认为它导致机器停机的事实使其成为一个严重的错误,所以我在这里报告了它:https ://0xdata.atlassian.net/browse/PUBDEV-4798

顺便说一句,您可以在此处找到显示使用 smvlight 的单元测试: https ://github.com/h2oai/h2o-3/blob/30f382efac687be3959a253d975cb48c341c92b4/h2o-r/tests/testdir_misc/runit_parser_type.R

于 2017-08-10T09:57:59.450 回答