问题标签 [svmlight]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
92 浏览

performance - 性能 SVMlight 多标签分类(特征:1000)

我目前正在研究多标签分类。作为分类器,我使用 SVMlight 并将多标签问题二值化。这意味着在我的情况下超过 1000 次分类运行。

我有一个 1000 的固定特征大小,模型的训练现在需要 3 天以上(2 GHz Intel Core 2 Duo,8 GB)。有没有人经历过通常需要这么长时间,或者你能给我任何建议来提高性能吗?你认为换成高性能机器会产生很大的影响吗?

提前致谢!

0 投票
1 回答
70 浏览

machine-learning - svm_light 错误“功能必须按递增顺序”

输出自svm_learn train.dat model.out

由于某些未知原因,svm_light 大约每 500 行的功能顺序存在问题。我已经通过排序功能对这些功能进行了排序,但无法弄清楚它失败的原因。

train.dat这是我的文件围绕有问题的行(第 4 行)的摘录:

0 投票
1 回答
1538 浏览

python - svmLight 格式中的每一项是什么意思

我对每个部分在 svmLight 数据格式中的含义感到非常困惑。例如:

(标签/目标,[(特征,值),...],查询ID)

标签是否表示数据的排名,而queryid是对象的id?

例如:对于以下项目:

2 qid:1 1:4.000000 2:2.772589 3:0.266667 4:0.258154 5:37.330565 6:11.431241 7:37.307017 8:1.213630 9:21.342267 10:10.842279 11:15.634736 12:2.749495 13:-39.467448 14:-37.791635 15: -38.002289 16:14.000000 17:5.634790 18:0.063927 19:0.063290 20:28.303065 21:9.340024 22:24.809801 23:0.231553 24:52.396216 25:1.692954 26:16.619600 27:2.810583 28:-45.733775 29:-44.612550 30:-44.823263 31:18.000000 32:6.579251 33:0.076923 34:0.076079 35:27.701632 36:9.139690 37:23.819476 38:0.277200 39:67.283604 40:1.847508 41:19.559974 42:2.973485 43:-44.687666 44:-43.467574 45:-43.302044 #docid = 346319

2 是否表示对象的等级/目标值?那么qid或docid对文件意味着什么?

谢谢!

0 投票
1 回答
717 浏览

azure - Azure 机器学习 Web 服务输入数据问题

我创建了一个 Azure ML Web 服务作为示例,但在部署 Web 服务时遇到了未知错误。该错误没有任何解释,因此很难追踪。

在工作室中运行实验时,实验运行没有任何问题。但是,当部署到 web 服务时,测试功能失败,输入与工作室中相同。

我还发布了该服务的示例,以查看是否有人可以看到问题所在。

https://gallery.cortanaintelligence.com/Experiment/mywebservice-1

有关该服务的一些信息:

该服务将输入作为代表 svmlight 格式的稀疏特征向量的字符串。它将返回输入特征向量的预测类。从部署的服务运行测试功能而工作室中的实验正在运行而没有任何问题时,该错误会失败。

希望任何人都知道它是如何出错的。

0 投票
1 回答
479 浏览

machine-learning - svm 预测文件中大于 1 的值

我正在使用svm light来训练二进制分类模型。使用该模型,我测试了一些示例。我很惊讶地看到预测文件的输出,它包含大于 1 和小于 -1 的值。我认为范围是[-1,1]。难道我做错了什么?

0 投票
1 回答
1099 浏览

python - 为什么来自 xgboost 的 Dmatrix 加载 svm 轻文本文件的速度如此之快

我使用 svm light 文件作为稀疏矩阵的存储。

测试表明,对于具有 570601944 个条目的 31700108x54070 矩阵

用了 21 秒,比

用了7分钟。

在破解代码之前,任何人都可以帮我回答这个问题吗?

您对提升 load_svmlight_file 功能有什么建议吗?

非常感谢!

0 投票
0 回答
193 浏览

svmlight - SVMLight:“模型文件的版本与 svm_classify 的版本不匹配!”

我已经安装了最新版本的 SVMLight (V6.02)。我可以使用 svm_learn 轻松创建模型,但是当我使用 svm_classify 进行分类时,我得到以下信息:

这对我来说有点令人沮丧,因为这两个都在几周前工作。我在这里进行了全新安装,并且 svm_learn 和 svm_classify 都将 V6.02 显示为工作版本。

有什么想法吗?我完全被难住了。

0 投票
1 回答
360 浏览

r - 将 text2vec dtm 写入文件(csv 或 svmlight)

我今天遇到了 text2vec 包,这正是我解决特定问题所需要的。但是,我无法弄清楚如何将使用 text2vec 创建的 dtm 导出到某种输出文件。我的最终目标是使用 text2vec 在 R 中生成特征,并将生成的矩阵导入 H2O 以进行进一步建模。H2O 可以读取 CSV 或 SVMLight 格式。

我创建的第一个是987753 x 8806 sparse Matrix of class "dgCMatrix", with 3625049 entries,所以它很大。无法使用 as.matrix() 将其写入 CSV,因为它太大了。我认为我可能能够轻松地将其写成 SVMLight 格式,但一直无法找到可以工作的库。任何人都有任何其他选项可以将此输出转换为我可以读入 H2O 的文件?

0 投票
1 回答
523 浏览

r - 使用 svmlight 在 h2o 中读取稀疏数据

我正在尝试将 SVMLight 格式的数据集读入 h2o。将其写入磁盘上的文件并读回工作正常,但直接从 R 的内存中读取则不行。我想知道是否有不同的函数或调用我在下面使用的函数的不同方式。

这是一个例子R 3.3.3, h2o 3.10.3.6

0 投票
2 回答
307 浏览

c++ - 如何在 C++ 代码中使用 SVM Light?(可能无需从 C++ 代码调用可执行文件)

我必须在我的 C++ 代码中使用工具 SVM Light。我编译并将 SVM Light 链接到我的代码,如http://svmlight.joachims.org/ 但现在我该如何调用

例如从我的 C++ 代码而不是从命令行?即在原始代码中

我得到了 svm 模型。我现在如何从我的 C++ 代码中获得相同的模型?最好从我的 C++ 代码中调用一个函数,而不是从命令行调用可执行文件?(可能是我被迫使用系统或类似功能从我的 C++ 代码中调用 C 对象代码(可执行文件)......是这样的吗?)

(我在 Linux 上使用 C++11 编译器)提前致谢