问题标签 [svmlight]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
161 浏览

machine-learning - 从 svnlight 解释结果模型

我想用一个平面将 2 个类的一些点分开,并认为这应该可以使用支持向量机 (SVM)。

所以我设置了以下数据文件(data.txt)用svmlight进行分析:

执行:

不幸的是,我不知道如何解释模型以及如何描述分离平面。

你能帮我吗?

0 投票
2 回答
1632 浏览

java - 如何在 java eclipse 中运行 svm light?

我已经下载了用于在 Java 中运行 svm 的 JNI_SVM-light-6.01-64bit 版本。我尝试过在线搜索,但没有完全弄清楚使用 eclipse IDE for java 运行库的步骤。我要做的就是知道如何提供输入训练文件来训练模型,并提供测试文件以便我得到相应的结果?使用 Eclipse IDE 进行分步说明会非常有帮助。

0 投票
0 回答
725 浏览

r - R:Rsofia 将 sparse.model.matrix 转换为 SVM-light 格式

我有一个 ~ 25kR x 10C 的数据集。有几列包含分类变量中的大量水平。我正在尝试使用 RSofia 包将数据集转换为 SVM-Light 格式,但出现以下错误

我已经使用包成功地将数据集转换为sparse.model.matrix对象,Matrix但很好奇是否可以从sparse.model.matrix对象写入 SVM-Light 格式的文件。

我的代码如下:

运行此代码时出现错误:

有什么建议么?

0 投票
1 回答
256 浏览

python - 如何在 Python 中序列化 CObject?

我已经使用NLTKsvmlightpython 库训练了一个 SVM 分类器,当我调用pickle.dump(my_classifier, outfile, 1)保存我的分类器时,它会抛出这个错误:

我读到我们不能腌制 a CObject,但我没有找到保存工作的解决方案:/

我该如何继续?我使用 python 2.7.3

对于它的价值,对于那些知道的人来说NLTK,当我挑选其他分类器喜欢MaxentClassifierNaiveBayesClassifier反对时一切正常SvmClassifier,我认为这与svmlight库有关,但这是我第一次使用它。

0 投票
0 回答
1135 浏览

svm - SVM 实现中的阈值 b

我正在使用我自己的 SVM 粗略实现,使用 cvxopt 来解决固有的二次规划问题。我是 SVM 的新手。

因为这是我自己的实现,所以我有责任找出边缘支持向量和分离平面的阈值 b。在一个大小合适的(大约 5K 个样本,二维数字输入)数据集上,在一个软 SVM 公式中,我在试图找出边际支持向量时遇到了这个问题。

边距支持向量是小于 C 的非零 alpha。但是,如果我盲目地使用 cvxopt 的 feastol 参数来确定哪些 alpha 可以被视为 C,哪些可以被视为小于 C,我发现阈值 b 来自每个边距支持向量差异很大,有时甚至是惊人的。(理论上,从任何边缘支持向量派生的阈值 b 应该是相同的)

有时临时阈值有效,但有时似乎不可行——也许有一种方法可以巧妙地尝试不同的阈值来获得一些“最少不一致”的 b 集合或类似的集合。

(a) 真正的从业者(或“内部”实现,如 libsvm 或 svm-light 等)在实践中是否遇到过这种情况,或者在我的具体情况下这听起来像错误或实现问题吗?

(b) 如果这在实践中确实是一个问题,如何解决:Burges 的 SVM 教程指出,您只需对从边际支持向量派生的所有阈值取平均值——这也是 matlab 代码中所做的Gunn 的技术报告 ( http://www.ecs.soton.ac.uk/~srg/publications/pdf/SVM.pdf )。这是简单的出路并且在实践中效果很好,这是在 libsvm 或 svm-light 等中完成的吗?或者是否有一些原则性的方法来尝试不同的阈值以获得最小不一致的可接受的阈值集 b ?

0 投票
1 回答
1534 浏览

machine-learning - SVM 灯的训练和测试文件

我正在尝试将 SVM 用于文本分类问题。我发现了一个名为 SVM light 的 SVM 实现及其派生的 SVM 多类(用于超过 2 个类的分类问题)。但是我真的无法理解用于训练和测试分类器的文件格式。我知道我需要创建一个特征向量(让我们假设我将文档中的每个单词作为一个特征)然后对于每个文档我必须指定它的类,它包含的特征(实际上是特征的索引)特征向量)和一个特征值来创建训练文件。我对这个“特征价值”感到困惑。可能是什么?这是本文档中该功能的计数吗?或者是别的什么?该网站包含的示例火车文件没有整数作为特征值,这表明形成特征值的不是频率

另外我想知道是否有一些工具/软件可以从一个简单的文档创建这个训练文件。我通常使用 Java;所以Java中的一些包可以做到这一点对我来说也足够了。我尝试搜索谷歌,但找不到任何相关内容。

我还想知道是否有其他更好的方法可以使用 SVM 进行文本分类。

在这方面的任何帮助将不胜感激。

0 投票
1 回答
1959 浏览

machine-learning - Libsvm 模型文件格式 无型号

我正在使用 libsvm 进行文档分类。我在我的项目中使用 svm.cc 和 svm.h。然后我调用 svm_train。我使用 svm_save_model 将模型保存在一个文件中。

我有类别。svm 模型文件为:

index:value 形式的向量值之前的 1 和 -1 是什么?

0 投票
2 回答
14468 浏览

machine-learning - 使用 SVM light 进行分类的文件格式

我正在尝试使用 SVM light 构建一个分类器,该分类器将文档分类为两个类之一。我已经对分类器进行了训练和测试,并将模型文件保存到磁盘中。现在我想用这个模型文件对全新的文档进行分类。这应该是什么输入文件格式?它可以是纯文本文件(我认为这行不通)还是只是文本文件中存在的特征的简单列表,没有任何类标签和特征权重(在这种情况下,我必须跟踪训练期间特征向量中的特征)还是其他格式?

0 投票
2 回答
34432 浏览

python-2.7 - Python Svmlight Error: DeprecationWarning: using a non-integer number instead of an integer will result in a error in the future

我在我的 Mac OSX Mountain Lion 上运行带有 scikit_learn-0.14 的 python 2.7.5。

但是,我运行 svmlight 命令的所有内容都会收到以下警告:

弃用警告:使用非整数而不是整数将导致错误>将来

0 投票
0 回答
303 浏览

opencv - 使用 SVM 的猪描述符训练

我正在尝试对路标进行分类。出于这个原因,我想使用 SVM 训练 Hog 描述符。我已经为尺寸为 64x64 的训练数据提取了 hog 描述符。正训练数据占整个样本的 60%,负训练数据占 40%。

当我使用opencv的SVM(带有线性内核)进行训练时,一切似乎都很好,但是当我试图预测时,结果失败并且只显示一个类(结果始终为1)。我也尝试将我的数据输入到 SVMlight 中,但所有的底片都被错误分类了。

有什么想法可能是错误的吗?也许是少量的训练数据?(我只是在尝试实现代码,并在不使用训练数据的情况下看到一切都很好)。