问题标签 [svm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Pyml得到的分类器如何使用
我是 Python 中 PyML 的新用户。使用教程,我做了以下事情:
我得到了结果集r
,但我不明白如何使用这个结果集用 Python 对一个全新的实例进行分类。有经验的人可以帮帮我吗?任何建议将不胜感激。
谢谢。
java - 支持向量机/K-最近邻代码示例
我正在尝试编写 SVM 或 KNN 程序来对文本文档进行分类。我掌握了两者的概念,但我希望看到一些很好的代码示例,专门演示如何将文本/单词表示为向量。有人知道好的教程/文章/讲座/任何带有代码示例的东西吗?即使是我可以自己单步执行的代码也会很好。我最擅长 ruby 和 java,虽然我能理解 python、javascript、c++。我会用任何语言举例。
machine-learning - WEKA:属性量表问题
我有一个训练数据集和多个测试集(我在聚类框架中对实例进行分类,因此测试集的实例是动态计算的)。
实例属性有不同的尺度(第一个从 0 到 1,第二个从 0 到 100)。
我的分类器(逻辑回归和 SMO)如何处理他们没有同时拥有整个测试集的事实?
换句话说,如果他们不知道测试集中的最大值是多少,他们如何处理不同的尺度属性?
谢谢
scale - svmlib 缩放与 pyml 规范化、缩放和转换
归一化特征向量以用于线性内核 SVM 的正确方法是什么?
查看 LIBSVM,看起来它只是通过将每个功能重新缩放到一个标准的上限/下限来完成的。但是,PyML 似乎没有提供一种以这种方式扩展数据的方法。取而代之的是,有一些选项可以按向量的长度对向量进行归一化,按平均值移动每个特征值,同时按标准差重新缩放,等等。
我正在处理大多数特征都是二进制的情况,除了少数是数字的。
dataset - 用于测试非线性 SVM 的数据集
我正在实现一个非线性 SVM,我想在一个简单的非线性可分数据上测试我的实现。谷歌没有帮我找到我想要的。你能告诉我在哪里可以找到这样的数据吗?或者至少,我怎样才能手动生成这样的数据?
谢谢,
classification - SVMlight 是否输出分类分数?
我需要知道 SVMlight 是否输出分类分数。我在任何地方都找不到它。我知道例如 libSVM 就可以了。thx
opencv - CvSVM 问题
使用opencv CvSVM的一些问题
它使用什么样的 svm?是否使用 svmlight?OpenCV2.2 有 svmlight,但我找不到太多对它的引用。
如果我使用 CvSVM,我是否需要手动创建 80% 的训练数据和 20% 的测试数据,并迭代 5 倍重新验证以获得更好的输出?
我正在使用 HOG 做一个检测器,我正在密切关注包装中的 opencv 示例行人检测器。我需要学习一个分类器来检测除行人之外的其他物体。任何建议将不胜感激。
谢谢!
machine-learning - 为什么 svm_predict 和 svm_predict_probability 在 java libsvm 中针对异或问题给出不同的结果?
我有一个简单的异或问题,我想在 libsvm 中使用 RBF 内核来学习。当我使用 XOR 问题训练 java libsvm 时,例如:
如果我使用 svm.svm_predict,我对测试向量 (0,0) 进行分类得到的结果为 -1,但如果我使用 svm.svm_predict_probability,则为 +1。甚至返回的概率也是相反的。我使用的代码和结果如下。谁能告诉我我在这里做错了什么?
- - - - - 结果 - - - - - - -
显然结果是完全相反的。这似乎发生在我选择作为测试的任何示例中。
有人可以对此有所了解吗?提前致谢
kernel - 为支持向量机 (XOR) 设计内核
我的问题的核心是“如何为学习问题设计核函数?”
作为一个快速背景,我正在阅读有关支持向量机和内核机器的书籍,并且我所看到的所有作者都给出了内核的示例(多项式内核,同质和非同质,高斯内核,以及对基于文本的内核的暗示等等) ,但要么都提供了结果图片而不指定内核,要么模糊地声称“可以构造一个有效的内核”。当一个人为一个新问题设计一个内核时,我对这个过程很感兴趣。
可能最简单的例子是学习 XOR,一个最小的(4 点)非线性数据集,嵌入真实平面。如何想出一个自然的(和非平凡的)内核来线性分离这些数据?
作为一个更复杂的例子(参见 Cristianini,SVM 简介,图 6.2),如何设计一个内核来学习棋盘模式?Cristianini 说这张图片是“使用高斯核”得出的,但他似乎使用了多个,并且它们以未指定的方式组合和修改。
如果这个问题太宽泛而无法在这里回答,我会很感激参考构造一个这样的内核函数,尽管我希望这个例子有点简单。
opencv - OpenCV HOG 描述符上的 SVMLight
我正在尝试使用 SVM Light 来学习 OpenCV2.2 HOG 描述符的分类器。我从 HOG 描述符中得到一个浮点向量输出。
阅读 SVMLight 文档后,我仍然无法理解输入训练和测试数据的格式是什么。
来自网站的 train.dat 中的一行示例:
在哪里,
有人可以帮忙吗?谢谢!