问题标签 [svmlight]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 在 Gate Tool 中加载 SVM 学习配置文件时出错
我是机器学习的新手。当我尝试通过门学习时,它显示了一些错误。学习配置文件如下。
训练属性在这个文件中。当我在没有包含多类 xml 标记的行的情况下进行训练时,它正在工作。添加此行时,显示如下错误
我不知道这件事以及它发生的原因并寻求解决方案。
matlab - SVM:one_vs_rest 错误
我使用 libsvm 进行 SVM 分类,并使用 one-over-rest 方法。问题是当我运行以下命令时,我发现“准确度”的值并非都是实数,其中有 NaN。谁能告诉我如何解决这个问题?太感谢了!
“准确度”中有一些奇怪的值:
matlab - SVM:为什么只计算前两列特征
我在网上找到了一个 SVM 示例。我不明白为什么只计算前两列特征。数据集是著名的“spiral_Nc10_train.mat”和“spiral_Nc10_train.mat”。“spiral_Nc10_train.mat”包含 1) 数据 = 1000*3 双倍;2) 标签 = 1000*1 双倍。“spiral_Nc10_test.mat”包含 1) 数据 = 500*3 双倍;2) 标签 = 500*1 双倍。原始代码的一部分如下所示:
我尝试将第 2 行和第 8 行更改为以下内容:
但是结果是错误的,最终的预测标签也是错误的。谁能告诉我为什么 SVM 只能应用于 2 列功能?太感谢了!
c++ - 如何使用 svmlight 模型文件使用 C++ 检测 opencv 中的对象
我正在使用 OpenCV 、 C++ 并尝试检测图像中的对象。直到现在我所做的。
1.从小图像(108x64)补丁中,我提取了所需的 6200(来自一个补丁)特征。然后我在 svmLight 格式的 train.txt 和 test.txt 文件中编写了这些功能。
.2然后我将 train.txt 给 svmLight 并得到模型文件。使用这个模型文件,我可以测试大约 90% 的分类准确度。到目前为止,我已经在 Ubuntu、OpenCV 和 C++ 中完成了。它是命令行培训和测试。
3.现在我想使用训练期间生成的模型文件从原始图像(480x640)中检测对象。
但问题是我不知道如何使用模型文件从原始图像(640x480)中检测对象。我想要非常基本/基本的东西,即如何使用此模型文件进行检测,使用简单的滑动窗口(108x64)和 svmLight 或(LatentSVM 或 cvSVM)。请不要告诉我我应该调整原始图像(图像金字塔)的大小以获得良好的准确性,我应该使用 ADM(主动可变形模型/蛇)。不要告诉我关于局部最大值抑制以删除额外的矩形框。只需告诉我如何检测(逐步完成实现)并获得矩形框。先谢谢了,等待专家回复。
machine-learning - SVM-Light 显示损坏的精度/召回结果
我运行 SVM-Light 分类器,但它输出的召回/精度行似乎已损坏:
我应该配置什么以获得有效的精度和召回率?
svm - 如何表示 LIBSVM 的分类特征
我有一个可以有 3 个值的属性。我的线应该是
machine-learning - 使用 SVM Rank 试验 OHSUMED 数据集
我正在尝试使用 OHSUMED 数据集和 SVM Rank 库来学习 RankSVM,如以下链接中所述: http ://research.microsoft.com/en-s/um/beijing/projects/letor/Baselines/RankSVM-Struct.txt
我使用了与链接建议的 OHSUMED 数据集相同的参数。IE
OHSUMED/QueryLevelNorm/cv_l1_e0.001/fold1_l1_c0.0002_e0.001.log OHSUMED/QueryLevelNorm/cv_l1_e0.001/fold2_l1_c0.002_e0.001.log OHSUMED/QueryLevelNorm/cv_l1_e0.001/fold3_l1_cl1_eED0/QueryLevelNorm1_cv0.01_e0.001 .001/fold4_l1_c0.02_e0.001.log OHSUMED/QueryLevelNorm/cv_l1_e0.001/fold5_l1_c0.01_e0.001.log
但是当我训练我的模型并运行“svm_rank_classify”命令时,我得到以下结果:
阅读模型……完成。
阅读测试示例...完成。
对测试示例进行分类...完成
运行时间(无 IO)以 cpu 秒为单位:0.00
测试集上的平均损失:0.3864 测试集上
的零/一错误:100.00%(0 正确,22 错误,总共 22)
注:损失上面报告的是
所有排名中平均交换对的比例。零/一错误是完全正确排名的一小部分!
交换对总数:31337
平均交换对百分比:38.64
请建议如果我在这里缺少任何步骤?
谢谢。
weka - 带有概率估计的 SVM
我有一个用 SVM 解决的二元分类问题。训练数据中的类是不平衡的。我现在需要获得后验概率输出,而不仅仅是二进制分数。我尝试通过 Weka 的 SMO 和 LibSVM 使用 Platt 缩放。对于这两种实现,我得到的结果,就少数类的 f1 度量而言,比我只生成二进制结果时更糟。
您是否知道将 SVM 二进制结果转换为保持下一条规则的概率的方法:“当且仅当决策值 >= 0 时,概率 > = 0.5”。
这意味着在使用二元分类或概率时,每个样本获得的标签是相同的。
machine-learning - SVMlight 输入格式中关系提取的建模特征
我目前正在从事一个专注于从维基百科文本语料库中提取关系的项目,我计划使用 SVM 来提取这些关系。为了对此建模,我计划使用以下论文中提到的 Word 特征、POS Tag 特征、Entity 特征、Mention 特征等 - https://gate.ac.uk/sale/eswc06/eswc06-relation.pdf(第 6 页起)
现在,我已经建立了特征提取的管道并对语料库进行了注释,我希望使用像 SVM-Light 这样的包来完成项目。根据 SVM-Light 包的输入文件格式,这是必需的格式 - .=。: : ... : #
示例(来自 SVM-Light 网页)-
在分类模式下,目标值表示示例的类别。+1作为目标值表示正例,-1分别表示负例。所以,例如,这条线
-1 1:0.43 3:0.12 9284:0.2 #abcdef
指定一个负例,其中特征编号 1 的值为 0.43,特征编号 3 的值为 0.12,特征编号 9284 的值为 0.2,所有其他特征的值为 0。此外,字符串 abcdef 与向量一起存储,它可以作为为用户定义的内核提供附加信息的一种方式。
现在,我想知道我们如何将我正在使用的特征(其值包括单词、POS 标签和实体类型和子类型)建模到 SVM-Light 包接受的特征向量中,其中每个特征都有一个与它。从我选择的功能到这些实际值的映射是如何完成的?
如果以前曾解决过类似问题的人能在正确的方向上刺激我,那将是非常有帮助的。
谢谢。
machine-learning - SVM-rank 查询级特征
我想知道查询级功能(例如查询中的术语计数)如何有用?因为,在生成模型文件时会忽略查询级特征。
培训档案;
在这个文件中,第一个特征是查询级别的特征,它在相同的查询中是相同的——不同的项目对。
它已经通过 SVM-rank 训练。然后,生成的模型文件忽略第一个特征,并从第二个特征开始。
生成的模型文件;