问题标签 [multilabel-classification]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

750 问题

0 投票

1 回答

3661 浏览

opencv - 如何在opencv中对词袋使用SIFT特征？

我已经阅读了很多关于在对图像进行筛选特征后实现词袋的文章，但我仍然对下一步该做什么感到困惑。我具体做什么？

非常感谢您的指导。

这是我到目前为止的代码。

2015-06-19T00:36:47.980

0 投票

1 回答

285 浏览

scikit-learn - 尽管标签相关性很强，为什么多标签性能结果与独立性能结果相同？

我有一个包含 2 个标签的数据集，我知道这两个标签之间存在很强的相关性。但是，当我使用不考虑相关性的 scikit multilearn 二元相关性时，我得到的结果与考虑这些标签相关性的 Labelpowerset 分类器非常相似？对此有何评论？除了我使用http://scikit-multilearn.github.io/ 我不知道它有多有效？

scikit-learn label multilabel-classification scikit-multilearn

2015-06-27T20:21:32.033

0 投票

1 回答

719 浏览

apache-spark - 在 Apache Spark 中使用随机森林进行多类分类

Apache Spark 的文档(1.4.0) 承诺可以将随机森林（与决策树相同的承诺）扩展到多类分类设置。但是，我找不到使用 RandomForestModel API 的任何方法：

如果在 1.4.0 版本中真的有可能，您能否提供一个正确的方法来做到这一点？

apache-spark random-forest decision-tree apache-spark-mllib multilabel-classification

2015-07-06T10:54:03.803

0 投票

1 回答

1112 浏览

scikit-learn - scikit learn中coverage_error度量的解释

我不了解在 sklearn.metrics 模块中可用的 scikit learn 中如何计算 coverage_error。文档中的解释如下：

coverage_error 函数计算必须包含在最终预测中的标签的平均数量，以便预测所有真实标签。

例如：

根据我的理解，这里我们需要从预测中包含 3 个标签来获取 y_true 中的所有标签。所以覆盖误差 = 3/2，即 1.5。但我无法理解在以下情况下会发生什么：

为什么两种情况下的错误都是一样的？

scikit-learn multilabel-classification

2015-07-09T07:45:18.350

0 投票

1 回答

2013 浏览

scikit-learn - Sklearn：使用 OneVsRestClassifier 和单独构建每个分类器之间的区别

据我所知，多标签问题可以通过 one-vs-all 方案解决，Scikit-learn 将其实现OneVsRestClassifier为分类器的包装器，例如svm.SVC. 我想知道如果我真的训练会有什么不同，比如说我们有一个多标签问题，有 n 个类，每个标签有 n 个单独的二元分类器，从而分别评估它们。

我知道这就像实现一对多而不是使用包装器的“手动”方式，但是两种方式实际上不同吗？如果是这样，它们有何不同，例如执行时间或分类器的性能？

scikit-learn multilabel-classification

2015-07-16T14:18:55.087

0 投票

1 回答

281 浏览

java - Weka 过滤器导致数据丢失

我正在使用 weka 构建随机森林模型。我的数据存储在 MySQL 数据库中。我找不到直接从数据库创建 weka 数据集（“实例”对象）的方法（至少不是一个简单的对象），所以我查询数据库并使用此代码将数据操作到 weka 数据集（实例）：

大多数数据以“数字”形式输入，而我需要一些特征（第一和第二）是分类的（或“名义”，根据 weka 术语）。我尝试使用过滤器将它们转换为标称：

这很好用，但令人惊讶的是，在调试数据集时，一些数据丢失了！

应用过滤器之前：

应用过滤器后：

为什么我失去了第二个属性的值？

java machine-learning classification weka multilabel-classification

2015-08-03T14:32:23.610

0 投票

0 回答

368 浏览

python - 单标签训练集产生多标签输出 scikit-learn one vs rest

我想知道是否有可能使用单个标签训练集来产生多标签输出。

使用修改后的 scikit 学习示例如下。训练集包含许多句子，标记为 London 或 NY。

目前，使用 train 集的结果是 London 或 NY，即使是句子，包括对这两个城市的引用。

有没有办法让算法为包含 London 和 NY 的句子生成两个标签而不接触火车？

python scikit-learn text-classification multilabel-classification

2015-08-14T09:51:34.740

0 投票

3 回答

2264 浏览

scikit-learn - 带有多标签的 sklearn-KNearestNeighbors

我有一个包含特征及其标签的数据集。

它看起来像这样：

我想在这个数据集上训练一个 KNeighborsClassifier。似乎 sklearn 不采用多标签。我一直在尝试这个：

它给了我ValueError: bad input shape

有没有办法可以在 sklearn 中运行多标签分类器？

scikit-learn knn multilabel-classification

2015-08-17T13:40:57.673

0 投票

2 回答

2439 浏览

python - nolearn 用于多标签分类

我尝试使用从 nolearn 包导入的 DBN 函数，这是我的代码：

由于我的数据具有形状 (1231, 229) 和带有形状 (1231,13) 的标签，因此标签集看起来像 ([0 0 1 0 1 0 1 0 0 0 1 1 0] ...,[.. ..]），当我运行我的代码时，我收到了这个错误消息：输入形状错误（1231,13）。我想知道这里可能会发生两个问题：

DBN 不支持多标签分类
我的标签不适合在 DBN 拟合函数中使用。

python multilabel-classification dbn nolearn

2015-08-24T16:26:20.520

0 投票

2 回答

7155 浏览

python - PyStruct - 找不到匹配的签名

我正在尝试使用此处的代码：https ://github.com/pystruct/pystruct/blob/master/examples/multi_label.py

我有 X_train 与 shape(2591, 256)和 y_train 与 shape (2591, 175)。当我运行这个：

我懂了：

当我直接从链接运行代码时，它可以工作（使用他们的数据集）。有谁知道应该是什么问题？

python python-2.7 multilabel-classification

2015-08-30T16:44:16.640

1 2 3 4 5 6 7 8 9 10

问题标签 [multilabel-classification]

Reference