问题标签 [multilabel-classification]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3661 浏览

opencv - 如何在opencv中对词袋使用SIFT特征?

我已经阅读了很多关于在对图像进行筛选特征后实现词袋的文章,但我仍然对下一步该做什么感到困惑。我具体做什么?

非常感谢您的指导。

这是我到目前为止的代码。

0 投票
1 回答
285 浏览

scikit-learn - 尽管标签相关性很强,为什么多标签性能结果与独立性能结果相同?

我有一个包含 2 个标签的数据集,我知道这两个标签之间存在很强的相关性。但是,当我使用不考虑相关性的 scikit multilearn 二元相关性时,我得到的结果与考虑这些标签相关性的 Labelpowerset 分类器非常相似?对此有何评论?除了我使用http://scikit-multilearn.github.io/ 我不知道它有多有效?

0 投票
1 回答
719 浏览

apache-spark - 在 Apache Spark 中使用随机森林进行多类分类

Apache Spark 的文档(1.4.0) 承诺可以将随机森林(与决策树相同的承诺)扩展到多类分类设置。但是,我找不到使用 RandomForestModel API 的任何方法:

如果在 1.4.0 版本中真的有可能,您能否提供一个正确的方法来做到这一点?

0 投票
1 回答
1112 浏览

scikit-learn - scikit learn中coverage_error度量的解释

我不了解在 sklearn.metrics 模块中可用的 scikit learn 中如何计算 coverage_error。文档中的解释如下:

coverage_error 函数计算必须包含在最终预测中的标签的平均数量,以便预测所有真实标签。

例如:

根据我的理解,这里我们需要从预测中包含 3 个标签来获取 y_true 中的所有标签。所以覆盖误差 = 3/2,即 1.5。但我无法理解在以下情况下会发生什么:

为什么两种情况下的错误都是一样的?

0 投票
1 回答
2013 浏览

scikit-learn - Sklearn:使用 OneVsRestClassifier 和单独构建每个分类器之间的区别

据我所知,多标签问题可以通过 one-vs-all 方案解决,Scikit-learn 将其实现OneVsRestClassifier为分类器的包装器,例如svm.SVC. 我想知道如果我真的训练会有什么不同,比如说我们有一个多标签问题,有 n 个类,每个标签有 n 个单独的二元分类器,从而分别评估它们。

我知道这就像实现一对多而不是使用包装器的“手动”方式,但是两种方式实际上不同吗?如果是这样,它们有何不同,例如执行时间或分类器的性能?

0 投票
1 回答
281 浏览

java - Weka 过滤器导致数据丢失

我正在使用 weka 构建随机森林模型。我的数据存储在 MySQL 数据库中。我找不到直接从数据库创建 weka 数据集(“实例”对象)的方法(至少不是一个简单的对象),所以我查询数据库并使用此代码将数据操作到 weka 数据集(实例) :

大多数数据以“数字”形式输入,而我需要一些特征(第一和第二)是分类的(或“名义”,根据 weka 术语)。我尝试使用过滤器将它们转换为标称:

这很好用,但令人惊讶的是,在调试数据集时,一些数据丢失了!

应用过滤器之前:

应用过滤器后:

为什么我失去了第二个属性的值?

0 投票
0 回答
368 浏览

python - 单标签训练集产生多标签输出 scikit-learn one vs rest

我想知道是否有可能使用单个标签训练集来产生多标签输出。

使用修改后的 scikit 学习示例如下。训练集包含许多句子,标记为 London 或 NY。

目前,使用 train 集的结果是 London 或 NY,即使是句子,包括对这两个城市的引用。

有没有办法让算法为包含 London 和 NY 的句子生成两个标签而不接触火车?

0 投票
3 回答
2264 浏览

scikit-learn - 带有多标签的 sklearn-KN​​earestNeighbors

我有一个包含特征及其标签的数据集。

它看起来像这样:

我想在这个数据集上训练一个 KNeighborsClassifier。似乎 sklearn 不采用多标签。我一直在尝试这个:

它给了我ValueError: bad input shape

有没有办法可以在 sklearn 中运行多标签分类器?

0 投票
2 回答
2439 浏览

python - nolearn 用于多标签分类

我尝试使用从 nolearn 包导入的 DBN 函数,这是我的代码:

由于我的数据具有形状 (1231, 229) 和带有形状 (1231,13) 的标签,因此标签集看起来像 ([0 0 1 0 1 0 1 0 0 0 1 1 0] ...,[.. ..]),当我运行我的代码时,我收到了这个错误消息:输入形状错误(1231,13)。我想知道这里可能会发生两个问题:

  1. DBN 不支持多标签分类
  2. 我的标签不适合在 DBN 拟合函数中使用。
0 投票
2 回答
7155 浏览

python - PyStruct - 找不到匹配的签名

我正在尝试使用此处的代码:https ://github.com/pystruct/pystruct/blob/master/examples/multi_label.py

我有 X_train 与 shape(2591, 256)和 y_train 与 shape (2591, 175)。当我运行这个:

我懂了:

当我直接从链接运行代码时,它可以工作(使用他们的数据集)。有谁知道应该是什么问题?