问题标签 [scikit-multilearn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1336 浏览

python - TypeError:传递了稀疏矩阵,但需要密集数据(多标签 K 最近邻)

在执行 GridSearchCV(来自 scikit-learn)之后,我无法拟合 MLkNN 模型的实例(来自 scikit-multilearn)。我收到一个错误。这是适当的代码:

完整跟踪:

我已经看过这个这个这个。我的问题不同,因为我检查了 train_x 和 train_y 的类型,它们都是密集的 numpy 数组。

我做错了什么,我该如何解决?

编辑:

我现在正在尝试下面提供的答案,但由于我得到的错误而进行了修改(在此处回答):

编辑2:毕竟那​​不好。我明白了ValueError: query data dimension must match training data dimension。这是跟踪:

0 投票
1 回答
373 浏览

keras - 在keras中使用标签powerset时如何传递纪元和批量大小

我有一个多标签问题,通过一些研究,我能够将 Label powerset 与 ML 算法结合使用。现在我想使用带有神经网络的标签 powerset,根据官方网站,我可以使用标签 powerset。但我无法理解如何修改我现有的代码才能使用 Label Powerset。

我想知道我们如何传递 epoch 或 batch_size 或模型的 fit 函数中传递的任何其他参数。

由于我有一个多标签问题,我使用了 sklearn 的 MultiLabelBinarizer,所以我的每个目标行看起来像这样 [1,0,0,1,0,0,0,0,0,0,0,0]。

最后,如果有人可以向我解释下一行中的 KERAS_PARAMS 和 Keras() 是什么:

下面是我现有的神经网络代码

我希望我的输出行看起来像这样只是 [1,0,0,1,0,0,0,0,0,0,0,0] 因为稍后我将使用我的 MultiLabelBinarizer 对此进行逆变换。

0 投票
1 回答
271 浏览

machine-learning - “OneVsRestClassifier”(Scikit-learn)和“Binary Relevance”(Scikit-multilearn)有什么区别?

在 scikit-learn 中,有一种称为 的策略sklearn.multiclass.OneVsRestClassifier,可用于多类和多标签问题。根据其文档

“在多标签学习文献中,OvR 也称为二元相关方法”。

我的问题是,

这个 scikit-learn 策略和 scikit-learn 策略有什么区别skmultilearn.problem_transform.BinaryRelevance吗?

先感谢您。

0 投票
1 回答
2099 浏览

python - 多标签分类 ML-kNN 与 KNN

这可能是一个愚蠢的问题,但我只是想知道 scikit.ml 中实现的 ML-KNN 和 scikit-learn 的 KNeighborsClassifier 之间的区别是什么。根据sklearn 的文档, KNeighborsClassifier 支持多标签分类。然而,ML-KNN 是适用于多标签分类的 KNN,它建立在 sklearn 的架构之上,基于它的文档

在搜索示例多标签问题时,MLkNN 大多出现,但我不明白如果它已经支持它,使用它是否比 sklearn 的基本实现有任何优势。只是sklearn方面的后期适应还是在实现上有更多差异?

任何输入表示赞赏。谢谢!

0 投票
1 回答
985 浏览

python-3.x - 如何在此数据帧上实现 MultiLabelBinarizer?

我有一个这样的数据框:

我想在删除每个标签列列表中的重复值后实现 MultiLabelBinarizer。

我试过循环框架并删除重复项。而且,多标签二值化器不起作用并引发异常

0 投票
1 回答
783 浏览

python - LinearSVC 中参数 class_weight 的最佳值是多少?

我有一个多标签数据(一些类有 2 个和一些 10 个标签),我的模型过度拟合平衡值和无值。为 class_weight 参数设置的最佳值是什么。

0 投票
1 回答
213 浏览

python - AttributeError:“BinaryRelevance”对象没有属性“分类器”

我正在尝试使用 BinaryRelevance 和 SVC 对数据(情绪)进行分类。这段代码在

http://scikit.ml/tutorial.html

我有这个问题

0 投票
0 回答
91 浏览

python - 保存 Keras 模型和权重

我正在使用 Azure ML Studio 创建一个自动化的 ML 管道。我已成功让我的模型在 Azure 中进行训练和测试,但它在model.to_json()model.save_weights().

我相信我的模型上不存在这些功能,因为 scikit-multilearn 是 Keras 的包装器。但是,我希望能够保存我的模型和重量,以便可以将它们部署到 Web 服务服务。我使用的 scikit-multilearn 模型是 Binary Relevance。

感谢任何提供帮助的人。

0 投票
0 回答
58 浏览

python - sklearn 中的错误:grid_ridge_m.cv_results_

我使用的 scikit-learn 版本是 0.22.1。我在 grid_scores(0.18) 和 cv_results(0.18+) 处收到错误,因为我有 sklearn 0.22 我使用了 cv_result..

错误:当我使用 (grid_ridge_m.cv_results_) 时出现以下错误

0 投票
0 回答
180 浏览

python - python API“scikit-multilearn”在调用“predict_proba”方法时返回“列索引(1)超出范围”

我正在使用已经在另一个上下文中运行的多标签分类器。

数据分类器包含来自图表的节点访问的数据,可在此处获得: https ://drive.google.com/file/d/1xD2dq4UL0UqQsuvEWgjSnFLBpjC5xlVL/view?usp=sharing

使用以下命令保存 csv:

代码:

X_train、X_test、y_train 和 y_test 的形状似乎还可以。我想这可能是任何标签概率都缺乏价值,但我不确定!无论如何,如果这是真的,我们怎么能避免呢?

错误信息: