问题标签 [multiclass-classification]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
scikit-learn - 多标签分类sklearn
我是 sklearn 和机器学习的新手。我有一个 csv 文件,其中包含以下类型的映射: ID-2001-0001, ID-category_1 ID-2002 - 0002, ID-category_2 。. 我有大约 1010 个唯一 ID 和 123 个唯一类别。现在,我希望对大约 1000 个其他 ID 进行分类。对于我想为 800/1010 已经分类的 ID 训练分类器。我正在使用sklearn。使用 SVM,我对剩余的 200 个 ID 得到了相同的预测。使用 GradientBoosting 我得到了 1.4% 的准确率。这是因为数据量小吗?基本上,我将 100 维向量和 ID-2001-0001 (word2vec) 及其对应的类别传递给 fit 方法。
我做这个分类对吗?还是我错过了什么?感谢任何帮助。谢谢
python - 创建和测试分类器
我在一个excel文件中有两列。第 1 行有准确的用户输入,第 2 行有其原因。例如
任务是实现一个分类器,当下次给出特定用户输入时,它可以分类为原因之一,即让分类器了解这些情况并预测未来值。
我对分类有一些了解,但我真的很想知道如何使用 one vs rest 分类器来实现它。
multilabel-classification - 将数据帧转换为 mldr 对象以用于 BR 算法
我正在使用 BR 算法进行多标签预测。我需要将测试数据转换为 MLDR 对象。但我没有这样做,因为测试数据没有结果列。我使用 mldr_from_dataframe(dataframe, labelIndices, attributes, name) 进行转换。在这个“labelIndices”是一个强制性条目。所以它不适用于我没有结果列(标签索引)的测试数据。如何进行转换?这样我就可以使用测试数据进行预测。
python - scikit learn中的OneVsRestClassifier和MultiOutputClassifier有什么区别?
有人可以解释一下(可能有例子)scikit-learn中OneVsRestClassifier和MultiOutputClassifier有什么区别吗?
我已阅读文档,并且了解我们使用:
- OneVsRestClassifier - 当我们想要进行多类或多标签分类时,它的策略包括为每个类拟合一个分类器。对于每个分类器,该类与所有其他类进行拟合。(这很清楚,这意味着多类/多标签分类问题被分解为多个二元分类问题)。
- MultiOutputClassifier - 当我们想要进行多目标分类时(这是什么?),它的策略包括为每个目标拟合一个分类器(目标在那里意味着什么?)
我已经使用 OneVsRestClassifier 进行多标签分类,我可以理解它是如何工作的,但后来我发现 MultiOutputClassifier 并且无法理解它与 OneVsRestClassifier 的工作方式有何不同。
scikit-learn - ValueError:无法处理多标签指示符和二进制的混合
我正在使用带有 scikit-learn 包装器的 Keras。特别是,我想使用 GridSearchCV 进行超参数优化。
这是一个多类问题,即目标变量只能在一组 n 个类中选择一个标签。例如,目标变量可以是“Class1”、“Class2”...“Classn”。
问题是,在交叉验证期间计算分数时,验证样本的真实标签是一次性编码的,而由于某种原因,预测会崩溃为二进制标签(当目标变量只有两个类时)。例如,这是堆栈跟踪的最后一部分:
如何指示 Keras/sklearn 以 one-hot 编码返回预测?
python - 多类分类中缺少值的 Keras 自定义损失
您好,我的训练数据在标签中有很多缺失值,例如,单个标签可以具有以下值:
我想训练一个忽略 nan 值的分类模型。目前我已经用-1填充了nan值,并尝试对其进行切片。掩码不起作用,因为分类交叉熵仍将其考虑在内
是我到目前为止所能想到的,但它出错了
有谁知道如何处理这个问题?
r - 如何在 mlr 中使用 multiclass.au1p 度量
我正在尝试在 mlr 包中使用 multiclass.au1p 度量。它给了我一个错误说
FUN(X[[i]], ...) 中的错误:测量 multiclass.au1p 需要预测类型为:'prob'!
当我尝试将预测类型设置为 prob 时,它给了我一个类似于我使用的任何分类器的错误
setPredictType.Learner(learner, predict.type) 中的错误:尝试预测概率,但 classif.xgboost.multiclass 不支持!
我该如何解决这个问题?
以下是我的代码
matlab - 最近的质心分类器真的效率低下吗?
我目前正在阅读 Ethem Alpaydin 的“机器学习简介”,我遇到了最近的质心分类器并试图实现它。我想我已经正确实现了分类器,但我得到的准确率只有 68%。那么,最近的质心分类器本身效率低下还是我的实现中存在一些错误(如下)?
该数据集包含 1372 个数据点,每个数据点有 4 个特征,并且有 2 个输出类 My MATLAB implementation:
python - 决定使用 SMOTE 时要平衡的类
我正在使用 SMOTE (imblearn.over_sampling import SMOTE) 来解决多类分类问题,其中一些类高度不平衡。目前我已经创建了一个循环,它将通过一些迭代对具有最少观察的类进行过度采样。默认情况下,该库将采用样本最少的类并对其进行过采样,但我想决定要对哪个类进行过采样。我看不到图书馆如何支持这个选项 - 有什么想法吗?
我的代码: