问题标签 [multiclass-classification]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2470 浏览

r - 如何从 glm 逻辑回归预测多类概率?

我有 10 个具有二元和多类因子的数据集,我使用逻辑回归和 R“glm”来预测类概率 class,prediction(formula,data,type="response")。我怎样才能得到预测的类,就像其他模型给出的那样?例如:

这将给出概率预测:

  • 但是,无论是 0 还是 1,我都需要类别预测。或者两列中的概率预测:一列用于 1 类,另一列用于 0 类?
  • 当我有多个班级时如何使用它?
0 投票
1 回答
1697 浏览

python - 多类与多标签

目前,我正在从事必须对餐厅评论数据进行分类的项目。我正在使用多项朴素贝叶斯算法。我有点困惑,我的问题与多类或多标签有关。

审查示例-

请像对待客户一样对待您的客户,而不是狗。.我永远不会去或建议任何人去Naivedyam,Hauz Khas。他们是病态的完全商人。食物味道很差,但是地方和工作人员太脏了

它包含三个不同的类,例如

如何创建训练数据集?

我应该使用多标签并创建训练数据集,如

或者

就像在多类中

任何建议

0 投票
2 回答
2516 浏览

apache-spark - Spark ML - MulticlassClassificationEvaluator - 我们可以通过每个类标签获得精度/召回率吗?

我正在 Spark ML 中使用随机森林进行多类预测。

对于 spark ML 中的这个 MulticlassClassificationEvaluator(),是否可以通过每个类标签获得精度/召回率?

目前,我只看到所有班级的精确度/召回率相结合。

0 投票
1 回答
366 浏览

machine-learning - LibSVM - 具有不平衡数据的多类分类

我尝试使用 libsvm 和 3D 描述符来执行对象识别。到目前为止,我有 7 类对象,对于每个类别,我都有对象的数量(及其 pourcentage):

类别 1. 492 (14%)

类别 2. 574 (16%)

类别 3. 738 (21%)

第 4 类。164 (5%)

类别 5。369 (10%)

类别 6。123 (3%)

类别 7。1025 (30%)

所以我总共有 3585 个对象。

我遵循了 libsvm 的实用指南。这里提醒一下:

A. 扩展训练和测试 B. 交叉验证 C. 训练 D. 测试

我将我的数据分为训练和测试。通过进行 5 次交叉验证过程,我能够确定好的 C 和 Gamma。

但是我的结果很差(CV 大约是 30-40,我的准确率大约是 50%)。

然后,我在考虑我的数据,发现我有一些不平衡的数据(例如类别 4 和 6)。我发现在 libSVM 上有一个关于权重的选项。这就是为什么我现在想设置好的权重。

到目前为止,我正在这样做:

然而结果是一样的。我确信这不是这样做的好方法,这就是为什么我请你帮忙。我看到了一些关于该主题的主题,但它们与二元分类而不是多类分类有关。我知道 libSVM 正在做“一对一”(所以是一个二进制分类器),但是当我有多个类时我不知道如何处理它。

请你帮助我好吗 ?

预先感谢您的帮助。

0 投票
0 回答
730 浏览

matlab - 为多类分类计算每个类的准确度

我正在研究我设计的多类分类问题

支持向量机分类器

为了

31个不同的类别

在分类过程之后,我得到了预测的标签,现在我想计算每个不同类的准确率。虽然我已经计算了模型的整体精度,但我想要更多细节。

有人可以为此目的提供我的 Matlab 代码或指导我计算所需的结果。

0 投票
1 回答
84 浏览

machine-learning - 预测下一个目的地。它是什么类型的分类?

我有一个非常不同的机器学习问题。或者至少我第一次面临这样的问题。如果您能指导我解决它,那就太好了。

我有3个数据集如下:

酒店星级
1 3
2 2

用户 home_continent 性别
1 2 女性
2 3 女性
3 1 男性

用户酒店
1 39
1 44
2 63

我需要找到用户接下来会去哪家酒店。对我来说,它看起来不像正常的分类或回归问题。共有 66 家酒店和 4400 名用户,请您指导我。
谢谢

0 投票
2 回答
93 浏览

machine-learning - 预测序列中的下一个目的地。它是什么类型的分类?

如何决定使用什么模型?

0 投票
2 回答
10795 浏览

xgboost - XGBoost 中多类分类的损失函数是什么?

我想知道哪个损失函数使用 XGBoost 进行多类分类。我在这个问题中发现了二元情况下逻辑分类的损失函数。

我认为对于多类情况,它可能与 GBM(对于 K 类)中的相同,可以在此处看到,如果 x 的标签为 k,则 y_k=1,在任何其他情况下为 0,并且 p_k(x)是softmax函数。但是,我使用此损失函数进行了一阶和二阶梯度,并且粗麻布与此处代码中定义的梯度(在 SoftmaxMultiClassObj 中的函数 GetGradient 中)不匹配常数 2。

你能告诉我使用的是哪个损失函数吗?

先感谢您。

0 投票
1 回答
227 浏览

matlab - MATLAB SVM:使用相同的数据集进行训练和测试会产生不同的结果

我正在使用函数“fitcsvm”在具有 4 个类的数据集上使用一对多的方法训练具有多项式内核的 SVM。为了进行完整性检查,我尝试将生成的模型应用于我使用函数“predict”进行训练的同一数据集。我为每个 SVM 的所有观察预测标签,并选择与特定观察的后验概率最高的 SVM 对应的标签作为其最终标签。但是,训练和测试错误并不完全相同。这背后的原因是什么?

0 投票
0 回答
806 浏览

r - 应用 Neuralnet 和 nnet - 多类分类

我有一个如下所示的数据框:

我们正试图找出哪个目标更有可能在源上交付。下面的数据框显示了在哪些来源上交付了哪些目标的历史数据。我想使用神经网络来预测哪个目标更有可能在源上购买。这也是可重现的。

该数据集是 415 个数据点的子集。

我做的第一件事是使用 将class.ind分类变量转换为虚拟变量。然后从那里我创建一个有助于预测目标的神经网络模型。

1)我如何预测这个例子?

2)我如何用神经网络包重现这个?

3)我希望能够使用学习率等参数,但在nnet包中似乎找不到,以便我以后可以修改所有内容。

任何指导都会非常有帮助!