问题标签 [multiclass-classification]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何从 glm 逻辑回归预测多类概率?
我有 10 个具有二元和多类因子的数据集,我使用逻辑回归和 R“glm”来预测类概率 class,prediction(formula,data,type="response")
。我怎样才能得到预测的类,就像其他模型给出的那样?例如:
这将给出概率预测:
- 但是,无论是 0 还是 1,我都需要类别预测。或者两列中的概率预测:一列用于 1 类,另一列用于 0 类?
- 当我有多个班级时如何使用它?
python - 多类与多标签
目前,我正在从事必须对餐厅评论数据进行分类的项目。我正在使用多项朴素贝叶斯算法。我有点困惑,我的问题与多类或多标签有关。
审查示例-
请像对待客户一样对待您的客户,而不是狗。.我永远不会去或建议任何人去Naivedyam,Hauz Khas。他们是病态的完全商人。食物味道很差,但是地方和工作人员太脏了
它包含三个不同的类,例如
如何创建训练数据集?
我应该使用多标签并创建训练数据集,如
或者
就像在多类中
任何建议
apache-spark - Spark ML - MulticlassClassificationEvaluator - 我们可以通过每个类标签获得精度/召回率吗?
我正在 Spark ML 中使用随机森林进行多类预测。
对于 spark ML 中的这个 MulticlassClassificationEvaluator(),是否可以通过每个类标签获得精度/召回率?
目前,我只看到所有班级的精确度/召回率相结合。
machine-learning - LibSVM - 具有不平衡数据的多类分类
我尝试使用 libsvm 和 3D 描述符来执行对象识别。到目前为止,我有 7 类对象,对于每个类别,我都有对象的数量(及其 pourcentage):
类别 1. 492 (14%)
类别 2. 574 (16%)
类别 3. 738 (21%)
第 4 类。164 (5%)
类别 5。369 (10%)
类别 6。123 (3%)
类别 7。1025 (30%)
所以我总共有 3585 个对象。
我遵循了 libsvm 的实用指南。这里提醒一下:
A. 扩展训练和测试 B. 交叉验证 C. 训练 D. 测试
我将我的数据分为训练和测试。通过进行 5 次交叉验证过程,我能够确定好的 C 和 Gamma。
但是我的结果很差(CV 大约是 30-40,我的准确率大约是 50%)。
然后,我在考虑我的数据,发现我有一些不平衡的数据(例如类别 4 和 6)。我发现在 libSVM 上有一个关于权重的选项。这就是为什么我现在想设置好的权重。
到目前为止,我正在这样做:
然而结果是一样的。我确信这不是这样做的好方法,这就是为什么我请你帮忙。我看到了一些关于该主题的主题,但它们与二元分类而不是多类分类有关。我知道 libSVM 正在做“一对一”(所以是一个二进制分类器),但是当我有多个类时我不知道如何处理它。
请你帮助我好吗 ?
预先感谢您的帮助。
matlab - 为多类分类计算每个类的准确度
我正在研究我设计的多类分类问题
支持向量机分类器
为了
31个不同的类别
在分类过程之后,我得到了预测的标签,现在我想计算每个不同类的准确率。虽然我已经计算了模型的整体精度,但我想要更多细节。
有人可以为此目的提供我的 Matlab 代码或指导我计算所需的结果。
machine-learning - 预测下一个目的地。它是什么类型的分类?
我有一个非常不同的机器学习问题。或者至少我第一次面临这样的问题。如果您能指导我解决它,那就太好了。
我有3个数据集如下:
酒店星级
1 3
2 2
用户 home_continent 性别
1 2 女性
2 3 女性
3 1 男性
用户酒店
1 39
1 44
2 63
我需要找到用户接下来会去哪家酒店。对我来说,它看起来不像正常的分类或回归问题。共有 66 家酒店和 4400 名用户,请您指导我。
谢谢
machine-learning - 预测序列中的下一个目的地。它是什么类型的分类?
如何决定使用什么模型?
matlab - MATLAB SVM:使用相同的数据集进行训练和测试会产生不同的结果
我正在使用函数“fitcsvm”在具有 4 个类的数据集上使用一对多的方法训练具有多项式内核的 SVM。为了进行完整性检查,我尝试将生成的模型应用于我使用函数“predict”进行训练的同一数据集。我为每个 SVM 的所有观察预测标签,并选择与特定观察的后验概率最高的 SVM 对应的标签作为其最终标签。但是,训练和测试错误并不完全相同。这背后的原因是什么?
r - 应用 Neuralnet 和 nnet - 多类分类
我有一个如下所示的数据框:
我们正试图找出哪个目标更有可能在源上交付。下面的数据框显示了在哪些来源上交付了哪些目标的历史数据。我想使用神经网络来预测哪个目标更有可能在源上购买。这也是可重现的。
该数据集是 415 个数据点的子集。
我做的第一件事是使用 将class.ind
分类变量转换为虚拟变量。然后从那里我创建一个有助于预测目标的神经网络模型。
1)我如何预测这个例子?
2)我如何用神经网络包重现这个?
3)我希望能够使用学习率等参数,但在nnet包中似乎找不到,以便我以后可以修改所有内容。
任何指导都会非常有帮助!