问题标签 [multiclass-classification]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
124 浏览

python - 无法删除停用词;NLP

我有 csv 文件,其中包含 2 列“投诉详细信息”和“处置代码”。我想投诉详细信息分类为8 个不同类别的处置代码,例如“门从内部锁定”、“供应商错误”、“缺少钥匙或锁”。 .. 数据集如图所示。 在此处输入图像描述

什么是分类和找到准确性的好方法。

最初我尝试从 ComplaintDetails 中删除停用词,然后使用naivebayes 分类器

代码如下:

但我收到以下错误:-

匹配 self._lang_vars.period_context_re().finditer(text): TypeError: expected string or bytes-like object

0 投票
0 回答
91 浏览

r - 如何使用 R 中的“libsvm”包对 1000 多个因子执行多类分类

以下是“ svm ”中的实现

在哪里,

data_one[,1] -> 是具有 1000 多个因子的目标类。

由于要分类的因素很多,所以svm算法会抛出如下错误,

据我所知, libsvm适用于多类目标类。有谁能帮我做同样的事情吗?

0 投票
1 回答
1870 浏览

python - Python多类分类

我有一个关于文本数据的多类分类器(使用 sklearn.svm)的工作示例。一次通过,我只能训练/测试一个功能。是否可以在一个分类器中堆叠多个特征?具体来说,我的数据具有以下特点:

feature 1: 1c1, 1c2, 1c3, 1c4 feature 2: 2c1,2c2 feature 3: 3c1,3c2,3c3,3c4,3c5 feature 4: 4c1,4c2,4c3

目前,我可以为特征 1 运行训练通行证并为特征 2 重复等。我怎样才能将它们堆叠在一起以获得像这样的输出向量[1c4,2c1,3c5,4c2]?这不是多标签问题,因为特征集 {1..n} 是互斥的。

0 投票
1 回答
72 浏览

python - 无法为具有形状“(?,4)”的张量“Placeholder_10:0”提供形状(4,)的值

嘿嘿,

在 IRIS 数据集的多类神经网络的最后一步中,我正在执行以下代码:

我在这里的最后一步是预测手动输入值的输出。我试过这个:

但我收到以下错误

我真的不知道如何创建一个包含 4 个手动输入值的列表,这些值适合这个占位符的格式

谢谢!

0 投票
1 回答
1526 浏览

python - 情绪分析有 3 个类别(正面、中性和负面)?

我想用 3 个类别(正面、中性和负面)进行情绪分析。我已经看到了很多关于两个类别(正面和负面)情绪分析的工作,但对于 3 个类别来说则更少。如果我想在 Scikit-learn 中使用词袋方法和分类器,例如逻辑回归或 SVM,这将如何工作?我的输出预测 3 个类的步骤是什么?

我是否必须将每个类视为二进制分类并做一些事情来组合结果,还是 sklearn 能够为我做一些处理,所以我不必指定这个?

0 投票
0 回答
351 浏览

scikit-learn - GridSearchCV 和 RandomizedSearchCV 的多类 AUC

我正在使用GridSearchCVRandomizedSearchCV。我有一个包含 4 个类和一个不平衡数据集的多类设置。目前,我正在使用f1_micro作为评分功能。现在我想改用 AUC 的微平均。是否有可能将这样的多类 AUC 用于GridSearchCVRandomizedSearchCV

0 投票
4 回答
34675 浏览

python - 使用 LightGBM 进行多类分类

我正在尝试在 Python 中使用 LightGBM 为多类分类问题(3 类)建模分类器。我使用了以下参数。

数据集的所有分类特征都是用 编码的标签LabelEncoder。我在运行后训练了模型cveartly_stopping如下所示。

训练后,我用这样的模型进行预测,

我得到一个嵌套数组作为这样的输出。

由于中的每个列表都代表我用来查找此类preds的类概率。np.argmax()

在分析预测时,我发现我的预测只包含 2 个类 - 0 和 1。第 2 类是训练集中的第二大类,但在预测中找不到它。在评估结果时,它给出了关于78%准确性的结果.

那么,为什么我的模型没有预测任何情况下的第 2 类。?我使用的参数有什么问题吗?

这不是解释模型做出的预测的正确方法吗?我应该对参数进行任何更改吗??

0 投票
1 回答
2568 浏览

machine-learning - 使用高斯朴素贝叶斯的多类分类

我知道朴素贝叶斯擅长二元分类,但我想知道多类分类是如何工作的。

例如:我之前使用朴素贝叶斯进行了文本分类,其中我对文本进行了向量化以找到文档中每个单词的概率,然后使用向量化的数据来拟合朴素贝叶斯分类器。

现在,我正在处理如下数据:

A、B、C、D、E、F、G

210, 203, 0, 30, 710, 2587452, 0

273、250、0、30、725、3548798、1

283、298、0、31、785、3987452、3

在上述数据中,有 6 个特征(AF),G 是具有值(0,1 或 2)的类

我在数据集中有近 70000 个条目,类别(输出)为 1、2 或 3。

将数据拆分为测试和训练数据后,我将训练数据拟合到 sklearn-GaussianNB 算法中。拟合后,当我尝试预测测试数据时,它只是分类为 0 或 2。

所以,我的问题是,当我在文本分类期间拟合 navie bayes 分类器之前执行矢量化时,在将 GaussianNB 分类器与训练数据拟合之前,是否需要对上述数据进行数据预处理,以便它可以预测多-class(0,1 和 2) 而不是只有 (0 和 2)。

0 投票
1 回答
27 浏览

python - 将值与 Keras 中的类相关联

如何将值与 Keras 中的类相关联?

输入:

预期的:

问题是 [1, 2, 3], [4, 5, 6] 来自一个文件,而 [7, 8, 9] 来自另一个文件。我已经阅读了 iris.csv 的示例,但样本大小相同。

0 投票
2 回答
2065 浏览

nlp - 使用 python 和 nltk 进行多类文本分类

我的任务是将给定的新闻文本数据分类为以下 5 个类别之一 - 商业、体育、娱乐、技术和政治

关于我正在使用的数据:
由标记为 5 种新闻声明类型之一的文本数据组成(Bcc 新闻数据)

我目前正在使用带有 nltk 模块的 NLP 来计算训练数据中每个单词相对于每个类别的频率分布(停用词除外)。

然后我通过计算所有单词相对于这 5 个类别中的每一个的权重总和来对新数据进行分类。权重最大的类作为输出返回。

继承人的实际代码

该算法确实可以准确地预测新数据,但我有兴趣了解我可以实现的其他一些简单算法以获得更好的结果。我已经使用朴素贝叶斯算法将数据分为两类(垃圾邮件或非垃圾邮件等),如果它是一个可行的解决方案,我想知道如何为多类分类实现它。

谢谢你。