“multiclass-classification”的相关标签问题

0 投票

1 回答

124 浏览

python - 无法删除停用词；NLP

我有 csv 文件，其中包含 2 列“投诉详细信息”和“处置代码”。我想将投诉详细信息分类为8 个不同类别的处置代码，例如“门从内部锁定”、“供应商错误”、“缺少钥匙或锁”。 .. 数据集如图所示。在此处输入图像描述

什么是分类和找到准确性的好方法。

最初我尝试从 ComplaintDetails 中删除停用词，然后使用naivebayes 分类器

代码如下：

但我收到以下错误：-

匹配 self._lang_vars.period_context_re().finditer(text): TypeError: expected string or bytes-like object

2017-10-21T18:19:47.400

0 投票

0 回答

91 浏览

r - 如何使用 R 中的“libsvm”包对 1000 多个因子执行多类分类

以下是“ svm ”中的实现

在哪里，

data_one[,1] -> 是具有 1000 多个因子的目标类。

由于要分类的因素很多，所以svm算法会抛出如下错误，

据我所知， libsvm适用于多类目标类。有谁能帮我做同样的事情吗？

r libsvm multiclass-classification

2017-10-31T10:24:32.183

0 投票

1 回答

1870 浏览

python - Python多类分类

我有一个关于文本数据的多类分类器（使用 sklearn.svm）的工作示例。一次通过，我只能训练/测试一个功能。是否可以在一个分类器中堆叠多个特征？具体来说，我的数据具有以下特点：

feature 1: 1c1, 1c2, 1c3, 1c4 feature 2: 2c1,2c2 feature 3: 3c1,3c2,3c3,3c4,3c5 feature 4: 4c1,4c2,4c3

目前，我可以为特征 1 运行训练通行证并为特征 2 重复等。我怎样才能将它们堆叠在一起以获得像这样的输出向量[1c4,2c1,3c5,4c2]？这不是多标签问题，因为特征集 {1..n} 是互斥的。

python svm multiclass-classification

2017-11-06T15:08:41.980

0 投票

1 回答

72 浏览

python - 无法为具有形状“（？，4）”的张量“Placeholder_10：0”提供形状（4，）的值

嘿嘿，

在 IRIS 数据集的多类神经网络的最后一步中，我正在执行以下代码：

我在这里的最后一步是预测手动输入值的输出。我试过这个：

但我收到以下错误

我真的不知道如何创建一个包含 4 个手动输入值的列表，这些值适合这个占位符的格式

谢谢！

python tensorflow classification tensor multiclass-classification

2017-11-11T03:27:31.200

0 投票

1 回答

1526 浏览

python - 情绪分析有 3 个类别（正面、中性和负面）？

我想用 3 个类别（正面、中性和负面）进行情绪分析。我已经看到了很多关于两个类别（正面和负面）情绪分析的工作，但对于 3 个类别来说则更少。如果我想在 Scikit-learn 中使用词袋方法和分类器，例如逻辑回归或 SVM，这将如何工作？我的输出预测 3 个类的步骤是什么？

我是否必须将每个类视为二进制分类并做一些事情来组合结果，还是 sklearn 能够为我做一些处理，所以我不必指定这个？

python scikit-learn sentiment-analysis multiclass-classification

2017-11-15T21:29:36.787

0 投票

0 回答

351 浏览

scikit-learn - GridSearchCV 和 RandomizedSearchCV 的多类 AUC

我正在使用GridSearchCV和RandomizedSearchCV。我有一个包含 4 个类和一个不平衡数据集的多类设置。目前，我正在使用f1_micro作为评分功能。现在我想改用 AUC 的微平均。是否有可能将这样的多类 AUC 用于GridSearchCV和RandomizedSearchCV？

scikit-learn auc multiclass-classification

2017-11-18T00:57:29.220

0 投票

4 回答

34675 浏览

python - 使用 LightGBM 进行多类分类

我正在尝试在 Python 中使用 LightGBM 为多类分类问题（3 类）建模分类器。我使用了以下参数。

数据集的所有分类特征都是用编码的标签LabelEncoder。我在运行后训练了模型cv，eartly_stopping如下所示。

训练后，我用这样的模型进行预测，

我得到一个嵌套数组作为这样的输出。

由于中的每个列表都代表我用来查找此类preds的类概率。np.argmax()

在分析预测时，我发现我的预测只包含 2 个类 - 0 和 1。第 2 类是训练集中的第二大类，但在预测中找不到它。在评估结果时，它给出了关于78%准确性的结果.

那么，为什么我的模型没有预测任何情况下的第 2 类。？我使用的参数有什么问题吗？

这不是解释模型做出的预测的正确方法吗？我应该对参数进行任何更改吗？？

python machine-learning predict multiclass-classification lightgbm

2017-11-18T19:39:10.127

0 投票

1 回答

2568 浏览

machine-learning - 使用高斯朴素贝叶斯的多类分类

我知道朴素贝叶斯擅长二元分类，但我想知道多类分类是如何工作的。

例如：我之前使用朴素贝叶斯进行了文本分类，其中我对文本进行了向量化以找到文档中每个单词的概率，然后使用向量化的数据来拟合朴素贝叶斯分类器。

现在，我正在处理如下数据：

A、B、C、D、E、F、G

210, 203, 0, 30, 710, 2587452, 0

273、250、0、30、725、3548798、1

283、298、0、31、785、3987452、3

在上述数据中，有 6 个特征（AF），G 是具有值（0,1 或 2）的类

我在数据集中有近 70000 个条目，类别（输出）为 1、2 或 3。

将数据拆分为测试和训练数据后，我将训练数据拟合到 sklearn-GaussianNB 算法中。拟合后，当我尝试预测测试数据时，它只是分类为 0 或 2。

所以，我的问题是，当我在文本分类期间拟合 navie bayes 分类器之前执行矢量化时，在将 GaussianNB 分类器与训练数据拟合之前，是否需要对上述数据进行数据预处理，以便它可以预测多-class(0,1 和 2) 而不是只有 (0 和 2)。

machine-learning scikit-learn data-science naivebayes multiclass-classification

2017-11-25T22:45:12.023

0 投票

1 回答

27 浏览

python - 将值与 Keras 中的类相关联

如何将值与 Keras 中的类相关联？

输入：

预期的：

问题是 [1, 2, 3], [4, 5, 6] 来自一个文件，而 [7, 8, 9] 来自另一个文件。我已经阅读了 iris.csv 的示例，但样本大小相同。

python keras lstm multiclass-classification

2017-11-27T22:35:58.630

0 投票

2 回答

2065 浏览

nlp - 使用 python 和 nltk 进行多类文本分类

我的任务是将给定的新闻文本数据分类为以下 5 个类别之一 - 商业、体育、娱乐、技术和政治

关于我正在使用的数据：
由标记为 5 种新闻声明类型之一的文本数据组成（Bcc 新闻数据）

我目前正在使用带有 nltk 模块的 NLP 来计算训练数据中每个单词相对于每个类别的频率分布（停用词除外）。

然后我通过计算所有单词相对于这 5 个类别中的每一个的权重总和来对新数据进行分类。权重最大的类作为输出返回。

继承人的实际代码。

该算法确实可以准确地预测新数据，但我有兴趣了解我可以实现的其他一些简单算法以获得更好的结果。我已经使用朴素贝叶斯算法将数据分为两类（垃圾邮件或非垃圾邮件等），如果它是一个可行的解决方案，我想知道如何为多类分类实现它。

谢谢你。

nlp nltk text-classification naivebayes multiclass-classification

2017-11-29T18:49:47.603

问题标签 [multiclass-classification]

Reference