问题标签 [multiclass-classification]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 无法删除停用词;NLP
我有 csv 文件,其中包含 2 列“投诉详细信息”和“处置代码”。我想将投诉详细信息分类为8 个不同类别的处置代码,例如“门从内部锁定”、“供应商错误”、“缺少钥匙或锁”。 .. 数据集如图所示。 在此处输入图像描述
什么是分类和找到准确性的好方法。
最初我尝试从 ComplaintDetails 中删除停用词,然后使用naivebayes 分类器
代码如下:
但我收到以下错误:-
匹配 self._lang_vars.period_context_re().finditer(text): TypeError: expected string or bytes-like object
r - 如何使用 R 中的“libsvm”包对 1000 多个因子执行多类分类
以下是“ svm ”中的实现
在哪里,
data_one[,1] -> 是具有 1000 多个因子的目标类。
由于要分类的因素很多,所以svm算法会抛出如下错误,
据我所知, libsvm适用于多类目标类。有谁能帮我做同样的事情吗?
python - Python多类分类
我有一个关于文本数据的多类分类器(使用 sklearn.svm)的工作示例。一次通过,我只能训练/测试一个功能。是否可以在一个分类器中堆叠多个特征?具体来说,我的数据具有以下特点:
feature 1: 1c1, 1c2, 1c3, 1c4
feature 2: 2c1,2c2
feature 3: 3c1,3c2,3c3,3c4,3c5
feature 4: 4c1,4c2,4c3
目前,我可以为特征 1 运行训练通行证并为特征 2 重复等。我怎样才能将它们堆叠在一起以获得像这样的输出向量[1c4,2c1,3c5,4c2]
?这不是多标签问题,因为特征集 {1..n} 是互斥的。
python - 无法为具有形状“(?,4)”的张量“Placeholder_10:0”提供形状(4,)的值
嘿嘿,
在 IRIS 数据集的多类神经网络的最后一步中,我正在执行以下代码:
我在这里的最后一步是预测手动输入值的输出。我试过这个:
但我收到以下错误
我真的不知道如何创建一个包含 4 个手动输入值的列表,这些值适合这个占位符的格式
谢谢!
python - 情绪分析有 3 个类别(正面、中性和负面)?
我想用 3 个类别(正面、中性和负面)进行情绪分析。我已经看到了很多关于两个类别(正面和负面)情绪分析的工作,但对于 3 个类别来说则更少。如果我想在 Scikit-learn 中使用词袋方法和分类器,例如逻辑回归或 SVM,这将如何工作?我的输出预测 3 个类的步骤是什么?
我是否必须将每个类视为二进制分类并做一些事情来组合结果,还是 sklearn 能够为我做一些处理,所以我不必指定这个?
scikit-learn - GridSearchCV 和 RandomizedSearchCV 的多类 AUC
我正在使用GridSearchCV
和RandomizedSearchCV
。我有一个包含 4 个类和一个不平衡数据集的多类设置。目前,我正在使用f1_micro
作为评分功能。现在我想改用 AUC 的微平均。是否有可能将这样的多类 AUC 用于GridSearchCV
和RandomizedSearchCV
?
python - 使用 LightGBM 进行多类分类
我正在尝试在 Python 中使用 LightGBM 为多类分类问题(3 类)建模分类器。我使用了以下参数。
数据集的所有分类特征都是用 编码的标签LabelEncoder
。我在运行后训练了模型cv
,eartly_stopping
如下所示。
训练后,我用这样的模型进行预测,
我得到一个嵌套数组作为这样的输出。
由于中的每个列表都代表我用来查找此类preds
的类概率。np.argmax()
在分析预测时,我发现我的预测只包含 2 个类 - 0 和 1。第 2 类是训练集中的第二大类,但在预测中找不到它。在评估结果时,它给出了关于78%
准确性的结果.
那么,为什么我的模型没有预测任何情况下的第 2 类。?我使用的参数有什么问题吗?
这不是解释模型做出的预测的正确方法吗?我应该对参数进行任何更改吗??
machine-learning - 使用高斯朴素贝叶斯的多类分类
我知道朴素贝叶斯擅长二元分类,但我想知道多类分类是如何工作的。
例如:我之前使用朴素贝叶斯进行了文本分类,其中我对文本进行了向量化以找到文档中每个单词的概率,然后使用向量化的数据来拟合朴素贝叶斯分类器。
现在,我正在处理如下数据:
A、B、C、D、E、F、G
210, 203, 0, 30, 710, 2587452, 0
273、250、0、30、725、3548798、1
283、298、0、31、785、3987452、3
在上述数据中,有 6 个特征(AF),G 是具有值(0,1 或 2)的类
我在数据集中有近 70000 个条目,类别(输出)为 1、2 或 3。
将数据拆分为测试和训练数据后,我将训练数据拟合到 sklearn-GaussianNB 算法中。拟合后,当我尝试预测测试数据时,它只是分类为 0 或 2。
所以,我的问题是,当我在文本分类期间拟合 navie bayes 分类器之前执行矢量化时,在将 GaussianNB 分类器与训练数据拟合之前,是否需要对上述数据进行数据预处理,以便它可以预测多-class(0,1 和 2) 而不是只有 (0 和 2)。
python - 将值与 Keras 中的类相关联
如何将值与 Keras 中的类相关联?
输入:
预期的:
问题是 [1, 2, 3], [4, 5, 6] 来自一个文件,而 [7, 8, 9] 来自另一个文件。我已经阅读了 iris.csv 的示例,但样本大小相同。
nlp - 使用 python 和 nltk 进行多类文本分类
我的任务是将给定的新闻文本数据分类为以下 5 个类别之一 - 商业、体育、娱乐、技术和政治
关于我正在使用的数据:
由标记为 5 种新闻声明类型之一的文本数据组成(Bcc 新闻数据)
我目前正在使用带有 nltk 模块的 NLP 来计算训练数据中每个单词相对于每个类别的频率分布(停用词除外)。
然后我通过计算所有单词相对于这 5 个类别中的每一个的权重总和来对新数据进行分类。权重最大的类作为输出返回。
继承人的实际代码。
该算法确实可以准确地预测新数据,但我有兴趣了解我可以实现的其他一些简单算法以获得更好的结果。我已经使用朴素贝叶斯算法将数据分为两类(垃圾邮件或非垃圾邮件等),如果它是一个可行的解决方案,我想知道如何为多类分类实现它。
谢谢你。