问题标签 [multiclass-classification]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
638 浏览

python-3.x - 基于python中的电子邮件主题和正文多分类

我的数据集如下所示。

在此处输入图像描述

主题栏是指电子邮件主题和问题描述,问题详细信息栏是指电子邮件正文。

基于主题和电子邮件正文关键字,我需要分类它应该属于哪个队列。

以前的队列列包含 25 多个不同的类别。

我的数据框形状为 (60697, 4)。

请就我需要遵循的分类方法提出建议。我需要使用哪些 ML 模型来训练数据和测试数据。

我知道一点使用自然语言标记化概念。

分类更像是 gmail 收件箱分类:主要、社交和促销。但是,在这里我必须归类为 25+。

0 投票
1 回答
1939 浏览

python - 在 spacy 中进行多类分类时出错

我正在尝试进行多类分类并使用众包文本分类数据集。下面是我的代码:

我收到以下错误:

我正在使用:Python 版本:2.7.14

平台:Darwin-16.4.0-x86_64-i386-64bit

spaCy 版本:2.0.9

型号:zh

有人能帮我吗?我对 spacy 中的多类分类的方法是否正确?提前致谢。

0 投票
1 回答
327 浏览

python - Keras 在进行多类分类时出错

我正在尝试在 Keras 中进行多类分类。我正在使用众 包数据集。下面是我的代码:

我收到此错误:

有人可以指出我的逻辑错误吗?我知道我的问题有点类似于Exception: Error when checks model target: expected dense_3 to have shape (None, 1000) but got array with shape (32, 2)

但我还没有设法找到错误。

0 投票
1 回答
87 浏览

scikit-learn - 通过 scikit-learn 构建一个组合分类器,该分类器首先检测一个类,然后将该类分类为子类

我是 Sci-kit learn 的新用户,我正在研究一个分类问题,其中我有两个主要类,Class_1:良性程序和 Class_2:恶意软件(恶意程序)第二类(恶意软件)由不同的子类:蠕虫、病毒、特洛伊木马等。

在我的数据集中,我有良性程序、蠕虫、病毒等的样本

因此,由于我在分类两个主要类别(良性与恶意软件)方面具有相当高的准确性,因此我不希望一开始就将我的问题直接翻译为多类问题(良性 VS 木马 VS 病毒 VS 蠕虫 .. ..)。我想要的是通过 sci-kit 构建一个组合分类器,该分类器首先将我的数据集分类为主类(恶意软件,良性),然后如果样本被归类为恶意软件,则继续进行多类问题(蠕虫 VS 病毒 VS 木马,...)。

我不知道如何直接通过 sci-kit learn 的功能来做到这一点。我听说过多标签和多输出分类,我不知道我的问题是否可以在 scikit learn 中解释和实现为多输出问题:我的意思是,两个主要类(恶意软件,begnin),具有多个-恶意软件类的输出(多个子类:蠕虫、木马、....)?

提前感谢您的宝贵帮助

0 投票
0 回答
36 浏览

matlab - 如何在 matlab 中使用 libsvm 进行基于像素的多类分类?

我正在使用 libsvm,我必须执行基于多类像素的分类。我想对包含四个类的图像进行分类。为了训练,我为每个类提取了 SURF 密集特征,并将它们输出到 Data_Train.xlsx 中,其中第一列是类,其余的是 SURF 特征。为了测试,我提取了图像的 SURF 密集特征(同时包含四个类)。我的问题是如何对该图像的每个像素进行分类并使用 Libsvm 预测其类别,然后将结果可视化。这是我的代码

0 投票
1 回答
901 浏览

python - Word2vec 和 Conv1D 用于文本分类混淆

我正在做文本分类,并计划使用 word2vec 词嵌入并将其传递给 Conv1D 层进行文本分类。我有一个包含文本和相应标签(情绪)的数据框。我使用了 gensim 模块并使用 word2vec 算法来生成词嵌入模型。我使用的代码:

我打算使用 CNN 并使用这个词嵌入模型。但是我应该如何为我的 cnn 使用这个词嵌入模型呢?我的输入应该是什么?

我打算使用类似的东西(显然不是使用相同的超参数):

有人可以帮助我并指出正确的方向吗?提前致谢。

0 投票
1 回答
135 浏览

scikit-learn - 级联调用多个分类器

我是 scikit-learn 的新用户,

我有一个分类问题,我想调用第一个分类器来预测两个类{malware,begnin},然后只有当分类器1的输出预测标签是恶意软件时才调用第二个分类器来分类恶意软件家族(病毒、木马、蠕虫……)。换句话说,如果分类器 1 的预测标签为开始,则不会调用第二个分类器

但我想在同一个块(或者可能称为分类器)中执行此操作,当被调用时,它在内部执行上面提到的操作: - 在数据集上训练,预测二进制目标 {malware,begnin},如果目标是恶意软件,调用第二个分类器来预测恶意软件的家族。

预先感谢您的宝贵帮助

0 投票
1 回答
951 浏览

tensorflow - softmax(keras)之后的单个神经元层

我需要创建一个神经网络(使用 keras),它的最后一层有一个神经元,其中包含神经元的索引,在前面的 softmax 层中具有最大值预测。

例如,我的 softmax 层给出了这样的结果:

我希望单个神经元层(在 softmax 层之后)给出结果2(考虑基于 0 的估值)。

我怎样才能做到这一点?

0 投票
1 回答
1305 浏览

python - 保存模型进行文本分类后获取真实的类标签

我正在做文本分类。我Conv1D在 Keras 层之上使用了Embedding层。我的验证准确度为 0.68。这是我正在使用的数据集。这是我正在使用的代码:

我正在腌制标记器并保存模型。然后我使用分词器预处理一个示例输入语句来检查我的模型。下面是用于测试的代码:

我得到如下输出:

我怎样才能获得真正的阶级标签(如恐惧、愤怒等)?我的方法是否正确,即保存标记器并再次使用它?我在概念上搞砸了某个地方吗?[编辑] 我在 JARS 的推荐下使用了 inverse_transform:

输出是这样的:

有人可以解释输出吗?

0 投票
1 回答
600 浏览

python-3.x - Keras“Tanh Activation”功能——编辑:隐藏层

Tanh 激活函数将输出限制为 [-1,1]。我想知道如果输入(特征和目标类)以 1-hot-Encoded 形式给出,它是如何工作的?

keras 如何(在内部管理)激活函数的负输出以将它们与类标签(采用单热编码形式)进行比较——仅表示 0 和 1(没有“-”ive 值)

谢谢!