问题标签 [one-hot-encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
11010 浏览

python - 将 2d 矩阵转换为 3d 单热矩阵 numpy

我有 np 矩阵,我想将其转换为 3d 数组,其中元素的一个热编码作为第三维。有没有办法不用遍历每一行,例如

应该做成

0 投票
1 回答
83 浏览

python - 一个热门编码器:如何对同一类别的多个值进行编码?

我要预测一部电影的票房。假设只有一个分类特征“演员”,其值为“A”,“B”,“C”。我将它们编码为[1,0,0],[0,1,0],[0,0,1],如果电影有多个演员,例如 A 和 B,我应该对其进行编码吗作为[1,1,0][1,0,0,0,1,0]

0 投票
21 回答
400776 浏览

python - 如何在 Python 中进行一次热编码?

我有一个包含 80% 分类变量的机器学习分类问题。如果我想使用某个分类器进行分类,我必须使用一种热编码吗?我可以在没有编码的情况下将数据传递给分类器吗?

我正在尝试执行以下功能选择:

  1. 我读了火车文件:

    /li>
  2. 我将分类特征的类型更改为“类别”:

    /li>
  3. 我使用一种热编码:

    /li>

问题是第三部分经常卡住,尽管我使用的是一台强大的机器。

因此,如果没有一种热编码,我就无法进行任何特征选择,以确定特征的重要性。

你有什么建议吗?

0 投票
0 回答
48 浏览

python - 在 Python 中对测试数据进行 1-hot 编码

我正在研究一个分类问题。我的训练数据有一些分类变量,我想将它们转换为虚拟变量。我可以用 Pandas 轻松做到这一点。

问题是,如果测试数据具有训练数据中不存在的某些级别怎么办。如何将测试数据转换为与火车数据具有相同架构的 1-hotcoded 数据?

例如:

训练数据

1-hot 编码的火车数据

测试数据

问题是我不能直接将其转换为虚拟变量,因为这只会产生两个属性dummy_attr_adummy_attr_e(不存在于训练数据中)。

0 投票
4 回答
7360 浏览

python - 如何在一个单元格中使用多个值进行一次热编码?

我在 Excel 中有这张表:

现在,我想在 Python 中做一个“特殊”的 one-hot 编码。对于第一个表中的每个 id,都有两个数字。每个数字对应一个类(class1、class2 等)。第二个表是基于第一个表创建的,这样对于每个 id,其行中的每个数字都显示在其相应的类列中,而其他列则为零。例如,id 0 的数字是 2 和 3。2 放置在 class2,3 放置在 class3。类 1、4 和 5 的默认值为 0。结果应如下所示:

我之前的解决方案,

结果是:

(class_3 出现两次)。我能做些什么来解决这个问题?(在这一步之后,我可以将其转换为我想要的最终格式。)

0 投票
1 回答
1024 浏览

python - 在 OneHotEncoder 之后取消转换

我正在使用 sklearn 的 OneHotEncoder,但想取消转换我的数据。知道怎么做吗?

但我希望能够做到以下几点:

我该怎么做呢?

对于上下文,我构建了一个学习 one-hot 编码空间的神经网络,现在想使用 nn 进行需要采用原始数据格式的真实预测。

0 投票
1 回答
247 浏览

tensorflow - 一种用于大量标签的热编码

我对一个问题感到困惑,想听听你的意见。我正在研究 tensorflow 中的卷积神经网络。现在我有带有标签的图像。大约有 10000 个唯一标签,我希望自动标记图像。现在我对标签使用一种热编码。对于 10000 个独特的标签,它就像功能爆发一样。我们如何处理这种情况?

facebook如何在面部标记中做到这一点?有数以百万计的面孔。我猜他们不会对人脸标签进行一种热编码,对吧?

0 投票
1 回答
143 浏览

r - `dmap_if` 和 'model.matrix' 一起

我正在使用包中的Arthritis数据集vcd来执行一种热编码。我想用purrr::dmap_ifMatrix::model.matrix一起来做这件事。当我跑

工作正常。

当我使用下面的代码不起作用

0 投票
2 回答
9936 浏览

python - 如何在 sklearn 中使用 OneHotEncoder 的输出?

我有一个带有 2 个分类变量、ID 变量和一个目标变量(用于分类)的 Pandas 数据框。我设法用OneHotEncoder. 这导致稀疏矩阵。

但我不知道如何在 DecisionTreeClassifier 中使用这个稀疏矩阵?特别是当我想稍后在我的数据框中添加一些其他非分类变量时。谢谢!

编辑 回复 miraculixx 的评论:我还尝试了 sklearn-pandas 中的 DataFrameMapper

但后来我得到这个错误:

TypeError:不支持类型转换:(dtype('O'),dtype('int64'),dtype('float64'),dtype('float64'))。

0 投票
9 回答
92564 浏览

python - 一种使用 numpy 的热编码

如果输入为零,我想创建一个如下所示的数组:

如果输入为 5:

对于上面我写的:

但它没有用。

有什么方法可以在一行中实现吗?