问题标签 [one-hot-encoding]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1094 问题

0 投票

1 回答

1951 浏览

bus - Chisel：如何实现高效的 one-hot mux？

我有一个表格，表格的每一行都包含状态（寄存器）。存在选择一个特定行的逻辑。只有一行接收“选择”信号。然后访问该选定行的状态。要么状态的一部分作为输出连接到模块的 IO，要么将 IO 的一部分用作更新状态的输入。

如果我用电路实现这个，我会使用通道门。选定的信号将打开一组传输门，它将行的寄存器连接到总线。然后将总线连接到 IO 包。这是快速、小面积和低能量的。

在 Chisel 中有一种直接的实现方式。它将所选行编码为二进制数，然后将该数字应用于传统多路复用器的选择输入。不幸的是，对于具有 20 到 50 行和数百位状态的表，这种实现可能非常缓慢，并且在面积和能源上都是浪费的。

这个问题有两个部分：1）有没有办法在 Chisel 中指定公共汽车，这样你就有通关门或传统的三州司机都挂在公共汽车上？

2）如果做不到这一点，在 Chisel 中是否有一种快速、小面积、低能耗的方法？

谢谢

2016-12-19T06:57:57.703

0 投票

1 回答

91 浏览

tensorflow - tensorflow 0.8 一热编码

我要编码的数据如下所示：

[0 0 0 ...，42 42 42]

从 0-42 有 43 个班级

现在我读到 0.8 版中的 tensorflow 有一个热编码的新功能，所以我尝试按如下方式使用它：

唯一的问题是我认为输出不是我需要的

张量("strided_slice:0", shape=(43,), dtype=int32)

有人可以将我推向正确的方向吗:)

tensorflow neural-network one-hot-encoding

2016-12-26T12:07:11.940

0 投票

1 回答

75 浏览

python - scikit 的 one-hot encoding 如何分配假人？

对于一篇研究论文，我将使用 lasso 模型来执行分类和特征选择。我正准备使用 one-hot 编码来处理我的分类数据，并且需要找出哪些特征映射到原始分类值，以确定最终为最终模型选择了哪些特征。我已经在谷歌上搜索了一段时间，但没有找到答案。

scikit 的 one-hot encoding 是如何赋值的？例如，假设我对某个变量的分类值为 {1, 2, 3, 4}。one-hot encoding 是否按时间顺序将它们组织成虚拟对象（即丢弃 1，使值 2 的第一个虚拟对象，值 3 的第二个虚拟对象，值 4 的第三个虚拟对象？还是根据它找到的顺序分配向下扫描行时使用不同的分类值（例如，第一个观察值的值为 3，第二个观察值的值为 2，因此删除了 3，第一个虚拟变量变为值 2）？

谢谢！

python scikit-learn one-hot-encoding

2016-12-26T23:47:32.990

0 投票

2 回答

244 浏览

python - OneHotEncoding 转换解读

我试图通过 python 和 scikit-learn 了解 onehotencoding 过程的输出。我相信我得到了一种热编码的想法。即，将离散值转换为值为“on”的扩展特征向量，以识别分类的成员资格。也许我弄错了，这让我感到困惑，但这是我的理解。

所以，从这里的文档：http: //scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html

我看到以下示例：

有人可以解释一下数据 [[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]] 是如何最终转换为 [[ 1., 0., 0., 1., 0., 0., 1., 0., 0.]]？

如何使用转换参数 [0, 1, 1]？

非常感谢您对此的任何帮助

乔恩

python scikit-learn one-hot-encoding

2016-12-27T12:08:12.440

0 投票

4 回答

24547 浏览

python - 你如何在 Tensorflow 中解码 one-hot 标签？

一直在寻找，但似乎找不到任何关于如何从 TensorFlow 中的单热值解码或转换回单个整数的示例。

我使用tf.one_hot并且能够训练我的模型，但在分类后如何理解标签有点困惑。我的数据是通过TFRecords我创建的文件输入的。我想过在文件中存储一个文本标签，但无法让它工作。似乎TFRecords无法存储文本字符串，或者我弄错了。

python tensorflow machine-learning deep-learning one-hot-encoding

2016-12-30T16:30:18.190

0 投票

1 回答

2436 浏览

scikit-learn - 文本语料库中单词的一种热编码

如何使用 tensorflow 创建一个单词的热编码，每个单词由词汇大小的稀疏向量表示，并且该特定单词的索引等于 1 ？

就像是

oneHotEncoding(words = ['a','b','c','d']) -> [[1,0,0,0],[0,1,0,0],[0,0, 1,0],[0,0,0,1]] ?

scikit-learn one-hot-encoding

2017-01-06T10:17:29.893

0 投票

3 回答

3722 浏览

python - 如何使用python处理测试数据集中看不见的分类值？

假设我有位置功能。在火车数据集中，它的唯一值是“NewYork”、“Chicago”。但在测试集中，它有“NewYork”、“Chicago”、“London”。那么在创建一种热门编码时如何忽略“伦敦”？换句话说，如何不对只出现在测试集中的类别进行编码？

python machine-learning feature-extraction categorical-data one-hot-encoding

2017-01-19T04:52:18.380

0 投票

2 回答

1279 浏览

python - 如何对具有两个值的列进行一次热编码？

如果我用 3 个可能的值对一列进行一次性编码，如下所示：

然后我得到：

这正是我想要的。3 列 = 每个可能值 1 列。

但是，如果我有 2 个像这样的可能值：

我得到：

这只有 1 列，即使我有 2 个可能的值。在这种情况下，我想结束的是：

在这种情况下，如何获得 2 列结果？

python scikit-learn one-hot-encoding

2017-01-23T21:17:46.417

0 投票

1 回答

12892 浏览

python - 在 Keras 中训练多类图像分类器

我正在按照教程学习使用 Keras 训练分类器

https://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html

具体来说，从作者给出的第二个脚本中，我想将脚本转换为可以训练多类分类器的脚本（猫和狗的二进制）。我的火车文件夹中有 5 个课程，所以我做了以下更改：

在train_top_model() 的函数中：

我变了

进入

完成训练后，该模型达到了接近 99% 的训练准确率，但只有验证准确率的 70% 左右。因此我开始思考，将 2 类培训转换为 5 类可能并不那么简单。标记类时可能需要使用 one-hot 编码（但我不知道如何）

编辑：

我也附上了我的微调脚本。另一个问题：微调开始时，准确率没有有效提高。

python machine-learning deep-learning keras one-hot-encoding

2017-01-24T08:12:06.447

0 投票

1 回答

5530 浏览

python - 如何使用分类单热标签进行 Keras 训练？

我的输入如下所示：

的 shape(1, num_samples, num_features)和如下所示的标签：

的形状(1, num_samples, 2)。

但是，当我尝试运行以下 Keras 代码时，我收到此错误： ValueError: Error when checking model target: expected dense_1 to have 2 dimensions, but got array with shape (1, 8038, 2). 根据我的阅读，这似乎源于我的标签是二维的，而不仅仅是整数。这是正确的，如果是这样，我如何在 Keras 中使用 one-hot 标签？

这是代码：

这会立即引发上述错误：

谢谢！

python machine-learning keras one-hot-encoding

2017-01-26T00:03:22.140

1 2 3 4 5 6 7 8 9 10

问题标签 [one-hot-encoding]

编辑：

Reference