问题标签 [one-hot-encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1951 浏览

bus - Chisel:如何实现高效的 one-hot mux?

我有一个表格,表格的每一行都包含状态(寄存器)。存在选择一个特定行的逻辑。只有一行接收“选择”信号。然后访问该选定行的状态。要么状态的一部分作为输出连接到模块的 IO,要么将 IO 的一部分用作更新状态的输入。

如果我用电路实现这个,我会使用通道门。选定的信号将打开一组传输门,它将行的寄存器连接到总线。然后将总线连接到 IO 包。这是快速、小面积和低能量的。

在 Chisel 中有一种直接的实现方式。它将所选行编码为二进制数,然后将该数字应用于传统多路复用器的选择输入。不幸的是,对于具有 20 到 50 行和数百位状态的表,这种实现可能非常缓慢,并且在面积和能源上都是浪费的。

这个问题有两个部分:1)有没有办法在 Chisel 中指定公共汽车,这样你就有通关门或传统的三州司机都挂在公共汽车上?

2)如果做不到这一点,在 Chisel 中是否有一种快速、小面积、低能耗的方法?

谢谢

0 投票
1 回答
91 浏览

tensorflow - tensorflow 0.8 一热编码

我要编码的数据如下所示:

[0 0 0 ...,42 42 42]

从 0-42 有 43 个班级

现在我读到 0.8 版中的 tensorflow 有一个热编码的新功能,所以我尝试按如下方式使用它:

唯一的问题是我认为输出不是我需要的

张量("strided_slice:0", shape=(43,), dtype=int32)

有人可以将我推向正确的方向吗:)

0 投票
1 回答
75 浏览

python - scikit 的 one-hot encoding 如何分配假人?

对于一篇研究论文,我将使用 lasso 模型来执行分类和特征选择。我正准备使用 one-hot 编码来处理我的分类数据,并且需要找出哪些特征映射到原始分类值,以确定最终为最终模型选择了哪些特征。我已经在谷歌上搜索了一段时间,但没有找到答案。

scikit 的 one-hot encoding 是如何赋值的?例如,假设我对某个变量的分类值为 {1, 2, 3, 4}。one-hot encoding 是否按时间顺序将它们组织成虚拟对象(即丢弃 1,使值 2 的第一个虚拟对象,值 3 的第二个虚拟对象,值 4 的第三个虚拟对象?还是根据它找到的顺序分配向下扫描行时使用不同的分类值(例如,第一个观察值的值为 3,第二个观察值的值为 2,因此删除了 3,第一个虚拟变量变为值 2)?

谢谢!

0 投票
2 回答
244 浏览

python - OneHotEncoding 转换解读

我试图通过 python 和 scikit-learn 了解 onehotencoding 过程的输出。我相信我得到了一种热编码的想法。即,将离散值转换为值为“on”的扩展特征向量,以识别分类的成员资格。也许我弄错了,这让我感到困惑,但这是我的理解。

所以,从这里的文档:http: //scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html

我看到以下示例:

有人可以解释一下数据 [[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]] 是如何最终转换为 [[ 1., 0., 0., 1., 0., 0., 1., 0., 0.]]?

如何使用转换参数 [0, 1, 1]?

非常感谢您对此的任何帮助

乔恩

0 投票
4 回答
24547 浏览

python - 你如何在 Tensorflow 中解码 one-hot 标签?

一直在寻找,但似乎找不到任何关于如何从 TensorFlow 中的单热值解码或转换回单个整数的示例。

我使用tf.one_hot并且能够训练我的模型,但在分类后如何理解标签有点困惑。我的数据是通过TFRecords我创建的文件输入的。我想过在文件中存储一个文本标签,但无法让它工作。似乎TFRecords无法存储文本字符串,或者我弄错了。

0 投票
1 回答
2436 浏览

scikit-learn - 文本语料库中单词的一种热编码

如何使用 tensorflow 创建一个单词的热编码,每个单词由词汇大小的稀疏向量表示,并且该特定单词的索引等于 1 ?

就像是

oneHotEncoding(words = ['a','b','c','d']) -> [[1,0,0,0],[0,1,0,0],[0,0, 1,0],[0,0,0,1]] ?

0 投票
3 回答
3722 浏览

python - 如何使用python处理测试数据集中看不见的分类值?

假设我有位置功能。在火车数据集中,它的唯一值是“NewYork”、“Chicago”。但在测试集中,它有“NewYork”、“Chicago”、“London”。那么在创建一种热门编码时如何忽略“伦敦”?换句话说,如何不对只出现在测试集中的类别进行编码?

0 投票
2 回答
1279 浏览

python - 如何对具有两个值的列进行一次热编码?

如果我用 3 个可能的值对一列进行一次性编码,如下所示:

然后我得到:

这正是我想要的。3 列 = 每个可能值 1 列。

但是,如果我有 2 个像这样的可能值:

我得到:

这只有 1 列,即使我有 2 个可能的值。在这种情况下,我想结束的是:

在这种情况下,如何获得 2 列结果?

0 投票
1 回答
12892 浏览

python - 在 Keras 中训练多类图像分类器

我正在按照教程学习使用 Keras 训练分类器

https://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html

具体来说,从作者给出的第二个脚本中,我想将脚本转换为可以训练多类分类器的脚本(猫和狗的二进制)。我的火车文件夹中有 5 个课程,所以我做了以下更改:

train_top_model() 的函数中:

我变了

进入

完成训练后,该模型达到了接近 99% 的训练准确率,但只有验证准确率的 70% 左右。因此我开始思考,将 2 类培训转换为 5 类可能并不那么简单。标记类时可能需要使用 one-hot 编码(但我不知道如何)

编辑:

我也附上了我的微调脚本。另一个问题:微调开始时,准确率没有有效提高。

0 投票
1 回答
5530 浏览

python - 如何使用分类单热标签进行 Keras 训练?

我的输入如下所示:

的 shape(1, num_samples, num_features)和如下所示的标签:

的形状(1, num_samples, 2)

但是,当我尝试运行以下 Keras 代码时,我收到此错误: ValueError: Error when checking model target: expected dense_1 to have 2 dimensions, but got array with shape (1, 8038, 2). 根据我的阅读,这似乎源于我的标签是二维的,而不仅仅是整数。这是正确的,如果是这样,我如何在 Keras 中使用 one-hot 标签?

这是代码:

这会立即引发上述错误:

谢谢!