问题标签 [one-hot-encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
bus - Chisel:如何实现高效的 one-hot mux?
我有一个表格,表格的每一行都包含状态(寄存器)。存在选择一个特定行的逻辑。只有一行接收“选择”信号。然后访问该选定行的状态。要么状态的一部分作为输出连接到模块的 IO,要么将 IO 的一部分用作更新状态的输入。
如果我用电路实现这个,我会使用通道门。选定的信号将打开一组传输门,它将行的寄存器连接到总线。然后将总线连接到 IO 包。这是快速、小面积和低能量的。
在 Chisel 中有一种直接的实现方式。它将所选行编码为二进制数,然后将该数字应用于传统多路复用器的选择输入。不幸的是,对于具有 20 到 50 行和数百位状态的表,这种实现可能非常缓慢,并且在面积和能源上都是浪费的。
这个问题有两个部分:1)有没有办法在 Chisel 中指定公共汽车,这样你就有通关门或传统的三州司机都挂在公共汽车上?
2)如果做不到这一点,在 Chisel 中是否有一种快速、小面积、低能耗的方法?
谢谢
tensorflow - tensorflow 0.8 一热编码
我要编码的数据如下所示:
[0 0 0 ...,42 42 42]
从 0-42 有 43 个班级
现在我读到 0.8 版中的 tensorflow 有一个热编码的新功能,所以我尝试按如下方式使用它:
唯一的问题是我认为输出不是我需要的
张量("strided_slice:0", shape=(43,), dtype=int32)
有人可以将我推向正确的方向吗:)
python - scikit 的 one-hot encoding 如何分配假人?
对于一篇研究论文,我将使用 lasso 模型来执行分类和特征选择。我正准备使用 one-hot 编码来处理我的分类数据,并且需要找出哪些特征映射到原始分类值,以确定最终为最终模型选择了哪些特征。我已经在谷歌上搜索了一段时间,但没有找到答案。
scikit 的 one-hot encoding 是如何赋值的?例如,假设我对某个变量的分类值为 {1, 2, 3, 4}。one-hot encoding 是否按时间顺序将它们组织成虚拟对象(即丢弃 1,使值 2 的第一个虚拟对象,值 3 的第二个虚拟对象,值 4 的第三个虚拟对象?还是根据它找到的顺序分配向下扫描行时使用不同的分类值(例如,第一个观察值的值为 3,第二个观察值的值为 2,因此删除了 3,第一个虚拟变量变为值 2)?
谢谢!
python - OneHotEncoding 转换解读
我试图通过 python 和 scikit-learn 了解 onehotencoding 过程的输出。我相信我得到了一种热编码的想法。即,将离散值转换为值为“on”的扩展特征向量,以识别分类的成员资格。也许我弄错了,这让我感到困惑,但这是我的理解。
所以,从这里的文档:http: //scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html
我看到以下示例:
有人可以解释一下数据 [[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]] 是如何最终转换为 [[ 1., 0., 0., 1., 0., 0., 1., 0., 0.]]?
如何使用转换参数 [0, 1, 1]?
非常感谢您对此的任何帮助
乔恩
python - 你如何在 Tensorflow 中解码 one-hot 标签?
一直在寻找,但似乎找不到任何关于如何从 TensorFlow 中的单热值解码或转换回单个整数的示例。
我使用tf.one_hot
并且能够训练我的模型,但在分类后如何理解标签有点困惑。我的数据是通过TFRecords
我创建的文件输入的。我想过在文件中存储一个文本标签,但无法让它工作。似乎TFRecords
无法存储文本字符串,或者我弄错了。
scikit-learn - 文本语料库中单词的一种热编码
如何使用 tensorflow 创建一个单词的热编码,每个单词由词汇大小的稀疏向量表示,并且该特定单词的索引等于 1 ?
就像是
oneHotEncoding(words = ['a','b','c','d']) -> [[1,0,0,0],[0,1,0,0],[0,0, 1,0],[0,0,0,1]] ?
python - 如何使用python处理测试数据集中看不见的分类值?
假设我有位置功能。在火车数据集中,它的唯一值是“NewYork”、“Chicago”。但在测试集中,它有“NewYork”、“Chicago”、“London”。那么在创建一种热门编码时如何忽略“伦敦”?换句话说,如何不对只出现在测试集中的类别进行编码?
python - 如何对具有两个值的列进行一次热编码?
如果我用 3 个可能的值对一列进行一次性编码,如下所示:
然后我得到:
这正是我想要的。3 列 = 每个可能值 1 列。
但是,如果我有 2 个像这样的可能值:
我得到:
这只有 1 列,即使我有 2 个可能的值。在这种情况下,我想结束的是:
在这种情况下,如何获得 2 列结果?
python - 在 Keras 中训练多类图像分类器
我正在按照教程学习使用 Keras 训练分类器
https://blog.keras.io/building-powerful-image-classification-models-using-very-little-data.html
具体来说,从作者给出的第二个脚本中,我想将脚本转换为可以训练多类分类器的脚本(猫和狗的二进制)。我的火车文件夹中有 5 个课程,所以我做了以下更改:
在train_top_model() 的函数中:
我变了
进入
完成训练后,该模型达到了接近 99% 的训练准确率,但只有验证准确率的 70% 左右。因此我开始思考,将 2 类培训转换为 5 类可能并不那么简单。标记类时可能需要使用 one-hot 编码(但我不知道如何)
编辑:
我也附上了我的微调脚本。另一个问题:微调开始时,准确率没有有效提高。
python - 如何使用分类单热标签进行 Keras 训练?
我的输入如下所示:
的 shape(1, num_samples, num_features)
和如下所示的标签:
的形状(1, num_samples, 2)
。
但是,当我尝试运行以下 Keras 代码时,我收到此错误:
ValueError: Error when checking model target: expected dense_1 to have 2 dimensions, but got array with shape (1, 8038, 2)
. 根据我的阅读,这似乎源于我的标签是二维的,而不仅仅是整数。这是正确的,如果是这样,我如何在 Keras 中使用 one-hot 标签?
这是代码:
这会立即引发上述错误:
谢谢!