问题标签 [label-encoding]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

87 问题

0 投票

1 回答

83 浏览

python - 是否可以将 sklearn.preprocessing.LabelEncoder() 应用于 2D 列表？

假设我有一个如下列表：

我想用 LabelEncoder() 对二维列表进行编码。

它应该看起来像：

是否可以？如果没有，是否有任何解决方法？

提前致谢！

python label-encoding

2021-04-20T18:40:32.110

0 投票

1 回答

128 浏览

python - 使用 LabelEncoder 转换数据

我写了这个函数来用 LabelEncoder 转换分类特征

这些列中有空值，但是有这样的错误

有谁知道如何帮助我解决这个问题？谢谢

2021-04-28T03:20:53.397

0 投票

1 回答

74 浏览

python - 在某些列上标注编码器和 Inverse_Transform

假设我有一个如下的数据框

我想使用标签编码器对“动物”、“颜色”、“性别”和“名称”进行编码，但我不需要对其他两列进行编码。我还希望能够在之后对列进行 inverse_transform。

我尝试了以下方法，尽管编码按我的预期工作，但反转却没有。

inverse_transform 函数产生以下数据帧：

动物	颜色	年龄	宠物	性别	姓名
雷克斯	嘘	1	1	小发明	雷克斯
嘘	小发明	10	0	小发明	小发明
雷克斯	雷克斯	3	1	嘘	苏西
小发明	嘘	6	1	嘘	嘘

这显然是不对的，但我不确定我还能如何做到这一点？

任何意见，将不胜感激！

python pandas scikit-learn label-encoding

2021-04-29T00:27:14.980

0 投票

0 回答

65 浏览

python - 问题类型错误：参数必须是字符串或数字

只有一个分类列，我想对其进行编码，它在笔记本上运行良好，但是当它被上传到 aicrowd 平台时，它会产生这个麻烦。共有 3 个分类特征，其中一个是目标特征，一个是 id 行，在将它们排除在训练之外后，我只剩下一个特征。

我的错误是

python label-encoding

2021-05-05T07:03:51.177

0 投票

1 回答

149 浏览

python - 标签编码器如何分配相同的数字？

我的数据框中有该列

我是对列进行编码的标签，它将 0 分配给 London ， 1 分配给 Paris ， 2 分配给 New York 。但是，当我从模型中传递单个值进行预测时，我给出了城市名称 New York 并将 0 分配给它。它应该如何保持不变，我希望如果纽约值在训练阶段通过标签编码器分配 2，它应该在预测时再次分配 2。

python pandas dataframe machine-learning label-encoding

2021-05-09T09:25:46.933

0 投票

1 回答

197 浏览

python - 标签编码器 - 使用 Inverse_transform 函数

我试图弄清楚如何使用 LabelEncoder() 中的 inverse_transform 函数。例如，在下面的代码中，

如果我想反转，我可以简单地调用：

但是，我需要将相同的变换/逆变换应用到一个新的数据集中，这可以从上面的模型中预测出来。即，它是在一个新笔记本中完成的，所以，我似乎必须存储标签。任何想法如何做到这一点？我唯一的想法是导出一个包含 2 列的数据框，然后使用 pd.merge。

python pandas scikit-learn label-encoding

2021-06-08T13:54:44.617

0 投票

2 回答

143 浏览

python - LabelEncoder().fit_transform 给我负值？

嘿，

我的数据集中的“城市”列中有不同的城市名称。我很想使用 LabelEncoder() 对其进行编码。但是，我得到了非常令人沮丧的负值结果

df['city_enc'] = LabelEncoder().fit_transform(df['City']).astype('int8')

新的 city_enc 列给了我从 -128 到 127 的值。我不明白为什么 LabelEncoder().fit_transform 给了我负值？我希望它会给出从 0 到 (n-1) 的值。谁能给我解释一下？

最好的问候，兰阮

python scikit-learn sklearn-pandas one-hot-encoding label-encoding

2021-07-01T11:47:42.003

0 投票

0 回答

57 浏览

fasttext - 为什么fastText的文本分类示例没有在标签上应用LabelEncoder

我是 fastText 的新手，并且已经阅读了教程：https ://fasttext.cc/docs/en/supervised-tutorial.html 。

我下载了示例数据，发现标签是字符串类型。

以及教程中的训练和测试代码。

我的问题是为什么不应用标签（比如sklearn）LabelEncoder？我已经运行了这个例子，它运行良好。我很困惑。

[更新] - - - -

IMO，代码如下所示

fasttext label-encoding

2021-07-06T04:11:40.423

0 投票

2 回答

221 浏览

python - 标签编码然后估算缺失然后逆编码

我有一个关于警察杀人的数据集，你可以在 Kaggle 上找到。几列中缺少一些数据：

我创建了原始 df 的副本对其进行编码，然后估算缺失值。我的计划是：

标签编码所有分类列：

现在我有我的所有类别编码的数据框。

然后，我在原始数据帧 (pf) 中找到了这些 nan 值，以替换 lpfdf 中那些编码的 nan：

性别 8
种族 3965
城市 4 州 0 Manner_of_death 0 武装 5677 Mental_illness 0
逃离 0

例如，Gender 有三个编码标签：0 代表男性，1 代表女性，2 代表 nan。但是，要素 City 具有 >3000 个值，并且无法使用 value_counts() 找到它。出于这个原因，我使用了：

这产生了：

(数组([ 4110, 9093, 10355, 10549], dtype=int64), 数组([0, 0, 0, 0], dtype=int64))

查看与索引对应的任何这些行，我看到 City 的 nan 标签是 3327：

然后我开始用这些标签替换 np.nan：

创建迭代 imputer 的实例，然后拟合和转换 lpfdf：

然后为这些新的估算值创建一个数据框：

最后，当我去 inveres 变换查看它估算的相应标签时，我收到以下错误：

我的步骤有什么问题？很抱歉我的冗长解释，但我觉得我需要解释所有步骤，以便您能够正确理解问题。谢谢你们。

python pandas scikit-learn imputation label-encoding

2021-07-29T10:23:42.350

0 投票

0 回答

21 浏览

model - ValueError：y 包含以前看不见的标签：'Barred Tee'

这些行我总是得到相同的错误，即使这些行之前没有错误。

谁能建议我如何克服这个问题？

model conv-neural-network label-encoding

2021-09-01T19:55:19.227

1 2 3 4 5 6 7 8 9 10

问题标签 [label-encoding]

Reference