问题标签 [label-encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
83 浏览

python - 是否可以将 sklearn.preprocessing.LabelEncoder() 应用于 2D 列表?

假设我有一个如下列表:

我想用 LabelEncoder() 对二维列表进行编码。

它应该看起来像:

是否可以?如果没有,是否有任何解决方法?

提前致谢!

0 投票
1 回答
128 浏览

python - 使用 LabelEncoder 转换数据

我写了这个函数来用 LabelEncoder 转换分类特征

这些列中有空值,但是有这样的错误

有谁知道如何帮助我解决这个问题?谢谢

0 投票
1 回答
74 浏览

python - 在某些列上标注编码器和 Inverse_Transform

假设我有一个如下的数据框

我想使用标签编码器对“动物”、“颜色”、“性别”和“名称”进行编码,但我不需要对其他两列进行编码。我还希望能够在之后对列进行 inverse_transform。

我尝试了以下方法,尽管编码按我的预期工作,但反转却没有。

inverse_transform 函数产生以下数据帧:

动物 颜色 年龄 宠物 性别 姓名
雷克斯 1 1 小发明 雷克斯
小发明 10 0 小发明 小发明
雷克斯 雷克斯 3 1 苏西
小发明 6 1

这显然是不对的,但我不确定我还能如何做到这一点?

任何意见,将不胜感激!

0 投票
0 回答
65 浏览

python - 问题类型错误:参数必须是字符串或数字

只有一个分类列,我想对其进行编码,它在笔记本上运行良好,但是当它被上传到 aicrowd 平台时,它会产生这个麻烦。共有 3 个分类特征,其中一个是目标特征,一个是 id 行,在将它们排除在训练之外后,我只剩下一个特征。

我的错误是

0 投票
1 回答
149 浏览

python - 标签编码器如何分配相同的数字?

我的数据框中有该列

我是对列进行编码的标签,它将 0 分配给 London , 1 分配给 Paris , 2 分配给 New York 。但是,当我从模型中传递单个值进行预测时,我给出了城市名称 New York 并将 0 分配给它。它应该如何保持不变,我希望如果纽约值在训练阶段通过标签编码器分配 2,它应该在预测时再次分配 2。

0 投票
1 回答
197 浏览

python - 标签编码器 - 使用 Inverse_transform 函数

我试图弄清楚如何使用 LabelEncoder() 中的 inverse_transform 函数。例如,在下面的代码中,

如果我想反转,我可以简单地调用:

但是,我需要将相同的变换/逆变换应用到一个新的数据集中,这可以从上面的模型中预测出来。即,它是在一个新笔记本中完成的,所以,我似乎必须存储标签。任何想法如何做到这一点?我唯一的想法是导出一个包含 2 列的数据框,然后使用 pd.merge。

0 投票
2 回答
143 浏览

python - LabelEncoder().fit_transform 给我负值?

嘿,

我的数据集中的“城市”列中有不同的城市名称。我很想使用 LabelEncoder() 对其进行编码。但是,我得到了非常令人沮丧的负值结果

df['city_enc'] = LabelEncoder().fit_transform(df['City']).astype('int8')

新的 city_enc 列给了我从 -128 到 127 的值。我不明白为什么 LabelEncoder().fit_transform 给了我负值?我希望它会给出从 0 到 (n-1) 的值。谁能给我解释一下?

最好的问候,兰阮

0 投票
0 回答
57 浏览

fasttext - 为什么fastText的文本分类示例没有在标签上应用LabelEncoder

我是 fastText 的新手,并且已经阅读了教程:https ://fasttext.cc/docs/en/supervised-tutorial.html 。

我下载了示例数据,发现标签是字符串类型。

以及教程中的训练和测试代码。

我的问题是为什么不应用标签(比如sklearn)LabelEncoder?我已经运行了这个例子,它运行良好。我很困惑。

[更新] - - - -

IMO,代码如下所示

0 投票
2 回答
221 浏览

python - 标签编码然后估算缺失然后逆编码

我有一个关于警察杀人的数据集,你可以在 Kaggle 上找到。几列中缺少一些数据:

我创建了原始 df 的副本对其进行编码,然后估算缺失值。我的计划是:

  1. 标签编码所有分类列:

现在我有我的所有类别编码的数据框。

  1. 然后,我在原始数据帧 (pf) 中找到了这些 nan 值,以替换 lpfdf 中那些编码的 nan:

性别 8
种族 3965
城市 4 州 0 Manner_of_death 0 武装 5677 Mental_illness 0
逃离 0

例如,Gender 有三个编码标签:0 代表男性,1 代表女性,2 代表 nan。但是,要素 City 具有 >3000 个值,并且无法使用 value_counts() 找到它。出于这个原因,我使用了:

这产生了:

(数组([ 4110, 9093, 10355, 10549], dtype=int64), 数组([0, 0, 0, 0], dtype=int64))

查看与索引对应的任何这些行,我看到 City 的 nan 标签是 3327:

然后我开始用这些标签替换 np.nan:

  1. 创建迭代 imputer 的实例,然后拟合和转换 lpfdf:

然后为这些新的估算值创建一个数据框:

最后,当我去 inveres 变换查看它估算的相应标签时,我收到以下错误:

我的步骤有什么问题?很抱歉我的冗长解释,但我觉得我需要解释所有步骤,以便您能够正确理解问题。谢谢你们。

0 投票
0 回答
21 浏览

model - ValueError:y 包含以前看不见的标签:'Barred Tee'

这些行我总是得到相同的错误,即使这些行之前没有错误。

代码和错误图像

谁能建议我如何克服这个问题?