问题标签 [label-encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
33 浏览

python - Sklearn 标签编码器 - 基于预测和逆变换未获得所需的输出

我是使用 scikit 的 Python ML 的新手。我正在研究一个解决方案来创建一个包含三列宠物、所有者和位置的模型。

现在,我使用标签编码器对整个数据帧进行编码。

现在,我将编码数组拆分为输入集(宠物和所有者)和输出集(位置)

然后,我创建了一个新的决策树分类器模型并拟合输入和输出集。

现在,我正在尝试使用新数据框的模型来预测位置。我正在使用与之前使用的相同的标签编码器。

有了这个,我期待看到“圣地亚哥”的价值。不确定,为什么我会得到“冠军”作为输出。

有人可以帮我解决这个问题吗?

0 投票
1 回答
39 浏览

scikit-learn - 使用 sklearn 继续使用 LabelEncoder 以恢复耦合的好方法是什么?

例如,我有一个具有分类值的数据框,例如城市名称。

对于 ML 算法,我需要将数据编码为数值。

我这样做:

我的问题是,如果我以后想知道例如哪个城市对应于编码值 2。

2 例如可以是“巴黎”。

在编码之前,我这样做是为了取回信息:

没用吗?你如何进行?谢谢

0 投票
0 回答
8 浏览

xgboost - XGBoost 标签编码数据中缺少标签?

我在具有数字特征和分类标签的数据集上使用 XGBoost。标签是在较早阶段分配的类别编号(整数)。

如果类标签是一组非连续整数,XGBoost 会如何反应?示例:[3、5、9、3、10]

我想知道我是否可以跳过使用 LabelEncoder 并仍然得到正确的结果。

0 投票
0 回答
15 浏览

scikit-learn - scikit learn label encoding 打印为行而不是列

我正在尝试使用 sci kit learn 的内置函数进行标签编码,但为什么我的结果打印为行而不是附加列?

在此处输入图像描述

0 投票
1 回答
22 浏览

python - 在数据帧中进行 onehotencoding 和 labelencoding 的函数

AttributeError: 'DataFrame' object has no attribute 'column'当我在数据框中的列上运行函数时,我不断得到

0 投票
0 回答
10 浏览

label-encoding - LABLE ENDCONDING 引发错误设置和复制警告

:1: SettingWithCopyWarning: 试图在 DataFrame 中的切片副本上设置一个值。尝试改用 .loc[row_indexer,col_indexer] = value

请参阅文档中的注意事项:https: //pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy X_train['business_code_enc'] = business_coder.fit_transform (X_train.business_code)

0 投票
1 回答
19 浏览

python - 熊猫中的LabelEncoding在一列上具有跨行的字符串列表

我想 LabelEncode 熊猫中的一列,其中每一行都包含一个字符串列表。由于类似的字符串/文本在各行中具有相同的含义,因此编码应该尊重这一点,并最好用唯一的数字对其进行编码。想象:

当我执行以下操作时:

它返回:

这不是预期的结果。这里每一行都是独立的 LabelEncoded。并且第一行中的字符串(例如“OK”)未编码为第三行或第四行中的字符串。理想情况下,我想让它们跨行全局编码。也许一种方法是从该列中创建一个语料库,并使用 Tokenization 或 LabelEncoding 获得一个映射来手动编码列表?如何将包含字符串列表的熊猫列中的然后转换为语料库文本?或者有没有更好的方法?

预期结果(假设):