问题标签 [label-encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
210 浏览

python - 将来自用户输入的分类数据映射到其实际编码值以进行预测

我的数据集的一部分看起来像这样(我的实际数据中有许多其他处理器类型)

我创建了一个回归模型来预测何时Time作为输入给出。Type, TaskDifficulty

label encoding首先做了改变Processor,这是分类的。

这是我的回归模型

我想预测Time输入"i5", 20, 1

如何进行标签编码以将其映射到与编码到"i5"的编码数据帧中相同的值?i52

我试过这个

但是,当 i5 输入为 2 时,我得到的输出预测与实际值不同,

0 投票
0 回答
92 浏览

python - 标签编码器和随机森林分类器的在线学习

我有一个非常大的数据集需要用于分类,我对数据进行了采样,但这并不能保证我的输出中会包含整个标签。如何对数据进行采样以涵盖所有标签?此外,我想保存我在此过程中使用的label encoder和,以便将它们用于增量学习。RandomForestClassifier我搜索了使用RandomForestClassifier我发现该set_warm功能仅用于添加额外的估计器而不是更新权重。并且partial_fit不支持使用随机森林。所以我的第二个问题是如何更新label encoderRandomForestClassifier训练可能有其他标签和更多数据点的另一个数据集?

0 投票
0 回答
199 浏览

python - Dask-ml LabelEncoder.fit_tranform() throw AttributeError: 'bool' object has no attribute 'astype'

所以我尝试将 LabelEncoder() 函数应用于object在我的 Dask 数据帧上具有 dtype 的列:

但它总是抛出错误

这是完整的错误:

任何帮助表示赞赏:)

0 投票
1 回答
468 浏览

python - 特征选择和分类变量

我在一个主要包含二进制变量的数据集上工作。然而,其中两个是具有多个值(字符串)的分类。我想使用套索应用特征选择,但我有一个错误Keyerror: could not convert string to float:

我应该使用LabelEncoder然后进行功能选择吗?任何想法如何处理这个?

这是我的代码

0 投票
2 回答
40 浏览

pandas - 如何从熊猫的标签编码中排除一或两列?

代码如下。我想从标签编码代码中排除两列名称“卡类型”和“风险值”。如何排除那些?下面的代码将所有对象类型编码为数字。 列是警报编号 Job、Loan、City、Date、Card Type、Gender、Income level、EstimatedSalary、Risk Value

0 投票
1 回答
82 浏览

python - 在 Pandas(df.apply) 和维度问题 Python 中使用标签编码函数

我正在使用将标签编码为“制作列”的encode_labels函数train.csv

train.csv如下:

和代码

通常encode_labels函数的输出是这样的:[[[0., 1., 0.]]也是二维的。

我想用df['encoded_label'] = df.apply(lambda x: encode_labels(['Make']), axis=1).但是这个功能出来了[[1.0]]。我找不到我做错的地方。

我得到了这样的打印输出

1-) 我认为使用 lamda 有问题。Lambda 无法正常工作。使用 lambda 也有问题吗?

encode_labels2-) 函数是二维的这一事实也给我带来了问题。那么我们如何将这个输出转换([[0., 0., 0., 1.]])为一维呢?

我们该如何处理这两个问题?

非常感谢。

0 投票
1 回答
353 浏览

python - y 包含以前看不见的标签:标签编码器中的“男性”

我正在尝试使用 LabelEncoder 将我的数据集的分类列转换为数字。 数据集

这是转换代码:

转换后的数据集看起来像转换后的数据

但问题是,每当我尝试转换我的测试数据集时,它都会给出一个错误

测试数据转换代码:

测试数据

现在我该如何解决这个问题?

0 投票
2 回答
22 浏览

python - 了解哪个值对应于特定列值

我希望找到数据框中输入定义的键值的索引的确切值,下面是我试图获取它的代码。

data_who = pd.DataFrame({'index':data['index'], 'Publisher_Key':data['Key']})

下面是我的 O/P 数据框:

在此处输入图像描述

如果假设我给一个输入说 100 作为键值,我想得到索引值的 O/P,即 Goat,我应该在我的代码中做什么?

PS:标签编码后的数据中标签过多,所以想知道标签的值对应于哪个类别。

0 投票
1 回答
2278 浏览

python - 值错误:y 包含以前看不见的标签:

我已经使用过Decision Tree Classifier并且我想输入 myinput作为string而不是给出一个integer 值,但它给了我error这样的信息:

代码:

0 投票
0 回答
18 浏览

numpy-ndarray - 数组切片未按预期返回一维数组

我正在尝试将我的数据框拆分为标签(最后一列)和特征(其余列),以便我可以通过分类器运行它。

这是我到目前为止所做的:

但是,在运行此函数时,我的特征 (y) 似乎返回 690 x 12,而不是预期的一维数组。有关完整的错误消息,请参阅附图。

我会很感激任何关于我在哪里出错的指示......

我是一名 Python 初学者,这是我在堆栈上的第一篇文章,如果这篇文章的结构不恰当,敬请见谅。