问题标签 [label-encoding]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

87 问题

0 投票

2 回答

210 浏览

python - 将来自用户输入的分类数据映射到其实际编码值以进行预测

我的数据集的一部分看起来像这样（我的实际数据中有许多其他处理器类型）

我创建了一个回归模型来预测何时Time作为输入给出。Type, TaskDifficulty

我label encoding首先做了改变Processor，这是分类的。

这是我的回归模型

我想预测Time输入"i5", 20, 1。

如何进行标签编码以将其映射到与编码到"i5"的编码数据帧中相同的值？i52

我试过这个

但是，当 i5 输入为 2 时，我得到的输出预测与实际值不同，

python scikit-learn regression categorical-data label-encoding

2021-01-06T08:43:26.027

0 投票

0 回答

92 浏览

python - 标签编码器和随机森林分类器的在线学习

我有一个非常大的数据集需要用于分类，我对数据进行了采样，但这并不能保证我的输出中会包含整个标签。如何对数据进行采样以涵盖所有标签？此外，我想保存我在此过程中使用的label encoder和，以便将它们用于增量学习。RandomForestClassifier我搜索了使用RandomForestClassifier我发现该set_warm功能仅用于添加额外的估计器而不是更新权重。并且partial_fit不支持使用随机森林。所以我的第二个问题是如何更新label encoder和RandomForestClassifier训练可能有其他标签和更多数据点的另一个数据集？

python classification random-forest label-encoding online-machine-learning

2021-01-20T08:54:50.030

0 投票

0 回答

199 浏览

python - Dask-ml LabelEncoder.fit_tranform() throw AttributeError: 'bool' object has no attribute 'astype'

所以我尝试将 LabelEncoder() 函数应用于object在我的 Dask 数据帧上具有 dtype 的列：

但它总是抛出错误

这是完整的错误：

任何帮助表示赞赏:)

python dataframe dask label-encoding dask-ml

2021-01-21T19:01:40.923

0 投票

1 回答

468 浏览

python - 特征选择和分类变量

我在一个主要包含二进制变量的数据集上工作。然而，其中两个是具有多个值（字符串）的分类。我想使用套索应用特征选择，但我有一个错误Keyerror: could not convert string to float:

我应该使用LabelEncoder然后进行功能选择吗？任何想法如何处理这个？

这是我的代码

python scikit-learn feature-selection label-encoding

2021-01-23T15:06:14.380

0 投票

2 回答

40 浏览

pandas - 如何从熊猫的标签编码中排除一或两列？

代码如下。我想从标签编码代码中排除两列名称“卡类型”和“风险值”。如何排除那些？下面的代码将所有对象类型编码为数字。 列是警报编号 Job、Loan、City、Date、Card Type、Gender、Income level、EstimatedSalary、Risk Value

pandas dataframe machine-learning data-science label-encoding

user13510399

2021-01-25T09:20:57.427

0 投票

1 回答

82 浏览

python - 在 Pandas(df.apply) 和维度问题 Python 中使用标签编码函数

我正在使用将标签编码为“制作列”的encode_labels函数train.csv。

train.csv如下：

和代码

通常encode_labels函数的输出是这样的：[[[0., 1., 0.]]也是二维的。

我想用df['encoded_label'] = df.apply(lambda x: encode_labels(['Make']), axis=1).但是这个功能出来了[[1.0]]。我找不到我做错的地方。

我得到了这样的打印输出

1-) 我认为使用 lamda 有问题。Lambda 无法正常工作。使用 lambda 也有问题吗？

encode_labels2-) 函数是二维的这一事实也给我带来了问题。那么我们如何将这个输出转换([[0., 0., 0., 1.]])为一维呢？

我们该如何处理这两个问题？

非常感谢。

python pandas dataframe lambda label-encoding

2021-01-28T18:15:11.593

0 投票

1 回答

353 浏览

python - y 包含以前看不见的标签：标签编码器中的“男性”

我正在尝试使用 LabelEncoder 将我的数据集的分类列转换为数字。数据集

这是转换代码：

转换后的数据集看起来像转换后的数据集

但问题是，每当我尝试转换我的测试数据集时，它都会给出一个错误

测试数据转换代码：

现在我该如何解决这个问题？

python pandas scikit-learn label-encoding

2021-02-25T08:50:52.907

0 投票

2 回答

22 浏览

python - 了解哪个值对应于特定列值

我希望找到数据框中输入定义的键值的索引的确切值，下面是我试图获取它的代码。

data_who = pd.DataFrame({'index':data['index'], 'Publisher_Key':data['Key']})

下面是我的 O/P 数据框：

如果假设我给一个输入说 100 作为键值，我想得到索引值的 O/P，即 Goat，我应该在我的代码中做什么？

PS：标签编码后的数据中标签过多，所以想知道标签的值对应于哪个类别。

python dataframe categorical-data label-encoding

2021-02-27T06:58:04.243

0 投票

1 回答

2278 浏览

python - 值错误：y 包含以前看不见的标签：

我已经使用过Decision Tree Classifier并且我想输入 myinput作为string而不是给出一个integer 值，但它给了我error这样的信息：

代码：

python machine-learning decision-tree label-encoding

2021-02-27T07:19:39.320

0 投票

0 回答

18 浏览

numpy-ndarray - 数组切片未按预期返回一维数组

我正在尝试将我的数据框拆分为标签（最后一列）和特征（其余列），以便我可以通过分类器运行它。

这是我到目前为止所做的：

但是，在运行此函数时，我的特征 (y) 似乎返回 690 x 12，而不是预期的一维数组。有关完整的错误消息，请参阅附图。

我会很感激任何关于我在哪里出错的指示......

我是一名 Python 初学者，这是我在堆栈上的第一篇文章，如果这篇文章的结构不恰当，敬请见谅。

numpy-ndarray numpy-slicing label-encoding

2021-04-06T12:11:39.380

1 2 3 4 5 6 7 8 9 10