问题标签 [label-encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 将来自用户输入的分类数据映射到其实际编码值以进行预测
我的数据集的一部分看起来像这样(我的实际数据中有许多其他处理器类型)
我创建了一个回归模型来预测何时Time
作为输入给出。Type, Task
Difficulty
我label encoding
首先做了改变Processor
,这是分类的。
这是我的回归模型
我想预测Time
输入"i5", 20, 1
。
如何进行标签编码以将其映射到与编码到"i5"
的编码数据帧中相同的值?i5
2
我试过这个
但是,当 i5 输入为 2 时,我得到的输出预测与实际值不同,
python - 标签编码器和随机森林分类器的在线学习
我有一个非常大的数据集需要用于分类,我对数据进行了采样,但这并不能保证我的输出中会包含整个标签。如何对数据进行采样以涵盖所有标签?此外,我想保存我在此过程中使用的label encoder
和,以便将它们用于增量学习。RandomForestClassifier
我搜索了使用RandomForestClassifier
我发现该set_warm
功能仅用于添加额外的估计器而不是更新权重。并且partial_fit
不支持使用随机森林。所以我的第二个问题是如何更新label encoder
和RandomForestClassifier
训练可能有其他标签和更多数据点的另一个数据集?
python - Dask-ml LabelEncoder.fit_tranform() throw AttributeError: 'bool' object has no attribute 'astype'
所以我尝试将 LabelEncoder() 函数应用于object
在我的 Dask 数据帧上具有 dtype 的列:
但它总是抛出错误
这是完整的错误:
任何帮助表示赞赏:)
python - 特征选择和分类变量
我在一个主要包含二进制变量的数据集上工作。然而,其中两个是具有多个值(字符串)的分类。我想使用套索应用特征选择,但我有一个错误Keyerror: could not convert string to float:
我应该使用LabelEncoder
然后进行功能选择吗?任何想法如何处理这个?
这是我的代码
pandas - 如何从熊猫的标签编码中排除一或两列?
代码如下。我想从标签编码代码中排除两列名称“卡类型”和“风险值”。如何排除那些?下面的代码将所有对象类型编码为数字。 列是警报编号 Job、Loan、City、Date、Card Type、Gender、Income level、EstimatedSalary、Risk Value
python - 在 Pandas(df.apply) 和维度问题 Python 中使用标签编码函数
我正在使用将标签编码为“制作列”的encode_labels
函数train.csv
。
train.csv
如下:
和代码
通常encode_labels
函数的输出是这样的:[[[0., 1., 0.]]
也是二维的。
我想用df['encoded_label'] = df.apply(lambda x: encode_labels(['Make']), axis=1).
但是这个功能出来了[[1.0]]
。我找不到我做错的地方。
我得到了这样的打印输出
1-) 我认为使用 lamda 有问题。Lambda 无法正常工作。使用 lambda 也有问题吗?
encode_labels
2-) 函数是二维的这一事实也给我带来了问题。那么我们如何将这个输出转换([[0., 0., 0., 1.]])
为一维呢?
我们该如何处理这两个问题?
非常感谢。
python - 值错误:y 包含以前看不见的标签:
我已经使用过Decision Tree Classifier
并且我想输入 myinput
作为string
而不是给出一个integer
值,但它给了我error
这样的信息:
代码:
numpy-ndarray - 数组切片未按预期返回一维数组
我正在尝试将我的数据框拆分为标签(最后一列)和特征(其余列),以便我可以通过分类器运行它。
这是我到目前为止所做的:
但是,在运行此函数时,我的特征 (y) 似乎返回 690 x 12,而不是预期的一维数组。有关完整的错误消息,请参阅附图。
我会很感激任何关于我在哪里出错的指示......
我是一名 Python 初学者,这是我在堆栈上的第一篇文章,如果这篇文章的结构不恰当,敬请见谅。