我的数据集的一部分看起来像这样(我的实际数据中有许多其他处理器类型)
df.head(4)
Processor Task Difficulty Time
i3 34 3 6
i7 34 3 4
i3 50 1 6
i5 25 2 5
我创建了一个回归模型来预测何时Time
作为输入给出。Type, Task
Difficulty
我label encoding
首先做了改变Processor
,这是分类的。
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
df['Processor'] = le.fit_transform(df['Processor'])
df.head(4)
Processor Task Difficulty Time
12 34 3 6
8 34 3 4
12 50 1 6
2 25 2 5
这是我的回归模型
from sklearn.ensemble import RandomForestRegressor
rf_model = RandomForestRegressor(random_state = 1)
rf_model.fit(features,target)
我想预测Time
输入"i5", 20, 1
。
如何进行标签编码以将其映射到与编码到"i5"
的编码数据帧中相同的值?i5
2
我试过这个
rf_model.predict([[le.fit_transform('i5'),20,1]])
但是,当 i5 输入为 2 时,我得到的输出预测与实际值不同,
rf_model.predict([[2,20,1)]])