python-3.x - 如何在决策树中获取新数据的标签编码器

翻译自：https://stackoverflow.com/questions/64076802 2020-09-26T10:55:29.193

161 次

我在以下示例数据的帮助下执行决策树。

所以我把上面的数据转换成LabelEncoder来执行Decision Tree，成功创建了一个DT模型。

所以现在我的要求是我想预测下面的值，那么如何在 python 代码中传递这些值。

为了预测现有值，我可以使用下面的预测代码。

model.predict([[2,1,1]])

完整代码

import pandas as pd

df = pd.read_csv(r"salaries.csv")
df.head()

inputs = df.drop('salary_more_then_100k',axis='columns')
target = df['salary_more_then_100k']

from sklearn.preprocessing import LabelEncoder
le_company = LabelEncoder()
le_job = LabelEncoder()
le_degree = LabelEncoder()

inputs['company_n'] = le_company.fit_transform(inputs['company'])
inputs['job_n'] = le_job.fit_transform(inputs['job'])
inputs['degree_n'] = le_degree.fit_transform(inputs['degree'])

inputs_n = inputs.drop(['company','job','degree'],axis='columns')

from sklearn import tree
model = tree.DecisionTreeClassifier()
model.fit(inputs_n, target)

model.score(inputs_n,target)

python-3.x - 如何在决策树中获取新数据的标签编码器

0 回答 0

Related

Reference