我在以下示例数据的帮助下执行决策树。
所以我把上面的数据转换成LabelEncoder来执行Decision Tree,成功创建了一个DT模型。
所以现在我的要求是我想预测下面的值,那么如何在 python 代码中传递这些值。
为了预测现有值,我可以使用下面的预测代码。
model.predict([[2,1,1]])
完整代码
import pandas as pd
df = pd.read_csv(r"salaries.csv")
df.head()
inputs = df.drop('salary_more_then_100k',axis='columns')
target = df['salary_more_then_100k']
from sklearn.preprocessing import LabelEncoder
le_company = LabelEncoder()
le_job = LabelEncoder()
le_degree = LabelEncoder()
inputs['company_n'] = le_company.fit_transform(inputs['company'])
inputs['job_n'] = le_job.fit_transform(inputs['job'])
inputs['degree_n'] = le_degree.fit_transform(inputs['degree'])
inputs_n = inputs.drop(['company','job','degree'],axis='columns')
from sklearn import tree
model = tree.DecisionTreeClassifier()
model.fit(inputs_n, target)
model.score(inputs_n,target)