我想知道是否可以获得 pandas.get_dummies 的功能名称,以便将其传递给 export_graphviz。我正在使用 get_dummies 为 sklearn DecisionTreeClassifier 编码我的数据集。当我导出树时,我希望节点的输出更易于阅读。
先感谢您!
编辑:
这是我要完成的一个示例:
#Concatenate the sets
concated = pd.concat([train_file, test_file])
#Get the encoded set
concated_encoded = pd.get_dummies(concated, columns=cols_to_retain)
#Separate the sets
train = concated_encoded[concated_encoded["Train"] == 1]
test = concated_encoded[concated_encoded["Train"] == 0]
train = train.drop(["Train"], axis=1)
test = test.drop(["Train"], axis=1)
X_train, X_val, y_train, y_val = train_test_split(train, train_outcome, test_size=0.15)
clf = DecisionTreeClassifier(criterion='entropy')
clf = clf.fit(X_train,y_train)
y_pred_val = clf.predict(X_val)
import StringIO
import pydot
dot_data = StringIO.StringIO()
我希望能够使用 feature_names 参数标记功能
export_graphviz(clf, out_file=dot_data, feature_names=())
graph = pydot.graph_from_dot_data(dot_data.getvalue())
graph.write_png('tree.png')