我是 scikit-learn 库的新手,一直在尝试使用它来预测股票价格。我正在浏览它的文档并被困在他们解释的部分OneHotEncoder()
。这是他们使用的代码:
>>> from sklearn.preprocessing import OneHotEncoder
>>> enc = OneHotEncoder()
>>> enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
OneHotEncoder(categorical_features='all', dtype=<... 'numpy.float64'>,
handle_unknown='error', n_values='auto', sparse=True)
>>> enc.n_values_
array([2, 3, 4])
>>> enc.feature_indices_
array([0, 2, 5, 9])
>>> enc.transform([[0, 1, 1]]).toarray()
array([[ 1., 0., 0., 1., 0., 0., 1., 0., 0.]])
有人可以逐步向我解释这里发生了什么吗?我很清楚 One hot 编码器是如何工作的,但我无法弄清楚这段代码是如何工作的。任何帮助表示赞赏。谢谢!