我正在使用sklearn.preprocessing.OneHotEncoder对表格的分类数据进行编码
A=array([[1,4,1],[0,3,2]])
B=array([[1,4,7],[0,3,2]])
假设我A
在这.fit(A)
一步和B
某个时刻使用新数据作为.transform(B)
. 如果B
包含关于 的不可见值A
,则这样做会产生feature out of bounds error
. 是否可以B
包含新的看不见的值,以便转换步骤将所有二进制文件设置为零以获取相关值?
ValueError: Feature out of bounds. Try setting n_values.
我知道我可以随时更改功能范围.fit
。但是,如果我使用A
作为训练数据,每次我得到一个新的集合 B 来预测时,我都必须弄乱我的初始编码。
谢谢。