我正在尝试FeatureUnion
从数据结构中提取不同的特征,但由于维度不同而失败:ValueError: blocks[0,:] has incompatible row dimensions
实施
我FeatureUnion
的构建方式如下:
features = FeatureUnion([
('f1', Pipeline([
('get', GetItemTransformer('f1')),
('transform', vectorizer_f1)
])),
('f2', Pipeline([
('get', GetItemTransformer('f2')),
('transform', vectorizer_f1)
]))
])
GetItemTransformer
用于从同一结构中获取数据的不同部分。这个想法在scikit-learn 问题跟踪器中进行了描述。
结构本身存储为具有不同长度的不同列表{'f1': data_f1, 'f2': data_f2}
。data_f1
问题
由于 Y 向量与数据字段不同,我假设会发生错误,但是如何缩放向量以适应这两种情况?