2

我想使用 GridSearchCV 来确定分类器的参数,并且使用管道似乎是一个不错的选择。

该应用程序将用于使用词袋特征的图像分类,但问题是存在不同的逻辑管道,具体取决于使用的是训练示例还是测试示例。

对于每个训练集,必须运行 KMeans 以生成将用于测试的词汇表,但对于测试数据,不运行 KMeans 过程。

我看不出如何为管道指定这种行为差异。

4

1 回答 1

3

您可能需要从KMeans该类派生并覆盖以下方法以使用您的词汇逻辑:

  • fit_transform只会在火车数据上调用

  • transform将在测试数据上调用

也许类派生并不总是最好的选择。您还可以编写自己的转换器类来包装对嵌入式 KMeans 模型的调用,并提供该类在第一阶段所期望的fit// API fit_transformtransformPipeline

于 2012-10-24T20:53:42.947 回答