2

如果我在完成之前中断 grid_search.fit() 我会失去到目前为止所做的一切吗?我对网格搜索有点不知所措,并提供了一个非常大的搜索空间。我可以看到我已经满意的分数,但我的标准输出没有显示导致这些分数的参数。

我搜索了文档:http ://scikit-learn.org/stable/modules/generated/sklearn.grid_search.GridSearchCV.html

几年前有一个关于在此处添加并行搜索功能的讨论:https ://sourceforge.net/p/scikit-learn/mailman/message/31036457/

但没有什么确定的。我的搜索已经工作了约 48 小时,所以我不想丢失已发现的内容,但我也不想继续。

谢谢!

4

1 回答 1

3

欢迎来到!

据我了解,grid_search 函数不会返回任何中间变量,只有生成的网格及其分数(有关更多信息,请参见此处grid search.py​​ )。

因此,如果您取消它,您可能会丢失迄今为止所做的工作。

但是有一点建议,48 小时是很长的时间(显然这取决于要调整的超参数的行、列和数量)。您可能希望先从更广泛的网格搜索开始,然后再细化您的参数搜索。

这将通过两种方式使您受益:

  1. 运行时间最终可能会更短(请参阅上面的警告),这意味着您不必等待这么长时间并冒失去结果的风险

  2. 您可能会发现您的模型预测分数仅受一两个超参数的影响,让您可以保持其他搜索范围更广,并将您的精力集中在影响预测准确性的参数上。

希望当我写下这个回复时,您的网格搜索已经完成!

于 2016-09-07T21:59:46.013 回答