3

我有很多数据,我想通过拆分我的数据并拟合在多个线程或多台机器中运行的多个估计器来并行化估计器拟合。

一些估计器为核外学习提供了一个 partial_fit API(例如PassiveAggressiveClassifier 这里

是否可以让多个估计器部分拟合,然后将它们各自的拟合组合成一个估计器?

4

1 回答 1

1

不使用标准 API。您可以对 and 进行平均coef_intercept_这将产生一个有意义的估计量。您想通过一个核心还是通过网络进行并行化?可能有更有效的选择,其中大部分需要更多的工作。SGD 有并行实现,但这些可能只会为庞大的数据集付费。您的数据有多大(样本数、特征数、稀疏性)?

于 2015-04-09T20:47:50.020 回答