问题标签 [online-machine-learning]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
57 浏览

multilabel-classification - vowpal wabbit:multilable_oaa 不返回所有输入的标签

我必须预测两个标签,并使用以下方法创建了一个模型:

model = vw("--multilabel_oaa 50 --ngram E2 -b 24 -l2")

这会在 65% 的预测中返回两个标签。但在其余情况下,它只返回一个标签,在某些情况下甚至返回三个标签,而且预测也是空的。

我尝试过使用 oaa 来预测标签的两个独立模型。但是想将它与这种方法进行比较,但我无法得到预期的预测。

0 投票
0 回答
22 浏览

python - 是否可以在 sklearn 中更新经过训练的模型?

对于任何 Python sklearn 学习模型,是否有可能更新已经拟合的模型?例如,如果我在大量数据上训练了我的模型,是否可以通过引入新数据来更新训练,还是每次都必须重新训练?

0 投票
0 回答
60 浏览

python - 实施中的 Keras 在线学习问题

我希望 LSTM 学习更新的数据。它需要根据新数据的趋势进行自我更新,我希望将其保存在文件中。然后我希望将这个预先输入的训练文件调用到任何其他完成测试的 X、Y、Z 新文件中。所以我希望用新数据“重新拟合”[更新而不是重新训练]模型,以便模型参数只是更新而不是重新初始化。我知道这是在线学习,但是如何通过 Keras 来实施呢?有人可以建议如何成功实施它吗?

0 投票
0 回答
92 浏览

python - 标签编码器和随机森林分类器的在线学习

我有一个非常大的数据集需要用于分类,我对数据进行了采样,但这并不能保证我的输出中会包含整个标签。如何对数据进行采样以涵盖所有标签?此外,我想保存我在此过程中使用的label encoder和,以便将它们用于增量学习。RandomForestClassifier我搜索了使用RandomForestClassifier我发现该set_warm功能仅用于添加额外的估计器而不是更新权重。并且partial_fit不支持使用随机森林。所以我的第二个问题是如何更新label encoderRandomForestClassifier训练可能有其他标签和更多数据点的另一个数据集?

0 投票
0 回答
96 浏览

python - 使用 SKlearn 预训练/重新训练核岭回归

我目前正在对数据集的前 30% 训练一个 Kernel Ridge 回归模型来预测最后 70%。由于我有许多有点相似的数据集,所以我想使用一个已经训练过的模型(在整个数据集上训练过),并将其拟合到一个新的数据集,其中参数和权重不仅被覆盖,而是被调整为来自旧模型的新数据。在查看 SKlearns Kernel Ridge Regression 的文档时,我似乎无法弄清楚如何做到这一点。我发现其他模型具有 partial.fit() 功能,但 KRR 不存在此功能。

所以我想知道是否有解决方法,或者是否真的有一个功能可以实现我想要做的事情。

0 投票
0 回答
27 浏览

python - 使用 river.stream.iter_csv() 循环数据集的 MemoryError

https://www.pyimagesearch.com/2019/06/17/online-incremental-learning-with-keras-and-creme/ 我练习在线学习并点击此链接。

因为我错误地安装了 creme,所以我找到了替代工具 River。

当我运行块时:

我看到内存错误:

任何人都知道为什么会发生此错误以及如何解决?

0 投票
1 回答
31 浏览

python - 如何使用 python 中的新数据集/数据农场更新训练有素的 IsolationForest 模型?

假设我IsolationForest()在基于时间序列的 Dataset1 或 dataframe1 上拟合来自 scikit-learn 的算法,并使用此处此处df1提到的方法保存模型。现在我想为的dataset2 或.df2

我的发现:

...从小批量实例中增量学习(有时称为“在线学习”)是核心外学习的关键,因为它保证在任何给定时间,主实例中只有少量实例记忆。为平衡相关性和内存占用的小批量选择合适的大小可能涉及调整。

但遗憾的是 IF 算法不支持estimator.partial_fit(newdf)

如何使用新的 Dataset2 更新在 Dataset1 上训练和保存的 IF 模型?