问题标签 [creme]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
658 浏览

machine-learning - 如何在 NLP 中实现增量学习

我们正在构建一个系统,在该系统中,我们将从最初的非常少量的训练数据开始。工作是将传入的数据(文档,对于我们的例子)分为 2 类:A 类和 B 类。数据是文档,所以用户需要将文档分类为 A 类或 B 类。所以,数量有限数据,我们创建训练数据集,并开始使用训练数据集预测下一个文档的类别。

现在,如果预测正确,用户将移动到下一个文档。但是如果预测不正确,则用户输入正确的类别(假设类别 A 是系统预测的,其中对数据的正确分配应该是类别 B)。所以现在系统应该使用这种学习(B 类而不是 A 类)来近乎实时地丰富(学习)自己。

它应该只训练添加的数据,而不是已经训练的完整数据集。所以应该是增量学习。对于分类,我们将应用朴素贝叶斯分类。

现在的问题是:

  • 我们如何实现增量训练,而不是每次都训练整个数据集?
  • 我知道有像 Vowpal Wabbit & creme 这样的增量学习库。对于我的情况,使用这些库会是一个很好的解决方案吗?
0 投票
1 回答
43 浏览

python - 盲位在线预测

新来的。我目前正在研究我的硕士论文,其中包括开发一组百叶窗/百叶窗,这些百叶窗/百叶窗可以根据用户的习惯和喜好来预测用户的行为并自动设置位置。我正在使用在线学习来解决我的问题,特别是图书馆奶油(python)。问题是我无法获得足够好的结果,MAE 大约为 24,这太过分了。你们对如何解决这样的问题有任何经验/想法吗?我用这样的模型得到这些数字:

并具有以下特点:

  • 时间戳
  • 四分之一
  • 一年中的一周
  • 一年中的一天
  • 月日
  • 星期几
  • 小时
  • 分钟
  • 假期
  • 温度
  • 湿度
  • 辐射

定位标签

0 投票
0 回答
164 浏览

python - 使用 spacy 的 TextBlob 增量/连续/在线学习

我已经使用 spacytextblob 库进行了一些情感分析,获取了文本的极性,但我想将增量学习应用于模型。我一直在寻找 creme 或 riverml.xyz 来开发这个增量模型,但我意识到 textblob 不使用 ml 模型进行分析。它使用它来代替https://github.com/sloria/TextBlob/blob/dev/textblob/en/en-sentiment.xml。如何应用增量学习来准确描述情绪?

(空间 2.3.0)

Spacy 代码:(来自https://spacy.io/universe/project/spacy-textblob

creme而言,这是一个非常简单的应用程序:(来自https://gokhang1327.medium.com/how-to-create-a-text-classifier-online-incremental-learning-with-creme-ml-6aac9d869e5c

让我知道如何解决这个问题。

0 投票
0 回答
34 浏览

python - 在训练 creme 随机森林分类器时获取“多项”对象没有属性“键”

我正在使用 creme python 库和 RandomForestClassifier 模型并收到此错误:

AttributeError: 'Multinomial' object has no attribute 'keys'

谁能帮忙?

我的代码:

0 投票
0 回答
27 浏览

python - 使用 river.stream.iter_csv() 循环数据集的 MemoryError

https://www.pyimagesearch.com/2019/06/17/online-incremental-learning-with-keras-and-creme/ 我练习在线学习并点击此链接。

因为我错误地安装了 creme,所以我找到了替代工具 River。

当我运行块时:

我看到内存错误:

任何人都知道为什么会发生此错误以及如何解决?