问题标签 [machine-learning-model]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 有没有办法在对新数据(Java)进行预测的同时更新 Weka 中训练有素的机器学习模型?
我已经使用 Weka Java 使用机器学习实现了分类算法。我想在 RasberryPi 上部署经过训练的模型进行测试。我希望经过训练的模型每次收到新数据并进行预测时都会更新?有没有办法用 weka Java 做到这一点?你能分享你的想法如何进行吗?
提前致谢
keras - 在 Keras 中显示模型布局/设计(带有所有连接)
在我训练完 Keras LSTM 模型后测试它与从文件加载训练模型时相比,我有很大的不同.h5
(第一个的准确度总是 > 0.85,但后面的总是低于 < 0.2,即随机猜测) .
但是我检查了权重,它们是相同的,并且 Keras 给我的稀疏布局plot_model
也是相同的,但是因为这只能检索粗略的概述:
是否可以展示 Keras 模型的完整布局(尤其是节点连接)?
machine-learning - 使用 Apache Spark MLIB 的推荐引擎在处理所有操作后显示零推荐
当谈到 ML 算法的实现时,我是一个新手。我想实现一个推荐引擎,并在经过少量实验后知道协同过滤可以用于相同的目的。我也在使用 Apache Spark。我从其中一个博客中获得了帮助,并尝试在我的本地实现相同的功能。我试过的 PFB 代码。每次我执行此操作时,正在打印的推荐计数始终为零。我没有看到任何明显的错误。有人可以帮我理解这一点。此外,请随时提供在这方面可以参考的任何其他参考。
另外,我看到这项工作正在运行很长时间。每次创建模型时。有没有一种方法可以创建一次模型,将其持久化并为连续预测加载相同的模型。我们能否提高这项工作的执行速度
提前致谢
java - 使用已保存的模型通过 Java 代码测试数据(Weka)
我对机器学习完全陌生,所以在某些情况下我的理解可能是错误的。我正在尝试通过使用 weka 通过 Java 代码加载保存的模型来测试数据。
当我保存模型时,我使用了交叉验证。现在我有点困惑,是使用eval.crossValidateModel()
还是eval.evaluateModel()
.
如果我使用evaluateModel()
,它会给我错误的准确性(远高于应有的水平)。我认为这是因为该线路<Evaluation eval = new Evaluation(testingData);>
在相同的数据上对其进行训练,然后在相同的数据上进行测试。这不是我想要的。我想在没有训练的情况下测试模型上的数据(我认为训练后保存模型)
如果我使用eval.crossValidateModel()
,我认为它仍在再次训练模型,因为据我所知,交叉验证将数据集拆分为 k-folds,然后对 k-1 进行训练,然后对剩余的折叠进行测试。
那么有没有办法只使用这个加载的模型进行测试呢?
提前致谢。
machine-learning - 为什么朴素贝叶斯是生成式的?
我正在编写一份文档,该文档应包含使用朴素贝叶斯(生成)和逻辑回归(判别)模型进行文本分类之间的主要区别。
在我的研究中,我遇到了朴素贝叶斯模型的定义:https ://nlp.stanford.edu/IR-book/html/htmledition/naive-bayes-text-classification-1.html
文档
d
在类别c
中的概率计算为 ... 其中p(tk|c)
是术语在类别文档中出现的条件概率...tk
c
当我开始比较生成模型和判别模型时,我发现 StackOverflow 上的这个解释被接受:生成算法和判别算法有什么区别?
生成模型学习联合概率分布
p(x,y)
,判别模型学习条件概率分布p(y|x)
——您应该将其理解为“给定 x 的 y 概率”。
在这一点上,我感到困惑:朴素贝叶斯是一个生成模型并使用条件概率,但同时判别模型被描述为好像它们学习了条件概率,而不是生成模型的联合概率。
有人可以对此有所了解吗?
谢谢!
testing - 如何测试机器学习模型?
我想开发一个验证机器学习模型的框架(用于 QA 测试)。我与同行进行了很多讨论,并阅读了谷歌的文章。
大多数讨论或文章都在告诉机器学习模型将随着我们提供的测试数据而发展。如我错了请纠正我。
开发一个验证机器学习模型的框架将给出准确结果的可能性有多大?
从我阅读的文章中测试模型的几种方法:拆分和多拆分技术,变形测试
还请建议任何其他方法
python - Python SKlearn 污染必须在 (0, 0.5] 错误
我是机器学习的新手,正在使用 Python(3.6)、Pandas、Numpy 和 SKlearn 开展项目。我已经完成了分类和重塑,但是在预测时它会抛出一个错误contamination must be in (0, 0.5]
。
这是我尝试过的:
这是它返回的内容:
ValueError: 污染必须在 (0, 0.5]
y_pred = clf.predict(X)
正如 Traceback 中所指出的,它会为 line 抛出此错误。
我是机器学习的新手,对**污染**不太了解,所以我哪里做错了?
请帮帮我!
提前致谢!
python - 如何保存和恢复我的 sklearn 模型?
我pickle
用来存储我的机器学习模型,如下所示:
现在,我想在另一台计算机上测试这个模型。所以我正在恢复我的模型并像这样传递数据:
但我收到此错误:
从上面我可以理解,在训练时我做了很多预处理,比如在数据中我有分类特征,然后我删除了多重共线性列等等。所以在我的期末考试中,我DataFrame
有 20 个功能(请记住,这是经过大量预处理之后的)。
所以,我想知道,我如何使用pickle
. 或者我怎样才能恢复我的模型并可以在新数据中使用。
编辑:
我也试过这个
但得到相同的值错误。
python - 使用隔离森林准备 SKlearn 模型以部署在 Google Cloud 上
我是机器学习世界的新手,正在从事一个项目,在该项目中我使用 SKlearn 训练了一个欺诈检测模型。我正在以这种方式训练模型:
它返回以下输出:
现在令人困惑的部分是它的部署,经过很多努力,我决定在烧瓶网络服务的帮助下部署和服务它,但不明白如何将输入传递给我的predict
方法以获得预测?
有没有以错误的方式做某事?
如何predict
在这里将输入传递给我的方法?
请帮帮我!非常感谢任何有关其部署到谷歌云的分步指南的资源。
提前致谢!
azure - Azure ML 预测是不变的
我正在使用https://gallery.azure.ai/Experiment/Weather-prediction-model-1上提供的 Azure ML 模型来设计基于温度和湿度的预测机制。我没有对现有模型进行任何更改,也没有从模拟器中输入数据。预测输出停留在 0.489944100379944。我已经采集了超过 17k 个样本,但预测仍然保持在这个值上。
任何帮助将不胜感激。
NB - 这是我第一次使用 ML