问题标签 [predictive]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - h20 在测试数据上预测函数概率评分
我已经为欺诈预测创建了 h20 随机森林模型。现在使用预测函数对测试数据进行评分。我从预测函数输出得到以下数据框。
现在对于第二条记录,它预测为 1,但 p1 的概率远小于 p0。我们可以用于我的欺诈预测模型的正确概率分数 (p0/1) 和分类是多少?
如果这些不是正确的概率,那么使用下面提到的参数(calibrate_model = True)计算的校准概率将给出正确的概率?
r - numeric(h) 中的错误:向量大小不能为 NA/NaN
我在 Tableau 和 R 上工作,我想每年预测学校人数。我创建了两个计算字段:dataforcast 计算字段
学校编号预测计算字段,但显示错误:
numeric(h) 中的错误:向量大小不能为 NA/NaN
machine-learning - H20 自动编码器异常仅接受数值预测器
我正在使用 h2o 自动编码器异常来查找模型中的异常数据,但问题是自动编码器仅接受数字预测器。我的要求是我已经根据 CardNumber 或商户号码找到异常值。卡号是 12 位数字(342178901244),大部分是唯一的,所以它的标称数据,我们不能做热编码,它会创建许多新的字段,与唯一的卡号一样多。所以请提出任何我们可以包含分类数据的方法,我们仍然可以运行自动编码器
machine-learning - H2OAutoEncoderEstimator 异常预测 REST API
我在 h2o python 中创建 H2o 自动编码器异常检测模型。当使用 (test_rec_error=model.anomaly(test.hex,per_feature=false) 计算异常时,每条记录都有一个重建错误。但是当我试图预测时(发现异常)在 H2o Flow 中的任何测试数据上我得到每个特征的重建错误。在 h2o Flow 中是否有任何选项可以在 h2o 流中只获得一个重建错误(不是每个特征)?
还有什么是 REST API 端点,用于从 h2o 中的异常模型获取重建错误。就像在分类模型 API(POST /3/Predictions/models/{model}/frames/{frame}) 中对测试数据进行评分预测一样......所以只是想知道用于从异常中获取重建错误的 REST API 是什么h2o 中的模型。
提前致谢。
statistics - 如果数据集中的一些实际值是 0 值,如何计算 MAPE?
我是数据科学的新手,并试图了解预测与实际的差异评估。
可以说我有实际情况:
我使用 XGboost 的预测值为:
仅根据总和进行评估会更好吗?示例添加所有实际值减去所有预测值?差 = 70.3 - 53.53?
还是根据 MSE、MAE、RMSE、MAPE 等预测误差技术来评估差异是否更好?
因为,我读到 MAPE 是最广泛接受的,所以在分母为 0 的情况下如何实现,如我上面的实际情况所示?
有没有更好的方法来评估与实际的偏差,或者这些是唯一合法的方法吗?我的目标是建立更多涉及不同变量的预测模型,这些变量会给我不同的预测值,然后选择与实际值偏差最小的模型。
machine-learning - 什么时候应该使用逻辑回归和KNN进行分类?换句话说,两者的用法有什么区别?
我正在学习预测建模,想知道在监督学习的情况下,逻辑回归和 KNN 都可以用于分类。那么在哪些情况下我们应该使用其中一种?更具体地说,它们在模型构建中的应用有什么区别?
谢谢你。
python - 建模选项
我有一个逐步的过程,我正在尝试对其进行一些预测。基本上我们有一个 10 步的过程,我们记录每个步骤以及它需要多长时间、何时开始、何时结束等。我想预测第一步开始后完成第 10 步需要多长时间。
搜索“建模,逐步过程”会引导您找到一堆关于创建模型的步骤的文章......
我假设我可以为每个步骤之间的时间长度创建一个特征,然后将标签设置为第一步和最后一步之间的时间,并且只使用回归模型,但很好奇是否有更具体的内容存在任务类型。
我们在 python 中工作,通常使用 sklearn。
machine-learning - 根据过去 3 年的季度客户数量预测未来 4 季度的客户数量
我目前正在开展一个项目,我需要根据过去三年的先前客户数量预测零售客户未来 4 个季度的客户数量,即季度数据意味着总共 12 个数据点。请建议一种节拍方法来预测未来 4 个季度的客户数量。
注意:-我无法分享数据,但客户数量呈同比下降趋势。
如果需要更多信息或问题不清楚,请告诉我。
types - 我可以更改元数据的数据类型吗
有人知道您是否可以更改元数据的数据类型?我想预测 Airbnb 的住宿价格。价格取决于房型和住宿地点。这两个功能都被标记为元数据。因此,我在橙色的“功能统计”中看不到这些功能,也看不到这些功能的统计信息。