问题标签 [predictive]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
289 浏览

machine-learning - h20 在测试数据上预测函数概率评分

我已经为欺诈预测创建了 h20 随机森林模型。现在使用预测函数对测试数据进行评分。我从预测函数输出得到以下数据框。

现在对于第二条记录,它预测为 1,但 p1 的概率远小于 p0。我们可以用于我的欺诈预测模型的正确概率分数 (p0/1) 和分类是多少?

如果这些不是正确的概率,那么使用下面提到的参数(calibrate_model = True)计算的校准概率将给出正确的概率?

0 投票
1 回答
1039 浏览

r - numeric(h) 中的错误:向量大小不能为 NA/NaN

我在 Tableau 和 R 上工作,我想每年预测学校人数。我创建了两个计算字段:dataforcast 计算字段

学校编号预测计算字段,但显示错误:

numeric(h) 中的错误:向量大小不能为 NA/NaN

0 投票
1 回答
59 浏览

machine-learning - H20 自动编码器异常仅接受数值预测器

我正在使用 h2o 自动编码器异常来查找模型中的异常数据,但问题是自动编码器仅接受数字预测器。我的要求是我已经根据 CardNumber 或商户号码找到异常值。卡号是 12 位数字(342178901244),大部分是唯一的,所以它的标称数据,我们不能做热编码,它会创建许多新的字段,与唯一的卡号一样多。所以请提出任何我们可以包含分类数据的方法,我们仍然可以运行自动编码器

0 投票
0 回答
69 浏览

machine-learning - H2OAutoEncoderEstimator 异常预测 REST API

我在 h2o python 中创建 H2o 自动编码器异常检测模型。当使用 (test_rec_error=model.anomaly(test.hex,per_feature=false) 计算异常时,每条记录都有一个重建错误。但是当我试图预测时(发现异常)在 H2o Flow 中的任何测试数据上我得到每个特征的重建错误。在 h2o Flow 中是否有任何选项可以在 h2o 流中只获得一个重建错误(不是每个特征)?

还有什么是 REST API 端点,用于从 h2o 中的异常模型获取重建错误。就像在分类模型 API(POST /3/Predictions/models/{model}/frames/{frame}) 中对测试数据进行评分预测一样......所以只是想知道用于从异常中获取重建错误的 REST API 是什么h2o 中的模型。

提前致谢。

0 投票
2 回答
1118 浏览

statistics - 如果数据集中的一些实际值是 0 值,如何计算 MAPE?

我是数据科学的新手,并试图了解预测与实际的差异评估。

可以说我有实际情况:

我使用 XGboost 的预测值为:

仅根据总和进行评估会更好吗?示例添加所有实际值减去所有预测值?差 = 70.3 - 53.53?

还是根据 MSE、MAE、RMSE、MAPE 等预测误差技术来评估差异是否更好?

因为,我读到 MAPE 是最广泛接受的,所以在分母为 0 的情况下如何实现,如我上面的实际情况所示?

有没有更好的方法来评估与实际的偏差,或者这些是唯一合法的方法吗?我的目标是建立更多涉及不同变量的预测模型,这些变量会给我不同的预测值,然后选择与实际值偏差最小的模型。

0 投票
0 回答
128 浏览

python-3.x - 如何使用 statsmodel 推断时间序列模型以预测样本外未来值

我有一个 AR 时间序列模型,可以使用 statsmodel 衡量 10 年前每个月的销售额。目前,我的模型预测现有月份的值(自变量),但我很难找到一种方法来构建我的模型来预测未来 2-3 年(2019-2022 年)的未来销售。

为了提供上下文,这里是我用来比较我的预测值与现有时间段与同一时间段下的实际值的代码。

下面是上面代码的输出。

在此处输入图像描述

任何提示将不胜感激!

0 投票
1 回答
293 浏览

machine-learning - 什么时候应该使用逻辑回归和KNN进行分类?换句话说,两者的用法有什么区别?

我正在学习预测建模,想知道在监督学习的情况下,逻辑回归和 KNN 都可以用于分类。那么在哪些情况下我们应该使用其中一种?更具体地说,它们在模型构建中的应用有什么区别?

谢谢你。

0 投票
1 回答
19 浏览

python - 建模选项

我有一个逐步的过程,我正在尝试对其进行一些预测。基本上我们有一个 10 步的过程,我们记录每个步骤以及它需要多长时间、何时开始、何时结束等。我想预测第一步开始后完成第 10 步需要多长时间。

搜索“建模,逐步过程”会引导您找到一堆关于创建模型的步骤的文章......

我假设我可以为每个步骤之间的时间长度创建一个特征,然后将标签设置为第一步和最后一步之间的时间,并且只使用回归模型,但很好奇是否有更具体的内容存在任务类型。

我们在 python 中工作,通常使用 sklearn。

0 投票
2 回答
25 浏览

machine-learning - 根据过去 3 年的季度客户数量预测未来 4 季度的客户数量

我目前正在开展一个项目,我需要根据过去三年的先前客户数量预测零售客户未来 4 个季度的客户数量,即季度数据意味着总共 12 个数据点。请建议一种节拍方法来预测未来 4 个季度的客户数量。

注意:-我无法分享数据,但客户数量呈同比下降趋势。

如果需要更多信息或问题不清楚,请告诉我。

0 投票
0 回答
54 浏览

types - 我可以更改元数据的数据类型吗

有人知道您是否可以更改元数据的数据类型?我想预测 Airbnb 的住宿价格。价格取决于房型和住宿地点。这两个功能都被标记为元数据。因此,我在橙色的“功能统计”中看不到这些功能,也看不到这些功能的统计信息。