问题标签 [predict]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在R中拟合黄土线
我在 R 中使用loess()
and时遇到了一些问题predict()
。我使用以下代码来模拟数据:
抱歉,但我不知道如何附上图片来展示它的样子!
最后两行代码最终只是在图表的一半处添加了一条随机黑线,尽管当我之前在不同(非常相似的)数据上使用此命令时,它似乎工作正常。我错过了什么?!任何帮助都会很棒,谢谢:)
r - 使用 survreg/tobit 预测超出界限
所以我正在使用 survreg,我希望我的预测结果遵循 0 的下限,但它们经常表示负面结果。我认为它以某种方式估计了线性结果,而不是我试图创建的生存模型。这是我所做的:
首先,我估计了一些点来加快我的估计过程。如果没有这个第一阶段,它就无法收敛。我按照 ?survreg 中的代码创建了一个生存对象,该代码提供了一个明确的 tobit 回归示例。我在下面为 x 和 y 复制了这个。在我的数据集中,y 只能观察到非负值,但如果它是正值,它往往会在 200 左右正态分布,sd 约为 20。X 可以取任何值,理论上不受约束通过立即想到的任何特定数字。
我运行生存回归,它应该相当于一个 Tobit。为了确认我对事件的解释是相同的,我运行了以下命令:
该图在零处显示一条平线,因此在目视检查时,这些命令应该是相同的。但是,在这两种情况下,都会预测到低于 0 的结果。这是有问题的,因为我已经说过可观察信息的左边界是 0。我的期望是所有预测值都必须 > 0。
我尝试使用“链接”、“响应”、“线性”类型进行预测,但无济于事。我假设 predict 命令正在产生结果,就好像审查没有发生一样。如何生成服从下限 0 的预测?
参考:
r - 理解 R 中的 predict()
我正在阅读 R 中的 predict() 并且很困惑:
有一个 Spam 数据集,我们从中使用随机抽样创建了训练数据和测试数据。我们使用了 trainSpam(训练数据集来训练系统)。我们想通过测试数据集(testSpam)来看看模型有多好。
在我们说的那一行:
如何predictionModel$fitted
预测测试数据中的垃圾邮件。它似乎正在使用从训练数据中拟合的 predictionModel$。然后我们继续与测试数据的垃圾邮件进行比较。有人可以解释吗?
这是我的理解。在行中:
predictionModel = glm(numType ~ charDollar, family = "binomial", data = trainSpam)
我们使用 trainSpam 数据创建模型。
在下一行:
predictionTest = predict(predictionModel, testSpam)
我们使用相同的模型创建预测测试,但使用测试数据。
在下一行:
predictSpam = rep("nonspam", dim(testSpam)[1])
我们创建了一个包含所有值“非垃圾邮件”的向量
在下一行:
预测垃圾邮件[predictionModel$fitted > 0.5] = "垃圾邮件"
我们正在使用 predictionModel$fitted,它已在训练数据上进行拟合,以决定将哪些行分类为垃圾邮件。难道我们不应该使用类似 predictTest 的东西来识别垃圾邮件吗?
我的想法应该是:
matlab - 从时间数据预测位置坐标
我的数据由 x 轴上的时间 (sec) 和 y 轴上的位置 (x,y,z) 组成。我希望能够使用时间(秒)预测位置(x,y,z)。我可以使用什么机器学习算法?如何在 Matlab/Octave 中实现这一点?
具体来说,我有以下数据
如何从时间预测位置?
我感谢您的帮助。
谢谢
java - Java,Weka:如何预测数字属性?
我试图使用 Weka 的 NaiveBayesUpdateable 分类器。我的数据包含名义属性和数字属性:
我需要根据其他属性预测销售数量(数字!)。
我知道我不能在 Weka 中使用数字属性进行贝叶斯分类。一种技术是将数值属性的值拆分为长度为 k 的 N 个区间,并使用名义属性代替,其中 n 是类名,如下所示:@attribute class {1,2,3,...N}。
然而,我需要预测的数字属性范围从 0 到 1 000 000。创建 1 000 000 个类根本没有意义。如何使用 Weka 预测数字属性,或者在 Weka 没有用于此任务的工具的情况下寻找什么算法?
r - R:如何为逻辑回归模型制作预测列?
所以我有一个名为x
. 内容很简单,写出来就行了,这里就简单介绍一下:
Report
第一列中的因变量是二进制是/否(0 = 否,1 = 是)- 随后的 3 列都是分类变量(
race.f
、sex.f
、gender.f
),它们都已转换为因子,并由数字指定(例如 1 = 白色,2 = 黑色等)
我对 x 进行了逻辑回归,如下所示:
我可以通过查看来检查拟合概率summary(glm$fitted)
。
我的问题:如何在该数据集的右侧创建第五列,x
其中将包含 的预测(即拟合概率)Report
?当然,我可以只插入glm$fitted
一个列,但我想尝试编写一个代码,根据种族、性别、性别列中的任何内容来预测它,以便更广泛地使用。
现在我遵循以下代码,我希望创建一个预测列以及置信区间的下限和上限。
不幸的是我得到了错误:
在cbind
代码之后。
有人知道吗?
r - Predict.lm 用于多重回归;new.data 的问题
我正在对一些树木数据进行多元回归。
我可以轻松地运行回归,但我在预测时遇到了麻烦。我正在随机删除 3 个观察结果并重新运行回归,然后预测这三个观察结果以计算 MAPE。
正如我所期望的那样,这在大约 80% 的时间里有效,为三个删除的观察返回三个预测值。但偶尔我会收到警告:
我不知道这是从哪里来的,因为代码大部分时间都在工作,而且我没有任何有 2 行的对象。我有 3 个像这样的单独计算,每个都使用树数据。我试图在没有公共变量的情况下将它们分开,但它们是否会相互干扰?警告是否来自 g 的采样?有没有更好的方法来删除观察或进行多变量预测?谢谢。
PS - 另外,当我附加树时,尽管我可以自己打电话,Merch.Vol
但我仍然不能直接打电话。没什么大不了的,但如果有一个明显的解释(我敢肯定)我想听听。trees$Merch.Vol
DBH
Height
r - 在没有案例本身的情况下预测 glm 模型构建的值
我想使用生成的模型来预测值。这是简单的部分:
但是:对于每种情况,我都不想使用这种情况来构建该模型(不使用 for 循环)
例子:
假设我想预测 St.Adam 学生的平均成绩,但不想用它们来构建模型。
rapidminer - 如何在 RapidMiner 中检查多项式回归结果?
我使用RapidMiner,我有一个包含 40 行的数据集,每行有 14 列。行是Android应用程序的不同类型的指标+,行尾是google-play排名(第一行是包含指标名称的标题)。
(所以目标是根据指标预测 google play 排名。)
数据集: http: //pastebin.com/Cw1BR4K6
- 第 1-13 列:不同类型的指标
- 第十四栏:google play排名
- 第 2-40 行:Android 项目的指标
我在 RapidMiner 中使用了PolynomialRegression ,我得到了这个结果:
我的问题: 我如何检查这个结果是否正确?如何将此结果检查到已经可用的线路?例如,我想将此结果应用于第 25 行:25,8,5,10,0,1,0,0,0,239,10,14,4,3.8
我的另一个问题: 我可以用什么方法来预测这个集合?最好的方法是什么?如果可能的话,我想请你向我解释一下。
在此先感谢,彼得
r - 概率回归中的预测和乘法变量/交互项
我想确定概率回归中每个因变量的边际效应,如下所示:
- 用每个变量的平均值预测(基础)概率
- 对于每个变量,如果变量取平均值 + 1x 变量标准差,则预测与基本概率相比的概率变化
在我的一个回归中,我有一个乘法变量,如下所示:
两个问题:
- 当我使用上述方法确定边际效应时,乘法项的值是否会反映 b 或 c 的值,取值均值 + 1x 变量标准差?
- 同样的问题,但使用交互项(* 并且没有 I())而不是乘法项。
非常感谢