问题标签 [mass]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在数据帧的行上迭代 mvrnorm 的复杂函数
我的数据如下所示:
我想在数据集的每一行上运行以下代码(来源: http ://www.quantpsy.org/medmc/medmc.htm)。
我创建了一个相对简单的函数,它将数据和行号作为输入:
但是,如果有一种方法可以摆脱行规范,让函数逐行遍历数据集并将输出保存到数据集中的新列,那就太好了。
我一直在试验 for 循环和应用函数,但没有取得任何成功,主要是因为 matrix() 和 mvrnorm() 函数都采用值而不是向量。
r - 我的 ecdf() 函数对不同的输入给出相同的结果
我有两个模拟:
在使用 ecdf() 函数并应用数据时,它给出了相同的结果。
我猜原因是该函数不考虑均值和标准差,而只考虑观察次数。我该如何解决这个问题?先感谢您。
r - 在 R 中找到负二项式 GLM 的 init.theta 值
我正在使用 R 中包 MASS 中的函数 glm.nb()。如何找到正确的 init.theta 值?在我看到的关于这个主题的其他问题中,提问者似乎已经有了他们的 init.theta。
我知道 theta 是一个色散参数。当我不输入 init.theta 时,摘要向我显示了高得离谱的 theta 和标准错误值。代码运行但给了我一条错误消息,说我达到了 theta.ml 迭代限制。
我进行了修改并添加了 init.theta = 1,这给了我较低的 theta、标准误差和 p 值。我仍然不明白这个论点是什么意思。
模拟我正在使用的代码:
r - 我应该将时间不变变量放在 glmm.PQL 函数中的哪里来执行时间相关的负二项式回归?
最近,为了应用负二项式回归,我处理并清理了一个数据。
首先,我尝试在Rglm.nb
中使用包MASS的功能,但在确保模型将实现数据针对一个唯一参与者(一组观察结果中可能存在相关性)时遇到了问题。
然后,我意识到我可以使用glmmPQL
包MASS或glmer
包lme4并在其家庭链接中使用家庭负二项式。
问题是我想知道我可以在模型的哪个部分嵌入偏移量(治疗天数的对数)以及我应该如何插入 id 的时间常数观察值(例如性别和基线年龄) df)?
我最近的尝试是:
它面临与内存相关的错误(可能是因为错误的代码)。数据示例:
r - fitdistr(x, "lognormal") 中的错误消息:“'x' 包含缺失或无限值”
当我使用 MASS 包的 fitdistr() 函数将对数正态模型拟合到基于具有给定参数 mean_log 和 sd_log 的对数正态分布的随机采样数据时,我不断收到错误消息“'x' contains missing or infinite values”。这是我的 df (data.sub.in) 的示例:
我从指定的分布中抽取一个随机样本,并使用以下代码为每个样本拟合一个对数正态模型:
我收到错误消息:
我不确定为什么随机抽样会产生一些 NA 或“无限值”是什么意思。有没有解决的办法?
谢谢!
r - 使用 fitditrplus 绘制截断正态分布时出现错误消息
我正在尝试绘制不同的分布,以查看最适合我的数据(“x”)的分布。我正在使用包 fitdistrplus 来做到这一点。除了“tnorm”(截断的正态分布)之外,所有分布都可以工作,它会显示一条错误消息:
任何想法导致此错误消息以及如何解决它?
非常感谢任何帮助!!!
有效的发行版:
使用的包:
关于我的数据的一些信息:
r - 来自 MASS-package 的 lda 具有比观察更多的预测变量
我对多元统计相当陌生,在 R 的帮助部分中也找不到答案,也不是在 MASS 包的源代码中,所以也许你可以帮助我。
我的数据有很多预测变量(450)和很少的观察值(~200)。我读到由于方差矩阵的必要反转,计算 lda 是不可能的。但只是在知道这表明它有效并且给出了不错的结果之前尝试它。怎么解释?lda正手选择分离影响最大的变量吗?
我正在使用 caret 包添加一个 5 倍的 cv 并预先分离到 train(0.8) 和 test(0.2) 数据中。
r - 我无法使用一个预测变量/协变量获得 R 中有序逻辑函数的置信区间?
我正在使用 R 中的 polr 函数进行具有一个协变量/预测变量的有序逻辑回归。下面是我的公式:
输出:
当我运行 confint 函数时,我没有得到输出或得到 NA。例如 confint(telangiec_ordinal)
我可以手动计算置信区间,使用估计 +/-(1.96 x 标准误差)没有问题,但我不确定这种方法是否适用于有序逻辑回归?
r - 在 glmmPQL 中使用权重
使用来自 SpData 的“巴尔的摩”住房数据,我想将庭院的存在建模为响应变量,房价作为解释变量。我还想按住房面积在我的模型中包含权重。
我的代码:
这基本上为我选择的每个加权变量提供了不同的错误消息。这里使用权重似乎是这里唯一的问题。权重向量长度与模型中的数据相同,所以我真的不明白为什么这不起作用。任何见解表示赞赏。
r - 在 R 中的 stepAIC (MASS) 中一起添加或删除一组变量
我想stepAIC
从MASS
包中使用来找到线性模型的自变量的最佳组合。其中一个自变量与另一个变量相关;例如,病毒载量 ( vl
) 与病程高度相关。因此,我也包括duration
在模型中。我的问题是:如何从模型中一起制作vl
和添加或删除?duration
我阅读了 SAS 的支持文档,在 SAS 中,这可以通过在 EFFECT 语句中使用集合{}
效果类型或在 MODEL 语句中
使用大括号来实现。http://support.sas.com/kb/52/362.html
我试图通过{}
在 R 中使用来做到这一点,但它所做的是创建一个新变量,它是括号中变量的总和。这不正是我想要的。任何想法将不胜感激!
可重现的例子: