问题标签 [s]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
statistics - 在SPSS中获取加权数据的标准误差
我正在尝试使用 SPSS 查找数据库中各种变量的均值的置信区间,但遇到了一些麻烦。
数据是加权的,因为每个接受调查的人都代表总人口的不同部分。例如,我们样本中的一名年轻人可能代表普通人群中的 28000 名年轻人。问题是 SPSS 似乎认为这个年轻人的数据库条目每个都代表 28000 个测量值,而实际上它们只代表一个,这使得 SPSS 认为我们拥有的数据比实际多得多。结果,SPSS 给出了非常低的标准误差估计和非常非常窄的置信区间。
我尝试通过将每个重量值除以平均重量来解决此问题。这给出了合理的数字和平均权重 1,但我不确定结果数字实际上是否正确。
我的方法合理吗?如果没有,我应该尝试什么?
我一直在使用 Explore 命令来查找平均误差和标准误差(除其他外),以防万一。
r - 具有固定和随机效应的库(lme4)中的 MLM 设计矩阵
应用背景
我有一个随机斜率和截距的模型。有许多级别的随机效应。新数据(待预测)可能具有也可能不具有所有这些级别。
为了更具体地说明这一点,我正在处理专辑级别的音乐收入 ( title
)。每张专辑可能有多种类型format2
(CD、黑胶唱片、电子音频等)。我对每种专辑的每张专辑的收入都有衡量标准。模型指定为:
问题是未来的数据可能不具有任何一个title
或的所有级别format2
。对于随机截距,这很容易用predict(..., allow.new.levels= TRUE)
. 但是对于固定效应和随机斜率是有问题的。因此,我正在尝试编写一个函数来对merMod
对象进行灵活的预测,类似于lme4::predict.merMod
; 但这将处理训练数据和预测数据之间的差异。这个问题与lme4::predict.merMod
其他任何事情一样,都是出于对确切细节的无知而提出的。
问题描述 问题
的症结在于model.matrix()
通过固定和随机效应来计算预测和 SE 的正确性。类的 S3 方法只merMod
返回固定效果。
基本stats::model.matrix()
功能的文档非常有限。不幸的是,我既不拥有S 中的统计模型,也不拥有用于数据分析的软件,它们似乎具有这些功能背后的细节。
model.matrix()
应该采用模型公式和新数据框并生成设计矩阵。但我遇到了一个错误。您可以提供的任何帮助将不胜感激。
示例数据
公式:
执行/错误
注意
我也用Orthodont
数据试过这个;但是,我得到一个不同的错误。
emacs - Emacs ESS 和 S-plus ( S+ ) 8.1 兼容性
我正在开发一个 S+ 8.1 中的项目,并且我正在使用带有来自 Vincent 的最新打包 ESS 的 Windows 7。splus.exe 和 sqpe.exe 的文件夹位于 PATH 中。
有没有办法让那个版本的 S+ 在 ESS 中运行?
R 工作没问题。然而,S+ 只不过是麻烦。
Mx S 告诉我从图标运行,然后使用 Mx S-existing。
使用现有的 Mx S 这样做会导致 emacs 挂起并崩溃。
Mx Sqpe 让我选择一个起始目录,但随后给出错误“生成子进程:无效参数”并且没有任何反应。
我尝试将这些代码行添加到我的 .emacs 文件中(基于一些过时的邮件列表线程),但结果保持不变:
注意:我也尝试过使用单斜杠。
如果我做 S+6、Sqpe+6 等,我会得到相同的结果。
有谁知道这是否可能?我是一个 emacs 恶魔,所以让我发疯的是 S+ 无法在其中工作。
谢谢你的帮助!
r - 创建一个值逐渐变化的矩阵,而不使用 for 循环
在 R 中,我正在构建一个矩阵M
,为 20 轮游戏中的每一轮存储 4 个变化的权重。
我从权重向量 (4x1) 开始,以权重向量W1
(4x1) 结束游戏W2
。
权重值保持不变,直到更改启动轮C1
(=5)。
在一轮之后C1
,权重开始以相等的增量w2c
和w3c
超过C
(=10) 轮变化。
权重必须始终添加到1
.
我使用for
循环来构建矩阵M
。结果如下所示:
这是我的 R 代码:
输入:
For循环,构建矩阵M
:
有没有更有效的方法可以在没有for
循环的情况下实现相同的结果?
r - 如何避免R中具有多个变量的多个循环
我有两个存储在表中的数据集,一个是一组,[a, b]
另一个是[x, Sx, y, Sy, rho]
. 我有一个f
需要的概率函数(a, b, x, Sx, y, Sy, rho)
。[x, Sx, y, Sy, rho]
最后,我想找到第一个概率结果的总和[a, b]
。[x, Sx, y, Sy, rho]
然后找到第二个的总和[a, b]
,等等......
我想文件中有几百行,[x, Sx, y, Sy, rho]
文件中有几十万行[a, b]
。
我想知道是否有办法在不使用两个循环的情况下做到这一点?我已经尝试了以下方法,但它并没有按照我想要的方式工作,但我知道它会太慢。
我不知道它是否会有所帮助,但我已在代码中添加了该功能。对不起,函数本身是一团糟,格式不正确。
我很难理解这些apply
功能以及何时可以/应该使用它们。我知道我可能没有添加足够的信息,所以任何可以帮助我的建议都会很棒。我对编程和 R 都很陌生,所以请原谅任何不恰当的词汇或格式。
可能有更好的方法来定义data
要获取Ndata
的全局数或行数,但这些是我偶然发现的第一个。
该函数不应该是递归的,但我现在看到它就像我写的那样。我花了很多时间在 R 的介绍教程上,但仍然很难理解如何apply
最好地实现这套函数。
我希望一次迭代将此函数应用于从第一行开始data2
使用的每一行。然后是所有这些的概率。然后下一次迭代应该将第 2 行的所有概率相加,应用于每行a, b
data
sum
data
a, b
data2
r - 在 R 中编辑默认汇总函数会为多个变量提供错误
我正在扩展默认的 summary() 函数,因为我需要更多的百分位数。它似乎适用于一个变量,但如果我添加一个包含多个变量的数据框,我会得到奇怪的值,而使用默认的 summary() 它可以工作。即使我完全复制了默认的汇总函数,所以如果不添加更多的百分位数,它也不起作用。我使用这一行来获取代码:
-
示例数据集:
-
但它适用于 1 个变量:
所以它似乎不适用于具有多个变量的数据框。非常感谢任何帮助!
最好的问候,蒂姆
@ 应要求编辑我添加了用于不同分位数的代码:
这适用于我的 df 中的一个变量:
但并非所有人:
而它使用正常的摘要:
r - 如何生成未包含在我的示例中的元素
这有点微不足道,但我如何生成 x 中未包含在样本中的一组数字。
r - 在多共线数据上使用 polr 训练后调用 predict 有问题
看看下面的代码。这个问题之前已经被问过,但被关闭了——大概是因为缺少 R 代码来重现问题。
基本上,当数据中存在多重共线性时,在调用predict()
. 我在这里想念什么?
下面的粗体部分是 R 对我说的。剩下的是我的代码。
警告消息:在 polr(r ~ x + z, data = a, Hess = TRUE) 中:设计似乎排名不足,因此删除了一些系数
X %*% object$coefficients 中的错误:参数不一致
X %*% object$coefficients 中的错误:参数不一致
X %*% object$coefficients 中的错误:参数不一致
[1] 1 1 1 3 3 3 1 1 1 2
等级:1 2 3
[1] 1 1 1 3 3 3 1 1 1 2
等级:1 2 3
[1] 1 1 1 3 3 3 1 1 1 2
等级:1 2 3
r - lm()$assign: 它是什么?
assign
线性模型拟合的属性是什么?它应该以某种方式提供响应项的位置,但实际上它似乎枚举了模型中的所有系数。据我了解,这assign
是 S 的遗留物,不受glm()
. 我需要为 提取等效信息glm
,但我不明白实现的用途lm
,似乎也找不到源代码。帮助文件lm.fit
说,无济于事:
非空拟合将具有与线性拟合相关的分量
assign
和effects
(除非未要求)qr
,供提取器函数使用,例如summary
和effects
r - 在识别列类型之前从 CSV 读取时,R 删除列
我有一个相当大的数据集,我想在推导列类型/类之前删除一些列。我该怎么做。
我试过这个
但这抱怨因为某些数据 100k 行不是 null 在 100 子集中是 null 。