问题标签 [s]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
403 浏览

statistics - 在SPSS中获取加权数据的标准误差

我正在尝试使用 SPSS 查找数据库中各种变量的均值的置信区间,但遇到了一些麻烦。

数据是加权的,因为每个接受调查的人都代表总人口的不同部分。例如,我们样本中的一名年轻人可能代表普通人群中的 28000 名年轻人。问题是 SPSS 似乎认为这个年轻人的数据库条目每个都代表 28000 个测量值,而实际上它们只代表一个,这使得 SPSS 认为我们拥有的数据比实际多得多。结果,SPSS 给出了非常低的标准误差估计和非常非常窄的置信区间。

我尝试通过将每个重量值除以平均重量来解决此问题。这给出了合理的数字和平均权重 1,但我不确定结果数字实际上是否正确。

我的方法合理吗?如果没有,我应该尝试什么?

我一直在使用 Explore 命令来查找平均误差和标准误差(除其他外),以​​防万一。

0 投票
1 回答
1449 浏览

r - 具有固定和随机效应的库(lme4)中的 MLM 设计矩阵

应用背景
我有一个随机斜率和截距的模型。有许多级别的随机效应。新数据(待预测)可能具有也可能不具有所有这些级别。

为了更具体地说明这一点,我正在处理专辑级别的音乐收入 ( title)。每张专辑可能有多种类型format2(CD、黑胶唱片、电子音频等)。我对每种专辑的每张专辑的收入都有衡量标准。模型指定为:

问题是未来的数据可能不具有任何一个title或的所有级别format2。对于随机截距,这很容易用predict(..., allow.new.levels= TRUE). 但是对于固定效应和随机斜率是有问题的。因此,我正在尝试编写一个函数来对merMod对象进行灵活的预测,类似于lme4::predict.merMod; 但这将处理训练数据和预测数据之间的差异。这个问题与lme4::predict.merMod其他任何事情一样,都是出于对确切细节的无知而提出的。

问题描述 问题
的症结在于model.matrix()通过固定和随机效应来计算预测和 SE 的正确性。类的 S3 方法只merMod返回固定效果

基本stats::model.matrix()功能的文档非常有限。不幸的是,我既不拥有S 中的统计模型,也不拥有用于数据分析的软件,它们似乎具有这些功能背后的细节。

model.matrix()应该采用模型公式和新数据框并生成设计矩阵。但我遇到了一个错误。您可以提供的任何帮助将不胜感激。

示例数据

公式

执行/错误

注意 我也用Orthodont数据试过这个;但是,我得到一个不同的错误。

0 投票
1 回答
90 浏览

emacs - Emacs ESS 和 S-plus ( S+ ) 8.1 兼容性

我正在开发一个 S+ 8.1 中的项目,并且我正在使用带有来自 Vincent 的最新打包 ESS 的 Windows 7。splus.exe 和 sqpe.exe 的文件夹位于 PATH 中。

有没有办法让那个版本的 S+ 在 ESS 中运行?
R 工作没问题。然而,S+ 只不过是麻烦。

Mx S 告诉我从图标运行,然后使用 Mx S-existing。
使用现有的 Mx S 这样做会导致 emacs 挂起并崩溃。
Mx Sqpe 让我选择一个起始目录,但随后给出错误“生成子进程:无效参数”并且没有任何反应。

我尝试将这些代码行添加到我的 .emacs 文件中(基于一些过时的邮件列表线程),但结果保持不变:

注意:我也尝试过使用单斜杠。

如果我做 S+6、Sqpe+6 等,我会得到相同的结果。

有谁知道这是否可能?我是一个 emacs 恶魔,所以让我发疯的是 S+ 无法在其中工作。

谢谢你的帮助!

0 投票
2 回答
262 浏览

r - 创建一个值逐渐变化的矩阵,而不使用 for 循环

在 R 中,我正在构建一个矩阵M,为 20 轮游戏中的每一轮存储 4 个变化的权重。

我从权重向量 (4x1) 开始,以权重向量W1(4x1) 结束游戏W2

权重值保持不变,直到更改启动轮C1(=5)。

在一轮之后C1,权重开始以相等的增量w2cw3c超过C(=10) 轮变化。

权重必须始终添加到1.

我使用for循环来构建矩阵M。结果如下所示:

这是我的 R 代码:

输入:

For循环,构建矩阵M

有没有更有效的方法可以在没有for循环的情况下实现相同的结果?

0 投票
1 回答
278 浏览

r - 如何避免R中具有多个变量的多个循环

我有两个存储在表中的数据集,一个是一组,[a, b]另一个是[x, Sx, y, Sy, rho]. 我有一个f需要的概率函数(a, b, x, Sx, y, Sy, rho)[x, Sx, y, Sy, rho]最后,我想找到第一个概率结果的总和[a, b][x, Sx, y, Sy, rho]然后找到第二个的总和[a, b],等等......

我想文件中有几百行,[x, Sx, y, Sy, rho]文件中有几十万行[a, b]

我想知道是否有办法在不使用两个循环的情况下做到这一点?我已经尝试了以下方法,但它并没有按照我想要的方式工作,但我知道它会太慢。

我不知道它是否会有所帮助,但我已在代码中添加了该功能。对不起,函数本身是一团糟,格式不正确。

我很难理解这些apply功能以及何时可以/应该使用它们。我知道我可能没有添加足够的信息,所以任何可以帮助我的建议都会很棒。我对编程和 R 都很陌生,所以请原谅任何不恰当的词汇或格式。

可能有更好的方法来定义data要获取Ndata的全局数或行数,但这些是我偶然发现的第一个。

该函数不应该是递归的,但我现在看到它就像我写的那样。我花了很多时间在 R 的介绍教程上,但仍然很难理解如何apply最好地实现这套函数。

我希望一次迭代将此函数应用于从第一行开始data2使用的每一行。然后是所有这些的概率。然后下一次迭代应该将第 2 行的所有概率相加,应用于每行a, bdatasumdataa, bdata2

0 投票
1 回答
1209 浏览

r - 在 R 中编辑默认汇总函数会为多个变量提供错误

我正在扩展默认的 summary() 函数,因为我需要更多的百分位数。它似乎适用于一个变量,但如果我添加一个包含多个变量的数据框,我会得到奇怪的值,而使用默认的 summary() 它可以工作。即使我完全复制了默认的汇总函数,所以如果不添加更多的百分位数,它也不起作用。我使用这一行来获取代码:

-

示例数据集:

-

但它适用于 1 个变量:

所以它似乎不适用于具有多个变量的数据框。非常感谢任何帮助!

最好的问候,蒂姆

@ 应要求编辑我添加了用于不同分位数的代码:

这适用于我的 df 中的一个变量:

但并非所有人:

而它使用正常的摘要:

0 投票
1 回答
46 浏览

r - 如何生成未包含在我的示例中的元素

这有点微不足道,但我如何生成 x 中未包含在样本中的一组数字。

0 投票
0 回答
1461 浏览

r - 在多共线数据上使用 polr 训练后调用 predict 有问题

看看下面的代码。这个问题之前已经被问过,但被关闭了——大概是因为缺少 R 代码来重现问题。

基本上,当数据中存在多重共线性时,在调用predict(). 我在这里想念什么?

下面的粗体部分是 R 对我说的。剩下的是我的代码。

警告消息:在 polr(r ~ x + z, data = a, Hess = TRUE) 中:设计似乎排名不足,因此删除了一些系数

X %*% object$coefficients 中的错误:参数不一致

X %*% object$coefficients 中的错误:参数不一致

X %*% object$coefficients 中的错误:参数不一致

[1] 1 1 1 3 3 3 1 1 1 2
等级:1 2 3

[1] 1 1 1 3 3 3 1 1 1 2
等级:1 2 3

[1] 1 1 1 3 3 3 1 1 1 2
等级:1 2 3

0 投票
2 回答
706 浏览

r - lm()$assign: 它是什么?

assign线性模型拟合的属性是什么?它应该以某种方式提供响应项的位置,但实际上它似乎枚举了模型中的所有系数。据我了解,这assign是 S 的遗留物,不受glm(). 我需要为 提取等效信息glm,但我不明白实现的用途lm,似乎也找不到源代码。帮助文件lm.fit说,无济于事:

非空拟合将具有与线性拟合相关的分量assigneffects(除非未要求)qr,供提取器函数使用,例如summaryeffects

0 投票
0 回答
34 浏览

r - 在识别列类型之前从 CSV 读取时,R 删除列

我有一个相当大的数据集,我想在推导列类型/类之前删除一些列。我该怎么做。

我试过这个

但这抱怨因为某些数据 100k 行不是 null 在 100 子集中是 null 。