“s”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

403 浏览

statistics - 在SPSS中获取加权数据的标准误差

我正在尝试使用 SPSS 查找数据库中各种变量的均值的置信区间，但遇到了一些麻烦。

数据是加权的，因为每个接受调查的人都代表总人口的不同部分。例如，我们样本中的一名年轻人可能代表普通人群中的 28000 名年轻人。问题是 SPSS 似乎认为这个年轻人的数据库条目每个都代表 28000 个测量值，而实际上它们只代表一个，这使得 SPSS 认为我们拥有的数据比实际多得多。结果，SPSS 给出了非常低的标准误差估计和非常非常窄的置信区间。

我尝试通过将每个重量值除以平均重量来解决此问题。这给出了合理的数字和平均权重 1，但我不确定结果数字实际上是否正确。

我的方法合理吗？如果没有，我应该尝试什么？

我一直在使用 Explore 命令来查找平均误差和标准误差（除其他外），以防万一。

2014-06-03T03:46:25.900

0 投票

1 回答

1449 浏览

r - 具有固定和随机效应的库（lme4）中的 MLM 设计矩阵

应用背景
我有一个随机斜率和截距的模型。有许多级别的随机效应。新数据（待预测）可能具有也可能不具有所有这些级别。

为了更具体地说明这一点，我正在处理专辑级别的音乐收入 ( title)。每张专辑可能有多种类型format2（CD、黑胶唱片、电子音频等）。我对每种专辑的每张专辑的收入都有衡量标准。模型指定为：

问题是未来的数据可能不具有任何一个title或的所有级别format2。对于随机截距，这很容易用predict(..., allow.new.levels= TRUE). 但是对于固定效应和随机斜率是有问题的。因此，我正在尝试编写一个函数来对merMod对象进行灵活的预测，类似于lme4::predict.merMod; 但这将处理训练数据和预测数据之间的差异。这个问题与lme4::predict.merMod其他任何事情一样，都是出于对确切细节的无知而提出的。

问题描述问题
的症结在于model.matrix()通过固定和随机效应来计算预测和 SE 的正确性。类的 S3 方法只merMod返回固定效果。

基本stats::model.matrix()功能的文档非常有限。不幸的是，我既不拥有S 中的统计模型，也不拥有用于数据分析的软件，它们似乎具有这些功能背后的细节。

model.matrix()应该采用模型公式和新数据框并生成设计矩阵。但我遇到了一个错误。您可以提供的任何帮助将不胜感激。

示例数据

公式：

执行/错误

注意我也用Orthodont数据试过这个；但是，我得到一个不同的错误。

r lme4 s

2014-08-27T22:56:35.607

0 投票

1 回答

90 浏览

emacs - Emacs ESS 和 S-plus ( S+ ) 8.1 兼容性

我正在开发一个 S+ 8.1 中的项目，并且我正在使用带有来自 Vincent 的最新打包 ESS 的 Windows 7。splus.exe 和 sqpe.exe 的文件夹位于 PATH 中。

有没有办法让那个版本的 S+ 在 ESS 中运行？
R 工作没问题。然而，S+ 只不过是麻烦。

Mx S 告诉我从图标运行，然后使用 Mx S-existing。
使用现有的 Mx S 这样做会导致 emacs 挂起并崩溃。
Mx Sqpe 让我选择一个起始目录，但随后给出错误“生成子进程：无效参数”并且没有任何反应。

我尝试将这些代码行添加到我的 .emacs 文件中（基于一些过时的邮件列表线程），但结果保持不变：

注意：我也尝试过使用单斜杠。

如果我做 S+6、Sqpe+6 等，我会得到相同的结果。

有谁知道这是否可能？我是一个 emacs 恶魔，所以让我发疯的是 S+ 无法在其中工作。

谢谢你的帮助！

emacs ide ess s s-plus

2014-11-04T21:23:35.680

0 投票

2 回答

262 浏览

r - 创建一个值逐渐变化的矩阵，而不使用 for 循环

在 R 中，我正在构建一个矩阵M，为 20 轮游戏中的每一轮存储 4 个变化的权重。

我从权重向量 (4x1) 开始，以权重向量W1(4x1) 结束游戏W2。

权重值保持不变，直到更改启动轮C1(=5)。

在一轮之后C1，权重开始以相等的增量w2c和w3c超过C(=10) 轮变化。

权重必须始终添加到1.

我使用for循环来构建矩阵M。结果如下所示：

这是我的 R 代码：

输入：

For循环，构建矩阵M：

有没有更有效的方法可以在没有for循环的情况下实现相同的结果？

r for-loop matrix vector s

2014-12-08T18:48:49.037

0 投票

1 回答

278 浏览

r - 如何避免R中具有多个变量的多个循环

我有两个存储在表中的数据集，一个是一组，[a, b]另一个是[x, Sx, y, Sy, rho]. 我有一个f需要的概率函数(a, b, x, Sx, y, Sy, rho)。[x, Sx, y, Sy, rho]最后，我想找到第一个概率结果的总和[a, b]。[x, Sx, y, Sy, rho]然后找到第二个的总和[a, b]，等等......

我想文件中有几百行，[x, Sx, y, Sy, rho]文件中有几十万行[a, b]。

我想知道是否有办法在不使用两个循环的情况下做到这一点？我已经尝试了以下方法，但它并没有按照我想要的方式工作，但我知道它会太慢。

我不知道它是否会有所帮助，但我已在代码中添加了该功能。对不起，函数本身是一团糟，格式不正确。

我很难理解这些apply功能以及何时可以/应该使用它们。我知道我可能没有添加足够的信息，所以任何可以帮助我的建议都会很棒。我对编程和 R 都很陌生，所以请原谅任何不恰当的词汇或格式。

可能有更好的方法来定义data要获取Ndata的全局数或行数，但这些是我偶然发现的第一个。

该函数不应该是递归的，但我现在看到它就像我写的那样。我花了很多时间在 R 的介绍教程上，但仍然很难理解如何apply最好地实现这套函数。

我希望一次迭代将此函数应用于从第一行开始data2使用的每一行。然后是所有这些的概率。然后下一次迭代应该将第 2 行的所有概率相加，应用于每行a, bdatasumdataa, bdata2

r nested-loops s

2014-12-19T18:41:28.687

0 投票

1 回答

1209 浏览

r - 在 R 中编辑默认汇总函数会为多个变量提供错误

我正在扩展默认的 summary() 函数，因为我需要更多的百分位数。它似乎适用于一个变量，但如果我添加一个包含多个变量的数据框，我会得到奇怪的值，而使用默认的 summary() 它可以工作。即使我完全复制了默认的汇总函数，所以如果不添加更多的百分位数，它也不起作用。我使用这一行来获取代码：

-

示例数据集：

-

但它适用于 1 个变量：

所以它似乎不适用于具有多个变量的数据框。非常感谢任何帮助！

最好的问候，蒂姆

@ 应要求编辑我添加了用于不同分位数的代码：

这适用于我的 df 中的一个变量：

但并非所有人：

而它使用正常的摘要：

r function customization summary s

2015-02-25T18:48:18.237

0 投票

1 回答

46 浏览

r - 如何生成未包含在我的示例中的元素

这有点微不足道，但我如何生成 x 中未包含在样本中的一组数字。

r s

2015-06-14T04:14:43.580

0 投票

0 回答

1461 浏览

r - 在多共线数据上使用 polr 训练后调用 predict 有问题

看看下面的代码。这个问题之前已经被问过，但被关闭了——大概是因为缺少 R 代码来重现问题。

基本上，当数据中存在多重共线性时，在调用predict(). 我在这里想念什么？

下面的粗体部分是 R 对我说的。剩下的是我的代码。

警告消息：在 polr(r ~ x + z, data = a, Hess = TRUE) 中：设计似乎排名不足，因此删除了一些系数

X %*% object$coefficients 中的错误：参数不一致

[1] 1 1 1 3 3 3 1 1 1 2
等级：1 2 3

r statistics logistic-regression ordinal s

2015-08-20T22:17:05.107

0 投票

2 回答

706 浏览

r - lm()$assign: 它是什么？

assign线性模型拟合的属性是什么？它应该以某种方式提供响应项的位置，但实际上它似乎枚举了模型中的所有系数。据我了解，这assign是 S 的遗留物，不受glm(). 我需要为提取等效信息glm，但我不明白实现的用途lm，似乎也找不到源代码。帮助文件lm.fit说，无济于事：

非空拟合将具有与线性拟合相关的分量assign和effects（除非未要求）qr，供提取器函数使用，例如summary和effects

r glm lm s

2016-03-25T18:33:06.623

0 投票

0 回答

34 浏览

r - 在识别列类型之前从 CSV 读取时，R 删除列

我有一个相当大的数据集，我想在推导列类型/类之前删除一些列。我该怎么做。

我试过这个

但这抱怨因为某些数据 100k 行不是 null 在 100 子集中是 null 。

r csv s

2016-03-29T14:59:31.420

问题标签 [s]

Reference