问题标签 [longitudinal]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
215 浏览

r - 是否可以使用 group by 和 tidy 将多级模型 (lme) 拟合到重复测量/纵向数据?

考虑以下示例纵向/重复测量数据集

我可以group_by %>% do(tidy(*))用来运行几个未调整和调整的单级回归模型(循环通过结果和暴露列表)并将模型结果提取到数据框,如下所示

我想使用相同的过程来拟合多级模型来解释重复数据。使用示例代码:

但是,当我尝试这样做时,例如使用:

我收到以下错误消息:

关于如何使其适用于 lme 类型模型的任何想法?

0 投票
0 回答
77 浏览

visualization - 如何可视化纵向数据?

我正在尝试绘制一些调查数据。我们收集了调查数据,其中每项调查每天被询问两次,持续 30 天,对相同的大约 20 人进行调查。因此,在我的数据中,我在不同的行中有多次相同的人。我目前试图想象的变量是关于他们乘坐的第一条公交路线(他们每天两次旅行的一次)。所以我希望能够看到他们乘坐的是哪条公交路线,在哪一天,以及他们是哪个用户。到目前为止,我尝试了许多不同的东西,但没有什么能给我一个有效且易于理解的图表。早些时候我试过这个:

但它看起来不太对。我也试过这个:

图表真的很忙,很难阅读。任何帮助,将不胜感激。谢谢!

0 投票
1 回答
178 浏览

r - 在R中计算加权分组平均值的快速方法?

给定纵向数据,我如何计算一个矩阵,其中每列代表给定变量的加权分组平均值?

我开发了一种需要循环的方法,而且速度太慢。我认为这可能是矢量化的,但解决方案让我望而却步。

这是我目前的方法:

最初,我尝试使用 执行此操作lfe::demeanlist,但它给了我错误的输出!

虽然速度快很多...

我会接受以下两种答案中的任何一种:

  1. 说明lfe::demeanlist在加权情况下所做的事情。当我从平均值中减去加权偏差时,我不应该得到加权平均值吗?知道这一点,我如何计算加权分组均值矩阵?
  2. 不涉及 demeanlist 计算加权分组均值矩阵的方法。

注意:用%*%矩阵乘法函数代替可以RcppEigen加快速度,但还不够。我认为问题在于循环。

这是一些示例输入:

哪里f是分组因子。

0 投票
0 回答
44 浏览

r - How to keep imputed value constant over time using R package Amelia?

I have data from longitudinal study about BMI and other variables (that could have some effect on BMI) in children in different time points, and I want to impute missing values using function amelia() from R package Amelia.

Each variable has at least one missing value.

Some variables change with time (like family income), whereas some are fixed (like sex).

In several cases sex is not known.

My question is following:

How can I incorporate constraints about sex into the amelia code?

It means I need to include somehow facts when e.g. sex is "male" in one time point it must be "male" in the rest of time points.

Does anyone know how to stick these facts using amelia code?

0 投票
1 回答
32 浏览

r - 将多阶段事件数据转换为r中的纵向数据

我有一个关于职位晋升的数据集。对于每个人,我都有关于他们何时被公司聘用、晋升和离开公司的确切数据。我也有几个特点。我正在使用 r。

我想将这些数据转换成一个长的纵向数据集,其中每个日期报告个人所处的阶段,同时还报告时间不变的特征。我的结束日期是 1995 年 1 月 1 日,之后没有观察到。我已经查看了 reshape 包,但它没有我需要的东西。

我的数据:

结构(列表(ï..Name = 结构(c(2L,1L,4L,3L),.Label = c(“Ademulegun,Sauel Adesujo”,“Bassey,惠灵顿 Umo”,“Imo,UO”,“Lawan, Umar"), class = "factor"), Mons = c(0L, 0L, 0L, 0L), Sandhurst = c(0L, 0L, 1L, 0L), Entry = structure(c(2L, 3L, 1L, 4L) ), .Label = c("2/6/1953", "4/30/1949", "6/11/1949", "6/4/1955"), class = "factor"), Second.Lieutenant =结构(c(2L,3L,1L,4L),.Label = c(“2/6/1953”,“4/30/1949”,“6/11/1949”,“6/4/1955” ), class = "factor"), Lieutenant = structure(c(2L, 1L, 4L, 3L), .Label = c("12/20/1949", "4/30/1949", "5/3/ 1958", "8/1/1955"), class = "factor"),船长=结构(c(2L,3L,1L,4L),.Label = c(“”,“2/7/1951”,“3/5/1952”,“5/3/1958”),类= "因子"), 主要 = 结构 (c(4L, 3L, 1L, 2L), .Label = c("", "1/15/1963", "12/27/1958", "6/21/1957 " ), class = "factor"), Lieutenant.Colonel = structure(c(4L, 3L, 1L, 2L), .Label = c("", "1/15/1963", "10/3/1962" , "8/30/1962"), class = "factor"), 上校 = structure(c(3L, 2L, 1L, 1L), .Label = c("", "10/3/1962", "2 /26/1966"), class = "factor"), Brigadier.General = structure(c(3L, 2L, 1L, 1L), .Label = c("", "10/3/1962", "2/ 26/1966"), 类 = "因素"),出发=结构(c(2L,1L,3L,4L),.Label = c(“1/15/1966”,“11/1/1966”,“5/8/1956”,“7/6/1967 "), class = "factor"), 种族 = structure(c(1L, 4L, 3L, 2L), .Label = c("Efik", "Igbo", "Kanuri", "Yoruba"), class = "因子")), 类 = "data.frame", row.names = c(NA, -4L))

我正在寻找这样的东西:

0 投票
2 回答
90 浏览

arrays - 具有变化的开始和停止值的 SAS 动态数组

我正在研究一个纵向数据集,其中每一行是一个主题,每一列是一个事件。对象可以拥有的事件数量没有限制,但事件以几种方式编码。为了这个例子,假设一种编码方式是二进制(好,坏)。

我试图找到 1) 所有由 3 个或更多事件(没有计数限制)组成的事件字符串,这些事件从开始到结束都在 24 小时内(在同一主题上)。在同一主题中,此标准也可能多次成功。

2)对于每个成功(24 小时内 3 个或更多事件的字符串)我需要计算好的事件的数量。

我已经包含了生成与我相似的数据的代码。现在我正在简化为 26 个观察结果,但对于单个主题我最多有 42 个。

下面的错误消息是结果:

在此先感谢您的任何建议!

0 投票
1 回答
340 浏览

syntax - spss中的第一个和最后一个ID语法

我以前的组织使用 SAS,但我现在的组织使用 SPSS。我有纵向数据集要分析。first.ID 和 last.ID 的 SPSS 等效语法是什么?在 SAS 中,语法是,'if first.ID and last.ID then do....;'

如果这篇文章被重复,我很抱歉,但我在档案中找不到它们。非常感谢您的帮助,我很感激。

干杯,梅尔

0 投票
1 回答
44 浏览

stata - 事件发生时保留第一条记录

我在Stata中有以下数据:

目标是在事件发生时获取第一行 foreach id,如果没有事件发生,则获取最后一个报告 foreach id。这是我希望获得的数据的示例

0 投票
2 回答
582 浏览

r - 如何在纵向分析中为每个人计算 R 中的回归残差?

我正在研究纵向/重复测量多级模型(MLM)。通常,对于随时间变化的协变量(在我的情况下为“每周总收入/1000”),您将计算变量的以人为中心的版本(即从个人每周收入的平均值中减去人年收入响应)所有所述人的时间点)。但是,这可能会导致偏差(参见此处),因此更好(更通用)的方法是围绕每个个体的回归线(碰巧,回归的残差用于此目的)。

因此,我需要计算以下回归,但对于每个人(大约 10,000 个人,有 25,000 个观察值):

然后,真正关键的部分是我需要将残差提取到我的主数据集中的单独列中,并与每个人匹配。这些残差将取代我的组均值中心变量(这又将用于我的 MLM)。

这是使用我为组均值居中所拥有的功能的可能起点。如果这可以更新以适应每个人的残差输出的回归,那么这将是理想的(如果不是,那么我对其他方法持开放态度):

长格式的数据提取(Person_ID人在哪里,nYear时间,Weekly_Gross_Pay_Main_Job周收入/1000,Weekly_Gross_Pay_Main_Jobgmc组均值居中版本):

0 投票
1 回答
199 浏览

r - r 将具有公共和唯一变量的 2 个数据帧合并为长数​​据

不确定我的标题是否很好地传达了我的问题。如果您可以阅读此示例,它将更有意义。我想合并 2 个数据框,它们是 2 波纵向调查。Time1 数据框的参与者多于 Time2 数据框,因为并非每个人都返回了 Time 2 调查。两次都测量了一些变量,但还有一些变量仅在每个数据帧中可用。例如,

我想通过合并两者来制作一个长数据集,只保留其数据在两个时间都可用的参与者并保持所有变量。我希望合并的数据看起来像 d3:

我使用的代码如下。

我得到了我想要的,但这需要时间,而且容易出错。我认为必须有更有效的方法来做到这一点。有人可以帮忙吗?