问题标签 [longitudinal]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
129 浏览

r - 如何在 R 中对 2x2x2 设计进行纵向分析?

我有一个数据集,其中包含以下处理变量(营养、肥料),它记录了水中藻类随时间的生长(t0,t1...t10)。在与标记为“氮”的肥料系列中,在t5天之后添加氮。在标记为“无”的系列中,不添加氮。

我想比较各组之间的坡度,看看施肥干预后坡度是否发生变化。我想不使用肥料作为对照(即(好,无)或(坏,无)作为对照)

我将这些数据转换为长格式,列标题为“营养”、“肥料”、“时间”、“重复”和“生长”。我创建了一个名为“加法”的新列,以区分 t5 之前和 t5 之后的时间段。t5 之前的时间 -> 0,t5 之后的时间 ->1

我进行以下纵向分析,每列具有以下结构:

lmer(生长~营养+肥料+时间+添加+(1|复制))

我收到一条错误消息,说固定效果模型排名不足,因此删除了 x 列。反正有这个问题吗?是否有改进模型编写方式的建议?

0 投票
1 回答
249 浏览

r - 如何使用 lme4/nlme 对不断变化的变量进行估计?

我对 R 和混合模型分析相当陌生。

我想为每个人ln_ahr的变量变化产生一个单一的估计。time我相信这可以被认为是时间变化的斜率。这是我的数据的结构(长格式):

v001主题标识符在哪里。

我尝试使用nlmeR 中的包计算斜率:

我尝试获得了ranef(slope)coef(slope)值。我读到这些coef(slope)值“计算每个分组因子的每个解释变量的固定和随机效应系数的总和”,因此我相信打印出时间系数(省略截距值)会给我一个估计每个人的ln_ahr随着时间的推移发生变化,我可以将其用作我的“斜率”或估计ln_ahr.

时间按年计算,其中time0 表示ln_ahr测量的第一年;每个人每三年测量一次。

我想知道这是否是正确的方法,或者我是否正确地做到了;如果不是,你有什么建议?

0 投票
2 回答
195 浏览

r - 如何计算 R 中最后两个值之间的差异?

我的数据大致如下所示,我想为每个参与者 ( v001)计算一个变量,其中包含最后两个可用测量值之间的差异(从lnslope1lnslope9)。每个受试者至少有两个测量值。

我的问题是:

我怎样才能在 R 中做到这一点?我已经阅读了有关该diff功能的信息,但我不确定它是否可以在这里使用。我是否必须以长格式重组数据才能进行此计算?这是数据:

0 投票
1 回答
140 浏览

r - 计算特定范围内多个重叠事件的最大值

我有多个大型数据帧来捕获持续一定时间的事件。这个例子给出了我的数据集的简化版本

数据框1:

数据框 2:

  • ID在所有数据集中对同一个人使用相同的

  • Days指定事件的长度(如果Days值为 10,则事件持续 10 天)

  • Date指定事件开始的日期。在这种情况下,Date可以是 0 到 90 或 91 之间的任何数字(数据代表季度中的天数)

  • Value是按指定次数重复的属性Days。例如,对于df1中的第一行,该值30从第80天开始重复10次(30重复10天)

我感兴趣的是为ID每个数据帧中的每一个赋予每天的最高值。请记住,多个事件可以重叠,然后必须将值相加。

最终的数据框应如下所示:

例如,对于ID1,三个事件重叠并导致数据帧 2 中的最高值为 80。对于ID3,df1 和 df1 的事件之间没有重叠,只有 df2 重叠。

由于文件的大小,我更喜欢一种避免将所有数据帧合并到一个数据帧中的解决方案。

编辑 我重新排列了我的数据,以便所有重叠的事件都在一个数据框中。我只需要每个数据帧的最高重叠值。

重现数据帧的代码:

0 投票
2 回答
87 浏览

sql - SQL根据数据点的出生日期和时间戳将数据分类到年龄箱中

我是 sql 和 stackoverflow 的新手,所以请怜悯我。我有 3 张桌子(如下所述)。我已经针对这个特定问题进行了很多搜索,但没有找到解决方案。我是一名研究生,研究儿童多年来的行为和心理。我通过观察一个孩子的行为 10 分钟并记录他们每分钟所做的事情来做到这一点。我为多个不同年龄的孩子这样做,并且多年来我多次关注每个孩子。所以数据是混合纵向的(多年来,同一个人由多个数据点表示)。我还应该注意,我目前正在使用 Access。

10 分钟的回合称为“跟随”,每分钟的活动称为“扫描”。多年来,我将这些数据输入到一个 Excel 表中,其中包含关注日期、扫描时间戳、个人 ID、活动和其他一些内容。我已经把它分成两个表:follow_id 表,其中包括唯一的关注 ID 号、每次关注的日期和关注的个人的 ID 等信息。然后,我为每次扫描制作了第二张表,每次扫描都有关联的 follow_id 编号,这是它来自的关注的唯一 ID 号。我希望这是有道理的,我尝试输入表格,但我无法正确格式化。请原谅我的n00bness。

我需要做的是整理所有的扫描,比如说,1 岁以下的婴儿,然后是 1-2 岁的婴儿,依此类推。这很困难,因为我几乎所有的科目都代表在多个年龄段。换句话说,我可能在 9 个月大时跟随了个体 A,然后在 16 个月大时再次跟随。所以我做了一个生日表,上面有每个人的 ID 和他们的生日。

我已经尝试了一堆子查询和连接等等,但很明显我真的不知道我在做什么。如果有人能指出我正确的方向,我将不胜感激。例如,我应该从联接开始吗?或者这一切都可以只使用子查询吗?任何见解都会有所帮助并不胜感激。

tbl_biography

tbl_follow_id

tbl_scan_id

我应该指出,您可以看到个人 AA 和 BB 在数据集中分别表示为 2 个单独的跟随者,并且每个跟随者的年龄不同。问题是,我如何过滤掉,例如,0-1 岁、1-2 岁等的所有扫描?目前,将所有个人聚集在一起就可以了。但在未来,如果某些人能够做到这一点,例如基于性别、母亲和我在传记表中的其他变量,这将是令人惊奇的。提前感谢大家。

0 投票
2 回答
196 浏览

r - 使用纵向数据创建起始值变量(条件)

我正在尝试创建一个新变量,该变量基本上是我的数据框中另一个变量的起始值。示例数据:

我想要的是一个名为 new_var (或其他)的新列,它等于outcomeattime == 0的值,id = id并且还取决于Attitude. 因此,我想将 to 扩展dataframe为:

只有这样才能进行一些体面的编码。在 SAS 中,我知道我可以使用该lag功能来做到这一点。我真的很感激一个不是“变通”的解决方案,所以它就像 SAS,而是正确的 r 解决方案。最后,我也想在 r 中变得更强大。

相关:R 中的保留和滞后函数作为 SAS 但是我更喜欢一些基于索引或“通常”r 方式的解决方案。在这里它也不依赖于其他条件。

因此,这里重要的是编码适用于不同idsattitude级别/变量(A1,A2,...),并且outcome valueattime == 0基本上被复制到new_var.

我希望我能清楚地传达我的信息。如果不是,我认为一小段示例代码以及我想如何扩展它应该足够清楚。期待建议。

编辑@jogo 答案的另一个示例代码。

0 投票
1 回答
894 浏览

r - 基于值 ggplot2 从深到浅的颜色

我正在尝试使用 ggplot2 自定义颜色。我写的函数如下:

然而这不起作用,但我似乎无法弄清楚为什么scale_color_manual(..)值不起作用。我正在使用的当前情节是:

在此处输入图像描述

这有点符合我想要达到的效果:值 1-3 的深色(即基于first_answer1 到 5 的范围)和 4 和 5 的浅色。原因很简单,因为有更多的行值为 4 或 5,我希望能够看到跨时间线的方向。

编辑图像是我目前拥有的情节。虽然它有点像我想要的,但我更愿意自己设置颜色或使用一些选择颜色的函数来自动增强绘图可见性(图中的线条)。

0 投票
1 回答
434 浏览

r - 使用“plm()”估计具有嵌套结构的重复测量随机效应模型

是否可以使用包估计具有嵌套结构的重复测量随机效应模型?plm()

我知道可以使用lmer()lme4。但是,lmer()依赖于可能性框架,我很想用plm().

这是我受此问题启发的最小工作示例。首先是一些必需的包和数据,

该数据集egsingle是一个不平衡的面板,由 1721 名学童组成,分为 60 所学校,跨越五个时间点。详情见?mlmRev::egsingle

一些轻量级的数据管理

此外,相关数据的片段

现在,严重依赖Robert Long 的回答,这就是我使用包估计具有嵌套结构的重复测量随机效应模型的lmer()方法,

我查看了手册plm(),它有一个索引命令,index但它只需要一个索引和时间,即,index = c("childid", "year")忽略 schoolid模型看起来像这样,

总结一下这个问题

我怎样才能,甚至有可能,使用包指定具有嵌套结构的重复测量随机效应模型,例如?Model.1plm()

下面是两个模型的实际估计结果,

0 投票
1 回答
46 浏览

python - 创建一个空的纵向国家数据集

我想创建一个空的纵向国家周数据集,其中每个国家代表 52 次(一年中的几周),所有其他变量首先用 0 填充。然后它应该看起来像这样:

因此,我的问题是:我如何从国家列表中获得这样一个纵向国家周数据集。

0 投票
1 回答
2614 浏览

r - R中纵向数据的简单图

我有一个简单的问题,但我花了几天时间试图解决这个问题。我有一个长数据文件,重复测量,如下所示。

我想绘制不同性别的抑郁症随时间变化的趋势。然而,我所有的尝试都导致每个 ID 都有自己的线路。

我只想要一条男性线和一条女性线。