问题标签 [locf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
107 浏览

arrays - 用于填充最后一个值的 SAS 数组在多列中结转

如图片 sepstrata0 中所述,sepstrata1、sepstrata3 的最后一个值已经带有 YAS、YES、YCS 列。我想更改代码,使 sepstrata0、sepstrata1、sepstrata3 列不受影响,而来自 transposed_gen_mod 的其他列应该具有 LVCF。我有 YAS0 YES0 YCS0 YAS1 YES1 YCS1 YAS3 YES3 YCS3 列,其中我在所有 YAS 列中都有诸如“Atrisk”之类的值,类似地,YES 列的“事件”和所有 YCS 列的“审查员”,总共我有大约 9547 行每列只有第一行有值。我想将这些值转发到所有 9657 行。

谁能指导我如何修改下面的书面代码以达到结果。我试图通过循环完成但无法完成它直到结束。让我知道我是否在轨道上并帮助解决修改代码以实现结果的解决方案。

跑;

0 投票
2 回答
100 浏览

r - 相当于 sparkR 中的 na.locf

我是 R 新手,试图在 sparkR 中重写 R 代码。名为costTbl的 data.table 上的操作之一(它有 5 个其他列)是

我无法在 sparkR 中找到等效的操作。我认为可以通过对 product_id 上的 df 进行分组并执行此操作来使用 gapply。但我无法使代码工作。

gapply是正确的方法吗?还有其他方法可以实现这一目标吗?

0 投票
0 回答
85 浏览

python - 如何在这个时间序列数据中为python中的熊猫使用LOCF

如果我有如下给出的数据,我需要根据上次出现时的 id 填写最后的观察结果,数据如下所示 -

ID OpenDate ObsDate 金额 ClosedDate 输出

1 10-12-1990 15-08-1991 20 15-08-1992 2

3 10-12-1993 15-12-1993 25 15-08-1994 1

5 10-12-1995 25-11-1997 0 18-08-1998 1

1 南 南 南 南 南 南

3 南 南 南 南 南 南

预期的输出应该是 1 AND 3 IDS 的字段值,之前的值为 1 和 3,即

ID OpenDate ObsDate 金额 ClosedDate 输出

1 10-12-1990 15-08-1991 20 15-08-1992 2

3 10-12-1993 15-12-1993 25 15-08-1994 1

5 10-12-1995 25-11-1997 0 18-08-1998 1

1 10-12-1990 15-08-1991 20 15-08-1992 2

3 10-12-1993 15-12-1993 25 15-08-1994 1

认为这是一个数据框,python 所需的输入。

0 投票
1 回答
41 浏览

r - 用因子变量在 data.table 中插入数值变量

我正在尝试插入 data.table 的多个数字列dt。它可以用 NA 或类似的东西填充na_locf。在我的真实数据中可能不止一个因子列。这是我的示例数据:

结果应如下所示:

对于插值,我使用了这个函数:

但我无法使用数字列进行插值并以所需的方式处理因子列。因子列a应填写 NA 或na_locf,我不确定。如果一个时间点有多个因子值,它们也应该存在,因此例如一个时间点有多个行(在我的示例中time = 0)有没有办法做到这一点?

0 投票
1 回答
111 浏览

r - 丢失数据的 LOCF 和 NOCF 方法:如何绘制数据?

我正在处理以下数据集及其缺失的数据:

我想通过最后一次观察结转方法 (LOCF) 和下一个观察结转方法 (NOCB) 填充缺失数据,并报告图形表示,按性别绘制年龄期间的个人资料,突出显示估算值,以及按性别计算每个年龄的均值和标准误。您能否建议一种在 plot() 函数中正确设置参数的方法?

有人可能对此有任何线索吗?

我让你下面的一些代码,以防万一它们变得有用,从其他数据集中提取作为示例。

0 投票
1 回答
68 浏览

r - LOCF 插补以及如何填写缺失的条目

我正在处理以下数据集,并尝试填充 VISUAL52 变量的缺失条目,通过 LOCF 方法(最后一次观察结转)输入数据。

我不知道我做得好不好,但我试图以这种方式描述每次治疗的 VISUAL52 变量的样本量、平均值和标准误差(让我知道我是否会最好使用不同的功能)。

但是,至于插补部分,我已经从 data-table 包中运行了函数 nafill(),但是我得到了你在运行 complete() 函数后可能会看到的错误。

我想知道为什么该函数会返回此错误,以及是否有人可能知道一些替代方法来使用 locf 方法估算数据并填充数据集中缺失的数据。

0 投票
2 回答
93 浏览

r - 绘制缺失数据

根据此过程,我正在尝试使用 LOCF 方法绘制以下估算数据集

然而,当我运行最后一行来绘制数据集时,它会让我返回这些错误和警告消息:

你能解释一下为什么以及如何修复它们吗?我让你在运行它后附上我一直在寻址的页面。 在此处输入图像描述

0 投票
1 回答
53 浏览

r - 绘制插补值

我被要求通过使用 zoo 包中的 na.locf() 函数来使用 LOCF 和 NOCB 方法估算数据集,我现在正在尝试绘制观察值和估算值。我正在使用的数据集如下:

我通过将原始宽格式转换为长格式来估算缺失值,并遵循其余步骤:

有没有人知道如何将估算值与观察值一起以图形方式绘制?我在这里向您介绍了一些我被推荐使用的功能,并且我已经开始对其进行适当的修改,但是没有成功。

不会返回正确区分两种性别的表示,并且:

它为 mouse 包中的空气质量数据集再现了一个很好的散点图。关键是我无法使用 na.locf 函数提取估算值。

我指定我应该将年龄/测量值绘制为响应变量与性别,这就是为什么我需要区分两种性别。

0 投票
2 回答
138 浏览

r - 用R中的最后一个非空单元格和下一个非空单元格填充列中两个值之间的空单元格

我需要遍历数据框中的 ID,通过在 NA 单元格之外的最后一个填充条目和第一个填充条目之间均匀地分配空单元格来填充列中的 NA 值。

应该填写到这个:

在观察之间有2n 个NA 值的情况下, n归因于最后一个,n归因于下一个。在2n+1 个值的情况下,n属于最后一个,n+1属于下一个。

我知道我需要使用与大型数据库配合使用na.locfzoo包,用于根据最后一个非空单元格填充空值,以及fromLast执行“下一个向后观察”的参数。但是,我无法构建一个循环来解释偶数或奇数个 NA 值,并将这两个值一起使用。

使用 tidyverse 包,

这会在两个方向上填充 NA 值,但不考虑组中 NA 单元格的不同边界值。

0 投票
1 回答
26 浏览

r - 用上个月的值估算缺失值(如果存在)

我有一个包含超过 100 000 行和 30 000 个唯一 ID 的数据框。

如果上个月的值和相同的 id ,我的目标是填充不同列中的所有 NA 。但是,大多数情况下,先前记录的值来自一个多月前。那些我想保持不变的NA。

id 列和 date 列没有 NA。这是我拥有的数据的示例:

这是我尝试过的最后一个代码实现:

'''

'''

但显然“mutate_all()忽略了以下分组变量:列id