0

我有一个长格式数据框data.set,其中每个主题在每个条件下都有不同的数值 ( data.set$target_resp.rt)。通过使用 DescTool 函数,我已经根据总体标准对我的数据进行了winsorized Winsorize(有关信息,请参见此处):

overall.criterion.2sd <- data.set$overall.mean+(2*data.set$overall.sd)
winsors.2 <- DescTools::Winsorize(data.set$target_resp.rt, maxval=overall.criterion.2sd[1])

上面,可以定义maxval为变量的第一个值overall.criterion.2sd,因为它对所有主题都是相同的值。现在我想按主题对我的数据进行winsorize,即我需要在主题内逐行运行winsorizisation。这是我的尝试,criterion.2sd它只是 N 个值的向量 N = no. of subject):

criterion.2sd <- data.set$rt.mean+(2*data.set$rt.sd)
within.winsors.2 <- data.set %>% group_by(Nome, Cognome) %>%
                                    Winsorize(data.set$target_resp.rt, maxval=unique(criterion.2sd))

弹出以下错误:

[<-.data.frame( , x < minval *tmp*, value = c(1.35768795013, : 'value' 的长度错误

我知道maxval变量的基数有问题,但我不知道如何解决它。有人可以帮忙吗?

这是数据集的一个示例data.set(希望它足够了;让我知道它是否是正确的格式):

   subject        target_resp.rt   rt.mean     rt.sd
 1 1              1.0398901        0.9016781   0.3109358
 2 1              0.6887729        0.9016781   0.3109358
 3 1              0.7691720        0.9016781   0.3109358
 4 1              1.0064900        0.9016781   0.3109358
 5 1              0.8195999        0.9016781   0.3109358
 6 2              0.8410320        1.0500845   0.4210796
 7 2              0.8229311        1.0500845   0.4210796
 8 2              0.9250839        1.0500845   0.4210796
 9 2              1.0085750        1.0500845   0.4210796
10 2              1.1406291        1.0500845   0.4210796
11 3              0.5561039        0.749789    0.2350127
12 3              0.6022139        0.749789    0.2350127
13 3              0.8560688        0.749789    0.2350127
14 3              0.5886030        0.749789    0.2350127
15 3              0.5520449        0.749789    0.2350127
4

1 回答 1

1

这是混合 dplyr 语法的问题。在原始问题中,您将一个向量传递给Winsorize,但data.set %>% group_by(Nome, Cognome)它是一个数据集,并且管道 ( %>%) 将整个数据集传递给 的第一个参数Winsorize,这意味着您真的在调用

Winsorize(x = data.set, minval = ..., maxval = ...)

你真正想要的是在改变mutate之后使用;语法如下:group_bytarget_resp.rt

data.set %>% group_by(subject) %>%
  mutate(target_winsorized = Winsorize(target_resp.rt, maxval=unique(overall.criterion.2sd))

target_winsorized这会在数据集中创建一个具有您想要的属性的新变量。将来您可能还想保存overall.criterion.2sd数据集的内部。

文档

dplyr如果想了解有关语法和dplyr样式的更多信息,请查看文档。

于 2018-01-26T13:58:01.383 回答