1

我有一个看起来像这样的数据集

头部(数据集)

Distance   Lag time  Kurtosis
7.406100   10
144.1700   1
77.31800   1
81.15400   1
4.249167   6

我想向峰度列添加值。要计算峰度,我需要按延迟时间对距离进行分组(即,延迟时间 1 的所有距离都会给我一个峰度值等)。为了得到峰度,我通常使用包“psych”和函数 describe() 有没有我可以添加的循环来做到这一点?

4

2 回答 2

0

由于describe生成一个数据框作为输出,而您想要的只是一列(也称为峰度),您需要对describe输出进行子集化

library(dplyr)
library(psych)

df %>% 
  group_by(Lag_Time) %>% 
  mutate(Kurtosis = describe(Distance)[1,"kurtosis"])

  Distance Lag_Time Kurtosis
     <dbl>    <dbl>    <dbl>
1     7.41       10    NA   
2   144.          1    -2.33
3    77.3         1    -2.33
4    81.2         1    -2.33
5     4.25        6    NA   
于 2020-03-10T16:08:12.253 回答
0

您应该可以使用dplyr

library(dplyr)
library(magrittr)
dataset <- dataset %>%
           dplyr::group_by('Lag time') %>%
           dplyr::mutate(Kurtosis = describe(Distance)$kurtosis)
于 2020-03-10T15:57:03.160 回答