0

我有一个包含 2 个数字列的数据集。

示例数据集:

X = c(-1:-20)
Y=c(11:30)
df=as.data.frame(cbind(X,Y))

我的数据集如下所示:

     X  Y
1   -1 11
2   -2 12
3   -3 13
4   -4 14
5   -5 15
6   -6 16
7   -7 17
8   -8 18
9   -9 19
10 -10 20
11 -11 21
12 -12 22
13 -13 23
14 -14 24
15 -15 25
16 -16 26
17 -17 27
18 -18 28
19 -19 29
20 -20 30

我正在使用一个循环,它允许我将 100 减去低于 -10 的值。

for (i in 1:length(df[,1]))
{
  if ((df$X[i]< c(-10.0)) == T)
  {df$X[i] = df$X[i] - 100}else
  {}
}

我的“真实”数据集包含 300 000 行,循环非常耗时。这就是为什么我一直在尝试找到一个可以完成这项工作的 apply 函数。

library(plyr)
TAB1=ddply(df,.(X),function (x) x[(df$x)< c(-10.0)]-100)

但它根本不起作用。

感谢您的帮助。

4

1 回答 1

2

不要ddply用于此任务。你不需要它。操作是矢量化的

index <- df$X < -10
df$X[index] <- df$X[index] - 100
于 2013-04-30T08:56:15.387 回答