7

我有一个数据框,我想使用与某个名称匹配的列来转换所有列(例如,获取日志或其他)。所以在下面的例子中,我想记录 X.1 和 X.2,而不是 Y 或 Z.1。

df <- data.frame(
  Y = sample(0:1, 10, replace = TRUE),
  X.1 = sample(1:10),
  X.2 = sample(1:10),
  Z.1 = sample(151:160)
)

# option 1, won't work for dozens of fields
df$X.1 <- log(df$X.1)
df$X.2 <- log(df$X.2)

当数据帧是几个千兆时,有没有一种好的、有效的方法来做到这一点?

4

3 回答 3

23

对于将返回 data.frame 的函数:

cols <- c("X.1","X.2")
df[cols] <- log(df[cols])

否则,您将需要lapply在列上使用或循环。这些解决方案会比上面的解决方案慢,所以只有在必要时才使用它们。

df[cols] <- lapply(df[cols], function(x) c(NA,diff(x)))
for(col in cols) {
  df[col] <- c(NA,diff(df[col]))
}
于 2013-07-03T16:35:54.293 回答
7
vars <- c("X.1", "X.2")

df[vars] <- lapply(df[vars], log)
于 2013-07-03T16:35:03.413 回答
1
df <- data.frame(
Y = sample(0:1, 10, replace = TRUE),
X.1 = sample(1:10),
X.2 = sample(1:10),
Z.1 = sample(151:160)
)
df

假设您知道那些需要在实际数据帧中进行转换的变量(2 和 3 是指 df 中的第 2 和第 3 个变量,即 X.1 和 X.2)

df2=log10(df[c(2:3)])
df2

如果变量是数据框中的一部分,您可以选择它们,例如 c(1,3,6,8:10,13) 用于第 1、第 3、第 6 8 到第 10 和第 13。这仅适用于数值变量。

于 2016-10-16T10:43:11.077 回答