5

我创建了以下函数/示例作为在表格等中显示变量标签的通用方式:

#' Function to prettify the output of another function using a `var.labels` attribute
#' This is particularly useful in combination with read.dta et al.
#' @param dat A data.frame with attr `var.labels` giving descriptions of variables
#' @param expr An expression to evaluate with pretty var.labels
#' @return The result of the expression, with variable names replaced with their labels
#' @examples
#' testDF <- data.frame( a=seq(10),b=runif(10),c=rnorm(10) )
#' attr(testDF,"var.labels") <- c("Identifier","Important Data","Lies, Damn Lies, Statistics")
#' prettify( testDF, quote(str(dat)) )
prettify <- function( dat, expr ) {
  labels <- attr(dat,"var.labels")
  for(i in seq(ncol(dat))) colnames(dat)[i] <- labels[i]
  attr(dat,"var.labels") <- NULL
  eval( expr )
}

但是,我宁愿用户不必引用传入的表达式。

replicate这样做,使用此代码:

eval.parent(substitute(function(...) expr))

然而,我不明白它是如何工作的,并且就像在没有理解的情况下尝试复制的典型情况一样,我尝试简单地复制此代码或修改它都失败了。

如何编写一个以未计算表达式作为输入的函数,而不要求用户输入quote他们的表达式?我认为答案将在很大程度上依赖于惰性评估。

4

1 回答 1

5

用评估和替代回答

我认为在这种情况下你只需要这样做eval(substitute(expr))expr是一个promise,我们既可以expr直接通过 using 获取promise的值,也可以通过 using 获取promise的内容substitute。有关详细信息,请参阅http://cran.r-project.org/doc/manuals/R-lang.html#Promise-objects。承诺的内容是 a call,所以我们只是eval为了得到新的结果。

prettify <- function( dat, expr ) {
  labels <- attr(dat,"var.labels")
  for(i in seq(ncol(dat))) colnames(dat)[i] <- labels[i]
  attr(dat,"var.labels") <- NULL
  eval(substitute(expr))
}

> prettify( testDF, str(dat))
'data.frame':   10 obs. of  3 variables:
 $ Identifier                 : int  1 2 3 4 5 6 7 8 9 10
 $ Important Data             : num  0.336 0.9479 0.1379 0.94 0.0484 ...
 $ Lies, Damn Lies, Statistics: num  1.398 0.654 0.268 -0.397 -0.41 ...

在建议的编辑中,@user2103369 建议这replicate是不同的,因为它用于sapply获取多个评估,因此它需要一个函数而不是调用。

默认参数时的不同行为

有趣的是,根据参数是默认参数还是用户添加,promise 的行为会有所不同;见下文。我认为 SoDA 解决了这个问题,但我手边没有。此函数打印承诺的值,用 评估它eval,然后直接评估它。

foo <- function(a, b=a+1) {
  print(substitute(b))
  print(eval(substitute(b)))
  b
}

当用户提供值时,直接评估它会导致错误。

> foo(a=2, b=a+1)
a + 1
[1] 3
Error in foo(a = 2, b = a + 1) : object 'a' not found

但默认值有效。

> foo(a=2)
a + 1
[1] 3
[1] 3

在建议的编辑中,@user2103369 表示默认参数在函数内部进行评估,而显式参数在调用框架中进行评估。所以在这种情况下,用户提供的值会失败,因为a在调用框架中不可见。

使用函数的另一种方法

但是,对我来说(尽管 OP 不同意;我将这部分留给该答案的未来读者),这感觉就像使用函数作为第二个参数更自然的情况,就像这样;一方面,这意味着用户不必知道它是dat在函数中调用的。

prettify <- function( dat, FUN ) {
  f <- match.fun(FUN)
  labels <- attr(dat,"var.labels")
  for(i in seq(ncol(dat))) colnames(dat)[i] <- labels[i]
  attr(dat,"var.labels") <- NULL
  f(dat)
}

然后可以使用匿名函数调用它,我认为这正是您正在寻找的,除了用户也必须输入function(x)

> prettify( testDF, function(x) str(x) )
'data.frame':   10 obs. of  3 variables:
 $ Identifier                 : int  1 2 3 4 5 6 7 8 9 10
 $ Important Data             : num  0.296 0.707 0.883 0.821 0.724 ...
 $ Lies, Damn Lies, Statistics: num  -1.1506 0.4846 -1.824 -0.397 0.0898 ...

或者在简单的情况下,例如在您的示例中,仅使用函数的名称。

> prettify( testDF, str)
'data.frame':   10 obs. of  3 variables:
 $ Identifier                 : int  1 2 3 4 5 6 7 8 9 10
 $ Important Data             : num  0.296 0.707 0.883 0.821 0.724 ...
 $ Lies, Damn Lies, Statistics: num  -1.1506 0.4846 -1.824 -0.397 0.0898 ...
于 2013-02-23T15:06:35.873 回答