7

我正在编写一些用于执行重复任务的函数,但我试图尽量减少加载数据的次数。基本上,我有一个函数可以获取一些信息并绘制图表。然后我有第二个函数,它将循环并将多个图输出到.pdf。在这两个函数中,我都有以下代码行:

if(load.dat) load("myworkspace.RData")

whereload.dat是逻辑的,我需要的数据存储在 myworkspace.RData 中。当我调用循环并输出多个图的包装函数时,我不想在每次调用内部函数时重新加载工作区。我以为我可以在包装函数中加载一次工作区,然后内部函数可以访问该数据,但我得到一个错误说明。

所以我的理解是当一个函数在其本地环境中找不到变量时(在函数被调用时创建),该函数将在父环境中查找该变量。

我假设内部函数调用的父环境将是外部函数调用。显然这不是真的:

func1 <- function(...){
  print(var1)
}

func2 <- function(...){
  var1 <- "hello"
  func1(...)
}

> func2()
Error in print(var1) : object 'var1' not found

在阅读了许多问题、语言手册和这篇非常有用的博客文章之后,我想出了以下几点:

var1 <- "hello"
save(list="var1",file="test.RData")
rm(var1)

func3 <- function(...){
  attach("test.RData")
  func1(...)
  detach("file:test.RData")
}

> func3()
[1] "hello"

有一个更好的方法吗?当它被调用时,为什么不在func1本地环境中寻找未定义的变量?func2func2func1

注意:我不知道如何命名这个问题。如果有人有更好的建议,我会更改并编辑此行。

4

2 回答 2

9

为了说明词法作用域,请考虑以下内容:

首先让我们创建一个沙盒环境,只是为了避免非常常见的 R_GlobalEnv:

sandbox <-new.env()

现在我们在里面放了两个函数:f,它寻找一个名为x;的变量。和g,它定义了一个本地x和调用f

sandbox$f <- function()
{
    value <- if(exists("x")) x else "not found."
    cat("This is function f looking for symbol x:", value, "\n")
}

sandbox$g <- function()
{
    x <- 123
    cat("This is function g. ")
    f()
}

技术性:在控制台中输入函数定义会导致封闭环境设置为R_GlobalEnv,因此我们手动强制封闭fg以匹配它们“所属”的环境:

environment(sandbox$f) <- sandbox
environment(sandbox$g) <- sandbox

呼唤gx=123找不到局部变量f

> sandbox$g()
This is function g. This is function f looking for symbol x: not found. 

x现在我们在全局环境中创建一个并调用g. 该函数fx首先在沙箱中查找,然后在沙箱的父级中查找,这恰好是 R_GlobalEnv:

> x <- 456
> sandbox$g()
This is function g. This is function f looking for symbol x: 456 

只是为了检查它首先在其外壳中f查找,我们可以在那里放置并调用:xxg

> sandbox$x <- 789
> sandbox$g()
This is function g. This is function f looking for symbol x: 789 

结论:R 中的符号查找遵循封闭环境链,而不是在执行嵌套函数调用期间创建的评估框架。

编辑:只需添加一个链接到Martin Morgan 关于parent.frame()vs相关主题的这个非常有趣的答案parent.env()

于 2013-08-21T01:40:23.673 回答
2

你可以使用闭包:

f2 <- function(...){
   f1 <- function(...){
     print(var1)
   }
   var1 <- "hello"
   f1(...)
 }
 f2()
于 2013-08-20T16:02:20.773 回答