r - 向量化 seq 的优雅方式？

Question

尽管标题相似，但这与R 中的 Vectorizing rep 和 seq问题不同。

我的直接目标：给定一个向量，我想生成一个新向量，其中包含原始值以及旧值中每个值之间的规则间隔。这并不难。

一种策略是使用更通用的函数，给定两个向量和指定的by间隔，使用相同的by值重复将 seq 应用于来自两个原始向量的数对。我还没有找到执行此操作的内置函数。 seq似乎拒绝将向量作为参数处理。这是一个执行更一般操作的函数（然后我可以立即使用它）：

multiseq <- function(froms, tos, by){
  x <- c(); 
  for (i in seq_along(froms)){
    x <- c(x, seq(from=froms[i], to=tos[i], by=by))
  }
  x
}

例如：

> multiseq(1:2, 1.75:2.75, .25)
[1] 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75

（这只是一个简单的例子。我真正想要的是用任意序列来做到这一点，例如

-0.89115386 -0.75346155 -0.61576924 -0.47807693 -0.34038463 -0.20269232 -0.06500001  0.07269230  0.21038460  0.34807691  0.48576922  0.62346153  0.76115383

我想将每个间隔细分为五个，以创建一个包含 5 倍多的元素的新序列。）

只要序列不太长，重复扩展一个向量就不会太慢，我相信。如果我需要大序列，我可以重写以预先扩展向量并填充它。然而，我仍然用循环来做这件事。有没有更优雅的函数式编程 R-ly 方式？

谢谢。

score 16 · Accepted Answer

在 R 中，向量化函数的最简单方法之一是使用Vectorize函数。

基本上，您可以对参数进行向量化，并将所有启动器from作为参数to中的向量，并对from参数执行相同的操作to。

使用你的例子，你可以做这样的事情

seq2 <- Vectorize(seq.default, vectorize.args = c("from", "to"))

unlist(seq2(from = c(1, 1.75), to = c(2, 2.75), by = 0.25))

## [1] 1.00 1.25 1.50 1.75 2.00 1.75 2.00 2.25 2.50 2.75

score 1 · Accepted Answer

正如@TylerRinker 在对我的问题的评论中所建议的那样，对于我的特殊需求，有一个比我对问题的表述所建议的更简单的解决方案——我太专注于一种特定的思考方式。由于我希望在已经规则间隔的数字之间插值规则间隔的数字，因此我可以只应用seq到向量中的初始值和终端值，使用一个by值均匀地划分为原始向量中值之间的间隔：

subdiv <- function(x, by) seq(x[1], x[length(x)], by)
subdiv(1:4, .25)
[1] 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 3.00 3.25 3.50 3.75 4.00
subdiv(c(-0.20269232, -0.06500001,  0.07269230), 0.1376923/3)
[1] -0.20269232 -0.15679489 -0.11089745 -0.06500002 -0.01910259  0.02679485  0.07269228

其中 0.1376923 是第二个应用程序中连续元素之间的差异。只要我不需要从原始向量中携带的元素完全等于它们的原始值，这个解决方案就可以了——正如您所看到的，由于浮点运算存在一些差异。（我实际上在做的是为直方图构建箱；精确的边界并不重要。）

不过，@dickoa 和 @geektrader 的答案具有更广泛的用途，并且可以保留输入向量中原始数字的确切值。

score 1 · Accepted Answer

尝试关注

x <- c(1, 2, 4, 8)
y <- unlist(mapply(FUN = function(from, to) {
    seq(from = from, to = to, by = 0.25)
}, head(x, -1), tail(x, -1)))
y
##  [1] 1.00 1.25 1.50 1.75 2.00 2.00 2.25 2.50 2.75 3.00 3.25 3.50 3.75 4.00 4.00 4.25 4.50 4.75 5.00 5.25 5.50 5.75 6.00
## [24] 6.25 6.50 6.75 7.00 7.25 7.50 7.75 8.00

result <- y[!duplicated(y)]
result
##  [1] 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 3.00 3.25 3.50 3.75 4.00 4.25 4.50 4.75 5.00 5.25 5.50 5.75 6.00 6.25 6.50
## [24] 6.75 7.00 7.25 7.50 7.75 8.00

r - 向量化 seq 的优雅方式？

3 回答 3

Related

Reference