I have a vector:
a <- c(1,2,3,4,5)
And I'd like to do something like:
b <- roll(a, 2) # 4,5,1,2,3
Is there a function like that in R? I've been googling around, but "R Roll" mostly gives me pages about Spanish pronunciation.
如何使用head
和tail
...
roll <- function( x , n ){
if( n == 0 )
return( x )
c( tail(x,n) , head(x,-n) )
}
roll(1:5,2)
#[1] 4 5 1 2 3
# For the situation where you supply 0 [ this would be kinda silly! :) ]
roll(1:5,0)
#[1] 1 2 3 4 5
head
使用and ...的一个很酷的事情是tail
你会得到一个负数的反向滚动n
,例如
roll(1:5,-2)
[1] 3 4 5 1 2
这是一种替代方案,它的优点是即使x
“滚动”了一个以上的完整周期(即何时abs(n) > length(x)
)也能工作:
roll <- function(x, n) {
x[(seq_along(x) - (n+1)) %% length(x) + 1]
}
roll(1:5, 2)
# [1] 4 5 1 2 3
roll(1:5, 0)
# [1] 1 2 3 4 5
roll(1:5, 11)
# [1] 5 1 2 3 4
FWIW(并不是说它值多少钱)它也适用于data.frame
s:
head(mtcars, 1)
# mpg cyl disp hp drat wt qsec vs am gear carb
# Mazda RX4 21 6 160 110 3.9 2.62 16.46 0 1 4 4
head(roll(mtcars, 2), 1)
# gear carb mpg cyl disp hp drat wt qsec vs am
# Mazda RX4 4 4 21 6 160 110 3.9 2.62 16.46 0 1
包binhf具有功能shift:
library(binhf)
shift(1:5, places = 2)
#[1] 4 5 1 2 3
地方可以是积极的或消极的
您还可以使用该permute
软件包:
require(permute)
a <- c(1,2,3,4,5)
shuffleSeries(a, start = 2)
输出:
[1] 3 4 5 1 2
rearrr
还包含roll_elements_vec()
向量和roll_elements()
数据框中的一列或多列。
roll_elements()
可以处理分组数据帧,并且可以n
根据具有给定功能(例如rearrr::median_index()
或rearrr::quantile_index()
)的组成员找到设置。
向左滚动一个向量 -2 个位置(即向右滚动 2 个位置):
library(rearrr)
library(dplyr)
# Roll vector
roll_elements_vec(1:10, n = -2)
> 9 10 1 2 3 4 5 6 7 8
向上滚动数据框中的一列 -2 位置:
# Set seed
set.seed(1)
# Create a data frame
df <- data.frame(
"x" = 1:10,
"y" = runif(10) * 10,
"g" = rep(1:2, each = 5)
)
# Roll `x` column
roll_elements(df, cols = "x", n = -2)
> # A tibble: 10 x 4
> y g x .n
> <dbl> <int> <int> <list>
> 1 2.66 1 9 <dbl [1]>
> 2 3.72 1 10 <dbl [1]>
> 3 5.73 1 1 <dbl [1]>
> 4 9.08 1 2 <dbl [1]>
> 5 2.02 1 3 <dbl [1]>
> 6 8.98 2 4 <dbl [1]>
> 7 9.45 2 5 <dbl [1]>
> 8 6.61 2 6 <dbl [1]>
> 9 6.29 2 7 <dbl [1]>
> 10 0.618 2 8 <dbl [1]>
该.n
列包含n
应用的设置。n
这在使用函数查找时非常有用。
在每个组中滚动x
列g
:
# Group by `g` and roll `x` within both groups
df %>%
dplyr::group_by(g) %>%
roll_elements(cols = "x", n = -2)
> # A tibble: 10 x 4
> y g x .n
> <dbl> <int> <int> <list>
> 1 2.66 1 4 <dbl [1]>
> 2 3.72 1 5 <dbl [1]>
> 3 5.73 1 1 <dbl [1]>
> 4 9.08 1 2 <dbl [1]>
> 5 2.02 1 3 <dbl [1]>
> 6 8.98 2 9 <dbl [1]>
> 7 9.45 2 10 <dbl [1]>
> 8 6.61 2 6 <dbl [1]>
> 9 6.29 2 7 <dbl [1]>
> 10 0.618 2 8 <dbl [1]>
如果我们不指定一列或多列,则滚动整个数据框。如前所述,我们可以n
通过函数找到,所以这里我们将按中值索引滚动(索引为 1:10,因此中值 = 5.5 并向上舍入到 6 个位置)。
# Roll entire data frame
# Find `n` with the `median_index()` function
roll_elements(df, n_fn = median_index)
> # A tibble: 10 x 4
> x y g .n
> <int> <dbl> <int> <list>
> 1 7 9.45 2 <dbl [1]>
> 2 8 6.61 2 <dbl [1]>
> 3 9 6.29 2 <dbl [1]>
> 4 10 0.618 2 <dbl [1]>
> 5 1 2.66 1 <dbl [1]>
> 6 2 3.72 1 <dbl [1]>
> 7 3 5.73 1 <dbl [1]>
> 8 4 9.08 1 <dbl [1]>
> 9 5 2.02 1 <dbl [1]>
> 10 6 8.98 2 <dbl [1]>
免责声明:我是rearrr
. 它还包含一个roll_values()
滚动元素的值而不是它们的位置的函数。
该numpy roll
方法支持向前和向后两个方向,并且它接受大于向量长度的移位参数。例如:
Python
import numpy
x=numpy.arange(1,6)
numpy.roll(x,-11)
我们得到:
array([2, 3, 4, 5, 1])
或者
x=numpy.arange(1,6)
numpy.roll(x,12)
我们得到:
array([4, 5, 1, 2, 3])
我们可以构建一个 R 函数来考虑移位参数大于向量长度的情况。例如:
R
custom_roll <- function( x , n ){
if( n == 0 | n%%length(x)==0) {
return(x)
}
else if (abs(n)>length(x)) {
new_n<- (abs(n)%%length(x))*sign(n)
return(c( tail(x,new_n) , head(x,-new_n) ))
}
else {
return(c( tail(x,n) , head(x,-n) ))
}
}
让我们看看我们得到了什么,但再次考虑向量 (1,2,3,4,5)。
x<-c(1,2,3,4,5)
custom_roll(x,-11)
我们得到:
[1] 2 3 4 5 1
或者
x<-c(1,2,3,4,5)
custom_roll(x,12)
我们得到:
[1] 4 5 1 2 3