r - 如何检查一个数字序列是否单调递增（或递减）？

Question

我们得到一个数字序列，作为一个向量foo。任务是找到单调递增- 每个项目小于或等于下一个 - 或foo单调递减- 每个项目大于或等于下一个。

当然这可以通过循环找到，但是还有更多的创意吗？

score 61 · Accepted Answer

另一个：检查是否

all(x == cummax(x))

或者

all(x == cummin(x))

分别为单调递增或递减。这似乎cummax比diff而且使用更少的内存要快得多：

> x <- seq_len(1e7)
> system.time(all(x == cummax(x)))
   user  system elapsed 
   0.11    0.00    0.11 
> system.time(all(diff(x) >= 0))
   user  system elapsed 
   0.47    0.13    0.59

> x <- seq_len(1e8)
> system.time(all(x == cummax(x)))
   user  system elapsed 
   1.06    0.09    1.16 
> system.time(all(diff(x) >= 0))
Error: cannot allocate vector of size 381.5 Mb
In addition: Warning messages:
1: Reached total allocation of 1535Mb: see help(memory.size) 
2: Reached total allocation of 1535Mb: see help(memory.size) 
3: Reached total allocation of 1535Mb: see help(memory.size) 
4: Reached total allocation of 1535Mb: see help(memory.size) 
Timing stopped at: 1.96 0.38 2.33

我打赌为什么cummax比 is 更快，diff因为它只需要比较比计算差异更快的数字。

编辑：应您（阿里）的要求，包括您的答案在内的其他测试（请注意，我现在正在另一台机器上运行，因此不应将以下结果与上述结果进行比较）

> x <- seq_len(1e7)
> system.time(x == cummax(x))
   user  system elapsed 
  0.316   0.096   0.416 
> system.time(all(diff(x) >= 0))
   user  system elapsed 
  4.364   0.240   4.632 
> system.time(x[-1] - x[-length(x)] >= 0)
   user  system elapsed 
  3.828   0.380   4.227
> system.time(all(x[-1] >= x[-length(x)]))
   user  system elapsed 
  2.572   0.288   2.865

score 14 · Accepted Answer

一种选择是使用该diff()函数来给出向量中相邻元素之间的差异。

单调递增函数将diff(x)全部 > 或等于 0：

f1 <- 1:10
f2 <- 10:1

> all(diff(f1) >= 0)
[1] TRUE
> all(diff(f2) >= 0)
[1] FALSE

0尽管可能不赞成测试平等；更好的可能是通过以下方式使用< 0和否定比较!：

> all(!diff(f1) < 0)
[1] TRUE
> all(!diff(f2) < 0)
[1] FALSE

原因是您使用的计算机无法准确表示所有数字。您可能会计算出实际上为零但不完全为零的结果，因为计算中的数字无法准确表示（即浮点数）。因此，如果foo是计算的结果，则测试它是否等于 0 可能会导致应该是 0 稍微大于或小于 0 的结果，这可能会为增加/减少函数给出错误的结果。

score 10 · Accepted Answer

对于增加的版本，您可以使用is.unsorted()：

x <- seq_len(1e7)
!is.unsorted(x)

> !is.unsorted(x)
[1] TRUE

这也很快：

> system.time(!is.unsorted(x))
   user  system elapsed 
  0.099   0.000   0.099 
> system.time(all(x == cummax(x)))
   user  system elapsed 
  0.320   0.039   0.360

不幸is.unsorted()的是明确用于增加顺序。我们在将其转换为下降的情况时受到了一些打击，但它仍然与我系统上的其他选项具有竞争力：

xx <- 1e7:1
!is.unsorted(-xx)
system.time(!is.unsorted(-xx))

> system.time(!is.unsorted(-xx))
   user  system elapsed 
  0.205   0.020   0.226 
> system.time(all(xx == cummin(xx)))
   user  system elapsed 
  0.356   0.088   0.444

在一个更大的问题上......

x  <- 1:1e8
xx <- 1e8:1
system.time(!is.unsorted(x))
system.time(all(x == cummax(x)))
system.time(!is.unsorted(-xx))
system.time(all(xx == cummin(xx)))

> system.time(!is.unsorted(x))
   user  system elapsed 
  1.019   0.000   1.019 
> system.time(all(x == cummax(x)))
   user  system elapsed 
  3.255   0.354   3.608 
> system.time(!is.unsorted(-xx))
   user  system elapsed 
  2.089   0.561   2.650 
> system.time(all(xx == cummin(xx)))
   user  system elapsed 
  3.318   0.395   3.713

如果您想强制执行严格递增的序列，请strictly参见?is.unsorted.

score 7 · Accepted Answer

7

all(diff(x)<0)（酌情替换>, <=）>=

于 2012-10-26T20:27:06.003 回答

score 0 · Accepted Answer

一个有趣的答案如下：

foo = c(1, 3, 7, 10, 15)
all(foo[-1] - foo[-length(foo)] >= 0) # TRUE

foo[3] = 20
all(foo[-1] - foo[-length(foo)] >= 0) # FALSE

r - 如何检查一个数字序列是否单调递增（或递减）？

5 回答 5

Related

Reference