3

我试图了解“胜率”如何影响交易策略的回报。

我下载标准普尔的价格并计算每日回报。然后,我随机选择这些回报的 x%,并说我正确预测了它的方向,因此回报是正的。对于剩余的 1-x%,我说我错了,回报是负数。我复制这个过程说 1000 次并收集年化几何回报。

我以 0.01 的增量间隔将 x 从 0.5 变为 0.6。

这是我的代码:

library(quantmod)
library(multicore)

getSymbols("^GSPC", from = "1950-1-1")
ret <- ROC(GSPC)[-1,4]

set.seed(123)

winpct <- seq(0.5, 0.6, 0.01)
ret <- coredata(ret)

system.time(res <- simplify2array(mclapply(winpct, function(x) replicate(1000, drawsample(ret, x)))))

drawsample <- function(ret, winpct){
  len = length(ret)
  ret = abs(ret)

  win = sample(1:len, round(winpct * len))
  a = c(ret[win], -ret[-win])
  return(prod(1 + a) ^ (252 / length(a)) - 1)
}

花的时间:

   user  system elapsed 
 18.904   0.842   5.580 

我可以做任何进一步的优化来加快速度吗?

4

2 回答 2

4

我做了以下两个调整:

1/ 使用exp(sum(a))而不是prod(1+a). 我认为无论如何你都想要这个,因为你已经创建了一个日志返回系列ROC(GSPC)[-1,6]。据此,rbenchmark我得到了大约 7% 的加速。

2/ sample fromc(-1,-1)ret序列的长度,然后与 ret 序列相乘,得到有符号的返回序列。这让我又获得了 30%。

请注意,在我的代码中,我已将您的名称重命名abin.

drawsample2 <- function(ret, winpct){
  len = length(ret)
  win = sample(c(-1,1), len, replace=TRUE, prob = c((1-winpct), winpct))
  ret <- abs(ret)
  bin <- ret*win
  return(exp(sum(bin))^(252/length(ret)) - 1)
}

以您的drawsample()i 为基准进行基准测试,得到约 37% 的加速。

bb <- benchmark(simplify2array(mclapply(winpct, function(x) replicate(1000, drawsample(ret, x)))), 
          simplify2array(mclapply(winpct, function(x) replicate(1000, drawsample2(ret, x)))),
          columns =c('test', 'elapsed', 'relative'),
          replications = 10,
          order = 'elapsed')

在我的 MBP 上,以下是基准:

> bb

  elapsed relative
2  17.254    1.000
1  27.734    1.607
于 2012-12-17T10:31:43.390 回答
2

这是ricardo函数的一个调整,对于较大的对象来说更快。我删除了对 的调用mclapply,以便通过避免多核处理所需的网络开销来隔离函数的性能。

drawsample_r <- function(ret, winpct){
  len = length(ret)
  win = sample(c(-1,1), len, replace=TRUE, prob = c((1-winpct), winpct))
  ret <- abs(ret)
  bin <- ret*win
  return(exp(sum(bin))^(252/length(ret)) - 1)
}
drawsample_j <- function(ret, winpct){
  len <- length(ret)
  win <- c(-1L,1L)[sample.int(2L,len,TRUE,c(1-winpct,winpct))]
  exp(sum(abs(ret)*win))^(252L/len)-1L
}
library(rbenchmark)
set.seed(123)
ret <- rnorm(1e6)/100  # 1 million observations
winpct <- seq(0.5, 0.6, 0.01)
benchmark(sapply(winpct, drawsample_r, ret=ret),
          sapply(winpct, drawsample_j, ret=ret),
  replications=10, order='elapsed')[,1:5]
#                                    test replications elapsed relative user.self
# 2 sapply(winpct, drawsample_j, ret=ret)           10   6.963    1.000     6.956
# 1 sapply(winpct, drawsample_r, ret=ret)           10  10.852    1.559    10.689
于 2012-12-22T20:41:30.957 回答