r - 为什么模拟股票收益在 R 中的 pbo（回测过拟合的概率）包中的“pbo”小插图中重新缩放并重新居中？

Question

这是小插图中的相关代码，稍作改动以使其适合此处的页面，并使其易于复制。省略了可视化代码。评论来自小插图作者。

（完整的小插图：https ://cran.r-project.org/web/packages/pbo/vignettes/pbo.html ）

library(pbo)

#First, we assemble the trials into an NxT matrix where each column 
#represents a trial and each trial has the same length T. This example 
#is random data so the backtest should be overfit.`

set.seed(765)
n <- 100
t <- 2400
m <- data.frame(matrix(rnorm(n*t),nrow=t,ncol=n,
                       dimnames=list(1:t,1:n)), check.names=FALSE)

sr_base <- 0
mu_base <- sr_base/(252.0)
sigma_base <- 1.00/(252.0)**0.5

for ( i in 1:n ) {
  m[,i] = m[,i] * sigma_base / sd(m[,i]) # re-scale 
  m[,i] = m[,i] + mu_base - mean(m[,i]) # re-center
}

#We can use any performance evaluation function that can work with the 
#reassembled sub-matrices during the cross validation iterations. 
#Following the original paper we can use the Sharpe ratio as

sharpe <- function(x,rf=0.03/252) {
  sr <- apply(x,2,function(col) {
    er = col - rf
    return(mean(er)/sd(er))
  })
  return(sr)
}

#Now that we have the trials matrix we can pass it to the pbo function  
#for analysis.

my_pbo <- pbo(m,s=8,f=sharpe,threshold=0)

summary(my_pbo)

这是我很好奇的部分：

sr_base <- 0
mu_base <- sr_base/(252.0)
sigma_base <- 1.00/(252.0)**0.5

for ( i in 1:n ) {
  m[,i] = m[,i] * sigma_base / sd(m[,i]) # re-scale 
  m[,i] = m[,i] + mu_base - mean(m[,i]) # re-center
}

为什么要在 for 循环中转换数据，这种重新缩放和重新居中是否需要用真实的回报来完成？或者这只是作者为了让他的模拟回报看起来更像真实的东西而做的事情？

谷歌搜索和通过 stackoverflow 搜索发现了一些关于将波动率缩放到时间的平方根的文章和帖子，但这看起来与我所看到的不太一样。通常它们涉及将一些短期（即每日）波动性度量乘以时间的根，但这并不完全是这样。此外，该包的文档不包括这块重新缩放和重新居中代码。文档：https ://cran.r-project.org/web/packages/pbo/pbo.pdf

所以：

为什么以这种方式转换数据/这种转换的结果是什么？
是否只需要这个模拟数据，还是我需要
类似地转换实际回报？

score 0 · Accepted Answer

我在 r-help 邮件列表上发布了这个问题并得到了以下答案：

“嗨，乔，为了他的示例，进行了居中和重新缩放，也与他对锐化函数的定义保持一致。特别注意锐化函数具有默认的 rf（无风险）参数0.03/252 的值，即 ANNUAL 3% rate 转换为 DAILY rate，以十进制表示。这意味着此函数的另一个参数 x 应该是 DAILY 返回，以十进制表示。

假设他想从具有 ANNUAL 均值 MU_A 和 ANNUAL 标准偏差 SIGMA_A 的收益分布中创建随机数据，两者均以十进制表示。等效的每日回报将具有平均 MU_D = MU_A / 252 和标准偏差 SIGMA_D = SIGMA_A/SQRT(252)。

他用名称 mu_base 调用 MU_D，用名称 sigma_base 调用 SIGMA_D。

他的循环现在转换他的矩阵中的随机数，以便每一列都有平均 MU_D 和标准偏差 SIGMA_D。

HTH，埃里克”

我跟进了这个：

“如果我理解正确，如果我想使用回测的实际回报而不是模拟回报，我需要确保我的风险调整回报衡量标准，在这种情况下是夏普比率，在规模上与我的回报相匹配（即每日收益与每日锐化，每月与每月等）。而且我不需要像小插图中的模拟收益那样转换收益，因为实际收益将具有它们所具有的任何属性（意味着它们将具有“无论他们碰巧有什么平均值和标准差）。对吗？”

我被告知这是正确的。

r - 为什么模拟股票收益在 R 中的 pbo（回测过拟合的概率）包中的“pbo”小插图中重新缩放并重新居中？

1 回答 1

Related

Reference