我最近一直在玩 R 中的技术交易技术。
我确实发现成为问题的一件事,特别是对于大量高频信息,是从信号向量生成策略向量。我想知道是否没有更快的使用方法dplyr
?
让我们先下载苹果的股票并生成短期和长期移动平均线
library("TTR")
library("quantmod")
library("PerformanceAnalytics")
library("dplyr")
getSymbols("AAPL", src = "google")
stock <- AAPL
stock <- window(stock['2015-10-01::2017-01-01'])
# Plot if you want to see
#lineChart(stock)
Short <- EMA(Cl(stock), n=5)
Long <- EMA(Cl(stock), n=6)
我们现在有我们选择的股票,让我们生成我们的信号向量,当两条移动平均线交叉时指示买入和卖出订单
# Signal
Signal <-
Lag(ifelse(
Lag(Short) < Lag(Long) & Short > Long, 1,
ifelse(
Lag(Short) > Lag(Long) & Short < Long, -1, 0)
))
Signal[is.na(Signal)] <- 0
之后我们使用这个信号来构建策略——这是高频数据中耗时较长的部分——这显然是由于for
循环
# Strategy
Strategy <- ifelse(Signal > 1, 0, 1)
for (i in 1:length(Cl(stock))) {
Strategy[i] <-
ifelse(Signal[i] == 1, 1, ifelse(Signal[i] == -1, 0, Strategy[i - 1]))
}
x <- as.numeric(Strategy$Lag.1)
x[is.na(x)] <- 0
我目前的 dplyr 方法如下,但它生成了错误的策略
dplyr_strat <-
Signal %>% tbl_df() %>%
mutate(Change = if_else(Lag.1 == -1, "Sell", "Buy", "NoChange") ) %>%
mutate(Strategy = ifelse(Change == "Buy", 1,
ifelse( Change == "Sell", 0,
lag(Strategy)) ) ) %>% select(Strategy)
y <- as.numeric(dplyr_strat$Strategy)
并测试
all.equal(x,y)