0

我最近一直在玩 R 中的技术交易技术。

我确实发现成为问题的一件事,特别是对于大量高频信息,是从信号向量生成策略向量。我想知道是否没有更快的使用方法dplyr

让我们先下载苹果的股票并生成短期和长期移动平均线

library("TTR")
library("quantmod")
library("PerformanceAnalytics")
library("dplyr")

getSymbols("AAPL", src = "google")
stock <- AAPL
stock <- window(stock['2015-10-01::2017-01-01'])

# Plot if you want to see
#lineChart(stock)

Short <- EMA(Cl(stock), n=5)
Long <- EMA(Cl(stock), n=6)

我们现在有我们选择的股票,让我们生成我们的信号向量,当两条移动平均线交叉时指示买入和卖出订单

# Signal
Signal <-
  Lag(ifelse(
    Lag(Short) < Lag(Long) & Short > Long, 1,
    ifelse(
      Lag(Short) > Lag(Long) & Short < Long, -1, 0)
  ))
Signal[is.na(Signal)] <- 0

之后我们使用这个信号来构建策略——这是高频数据中耗时较长的部分——这显然是由于for循环

# Strategy
Strategy <- ifelse(Signal > 1, 0, 1)
for (i in 1:length(Cl(stock))) {
  Strategy[i] <-
    ifelse(Signal[i] == 1, 1, ifelse(Signal[i] == -1, 0, Strategy[i - 1]))
}
x <- as.numeric(Strategy$Lag.1)
x[is.na(x)] <- 0

我目前的 dplyr 方法如下,但它生成了错误的策略

dplyr_strat <-
Signal %>% tbl_df() %>% 
  mutate(Change = if_else(Lag.1 == -1, "Sell", "Buy", "NoChange") ) %>% 
  mutate(Strategy = ifelse(Change == "Buy", 1, 
                           ifelse( Change == "Sell", 0, 
                                   lag(Strategy)) ) ) %>% select(Strategy)
y <- as.numeric(dplyr_strat$Strategy)

并测试

all.equal(x,y)
4

1 回答 1

1

我同意 Epi99 关于保持它与您的初始 for 循环一致的评论。我使用了 data.table 并得到了完全匹配,见下文:

## Using data.table
dt.Signal <- setDT(as.data.frame(Signal))
dt.Signal[, Strategy := ifelse(Lag.1 == 1, 1, ifelse(Lag.1 == -1, 0, lag(Strategy)))]
dt.Signal[is.na(dt.Signal)] <- 0
z <- as.numeric(dt.Signal[, Strategy])

all.equal(x,z)

您遇到的问题可能与“买入”、“卖出”和“不变”逻辑有关

于 2017-02-10T14:38:48.117 回答