4

我正在研究/回测交易系统。

我有一个包含 OHLC 数据的 Pandas 数据框,并添加了几个计算列,这些列标识了我将用作启动头寸的信号的价格模式。

我现在想添加一个进一步的列来跟踪当前的净头寸。我曾尝试使用 df.apply(),但将数据框本身作为参数而不是行对象传递,与后者一样,我似乎无法回顾前几行以确定它们是否导致任何价格模式:

open_campaigns = []
Campaign = namedtuple('Campaign', 'open position stop')

def calc_position(df):
  # sum of current positions + any new positions

  if entered_long(df):
    open_campaigns.add(
        Campaign(
            calc_long_open(df.High.shift(1)), 
            calc_position_size(df), 
            calc_long_isl(df)
        )
    )

  return sum(campaign.position for campaign in open_campaigns)

def entered_long(df):
  return buy_pattern(df) & (df.High > df.High.shift(1))

df["Position"] = df.apply(lambda row: calc_position(df), axis=1)

但是,这会返回以下错误:

ValueError: ('The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()', u'occurred at index 1997-07-16 08:00:00')

滚动窗口函数似乎很自然,但据我了解,它们仅作用于单个时间序列或列,因此也不起作用,因为我需要在多个时间点访问多个列的值。

实际上我应该怎么做?

4

1 回答 1

6

这个问题的根源在于 NumPy。

def entered_long(df):
  return buy_pattern(df) & (df.High > df.High.shift(1))

entered_long正在返回一个类似数组的对象。NumPy 拒绝猜测一个数组是 True 还是 False:

In [48]: x = np.array([ True,  True,  True], dtype=bool)

In [49]: bool(x)

ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()

要解决此问题,请使用anyorall指定数组为 True 的含义:

def calc_position(df):
  # sum of current positions + any new positions

  if entered_long(df).any():  # or .all()

如果其中的任何项目为 True,则该any()方法将返回entered_long(df)True。如果其中的所有项目都为 True,则该all()方法将返回entered_long(df)True。

于 2013-01-17T19:08:00.270 回答