1

对于所有彭博社和 R 用户:

我通常通过 Rblpapi 包将 Bloomberg 数据拉入 R 中没有问题,但是在尝试提取索引级数据时遇到了问题。

问题是下面的代码返回错误的结果,因为它从 1986 年(不是 1950 年)开始提取数据,并且留下了许多应该填充的值 NA。使用 excel API,数据很好,但我需要为某些字段添加“days = a”,因为它们直到 1950 年之后才开始。

可重现的示例(假设您具有彭博访问权限):

    # Load packages  ----------------------------------------------------------
library("Rblpapi")
library("tidyverse")
library("lubridate")

# Connect to Bloomberg --------------------------------------------------
blpConnect()


# Pull equity index-level specific data over time for S&P 500, S&P Mid Cap (400) and S&P Small Cap (600) indices  ---------------------- 

# Index tickers
tickers <- c("SPX Index", "MID Index", "SML Index")


# Bloomberg inputs 
myField <- c("PX_LAST", "TRAIL_12M_EPS", "TRAIL_12M_DILUTED_EPS", "BEST_EPS", "PE_RATIO", "BEST_PE_RATIO", 
             "TRAIL_12M_EBITDA_PER_SHARE",  "PX_TO_EBITDA", "PX_TO_BOOK_RATIO", "PX_TO_SALES_RATIO",
             "PX_TO_FREE_CASH_FLOW", "EQY_DVD_YLD_12M", "TOT_DEBT_TO_EBITDA", "EV_TO_T12M_SALES", "EV_TO_T12M_EBITDA",
             "TRAIL_12M_GROSS_MARGIN", "EBITDA_MARGIN", "TRAIL_12M_OPER_MARGIN", "TRAIL_12M_PROF_MARGIN",
             "RETURN_ON_ASSET", "RETURN_COM_EQY",  "RETURN_ON_CAP", "NET_DEBT_TO_EBITDA", "CUR_MKT_CAP", "AVERAGE_MARKET_CAP"
             )

# Pull data
sp_indices_fundmtls_raw <- as.data.frame(bdh(tickers,
                                             myField,
                                             start.date = as.Date("1950-01-01"),
                                             end.date   = Sys.Date(),
                                             include.non.trading.days = TRUE
                                             )
                                         )

由于这不起作用,我尝试仅使用 SPX 索引提取数据。同样的问题。然后我用更少的代码尝试了这个公式

# Bloomberg inputs 
myField <- c("PX_LAST", "TRAIL_12M_EPS", "TRAIL_12M_DILUTED_EPS", "BEST_EPS", "PE_RATIO", "BEST_PE_RATIO", 
             "TRAIL_12M_EBITDA_PER_SHARE",  "PX_TO_EBITDA", "PX_TO_BOOK_RATIO", "PX_TO_SALES_RATIO",
             "PX_TO_FREE_CASH_FLOW", "EQY_DVD_YLD_12M",
             "TOT_DEBT_TO_EBITDA", "EV_TO_T12M_SALES", "EV_TO_T12M_EBITDA"
             )

效果更好,但仍然是在 1964 年而不是 1950 年开始的。同样,excel API 工作正常,如果数据丢失,只会返回 NA,正如我预期的 R 所做的那样。

这使我认为必须有一个字段需要选项或覆盖才能正确提取数据。我尝试添加

ovrd <- c("PERIODICITY_OVERRIDE" = "D")


# Pull data
sp_indices_fundmtls_raw <- as.data.frame(bdh(tickers,
                                             myField,
                                             start.date = as.Date("1950-01-01"),
                                             end.date   = Sys.Date(),
                                             include.non.trading.days = TRUE,
                                             overrides = ovrd

                                             )
                                         )

但没有运气。

谁能弄清楚这个问题?

谢谢!

4

1 回答 1

0

经过多次试验和错误,我想出了一种获取数据的方法。

我创建了一个函数来提取数据:

      # Function to pull data
sp_indices_pull_fx <- function(myField, index_ticker) {
  df <- as.data.frame(bdh(index_ticker,
                          myField,
                          start.date = as.Date("1950-01-01"),
                          end.date   = Sys.Date(),
                          include.non.trading.days = TRUE
                          )
                      )

然后我用 lapply 循环浏览每个股票代码。例如:

    # SP500
sp_500_pull      <- lapply(myField, sp_indices_pull_fx, index_ticker = "SPX Index")

然后我将这些结果合并到一个数据框中:

  # Merge
sp_500_fundmtls_raw      = Reduce(function(...) merge(..., all = TRUE), sp_500_pull)

所以简而言之,有效的是创建一个函数并为每个单独的代码提供该函数,而不是尝试使用 bdh 函数一次拉多个代码。

于 2019-08-20T04:35:26.083 回答