我正在使用 R 中的 EDGAR 库来下载所有 2005 10-Ks。下面的代码将提示“是”为我的循环中的每个 CIK 下载 10-K。(h/t to Weihuang Wong 协助我解决这个问题。)
install.packages("edgar")
library(edgar)
report <- getMasterIndex(2005)
x <- capture.output(dput(edgar::getFilings))
x <- gsub("choice <- .*", "cat(paste(msg3, '\n')); choice <- 'yes'", x)
x <- gsub("^function", "my_getFilings <- function", x)
writeLines(x, con = tmp <- tempfile())
source(tmp)
for(CIK in c(789019, 777676, 849399)){
my_getFilings(2005, CIK, '10-K')
}
list.files(file.path(getwd(), "Edgar filings"))
我已经下载了这个映射器并将其加载到 R 中。它为我提供了每个 CIK 代码的 SIC 行业#。
CIK <- read.csv("cik-ticker.csv")
在按 SIC 代码对它们进行分组的同时,如何扩展我的代码以为此列表中的每个 CIK 查找 10-K?我尝试定义 CIK 和 SIC 并创建一个矩阵,但不确定如何使我的维度动态化以获取我将获得的 SIC 代码的数量。