我正在尝试使用 R 中的 finstr 包从 SEC 站点下载 XBRL 数据。
小插图引用了 2013-14 年的 Apple 财务报表。我要为我的雅培(CIK 1800)。我查看了 SEC 网站上的数据记录,提交的文件位于此文件夹中:
https://www.sec.gov/Archives/edgar/data/1800/000110465920023904
Apple xml 文件被命名aapl-20140927.xml
(CIK 后跟提交日期)。我已经通过浏览器进入文件并识别了相关数据。
具有相同信息的 Abbott xml 文件名为abt-20191231x10k59d41b_htm.xml
,同样带有相关数据。
在小插图之后,我添加了以下代码:
xbrl_url2020 <- "https://www.sec.gov/Archives/edgar/data/1800/000110465920023904/abt-20191231x10k59d41b_htm.xml"
xbrl_url2019 <-
"https://www.sec.gov/Archives/edgar/data/1800/000104746919000624/abt-20181231.xml"
old_o <- options(stringsAsFactors = FALSE)
xbrl_data_aapl2020 <- xbrlDoAll(xbrl_url2020)
然后返回:
Error in fileFromCache(file) :
Error in download.file(file, cached.file, quiet = !verbose) :
cannot open URL 'https://www.sec.gov/Archives/edgar/data/1800/000110465920023904/https://xbrl.sec.gov/dei/2019/dei-2019-01-31.xsd'
In addition: Warning message:
In download.file(file, cached.file, quiet = !verbose) :
cannot open URL 'https://www.sec.gov/Archives/edgar/data/1800/000110465920023904/https://xbrl.sec.gov/dei/2019/dei-2019-01-31.xsd': HTTP status was '404 Not Found'
我在这里阅读了其他提交的内容,不确定这是否是架构问题,我是否找到了错误的文件(文件夹中没有其他文件包含全部信息)或者是否是其他文件。
我还注意到一条评论说 SEC 网站上的数据集https://www.sec.gov/dera/data/financial-statement-data-sets.html
包含所有相关信息。这些集合的问题在于它们是提交的数据而不是批准的数据,因此可能与发布的最终结果不同。
感谢任何可能的帮助。