3

我正在尝试根据报表类型提取财务报表信息。

让我更详细地向您解释一下。

我想从 XBRL 实例中提取损益表、资产负债表和现金流量表——尤其是 US GAAP。

对我来说,完美的解决方案是在 XML 文件中添加标签,这样我就可以提取带有标签的损益表、带有标签<incomestatement>的资产负债表和带有 的<balancesheet>现金流量表<cashflow>

请在这里帮助我。我是一个新手,在 XBRL 方面没有太多背景。

4

2 回答 2

2

据我回忆,正确的地方是与这些角色相关的用户友好标签。

SEC 对这些标签的外观施加了限制(例如,Edgar Filing Manual 的第 6.7.12 段),例如02 - Statement - Balance Sheet. 损益表、现金流量表和资产负债表通常在两个破折号之间带有Statement(而不是Disclosure, Document, )的标签中找到。Schedule

标签本身的第三部分将告诉您在哪里可以找到损益表/现金流量表/资产负债表,但确切的标签可能因申报者而异。此外,这些有几种(合并与非合并,分类与非分类等),并且复杂性进一步增加,因为有时,同一个文件可能包含多个版本(合并非合并),因此您需要一些域专业知识来决定你需要哪一个。

简而言之,您需要对真实文件进行反复试验,才能找到合适的算法来过滤这些标签。

不过,应该对您有所帮助的是 Charles Hoffman 对此进行了一些研究,例如可以在此处找到(第 1.5 节)。

于 2017-05-05T14:52:36.083 回答
2

幸运的是,提取财务报表并不难。以下是我如何能够提取损益表信息:

  1. 使用arelle web server获取完整的事实表如下图: http://localhost:8080/rest/xbrl/view?file=c:/Python/SEC-EDGAR/sec/2017/01/0001530425-0001477932-17 -000505-xbrl.zip&view=factTable&media=xml

将 file="" 参数替换为您自己的路径。您还可以将 url 替换为文件参数

  1. 获得 xml 格式的 xml 事实表后,提取用于损益表的角色节点,您可以查找“StatementsOfOperations”。尽管损益表角色 ID 有一些变化,但它们并不多。

截屏

于 2017-04-22T21:09:09.787 回答