webserver - Arelle Webserver - 如何从 XBRL 文件中提取损益表？

Question

我正在尝试根据报表类型提取财务报表信息。

让我更详细地向您解释一下。

我想从 XBRL 实例中提取损益表、资产负债表和现金流量表——尤其是 US GAAP。

对我来说，完美的解决方案是在 XML 文件中添加标签，这样我就可以提取带有标签的损益表、带有标签<incomestatement>的资产负债表和带有的<balancesheet>现金流量表<cashflow>。

请在这里帮助我。我是一个新手，在 XBRL 方面没有太多背景。

score 2 · Accepted Answer

据我回忆，正确的地方是与这些角色相关的用户友好标签。

SEC 对这些标签的外观施加了限制（例如，Edgar Filing Manual 的第 6.7.12 段），例如02 - Statement - Balance Sheet. 损益表、现金流量表和资产负债表通常在两个破折号之间带有Statement（而不是Disclosure, Document, ）的标签中找到。Schedule

标签本身的第三部分将告诉您在哪里可以找到损益表/现金流量表/资产负债表，但确切的标签可能因申报者而异。此外，这些有几种（合并与非合并，分类与非分类等），并且复杂性进一步增加，因为有时，同一个文件可能包含多个版本（合并和非合并），因此您需要一些域专业知识来决定你需要哪一个。

简而言之，您需要对真实文件进行反复试验，才能找到合适的算法来过滤这些标签。

不过，应该对您有所帮助的是 Charles Hoffman 对此进行了一些研究，例如可以在此处找到（第 1.5 节）。

score 2 · Accepted Answer

幸运的是，提取财务报表并不难。以下是我如何能够提取损益表信息：

使用arelle web server获取完整的事实表如下图： http://localhost:8080/rest/xbrl/view?file=c:/Python/SEC-EDGAR/sec/2017/01/0001530425-0001477932-17 -000505-xbrl.zip&view=factTable&media=xml

将 file="" 参数替换为您自己的路径。您还可以将 url 替换为文件参数

获得 xml 格式的 xml 事实表后，提取用于损益表的角色节点，您可以查找“StatementsOfOperations”。尽管损益表角色 ID 有一些变化，但它们并不多。

webserver - Arelle Webserver - 如何从 XBRL 文件中提取损益表？

2 回答 2

Related

Reference