我正在尝试根据报表类型提取财务报表信息。
让我更详细地向您解释一下。
我想从 XBRL 实例中提取损益表、资产负债表和现金流量表——尤其是 US GAAP。
对我来说,完美的解决方案是在 XML 文件中添加标签,这样我就可以提取带有标签的损益表、带有标签<incomestatement>
的资产负债表和带有 的<balancesheet>
现金流量表<cashflow>
。
请在这里帮助我。我是一个新手,在 XBRL 方面没有太多背景。
据我回忆,正确的地方是与这些角色相关的用户友好标签。
SEC 对这些标签的外观施加了限制(例如,Edgar Filing Manual 的第 6.7.12 段),例如02 - Statement - Balance Sheet
. 损益表、现金流量表和资产负债表通常在两个破折号之间带有Statement
(而不是Disclosure
, Document
, )的标签中找到。Schedule
标签本身的第三部分将告诉您在哪里可以找到损益表/现金流量表/资产负债表,但确切的标签可能因申报者而异。此外,这些有几种(合并与非合并,分类与非分类等),并且复杂性进一步增加,因为有时,同一个文件可能包含多个版本(合并和非合并),因此您需要一些域专业知识来决定你需要哪一个。
简而言之,您需要对真实文件进行反复试验,才能找到合适的算法来过滤这些标签。
不过,应该对您有所帮助的是 Charles Hoffman 对此进行了一些研究,例如可以在此处找到(第 1.5 节)。
幸运的是,提取财务报表并不难。以下是我如何能够提取损益表信息:
将 file="" 参数替换为您自己的路径。您还可以将 url 替换为文件参数