0

当公司向 SEC 提交报告时,会提供一些文件。例如最新的 10-K 的AAPL。由此,甚至 SEC 网站(以及许多其他网站)也将表格制作为结构化数据

我想做的是自己复制它,但被卡住了。有人可以向我指出详细的分步说明如何做到这一点吗?

通常 SO 用户会询问更具体的问题和 OP 尝试过的事情列表,所以,这就是我尝试过的,我理解的:

  • 底部的六个文件(示例中的 8-12、15)已使用所有数据。基本上,公司提交的 8-12 和 15 是文件本身的内联 Xbrl 的摘录(示例中的 1)。
  • 提取文件 (15) 列出了所有 Xbrl 实例和所有上下文。非常清楚。
  • XSD 文件 (8) 包含所有表格和所有公司特定元素的列表。第一个在 link:roleType 块中给出,给出一个定义和它出现的链接库列表(尽管有时它们不出现)。第二个以 <xs:element>-s 的形式给出。
  • 演示文件 (12) 具有相同的表格列表。
  • 定义 (10) 和标签 (11) 链接库应该给出更多细节,例如特定数据的公司特定标签。
  • 计算链接库并不是真正需要的(我猜),它更多的是验证总数确实是如何计算的。

我不明白的是:

  • 从这些文件构建表的正确方法是什么?是通过查看 XSD/PRE 表单并在提取文件中找到它们的数据还是相反?
  • 无论我多么努力,我都找不到提取文件中的数据点和 LAB 文件中的标签之间的链接(包含所有定位器和弧)。作为人类,它“容易”,但作为机器,名称总是略有不同(例如(a)loc_XYZ 更改为lab_XYZ;(b)名称“XYZ”有自己的版本和“XYZAbstract”版本, (c) 像 XYZ 这样的名称附有数字 XY_123),因此我无法建立“两端”之间的联系。

这就是为什么我想要一步一步的解释,比如:

  • 拿文件……先。那里遍历 <...> 标签。对于每个标签,在文件 ... 中找到一个 <...> 标签,其中属性 ... 等于迭代标签的 ... 属性。等等。

谢谢,

PS(我对已经这样做的可用软件和服务不感兴趣,也不对某些特定的库调用。我只是想使用纯文本文件提取信息。)

4

1 回答 1

2

如果您希望在不重复使用现有 XBRL 软件的情况下处理 XBRL,那么最好的起点是XBRL 规范。特别是,XBRL 中的 XLink部分将解释 XBRL Linkbases 如何工作,包括在xlink:fromxlink:to属性中使用的标签。简短的回答是这些属性只包含任意标识符,这些标识符引用xlink:label文件中其他地方元素的属性。

如何从 XBRL 数据构建财务表的具体问题非常棘手。XBRL 报告不包含将报告中的事实与表格相关联的任何明确信息。您可以从演示链接库的财务报告部分中构建概念列表,但您经常会发现使用这些概念获得的事实比预期的要多。例如,如果您从“资产负债表”部分构建概念列表,您通常会发现您拥有使用这些概念但具有附加维度的事实,因为它们是从提供该概念细分的注释中标记的。

SEC 使用基于启发式的方法将事实组织成表格。此过程记录在Edgar Filer Manual的第 6.24 节中。

于 2022-01-19T20:28:29.727 回答