我试图从sec.gov
. 从fb 10-Q index.htm开始,我们来看一个完整的文本提交文件,如完整提交文本文件。它的结构如下:
<SEC-DOCUMENT>
<SEC-HEADER>
<ACCEPTANCE-DATETIME>"some content" This tag is not closed.
"some lines resembling yaml markup"
These are indented lines with a
"key": "value" structure.
</SEC-HEADER>
<DOCUMENT>
.
.
some content
.
.
</DOCUMENT>
"several DOCUMENT tags" ...
</SEC-DOCUMENT>
我试图弄清楚<SEC-HEADER>
标签的结构,并在公共传播服务(PDS)技术规范(pdf)下找到了一些信息,并得出结论,标题的内容应该是SGML。
尽管如此,我对格式一无所知,因为没有尖括号,并且键值对由冒号分隔,例如key: value
而不是<key>value</key>
. 在 pdf 链接中,我找不到任何关于冒号的信息。
问题: <SEC-HEADER>
标签是有效的 SGML 吗?如果是,如何解析?
我会很高兴有任何帮助。