我正在使用 edgar 5.4.1 从 SEC 数据库中获取 10K 文件,但我无法解析 html 元素并查看文档的实际文本内容。
import edgar
company = edgar.Company("Facebook Inc", "0001326801")
tree = company.get_all_filings(filing_type="10-K")
docs = edgar.Company.get_documents(tree=tree, no_of_documents=5, as_documents=True)
我用了两种方法:
- 第一个似乎适用于 5.4.1 版本,但它会引发如下属性错误。
sample_text = edgar.TXTML.parse_full_10K(docs[3].element)
sample_text
- 第二种方式,由于包的更新可能不起作用,也没有返回文本,但其他我不完全理解:
docs[3].element.text_content()
type(docs[3].element.text_content())
有没有办法解析这个?这是一个错误吗?我不明白这一点。