python - 使用 edgar 5.4.1 解析 10K 文件时出现问题？

翻译自：https://stackoverflow.com/questions/67349141 2021-05-01T17:35:57.547

103 次

我正在使用 edgar 5.4.1 从 SEC 数据库中获取 10K 文件，但我无法解析 html 元素并查看文档的实际文本内容。

import edgar
company = edgar.Company("Facebook Inc", "0001326801")
tree = company.get_all_filings(filing_type="10-K")
docs = edgar.Company.get_documents(tree=tree, no_of_documents=5, as_documents=True)

我用了两种方法：

第一个似乎适用于 5.4.1 版本，但它会引发如下属性错误。

sample_text = edgar.TXTML.parse_full_10K(docs[3].element) 
sample_text

第二种方式，由于包的更新可能不起作用，也没有返回文本，但其他我不完全理解：

docs[3].element.text_content()
type(docs[3].element.text_content())

有没有办法解析这个？这是一个错误吗？我不明白这一点。

python - 使用 edgar 5.4.1 解析 10K 文件时出现问题？

0 回答 0

Related

Reference