我在使用https://codingandfun.com/scraping-sec-edgar-python/的代码时遇到问题
我试图联系该网站的作者,但没有成功。我希望在这里得到一些帮助,并提前感谢您。
似乎当我进入打印(下载)步骤时,输出是一些奇怪的特殊字符,而不是有组织的公司网址。SEC master.idx 有问题吗?有人可以帮我确定问题吗?
这是代码:
import bs4 as bs
import requests
import pandas as pd
import re
company = 'Facebook Inc'
filing = '10-Q'
year = 2020
quarter = 'QTR3'
#get name of all filings
download = requests.get(f'https://www.sec.gov/Archives/edgar/full-index/{year}/{quarter}/master.idx').content
download = download.decode("utf-8").split('\n')
print (download)