-1

我在使用https://codingandfun.com/scraping-sec-edgar-python/的代码时遇到问题

我试图联系该网站的作者,但没有成功。我希望在这里得到一些帮助,并提前感谢您。

似乎当我进入打印(下载)步骤时,输出是一些奇怪的特殊字符,而不是有组织的公司网址。SEC master.idx 有问题吗?有人可以帮我确定问题吗?

这是代码:

import bs4 as bs
import requests
import pandas as pd
import re

company = 'Facebook Inc'
filing = '10-Q'
year = 2020
quarter = 'QTR3'
#get name of all filings 
download = requests.get(f'https://www.sec.gov/Archives/edgar/full-index/{year}/{quarter}/master.idx').content
download = download.decode("utf-8").split('\n')
print (download) 
4

1 回答 1

0

您需要按照此处所述声明您的用户代理,否则您将下载一个 html 页面提示您这样做。

于 2021-12-21T20:37:02.770 回答