我正在尝试在这里抓取网站:ftp: //ftp.sec.gov/edgar/daily-index/。使用如下所示的代码:
from bs4 import BeautifulSoup
import urllib.request
html = urllib.request.urlopen("ftp://ftp.sec.gov/edgar/daily-index/")
soup = BeautifulSoup(line, "lxml")
soup.a # or soup.find_all('a') neither of them works
#return None.
请帮忙,我对此感到非常沮丧。我怀疑是标签导致了问题。该站点的 Html 看起来格式正确(匹配的标签),所以我不知道为什么 BeautifulSoup 没有找到任何东西。谢谢