我有一个充满 HTML 文档的文件夹,这些文档是网页的保存副本,但我需要知道它们来自哪个站点,我可以使用什么功能从文档中提取网站名称?我在 BeautifulSoup 模块中没有找到任何东西。我应该在文档中查找特定内容吗?我不需要知道完整的网址,我只需要知道网站的名称。
问问题
71 次
我有一个充满 HTML 文档的文件夹,这些文档是网页的保存副本,但我需要知道它们来自哪个站点,我可以使用什么功能从文档中提取网站名称?我在 BeautifulSoup 模块中没有找到任何东西。我应该在文档中查找特定内容吗?我不需要知道完整的网址,我只需要知道网站的名称。