python - 从给定的 URL 中提取 CSS/JSS

Question

目前正在尝试编写一个可以从给定 URL 中提取 CSS/JSS 的 python 脚本。偶然发现了 urllib3，它帮助我在 PoolManager() 实用程序的帮助下收集给定 URL 的 HTML。使用下面的短代码，我能够提取给定 URL 的 HTML，然后将其存储在文件中。

import urllib3
http = urllib3.PoolManager()
x = http.request('GET','www.something.com')
x.data

我在他们的官方页面上浏览了 urllib3 的文档。但是，与我正在寻找的功能接近的各种功能并没有太多。现在我需要以某种方式获取特定 URL 的外部资源，我想知道是否可以使用 urllib3 或者我是否需要搜索其他可以帮助我做同样事情的东西（也欢迎任何建议） .

提前谢谢大家！

score 0 · Accepted Answer

这不是你要用 urllib3 做的事情。获得 HTML 后，您必须对其进行解析并提取链接到 CS 和 JS 文件的元素。您可以为此使用BeautifulSoup。

1 回答 1