目前正在尝试编写一个可以从给定 URL 中提取 CSS/JSS 的 python 脚本。偶然发现了 urllib3,它帮助我在 PoolManager() 实用程序的帮助下收集给定 URL 的 HTML。使用下面的短代码,我能够提取给定 URL 的 HTML,然后将其存储在文件中。
import urllib3
http = urllib3.PoolManager()
x = http.request('GET','www.something.com')
x.data
我在他们的官方页面上浏览了 urllib3 的文档。但是,与我正在寻找的功能接近的各种功能并没有太多。现在我需要以某种方式获取特定 URL 的外部资源,我想知道是否可以使用 urllib3 或者我是否需要搜索其他可以帮助我做同样事情的东西(也欢迎任何建议) .
提前谢谢大家!