0

目前正在尝试编写一个可以从给定 URL 中提取 CSS/JSS 的 python 脚本。偶然发现了 urllib3,它帮助我在 PoolManager() 实用程序的帮助下收集给定 URL 的 HTML。使用下面的短代码,我能够提取给定 URL 的 HTML,然后将其存储在文件中。

import urllib3
http = urllib3.PoolManager()
x = http.request('GET','www.something.com')
x.data

我在他们的官方页面上浏览了 urllib3 的文档。但是,与我正在寻找的功能接近的各种功能并没有太多。现在我需要以某种方式获取特定 URL 的外部资源,我想知道是否可以使用 urllib3 或者我是否需要搜索其他可以帮助我做同样事情的东西(也欢迎任何建议) .

提前谢谢大家!

4

1 回答 1

0

这不是你要用 urllib3 做的事情。获得 HTML 后,您必须对其进行解析并提取链接到 CS 和 JS 文件的元素。您可以为此使用BeautifulSoup

于 2015-06-18T15:39:36.610 回答