0

我正在尝试使用 beautifulsoup 从网站获取 javascript“.js”文件。这是我目前正在使用的代码,它可以工作但在某些文件上丢失

jss = soup.findAll(name = 'script', attrs = { 'src': re.compile('\.js') })

例如 js 文件:

src=http://krebsonsecurity.com/wp-content/plugins/comment-rating-pro/ck-karma.js?ver=3.3.2

然后它错过了。

任何人都知道能够提取 js 文件的最佳实现。

干杯

4

1 回答 1

0

删除对值的限制src(超出“拥有 src”)。:

re.compile('\.+')
于 2012-05-09T05:54:45.503 回答