我正在编写一个 python 脚本,它将在从网页解析后提取脚本位置。假设有两种情况:
<script type="text/javascript" src="http://example.com/something.js"></script>
和
<script>some JS</script>
我能够从第二种情况中获取 JS,即当 JS 写入标签时。
但是有什么办法,我可以从第一个场景中获取 src 的值(即提取脚本中 src 标记的所有值,例如http://example.com/something.js)
这是我的代码
#!/usr/bin/python
import requests
from bs4 import BeautifulSoup
r = requests.get("http://rediff.com/")
data = r.text
soup = BeautifulSoup(data)
for n in soup.find_all('script'):
print n
输出:一些 JS