所以我想用漂亮的汤来获取这个页面的内容。我想创建一个包含所有 css 颜色名称的字典,这似乎是一种快速简便的访问方法。所以很自然地我做了快速的基本操作:
from bs4 import BeautifulSoup as bs
url = 'http://www.w3schools.com/cssref/css_colornames.asp'
soup = bs(url)
出于某种原因,我只在p
正文中的标签中获取 url,就是这样:
>>> print soup.prettify()
<html>
<body>
<p>
http://www.w3schools.com/cssref/css_colornames.asp
</p>
</body>
</html>
为什么 BeautifulSoup 不能让我访问我需要的信息?