我是 python 新手,我只是想知道从网络服务器解析数据的最佳方法是什么。我用谷歌搜索并没有找到任何像样的教程,所以任何帮助将不胜感激。
问问题
311 次
1 回答
2
您可以使用,BeatifulSoap
.
Beautiful Soup 是一个 Python 库,用于从 HTML 和 XML 文件中提取数据。它与您最喜欢的解析器一起使用,提供导航、搜索和修改解析树的惯用方式。它通常可以节省程序员数小时或数天的工作时间。
示例用法:
import urllib2
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen('http://facebook.com').read()
soup = BeautifulSoup(page)
soup.prettify()
for anchor in soup.findAll('a', href=True):
print anchor['href']
于 2013-01-02T13:07:39.797 回答