-6

我是 python 新手,我只是想知道从网络服务器解析数据的最佳方法是什么。我用谷歌搜索并没有找到任何像样的教程,所以任何帮助将不胜感激。

4

1 回答 1

2

您可以使用,BeatifulSoap.

Beautiful Soup 是一个 Python 库,用于从 HTML 和 XML 文件中提取数据。它与您最喜欢的解析器一起使用,提供导航、搜索和修改解析树的惯用方式。它通常可以节省程序员数小时或数天的工作时间。

文档

示例用法:

import urllib2
from BeautifulSoup import BeautifulSoup

page = urllib2.urlopen('http://facebook.com').read()
soup = BeautifulSoup(page)
soup.prettify()
for anchor in soup.findAll('a', href=True):
   print anchor['href']
于 2013-01-02T13:07:39.797 回答