4

我想知道哪种编程语言提供了大量的库来编写网络机器人?类似于抓取网页以获取数据。假设我想获取 weather.yahoo.com 网站的天气。

AI桌面机器人的答案也一样吗?

4

3 回答 3

10

以下是您可以在 Python 中执行此操作的方法:

from urllib2 import urlopen
from BeautifulSoup import BeautifulSoup
soup=BeautifulSoup(urlopen("http://weather.yahoo.com/").read())
for x in soup.find(attrs={"id":"myLocContainer"}).findAll("li"):
  print x.a["title"], x.em.contents

印刷:

美国伊利诺伊州芝加哥的全面预报(雾霾)[u'35...47 °F']
伦敦、大伦敦地区、英格兰的全面预报(小雨)[u'43...45 °F']
全面美国纽约州纽约市预报(部分多云)[u'42...62 °F']
美国加利福尼亚州旧金山的完整预报(部分多云)[u'51...70 °F ']

于 2010-11-18T02:36:56.210 回答
3

我不知道它是否是最好的,但Python绝对是非常好的和简单的。

于 2010-11-18T02:21:16.493 回答
1

另一个用于屏幕抓取和网络抓取的优秀 python 库是scrapy

于 2010-11-18T16:27:25.763 回答