我想知道哪种编程语言提供了大量的库来编写网络机器人?类似于抓取网页以获取数据。假设我想获取 weather.yahoo.com 网站的天气。
AI桌面机器人的答案也一样吗?
我想知道哪种编程语言提供了大量的库来编写网络机器人?类似于抓取网页以获取数据。假设我想获取 weather.yahoo.com 网站的天气。
AI桌面机器人的答案也一样吗?
以下是您可以在 Python 中执行此操作的方法:
from urllib2 import urlopen
from BeautifulSoup import BeautifulSoup
soup=BeautifulSoup(urlopen("http://weather.yahoo.com/").read())
for x in soup.find(attrs={"id":"myLocContainer"}).findAll("li"):
print x.a["title"], x.em.contents
印刷:
美国伊利诺伊州芝加哥的全面预报(雾霾)[u'35...47 °F']
伦敦、大伦敦地区、英格兰的全面预报(小雨)[u'43...45 °F']
全面美国纽约州纽约市预报(部分多云)[u'42...62 °F']
美国加利福尼亚州旧金山的完整预报(部分多云)[u'51...70 °F ']
我不知道它是否是最好的,但Python绝对是非常好的和简单的。
另一个用于屏幕抓取和网络抓取的优秀 python 库是scrapy。