4

两天大的 Python(和编程)新手,所以请温柔一点。

我从 Twitter 上抓取了大约 1500 个缩短的 URL。它们都采用以下格式:http ://t.co/ ...

使用它来扩展短 URL:

import urllib2  
a = urllib2.urlopen('http://t.co/..')  
print a.url

最后两行使用不同的 URL 重复了大约 1500 次不同的时间。

只要 URL 指向的页面存在,它就可以正常工作,但是当它不存在错误消息时,它会在该点停止。我要在代码中添加什么,以便它返回“找不到页面”并继续到下一个 URL 并在不停止的情况下遍历整个列表。

4

1 回答 1

2

假设您使用的是 python 2(python 3 的异常处理语法稍有不同)

for url in urls:
    try:
        a = urllib2.urlopen(url)  
    except urllib2.HTTPError, e:
        print "Error", e
        continue

..... do something with a   
于 2013-02-19T16:09:09.657 回答