0

我在 SO 中关注了其他几个问题以找到最终的重定向 url,但是对于以下 url,我无法使重定向工作。它不会重定向并停留在 tinyurl。

import urllib2
def getFinalUrl(start_url):
        var = urllib2.urlopen(start_url)
        final_url = var.geturl()
        return final_url


url = "http://redirect.tinyurl.com/api/click?key=a7e37b5f6ff1de9cb410158b1013e54a&out=http%3A%2F%2Fwww.amazon.com%2Fgp%2Fprofile%2FA3B4EO22KUPKYW&loc=&cuid=0072ce987ebb47328d22e465a051ce7&opt=false&format=txt"
redirect = getFinalUrl(url)
print "redirect: " + redirect

结果(如果您在浏览器中尝试,这不是最终的 url):

redirect: http://redirect.tinyurl.com/api/click?key=a7e37b5f6ff1de9cb410158b1013e54a&out=http%3A%2F%2Fwww.amazon.com%2Fgp%2Fprofile%2FA3B4EO22KUPKYW&loc=&cuid=0072ce987ebb47328d22e465a051ce7&opt=false&format=txt
4

1 回答 1

2
import urlparse
url = 'http://redirect.tinyurl.com/api/click?key=a7e37b5f6ff1de9cb410158b1013e54a&out=http%3A%2F%2Fwww.amazon.com%2Fgp%2Fprofile%2FA3B4EO22KUPKYW&loc=&cuid=0072ce987ebb47328d22e465a051ce7&opt=false&format=txt'
try:
    out = urlparse.parse_qs(urlparse.urlparse(url).query)['out'][0]
    print(out) #http://www.amazon.com/gp/profile/A3B4EO22KUPKYW
except Exception as e: # dont catch all
    print('not found')

这种 url 不需要卷曲来找出目标/重定向 url 是什么,因为你已经在你的 url 中有它们。


如果没有像这个人那样显示目标/重定向 url

tinyurl.com/xxxx

那么这是一个不同的故事,你必须卷曲它以找出它解析/ 304到如下所示:

import requests
url = 'http://urlshortener.com/applebanana'
t = requests.get(url)
print(t.url)
于 2016-05-06T19:27:06.340 回答