我有一个包含许多短 url 的 txt 文档。每个 url 由一行分隔。我想解析 URL 以获得最终链接。还有一些 URL 被重定向两次。如何自动执行此操作以获取具有输出格式的最终 url每行一个网址?更新:输入文本文件:
http://www.example.com/go/post-page-1
http://www.example.com/go/post-page-2
http://www.example.com/go/post-page-3
txt文件中需要的输出格式:
http://www.example.org/post-page-name
http://www.example.org/post-page-name
http://www.example.org/post-page-name
以下是链接的重定向方式:
Initial URL:http://www.example.com/go/post-page
==>301 Permanent Redirect
Intermediate url:http://click.affiliate.com/tracking?url=http://www.example.org/post-page-name
==>302 Temporary Redirect
Final URL: http://www.example.org/post-page-name
这是我尝试过的代码,但它没有将 URL 解析为最终链接,而是解析为中间链接。
#!/bin/bash
rm resolved_urls.txt
for url in $(cat url.txt); do
wget -S "$url" 2>&1 | grep ^Location >> resolved_urls.txt
done