我正在尝试使用 Python Mechanize 检索网站并将它们保存在本地磁盘上。问题是许多网站重定向到 html/asp/php 以外的链接。是否有任何准确的方法来检测 URL 具有什么扩展名以及它将检索什么类型的文件?
例如: http ://www.yahoo.com 应该保存为 html 文件。
http://www.microsoft.com/en-us/download/confirmation.aspx?id=3745 应保存为 .exe 文件,因为它会重定向,然后下载 exe 文件。然而,内容类型被声明为 text/html 所以这不是我猜的最可靠的方法。
如何在保存文件时像浏览器一样准确检测 aa 文件扩展名?
非常感谢