1

在所有 30x 重定向和位置标头之后,我正在寻找将给定 url 解析为其最终端点的最有效方法。

基本上,我有一堆像http://foo.com这样的 URL,当你访问它们时,它们最终会出现在像http://foo.com/Welcome.html这样的页面上,我需要找到最后一个 URL。

现在,我正在使用CURLOPT_FOLLOWLOCATIONand CURLOPT_NOBODY(因为我真的不关心返回的文本),一旦它被执行,我运行 curl_getinfo() 并从该数组中保存 'url' 键。

我只是一直在想,这是一种巨大的浪费,<something>可能有更好的方法。

编辑:对于那些稍后阅读此内容的人。我最终找到了一个更好的解决方案(不涉及 curl),请参阅php5+ 中的get_headers()

4

1 回答 1

3

您可以通过分析接收到的标头在 php 中手动执行此操作,但 cURL 执行完全相同的操作。没有其他直接的方法,cURL 是最舒服的一种。别管它。

或者你可以使用一些已经被爬虫检索到的搜索引擎信息。

于 2009-02-03T12:09:53.243 回答