0

编辑:答案在标记答案的评论中。

我目前正在更新移动网站上的一些关键组件。该站点使用来自不同服务器的数据来显示学生的日程安排。最近这个其他网站(我对它的控制为零)进行了大修,自然我现在必须更新移动网站。

我想要做的是访问一个 iCal 文件并解析它。由于我正在处理的站点在没有 curl-library 也没有正确设置 fopen 包装器的环境中运行,因此我采用了此处描述的方法(编号 4,直接使用套接字)。

我当前的问题是,我没有得到 iCal 文件,而是得到 301 错误。但是,如果我尝试在 Web 浏览器中访问相同的文件(通过相同的 URL),它就可以正常工作。

编辑:我添加了一些日志记录,这就是它的结果:

------------- 
Querying url:      
https://someUrl/schema/ri654Q055ZQZ60QbQ0ygnQ70cWny067Z0109Zx4h0Z7o525Y407Q.ics  
Response:   
HTTP/1.1 301 Moved Permanently  
Server: nginx/1.2.8  
Date: Sun, 11 Aug 2013 14:08:36 GMT  
Content-Type: text/html  
Content-Length: 184  
Connection: close  
Location:   
https://someUrl/schema/ri654Q055ZQZ60QbQ0ygnQ70cWny067Z0109Zx4h0Z7o525Y407Q.ics

<html>
<head><title>301 Moved Permanently</title></head>
<body bgcolor="white">
<center><h1>301 Moved Permanently</h1></center>
<hr><center>nginx/1.2.8</center>
</body>
</html>

Redirect url found: https://someUrl/schema/ri654Q055ZQZ60QbQ0ygnQ70cWny067Z0109Zx4h0Z7o525Y407Q.ics

我得到的新位置与原来的位置相同。

这是使用的代码:

function getRemoteFile($url)
{

    error_log("------------- \r\nQuerying url: " . $url, 3, "error_log.log");
  // get the host name and url path
  $parsedUrl = parse_url($url);
  $host = $parsedUrl['host']; 
  if (isset($parsedUrl['path'])) {
     $path = $parsedUrl['path'];
  } else {
     // the url is pointing to the host like http://www.mysite.com
     $path = '/';
  }
  if (isset($parsedUrl['query'])) {
     $path .= '?' . $parsedUrl['query'];
  } 

  if (isset($parsedUrl['port'])) {
     $port = $parsedUrl['port'];
  } else {
     // most sites use port 80
     // but we want port 443 because we are using https
     error_log("Using port 443\r\n" . $url, 3, "error_log.log");
     $port = 443;
  }
  $timeout = 10;
  $response = '';
  // connect to the remote server 
  $fp = fsockopen($host, $port, $errno, $errstr, $timeout );
  if( !$fp ) { 
     echo "Cannot retrieve $url";
  } else {
    $payload = "GET $path HTTP/1.0\r\n" .
                "Host: $host\r\n" .
                "User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.0.3) Gecko/20060426 Firefox/1.5.0.3\r\n" .
                "Accept: */*\r\n" .
                "Accept-Language: sv-SE,sv;q=0.8,en-us,en;q=0.3\r\n" .
                "Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7\r\n" .
                "Referer: https://$host\r\n\r\n";
    error_log("\nPAYLOAD: " . $payload, 3, "error_log.log");
     // send the necessary headers to get the file 
     fputs($fp, $payload);
     // retrieve the response from the remote server 
     while ( $line = stream_socket_recvfrom( $fp, 4096 ) ) {
        $response .= $line;
     }
     fclose( $fp );
     // naively find location redirect
     $location_pos = strpos($response, "Location:");
     if($location_pos){
        $location_pos += 10;
        $new_url = substr($response, $location_pos, strpos($response, "\r\n\r\n") - $location_pos);
        error_log("\nRedirect url found: " . $new_url, 3, "error_log.log");
     }else{
        //log the response
        error_log($response, 3, "error_log.log");
     }


     // strip the headers
     $pos      = strpos($response, "\r\n\r\n");
     $response = substr($response, $pos + 4);
  }
  // return the file content 
  return $response;
}
4

1 回答 1

0

HTTP 响应代码 301是永久重定向,而不是错误。

您的代码必须遵循该重定向才能访问资源。

例如, http: //google.com/返回 301 以将用户重定向到http://www.google.com/

$ curl -I http://google.com/
HTTP/1.1 301 Moved Permanently
Location: http://www.google.com/
Content-Type: text/html; charset=UTF-8
Date: Sun, 11 Aug 2013 01:25:34 GMT
Expires: Tue, 10 Sep 2013 01:25:34 GMT
Cache-Control: public, max-age=2592000
Server: gws
Content-Length: 219
X-XSS-Protection: 1; mode=block
X-Frame-Options: SAMEORIGIN
Alternate-Protocol: 80:quic

您可以在第 2 行看到 301 响应,然后是 Location 标头,它告诉 Web 浏览器去哪里。

可能发生的情况是,在这次大修期间,他们将资源转移到了另一个位置。为了不破坏任何用户的书签或日历,他们使用了 301 重定向,以便客户端自动从新位置获取资源。

于 2013-08-11T01:23:10.733 回答