0

这个谷歌文档页面当前内容是:

替代文字 http://www.deviantsart.com/upload/i9k01q.png

但是,当使用以下 PHP fopen()脚本阅读此页面时,我得到了一个较旧的缓存版本:

替代文字
(来源:deviantsart.com

我尝试了这个问题中提出的两种解决方案(随机属性和使用 POST),我也尝试了clearstatcache()但我总是得到网页的缓存版本。

为了使 fopen() 返回网页的当前版本,我必须在以下脚本中进行哪些更改?

<?php
$url = 'http://docs.google.com/View?id=dc7gj86r_32g68627ff&amp;rand=' . getRandomDigits(10);

echo $url . '<hr/>';
echo loadFile($url);

function loadFile($sFilename) {
    clearstatcache();
    if (floatval(phpversion()) >= 4.3) {
        $sData = file_get_contents($sFilename);
    } else {
        if (!file_exists($sFilename)) return -3;

        $opts = array('http' =>
          array(
            'method'  => 'POST',
            'content'=>''
          )
        );
        $context  = stream_context_create($opts);                

        $rHandle = fopen($sFilename, 'r', $context);
        if (!$rHandle) return -2;

        $sData = '';
        while(!feof($rHandle))
            $sData .= fread($rHandle, filesize($sFilename));
        fclose($rHandle);
    }
    return $sData;
}

function getRandomDigits($numberOfDigits) {
 $r = "";
 for($i=1; $i<=$numberOfDigits; $i++) {
  $nr=rand(0,9);
  $r .=  $nr;
 }
 return $r;
}

?>

添加:取出$op​​ts$context也会给我一个缓存页面:

function loadFile($sFilename) {
    if (floatval(phpversion()) >= 4.3) {
        $sData = file_get_contents($sFilename);
    } else {
        if (!file_exists($sFilename)) return -3;              

        $rHandle = fopen($sFilename, 'r');
        if (!$rHandle) return -2;

        $sData = '';
        while(!feof($rHandle))
            $sData .= fread($rHandle, filesize($sFilename));
        fclose($rHandle);
    }
    return $sData;
}

添加:这个发送 Firefox 用户代理的curl脚本也返回缓存的版本:

<?php
$url = 'http://docs.google.com/View?id=dc7gj86r_32g68627ff';
//$user_agent = 'Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)';
$user_agent = 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3 (.NET CLR 3.5.30729)';
$ch = curl_init();
//curl_setopt($ch, CURLOPT_COOKIEJAR, "/tmp/cookie");
//curl_setopt($ch, CURLOPT_COOKIEFILE, "/tmp/cookie");
curl_setopt($ch, CURLOPT_URL, $url ); 
curl_setopt($ch, CURLOPT_FAILONERROR, 1); 
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 0); 
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); 
curl_setopt($ch, CURLOPT_TIMEOUT, 15);
curl_setopt($ch, CURLOPT_USERAGENT, $user_agent);
curl_setopt($ch, CURLOPT_VERBOSE, 0);
echo curl_exec($ch);
?>
4

3 回答 3

2

我已经成功复制了这个。当您不是已发布 Web 文档的所有者时,Google 会进行缓存。如果你注销,它给了我旧版本。

在我取消发布并重新发布后,我无法再重现该问题。确保在更新时继续在“共享为网页”下发布文档。

只是为了确保,检查未登录的浏览器(或您的脚本)。如果没有更新:取消发布并再次发布。它并没有为我改变 URL。

于 2010-05-02T03:41:59.930 回答
1

我也明白了:

Test One;http://docs.google.com/View?id=dc7gj86r_30dzgzbjch
Test Two;http://docs.google.com/View?id=dc7gj86r_31dbssfrzx

“缓存”必须在 Google Docs 中完成,或者更有可能是您的错(错误的 URL?)。


响应标头:

Set-Cookie: ******
Content-Type: text/html; charset=UTF-8
Cache-Control: no-cache, no-store, max-age=0, must-revalidate
Pragma: no-cache
Expires: Fri, 01 Jan 1990 00:00:00 GMT
Date: Sun, 02 May 2010 03:30:29 GMT
X-Frame-Options: ALLOWALL
Content-Encoding: gzip
X-Content-Type-Options: nosniff
X-XSS-Protection: 1; mode=block
Content-Length: 3987
Server: GSE
于 2010-05-02T03:02:24.210 回答
1

尝试确保您的浏览器没有缓存信息。我没有看到任何缓存标头或任何东西。您的网络服务器可能正在添加某些内容,或者您​​的浏览器可能假设它已被缓存。尝试在输出中包含时间,以便确保请求是在正确的时间生成的。

几年前我使用 fopen 来处理经常更新的数据。从来没有遇到过 fopen 的缓存问题。事实上,如果 PHP 开发人员在 fopen 中添加一个 Web 缓存,我会感到失望,因为它会破坏大多数有效的用例并且它不在他们的文档中。我会去看看 PHP 源代码以确保。

您能否更新文档,以便我们中的一些人可以尝试复制?

于 2010-05-02T03:09:25.383 回答