2

我正在使用此 URL 末尾的 pdf

https://www2.blackrock.com/webcore/litService/search/getDocument.seam?venue=PUB_INS&source=CONTENT&serviceName=PublicServiceView&ContentID=51648

通过查看它,我们可以看到它是12/31/2012版本。有没有办法可以在 pdf 本身上获取一些时间戳数据?上传日期、创建日期、修改日期,以及该范围内的任何内容?

我已经尝试了以下并且都返回12/31/1969

$pdfURL = 'https://www2.blackrock.com/webcore/litService/search/getDocument.seam?venue=PUB_INS&source=CONTENT&serviceName=PublicServiceView&ContentID=51648';
$rawPDF = file_get_contents($pdfURL);
echo date("F d Y H:i:s.", filemtime($pdfURL));

-AND-

echo date("F d Y H:i:s.", filemtime($rawPDF));

我也试过

$headerArray = array();
$headerArray = get_headers($pdfURL, 1);
echo "<PRE>";
var_dump($headerArray);
echo "</PRE>";

但是Last-Modified在标头数组中不存在

4

1 回答 1

2

我之前回答过,因为我只提供了一个链接,版主删除了我的答案并转换为评论。现在让我们根据我们的评论尝试更完整的答案:

根据我的分析,给定链接的 HTTP 标头包含 Last-modified 字段。但前提是链接直接指向文件。但是,当您看到链接是那种类型时somepage.pgp?file=file.pdf,Last-modified 将不存在。在第一种情况下,get_headers()可以使用 php 函数来读取相关字段。我是后一种情况,恐怕我帮不了你。

于 2013-01-26T19:35:49.497 回答