我有一个企业盒子帐户,我的任务是创建一个爬虫,它将扫描盒子上的帐户并将所有元信息(包括直接链接)保存在本地数据库中。这工作正常。
在 PHP 中,我还构建了一个函数,用于下载文档(通过我从 api 获得的直接链接)并从中提取可读文本。这在一周前工作得很好,但是昨天这完全停止了工作。我正在使用 file_get_contents() 函数来下载文件,目前它只检索文档的文件大小而不是文档本身,我觉得这很奇怪。我已经尝试过 CURL 并且得到了相同的结果,似乎框正在使用文件大小而不是实际文件来响应我的直接文件请求。
这些文件都是开放访问的,因此任何拥有直接链接的人都可以在不登录的情况下下载该文件。我还尝试在另一家托管公司的另一台服务器上运行此代码,我得到了完全相同的结果。我已经通过从其他位置(不是盒子)访问其他文件来测试我的代码,它工作正常。
重要的是要注意,这在一周前还可以正常工作,但现在根本无法正常工作。我之间没有任何改变,(据我所知)。有人有想法吗?