Facebook 刮板在阅读我的页面内容时会抛出一些奇怪的东西......
页面网址: http: //www.protagora.hr/Stranica/O-nama/9/
为什么当我使用浏览器访问页面时一切正常,但爬虫无法访问相同的数据?
请帮忙。
Facebook 刮板在阅读我的页面内容时会抛出一些奇怪的东西......
页面网址: http: //www.protagora.hr/Stranica/O-nama/9/
为什么当我使用浏览器访问页面时一切正常,但爬虫无法访问相同的数据?
请帮忙。
当我第一次尝试访问您的页面时,我得到了一个 php 错误而不是页面,然后我刷新了浏览器,错误消失了,页面被加载了。
然后我试着看看调试器说了什么,你是对的,它抱怨(警告而不是错误)没有以下标签:标题、网址和描述,即使在查看你的源代码时很明显所有标签都存在.
在调试器结果页面的底部有一个链接“Scraped URL: See exactly what our scraper sees for your URL”,当点击 facebook scraper获取的内容是:
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd">
<html>
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8">
<br><b>Fatal error</b>
</head>
<body><p>: Call to a member function LoadContentData() on a non-object in <b>/home/protagor/public_html/WebSuite/Modules/WebCMS/Classes/Content.php</b> on line <b>65</b><br></p></body>
</html>
这是我最初看到的错误。
我不确定他们是否只是缓存了此错误,或者此错误是否仅在 facebook 机器人抓取您的页面时发生。通常使用调试器“强制”清除 facebook 缓存,新结果正在替换缓存中的旧结果。
您应该检查为什么会发生此错误。