Google Search Console 报告我的旧网站上某些页面的图片链接损坏错误。其中许多页面似乎没有被 Google 索引,我怀疑损坏的链接可能是原因。
证据如下:在控制台中,我选择了 Googlebot 发现错误的页面之一。然后我点击“Fetch as Google”,出现如下错误:“Googlebot could not get all resources for this page”。它列出了页面中“未找到”的一个或多个外部图像链接。实际上,确实有些外部图像路径被破坏了。
如果我为每个有缺陷的页面单击“查看为搜索结果”,控制台通常会显示一个空白的搜索结果页面。我认为这意味着这些页面尚未被 Google 索引。
这就是问题所在:纠正损坏的图像路径似乎很容易,但在这种情况下并非如此。我的网站有超过 70,000 个页面,其中的数据来自 MySQL 数据库,其中包含数十万个项目。每个网页都有多个从产品供应商网站链接的图像。大多数图像存储在供应商网站上的默认图像文件夹中,但有些图像存储在其他各种位置。它们的位置是不可预测的,这就是问题所在。
这个问题从一开始就预料到了。假设一定比例的外部图像路径不可避免地会被破坏,则每个路径都已使用以下 Javascript 进行编码,以隐藏任何丑陋的错误消息:
<img src="http://www.product-supplier.com/default-image-folder/12345678.gif" alt="Image not available." onerror="javascript:this.style.display='none';" width="150">
如果路径正确,此 javascript 允许所有产品图像在网页上正确显示。但如果图像路径有问题,则只显示一个空白。从视觉上看,这对人类来说是可以接受的,但 Googlebot 不理解 javascript,因此它认为损坏的链接是必需的资源。
以下是我的问题:有什么方法可以阻止 Googlebot 尝试验证所有外部图片链接?我可以向 Googlebot 表明外部图片链接无关紧要吗?有什么方法可以隐藏 Googlebot 的图片链接?
如果 Google 确实倾向于不索引任何外部图像链接断开的页面,那么它是否也不会索引外部网站链接断开的页面?如果是这样,那将产生不链接到外部网页的强大动力,因为我们无法控制外部网页,并且它们偶尔会被删除。
约束:
- 供应商没有解释他们将某些产品图像存储在其网站上的非标准位置的标准。
- 供应商未提供每张图片的链接。
- 鉴于大量的产品数据,梳理它以找到每个单独的断开链接是不可行的。
- 托管与供应商不断变化的产品目录相关的所有图像是不可行的,因为这需要太多的持续维护。
- 因此,一定比例的图像链接将始终被破坏。
- 我的网页是从我的 MySQL 数据库中以编程方式生成的,该数据库会使用供应商提供的新数据定期更新。
- 我的编程知识仅限于一些 php 和很少的 javascript。所以请用简单的方式回答。谢谢。