发表这篇文章多年后,这仍然是一个问题,但它不是 facebook 的缓存:这通常是人为错误(请允许我详细说明)
OG:TYPE 影响您的图像抓取:
- https://ogp.me/#type_article 与 https://ogp.me/#type_website 不一样
请注意, og:type=website 将导致该网址的任何 /sub-pages/ 变为“规范”。这意味着无论您做什么,都无法使用刮板更新图像。
考虑一下这个“假设和常见错误”
- <meta property="og:type" content="website" />
=> https://www.example.org (父)
- <meta property="og:type" content="website" />
=> https://www.example.org/sub-page/
- <meta property="og:type" content="website" />
=> https://www.example.org/sub-page/child -2/
- Ergo:将继承父级/sub-page/
的/child-2/
og:image
那些不是“所有网站”,1是网站,其他是文章。
如果你这样做,Facebook 会认为所有这些都是规范的,它会将 FIRST og:image 放入所有这些中。(试试看,你会看到) - 如果你将 og:url 设置为你的根域或父域,你告诉 facebook 它们都是规范的。(这是有充分理由的,但它离题了)
考虑这个解决方案(这是大多数人“真正想要的”)
- <meta property="og:type" content="article" />
=> https://www.example.org/sub-page/
- <meta property="og:type" content="article" />
=> https://www.example.org/sub-page/child-2/
如果你现在这样做,Facebook 会给你带来更少的抓取新图像的问题。
最后,是的,这里的缓存破坏者、随机变量、更改 url 和建议可以工作,但如果没有正确指定,它们看起来像“间歇性巫毒” 。og:type
PS:请记住,即使您“认为”可以看到最新版本,CDN 或服务器端缓存也会服务于 Facebook 的抓取工具。(除了指出如果不仔细检查它会浪费你大量的时间,我不会花任何时间在这上面。)