0

我正在尝试收集此页面的参与数据:http: //www.nature.com/news/the-future-of-dna-sequencing-1.22787

在处理我的代码时,我意识到 Facebook 会为 URL 的不同变体返回不同的 Open Graph 对象,这不应该发生,因为页面提供了规范的 URL。

例子:

  1. http://www.nature.com/news/the-future-of-dna-sequencing-1.22787
  2. http://www.nature.com/news/the-future-of-dna-sequencing-1.22787/
  3. https://www.nature.com/news/the-future-of-dna-sequencing-1.22787
  4. https://www.nature.com/news/the-future-of-dna-sequencing-1.22787/

解析为不同的 Open Graph 对象。

在 Open Graph Object Debugger 中检查后,我看到推断的规范 URL 具有附加参数,例如http://www.nature.com/news/the-future-of-dna-sequencing-1.22787?error=cookies_not_supported&code=4b78fd75 -8cad-4456-a877-be0c9c1b9108


虽然我知道由于某些 cookie 操作而导致重定向失败,但新 URL 的最后一部分code=4b78fd75-8cad-4456-a877-be0c9c1b9108因 4 个 URL 变体中的每一个而异,从而导致不同的 OG 对象。

有人可以在这里帮助我并解释为什么 Facebook 会推断出一个新的规范 URL(带有附加参数),即使原始链接提供了一个?

4

0 回答 0