1

我创建了一个网站,人们可以在其中发布其他网站的链接,然后后端生成链接的预览(通过使用 curl 并解析大多数网站上可用的开放图形标签/通过选择第一张图片、html 标题等)。现在,经过一些调整后很好,但有时我会得到某种速率限制。

这是我要解析的链接的一个示例:https ://www.facebook.com/HBR/posts/10157131816732787

我可以解析它 4 或 5 次并获得标题、图像等,但如果我重复它,我会被发送到 facebook 的登录页面。我怎样才能避免这种情况?

我试图解析https://developers.facebook.com/tools/debug/sharing上的链接,但它显示“无法抓取 Facebook URL”。所以我的问题是:如果他们甚至不允许在调试器上使用这些链接,我什至应该如何解析它们?

是否有任何类型的 API 可以让我在没有用户登录的情况下获取这些信息?我不想解析整个 Facebook 页面、个人资料等,只是预览我的用户可能在网站上发布的链接。

4

1 回答 1

2

如果您想获取 Facebook 页面(或 Facebook 上的任何其他内容)的数据,则必须使用 Facebook Graph API,不允许抓取。

为了获取您不拥有的页面的数据,您需要申请页面公共内容访问:https ://developers.facebook.com/docs/apps/review/feature/#reference-PAGES_ACCESS

在这种情况下,应用程序访问令牌(无需登录)就足够了。

页面 API 参考:https ://developers.facebook.com/docs/graph-api/reference/page/

于 2019-09-17T19:17:47.113 回答