当您添加/分享文章时,我想做类似于 Facebook 正在做的事情
例如,通过输入文章/故事的 URL,Facebook 会自动识别标题图像等。
是否有现有的算法或标准?是否有任何商业或开放 API 可以做到这一点?
一个相关的 SO 问题如何在发布共享链接时获取链接的标题 + 图像,有一个很好的建议是简单地找到第一个<h1>
,<img>
但我想知道是否有一个 API 可以处理 HTML 作者不那么友好的情况(例如图像在背景中,标题不在 h1 中,而是在 h2 中(或仅使用样式类)。我将测试 Facebook 如何处理此类页面并更新问题。