0

我在我的 Drupal 自定义模块中使用 Simple HTML DOM 库在我的项目中执行任务。

该任务只是模仿 Facebook 的操作,当我们粘贴文章 url 时,FB 会废弃该 url 并返回文章的一部分作为描述和图像。

我的问题是,在很多<p>标签之间选择文章的第一部分并在页面中的所有图片之间选择正确图片的算法是什么!

我知道 FB 使用:OG标签,但如果 OG 标签不存在,我需要开发一种算法来选择这些信息。

谢谢大家的支持,祝您有美好的一天。

问候。

4

1 回答 1

0

我认为图像是图像的尺寸。Th 采用超过 100x100 像素左右的第一张图像。

与文本可能类似。剥离内联 HTML 标签,获取第一个块元素文本(或者可能只是段落),然后就可以了。

于 2012-08-26T16:13:45.627 回答