0

我正在尝试为站点创建一个通用解析器并获取相关信息。我想做的第一件事是能够知道网站的徽标是什么。

通常,徽标将是一个链接回主页的图像,并且可能在其 ID 中包含“徽标”一词。

为了在解析页面时找到什么是页面徽标,我可以应用什么好的策略或标准?

4

1 回答 1

2

真的没有办法让这个过程成为一个通用的过程。没有关于如何显示网站徽标的规则 - 因此没有您可以查看的单一 ID、类别、标签或位置。同样,图像不会“链接”到任何东西,<a>链接可能包含<img>标签,但仅此而已。

如果没有写出一长串最佳猜测,就没有办法可靠地解析任意 HTML 页面并从中获取徽标。

于 2013-10-07T22:20:46.103 回答