Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在尝试为站点创建一个通用解析器并获取相关信息。我想做的第一件事是能够知道网站的徽标是什么。
通常,徽标将是一个链接回主页的图像,并且可能在其 ID 中包含“徽标”一词。
为了在解析页面时找到什么是页面徽标,我可以应用什么好的策略或标准?
真的没有办法让这个过程成为一个通用的过程。没有关于如何显示网站徽标的规则 - 因此没有您可以查看的单一 ID、类别、标签或位置。同样,图像不会“链接”到任何东西,<a>链接可能包含<img>标签,但仅此而已。
<a>
<img>
如果没有写出一长串最佳猜测,就没有办法可靠地解析任意 HTML 页面并从中获取徽标。