Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想知道爬虫和机器人是否可以解码html实体,例如在我的html中我有类似的东西:
salariés
他们是这样读的吗?或类似的东西:
salariés
哪个选项更适合 SEO?
我想说您可以放心地假设 HTML 实体已正确解码。它们是有效的 HTML,不解码它们的爬虫最终会得到大量损坏的内容。
大多数爬虫将解码您的实体,因为它们需要纯文本来计算数据和提取信息。
如果您想帮助他们,请使用适当的编码(如 utf8)、良好的字符集元,并避免使用 html 实体。