3

我想知道爬虫和机器人是否可以解码html实体,例如在我的html中我有类似的东西:

salariés

他们是这样读的吗?或类似的东西:

salariés

哪个选项更适合 SEO?

4

2 回答 2

5

我想说您可以放心地假设 HTML 实体已正确解码。它们是有效的 HTML,不解码它们的爬虫最终会得到大量损坏的内容。

于 2010-09-01T16:09:51.883 回答
1

大多数爬虫将解码您的实体,因为它们需要纯文本来计算数据和提取信息。

如果您想帮助他们,请使用适当的编码(如 utf8)、良好的字符集元,并避免使用 html 实体。

于 2010-09-01T16:09:47.923 回答