我想防止页面及其资产(图像)被索引。
因此,如果我告诉爬虫跳过该页面,但该页面仍在 sitemap.xml 中注册,那么该页面上的任何信息都会被编入索引吗?
我想防止页面及其资产(图像)被索引。
因此,如果我告诉爬虫跳过该页面,但该页面仍在 sitemap.xml 中注册,那么该页面上的任何信息都会被编入索引吗?
robots.txt 不允许抓取,而不是索引。
如果您在 robots.txt 中禁止抓取某个网址,并在站点地图中列出该网址,则仍不允许抓取该网址。站点地图中的出现不会改变这一点。
不过,此 URL 可能仍会被编入索引(无论它是否在站点地图中)。