我有一个网页,用户可以在该网页上填写一些数据,为此他们需要登录。因此,当我sitemap.xml
使用 xml-sitemaps.com 创建时,它创建了几个首先要求登录的位置。就像是:
<loc> https://www.example.com/login/?next=fill-form/ </loc>
这个页面也没有内容,所以我认为阻止搜索引擎抓取它是个好主意。
我想知道防止搜索引擎爬行的正确方法是什么,
head
在部分中添加以下标签,
<meta name="robots" content="noindex, nofollow">
或通过在文件中添加其 URL 来禁止该网页robots.txt
?
另外,这两者有什么区别?