我不太了解 SEO 和网络蜘蛛的工作原理,所以请原谅我的无知。我正在创建一个站点(使用 ASP.NET-MVC),该站点具有显示从数据库检索到的信息的区域。数据对用户来说是唯一的,因此没有真正的服务器端输出缓存正在进行。但是,由于数据可能包含用户可能不希望从搜索引擎结果中显示的内容,我想阻止任何蜘蛛访问搜索结果页面。我应该采取什么特殊措施来确保不抓取搜索结果目录?此外,蜘蛛是否会抓取动态生成的页面,并且阻止某些目录被搜索的任何操作是否会扰乱我的搜索引擎排名?
编辑:我应该补充一下,我正在阅读robots.txt
协议,但它依赖于网络爬虫的合作。但是,我还想阻止任何会忽略 robots.txt 文件的数据挖掘用户。
我很感激任何帮助!