我正在使用 htaccess 重写并重定向www.mysite.com/index.php?id=#
到友好的 url,例如www.mysite.com/news
. 所以所有的新闻文章都会写成www.mysite.com/news/article1
,等等。
现在,我将阻止服务器上不需要使用 robots.txt 索引的所有目录。由于我使用的是 cms,因此这些目录是 /core、/managers、/connectors 等。但由于该www.mysite.com/news
目录实际上并不存在,而是用 htaccess 重写,因此会阻止所有目录,如 /core 等。仍然允许爬虫索引我的网站?
所以基本上我想知道的是:爬虫是否会在重写后看到我的网站网址?还是它仍然需要访问我的 cms 的其他目录,例如 /core 才能索引我的页面?