我编写了一个脚本,用于在特定时间自动发布新页面。它只会显示一个倒数计时器,然后当它达到 0 时,它会将特定文件重命名为 index.php 并将当前 index.php 重命名为 index-modified.php
这没有问题。但是在某个时候,我的客户告诉我的网站没有来。我发现 index.php 被重命名为 index-modified.php 并且所有其他页面都可以正常工作。如果没有 index.php,我的网站显示 404 错误。
然后我分析了访问日志,发现alexa爬虫访问了那个发布脚本,这导致了问题
我想知道alexa爬虫是如何找到我的内部脚本文件并爬取的??我的所有内部管理用途文件都会发生这种情况吗?我的任何页面都没有该脚本的任何链接。
我想知道它如何找到我服务器中存在的文件..????