我最近一直在构建一个处理重复事件的新网络应用程序。这些事件可以每天、每周或每月重复发生。
这一切都很好。但是当我开始创建事件浏览器页面(公共互联网可以看到)时,我想到了一个想法。
如果爬虫点击此页面,并带有下一个和上一个按钮来浏览日期,它会永远继续下去吗?所以我选择不使用通用 HTML 链接并使用 AJAX。这意味着机器人将无法访问链接。
但是这种方法意味着我失去了没有 Javascript 的用户的任何功能。还是没有 Javascript 的用户数量太少而无需担心?
有没有更好的方法来处理这个?
我也对像 Google Crawler 这样的机器人如何检测到这样的黑洞以及它如何处理它们非常感兴趣?