情况:
- 内容受用户名/密码保护的网站(并非全部受控,因为他们可以是试用/测试用户)
- 由于用户名/密码限制,普通搜索引擎无法获取
- 恶意用户仍然可以登录并将会话 cookie 传递给“wget -r”或其他东西。
问题是什么是监控此类活动并对其做出响应的最佳解决方案(考虑到网站政策是不允许抓取/抓取的)
我可以想到一些选择:
- 设置一些流量监控解决方案来限制给定用户/IP 的请求数量。
- 与第一点相关:自动屏蔽部分用户代理
- (邪恶:))设置一个隐藏链接,当访问该链接时会注销用户并禁用他的帐户。(大概普通用户不会访问它,因为他不会看到它来点击它,但机器人会抓取所有链接。)
对于第 1 点,您是否知道已经实施的良好解决方案?有什么经验吗?一个问题是,对于非常活跃的人类用户,可能会出现一些误报。
对于第 3 点:你认为这真的很邪恶吗?或者你看到它有任何可能的问题吗?
也接受其他建议。