我正在一个包含 Spring MVC 中房地产列表的网站上工作。我想防止脚本通过抓取网站来窃取内容。有没有人有可以轻松插入spring mvc环境的技术经验?
用户代理太简单而无法规避。
我的一个想法是跟踪服务器端的两个计数器。ipaddress --> (counter xhr request, counter page request)
- 计数器页面请求通过过滤器增加
- 文档准备就绪后,计数器 xhr 请求增加
如果过滤器注意到两个计数器完全不同步,则该 ip 被阻止。
这可以工作还是有更简单的技术?
干杯
编辑
我知道,如果抓取工具是持久的,他们会找到获取内容的方法。但是,我想让它尽可能难。