我正在开发一个汇总报纸文章的网络抓取工具。我知道 AMP 协议要求使用精简版的 Javascript,而且我也知道 Javascript(部分)使网站管理员能够检测/防止抓取。所以从逻辑上讲,我认为抓取 AMP 网站会更容易。但是,另一方面,如果这是真的,我认为 StackOverflow 会在它之上,但我还没有找到一个线程来重申我的推论。我是正确的还是我忽略了什么?
问问题
252 次
我正在开发一个汇总报纸文章的网络抓取工具。我知道 AMP 协议要求使用精简版的 Javascript,而且我也知道 Javascript(部分)使网站管理员能够检测/防止抓取。所以从逻辑上讲,我认为抓取 AMP 网站会更容易。但是,另一方面,如果这是真的,我认为 StackOverflow 会在它之上,但我还没有找到一个线程来重申我的推论。我是正确的还是我忽略了什么?