很晚了,我一直在做一些关于 Web Scraping 的工作。经过一些研究和分析,我可以掌握它。但是我坚持到了某个点,即使在谷歌搜索之后我也无法找到合适的答案。我坚持的一点是,通过网络抓取,我使用登录用户和密码登录到 Intranet 页面,对于我的代码中的给定 URL,我能够获取数据,但是当 URL 更改时,我的代码无法登录,因为代码命中错误 URL 的原因。现在点击链接的代码是一种代理,它在刷新命令时点击 URL。
我想知道任何可以帮助我理解在 Web 抓取中应用人工智能的好工具或书籍。有了这个,我可以动态处理我的代理,而无需手动重新配置。任何帮助都会非常高兴。