我正在尝试构建一个 java 应用程序来使用 HTMLUnit 抓取网站。提取一些数据后,应用程序遇到以下异常 - java.lang.RuntimeException: org.apache.http.conn.HttpHostConnectException: Connection to siteURL denied。
如果我再次运行应用程序,它能够在失败之前再次提取一些数据并出现相同的异常。服务器可能会看到来自同一客户端 IP 的大量请求并拒绝连接请求。
此外,当应用程序遇到此问题时,我可以使用浏览器连接到该站点。
我该如何克服这个问题?在网络抓取应用程序中,如何处理和解决此类问题?