15

我们有一个 Webstart 客户端,它通过 HTTPS 使用java.net.HttpsURLConnection.

在我的本地机器和位于我们办公室的测试服务器上,一切都运行良好,但我遇到了一个非常非常奇怪的问题,它只发生在我们的生产和登台服务器上(偶尔会发生)。我所知道的这些服务器与我们办公室的服务器之间的主要区别在于它们位于其他地方并且与它们的客户端-服务器通信要慢得多,但在此之前它在生产中也能正常工作很长时间。

无论如何,这就是发生的事情:

  • 客户端在设置读取超时等选项和Content-Typeon 等属性后HttpURLConnection,调用getOutputStream()它以获取要写入的流。
  • 在这一点上,据我所知,客户端挂了一段时间。
  • 然后客户端抛出以下异常:
java.net.ConnectException:连接超时:连接
    在 java.net.PlainSocketImpl.socketConnect(本机方法)
    在 java.net.PlainSocketImpl.doConnect(未知来源)
    在 java.net.PlainSocketImpl.connectToAddress(未知来源)
    在 java.net.PlainSocketImpl.connect(未知来源)
    在 java.net.SocksSocketImpl.connect(未知来源)
    在 java.net.Socket.connect(未知来源)
    在 com.sun.net.ssl.internal.ssl.SSLSocketImpl.connect(未知来源)
    在 com.sun.net.ssl.internal.ssl.BaseSSLSocketImpl.connect(未知来源)
    在 sun.net.NetworkClient.doConnect(未知来源)
    在 sun.net.www.http.HttpClient.openServer(未知来源)
    在 sun.net.www.http.HttpClient.openServer(未知来源)
    在 sun.net.www.protocol.https.HttpsClient.(未知来源)
    在 sun.net.www.protocol.https.HttpsClient.New(未知来源)
    在 sun.net.www.protocol.https.AbstractDelegateHttpsURLConnection.getNewHttpClient(未知来源)
    在 sun.net.www.protocol.http.HttpURLConnection.plainConnect(未知来源)
    在 sun.net.www.protocol.https.AbstractDelegateHttpsURLConnection.connect(未知来源)
    在 sun.net.www.protocol.http.HttpURLConnection.getOutputStream(未知来源)
    在 sun.net.www.protocol.https.HttpsURLConnectionImpl.getOutputStream(未知来源)

请注意,这不是 a ,如果在建立连接之前超时到期SocketTimeoutException,该connect()方法会抛出它。HttpURLConnection此外,当这种情况发生时,我可以拨打电话conn.getResponseCode()并收到 200 的响应代码。

  • 在服务器端,EOFException在 的构造函数中抛出an ObjectInputStream,它尝试读取序列化标头但失败,因为客户端永远无法OutputStream写入。

如果它有帮助,这里是在调用HttpsURLConnection之前进行的调用getOutputStream()(编辑以仅显示正在进行的调用,而不是执行此操作的代码的整个结构):

HttpsURLConnection conn = (HttpsURLConnection) url.openConnection();
conn.setUseCaches(false);
conn.setReadTimeout(30000);
conn.setRequestProperty("Cookie", cookie);
conn.setDoOutput(true);
conn.setRequestProperty("Content-Type", "application/x-java-serialized-object");
conn.getOutputStream();

问题是,我不知道这一切是如何发生的,特别是考虑到它只是偶尔发生(我无法分辨出明确的活动模式),即使这样也只有在客户端和客户端之间存在(相对)高延迟时服务器。

鉴于到目前为止我能够找到的内容java.net.ConnectException: Connect timed out,我想知道这是否不是我们的服务器正在运行的网络上的一些网络或防火墙问题......但考虑到请求,这对我来说没有多大意义显然是通过 servlet。此外,在同一网络上运行的其他应用程序也没有报告类似的问题。

有谁知道这可能是什么原因,甚至我应该调查什么?

4

2 回答 2

13

我们在与您类似的情况下遇到过这些。通常在高负载下并且不容易在测试中重现。尚未修复它,但这是我们经历的步骤。

如果是防火墙问题,我们会收到 Connection Refused 或 SocketTimeout 异常。

1) 您是否能够在服务器上的访问日志中跟踪这些请求 - 它们是否显示 HTTP 状态 200 或 404 或其他?在我们的例子中,服务器(在这种情况下是 IIS)日志显示客户端关闭了连接,而不是服务器。所以这是一个谜。

更新:如果客户端总是得到 200,那么服务器实际上已经发回了一些响应,但我怀疑响应字节大小(如果这记录在访问日志中)将显示与正常响应大小不同的值那个请求。

如果它显示相同大小的响应,那么您有一个(可能不合理)条件,即服务器实际上正确响应但客户端没有得到响应,因为连接在两者之间的某个地方终止。

2) 网络管理员团队查看 TCP/IP 流量以确定哪一端(或中间路由器)正在终止 HTTP/TCP-IP 会话。一旦我们了解终止连接的一端就是看看为什么。有足够知识的人可以运行snoop

3)服务器上是否配置/限制了最大请求数 - 这是否会限制您的连接?

4) 是否有任何中间负载均衡器可以丢弃请求?

更新:我们想要但未完成的另一件事是在客户端和服务器之间创建一个静态路由,以减少它们之间的跳数并确保没有与网络相关的连接丢失。见http://en.wikipedia.org/wiki/Static_routing

5)另一个建议是也设置ConnectTimeout以查看这些是否具有更高的值。 更新:您可能想尝试conn.getErrorStream()

如果连接失败但服务器仍然发送了有用的数据,则返回错误流。如果连接未连接,或者服务器在连接时没有错误,或者服务器有错误但没有发送错误数据,则此方法将返回 null。

6) 也可以尝试在服务器上每隔 5 秒进行一组线程转储,以查看是否有任何线程在服务器上显示这些传入请求。

更新:截至今天,我们学会了解决这个问题,因为在每天 400,000 个请求中,我们总计失败率为 200-300,即 0.00075 %

于 2010-10-07T07:57:23.480 回答
0

在我们的服务器上使用它时,我们也会遇到零星的超时。我们可以通过两件事来解决它:

  1. 通过使用特定的 ContentLength setFixedLengthStreamingMode(将错误率从 ~150 降低到 10)
  2. 如果发生超时重试(错误率从 10 到 0。最多重试一次后,一切都通过了)

伪代码:

//set timeouts to 6s
try{
 //open connection here and write etc.
 //use a timeout of 6s (since retry is in place)
} 
catch (java.io.InterruptedIOException e) {
 //read- or connection time out try again                 
} 

发生这种情况的另一个理论可能如下:

在 HttpURLConnection/HttpsURLConnection 的文档中,可以阅读以下内容:

每个 HttpURLConnection 实例用于发出单个请求,但到 HTTP 服务器的底层网络连接可能会被其他实例透明地共享。

所以现在close()只调用就可以了,但调用disconnect()也会终止其他用户的套接字/透明共享连接,然后在达到超时期限后运行到 SocketTimeOut。

于 2020-04-09T16:05:53.757 回答