8

我们处于生产应用程序面临以下套接字异常并且在此之后无法执行任何其他网络操作的情况。 

DioError [DioErrorType.DEFAULT]: SocketException: Failed host lookup: ‘xyz.abc.com’ (OS Error: nodename nor servname provided, or not known, errno = 8)

注意:反复遇到一位使用 iPhone X、iOS 14.4 的用户

我们使用Dio作为网络客户端,使用Retrofit,它在内部使用来自 dart 的 HttpClient。使用 Dio 的异常不能在模拟环境中重现,但直接使用 HttpClient,可以在 iOS 模拟器中使用以下代码重现相同的异常。

HttpClient userAgent = new HttpClient();
  bool run = true;
  while (run) {
    try {
      await userAgent.getUrl(Uri.parse('https://www.google.com'));
      print('Number of api executed');
    } catch (e) {
      print(e);
      if (e is SocketException) {
        if ((e as SocketException).osError.errorCode == 8)
          print('***** Exception Caught *****');
      }
    }
  }

一旦抛出异常,HttpClient 就无法从该陈旧状态中恢复,并且所有其他 API 请求都开始失败并出现相同的错误。

在此处输入图像描述

我们能够通过强制关闭所有先前的连接并打开一个新的 HttpClient 来从该陈旧状态中恢复。

  HttpClient userAgent = new HttpClient();
  bool run = true;
  while (run) {
    try {
      await userAgent.getUrl(Uri.parse('https://www.google.com'));
      print('Number of api executed');
    } catch (e) {
      print(e);

      if (e is SocketException) {
        if ((e as SocketException).osError.errorCode == 8)
          print('***** Exception Caught *****');
      }
      userAgent.close(force: true);
      print('Force closing previous connections');
      userAgent = HttpClient();
      print('Creating new HttpClient instance');
    }
  }

在此处输入图像描述

一个有趣的事实是在每 236 个请求之后引发异常。这可能是因为文件描述符过度使用,但 iOS 有 256 个限制。

有了稳定的互联网连接,这个问题每次都可以在 iOS 模拟器中重现。

虽然我无法重现 Dio 客户端的问题,但在生产中它正在发生。因此,我正在寻求帮助以了解此问题的根本原因,以及我们如何预防它?

任何遇到过这种情况以及如何克服它的人,请帮助我。

提前致谢。

4

2 回答 2

0

这是一个奇怪的错误。

这可能无法回答您的问题,但可能会促使我们弄清楚发生了什么。

stream代码片段(从问题中复制)将在每次.getUrl()调用时打开一个新的,并且不会关闭它们。(我假设这是故意创建套接字异常?)

HttpClient userAgent = new HttpClient();
  bool run = true;
  while (run) {
    try {
      await userAgent.getUrl(Uri.parse('https://www.google.com'));
      print('Number of api executed');
    } catch (e) {
      print(e);
      if (e is SocketException) {
        if ((e as SocketException).osError.errorCode == 8)
          print('***** Exception Caught *****');
      }
    }
  }

在某些时候,达到了(开放流的)限制。我想在你的情况下这个幻数是 236。

那么在那个时候,是你看到nodename or servname provided异常的时候吗?

(顺便说一句,我认为错误来自底层主机操作系统的 DNS 服务,尽管我不确定这是否是由于请求垃圾邮件、打开的连接数等。这可能不是相关信息.)

因此,如果您HttpClient以典型的方式使用,发出请求并关闭那些打开的流,例如:

      var request = await userAgent.getUrl(Uri.parse('http://example.com/'));
      var response = await request.close(); // ← close the stream
      var body = await response.transform(utf8.decoder).join();
      // ↑ convert results to text
      // rinse, repeat... 

...您是否仍然看到相同的nodename or servname provided错误弹出?

使用上面的“典型用法”代码,userAgent可以重复使用直到进行userAgent.close()调用(并且 HttpClient 永久关闭。再次尝试使用它会引发Bad State异常)。

我很想知道这个修改后的代码是否仍然出现节点名错误。


回复:问题的第二个代码片段。

在 catch 块中,HttpClient关闭,然后HttpClient创建一个新的。这有效地关闭了在块中打开的所有打开流try(我假设,重置打开流的限制。)

如果您调整第二个代码示例以使用:

      var req = await userAgent.getUrl(Uri.parse('https://www.google.com'));
      userAgent.close(force: true);
      userAgent = HttpClient();
      print('Number of api executed');

你能无限期地运行它吗?

于 2021-02-10T20:22:25.000 回答
0

我用这段代码解决了同样的问题:-

示例

//Add This Class
    class MyHttpOverrides extends HttpOverrides{
      @override
      HttpClient createHttpClient(SecurityContext? context){
        return super.createHttpClient(context)
          ..badCertificateCallback = (X509Certificate cert, String host, int port)=> true;
      }
    }
    
    Future<void> main() async {
      HttpOverrides.global = MyHttpOverrides();      //call here
      runApp(const MyApp());
    }
于 2022-02-12T09:16:33.920 回答