12

我们最近将 Web 应用程序升级到 MongoDB C# Driver 2.0 并部署到生产环境。在一定的负载下,应用程序运行良好。一旦生产服务器上的负载超过一定限制,应用程序的 CPU 会立即下降到 0,大约 30 秒后,会多次记录此异常:

System.TimeoutException message: A timeout occured after 30000ms selecting a server using CompositeServerSelector{ Selectors = ReadPreferenceServerSelector{ ReadPreference = { Mode = Primary, TagSets = System.Collections.Generic.List`1[MongoDB.Driver.TagSet] } }, LatencyLimitingServerSelector{ AllowedLatencyRange = 00:00:00.0150000 } }. Client view of cluster state is { ClusterId : "1", Type : "Standalone", State : "Disconnected", Servers : [{ ServerId: "{ ClusterId : 1, EndPoint : "Unspecified/10.4.0.113:27017" }", EndPoint: "Unspecified/10.4.0.113:27017", State: "Disconnected", Type: "Unknown" }] }.
stack trace:
at MongoDB.Driver.Core.Clusters.Cluster.ThrowTimeoutException(IServerSelector selector, ClusterDescription description)
at MongoDB.Driver.Core.Clusters.Cluster.<WaitForDescriptionChangedAsync>d__18.MoveNext()
--- End of stack trace

我们正在使用一个单例 MongoClient 对象,它是这样启动的:

private static object _syncRoot = new object();

private static MongoClient _client;
private static IMongoDatabase _database;

private IMongoDatabase GetDatabase()
{
    ...

    if (_client == null)
    {
        lock (_syncRoot)
        {
            if (_client == null)
            {
                _client = new MongoClient(
                    new MongoClientSettings
                    {
                        Server = new MongoServerAddress(host, port),
                        Credentials = new[] { credentials },
                    });

                _database = _client.GetDatabase("proddb");
                return _database;
            }
        }
    }
    return _database;
}

public IMongoCollection<T> GetCollection<T>(string name)
{
    return GetDatabase().GetCollection<T>(name);
}

对数据库的典型调用如下所示:

public async Task<MongoItem> GetById(string id)
{
    var collection = _connectionManager.GetCollection<MongoItem>("items");
    var fdb = new FilterDefinitionBuilder<MongoItem>();
    var f = fdb.Eq(mi => mi.Id, id);
    return await collection.Find(f).FirstOrDefaultAsync();
}

我们如何才能发现原因并解决此问题?

4

4 回答 4

6

这篇文章可能会有所帮助:

我想到了。这张 JIRA 票有详细信息。

实际上,我们已经区分了连接到独立服务器和直接连接到副本集成员,后者相对不常见。不幸的是,MongoLab 的单节点设置实际上是一个单节点副本集,这导致我们不信任它。您可以通过附加 ?connect=replicaSet到连接字符串来解决此问题。它将强制驱动程序进入副本集模式,一切都会正常工作。

鉴于此,我们将重新考虑CSHARP-1160 。?connect=replicaSet非常感谢您的报告,如果附加到您的连接字符串不起作用,请告诉我。

于 2015-08-21T08:20:07.960 回答
2

此问题与CSHARP-1435CSHARP-1515CSHARP-1538错误报告有关,并且很可能已在最近的 C# MongoDB 驱动程序中修复。

此问题可能与读取的文档数量超过一个批次中返回的文档数量有关。资源

所以可能的解决方案是:

  • 确保您的 MongoDB 已启动并正在运行。资源
  • 检查 MongoDB 日志以获取任何其他详细信息。
  • 如果连接到mongod进程组(请参阅:复制),请添加?connect=replicaSet到您的连接字符串。例如:

    mongodb://db1.example.net:27017,db2.example.net:2500/?replicaSet=test&connectTimeoutMS=300000
    

    示例ConnectionStrings.config文件:

    <connectionStrings>
          <add name="MongoDB" connectionString="mongodb://10.0.80.231:27017,10.0.108.31:27017/?replicaSet=groupname&amp;connectTimeoutMS=600000&amp;socketTimeoutMS=600000" />
          <add name="RedisCache" connectionString="www-redis.foo.cache.amazonaws.com:6379" />
          <add name="SqlConnection" connectionString="server=api.foo.eu-west-1.rds.amazonaws.com;database=foo;uid=sqlvpc;pwd=somepass;" providerName="System.Data.SqlClient"  />
    </connectionStrings>
    

    相关:CSHARP-1160如何在连接字符串中包含 & 符号?

    如果上述方法不起作用,请检查:C# MongoDB Driver Ignores timeout options

  • MongoDB.Driver尝试按照上述错误报告进行升级。

  • 尝试增加连接和套接字超时。

    通过附加?connectTimeoutMS=60000&socketTimeoutMS=60000到您的连接字符串。请参阅:mongoDB 连接字符串选项

    或者更改代码中的设置(例如、connecttimeoutmaxpoolsize)。请参阅此处的示例waitQueueSizewaitQueueTimeout

  • 检查连接字符串是否正确包含数据库。资源
  • 在快速调用 MongoDB 的情况下增加每个查询之间的延迟。资源

另请检查MongoDB C#/.NET 驱动程序的 MongoDB 兼容性

C#/.NET 驱动版本,MongoDB C#/.NET 驱动兼容性

于 2017-10-16T16:27:21.840 回答
2

我在使用驱动程序 v2.2.4 时遇到了同样的问题。升级到v2.3.0后,问题似乎已经解决了

于 2016-11-09T10:17:43.273 回答
0

当我在 MongoLab 中使用免费(2.6 版)沙箱时,我遇到了同样的问题,当我开始使用付费集群时,超时问题就消失了。

我要说我认为问题是只支持 MongoDB 3.0+ 版本(因为我发现一些文档说得一样多,我发誓我通过 MongoLab 完成了 3.0 升级过程),但是当我去搜索文档中,它现在说支持 2.6,而我付费的 MongoLab DB 仍然说它是 2.6.9 版本。

我想我一定快疯了,但至少我的代码现在可以工作了!

于 2015-08-06T00:19:48.630 回答