5

我在com.netflix.astyanax.connectionpool.NodeDiscoveryTypeTOKEN_AWARE的 Cassandra 的 Astyanax 客户端中找到了枚举值,并试图了解它的作用?

package com.netflix.astyanax.connectionpool;

public enum NodeDiscoveryType {
    /**
     * Discover nodes exclusively from doing a ring describe
     */
    RING_DESCRIBE,

    /**
     * Discover nodes exclusively from an external node discovery service
     */
    DISCOVERY_SERVICE,

    /**
     * Intersect ring describe and nodes from an external service. This solve
     * the multi-region ring describe problem where ring describe returns nodes
     * from other regions.
     */
    TOKEN_AWARE,

    /**
     * Use only nodes in the list of seeds
     */
    NONE
}

假设我有 24cross colo cluster个节点,其中 PHX 中有colo/datacenter12 个节点, SLC中有 12 个节点colo/datacenter

我正在使用 Astyanax 客户端连接到 Cassandra,如下所示:

private CassandraAstyanaxConnection() {
    context = new AstyanaxContext.Builder()
                .forCluster(ModelConstants.CLUSTER)
                .forKeyspace(ModelConstants.KEYSPACE)
    .withConnectionPoolConfiguration(new ConnectionPoolConfigurationImpl("MyConnectionPool")
        .setPort(9160)
        .setMaxConnsPerHost(40)
        .setSeeds("cdb03.vip.phx.host.com:9160,cdb04.vip.phx.host.com:9160")
    )
    .withAstyanaxConfiguration(new AstyanaxConfigurationImpl()      
        .setCqlVersion("3.0.0")
        .setTargetCassandraVersion("1.2")
        .setDiscoveryType(NodeDiscoveryType.TOKEN_AWARE))
    .withConnectionPoolMonitor(new CountingConnectionPoolMonitor())
    .buildKeyspace(ThriftFamilyFactory.getInstance());

    context.start();
    keyspace = context.getEntity();

    emp_cf = ColumnFamily.newColumnFamily(
        ModelConstants.COLUMN_FAMILY, 
        StringSerializer.get(), 
        StringSerializer.get());
}

谁能解释一下of和of的TOKEN_AWARE区别NodeDiscoveryTypeTOKEN_AWARE什么ConnectionPoolType

谢谢您的帮助。

更新代码

以下是我在进行更改后使用的代码 -

private CassandraAstyanaxConnection() {

    context = new AstyanaxContext.Builder()
    .forCluster(ModelConstants.CLUSTER)
    .forKeyspace(ModelConstants.KEYSPACE)
    .withConnectionPoolConfiguration(new ConnectionPoolConfigurationImpl("MyConnectionPool")
        .setPort(9160)
        .setMaxConnsPerHost(40)
        .setSeeds("cdb03.vip.phx.host.com:9160,cdb04.vip.phx.host.com:9160")
        .setLocalDatacenter("phx")
    )
    .withAstyanaxConfiguration(new AstyanaxConfigurationImpl()
        .setCqlVersion("3.0.0")
        .setTargetCassandraVersion("1.2")
        .setConnectionPoolType(ConnectionPoolType.TOKEN_AWARE))
    .withConnectionPoolMonitor(new CountingConnectionPoolMonitor())
    .buildKeyspace(ThriftFamilyFactory.getInstance());

    context.start();
    keyspace = context.getEntity();

    emp_cf = ColumnFamily.newColumnFamily(
        ModelConstants.COLUMN_FAMILY, 
        StringSerializer.get(), 
        StringSerializer.get());
}

您在示例中提到您将使用-

    .setDiscoveryType(NodeDiscoveryType.RING_DESCRIBE)
    .setConnectionPoolType(ConnectionPoolType.TOKEN_AWARE)

这两个在一起对吧?但我相信TOKEN_AWARE ConnectionPoolType默认情况下使用RING_DESCRIBE,所以再次添加它没有意义。我对吗?

如果我错了,请纠正我?

4

2 回答 2

12

当谈到“节点发现”时,NodeDiscoveryType 的 TOKEN_AWARE 和 ConnectionPoolType 的 TOKEN_AWARE 之间的关系是相互关联的,并且有些混乱。

NodeDiscoveryType 的确定方式如下(通常不是通过 setDiscoveryType()):

  • 如果您通过 setSeeds 提供了种子,并且 ConnectionPoolType 是 TOKEN_AWARE,那么NodeDiscoveryType 是 RING_DESCRIBE。
  • 如果您通过 setSeeds 提供了 Seeds,并且 ConnectionPoolType 不是 TOKEN_AWARE ,那么将使用您配置的 setDiscoveryType。 这是唯一使用您配置的 NodeDiscoveryType(通过 setDiscoveryType)的情况。
  • 如果您没有通过 setSeeds 提供种子并且 ConnectionPoolType 是 TOKEN_AWARE,那么NodeDiscoveryType 是 TOKEN_AWARE。
  • 如果您没有通过 setSeeds 提供种子,并且 ConnectionPoolType 不是 TOKEN_AWARE,那么NodeDiscoveryType 就是 DISCOVERY_SERVICE。

节点发现

现在我们已经确定了 NodeDiscoveryType 的设置方式,让我们看看它如何影响实际发现节点。节点发现归结Supplier<List<Host>>为使用 HostSupplier(即)的哪个实现。

  • 如果NodeDiscoveryType(从上面)是 DISCOVERY_SERVICE ,那么必须使用 HostSupplier(通过withHostSupplier)。
  • 如果NodeDiscoveryType(从上面)是 RING_DESCRIBE,使用 RingDescribeHostSupplier。
  • 如果NodeDiscoveryType(从上面)是 TOKEN_AWARE 并且 HostSupplier 设置(通过withHostSupplier然后使用 FilteringHostSupplier 和 RingDescribeHostSupplier。
  • 如果NodeDiscoveryType(从上面)是 TOKEN_AWARE 并且没有设置 HostSupplier,使用 RingDescribeHostSupplier。

RingDescribe 和使用本地 DC

根据您提供的配置,您最终会得到 RingDescribeHostSupplier。RingDescribeHostSupplier 允许连接到环中的所有节点,除非您指定了数据中心。因此,在使用 ConnectionPoolConfigurationImpl 设置 AstyanaxContext 时,您可能希望使用所需的 DC 设置本地数据中心。这将确保来自其他 dc 的主机不在连接池中,并且您的请求是本地的。

.withConnectionPoolConfiguration(new ConnectionPoolConfigurationImpl("MyConnectionPool")
        .setPort(9160)
        .setMaxConnsPerHost(40)
        .setLocalDatacenter("phx")
        .setSeeds("cdb03.vip.phx.host.com:9160,cdb04.vip.phx.host.com:9160")
    )

连接池类型

您可能还想将 ConnectionPoolType 设置为 TOKEN_AWARE。当该值未设置时,它将默认为 ROUND_ROBIN(使用上述节点发现工作中的节点)。TOKEN_AWARE Con​​nectionPoolType 将“跟踪哪些主机拥有哪些令牌并尝试智能地引导流量”。

除非您提供 HostSupplier,否则我会为 Astyanax 配置做类似的事情。

.withAstyanaxConfiguration(new AstyanaxConfigurationImpl()      
        .setDiscoveryType(NodeDiscoveryType.RING_DESCRIBE)
        .setConnectionPoolType(ConnectionPoolType.TOKEN_AWARE)
    )

池优化

另一个考虑因素是在 ConnectionPoolConfigurationImpl 上使用 Astyanax“延迟感知”优化池使用,但在设置上使用 YMMV。例如:

.setLatencyScoreStrategy(new SmaLatencyScoreStrategyImpl(10000,10000,100,0.50))
// The constructor takes:
//  UpdateInterval: 10000 : Will resort hosts per token partition every 10 seconds
//  ResetInterval: 10000 : Will clear the latency every 10 seconds
//  WindowSize: 100 : Uses last 100 latency samples
//  BadnessThreshold: 0.50 : Will sort hosts if a host is more than 100% 

请参阅 Astyanax配置

TLDR;

总之,将 NodeDiscoveryType 设置为 RING_DESCRIBE(如果您不使用 HostSupplier),将 ConnectionPoolType 设置为 TOKEN_AWARE。此外,使用 setLocalDatacenter 将请求保持在 dc 本地,并考虑延迟感知设置。

于 2013-05-09T22:00:44.480 回答
0

明智的实施ConnectionPoolType.TOKEN_AWARE

连接池,由拥有正在操作的令牌的主机划分连接。当令牌不可用或已知操作跨越多个令牌(例如批量变异或索引查询)时,使用循环法挑选主机池。

然而NodeDiscoveryType.TOKEN_AWARE

在多数据中心场景中重新发现环描述信息。

于 2013-05-09T06:09:17.643 回答