2

我正在使用DocumentClient进行查询。并使用带有 DynamoDb 的无服务器框架。

我正在尝试在不提供任何主键的情况下使用 BEGINS_WITH 进行查询。

这是我的数据的样子:

[
  {
    id: 1,
    some_string: "77281829121"
  },
  {
    id: 2,
    some_string: "7712162hgvh"
  },
  {
    id: 3,
    some_string: "7212121"
  }
]

这是我的serverless.yml[即我猜的表配置]:

Resources:
 IPRecord:
      Type: 'AWS::DynamoDB::Table'
      Properties:
        TableName: ${file(./serverless.js):Tables.IPRecord.name}
        BillingMode: PAY_PER_REQUEST
        AttributeDefinitions:
          - AttributeName: 'id'
            AttributeType: 'S'
          - AttributeName: 'some_string'
            AttributeType: 'S'
        KeySchema:
          - AttributeName: 'id'
            KeyType: 'HASH'
        GlobalSecondaryIndexes:
          - IndexName: ${file(./serverless.js):Tables.IPRecord.index.ID}
            KeySchema:
              # ...some more index goes here
              - AttributeName: 'some_string'
                KeyType: 'RANGE'
            Projection:
              ProjectionType: 'ALL'

问: 使用 DocumentClinet 我想查询some_string. 这将返回所有匹配的文档。就像在这种情况下我想查询{some_string:"77"}它会返回

 [{
    id: 1,
    some_string: "77281829121"
  },
  {
    id: 2,
    some_string: "7712162hgvh"
  }]

目前我的查询看起来像这样[这给出错误][在本地 DynamoDB JS shell 中运行]:

var params = {
    TableName: '<TABLE_NAME>',
    IndexName: '<INDEX_NAME>',
    KeyConditionExpression: 'begins_with(some_string,:value)',
    ExpressionAttributeValues: { 
      ':value': '77'
    }
};
docClient.query(params, function(err, data) {
    if (err) ppJson(err);
    else ppJson(data); 
});

似乎上面的查询需要一个主键,在我的情况下是id. 如果我通过它,那么它将指向一个文档。

这是我到目前为止所取得的成就:

var params = {
    TableName: '<TABLE_NAME>',
    FilterExpression: 'begins_with(some_string,:value)',
    ExpressionAttributeValues: { 
      ':value': '77'
    },
    Select:'COUNT' //as i only required COUNT
};
docClient.scan(params, function(err, data) {
    if (err) ppJson(err);
    else ppJson(data); 
});

上面的这个查询可以满足我的要求。但是任何更好的方法或解决方案总是受欢迎的。

4

1 回答 1

0

如果 beginwith 查询中的字符数总是随机的,我看不到使用 dynamodb 解决它的选项。

但假设至少有 3 个字符。那么您可以执行以下操作。

将您的 dynamodb 架构更新为

 IPRecord:
      Type: 'AWS::DynamoDB::Table'
      Properties:
        TableName: ${file(./serverless.js):Tables.IPRecord.name}
        BillingMode: PAY_PER_REQUEST
        AttributeDefinitions:
          - AttributeName: 'id'
            AttributeType: 'S'
          - AttributeName: 'some_string'
            AttributeType: 'S'
        KeySchema:
          - AttributeName: 'id'
            KeyType: 'HASH'
          - AttributeName: 'some_string'
            KeyType: 'RANGE'

而不是存储

[
  {
    id: 1,
    some_string: "77281829121"
  },
  {
    id: 2,
    some_string: "7712162hgvh"
  },
  {
    id: 3,
    some_string: "7212121"
  }
]

存储为

[
  {
    id: 772,
    uniqueid:1,
    some_string: "77281829121"
  },
  {
    id: 771,
    uniqueid:2,
    some_string: "7712162hgvh"
  },
  {
    id: 721,
    uniqueid:3,
    some_string: "7212121"
  }
]

其中 id 始终是原始 some_string 的前 3 个字符。

现在假设你必须查询所有以abcx你开头的项目

select * where id=abc and some_string startswith abcx

但是您应该始终尝试在 id 中包含更多字符,以便随机分布负载。例如,如果只有 2 个字符,则只有 36*36 个 id 如果有 3 个字符,则 36*36*36 个 id 是可能的。

于 2019-02-06T02:40:31.080 回答