9

我是 DynamoDB 的新手,我有一大堆问题:我的表应该是什么样子。

我已经阅读了这里的帖子:(推荐给尚未阅读的人) http://docs.amazonwebservices.com/amazondynamodb/latest/developerguide/BestPractices.html

现在我有一些困境,我认为每个开始使用 DynamoDB 的人都会遇到。

首先,我的表:学生、团队、项目

学生身份证,年龄...

团队: id , student-1-id, student-2-id, current-project, prev-project, last-updated-on

PROJECTS : id , team-id, 问题列表, student1answers 列表, student2answers 列表

一些评论:

  1. 如您所见,我不使用范围键。我需要吗?.
  2. 每个答案都是(问题数量、文本、插入日期)的 json
  3. 每个学生都可以在多个团队中。

我的困境:

  1. 我想获取在特定日期之后更新的特定学生的所有团队。

现在我正在使用 2 次扫描操作:一次搜索 student1,第二次搜索 student2。

       **Is there a better way ?**

我考虑过添加一个新表: user-Battles: student-id, team-id 这样我就可以查询特定学生的团队,然后对所有团队进行批处理,但是最后一次更新呢?我怎样才能在 batch_get_item 中通过这个查询?

  1. 当一个项目结束时,我不再使用它。旧物品怎么办?删除 ?把它们移到另一张桌子上?

  2. 在项目表中,可以更新的属性是答案属性,所以我想将它们移到另一个表中进行表演。

如果只更新两次,我真的需要移动它们吗?(当学生 1 发送答案和学生 2 发送答案时 - 然后项目是旧的)

*如果我为答案创建一个新表,我将不必以 JSON 格式存储它们

你会如何设计桌子?请告诉我。

4

1 回答 1

3

有很多细节的好问题:)

如果我只有一个建议,那就是:

请记住,对于 NoSQL,它不仅可以而且正常,甚至建议对数据进行反规范化。

这就是说,对于您的“困境”,您的建议非常好。您应该将日期反规范化为range_key. 一种方法是添加这样的表:

  • hash_key: 学生
  • range_key: 日期
  • team:team_id

但是,这并不完美,因为表格会继续增长。每次更新都会插入一个新对象。实际上,无法编辑密钥。您必须自己编写清洁代码。

在 DynamoDB 中,您不必担心“旧”项(扫描除外)导致性能下降,这是 DynamoDB 的主要优势。尽管如此,这始终是保持数据清洁但保持一致的好习惯。如果您开始移动过期的项目,请移动所有项目,否则您最终将不知道您的数据在哪里。

最后一个建议:您确定“ids”是描述您的对象的最佳方式吗?大多数情况下,名称、日期或任何唯一属性都是更好的键。

于 2012-10-05T18:41:40.067 回答