0

介绍

我是 GAE 的新手,写了一个小应用程序,不幸的是,尽管数据存储区中的数据不多,但它很快就达到了数据存储区每天读取的配额限制。
这个问题应该是关于布局和索引的可能使用(目前我对如何使用它们没有任何线索)。

应用程序应该做什么

  • 该应用程序应该记录纸牌游戏的分数(感兴趣的人可以使用Tichu ^^)。一场比赛由几轮组成,当一支球队达到 1000 分时结束。
  • 该应用程序应显示已玩游戏的统计信息

应用程序的第一个布局

我的第一个布局方法是使用以下实体:

class Player(db.Model):
    Name = db.StringProperty(required = True)

class Game(db.Model):
    Players = db.ListProperty(db.Key)
    Start = db.DateTimeProperty(auto_now_add = True, required = True)
    End = db.DateTimeProperty()

class Round(db.Model):
    Game = db.Reference(Game, required = True)
    RoundNumber = db.IntegerProperty(required = True)
    PointsTeamA = db.IntegerProperty(required = True)
    PointsTeamB = db.IntegerProperty(required = True)
    FinishedFirst = db.ReferenceProperty(Player, required = True)
    TichuCalls = db.ListProperty(db.Key)

正如您在上面看到的,实体已标准化(至少我希望它们是标准化的)。但是,使用这种方法可以进行简单的计算,例如

  • 什么球员赢得了最多的比赛

这可能看起来像这样

#Untested snippet just to get an idea of what I am doing here
Wins = dict.fromkeys(Player.all().fetch(None), 0)
for r in Round.all():
    wins[r.FinishedFirst] += 1

但还有其他统计数据,如

  • 哪个玩家最常先完成
  • 哪个玩家的胜率最高
  • 等等

产生非常大量的数据集读取操作。在仅显示有限数量统计数据的页面上,仅通过几次刷新就达到了一天的配额,只有 60 轮和满手的游戏。此外,使用 memcache 并没有解决这里的问题。
这导致了我的第二种方法:

应用程序的第二个布局

class Player(db.Model):
    Name = db.StringProperty(required = True)

class Game(db.Model):
    Players = db.ListProperty(db.Key)
    Start = db.DateTimeProperty(auto_now_add = True, required = True)
    End = db.DateTimeProperty()
    Rounds = db.BlobProperty()

    def GetRounds(self):
        if self.Rounds:
            return pickle.loads(self.Rounds)
        else:
            return []

    def AddRound(self, R):
        Rounds = self.GetRounds()
        Rounds.append(R)
        self.Rounds = pickle.dumps(Rounds, -1)

class Round(object):
    def __init__(self, Game, RoundNumber, PointsTeamA, PointsTeamB, FinishedFirst, TichuCalls):
        self.Game = Game
        self.RoundNumber = RoundNumber
        self.PointsTeamA = PointsTeamA
        self.PointsTeamB = PointsTeamB
        self.FinishedFirst = FinishedFirst
        self.TichuCalls = TichuCalls

现在每个都Game存储一个不再是db.Model. 这大大减少了数据集读取量。

问题

  1. 您将如何设置数据模型?BlobProperty(使用非 type 的存储对象有意义db.Model吗?)
  2. 该模型的索引如何?(请详细说明,因为我对索引的了解非常有限。)
  3. 随着数据存储中元素数量的增加,第二个方法最终也将达到每天读取的配额。在设计模型时,您将如何考虑这一事实?
4

1 回答 1

1

简短的回答 - 习惯于不“规范化”您的数据。这就是 NoSQL DBS 的美妙之处。我会在 Player 模型中添加一个列表属性或一堆整数属性(以您的应用程序更有意义的为准),跟踪他们的游戏完成情况。像这样:

class Player(db.Model):
    Name = db.StringProperty(required = True)
    FinishedFirst = db.IntegerProperty(default=0)
    FinishedSecond = db.IntegerProperty(default=0)
    ...

或者

class Player(db.Model):
    Name = db.StringProperty(required = True)
    Finishes = db.ListProperty() # A list of 1s, 2s, 3s, etc... for each finish

关键是这两个都将帮助您避免查询/使用更多资源,然后以编程方式尝试找出用户首先完成了多少次。

当您知道您将使用 A LOT 的数据时,请考虑将冗余属性存储在主模型中,以便它始终触手可及,而无需重新查询。

此外,请查看 NDB API https://developers.google.com/appengine/docs/python/ndb/properties 您可以在游戏回合中利用 JsonProperty。

归根结底,规范化是老式的 RDB 东西。

于 2013-03-07T13:35:28.013 回答