我有用户模型对象,其中包含很少的字段(属性,如果您愿意)。说“名字”、“姓氏”、“城市”和“出生年份”。每个用户还获得“唯一 ID”。
我希望能够通过他们进行搜索。我该如何正确地做到这一点?如何做到这一点?
我的理解(几乎适用于任何键值存储——首先是键,然后是值)
u:123456789 = serialized_json_object
(“u”作为用户密钥的简单前缀,123456789 是“唯一 id”)。
现在,考虑到我希望能够按名字和姓氏进行搜索,我可以保存在:
f:Steve = u:384734807,u:2398248764,u:23276263 f:Alex = u:12324355,u:121324334
所以键是“f”——这是名字的前缀,而“Steve”是实际的名字。对于“u:Steve”,我们将所有属于“Steve”的用户 ID 保存为值。
这使得每次搜索都非常非常容易。按少数字段(属性)查询——比如按名字(即“Steve”)和姓氏(即“l:Anything”)仍然很容易——首先从“f:Steve”获取用户 ID 列表,然后从“l :Anything",找到交叉的用户 ID,然后就可以了。
问题(而且有很多):
保存、更新、删除用户很痛苦。它必须是原子的和一致的操作。此外,如果我们将价值大小限制在某个值上——那么我们就有(潜在的)麻烦。这里真的没有答案。只压缩用户 ID 列表?不过也不算太酷。
我们要添加新字段以进行搜索的 id。最终。用“城市”说。我们当然可以这样做 "c:Los Angeles" = ..., "c:Chicago" = ...,但是如果我们一开始就没有预见到所有这些“搜索选择”,那么我们将有能够通过所有现有的用户记录创建一些夜间工作或其他东西并为他们更新那些“c:CITY”......相当大的工作!
锁定问题。用户“u:123”更新了他的名字“Alex”,用户“u:456”更新了他的名字“Alex”。他们都必须用他们的 id 更新“f:Alex”。这意味着要么我们遇到覆盖问题,要么一个更新将等待另一个更新(如果有很多更新,还有成像?!)。
这样做的最佳方法是什么?请记住,我想按多个字段进行搜索?
PS 请,问题是关于 HBase/Cassandra/NoSQL/Key-Value 存储。请 - 不建议使用 MySQL 和“阅读”SELECT;并担心“以后”的扩展问题。我完全按照我的方式问我的问题是有原因的。:-)