我有这样的结构数据(网络访问者)
List(p1,p1,p1,p2,p3,p3,p4,p4,p5...)
一位访客可以访问 1 --> 多次
数据量:约1亿/天
我可以存储唯一访问者以快速访问(接近实时)的数据库怎么样?
2014-11-15 | p1 | p2 | p3 | ...| pn
我尝试通过使用这样的表来使用 Cassandra 来解决:
CREATE TABLE uniqueVisitor (
key text,
p text,
PRIMARY KEY (key, data)
)
我认为这种商店模式不是很好,因为:
由于该表的数据分区,一个key的所有数据将只存储在一个服务器中(复制因子=1)==>过多的写入请求可能会炸毁存储该key的服务器。
请建议我一个解决方案(存储模式)