我们有一个名为 user_preferences 的表。它们是名称值对,每个用户都可以自定义定义任意数量的偏好。我们想要在我们的数据仓库/数据集市中提供关于这些偏好的报告,就好像它们是维度一样。例如,用户偏好可以是性别、位置等。我们希望找到男性用户在特定时间范围内执行的操作数量。
人们通常如何做到这一点?在不爆炸他们的数据集市的情况下。
我们有一个名为 user_preferences 的表。它们是名称值对,每个用户都可以自定义定义任意数量的偏好。我们想要在我们的数据仓库/数据集市中提供关于这些偏好的报告,就好像它们是维度一样。例如,用户偏好可以是性别、位置等。我们希望找到男性用户在特定时间范围内执行的操作数量。
人们通常如何做到这一点?在不爆炸他们的数据集市的情况下。
这就是所谓的实体-属性-值数据模型,也称为“每个人都发明它,使用它一次,然后再也不使用它”的数据模型。
不应该使用它的原因有很多,并且应该使用它的一些极端情况。但是,假设您无法将模型更改为更好的模型,那么我对这个 SO 问题的回答应该足以满足您的情况。