3

我正处于为邮件/电子邮件/SMS 联系信息和历史构建 SQL Server DataMart 的计划阶段。每条数据都位于不同的外部系统中。因此,电子邮件地址没有帐号,短信电话号码没有电子邮件地址等。换句话说,没有共享的主键。一些数据重叠,但除了在出现重复时保留最完整的版本外,我无能为力。

是否有使用此数据构建 DataMart 的最佳实践?为每个外部键创建一个包含一列的键表是一种可接受的做法吗?然后,可以分配一个唯一的主 ID 以将其绑定到其他 DataMart 表。

寻找我可能还没有想到的方法的想法/建议。

谢谢。

4

3 回答 3

2

电子邮件地址或电话号码本身听起来像是一个合适的业务密钥。通常,“暂存”数据库用于从多个源加载数据,然后分配代理键并进行其他转换。

您熟悉数据仓库方法和设计模式吗?如果您没有以前的知识或经验,请考虑聘请一些帮助。BI / 数据仓库项目的失败率非常高,错误可能代价高昂。

于 2010-10-12T15:30:54.993 回答
1

在这里找到更多信息:

http://en.wikipedia.org/wiki/Extract,_transform,_load#Dealing_with_keys

于 2010-10-28T14:13:52.847 回答
0

好吧,没有其他信息可以将不同的部分联系在一起,您的数据集市将非常初级。您将能够获取数据类型(短信、电子邮件、邮件)、每种类型随时间推移的指标(“本周/月/季度/年,我们平均每天 42.5 条短信,每月 8000 封电子邮件!w00t !”)。只有电话号码和电子邮件地址,您的“其他数据集市”可能必须是电话公司名称或互联网域。我想您可以将其链接到某种地理信息(互联网提供商位置?),或者可能是公司的财务信息。如果您还不知道要朝哪个方向前进,那就有点模糊了。

老实说,这听起来像是高层对“数据集市”流行语的下意识反应,并听到了一些关于通信指标有多重要的信息,因此他们在链条上发送命令“让我们一些数据集市对我们所有的电子邮件进行统计!”

您需要弄清楚您或您的雇主期望从该项目中获得什么,然后弄清楚您当前收集的数据是否为您提供了跟踪该信息的线索。现在听起来你在倒退(“我有这个数据,它有什么用?”)。您目前完全有可能没有您需要的数据,这意味着您需要购买它(谁知道是否可以)或开始收集它,在这种情况下,您不会有漂亮的图表和趋势-供高层管理人员查看一段时间的线路......符合 dportas 在他的第二段中给你的警告;)

于 2010-10-14T00:24:20.163 回答