我有两组数据需要加入,但是由于数据质量不是很好,所以还有一个额外的问题。
这两个数据集是 Calls(电话呼叫)和 Communications(关于电话呼叫创建的记录)。它们的 ID 分别称为 call_id 和 comm_id。通信记录也有 call_ids 来执行连接。问题是数据收集系统一开始就无法正常工作,而且我有大量的通信无法匹配到特定的呼叫。并非所有呼叫都会产生通信。
对于每一天,我都需要创建一个加入列表来执行一些分析。问题是由于缺少一些链接,我得到了 3 种不同的行类型:
- 只是打电话,
- 只是通讯,
- 链接通讯和通话。
我想要做的是对于给定日期的“Just Comm”行的每一行,我应该删除同一日期的“Just Call”行。我不需要通话中的任何值,我只需要知道通话发生了。如果我这样做,我将得到正确的行数,因为所有“just comms”都将删除一个“just call”行,据我所知,这是创建 comm 的调用。
我的问题是如何在 SSIS 中做到这一点。我已经到了拥有我的数据集的地步,其中包含我需要的所有数据,并且是我上面提到的 3 种行类型的混合。您如何建议我完成删除“Just Call”行的过程?