假设我有以下数据:
OrderNumber | CustomerName | CustomerAddress | CustomerCode
1 | Chris | 1234 Test Drive | 123
2 | Chris | 1234 Test Drive | 123
如何检测“CustomerName”、“CustomerAddress”和“CustomerCode”列是否完全相关?我认为 Sql Server 数据挖掘可能是适合这项工作的工具,但我对此没有太多经验。
提前致谢。
更新:
通过“相关”,我的意思是在统计意义上,只要 a 列是 x,b 列就会是 y。在上述数据中,最后三列相互关联,而第一列不相关。
操作的输入将是表的名称,输出将类似于:
Column 1 | Column 2 | Certainty
CustomerName | CustomerAddress | 100%
CustomerAddress | CustomerCode | 100%