我对如何将 BI 与数据挖掘联系起来有点困惑。BI可以被称为数据挖掘的某种表现形式吗?
Microsoft Analysis Services 等 BI 工具与 Weka 等数据挖掘工具有何不同?
我猜BI涉及更多的数据报告和分析,其中数据经过某种聚合并以多维数据集的形式表示,但数据挖掘还涉及执行聚类的不同算法,不是吗?
任何指针?
干杯
我对如何将 BI 与数据挖掘联系起来有点困惑。BI可以被称为数据挖掘的某种表现形式吗?
Microsoft Analysis Services 等 BI 工具与 Weka 等数据挖掘工具有何不同?
我猜BI涉及更多的数据报告和分析,其中数据经过某种聚合并以多维数据集的形式表示,但数据挖掘还涉及执行聚类的不同算法,不是吗?
任何指针?
干杯
BI small 正在生成详细报告(今天的销售列表)。涉及的数学很少,可能会计算行数和汇总销售额。在这里您可以看到称为“BI”的报告工具
BI 媒介正在生成一个指标(本季度的利润率)。这只是简单的代数,但由于数据量巨大,频繁生成它是一项挑战。这是立方体和 olap 的世界。
BI large 正在做数学建模。这可能是从线性回归到统计模型的任何东西,你可以命名它。这里的关键是模型使用大量数据。真正的统计学家在贬义上使用“数据挖掘”一词,因为未经训练使用统计数据的人可能会挖掘数据,直到他们发现虚假的相关性。你的数据集越大,你就越有可能找到偶然的关系,而不是现实中真的存在这样的关系。
因为 BI 的客户是业务经理,而不是博士研究生,微软等供应商。通过为我们提供黑匣子“数据挖掘”工具来简化它,其中许多与您在 SAS 等中找到的相同。
我看到将所有这些 BI 应用程序联系起来的唯一一点是,它们都在使用大量数据来做出业务决策。
要回答您的一般问题“商业智能是数据挖掘的一种表现”,实际上是相反的。
在一般定义中,BI 是使用您公司的数据来了解您的市场状况并做出决策。因此,正如 MatthewMartin 所说,它可以像 SSRS 报告一样简单,也可以像实时决策支持/人工智能系统一样复杂。
数据挖掘是 BI 的一个方面,因为数据挖掘可用于大量数据,使用实现聚类、神经网络等算法的工具进行知识发现和预测。