9

昨天我和一位同事讨论了他使用 SSIS(或类似的东西)用 SSIS 包做一些非常酷的事情的情况,他通过了一个名字,比如“雷金纳德·威廉姆斯博士”。并且基于一些加权方案,系统足够聪明,可以弄清楚如何对其进行标记并将其存储在数据库中作为“Salutation-First Name-Last Name-Suffix”。他抛出了一些流行词,比如 BI、SSIS、ETL 和数据挖掘。我真的很想了解更多信息,但我什至不知道从哪里开始询问。

我是一名 .Net 开发人员,精通 C#、Vb.Net、WPF 等...,但我不知道这些技术是什么,如何将它们添加到我的技能中,以及它是否是我真的应该专注于。任何方向都会有所帮助。

4

3 回答 3

21

SSIS == SQL Server Integration Services,它是一个提取转换和加载 (ETL) 工具,它是 SQL7、SQL2K 时代的数据转换服务或 DTS 的卓越实现。它是表达工作流过程的绝佳工具,其中数据从 A 点移动到 B 点(以及 c 和 d 等)并通过该过程进行更改,例如整合到非规范化设计或数据清理。

BI 或商业智能是科技界整个类别的绰号,它是现在的好地方。BI 技能非常有价值且很难获得,原因之一是很难在实验室中重新创建真正的 BI 案例,因此教学几乎总是在真实世界的情况下进行。

从高层次上看,BI 项目通常涉及报告的终点。通常,作为开发人员,我们习惯于编写事务性报告,例如 PO 的详细信息,但 BI 可以进入涵盖数十年产品销售趋势并处理数亿条记录的非常广泛的报告。我们为应用程序设计数据库的方式对于这种报告并不理想,因此发明了其他工具和技术并在 BI 空间中使用。这些就是您经常听到的称为 OLAP 多维数据集的多维数据集。OLAP 多维数据集通常源自一个数据仓库,该数据仓库只不过是另一个数据库——但典型的仓库包含来自多个(通常是几十个)其他应用程序数据库的数据。您的库存应用程序、采购应用程序、HR 应用程序和一大堆其他应用程序都包含创建业务完整图景的点点滴滴的数据,BI 架构师将使用 SSIS 之类的工具从所有这些系统中提取数据,对其进行处理并将其存储在数据仓库中它采用不同类型的设计来更好地进行报告。一旦数据进入仓库,他将使用分析服务在该数据上创建多维数据集,并使用 Reporting Services 之类的工具向您显示有关该数据的报告。

编辑:抱歉,忘记了数据挖掘,它是另一个描述和概念或过程的非特定术语,而不是工具。在一个简单的例子中,它是一种识别数据模式的有条不紊的方法。过去,一个好的业务分析会通过数据查看趋势,但是对于现代数据库,您所谈论的数据集太大而无法手动梳理 - 数据挖掘允许您指示计算机梳理这些数据并识别感兴趣的模式.

希望有帮助

于 2009-01-06T14:09:41.223 回答
3

您的同事所做的可能更好地描述为字符串的“智能解析”。这可以在许多复杂级别上完成——例如,使用统计模型给你“博士”的可能性。是称呼而不是名字。或者它可以只使用常见称呼的简单查找列表,在这种情况下,它只是常规的程序代码,仅此而已。

SSIS 是 SQL Server 集成服务的缩写。它基本上是类固醇上的DTS ;有些人喜欢它,有些人讨厌它。单独使用它来做你正在谈论的那种事情会很棘手;它主要只是用于从各种来源获取数据并将其组合,转换并将其加载到其他地方。它可以做一些漂亮的事情,其中​​许多往往是数据挖掘之类的,但最终它是一种用于在一个方向或另一个方向填充数据的生产工具。它在数据挖掘社区中并不是特别受尊重。

数据挖掘是一门完整的学科,专注于使用一些(通常是大量的)数据来预测未来的答案或更好地理解现有数据中的模式。这绝对是一个很好的领域,但如果没有对数学和算法的深入研究,你就不能随便学。这本是一本关于这个主题的好书。

“商业智能”实际上更像是一个流行词,而不是一种特定的技术,对不同的人来说可能意味着不同的东西。从根本上说,这个想法建议对业务数据做一些不那么愚蠢的事情,通常它指的是随着时间的推移分析趋势,通常使用 OLAP。它可能还包括数据挖掘或人工智能算法,但由于没有严格的定义,几乎任何想卖给你东西的人都会告诉你它提供“商业智能”,并希望你不要进一步挖掘。

于 2009-01-06T14:13:58.140 回答
2

SSIS 是SQL Server 集成服务,可用于执行 ETL(提取、转换和加载),这是许多数据仓库/商业智能解决方案的前端,这些解决方案将数据集成到易于使用的维度模型中。SSIS 对于较小的项目也很有用,它是一种从其他存储库或文件加载旧数据或数据的便捷方式。

数据挖掘通常意味着使用来自集成源的数据来推断交易数据中不明显的信息(通过集成多个源为数据提供更多“维度”。

BI 是一个很大的话题,所以除非你想进入那个领域,否则它可能不是值得关注的东西,但是 SSIS 在较小的项目中很有用,无论如何都值得学习。

于 2009-01-06T14:05:31.247 回答