4

我的客户希望我使用 Alteryx 实施 ETL 流程,因为他们拥有它的许可证。我很困惑 Alteryx 是否是 ETL 工具。我相信 Alteryx 是常用的 Tableau 数据可视化工具准备数据。

请告知它是否是ETL工具?它与 SSIS 有何不同?

谢谢,

4

5 回答 5

9

Alteryx 是一个数据准备/高级分析应用程序。由于它允许数据准备、空间分析和预测,人们以许多不同的方式使用它。

我与许多选择使用 Alteryx 纯粹是因为其 ETL 功能将数据从一个数据库移动到另一个数据库的客户合作,例如,我曾与一个使用 Alteryx 自动从 MySQL 加载到他们的 Amazon Redshift 数据库的客户合作,另一个正在使用SQL -> Tableau 数据引擎,以及许多其他涉及一系列数据输入的示例(Alteryx 支持从自定义 API 到 Excel 的所有内容)。

如果您已经在使用 SSIS,那么说实话,您会发现 Alteryx 呼吸新鲜空气,我在过去的生活中与 SSIS 合作,并且发现 Alteryx 的开发速度要快得多。它对数据的更改更加宽容,并允许更紧密地集成许多不同的数据源。新的数据库内工具提供了与 SQL 更紧密的集成,这在以前是可能的,允许在数据库内完成工作。

最后,与 SSIS 相比,我认为您会发现 Alteryx 非常易于学习。他们网站上的在线培训视频将为您提供尽可能多的介绍。

享受吧,我想你会喜欢这种体验的。

克里斯

于 2015-05-26T19:00:21.203 回答
5

只要您有 Alteryx 服务器,Alteryx 就可以用于 ETL。我已经将它用于许多用例,尤其是在云和数据库之间。

在我个人看来,它明显优于 SSIS 的一些事情:

  • 如果输入具有列名(来自数据库或来自带有标题的 csv 文件),它会自动处理意外的新列或列顺序更改,而根本不需要您更改流。
  • 您可以将流构建为“宏”,然后您可以完全独立于源/目标数据库进行单元测试(在 SSIS 中尝试..)
  • 能够在流程中的任何位置放置浏览工具并进行有效调试。
  • 使用“测试”工具构建断言。

流可以从服务器上的命令行运行,我发现的最简单的方法(除了使用 Alteryx 自己的调度程序)是保存为“应用程序”,然后使用 Alteryx 引擎可执行文件从命令行运行,通过它传递参数xml 文件。您可以通过点击魔术棒按钮(在将流程保存为 .yxwz(应用程序)之后)从流程中保存示例 xml 参数文件。这会打开一个面板,让您设置变量,并且该面板有一个方便的“保存" 按钮生成正确格式的 xml 文件。

在流程本身中,通过操作工具或模块级参数 (User.*) 对环境设置等进行参数化 - 例如,您可以在字段中使用 %User.[Your variable name]% 在输入上设置数据库服务器。

错误日志通常非常好(识别失败的工具,有用的错误消息),并且命令行会抛出有用的错误级别数字,因此使用某些第三方调度程序(或仅使用 Alteryx 服务器自己的调度程序)进行调度非常简单。

显然,如果您需要进行任何严肃的数据操作、旋转等,那么它就是我使用过的最简单的工具。

于 2015-05-26T22:14:11.993 回答
1

是的,Alteryx 是一个 ETL 和数据整理工具,但它比纯 ETL 做得更多。Alteryx 将预烘焙的连接(Experian / Tableau 等)选项与一系列嵌入式功能(如数据挖掘、地理空间、数据清理)结合起来,在一个产品中提供一套工具。

如果您正在寻找的只是基本的 a->b ETL 映射,并且您不需要 Alteryx 具有的附加功能,那么像 SSIS 这样更便宜的产品往往就绰绰有余了。

于 2015-05-26T09:54:05.560 回答
0

Alteryx 是一个数据挖掘工作台,ETL 通常是数据挖掘过程的重要组成部分。Alteryx 有很多 ETL 工具/功能,还有更多。我已经很久没有使用过 SSIS 了,当然自从收购 Alteryx 之后就没有了。

凯特

于 2015-05-26T20:22:29.383 回答
0

Alteryx 具有三个基本功能 ETL、高级分析和报告。

我最喜欢的部分是高级分析,但 ETL 也在那里。所以,我认为它是一个完整的分析工具,从 ETL 到报告。我曾经将它与存储在磁带中的数据连接起来。

于 2016-05-06T06:58:25.447 回答