3

我公司的大多数人都使用 powercenter informatica 在数据库之间进行 Extract-Transform-Load 类型的数据移动作业。

然而,我参与的项目有一个大型的自定义 Perl 工作,其中包含一些 Java,以便很好地移动数据并触发其他一些更新。

有人说要改写东西来改用powercenter,人们在这样一个项目上的经验是什么,这有意义吗?似乎您在使用这种“现成的”解决方案时牺牲了很多灵活性,但是 ETL 工具在生产力方面给您带来了很多好处吗?

4

5 回答 5

7

Informatica 非常适合运营团队。它允许非技术人员监控和重新运行作业。然而,它使任何任务都比它需要的复杂得多。这是一个巨大的软件,需要一段时间来学习,而且它在没有编程的情况下可以进行的转换受到限制。我肯定会在任何一天通过“企业 ETL”工具使用 Perl 或编程语言。

于 2009-08-06T00:07:57.380 回答
4

我们从 2001 年开始拥有 Informatica 和 Tibco,人们能够轻松地使用 Informatica(用于基本任务),但 Tibco 很痛苦。Tibco 现在已经消失了,Informatica 的足迹已经扩大,现在甚至业务分析师都可以查看它的代码。

熟练后,可以快速完成很多工作(我在一周内从多个来源完成了 3 个事实表和 12 个维度,用于财务和 PO 数据集市),并且在更改代码、调度、过渡到时更容易维护另一个开发人员等。更少的时间享受乐趣,更多的时间在会议和组织的文书工作上。

我们将它用于数据集市、数据移动和与 ASP 的接口。

如果您想做一些完全自定义的事情,而不是编译的 C 程序,它现在有了 Java 转换。

于 2009-09-01T00:00:12.300 回答
2

在您的情况下,我将转换为 Informatica 有两个原因:影响分析 (SLA) 和维护(监控、单个 ETL 工具)。可重用性是另一个优点。

特定于 informatica:影响分析是一个很好的工具:它可以防止许多紧急修复并帮助您保持 SLA。对我来说,改进 SLA 高于灵活性。Informatica 中的监控功能也非常有用。

一般来说:如果您的公司正在转向单一的 ETL 工具,那么转换该工作将使其更易于维护。支持团队监控一种工具也更加有效和可靠。希望您的公司尝试使对象可重用,这使转换更容易并提高未来的生产力(您可以在转换期间创建新的可重用对象)。

提醒一句:转换任务实际上很难估计。如果可以的话,让它成为一个独立的项目(不是更大的可交付成果的一部分)。

于 2010-02-26T17:48:59.057 回答
1

如果你的人不会编码,像 Informatica 这样的 ETL 工具可以为你带来生产力(和漂亮的图片)。如果没有人可以维护代码,这是有道理的。对于会编程的人来说,这就像雇佣一只 500 磅重的大猩猩来移动一座鼹鼠山。

另见:这篇文章这个帖子中的这篇文章

这对于自动作业日志记录(您不必考虑要记录什么......这一切都为您完成)和运行时监控工具(我的工作流程有多远,以及在哪里它失败了吗?)。

于 2009-07-29T21:34:01.590 回答
1

编码为您提供了极大的灵活性。无论是 Perl、Python、C#、Java、SQL - 随便。您可以快速轻松地构建一些数据转换。为什么有人会费心去看看 ETL 软件,对吧?

假设您已经准备好整个解决方案。您选择的语言的所有脚本都在那里。现在有几个问题:

  • 如果数据量增加并且您无法将所有内容都放入内存中,那么缓存在哪里创建?你能控制它吗?
  • 您如何创建所有日志?你创造了那个吗?
  • 错误处理呢?如果出现错误(例如磁盘空间问题、连接问题等),是否容易指出根本原因?
  • 你是怎么做监控的?有动态仪表盘吗?
  • 您的解决方案可以进行集群吗?
  • 是否可以在多个线程中运行一些数据转换,以使其运行得更快?
  • 故障转移:您如何处理故障?是否可以从故障点重新启动作业?
  • 连接性:出现了一个新的数据源——比如 Salesforce——你需要多长时间来增强脚本以读取/写入它?
  • 您可以连接到 SAP 等 ERP 系统吗?
  • 你能从脚本中得到数据沿袭和影响分析吗?

所有这些——甚至更多——当你使用一些下降 ETL 软件时你会得到。多年来,有人一直在努力工作,以处理所有这些麻烦并获得一些 GUI。这就是区别。

现在:如果您需要一些东西来偶尔将一个文件加载到数据库中 - 任何事情都可以。但是,如果您计划拥有很多这样的 ETL 软件,则值得考虑。如果 Informatica 已经存在于您的公司中,那为什么还要费力地重新发明轮子呢?

于 2016-09-16T13:40:04.000 回答