我公司的大多数人都使用 powercenter informatica 在数据库之间进行 Extract-Transform-Load 类型的数据移动作业。
然而,我参与的项目有一个大型的自定义 Perl 工作,其中包含一些 Java,以便很好地移动数据并触发其他一些更新。
有人说要改写东西来改用powercenter,人们在这样一个项目上的经验是什么,这有意义吗?似乎您在使用这种“现成的”解决方案时牺牲了很多灵活性,但是 ETL 工具在生产力方面给您带来了很多好处吗?
我公司的大多数人都使用 powercenter informatica 在数据库之间进行 Extract-Transform-Load 类型的数据移动作业。
然而,我参与的项目有一个大型的自定义 Perl 工作,其中包含一些 Java,以便很好地移动数据并触发其他一些更新。
有人说要改写东西来改用powercenter,人们在这样一个项目上的经验是什么,这有意义吗?似乎您在使用这种“现成的”解决方案时牺牲了很多灵活性,但是 ETL 工具在生产力方面给您带来了很多好处吗?
Informatica 非常适合运营团队。它允许非技术人员监控和重新运行作业。然而,它使任何任务都比它需要的复杂得多。这是一个巨大的软件,需要一段时间来学习,而且它在没有编程的情况下可以进行的转换受到限制。我肯定会在任何一天通过“企业 ETL”工具使用 Perl 或编程语言。
我们从 2001 年开始拥有 Informatica 和 Tibco,人们能够轻松地使用 Informatica(用于基本任务),但 Tibco 很痛苦。Tibco 现在已经消失了,Informatica 的足迹已经扩大,现在甚至业务分析师都可以查看它的代码。
熟练后,可以快速完成很多工作(我在一周内从多个来源完成了 3 个事实表和 12 个维度,用于财务和 PO 数据集市),并且在更改代码、调度、过渡到时更容易维护另一个开发人员等。更少的时间享受乐趣,更多的时间在会议和组织的文书工作上。
我们将它用于数据集市、数据移动和与 ASP 的接口。
如果您想做一些完全自定义的事情,而不是编译的 C 程序,它现在有了 Java 转换。
在您的情况下,我将转换为 Informatica 有两个原因:影响分析 (SLA) 和维护(监控、单个 ETL 工具)。可重用性是另一个优点。
特定于 informatica:影响分析是一个很好的工具:它可以防止许多紧急修复并帮助您保持 SLA。对我来说,改进 SLA 高于灵活性。Informatica 中的监控功能也非常有用。
一般来说:如果您的公司正在转向单一的 ETL 工具,那么转换该工作将使其更易于维护。支持团队监控一种工具也更加有效和可靠。希望您的公司尝试使对象可重用,这使转换更容易并提高未来的生产力(您可以在转换期间创建新的可重用对象)。
提醒一句:转换任务实际上很难估计。如果可以的话,让它成为一个独立的项目(不是更大的可交付成果的一部分)。
编码为您提供了极大的灵活性。无论是 Perl、Python、C#、Java、SQL - 随便。您可以快速轻松地构建一些数据转换。为什么有人会费心去看看 ETL 软件,对吧?
假设您已经准备好整个解决方案。您选择的语言的所有脚本都在那里。现在有几个问题:
所有这些——甚至更多——当你使用一些下降 ETL 软件时你会得到。多年来,有人一直在努力工作,以处理所有这些麻烦并获得一些 GUI。这就是区别。
现在:如果您需要一些东西来偶尔将一个文件加载到数据库中 - 任何事情都可以。但是,如果您计划拥有很多这样的 ETL 软件,则值得考虑。如果 Informatica 已经存在于您的公司中,那为什么还要费力地重新发明轮子呢?