我是一名 Linux 程序员。我曾经编写代码以完成任务:java perl php c。我需要开始使用 DATA STAGE。
我所看到的是 DATA STAGE 正在处理 table/csv 样式数据并逐行执行。
我想知道 DATA STAGE 是否可以处理不是 table/csv 的文件。它可以将数据加载到数据结构中并在其上运行功能,还是仅限于一次仅在一行上工作。
感谢您提供有关 DATA SATGE 功能的任何信息
我是一名 Linux 程序员。我曾经编写代码以完成任务:java perl php c。我需要开始使用 DATA STAGE。
我所看到的是 DATA STAGE 正在处理 table/csv 样式数据并逐行执行。
我想知道 DATA STAGE 是否可以处理不是 table/csv 的文件。它可以将数据加载到数据结构中并在其上运行功能,还是仅限于一次仅在一行上工作。
感谢您提供有关 DATA SATGE 功能的任何信息
You can all times of functions , conversions , manipulate the data. mainly Datastage is used for ease of use when you handling humongous data from datamart /datawarehouse.
The main process of datastage would be ETL - Extraction Transformation Loading. If a programmer uses 100 lines of code to connect to some database here we can do it with one click. Anything can be done here even c , c++ coding in a rountine activity.
IBM (formerly Ascential) DataStage is an ETL platform that, indeed, works on data sets by applying various transformations.
This does not necessarily mean that you are constrained on applying only single line transformations (you can also aggregate, join, split etc). Also, DataStage has it's own programming language - BASIC - that allows you to modify the design of your jobs as needed.
Lastly, you are still free to call external scripts from within DataStage (either using the DSExecute function, Before Job property, After Job property or the Command stage).
Please check the IBM Information Center for a comprehensive documentation on BASIC Programming.
You could also check the DSXchange forums for DataStage specific topics.
是的,正如 Razvan 所说,您可以加入、聚合、拆分。它可以使用循环和外部脚本,也可以处理 XML。我对你的建议是,如果你有大量数据需要处理,那么 datastage 是你的朋友,否则如果你要加载的数据不是很大,那么它会更容易使用 JAVA、c 或任何您知道的编程语言。
如果您谈论的是分层文件,例如 XML 或 JSON,答案是肯定的。如果您谈论的是复杂的文件,例如由 COBOL 生成的文件,答案是肯定的。全部使用内置功能(例如分层数据阶段、复杂平面文件阶段)。查看 DataStage 调色板以查找其他示例。