2

要求是,源文件结构将每天/动态更改。我们如何在 Informatica 中实现可以:

例如,

让我们考虑源是一个具有不同格式的平面文件,例如带有标题,没有标题,不同的元数据(今天的文件有 4 列,明天有 7 个不同的列,后天没有标题,另一个文件中有记录数的文件)

我需要在一个 informatica 云映射中使用所有动态更改的文件。你能帮我解决这个问题吗?

4

2 回答 2

0

总结一下我对这个问题的理解:

  1. 您有随机数量的文件格式
  2. 您事先不知道文件格式
  3. 这些文件不包含确定其格式的必要信息。

如果这是正确的,那么我认为这在 Informatica 或任何其他工具、编码语言等中都不是可解决的问题。您没有足够的信息来定义解决方案。

唯一的解决方案是更改源文件。可能性包括:

  • 一种标准格式(或少数标准格式之一,文件中包含允许您以编程方式确定正在使用的格式的信息)
  • 自记录文件类型,例如 JSON
于 2020-09-11T09:41:12.263 回答
0

这是一个棘手的情况。我知道这不是一个完美的解决方案,但这是我的想法
- 创建一个源文件结构,其中包含最大数量的文本类型列,比如 50。读取文件,应用过滤器来清理标题数据等。然后使用路由器根据文件处理文件结构 - 可能是文件名可以给你一个提示它包含什么。一旦您确定了文件的类型,根据其数据类型处理、转换列并加载到正确的目标中。
映射看起来像 Source -> SQ -> EXP -> FIL -> RTR -> TGT1, TGT2

必须有一种模式来识别动态文件结构。HTH...

于 2020-09-10T17:45:25.467 回答