我们如何从 DeNormalized 文本文件 1 构建 Normalized 表?
感谢您的回复/时间。
我们需要从 DeNormalized 文本文件构建一个 Normalized DB Table。我们探索了几个选项,例如 unix shell 和 PostgreSQL 等。我希望从这个社区中学习更好的解决方案。
输入文本文件是各种长度的逗号分隔记录。内容可能如下所示:
XXXXXXXXXX , YYYYYYYYYY, TTTTTTTTTTT, UUUUUUUUUU, RRRRRRRRR,JJJJJJJJJ
111111111111, 22222222222, 333333333333, 44444444, 5555555, 666666
EEEEEEEE,WWWWWW,QQQQQQQ,PPPPPPPP
我们喜欢标准化如下(Split & Pair):
XXXXXXXXXX , YYYYYYYYYY
TTTTTTTTTTT, UUUUUUUUUU
RRRRRRRRR,JJJJJJJJJ
111111111111, 22222222222
333333333333, 44444444
5555555, 666666
EEEEEEEE,WWWWWW
QQQQQQQ,PPPPPPPP
我们是否需要使用文本预处理和加载方法?
如果是,预处理的最佳方法是什么?
是否有任何单一的 SQL/Function 方法来获得上述内容?
感谢您的帮助。