1

我想解析存在于非结构化文本文件中的数据。但在此之前,我希望将该文本文件中的全部内容存储到一个字段中。这样,我就可以通过从字段中检索来解析数据。

我计划使用Javascript 修改值进行解析。

注意:
我所说的文件不是普通文本或 CSV 文件。它是从Tandem Server接收的直接文件。
例如:(文本文件中的内容)
' |08-Jul-16|1| 5996|W2266001|BODHAN ROADNIZAMABAD|FNFA|5211080013438979|*****************|0220|01|7|07-Jul-16|08-Jul-16|23:14 :23|1043|000|00|541100|30000|0000|PRO1|FNFA|00000403362|356|356|0|NIZ-220|NIZAMABAD|TS|IN||16 年 7 月 8 日|1| '

4

1 回答 1

1

您可以为此使用“在内存中加载文件内容”步骤。

它完全符合您的要求,无需解析即可将文件读入每个文件的单个字段。您无需指定分隔符,而是手动输入字段数据。选择“文件内容”作为元素,选择“字符串”作为类型。

我看到了你的另一个问题。如果您的文件大小为 1.7 GB,则它可能不会加载到单行中而不会出现内存问题。

我测试使用:

拆分非结构化文件的转换步骤

  1. 将文件加载到内存中,如上所述
  2. 使用“\|DR\|”将字段拆分为行 作为正则表达式分隔符
  3. 选择值,去掉原来巨大的字段
  4. 拆分字段,使用分隔符“|” 到字符串字段列表中(您的记录最多可以有多少)。

这提供了一些可用的记录,但您可能需要进行更多处理以识别某些记录中缺失的列并将它们理顺。

于 2017-01-18T08:45:45.923 回答