0

这个问题从之前的帖子继续。这篇文章是为了重新提出问题并尝试另一种方法。

较早的帖子:

清理大文本文件

问题:

大文本文件包含由竖线 (|) 分隔的记录。

一个字段包含自由文本。一些记录包含回车或换行符(这些特殊特征中的一个或多个)。

一种去除各种特殊字符组合的建议方法并未成功去除所有问题。

建议的解决方案:

运行 VB 脚本以逐条记录文件。将每个字段存储在一个数组中。清理问题字段。然后输出到新文件中。

对于字段 1 - 只需存储在数组中。(从最后一条记录到第一个管道的起始位置为 +1)

对于字段 2 - 删除任何出现的特殊字符。(从最后一个字段到下一个管道的起始位置为 +1)。在小情况下,此字段可能包含管道 - 因此解决方案可能需要考虑解决方法。

对于字段 3 - 存储在数组中。(起始位置从最后一个字段到(回车)+1)

示例文件:( 方括号代表特殊字符 - 换行符或回车)

FIELD_NAME1 |    FREE_TEXT1                          |    FIELD_NAME3
 John       |    He likes food                       |    1002
 Jake       |    He eats food and [][] likes swimming|    1003
 Jake       |    He eats food and [][] likes swimming|    1003
 Jake       |    He eats food and                    |    1006
 John       |    He likes [] food                    |    1007

.

4

0 回答 0