这个问题从之前的帖子继续。这篇文章是为了重新提出问题并尝试另一种方法。
较早的帖子:
问题:
大文本文件包含由竖线 (|) 分隔的记录。
一个字段包含自由文本。一些记录包含回车或换行符(这些特殊特征中的一个或多个)。
一种去除各种特殊字符组合的建议方法并未成功去除所有问题。
建议的解决方案:
运行 VB 脚本以逐条记录文件。将每个字段存储在一个数组中。清理问题字段。然后输出到新文件中。
对于字段 1 - 只需存储在数组中。(从最后一条记录到第一个管道的起始位置为 +1)
对于字段 2 - 删除任何出现的特殊字符。(从最后一个字段到下一个管道的起始位置为 +1)。在小情况下,此字段可能包含管道 - 因此解决方案可能需要考虑解决方法。
对于字段 3 - 存储在数组中。(起始位置从最后一个字段到(回车)+1)
示例文件:( 方括号代表特殊字符 - 换行符或回车)
FIELD_NAME1 | FREE_TEXT1 | FIELD_NAME3
John | He likes food | 1002
Jake | He eats food and [][] likes swimming| 1003
Jake | He eats food and [][] likes swimming| 1003
Jake | He eats food and | 1006
John | He likes [] food | 1007
.