1

我没有使用正则表达式的经验,并且希望就删除 csv 文件中包含的部分文件名的可能解决方案提供一些帮助和建议。

问题:

导出的文件名列表包含我需要隔离的随机唯一标识符。唯一标识符没有可预测的模式,但是需要删除的方面可以。每个文件名都以下列变体之一结尾:

V、-V 或 %20V 后跟带有可能空格的随机数序列、附加的“-”、“ ”并以 .PDF 结尾

例子:

GTD-LVOE-43-0021 V10 0.PDF GTD-LVOE-43-0021-V34-2.PDF GTD-LVOE-43-0021_V02_9.PDF GTD-LVOE-43-0021 V49.9.PDF

解决方案:

我的计划是编写一个脚本,从字符串末尾选择第一次出现的 V,然后删除它以及它右侧的所有内容。然后可以通过删除出现在字符串末尾的任何“-”或“_”和空格来清理文件名。

问题:

我怎样才能用正则表达式做到这一点,我的思路是否接近解决这个问题的正确方法?

4

1 回答 1

1

正则表达式: [\s\-_]V.*?\.PDF

可能会奏效。您仍然需要替换任何前导 - 和 _,但希望它能让您走上正轨。

这将如下所示..

whitespace, -OR开头,_后跟V. 然后拿走所有东西,直到你到达第一个.PDF

于 2012-04-30T02:42:54.157 回答