我没有使用正则表达式的经验,并且希望就删除 csv 文件中包含的部分文件名的可能解决方案提供一些帮助和建议。
问题:
导出的文件名列表包含我需要隔离的随机唯一标识符。唯一标识符没有可预测的模式,但是需要删除的方面可以。每个文件名都以下列变体之一结尾:
V、-V 或 %20V 后跟带有可能空格的随机数序列、附加的“-”、“ ”并以 .PDF 结尾
例子:
GTD-LVOE-43-0021 V10 0.PDF GTD-LVOE-43-0021-V34-2.PDF GTD-LVOE-43-0021_V02_9.PDF GTD-LVOE-43-0021 V49.9.PDF
解决方案:
我的计划是编写一个脚本,从字符串末尾选择第一次出现的 V,然后删除它以及它右侧的所有内容。然后可以通过删除出现在字符串末尾的任何“-”或“_”和空格来清理文件名。
问题:
我怎样才能用正则表达式做到这一点,我的思路是否接近解决这个问题的正确方法?