我一直在使用这个 PDF 比较工具 (ExamDiff Pro),我试图弄清楚如何排除与潜在日期匹配的任何单词。我正在比较的文档上的特定日期格式使用类似:“2014 年 1 月 20 日”
有人可以帮我弄清楚这个正则表达式吗?
我发现了类似问题的结果,但它们的差异足以让我无法弄清楚:/
谢谢!
我不确定您的工具是如何工作的,但这里的工具应该可以通过您提供的示例找到您想要的东西:
\w{3,9}?\s\d{1,2}?\s,\s\d{4}?
第 1 部分:\w{3,9}?
-- 尽可能少地找到 3 到 9 个字符之间的单词字符序列 (short=May(3), long=September(9))
第 2 部分。\s
-- 这就是所谓的“空格” "或空格,如果你愿意的话。
第 3 部分:\d{1,2}?
-- 这会找到一个数字序列 (0-9) 尽可能少的一次和尽可能多的 2 倍(意味着 1-31 范围)
第 4 部分:\s,\s
- 这会找到一个空格,后跟一个逗号,然后是另一个空格
第 5 部分:\d{4}?
- 这会尽可能少地找到 4 位数字的序列(1000-2014 年及以后)
这足以满足您的需求吗?
我从未使用过 ExamDiff,但查看他们的正则表达式帮助页面,我想我可以提供帮助。
我认为以下正则表达式应该以您指定的格式为您提供日期。
\w+\s\d{2},\s\d{4}
解释:
\w+ -- Find one or more word characters
\s -- a white space character
\d{2} -- 2 digits
, -- a literal comma
\s -- another space
\d{4} -- 4 digits
您可以尝试^[0][0-9]([1][0-2])$
检查从 01 到 12 的月份