我目前正在使用:
[0-1]{1}[0-9]{1}[0-3]{1}[0-9]{1}[0-1]{1}[0-9]{1}
匹配一个 6 位数的日期。有没有办法使这个更具限制性,我的问题是文本中包含其他 6-8 位数字,并且我在非日期序列中偶尔会出现误报。
有什么建议么 ?
谢谢 !
ps 应该说年份总是高于 2000 并且小于当前日期,因此对年份有限制。
您应该为此使用实际的日期解析器,不仅可以更简单地解析实际可能的值(即第 13 个月无效),还可以为闰年等做好准备。
通常,您最喜欢的语言的日期解析器应该能够解析 MMDDYY 格式的字符串,并在失败时给出某种反馈。
一项改进,仅用了 12 个月 31 天,从 2000 年到 2012 年。
(?:0[1-9]|1[0-2])(?:0[1-9]|[1-2][0-9]|3[0-1])(?:200[0-9]|201[1-2])
我知道其中一些破折号是不必要的。添加它们以提高可读性。
然后你可以走得更远,28、30 或 31 天,具体取决于月份。
(?:(?:0[13578]|1[02])31|(?:0[13-9]|1[0-2])(?:29|30)|(?:0[1-9]|1[0-2])(?:0[1-9]|1[0-9]|2[0-8]))(?:200[0-9]|201[1-2])
从技术上讲,有一种方法可以计算闰年,但这有点过火了。
http://www.regular-expressions.info/dates.html 顺便说一句:您将无法仅使用正则表达式来处理闰年(尽管理论上可能这是不切实际的)。您应该使用适当的日期解析器。
使用这个正则表达式[0-1]\d[0-3]\d[2-9]\d{3}
,但不可能与当前日期交互