我的程序可以接受具有 \n、\r\n 或 \r 换行符的数据(例如 Unix、PC 或 Mac 样式)
构建将匹配任何编码的正则表达式的最佳方法是什么?
或者,我可以在输入上使用universal_newline 支持,但现在我有兴趣看看正则表达式会是什么。
我的程序可以接受具有 \n、\r\n 或 \r 换行符的数据(例如 Unix、PC 或 Mac 样式)
构建将匹配任何编码的正则表达式的最佳方法是什么?
或者,我可以在输入上使用universal_newline 支持,但现在我有兴趣看看正则表达式会是什么。
The regex I use when I want to be precise is "\r\n?|\n"
.
When I'm not concerned about consistency or empty lines, I use "[\r\n]+"
, I imagine it makes my programs somewhere in the order of 0.2% faster.
可以将模式简化\r?\n
为一点性能提升,因为您可能不必处理旧的 Mac 样式(自 2002 年 2 月起不支持 OS 9)。