这两个替换总是产生相同的结果吗?
$data =~ s/\p{Space}//g;
$data =~ s/[\h\v]//g;
是的。
$ diff -U0 \
<( unichars -au '\p{Space}' ) \
<( unichars -au '[\h\v]' ) \
&& echo No differences
No differences
对比
$ diff -U0 \
<( unichars -au '\p{Space}' ) \
<( unichars -au '\s' ) \
&& echo No differences
--- /dev/fd/63 2012-07-20 11:28:33.356934588 -0400
+++ /dev/fd/62 2012-07-20 11:28:33.356934588 -0400
@@ -3 +2,0 @@
- ---- U+0000B LINE TABULATION
\s
不过,可能很快就会开始包括 U+000B。
unichars
由Unicode::Tussle安装。
注意:如果没有/u
or use 5.012;
,\s
有时与 NBSP 不匹配。
我刚刚在 Perl (5.16.0) 中发现了一个错误。立即报告。
$ perl -le'print "\xA0" =~ /\p{Space}/ ?1:0'
1
$ perl -le'print "\xA0" =~ /\s/ ?1:0'
0
$ perl -le'print "\xA0" =~ /\s/u ?1:0'
1
__
$ perl -le'print "\xA0" =~ /\h/ ?1:0' \
1 \
> huh??
$ perl -le'print "\xA0" =~ /[\h]/ ?1:0' /
0 __/
$ perl -le'print "\xA0" =~ /[\h]/u ?1:0'
1
所以这意味着,不,\p{Space}
并且只有在使用or[\h\v]
时才等效。/u
use 5.012;
地位:
/\h/
相当于/[\h]/
5.10、5.12、5.14 和 5.18/\h/
不等于/[\h]/
5.16.0