0

我正在解析一些包含不可见字符的文件。这些文件的结构很奇怪,所以有时我必须在 9 或 10 个不可见字符之后找到真实信息。是的...

无论如何,我有一些文件似乎有我的正则表达式还不知道的不可见字符。有没有办法通过函数传递一个字符来查找它的字符代码?因为它是隐形的,所以我真的没有太多事情要做了,哈。

目前我正在使用以下正则表达式来查找不可见字符。(从这个问题中找到)

public $invisibles='\x00-\x09\x0B\x0C\x0E-\x1F\x7F';
4

1 回答 1

1

你的是控制字符。但另一个真正的隐形特征是\xA0不间断的空间。

无论如何要找出困扰您的问题,首先将其隔离(substr如果可以的话),然后将其传递ord()以获取 ASCII 号:

preg_match('/\W/', $str, $match);   // find first non-letter
print dechex(ord($match[0]));

(十进制用于将其打印为十六进制)

尽管确实如此,但您应该为此目的下载一个 hexeditor。

于 2011-05-07T04:05:44.963 回答