我有一些regex
陈述有问题。我不确定它为什么这样做,但是我认为它可能与字符编码有关。
所以我使用 curl 从网站接收页面内容。然后我使用domXPath
查询来获取某个元素,然后从该元素中获取其内容,然后从该内容中执行regex
语句。但是该regex
声明不起作用,我不知道为什么。
这是我从元素中收到的:
X: asdasdfgdgdrrY: dfgdfgfgZ: ukuykyukjghj
a B 7dd.
现在,当我尝试将其与此代码匹配时:
/X: (?P<x>.*)Y: (?P<y>.*)Z: (?P<z>.*)\s*(?P<a>[a-zA-Z]+) (?P<b>[a-zA-Z]+) (?P<c>[0-9]+)dd/
我已经在 Dreamweaver 中测试过它并且它匹配所以我不知道它不会在线
我收到的页面也有 utf-8 的内容,
我尝试使用转换内容以删除 utf-8 字符
iconv('utf-8', 'ISO-8859-1//IGNORE', $td->item(0)->nodeValue);
如果我不删除 utf-8 字符,则Á
在“a”、“b”和“c”变量值之后会有奇怪的符号。