我目前正在尝试使用网络爬虫,并遇到了正则表达式的这个问题。
我想从下面的字符串中存储的字符是“09:00 AM”:
<td style="border: #080707 1px solid;" lang="lang" valign="top" scope="scope"> 09:00 AM</td>
下面是我的正则表达式部分:
preg_match_all ('/<td .+ scope="scope">(.*)<\/td>/i',$link_string,$details);
结果输出是 09:00 AM,我不想要 Â。我知道这是由空格引起的,但我尝试了几种不同的方法,例如:
preg_match_all ('/<td .+ scope="scope">\s(.*)<\/td>/i',$link_string,$details);
preg_match_all ('/<td .+ scope="scope">(\w+)<\/td>/i',$link_string,$details);
preg_match_all ('/<td .+ scope="scope"> (.*)<\/td>/i',$link_string,$details);
但是,返回是假的,我想要的字符不匹配。
希望对进行这种正则表达式的最佳方式有所启发。