首先,我知道用正则表达式解析 HTML 是不好的。但是,幸运的是,我提取代码的网站很简单,所以使用这种方法我总是会得到很好的结果。
Pattern p = Pattern.compile("(?<=<span class=\\\"itemName\\\">).*(?=</span>)");
Matcher m = p.matcher(code);
这应该返回“itemname”标签和“span 标签”之间的内容。像这样的东西:
PESCA INSOLITA
但是,相反,它返回:
PESCA INSOLITA</span></a><li><a href="/uy/synop...
我究竟做错了什么?