我的解析器有问题。我想阅读网站上的图片链接,这通常可以正常工作。但是今天我得到了一个包含特殊字符的链接,并且通常的正则表达式不起作用。
这就是我的代码的样子。
Pattern t = Pattern.compile(regex.trim());
Matcher x = t.matcher(content[i].toString());
if(x.find())
{
values[i] = x.group(1);
}
这是html的一部分,会引起麻烦
<div class="open-zoomview zoomlink" itemscope="" itemtype="http://schema.org/Product">
<img class="zoomLink productImage" src="
http://tnm.scene7.com/is/image/TNM/template_335x300?$plus_335x300$&$image=is{TNM/1098845000_prod_001}&$ausverkauft=1&$0prozent=1&$versandkostenfrei=0" alt="Produkt Atika HB 60 Benzin-Heckenschere" title="Produkt Atika HB 60 Benzin-Heckenschere" itemprop="image" />
</div>
这是我用来获取 src 属性中的部分的正则表达式:
<img .*src="(.*?)" .*>
我相信它与链接中的所有特殊字符有关。但我不确定如何逃脱所有这些。我已经试过了
Pattern.quote(content[i].toString())
但结果是一样的:什么也没找到。