我第一次尝试在 Java 中使用 Regex。我想得到一个字符串的某些部分。字符串有点复杂:
<description>
<a href='http://testlink.html' alt='some text'><img border='0'
src='http://s2.glbimg.com/zzag70iNYX-QK24sUp0YXQmmXhx7yb8j2Sq2YK7tvX3A6vCwEUOFnFTBONQFT-
ni/s.glbimg.com/es/ge/f/original/2012/04/25/image.jpg'
alt='some' title='text' /></a><br />some text; some text
</description>
我的需要是获取位于href和alt中的字符串。为此,我正在执行此代码:
for(Element element : elements)
{
//Elements children = element.children();
Pattern pattern = Pattern.compile("a\\bhref=*(.html|.htm)>");
String[] data = pattern.split(element.text()); ...
}
等等。目前,我试图仅获得href而没有成功。返回值始终是整个字符串。不正确吗?我已经把 html 扩展名保证了,没有任何反应。