问问题
190 次
4 回答
1
也许,你会选择一个好的 HTML 解析器。即JSoup。
String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>";
Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();
String text = doc.body().text(); // "An example link"
String linkHref = link.attr("href"); // "http://example.com/"
String linkText = link.text(); // "example""
String linkOuterH = link.outerHtml();
// "<a href="http://example.com"><b>example</b></a>"
String linkInnerH = link.html(); // "<b>example</b>"
于 2013-08-20T08:24:36.777 回答
0
这是这个的正则表达式:
"\\"(.*?)\"\" (提取撇号之间的字符串)
尽管我建议您使用专门用于 HTML 属性提取的工具。
于 2013-08-20T08:24:44.937 回答
0
您可以使用 Apache commons substringBetween方法。
于 2013-08-20T08:24:53.470 回答