java - 如何从字符串标签中提取 url 和标签 ？

Question

score 2 · Accepted Answer

您想查看JSoup以从 html 中提取值。

他们提供了一个几乎正是您想要的示例

Document doc = Jsoup.connect("http://jsoup.org").get();

Element link = doc.select("a").first();
String relHref = link.attr("href"); // == "/"
String absHref = link.attr("abs:href"); // "http://jsoup.org/"

score 1 · Accepted Answer

也许，你会选择一个好的 HTML 解析器。即JSoup。

String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>";
Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();

String text = doc.body().text(); // "An example link"
String linkHref = link.attr("href"); // "http://example.com/"
String linkText = link.text(); // "example""

String linkOuterH = link.outerHtml(); 
    // "<a href="http://example.com"><b>example</b></a>"
String linkInnerH = link.html(); // "<b>example</b>"

score 0 · Accepted Answer

这是这个的正则表达式：

"\\"(.*?)\"\" （提取撇号之间的字符串）

尽管我建议您使用专门用于 HTML 属性提取的工具。

score 0 · Accepted Answer

0

您可以使用 Apache commons substringBetween方法。

于 2013-08-20T08:24:53.470 回答

java - 如何从字符串标签中提取 url 和标签？

4 回答 4

Related

Reference