我刚开始使用 jsoup,我想在 jsoup 中提取具有 'start nav.*base' 之类的正则表达式的类。然后我想得到href。在 jsoup 中,不需要使用正则表达式。那么我怎样才能得到像这样的标签
<li class="start nav-fruit-more level-top base">
<a class="level-top" title="All Fruits" href="url link">Fruit</a>
</li>
您可以使用语法 [attr~=regex]
来选择属性值与正则表达式匹配的元素。
以 开头start nav
和结尾的字符串的正则表达式base
是^start(\s)*nav.* base$
,因此您可以尝试使用:
Document doc = Jsoup.parse(content);
System.out.println(doc.select("[class~=^start(\\s)*nav.* base$]").first());