Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
例如,我想从类过滤的 HTML 中获取数据
<p class="job_list_first_line">
在那个类中,我想获取一些数据,例如
<a href="adasdasdasd.html" title="blablabla"> some value text text text < /a >
标签。
那可能吗?请注意,我有兴趣检索我无法控制的网页的数据。
提前感谢大家,狼。
您可以下载整个 html 页面并借助字符串方法和正则表达式对其进行过滤。这里有很多线程。
也许JSoup可以帮助你?这是一个 HTML 解析器:
jsoup 实现了 WHATWG HTML5 规范,并将 HTML 解析为与现代浏览器相同的 DOM。
JSoup 链接