0

可能重复:
如何从网页中提取文本内容?

我搜索了很多,但找不到我要找的东西。实际上我想从网页中提取数据(只有主要数据,如新闻页面中的文章)。在谷歌上我发现了很多开源软件像bottlepipe,Jtidy等,但我想编写自己的代码来做到这一点。因为我已经在java中完成了编程并希望在java中实现它。有没有办法在不使用开源库的情况下做到这一点?

你能给我一些很好的教程吗?

4

0 回答 0