我环顾四周,找不到任何有用的东西。这是我想做的事情:
- 从 a 中提取第一个帖子
- Blogspot 博客 在屏幕上显示
我需要一些可以从 html 页面中的特定标签和 id 中提取数据的东西。我还需要它与 Dalvik 格式兼容,因为对于某些库,它说转换失败并且我的应用程序不起作用。如果它也是直截了当的就好了。
有什么建议么?
使用 HttpClient 检索页面。使用Java HTML 解析器的任何优势来提取您的帖子。如果你找到一个你喜欢的库,并且你得到一个“转换失败”的错误,获取源代码而不是 JAR 并将源代码添加到你的项目中——你会得到具体的编译错误,然后你可以确定它们是否可以修复。
使用 Jsoup,您可以通过文件、字符串和 url 解析 html 数据。它还提取带有标签和类的数据 http://jsoup.org/cookbook/