0

我环顾四周,找不到任何有用的东西。这是我想做的事情:

  1. 从 a 中提取第一个帖子
  2. Blogspot 博客 在屏幕上显示

我需要一些可以从 html 页面中的特定标签和 id 中提取数据的东西。我还需要它与 Dalvik 格式兼容,因为对于某些库,它说转换失败并且我的应用程序不起作用。如果它也是直截了当的就好了。

有什么建议么?

4

3 回答 3

3

使用 HttpClient 检索页面。使用Java HTML 解析器的任何优势来提取您的帖子。如果你找到一个你喜欢的库,并且你得到一个“转换失败”的错误,获取源代码而不是 JAR 并将源代码添加到你的项目中——你会得到具体的编译错误,然后你可以确定它们是否可以修复。

于 2011-02-26T23:45:37.167 回答
0

使用 Jsoup,您可以通过文件、字符串和 url 解析 html 数据。它还提取带有标签和类的数据 http://jsoup.org/cookbook/

于 2012-04-07T07:48:33.503 回答
0

如果您只需要文本,我强烈建议您尝试一下

http://www.alchemyapi.com/api/text/

您可以使用他们的 Android SDK。效果很棒!我也用它来提取文本。

于 2011-02-27T02:50:34.177 回答