0

我目前正在尝试从我的 webview 中的 html 内容导入选择性标题。我正在研究各种各样的选项,例如 json 解析或任何 hack 都可以。我想知道是否有人对此有过经验或对如何进行此操作有一个简短的想法?这是我的示例:这是我的 html 文件内容:

<div><h1><span class = "headline"> Some depressing title </span> <span class = "source" > ABCD </span> </h1> <br/> <span class = "body"> crappy body content which I do not need </span></div>

我只想在我的 webview 中从这个 html 中检索“标题”和“来源”,没有别的(不是正文)。我如何去定义一个参数来检索这些?关于如何做的任何线索?

谢谢!

4

1 回答 1

0

第 1 步:从您的 WebView 获取 HTML 源代码 - 请参阅问题。您基本上创建了一个 JS 接口,将您的 HTML 源代码提取为 Java 字符串。

第 2 步:使用 HTML 解析器(例如JSOUP)将 JAVA 字符串解析为您可以轻松处理的格式。

第 3 步:使用解析器提取您的相关信息。在这里,您可以使用getElementsByTag('span')获取所有跨度,然后按类过滤;或者你可以直接使用getElementsByClass('healine')and getElementsByClass('source')

通常,您可以在所有情况下检索 HTML 源并解析 DOM。

编辑:如果您不想使用解析器,您可以通过对 HTML 源字符串进行搜索来提取您的信息(找到正确的类,然后找到 '<' 和 '>' 字符的索引来解析信息。这种方式更难、效率更低、灵活性更低,但可以做到。

于 2015-04-30T15:02:09.500 回答