1

我正在处理一个页面,该页面需要从其他页面获取信息,然后在当前页面上显示部分信息/数据。

我有需要在字符串中解析的 HTML 源代码。我正在寻找一个可以帮助我轻松做到这一点的库。(我只需要提取特定的标签和它们包含的文本) HTML 格式正确(所有结束/结束标签都存在)。

我已经查看了一些选项,但由于各种原因,它们都非常难以使用。

我尝试了以下解决方案:

  1. jkl-parsexml 库(库 js 文件本身抛出 HTTPError 101)
  2. jQuery.parseXML 实用程序(没有找到太多文档/许多示例来弄清楚该怎么做)
  3. XPATH(执行语句不起作用,但 JS 错误控制台未显示错误)

所以我正在寻找一个对用户更友好的图书馆或任何可以让我更好、更轻松、更有效地使用上述工具的东西(教程/书籍/参考资料/文档)。

理想的解决方案是 Python 中可用的 BeautifulSoup。

4

2 回答 2

4

使用 jQuery,它就像使用其中的字符串中的 HTML 数据创建一个 jQuery 对象一样简单$(HTMLstring);(此 DOM 将与您的文档断开连接)。从那里可以很容易地用它做任何你想做的事情——当然,遍历加载的数据对于 jQuery 来说是小菜一碟。

于 2012-09-11T22:56:08.380 回答
0

你可以这样做:

$("string with html here").find("jquery selector")

$("string with html here")这将创建一个文档片段并将一个 html 放入其中(基本上,它将解析您的 HTML)。并将find搜索该文档片段中的元素(并且仅在其中)。同时不会放到页面DOM中

于 2012-09-11T22:56:52.087 回答