我正在处理一个页面,该页面需要从其他页面获取信息,然后在当前页面上显示部分信息/数据。
我有需要在字符串中解析的 HTML 源代码。我正在寻找一个可以帮助我轻松做到这一点的库。(我只需要提取特定的标签和它们包含的文本) HTML 格式正确(所有结束/结束标签都存在)。
我已经查看了一些选项,但由于各种原因,它们都非常难以使用。
我尝试了以下解决方案:
- jkl-parsexml 库(库 js 文件本身抛出 HTTPError 101)
- jQuery.parseXML 实用程序(没有找到太多文档/许多示例来弄清楚该怎么做)
- XPATH(执行语句不起作用,但 JS 错误控制台未显示错误)
所以我正在寻找一个对用户更友好的图书馆或任何可以让我更好、更轻松、更有效地使用上述工具的东西(教程/书籍/参考资料/文档)。
理想的解决方案是 Python 中可用的 BeautifulSoup。