问题标签 [lxml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
277 浏览

java - java的LXML E构建器?

我非常喜欢 LXML 的一件事,那就是 E 构建器。我喜欢我可以像这样将 XML 放在一起:

制作:

与 DOM 的艰苦工作方式相反。

我很快将把我的一堆软件转移到 Java 上,它对 E 的使用非常重。Java 有什么与这种用法接近的东西吗?

0 投票
1 回答
3470 浏览

python - 实体引用和 lxml

这是我的代码:

这是输出:

如何让 lxml 给我'&test;',即原始实体参考?

0 投票
1 回答
119 浏览

python - 将第一组元素与 xpath 匹配

我有一个看起来像这样的 xml 文档。

我想构造一个只返回第一组的 xpath:

怎么办?我已经尝试过//bar[@type='artist'],但很明显还有更多。提前致谢。

0 投票
1 回答
3850 浏览

python - 使用 lxml 根据 xsd 类型查找元素

我正在尝试使用 lxml 2.x 获取具有特定 xsd 类型的元素列表,但我不知道如何遍历特定类型的 xsd。

架构示例:

示例 xml 数据:

理想的函数如下所示:

0 投票
7 回答
16621 浏览

python - 如何使用 html5lib 解析 HTML,并使用 XPath 查询解析后的 H​​TML?

我正在尝试使用 html5lib 将 html 页面解析为可以使用 xpath 查询的内容。html5lib 的文档几乎为零,我花了太多时间试图解决这个问题。最终目标是拉出表格的第二行:

所以让我们试试吧:

看起来不错,让我们看看我们还有什么:

大声笑吗?

严重地。我打算使用一些 xpath 来获取我想要的数据,但这似乎不起作用。那么我能做什么呢?我愿意尝试不同的库和方法。

0 投票
3 回答
1786 浏览

python - 使用 lxml.cssselector 查找内联样式

这个库的新手(遗憾的是,对 BeautifulSoup 也不熟悉),尝试做一些非常简单的事情(按内联样式搜索):

我只想选择 style="padding: 20px" 的所有 tds,但我似乎无法弄清楚。所有示例都展示了如何选择 td,例如:

但这对我帮助不大。

0 投票
4 回答
2535 浏览

python - 使用 lxml html 从嵌套元素中提取特定元素

大家好,我遇到了一些我认为可以归因于 xpath 问题的问题。我正在使用 lxml 包中的 html 模块来尝试获取一些数据。我在下面提供了最简化的情况,但请记住,我正在使用的 html 更丑陋。

我真正想要的是深度嵌套的表格,因为它有标题文本“Header1”。我正在尝试这样:

但这给了我所有的表格元素。我只想要一个包含此文本的表。我了解发生了什么,但除了打破一些讨厌的正则表达式之外,我很难弄清楚如何做到这一点。有什么想法吗?

0 投票
1 回答
23385 浏览

python - 如何匹配 XPath (lxml) 中元素的内容?

我想使用 XPath 表达式用 lxml 解析 HTML。我的问题是匹配标签的内容:

例如给定

元素我可以使用匹配 href 属性

但是给定的表达式

甚至

lxml 引发“无效节点谓词”异常。

我究竟做错了什么?

编辑:

示例代码:

预期输出为“a”。我得到“语法错误:无效的节点谓词”

0 投票
2 回答
12777 浏览

python - 使用 lxml 在 python 中编码 - 复杂的解决方案

我需要使用 lxml 下载和解析网页并构建 UTF-8 xml 输出。我认为伪代码中的模式更具说明性:

所以 webfile 可以是任何编码(lxml 应该处理这个)。输出文件必须为 utf-8。我不确定在哪里使用编码/编码。这个架构好吗?(我找不到关于 lxml 和编码的好教程,但我可以找到很多问题......)我需要强大的解决方案。

编辑:

所以为了将 utf-8 发送到 lxml 我使用

0 投票
1 回答
253 浏览

python - 在 DreamHost 上安装 python2.6 和各种库

我设法按照指南在 DreamHost 上安装了 python2.6。我也尝试过easy_install“lxml”,但它失败了。

有人曾经做到过吗?

TIA