问题标签 [lxml]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
36045 浏览

python - 如何删除 etree 元素的属性?

我的 etree 元素具有一些属性 - 我们如何删除特定 etree 元素的属性。

0 投票
1 回答
2791 浏览

python - python:检查 XSD xml 架构

我想检查 python 中的 XSD 模式。目前我正在使用 lxml,当它只需要根据架构验证文档时,它的工作非常好。但是,我想知道架构中的内容并访问 lxml 行为中的元素。

架构:

加载模式的 lxml 代码是(简化的):

然后,我可以使用schema_document(即etree._Element)将模式作为 XML 文档进行浏览。但是因为etree.fromstring(至少看起来是这样)需要一个 XML 文档,xsd:include所以不会处理元素。

目前解决问题的方法是解析第一个schema文档,然后加载include元素,然后手动将它们一个一个插入到主文档中:

我要求的是如何通过使用更常见的方式来解决问题的想法。我已经在 python 中搜索了其他模式解析器,但现在没有任何东西适合这种情况。

问候,

0 投票
2 回答
70346 浏览

python - 如何使用 LXML 递归查找 XML 标记?

使用 lxml 是否可以递归地找到标签“ f1 ”?我尝试了 findall 方法,但它仅适用于直系子女。

我想我应该为此选择 BeautifulSoup !!!

0 投票
2 回答
4395 浏览

python - 使用 lxml 将 xml 转换为 Python 数据结构

如何使用 lxml 将 xml 转换为 Python 数据结构?

我搜索了高低,但找不到任何东西。

输入示例

0 投票
5 回答
21631 浏览

python - 如何在 lxml xpath 中使用正则表达式?

我正在使用这样的构造:

但我需要选择所有文本以“某些文本”开头的链接,所以我想知道有没有办法在这里使用正则表达式?在 lxml 文档中找不到任何内容

0 投票
1 回答
900 浏览

python - 设置超时以使用 python lxml 解析网页

我正在使用 python lxml 库来解析 html 页面:

有没有办法设置解析超时?

0 投票
4 回答
4293 浏览

python - 关闭lxml中没有文本的标签

我正在尝试使用 Python 和 lxml 输出 XML 文件

但是,我注意到一件事,如果标签没有文本,它不会自行关闭。这方面的一个例子是:

这个的输出是:

我希望输出为:

所以基本上我想关闭一个没有文本但习惯于属性值的标签。我怎么做?还有,这样的标签叫什么?我会用谷歌搜索它,但我不知道如何搜索它。

0 投票
1 回答
312 浏览

python - OS X 上的 Python 2.6 是否应该处理 $PYTHONPATH 中的多个 easy-install.pth 文件?

我正在从sage运行 ipython,并且正在使用安装在我的主目录中的一些不在 sage 中的包(lxml,argparse)。因此,我最终得到了 $PYTHONPATH

$HOME/sage/local/lib/python:$HOME/lib/python

Python 正在读取和处理它找到的第一个 easy-install.pth ($HOME/sage/local/lib/python/site-packages/easy-install.pth) 但不是第二个,所以鸡蛋安装在 $HOME/lib/ python 没有添加到路径中。在阅读现成的 site.py 时,我一生都无法理解它为什么这样做。

有人可以启发我吗?或者建议如何让 Python 读取这两个 easy-install.pth 文件?

将两者合并到一个 .pth 文件中是目前可行的解决方法,所以这个问题主要是出于好奇的价值。

0 投票
2 回答
691 浏览

python - 正则表达式正常工作,但放在 XML 模式中时失败

我有一个简单的doc.xml文件,其中包含一个带有 Timestamp 属性的根元素:

我想根据我的简单验证此文档,schema.xsd以确保时间戳的格式正确:

所以我使用lxml Python 模块并尝试执行简单的模式验证并报告任何错误:

我的 XML 文档验证失败,并显示以下错误消息:

所以看起来我的正则表达式一定有问题。但是当我尝试在命令行验证正则表达式时,它通过了:

我知道 XSD 正则表达式并不具备所有功能,但我发现的文档表明我使用的每个功能都应该有效。

那么我误解了什么,为什么我的文档失败了?

0 投票
1 回答
808 浏览

python - 如何要求元素在 XSD 架构中具有一组属性或另一组属性?

我正在处理一个 XML 文档,其中标签必须具有一组属性或另一组属性。例如,它需要看起来像<tag foo="hello" bar="kitty" /><tag spam="goodbye" eggs="world" />例如

所以我有一个 XSD 架构,我使用该xs:choice元素在两个不同的属性组之间进行选择:

但是,当使用lxml尝试加载此架构时,我收到以下错误:

由于错误在于我的xs:choice元素的放置,我尝试将它放在不同的位置,但无论我尝试什么,我似乎都无法使用它来定义一个标签以具有一组属性(foobar)或另一个(spameggs)。

Is this even possible? And if so, then what is the correct syntax?