问题标签 [celementtree]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
30 浏览

python - 带有python的cElementTree没有按预期工作

我编写了一个 python 脚本来读取从软件生成的 xml 文件。我使用 xml.etree.cElementTree 来解析 xml。它一直工作正常,但今天突然发现脚本无法正常工作。我认为系统没有任何变化,我只有一批新文件要解析。

我尝试将 cpython/lib/xml/etree lib 添加到我的项目目录中,但它没有解决任何问题。早些时候它曾经独立运行,所以我不能在这里指出问题。我在下面提供我的代码:

我曾经收到一个格式良好的关联数组,其中 id 作为键,注释作为值。但现在我收到以下错误:

这是我正在检查的文件:

请帮助我理解问题以及如何解决它..提前致谢

PS:

rootTag.find('profile_info')返回None..

我也试过使用rootTag.findall('profile_info'),它返回空白数组[]..

我也尝试使用rootTag.find('{*}profile_info')and rootTag.findall('{*}profile_info'),但它们也返回相同的结果..

0 投票
1 回答
29 浏览

python-3.x - 如何读取 ElementTree 中特定子节点的文本?

我正在使用 ElementTree 处理 XML 文件,每个文件有大约 5000 个这些“资产”节点

我需要
资产节点上 id 属性的值
vin 节点
的文本 gps 节点的文本

如何直接读取“vin”和“gps”子节点的文本,而无需遍历所有子节点?

0 投票
1 回答
40 浏览

python - 从 XML 文件中提取元素并使用 cElementTree 模块写入另一个文件

我有一个大的 XML 文件,我想提取一些标签并将它们写入另一个 xml 文件。我写了这段代码:

但我没有得到想要的结果,我得到了这个:

而不是这个:

编辑

输入文件:

而且我还需要从源文件中删除元素。

0 投票
1 回答
145 浏览

python - 用子节点创建多个同名节点

我有一个文本文件,我使用xml.etree.cElementTree库用 python 解析它。在输入中,我有一个<p>包含句子的段落<s>,每个句子都有单词<w>,这是文本文件的样子:

在输出中,我想要以下 xml 文件:

我编写了以下 python 代码,它给了我段落标签和单词标签,我不知道如何实现具有多个<s>标签的案例。句子以大写字母开头,以点结尾。我的python代码:

以下xml输出:

我面临的问题是我无法<s>为每个新句子创建一个新标签,有没有办法使用 python 使用 xml 库来做到这一点?

0 投票
1 回答
1433 浏览

python - Python:访问 xml 文件中的嵌套子元素

我有一个结构如下的 xml 文件:

以及解析它的python代码:

当我想迭代这个元素时

要获取所有嵌套元素并解析它们的属性,我在这一行收到以下错误:print(subChild.attrib['ref']) 错误:

并且属性ref存在于元素的子子元素中

我的问题是如何遍历根元素的所有嵌套子子元素?

0 投票
1 回答
1172 浏览

python - 所有 XML 元素标记中的 URL

我在 Python 中使用 cElementTree 包,但遇到了元素标签的问题。它们在标签本身中包含一个属性。似乎是解析器的问题。请查看以下代码:

xml是这样的:

知道为什么包含 url '{ http://www.aftmark.org }' 吗?我正在解析很多文件并且该网址发生了变化。DATA 标签没有。(备份是使用 root.tag 并获取该 url 并将其附加到所有 ET.find() 稍后)谢谢!

0 投票
2 回答
633 浏览

xml - 如何使用 Python 中的 ElementTree 删除带有 iterparse 的 XML 部分?

我有多个大文件需要导入并遍历它们——它们都是 xmls 并且具有相同的树结构。结构是这样的,除了 ID 之外还有一些额外的文本,所以在 Start 下有更多的子元素标签:我想做的是输入一个我知道是错误的 Id 列表,然后从整个 XML 文件。一份报告在两个“T”之间。

到目前为止我所拥有的:

因此,上面的代码显然不起作用,因为根是以 Header 开头的整个 xml 文件,并且它无法准确找到我所指的删除子元素,因为它的父级是 Header3 而不是 Header。

所以所需的输出将是:

展望未来,我要输入删除的不是单个值,而是数千个值,所以要成为一个列表,我只是认为以这种方式表示问题更容易。任何帮助表示赞赏。

0 投票
1 回答
118 浏览

python - 无法在 Python 2.7 上导入 cElementTree

我无法xml.etree.cElementTree在 Python 2.7 上导入。在网上,它说它已经实现了,所以我不必安装它。(它对我来说正在使用 Python 3.6,但出于此处的原因,我需要 2.7)

那是控制台输出:

我希望你能帮助我。

亲切的问候,马库斯

0 投票
0 回答
15 浏览

celementtree - 如何使用 xml.etree.cElementTree.iterparse 将所有 xml 元素名称(不同)添加到字典中

我想使用 xml.etree。c ElementTree.iterparse 形成一个巨大的文件,xml 根和顶级标签,并将它们添加到字典中。请问有人可以帮助我吗?

0 投票
0 回答
51 浏览

python - Python xml树结构

如何在每个循环中按照一种方式在 doc 标签中打印数据?

我的代码

我的导出结果:

我想将数据打印到 xml 文件中,如下所示: