问题标签 [xml2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
240 浏览

r - 使用 xml2 在 R 中获取 xll xpaths

在 xml2 中,可以使用以下方法获取给定节点的 xpath:

我想知道从给定文档中提取所有 xpath 的最快方法是什么。即我想找到最终节点,然后向上迭代。

本质上,我正在努力实现这一目标:

本质上,我想解析一个 .xml 文件,然后将其作为一行放到 data.table 中。我目前的解决方案非常慢,如果我有很多文件,也许有人可以提出一些更快的解决方案。

0 投票
0 回答
238 浏览

r - 从 .zip 读取多个 xml 文件并将它们存储在列表中

我在 .zip 存档中有许多 .xml 文件。我想知道是否可以在不通过 read_xml 解压缩的情况下读取 .zip 文件,然后将结果存储在一个列表中(其中每个元素对应一个 .xml 文件)

0 投票
4 回答
1679 浏览

python - Python/R:当并非所有节点都包含所有变量时,从 XML 生成数据框?

考虑以下XML示例

在这里,我想从此 XML 中获取一个(R 或 Pandas)数据框,其中包含列namehobby.

但是,如您所见,存在对齐问题,因为hobby在第二个节点中缺少并且 John 有两个爱好。

在 R 中,我知道如何一次提取一个特定值,例如使用xml2如下:

但是如何在数据框中正确对齐这些数据?也就是说,我怎样才能获得如下的数据框(注意我是如何加入|约翰的两个爱好的):

在 R 中,我更喜欢使用xml2and的解决方案dplyr。在 Python 中,我想最终得到一个 Pandas 数据框。此外,在我的 xml 中还有更多我想要解析的变量。我想要一个解决方案,它允许用户解析其他变量而不会过多地弄乱代码。

谢谢!

编辑:感谢大家提供这些出色的解决方案。他们都非常好,有很多细节,很难找到最好的。再次感谢!

0 投票
2 回答
3225 浏览

r - Parsing large and complicated XML file to data.frame

So, I have large XML file with lots of reports. I created data example below to approximately show the size of xml and its structure:

I would like to transform this data to data.frame, but the structure of XML isn't straightforward. Previously working with XMLs I created loop that for every report transforms its sub nodes to data.frame, but here (in this data) the sub node count is greater than 30 (didn't put all of them in the example), and the structure differs (List nodes can occur even 2 levels deep in XML).

So I have few questions:

1) I am sure that looping over reports isn't the best way to handle this. How should I approach this problem?

2) Can I somehow extract all the data of one report two one line of data.frame (recursively maybe)?

3) Or can I automatically create separate data.frames for each list object of XML?

Any help would be much appreciated.

Update:

Example of results could look like this:

, but as I mentioned previously, sub lists could also be in separate tables.

0 投票
1 回答
571 浏览

centos - 在 CENTOS 6.9 x86_64 上安装 xml2 错误

我尝试时得到以下信息

install.packages("xml2") bash:意外标记“xml2”附近的语法错误

或 devtools::install_github("hadley/xml2") bash: 意外标记 `"hadley/xml2"' 附近的语法错误

我已经安装了 R 版本 3.3.3 (2017-03-06) -- "Another Canoe" 版权所有 (C) 2017 The R Foundation for Statistical Computing Platform: x86_64-redhat-linux-gnu (64-bit)

0 投票
2 回答
508 浏览

r - 使用 xpath 检索空和非空节点

我正在尝试获得 XML 的良好表示...为了简单起见,假设我们有以下 XML

理想情况下,我想将其转换为具有一列的表:

(我在这里使用引号清楚地表明我也想要空节点)

我尝试了几个 xpath 查询.. 最简单的一个是我用 R 测试过的,在这里我会得到

大多数其他问题都是关于仅检测空/非空单元格..或选择第一个非空单元格..但我不知道如何在这里使用它。

我的一个想法是尝试使用 concat... 向所有节点(包括空节点)添加一些字符串。但是,这是一个 Xpath 2.0 解决方案 (AFAIK),这不是一个可行的解决方案。

最终解决方案(从此 XML 中提取信息)将在 Hive 中实现。我使用一些 Serde 功能来获取信息..然后将其存储为数组..然后我想将其转换为普通表..但如果由于长度差异而未检索到缺失值,则这是不可能的

0 投票
0 回答
90 浏览

r - R xml2 使用 XPath3.0

我想知道xml2R包最终是否会使用XPath3.0而不是XPath1.0?我知道这个包是建立在libxml2C 库之上的,它仍然使用 Xpath1.0,但我找不到是否有计划更新到 XPath3.0。

谢谢!

0 投票
1 回答
3319 浏览

r - 通过属性从带有r的xml中获取值

我正在尝试从中获取值xml,如下所示:

到目前为止,我可以通过id以下方式获得价值:

这似乎非常低效,并且仅当“id”存储在第一个子元素中时才有效。123, 456那么,有没有办法通过搜索属性(name)和值( )来获取元素( )的值id

0 投票
0 回答
162 浏览

r - 使用 xml2 和 purrr 创建列表小标题时出现 bind_rows 错误

我的目标是从 XML 文件中提取列表列表并将它们存储为小标题以供进一步使用。我已成功使用此处tidyverse描述的选项,但收到一些列表的错误消息。

我已经在我的在线搜索引擎中输入了错误消息,并且还在 Stack Overflow 上使用了以下搜索词:

  • map_df(展平)bind_rows
  • map_df getCharCE
  • bind_rows getCharCE
  • bind_rows CHARSXP

但没有成功确定我的问题的解决方案。

编码:

错误信息:

它适用于 中的大多数其他列表元素vector_deu,请参阅:

结果的前五行:

我还使用了 unlist,它有效:

并返回以下内容:

任何帮助将不胜感激。

会话信息

0 投票
1 回答
126 浏览

r - 如何使用 R 在 XML 中选择一些具有相同名称的特定节点

我在 R 中使用 xml2 包来提取具有相同类名的某些节点。我正在尝试提取出现在 xml 中的“角色”和“公司”标签下方的开始日期和结束日期(都有类名“日期”)。但是还有其他与我不需要的培训相关的日期标签。此外,格式因 xml 而异。是否有任何功能可以帮助我选择每个角色标签后面的日期标签?下面是xml片段: