问题标签 [xml2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
5552 浏览

xml - R 中的错​​误:没有适用于“xpathApply”的方法

我正在尝试从 oData 源检索 R 中的数据。该脚本有效,但是在我更新了一些软件包后,该脚本需要 xml2 软件包,这导致了错误。

在确定属性的名称时,我收到以下错误。有谁知道此错误消息的含义以及我该如何解决?

UseMethod(“xpathApply”)中的错误:没有适用于“xpathApply”的方法应用于类“c('xml_document','xml_node')”的对象

0 投票
1 回答
473 浏览

r - R 中用于 RSelenium 的短 xPath

我在此页面findElement()上使用from和 xPath 时遇到问题,其中元素的 xPath 表达式很长,即元素嵌套很深(我使用 firefox 作为远程驱动程序)。如果我使用通过检查元素(例如在 Google Chrome 中)获得的简短 xPath 表达式,则可以在页面上正常工作。但是,在 R 中(据我所知),我只能使用例如from package检索长 xPath 表达式。有没有办法在 R 中获得一个简短的 xPath 表达式来解决这个问题?RSeleniumfindElement()xml_path()xml2

remDr$findElement(using='xpath', ShortxPath)工作正常,但remDr$findElement(using='xpath', LongxPath)我收到以下错误消息:

任何帮助深表感谢!

0 投票
2 回答
394 浏览

r - 使用 R 解析维基百科转储时出错

出于研究目的,我想解析一些来自法国维基百科的转储。这是我要解析的 XML 文件的摘录:

但是当我尝试用代码解析它时

我收到以下错误:

我也尝试使用 xml2 包,结果相同。

你有解决办法吗?

提前谢谢。

0 投票
1 回答
71 浏览

r - 创建具有不同长度的列表列表

我正在尝试检查某些单词是否是名词、动词等。

所以我的最终输出应该是一个单词列表及其分类。

考虑这个脚本:

有些词有不止一种分类,如动词、副词等。因此,列表会有不同的大小。我尝试了上面的代码,但是应该给我解决方案的 dics 变量是:

空数据表(0 行和 0 列)

但是, dic 变量给出:

[[1]] V1 1:名词

[[2]] V1 1:缩写

有人可以解释为什么会发生这种情况,还有没有更有效的方法来解决它?

谢谢

0 投票
1 回答
1421 浏览

r - R&xml2:通过特定文本值定位元素,将所有子值存储在data.frame中

我使用定期刷新的 XML 报告,我想使用 R & xml2 自动化处理过程。

这是整个示例文件的链接。 这是 XML 的示例:

我想:

  1. 将 XML 读入 R
  2. 找到特定的被保险人标识符
  3. 提取(2)中与成员ID关联的planIdentifier和所有claimIdentifier数据
  4. 将保险会员标识符、计划标识符、索赔标识符和索赔支付金额的所有文本和值存储在 data.frame 中,每个唯一索赔 ID 对应一行(会员 ID 到索赔 ID 是一对多)

到目前为止,我已经完成了 1 并且我在 2 的球场上:

[我知道我可以使用它xml_text()来提取元素的文本。]

在上面第 2 步中的代码之后,我尝试使用xml_parent()来定位被保险人标识符的父节点,将其保存为变量,然后重复第 2 步以获取该已保存变量节点上的索赔信息。

但这只会导致拉取全局文件中的所有声明标识符。

任何有关如何进入上述第 4 步的帮助/信息将不胜感激。先感谢您。

0 投票
1 回答
76 浏览

c++ - 使用 libxml2 库读取 XML

我有一个如下的 XML 文件

我正在尝试使用 libxml2 库读取 xml。

现在,我的问题是,如果我要打印 cur->name,首先它会给我文本,然后下次它会给我 Radii1,下次再给我文本,然后退出代码。

我不确定为什么会发生这种情况是 xml 的格式不正确?

0 投票
2 回答
226 浏览

r - xml文档作为r中的根到叶树

我试图将 XML 文档的树结构表示为路径列表或连接节点名称的列表。例如:

应转换为:

或这个:

我找到了其他语言的例子:

获取 DOM 树中所有从根到叶路径的列表

但我不确定如何遍历 R 中的节点。我使用的是 xml2 包。

有没有人解决过这个问题?求朋友。

0 投票
1 回答
123 浏览

r - R在循环中使用xml2包崩溃

我有一个包含大约 46000 个链接的目录(我称为 links3),我想使用以下代码抓取每个链接:

但经过大约 5000 次迭代后,我收到以下消息:

我必须关闭 R 会话并重新开始。

我查看了我的系统配置,它显示以下内容:

为什么我会收到这条消息?我该如何解决?

0 投票
1 回答
57 浏览

r - 关闭时将节点属性留空

我正在使用 R 的xml2包向OverpassAPI编写查询,这不是严格的 xml,但确实很像它。

但是,我有一个问题,xml2包在打开和关闭时写入节点属性。

into="_"属性是关于节点的打开和关闭;我对 xml 不是很熟悉,但是在 Overpass 中具有此属性会使查询失败。

有没有办法抑制这种行为?

0 投票
1 回答
489 浏览

r - R:使用 xpath 过滤节点

我正在尝试用 R 解析一个 html 文档。我想抓取一个节点,但在节点内有一些我不需要的信息。

例如:

我想要所有内容以及列表。我不需要标题。所以通常我会用这段代码抓住它:

这通常工作正常。但是这里的“[not(ancestor-or-self”-Line 过滤掉了所有的内容。我认为这是因为我过滤掉了我想要抓取的节点内的东西。代码在那些情况下可以正常工作,其中标题或我不需要的任何其他信息位于单独的节点中,如下所示:

我的另一个想法是:

但问题是,我不能同时抓住段落和列表。