问题标签 [xml2]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

261 问题

0 投票

1 回答

5552 浏览

xml - R 中的错误：没有适用于“xpathApply”的方法

我正在尝试从 oData 源检索 R 中的数据。该脚本有效，但是在我更新了一些软件包后，该脚本需要 xml2 软件包，这导致了错误。

在确定属性的名称时，我收到以下错误。有谁知道此错误消息的含义以及我该如何解决？

UseMethod（“xpathApply”）中的错误：没有适用于“xpathApply”的方法应用于类“c（'xml_document'，'xml_node'）”的对象

2016-02-18T10:59:25.257

0 投票

1 回答

473 浏览

r - R 中用于 RSelenium 的短 xPath

我在此页面findElement()上使用from和 xPath 时遇到问题，其中元素的 xPath 表达式很长，即元素嵌套很深（我使用 firefox 作为远程驱动程序）。如果我使用通过检查元素（例如在 Google Chrome 中）获得的简短 xPath 表达式，则可以在页面上正常工作。但是，在 R 中（据我所知），我只能使用例如from package检索长 xPath 表达式。有没有办法在 R 中获得一个简短的 xPath 表达式来解决这个问题？RSeleniumfindElement()xml_path()xml2

remDr$findElement(using='xpath', ShortxPath)工作正常，但remDr$findElement(using='xpath', LongxPath)我收到以下错误消息：

任何帮助深表感谢！

r rselenium xml2

2016-02-22T13:02:56.470

0 投票

2 回答

394 浏览

r - 使用 R 解析维基百科转储时出错

出于研究目的，我想解析一些来自法国维基百科的转储。这是我要解析的 XML 文件的摘录：

但是当我尝试用代码解析它时

我收到以下错误：

我也尝试使用 xml2 包，结果相同。

你有解决办法吗？

提前谢谢。

r mediawiki wikipedia xml2

2016-03-25T08:38:07.303

0 投票

1 回答

71 浏览

r - 创建具有不同长度的列表列表

我正在尝试检查某些单词是否是名词、动词等。

所以我的最终输出应该是一个单词列表及其分类。

考虑这个脚本：

有些词有不止一种分类，如动词、副词等。因此，列表会有不同的大小。我尝试了上面的代码，但是应该给我解决方案的 dics 变量是：

空数据表（0 行和 0 列）

但是， dic 变量给出：

[[1]] V1 1：名词

[[2]] V1 1：缩写

有人可以解释为什么会发生这种情况，还有没有更有效的方法来解决它？

谢谢

r data.table xml2

2016-04-07T21:07:43.233

0 投票

1 回答

1421 浏览

r - R＆xml2：通过特定文本值定位元素，将所有子值存储在data.frame中

我使用定期刷新的 XML 报告，我想使用 R & xml2 自动化处理过程。

这是整个示例文件的链接。这是 XML 的示例：

我想：

将 XML 读入 R
找到特定的被保险人标识符
提取（2）中与成员ID关联的planIdentifier和所有claimIdentifier数据
将保险会员标识符、计划标识符、索赔标识符和索赔支付金额的所有文本和值存储在 data.frame 中，每个唯一索赔 ID 对应一行（会员 ID 到索赔 ID 是一对多）

到目前为止，我已经完成了 1 并且我在 2 的球场上：

[我知道我可以使用它xml_text()来提取元素的文本。]

在上面第 2 步中的代码之后，我尝试使用xml_parent()来定位被保险人标识符的父节点，将其保存为变量，然后重复第 2 步以获取该已保存变量节点上的索赔信息。

但这只会导致拉取全局文件中的所有声明标识符。

任何有关如何进入上述第 4 步的帮助/信息将不胜感激。先感谢您。

r xml xpath xml2

2016-05-20T12:27:20.337

0 投票

1 回答

76 浏览

c++ - 使用 libxml2 库读取 XML

我有一个如下的 XML 文件

我正在尝试使用 libxml2 库读取 xml。

现在，我的问题是，如果我要打印 cur->name，首先它会给我文本，然后下次它会给我 Radii1，下次再给我文本，然后退出代码。

我不确定为什么会发生这种情况是 xml 的格式不正确？

c++xml xml2

2016-06-29T18:09:54.113

0 投票

2 回答

226 浏览

r - xml文档作为r中的根到叶树

我试图将 XML 文档的树结构表示为路径列表或连接节点名称的列表。例如：

应转换为：

或这个：

我找到了其他语言的例子：

获取 DOM 树中所有从根到叶路径的列表

但我不确定如何遍历 R 中的节点。我使用的是 xml2 包。

有没有人解决过这个问题？求朋友。

r xml xml2

2016-07-07T17:39:40.240

0 投票

1 回答

123 浏览

r - R在循环中使用xml2包崩溃

我有一个包含大约 46000 个链接的目录（我称为 links3），我想使用以下代码抓取每个链接：

但经过大约 5000 次迭代后，我收到以下消息：

我必须关闭 R 会话并重新开始。

我查看了我的系统配置，它显示以下内容：

为什么我会收到这条消息？我该如何解决？

r xml web-scraping xml2

2016-07-10T20:34:28.077

0 投票

1 回答

57 浏览

r - 关闭时将节点属性留空

我正在使用 R 的xml2包向OverpassAPI编写查询，这不是严格的 xml，但确实很像它。

但是，我有一个问题，xml2包在打开和关闭时写入节点属性。

该into="_"属性是关于节点的打开和关闭；我对 xml 不是很熟悉，但是在 Overpass 中具有此属性会使查询失败。

有没有办法抑制这种行为？

r overpass-api xml2

2016-07-19T20:51:40.043

0 投票

1 回答

489 浏览

r - R：使用 xpath 过滤节点

我正在尝试用 R 解析一个 html 文档。我想抓取一个节点，但在节点内有一些我不需要的信息。

例如：

我想要所有内容以及列表。我不需要标题。所以通常我会用这段代码抓住它：

这通常工作正常。但是这里的“[not(ancestor-or-self”-Line 过滤掉了所有的内容。我认为这是因为我过滤掉了我想要抓取的节点内的东西。代码在那些情况下可以正常工作，其中标题或我不需要的任何其他信息位于单独的节点中，如下所示：

我的另一个想法是：

但问题是，我不能同时抓住段落和列表。

r parsing xpath xml2

user5539866

2016-07-26T17:42:06.090

1 2 3 4 5 6 7 8 9 10

问题标签 [xml2]

Reference