过去几天我一直在搜索,我看到在 XPath v2 中您可以使用“except”运算符,但无法弄清楚 xml2 如何处理这个问题。
这个链接是我想要做的,但这是特定于 XPath 的,我正在尝试像在这个 SO answer 中那样对节点进行全面排除。
例如,我的测试文档是.docx
我解压缩并阅读的。它有正文和表格。我想阅读所有正文,除了表格中的任何内容。我可以阅读两者,但我不知道如何排除所有w:tbl
. 任何not
或except
运算符似乎都不起作用。
用xml_find_all
它刮掉这些节点内的任何东西,无一例外。
bodytext <- xml2::xml_find_all(doc, "//w:p")
tabletext <- xml2::xml_find_all(doc, "//w:tbl")