我在 Rapidminer 中使用 Read XML 来读取文件并提取一些节点。
我的问题是,每当一个节点在 XML 文件中出现不止一次时,Rapidminer 就会提取所有节点值并构建一个字符串,值之间没有空格。相反,我想要一个逗号分隔的字符串。
所以对于 XPath 属性:
//nounPhrase/node()
和 XML 代码:
<extractedData>
<nounPhrase occurrence="1" origin="syllabs">homme blanc</nounPhrase>
<nounPhrase occurrence="1" origin="syllabs">peine</nounPhrase>
<nounPhrase occurrence="2" origin="syllabs">religieuse</nounPhrase>
<nounPhrase occurrence="1" origin="syllabs">peur</nounPhrase>
</extractedData>
Rapidminer 提取此字符串:
homme blancpeinereligieusepeur
虽然我想要的是:
homme blanc, peine, religeuse, peur
有谁知道该怎么做?我在 Read XML 中看不到任何控制提取这方面的选项。
我用于读取 XML 的配置:
检查的xpath:/
属性的xpath:几个,其中 //nounPhrase/node()