在 RapidMiner 中,我试图从 div 类“描述”中提取数据。当我使用 Google XPath 导入 XML 测试语法时,它会返回适当的数据。当我在 RapidMiner 中尝试以下操作时,我得到空白结果:
//h:div[@id='description']/text()
这有效:
//h:div[@id='description']
但我得到了所有的 HTML 标记数据。
我需要添加或删除什么?
在同一个文档上,我能够得到这个来返回预期的结果:
//h:label[@id='desc']/text()
XML:
div id="description" class="longdesc" style=" padding-top: 0px; display: block;" xmlns:IDB="urn:ItemDataBinding">Description Text Here./div