我只想在 Ruby 中使用 doc.xpath 从 XML 文件中提取主体节点/标签
从 XML 文件中提取的节点:
<wcm:element name="Body"><p>A new study suggests that <a href="ssNODELINK/SmokingAndCancer">tobacco</a> companies may be using online video portals, such as YouTube, to get around advertising restrictions and market their products to young people.</p>
</wcm:element>
我尝试了以下方法:
page_content = doc.xpath("/wcm:root/wcm:element").inner_text
但这会提取每个节点的所有内容
然后我尝试了这个:
page_content = doc.xpath("/wcm:root/wcm:element/Body")
但不起作用。
任何人有任何建议如何在 Ruby 中使用 doc.xpath 准确提取 XML 文件的正文部分?