18

我想构造一个返回“div”或“table”元素的 XPath 查询,只要它有一个包含文本“abc”的后代。一个警告是它不能有任何 div 或 table 后代。

<div>
  <table>
    <form>
      <div>
        <span>
          <p>abcdefg</p>
        </span>
      </div>
      <table>
        <span>
          <p>123456</p>
        </span>
      </table>
    </form>
  </table>
</div>

所以这个查询的唯一正确结果是:

/div/table/form/div 

我最好的尝试是这样的:

//div[contains(//text(), "abc") and not(descendant::div or descendant::table)] | //table[contains(//text(), "abc") and not(descendant::div or descendant::table)]

但不返回正确的结果。

谢谢你的帮助。

4

3 回答 3

49

不同的东西::)

//text()[contains(.,'abc')]/ancestor::*[self::div or self::table][1]

似乎比其他解决方案短很多,不是吗?:)

翻译成简单的英语:对于文档中包含字符串的任何文本节点,请"abc"选择其第一个祖先,即 adiv或 a table

这更有效,因为只需要对文档树进行一次完整扫描(而不需要任何其他),并且与(树)扫描ancestor::*相比,遍历非常便宜。descendent::

要验证此解决方案“确实有效”:

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>
 <xsl:strip-space elements="*"/>

 <xsl:template match="/">
  <xsl:copy-of select=
  "//text()[contains(.,'abc')]/ancestor::*[self::div or self::table][1] "/>
 </xsl:template>
</xsl:stylesheet>

在提供的 XML 文档上执行此转换时

<div>
  <table>
    <form>
      <div>
        <span>
          <p>abcdefg</p>
        </span>
      </div>
      <table>
        <span>
          <p>123456</p>
        </span>
      </table>
    </form>
  </table>
</div>

产生了想要的正确结果

<div>
   <span>
      <p>abcdefg</p>
   </span>
</div>

注意:不必使用 XSLT——任何 XPath 1.0 主机——例如 DOM,都必须获得相同的结果。

于 2010-10-13T12:57:22.753 回答
2
//*[self::div|self::table] 
   [descendant::text()[contains(.,"abc")]]  
   [not(descendant::div|descendant::table)]

问题contains(//text(), "abc")在于函数转换节点集采用第一个节点。

于 2010-10-13T12:30:04.943 回答
1

你可以试试:

//div[
  descendant::text()[contains(., "abc")] 
  and not(descendant::div or descendant::table)
] | 
//table[
  descendant::text()[contains(., "abc")] 
  and not(descendant::div or descendant::table)
]

这有帮助吗?

于 2010-10-13T09:48:35.527 回答