我目前正在从HTML
. 我想提取两个<p class="xfHeading">
标签之间的文本。
<p class="xfHeading"><b>XYZ:</b></p>
<p>asdfghjk</p>
<p>sdsdsd</p>
<p>asdvcvcfghjk</p>
<p class="xfHeading"><b>ABC:</b></p>
<P>fvgbhnjm</P>
<p class="xfHeading"><b>PQR:</b></p>
<ul>
</ul>
<p class="xfHeading"><b>MNO:</b></p>
<ul>
<li>jdjshdj</li>
</ul>
输出应该是:
asdfghjk
sdsdsd
asdvcvcfghjk
一种方法是:
/p[class="xfHeading"]/following-sibling::p[0]|/p[class="xfHeading"]/following-sibling::p[1]|/p[class="xfHeading"]/following-sibling::p[2]
或者
/p[class="xfHeading"]/following-sibling::p[position()<4]
但是,由于两者之间的内容一直在变化,我需要一个解决方案,其中<p class="xfHeading">
提取两个标签之间的内容。