我有一个可能看起来像这样的 HTML 字符串:
<body>
<div>
<span class="blah">Monkey </span>
<p>breath really <b>stinks</b></p>
And I don't like it!
</div>
</body>
正如您所看到的,有些文本作为值正确包含在元素内部,有些元素包含文本节点和其他元素。我希望能够获取body 下的所有文本值(假设 body 是我存储在变量中的 DOMElement)。
所以,输出看起来像:
猴子的呼吸真的很臭而且我不喜欢它!
我该怎么做?XPath?正则表达式?魔法?