3

我有一个可能看起来像这样的 HTML 字符串:

<body>
  <div>
    <span class="blah">Monkey </span>
    <p>breath really <b>stinks</b></p>
    And I don't like it!
  </div>
</body>

正如您所看到的,有些文本作为值正确包含在元素内部,有些元素包含文本节点和其他元素。我希望能够获取body 下的所有文本值(假设 body 是我存储在变量中的 DOMElement)。

所以,输出看起来像:

猴子的呼吸真的很臭而且我不喜欢它!

我该怎么做?XPath?正则表达式?魔法?

4

1 回答 1

0

如果您不介意使用 jquery,我可能对此有答案。

首先我们需要抓取内容。因此使用 php curl 并回显内容。在获取正文中的内容后,触发一个 jquery 函数,该函数具有以下行,

假设所有文本都包含在具有 id 内容的 div 中

$('#content').text() gives you the required output.

请记住使用 jquery 委托将函数绑定到您选择的任何事件。

于 2012-04-06T02:13:08.483 回答