0

有谁知道如何使用 RegEx 将 html 标签(h1-h6、a、b、i、br)中的文本划分为“单词”?例如,

输入:

<h4>TEST</h4> This sentence <br/> is <b><i>test</i></b>

输出:

“单词”的结果列表:

<h4>TEST</h4>
This
sentence
<br/>
is 
<b> <i>test</i></b>
4

1 回答 1

0

我认为要做到这一点,您需要首先使用正则表达式解析 html,因为正则表达式还不够复杂。

我认为您需要使用解析器(在您选择的平台中)才能完成您的项目。

于 2014-05-21T19:55:29.163 回答