我正在解析一些 HTML,我需要在 body 标记中获取所有 html。我的目标字符串将始终如下所示:
<body><div><img src="" />text etc</div></body>
但是,我只需要:
<div><img src="" />text etc</div>
我的目标字符串将始终以这些正文标签开始和结束。但是,反复警告不要使用 Regex 解析 HTML,但目前除了 Regex 之外,我没有任何可行的解决方案。
问题:在这种情况下是否有任何安全的正则表达式可以使用?还是我应该忘记它?