我有一个 Node.js/Express 应用程序,它将用户输入作为 HTML,我需要使其格式正确并删除或替换除一小部分允许的标签之外的所有内容。这样做的现有选择是什么?
例如,清理后,我可能想将<div><br></div>
其视为空并将其删除,并替换<div>Text</div>
为<p>Text</p>
.
编辑
@kaareal 建议使用 htmltidy,它很好地处理了清理部分。如何获取这个干净的输出并删除或替换元素?
我有一个 Node.js/Express 应用程序,它将用户输入作为 HTML,我需要使其格式正确并删除或替换除一小部分允许的标签之外的所有内容。这样做的现有选择是什么?
例如,清理后,我可能想将<div><br></div>
其视为空并将其删除,并替换<div>Text</div>
为<p>Text</p>
.
编辑
@kaareal 建议使用 htmltidy,它很好地处理了清理部分。如何获取这个干净的输出并删除或替换元素?