我需要使用 html 标签获取两个文本块并进行比较 - 合并两个文本块,然后突出显示从一个版本添加或删除的内容到下一个版本。
我已经使用 PEAR Text_Diff 类成功地呈现了纯文本的比较,但是当我尝试在其中抛出带有 html 标签的文本时,它变得丑陋。由于该类使用基于单词和字符的比较算法,html 标签被破坏,我最终得到了像<p><span class="new"> </</span>p>
. 它屠杀了html。
有没有办法在保留原始有效 html 标记的同时生成文本比较?
谢谢您的帮助。我已经为此工作了几个星期:[
这是我能想到的最佳解决方案:使用 1 个特殊的非标准字符(如苹果徽标(opt shift k))查找/替换每种类型的 html 标签,使用这种原始降价进行比较,然后恢复非标准字符回到标签。任何反馈?