我正在重新设计一个网站,该网站在从 Word 粘贴的内容中包含一堆标签。我想摆脱字体标签的每个实例。
我还想摆脱通常放入的所有内联样式
<span style="font-family:Verdana, etc.;">...</span>
我想保留所有 a、em、br、强标签,所以我不想只删除影响内容样式的所有标签。
这些内容都在 MySQL 数据库中,并且 MySQL 解决方案优于 PHP 解决方案,但我将在这一点上采取任何一种。
我正在重新设计一个网站,该网站在从 Word 粘贴的内容中包含一堆标签。我想摆脱字体标签的每个实例。
我还想摆脱通常放入的所有内联样式
<span style="font-family:Verdana, etc.;">...</span>
我想保留所有 a、em、br、强标签,所以我不想只删除影响内容样式的所有标签。
这些内容都在 MySQL 数据库中,并且 MySQL 解决方案优于 PHP 解决方案,但我将在这一点上采取任何一种。
也许这不是解决问题的最佳方法,但这就是我正在做的事情。我尝试了一些不同的脚本来从数据库中获取信息,对其进行清理并使用 PHP 将其发回,但没有什么能真正奏效。我使用的所有东西都弄乱了数据,而不是帮助。GIGO。
我决定使用 javascript (jQuery) 从 <font> 标记中取出所有属性,并清除所有 <span> 和 <p> 标记的样式属性。这样做后一切看起来都很好。所有未来的内容都将直接进入系统,但所有旧内容的丑陋代码仍在数据库中,已清理到足以在客户端显示。
您无法使用 RegExp 解析 HTML,而 MySQL 用于存储和检索数据,而不是过滤它。
只需使用http://htmlpurifier.org/在 PHP 中清理您的 HTML。