我有一个网站,用户可以使用 TinyMCE 的自定义实现发布内容(如在论坛、评论等中)。他们中的很多人喜欢从 Word 中复制和粘贴,这意味着他们的输入通常带有大量相关的 MS 内联格式。
我不能只是摆脱<span whatever>
TinyMCE 依赖 span 标签进行某些格式设置,而且我不能(也不想)强迫用户使用 TinyMCE 的“从 Word 粘贴”功能(这不无论如何,t似乎工作得很好)。
有人知道可以为我处理这个问题的库/类/函数吗?这一定是一个普遍的问题,虽然我找不到任何确定的东西。我最近一直在想,寻找 MS 特定模式的一系列蛮力正则表达式可能会起到作用,但我不想重写可能已经可用的东西,除非我必须这样做。
此外,修正弯引号、破折号等会很好。我现在有自己的东西要做,但我真的只想找到一个 MS 转换过滤器来统治它们。