我的网站上的 Â 字符有问题。
我有一个网站,用户可以使用所见即所得的编辑器(ckeditor)来填写他们的个人资料。内容在放入数据库之前通过 htmlpurify 运行(出于安全原因)。
数据库的所有表都设置为 UTF-8 字符集。我还在脚本执行开始时调用'SET NAMES utf-8'以防止出现问题(这已经工作了多年,因为我很长时间没有遇到这个问题了)。显示文本的网页的内容类型为 utf-8,我还使用 header() 函数来设置内容类型和字符集。
显示文本时一切似乎都很好,直到我尝试在内容上运行正则表达式。html_entity_decode(使用'utf-8'的编码参数调用)由于某种原因正在删除/不显示Â字符,并且它留下了导致我所有正则表达式失败的东西(似乎那里有一个字符,但我不能在源代码中查看它)。
如何防止和/或删除此字符,以便运行正则表达式?
编辑:我决定放弃 ckeditor 并使用本网站使用的降价格式,以获得更大的灵活性。从我记事起,我就讨厌所见即所得的编辑器。将所有配置文件更新为新格式将使我有机会删除所有有问题的文本并为网站提供一个全新的开始。感谢所有的投入。