我在处理来自包含外来字符的网页的字符串时遇到了一些问题。
该字符串是通过使用 解析网页生成的str_get_html()
,后跟$htmldom->innertext;
(simple_html_dom 类库)。
htmlentities()
当我使用它输出字符串时显示正常;但是explode()
在字符串上使用并打印零件,我得到一个倾斜的块,其中每个外来字符都有一个问号。
我需要将字符串存储在utf8
MySQL 数据库中,所以我需要正确的外来字符。
我的页面有一个带有utf8
字符集的标题。
我已经尝试过mb_split()
and preg_split()
,但是那些有同样的问题。