我有一个到目前为止只有英文的应用程序。整个模板和数据库的内容编码都是 UTF-8。我现在希望将应用程序国际化/翻译成具有绝对需要 UTF-8 的字符集的语言。
该应用程序使用各种 PHP 字符串函数,例如strlen()
、strpos()
、substr()
等,我的理解是我应该将这些函数切换为多字节字符串函数,例如mb_strlen()
、mb_strlen()
、mb_substr()
等,以便正确处理多字节字符。我试图阅读这个主题,但几乎我能找到的所有内容都深入到“编码理论”中,并没有提供一个简单的问题答案:如果我始终使用 UTF-8,我可以从使用strlen()
tomb_strlen()
并期望事情可以正常工作,例如英语和阿拉伯语,还是我还需要注意什么?
任何见解都将受到欢迎,如果我因我的相对无知而冒犯了一个贴近他们内心的编码的人,我深表歉意。