我将字符串编码从宽编码转换utf8
为有限编码cp1251
。我需要保留一些未包含在 cp1251 中的字符。
在 python 2.x 中有一个特殊的函数,它在编码转换期间用 html-entities 替换不可能的字符:
# -*- coding: utf-8 -*-
s_in = "Ø 125 mm".decode('utf8')
s_out = s_in.encode('cp1251', 'xmlcharrefreplace')
print s_out # prints Ø 125 mm
PHP 中是否有任何现成的 func/lib 来完成这项任务?
我的代码是:
<?php
$in = 'Ø 125 mm';
$out = mb_convert_encoding($in, 'cp1251', 'utf8');
echo $out; // prints ? 125 mm