我正在尝试通过 PHP 中的 URL 通过 Exchange Server 2003 阅读电子邮件。文件名中包含不允许字符的文件将它们转换为某种形式的 Unicode。例如 / 被转换为xF8FF并且 \ 被转换为xF8FE
如何使用 PHP 将这些字符转换为正确的编码?我知道我可以花很长时间来使用 str_replace,但我知道其他字符,例如 : ; * < > 也会有同样的问题。PHP 本身是否支持这种编码?
谢谢
我正在尝试通过 PHP 中的 URL 通过 Exchange Server 2003 阅读电子邮件。文件名中包含不允许字符的文件将它们转换为某种形式的 Unicode。例如 / 被转换为xF8FF并且 \ 被转换为xF8FE
如何使用 PHP 将这些字符转换为正确的编码?我知道我可以花很长时间来使用 str_replace,但我知道其他字符,例如 : ; * < > 也会有同样的问题。PHP 本身是否支持这种编码?
谢谢
尼克,你应该看看这个问题:MSExchange URL encoding
OP 与您有完全相同的问题,其中一个答案提供了一些有关如何进行转换的提示。
从 Microsoft Exchange 的 Ximian 连接器的源代码(用 C 编程语言编写)开始,我编写了这个 PHP 代码示例:
<?php
class myExchange {
private $uri_encoded_char = array(
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, /* 0x00 - 0x0f */
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, /* 0x10 - 0x1f */
1, 0, 1, 1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 2, /* ' ' - '/' */
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 2, /* '0' - '?' */
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, /* '@' - 'O' */
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 2, 1, 1, 0, /* 'P' - '_' */
1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, /* '`' - 'o' */
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 1, /* 'p' - 0x7f */
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1
);
/**
* e2k_uri_append_encoded:
*
* Appends $in to $str, encoding URI-unsafe characters as needed
* (optionally including some Exchange-specific encodings).
* When appending a path, you must append each segment separately;
* e2k_uri_append_encoded() will encode any "/"s passed in.
*
* @param string $str a string containing part of a URI
* @param string $in data to append to $str
* @param bool $wss_encode whether or not to use the
* special Web Storage System
* encoding rules
* @param string $extra_enc_chars additional characters beyond
* the normal URI-reserved
* characters to encode when
* appending to $str
* @return string
**/
public function e2k_uri_append_encoded($str, $in, $wss_encode, $extra_enc_chars) {
$len = strlen($in);
for ($i = 0; $i < $len; $i++) {
$s = $in[$i];
$c = ord($s);
if ($extra_enc_chars && strchr($extra_enc_chars, $s)) {
$str .= sprintf("%%%02x", $c);
} else {
switch ($this->uri_encoded_char[$c]) {
case 2:
if (!$wss_encode) {
$str .= sprintf("%%%02x", $c);
} else {
switch ($s) {
case '/':
$str .= "_xF8FF_";
break;
case '?':
$str .= "_x003F_";
break;
case '\\':
$str .= "_xF8FE_";
break;
case '~':
$str .= "_x007E_";
break;
}
}
break;
case 1:
$str .= sprintf("%%%02x", $c);
break;
default:
$str .= $s;
break;
}
}
}
return($str);
}
}
$filename = "@#£¤$%&/{([)]=}+?'`|~,;.:-_<>æøåäâãëêïîöôõüûÿ\\.EML";
$e = new myExchange();
echo $e->e2k_uri_append_encoded("", $filename, true, null);
echo "\n";
?>
这是输出:
@%23%a3%a4$%25%26_xF8FF_%7b(%5b)%5d=%7d+_x003F_'%60%7c_x007E_,;.:-_%3c%3e%e6%f8%e5%e4%e2%e3%eb%ea%ef%ee%f6%f4%f5%fc%fb%ff_xF8FE_.EML
不幸的是,我没有 Exchange Server,所以我无法判断它是否真的有效,但我希望它可以成为一个好的起点。