3

我正在尝试通过 PHP 中的 URL 通过 Exchange Server 2003 阅读电子邮件。文件名中包含不允许字符的文件将它们转换为某种形式的 Unicode。例如 / 被转换为xF8FF并且 \ 被转换为xF8FE

如何使用 PHP 将这些字符转换为正确的编码?我知道我可以花很长时间来使用 str_replace,但我知道其他字符,例如 : ; * < > 也会有同样的问题。PHP 本身是否支持这种编码?

谢谢

4

2 回答 2

3

尼克,你应该看看这个问题:MSExchange URL encoding

OP 与您有完全相同的问题,其中一个答案提供了一些有关如何进行转换的提示。

于 2012-08-02T17:56:19.907 回答
3

从 Microsoft Exchange 的 Ximian 连接器的源代码(用 C 编程语言编写)开始,我编写了这个 PHP 代码示例:

<?php

class myExchange {
    private $uri_encoded_char = array(
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,  /* 0x00 - 0x0f */
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,  /* 0x10 - 0x1f */
        1, 0, 1, 1, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 2,  /*  ' ' - '/'  */
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 2,  /*  '0' - '?'  */
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,  /*  '@' - 'O'  */
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 2, 1, 1, 0,  /*  'P' - '_'  */
        1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,  /*  '`' - 'o'  */
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 1,  /*  'p' - 0x7f */
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
        1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1
    );

    /**
     * e2k_uri_append_encoded: 
     *  
     * Appends $in to $str, encoding URI-unsafe characters as needed
     * (optionally including some Exchange-specific encodings).
     * When appending a path, you must append each segment separately;
     * e2k_uri_append_encoded() will encode any "/"s passed in.
     *  
     * @param string $str               a string containing part of a URI
     * @param string $in                data to append to $str
     * @param bool   $wss_encode        whether or not to use the 
     *                                  special Web Storage System
     *                                  encoding rules
     * @param string $extra_enc_chars   additional characters beyond 
     *                                  the normal URI-reserved
     *                                  characters to encode when
     *                                  appending to $str
     * @return string  
     **/
    public function e2k_uri_append_encoded($str, $in, $wss_encode, $extra_enc_chars) {
        $len = strlen($in);
        for ($i = 0; $i < $len; $i++) {
            $s = $in[$i];
            $c = ord($s);
            if ($extra_enc_chars && strchr($extra_enc_chars, $s)) {
                $str .= sprintf("%%%02x", $c);
            } else {
                switch ($this->uri_encoded_char[$c]) {
                    case 2:
                        if (!$wss_encode) {
                            $str .= sprintf("%%%02x", $c);
                        } else {
                            switch ($s) {
                                case '/':
                                    $str .= "_xF8FF_";
                                    break;
                                case '?':
                                    $str .= "_x003F_";
                                    break;
                                case '\\':
                                    $str .= "_xF8FE_";
                                    break;
                                case '~':
                                    $str .= "_x007E_";
                                    break;
                            }
                        }
                        break;
                    case 1:
                        $str .= sprintf("%%%02x", $c);
                        break;
                    default:
                        $str .= $s;
                        break;
                }
            }
        }
        return($str);
    }
}

$filename = "@#£¤$%&/{([)]=}+?'`|~,;.:-_<>æøåäâãëêïîöôõüûÿ\\.EML";

$e = new myExchange();
echo $e->e2k_uri_append_encoded("", $filename, true, null);
echo "\n";

?>

这是输出:

@%23%a3%a4$%25%26_xF8FF_%7b(%5b)%5d=%7d+_x003F_'%60%7c_x007E_,;.:-_%3c%3e%e6%f8%e5%e4%e2%e3%eb%ea%ef%ee%f6%f4%f5%fc%fb%ff_xF8FE_.EML

不幸的是,我没有 Exchange Server,所以我无法判断它是否真的有效,但我希望它可以成为一个好的起点。

于 2012-08-02T19:30:04.000 回答