10

以下是文件名的一些示例:

漢語.jpg (Chinese)
Федерация.jpg (Russian)
AbÇöişÜĞ.jpg (Turkish, ISO-8859-9)
...

我试过rawurlencode(mb_convert_encoding($file, "UTF-8", mb_detect_encoding($file)))了,但这不起作用,所有中文和俄文字符都打印为 %3F(常规问号),所有土耳其文字符都被删除。

我正在 Windows,PHP 5.3 上进行测试。

我找到的唯一解决方案是显式输入编码:rawurlencode(mb_convert_encoding($file, "UTF-8", "ISO-8859-9"))这仅适用于土耳其语字符。

顺便说一句,mb_detect_encoding($file)上述文件总是返回“UTF-8”。

编辑:
运行以下代码后,我认为mb_convert_encoding()无法解决我的问题:

$iterator = new RecursiveIteratorIterator(new RecursiveDirectoryIterator("mp", FilesystemIterator::UNIX_PATHS));
$iterator = new RegexIterator($iterator, '/^.+\.(gif|jpg|jpeg|png)$/i', RegexIterator::GET_MATCH);

foreach ($iterator as $file)
{
    foreach (mb_list_encodings() as $encoding)
        var_dump(rawurlencode(mb_convert_encoding($file[0], "UTF-8", $encoding)) . " : " . $encoding);
}

我想这是关于编码的事情,但我不知道该怎么做。

4

1 回答 1

1

所以,主要的是大多数传输(网络、文件、rpc)最多需要一个字节的字符。URL 编码 (%FF) 要求输入数据也是每个字符一个字节。

所以你需要做的是使用 UTF8。它将采用多字节字符并从中生成一个 1 字节字符的字符串。从这个字符串,你可以做正常 ascii 可以做的事情。

你想要做的是为 php 显式设置编码:

mb_internal_encoding("UTF-8");

现在您的所有内部字符串和文件名等都将采用 UTF-8(单字节)编码。从这里您可以回显文件名 AS-IS,它将作为编码数据命中传输。从 javascript,您所要做的就是使用 AJAX 发送一个请求,它会自动为您整齐地解码,准备好在浏览器中使用:) 只需确保您在 html 文件中设置了您的内容类型,因为这样将用作您的默认 JS 编码。

<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″ />
于 2012-04-05T19:11:41.587 回答