我目前在客户端 JavaScript 中遇到一些字符编码问题。我的基本程序流程是这样的:客户端 JavaScript 使用漂亮的 FileReader 读取本地文本文件。然后我对字符串进行大量编辑,然后尝试为用户提供一种下载新的、更改的文件的方法。这是我的问题,我正在读取的文件(根据 Notepad++)是用 ANSI 编码的,而我要编写的文件也需要用 ANSI 编码。
当我尝试从这样的文件中读取时:
reader.readAsText(this.files[0], "ANSI");
...
cachedFile = e.target.result.split("\n");
console.log(cachedFile[179544]);
我的结果是这样的( Î 字符读取不正确):
name="�le-de-France"
但是,当我使用 ISO-8859-1 作为编码参数(完全随机选择)时,由于某种原因,结果是正确的:
name="Île-de-France"
所以很有可能我不知道发生了什么。因此,我将其保留为 ISO-8859-1 编码,进行了各种编辑,然后尝试准备下载。我不能简单地将其发布到未压缩的服务器并准备一个文件以供下载,因为坦率地说,这个文件相当大(~14 mb)。然而,它确实可以很好地压缩,因为它是纯文本。问题是我发现的任何 JavaScript 压缩库(比如 jszip 可以很好地让您生成文件并将其粘贴在 .zip 中)似乎保持 JavaScript 的内部字符串编码,我相信它是 UTF-16。.zip 文件也被编码为 base64(我刚刚在我的 PHP 服务器上解码)。当然,这样做会得到类似这样的最终结果:
name="ÃŽle-de-France"
所以这是我的问题,我有一个用 ANSI 编码的文件,我使用 ISO-8859-1 解析它,我用 UTF-16 编辑它,我需要找到一种方法将它恢复到 ANSI 并放到一个人的桌面上。是否有一种标准方法可以在压缩之前将 JavaScript 字符串转换为 ANSI,以便我可以将压缩文件提供给我的用户下载?或者有没有办法在服务器端使用 PHP 解压缩字符串,转换为 ANSI,然后提供下载?仅供参考,我当前的 PHP 代码是这样的:
<?php
$res = $_POST["saveString"];
$maybe = base64_decode($res);
header('Content-Type: application/download');
header('Content-Disposition: attachment; filename="genSave.zip"');
header("Content-Length: " . strlen($maybe));
echo $maybe;
?>