问题标签 [iconv]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2345 浏览

php - Zend 框架和使用 iconv 的字符串转换

一个站点被移动到另一台安装了 Solaris 和其他 iconv 设置的服务器。现在,当我使用 Zend Framework 中的“StringLength”函数验证任何内容时,我的脚本失败并出现以下错误:

据我了解,服务器确实知道“UCS-4LE”,这是主要问题。

服务器管理员回答说他可以解决这个问题。您知道如何在此服务器上设置 ZF 吗?

0 投票
1 回答
889 浏览

ruby - 使用 Ruby 上传文件字符集转换

我有一个应用程序,我们让我们的客户将 csv 文件上传到我们的服务器。然后,我们处理 csv 中的数据并将其放入我们的数据库中。我们遇到了一些字符集问题,尤其是在处理 JSON 时,特别是一些未转换的 UTF-8 字符在 JSON 响应中破坏了 IE。

在我们开始处理之前,有没有办法将上传的 csv 文件转换为 UTF-8?有没有办法确定上传文件的字符编码?我已经玩过 iconv 了,但我们并不总是确定上传的文件会有什么编码。谢谢。

0 投票
2 回答
13889 浏览

c++ - iconv编码转换问题

我在将字符串从 utf8 转换为 gb2312 时遇到问题。我的转换功能如下

这是我如何使用它的示例:

编辑:我大多数时候都会遇到 E2BIG 错误。

0 投票
1 回答
1050 浏览

python - 在 shell 中将文件从 iso-8859-1 转换为 utf-8 iconv 与使用子进程从 python 调用它的不同结果

好吧,这可能是一个简单的问题,坦率地说,我对编码和所有这些事情有点困惑。

假设我有一个01234.txtiso-8859-1 文件。

当我做:

iconv --from-code=iso-8859-1 --to-code=utf-8 01234.txt > 01234_utf8.txt

它给了我想要的结果,但是当我用 python 做同样的事情并使用子进程时:

我得到几乎相同的结果,但是新文件丢失了,例如最后一个和最后一个之前的行的一部分。

这是两个文件的最后三行: iconv 结果:

795719000|MARIA TERESA MARROU VILLALOBOS|107
259871385|CHRISTIAM ALBERTO SUAREZ VILLALOBOS|107
311015100|Jorge MEZA CERVANTES|09499386

蟒蛇结果:

795719000|MARIA TERESA MARROU VILLALOBOS|107
259871385|CHRISTIAM

编辑:在我尝试使用coding: utf-8and的python文件中coding: iso-8859-1不能同时使用)。

编辑:我在 bpython 中使用了编解码器,效果很好。从文件中使用它时,我得到了不想要的结果。

编辑:我正在使用 linux (Ubuntu 9.10) 和 python 2.6.2。

有什么建议么?

0 投票
0 回答
507 浏览

php - 如何在 PHP 安装中升级 iconv 模块?

我正在尝试在具有 iconv 库版本 2.5 的 Windows 2003 服务器上安装 PHP。但是,如果我下载 PHP 5.2.13 二进制文件并尝试安装它,iconv 库版本被列为 1.1。

反正有没有单独升级这个模块?我错过了什么吗?

0 投票
1 回答
5536 浏览

sql - 如何使用 iconv 将存储为 LATIN1 ( sql ) 的西里尔字母转换为真正的 UTF8 西里尔字母?

0 投票
2 回答
14219 浏览

ruby - Tab / LF / CR unicode 字符

我有一个包含制表符分隔字段行的 Unicode 文件(UTF-16 FFFE little-endian BOM)。

在 ruby​​ 中使用 .split阅读拆分 unicode(我认为) ,我将使用 Ruby 拆分(文件到行,然后行到字段)。

顺便说一句,Unicode 字符是什么:

  • 如果
  • 标签

谢谢!

0 投票
1 回答
2114 浏览

utf-8 - 可以修复乱码的中文文件名吗?

我正在通过 FTP 下载一些带有中文名称(BIG5 编码)的文件,而 Filezilla 将这些文件名显示为垃圾(因为 FTP 无法处理除 ASCII 和 UTF-8 之外的任何编码,至少符合标准的编码)。

给定带有乱码的文件名,鉴于我已经知道源编码,我是否可以修复编码并获得正确的文件名字符串?FTP 客户端是否会将 BIG5 误解为 UTF-8 插入字节,从而使转换回 BIG5 变得困难?

我建议的步骤(在 Java 中): 1. 使用 File 对象获取乱码文件名。2. getbytes 使用 UTF-8。3. 使用 BIG5 中的这些字节创建一个新字符串。4. 将解码后的文件名写回文件。

上述方法行得通吗?

0 投票
1 回答
5042 浏览

utf-8 - 如何将非拉丁编码文本转换为 UTF-8,或使它们在同一页面上共存?

再会,

我有一个脚本可以抓取远程页面的标题/描述并将这些值打印到相应的charset=UTF-8编码页面中。这就是问题所在,每当远程页面使用非拉丁字符编码(如阿拉伯文、俄文、中文、日文等)进行编码时,导入的值就会打印为乱码。

我尝试通过任何一个iconvmb_convert_encoding转换器传递这些值,但没有太大成功。

然后,我尝试先检测远程编码,然后将演示页面的编码更改为远程编码,而不是当前的 utf-8,这适用于导入的值,但页面上该语言的其他现有 utf-8 内容反而会乱码。

示例:
如果我尝试将这些值从俄语windows-1251导入到具有混合英语/俄语内容的 UTF-8 编码页面中。我使用 iconv 或 mb_convert_encoding 将导入的非 utf-8 字符串更改为 utf-8。

我试过了:
$RemoteValue = iconv($RemoteEncoding, 'UTF-8', $RemoteValue);
或者
$RemoteValue mb_convert_encoding($RemoteValue, "UTF-8", $RemoteEncoding);
没有
$RemoteValue mb_convert_encoding($RemoteValue, "UTF-8", "auto");
成功。

如果我检测到远程页面已windows-1251编码并且我将演示页面(已经有 UTF-8 编码的混合语言内容)更改为与远程页面相似,那么现有页面上的日语 utf-8 内容就会出现乱码。 .

  • 2 个不同编码的字符串可以在同一页面上共存(例如 utf-8 和 windows-1251)吗?
  • 我是否正确使用转换器?关于为什么它们不起作用的任何提示?
  • 有没有更好的方法来做到这一点?

谢谢您的帮助

0 投票
2 回答
1249 浏览

ruby-on-rails - 将 jruby 1.8 字符串转换为 windows 编码?

我想从我的 jruby on rails webapp 导出一些数据到 excel,所以我创建了一个 csv 字符串并将其作为下载发送到客户端使用

该文件似乎是 Excel 无法正确读取的 UTF-8。我搜索了这个问题,发现 iconv 可以转换编码。我尝试这样做:

但是当我发送转换后的文本时,它没有任何区别。它仍然是 UTF-8,Excel 无法读取特殊字符。有几种使用 iconv 的解决方案,所以这似乎对其他人有用。当我使用 iconv 手动转换 linux shell 上的文件时,它可以工作。

我究竟做错了什么?有没有更好的办法?

我正在使用: - jruby 1.3.1 (ruby 1.8.6p287) (2009-06-15 2fd6c3d) (Java HotSpot(TM) Client VM 1.6.0_19) [i386-java] - Debian Lenny - Glassfish 应用服务器 - Iceweasel 3.0。 6

编辑:我是否必须包含一些宝石才能使用 iconv?

解决方案:S.Mark 指出了这个解决方案:你必须使用 UTF-16LE 编码才能让 excel 理解它,像这样:

谢谢,S.Mark 的回答。