问题标签 [cp1252]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1094 浏览

macos - RTF CP1252 转文本 UTF-8

这是我需要在 MAC OSX zshell 中转换为纯文本的文件。 http://narod.ru/disk/6431540001/Test_rtf.rtf.html

我试过 unrtf、rtf2txt、rtf2html = 没有结果。他们无法转换 ru_cp1252。我也试过

unrtf 文件.rtf | iconv -f cp1252 -t UTF-8 没有结果。

我会对任何解决方案感到满意:shell/perl/python/ruby

如果您不想下载该文件,则有一部分 rtf 文件,正如我在带有 cat 的 zshell 中看到的那样:

0 投票
1 回答
1061 浏览

java - 在java中使用CP1252编码解码Inputsteam

我通过 ExtJS 从发布请求中收到的 Inputstream 采用 CP1252 编码。我如何解码 Inputsteam 以便我可以使用 json 字符串并将其转换为适当的 java bean。

我通过使用 InputStreamReader 的 getEncoding() 方法找到了编码。

ExtJs 以以下格式发送数据:

需要将其转换为:

0 投票
2 回答
30477 浏览

java - Excel 电子表格中的字符编码(以及用于解码的 Java 字符集)

我正在使用 JExcel 库来阅读 excel 电子表格。电子表格上的每个单元格都可能包含 44 种语言(英语、葡萄牙语、法语、中文等)中的任何一种的本地化字符串。今天我没有告诉 API 任何关于它应该使用的编码的信息。它处理中文还可以,但它总是搞砸葡萄牙语和德语。不知何故,默认编码(我的开发盒上的 MacRoman,生产上的 UTF-8)无法正确解释它从 excel 工作簿中提取的字符串。JExcel 解释文件字符编码的方式一定有问题。

话虽如此...

excel工作簿中的所有字符串是否都使用相同的字符集进行编码?

是否有工作簿元数据我可以问这个字符集是什么(我还没有找到)?

如果我通过 jchardet (http://jchardet.sourceforge.net/) 之类的东西运行所有单元格,是否能够预测整个工作簿的字符编码(这几乎取决于第一个问题是“是的,给定工作簿中的所有字符串都使用相同的字符集进行编码”)?

这么多问题,这么少时间。

0 投票
1 回答
286 浏览

python - cp1252 编码字符的二进制表示

我在哪里可以找到封装在 Windows 的 cp1252 字符库中的字符的二进制表示(例如 •、†、...等)?

0 投票
1 回答
5988 浏览

java - 在 Java 中将字符串从 Windows 字符集转换为 UTF 8

所以我必须为从 .bat 文件调用的 Java 应用程序提供一些参数。这样做会使参数具有系统的字符集编码,这会使某些字符显示错误。我试过这个

还尝试了此列表中的其他一些http://docs.oracle.com/javase/1.4.2/docs/guide/intl/encoding.doc.html并且没有一个成功。我还能如何将字符串从 Windows 字符集编码为 Java 的 UTF 8?提前非常感谢!

问候,罗德里戈。

编辑:我在 .bat 中给出的参数是 Martín,输出(显示的 JLabel)显示了这个 Martín。

0 投票
4 回答
4175 浏览

utf-8 - 在 Windows 中将 cp1252 批量转换为 utf-8

因此,我一直在尝试使用我在网上找到的提示和 trix 将大型 Java 源代码树从 cp1252 转换为 UTF-8,特别是在这里。问题是,我在 Windows 上;我不做VB;Cygwin 的 iconv 没有-o切换。

我第一次尝试使用的行是:

这会{}.converted在工作目录中创建一个文件,而第二个文件-exec由于显而易见的原因而失败。

在 iconv 表达式周围加上引号:

导致以下错误:

尽管手动执行单个表达式效果很好。

我已经尝试过随机引用,但似乎没有任何效果,我错过了什么?为什么它不起作用..?

提前谢谢,拉斯

0 投票
2 回答
3661 浏览

java - 如何检测Java中的字符集?

半年前,我遇到了烦人的问题。仍然无法修复它。问题在于 log4j-logging,其中默认字符集是 utf 8。

有时我会收到不同编码的消息,CP1252。(没有办法改变这一点)。因此,登录 utf8 会使文本不可读。我可以以某种方式修复编码,并且此文本将在日志中可读。

但是,如果我将该“编码修复”应用于正常消息,它将被搞砸。我需要知道是否真的需要这种转换。不幸的是,我没有想法。

0 投票
1 回答
5166 浏览

encoding - 十六进制编辑 UTF-8 文件

我正在尝试使用 HEX 编辑器创建一个 UTF-8/no-BOM 文件。我想要的 UTF 字符是e2 82 aeUTF-8 格式的 TUGRIK SIGN。

我用 N++ 创建了一个UTF-8/no BOM 文件,复制了 N++ 中的字符并保存了文件。瞧,在 HEX 编辑器中看起来不错,太棒了e2 82 ae

所以我尝试了另一种方式,将 3 个字节保存e2 82 ae到带有 wxHexEdtior 的文件中。废话,N++ 出于某种原因认为该文件是ANSI(Latin1)编码的。

我完全不明白。会不会和windows -CP1252-编码有冲突?

另一个有趣的事情(我也完全不明白)是 wxHexEditor 显示了一些文件的反汇编。

N++ 创建文件的反汇编对 wxHexEditor 是可以的,但是 wxHexEditor 创建的文件反汇编无效。

如果有人能向我解释这种黑魔法,我会非常高兴。

图 1

图 2

0 投票
1 回答
2690 浏览

pdf - CP1252 中标准 PDF 字体的 Adob​​e Font Metrics

我需要 14 种标准 PDF 字体的指标。

我从 Adob​​e 下载了以下内容,但它似乎使用 ISO-8859-1 编码,而不是 CP1252: https ://partners.adobe.com/public/developer/en/pdf/Core14_AFMs.zip

所以它缺少代码点 127 到 142(例如,省略号字符)。

我在哪里可以下载这些 Type1 字体的 CP1252 版本?谢谢。

0 投票
2 回答
5379 浏览

bash - Cygwin终端不显示某些字符?

我正在运行一个股票 Cygwin 安装,并wget添加了包。

如果我运行命令

我明白了;注意字符显示不正确

如果我只是下载文件,记事本中的一切看起来都很好。