问题标签 [cp1252]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
macos - RTF CP1252 转文本 UTF-8
这是我需要在 MAC OSX zshell 中转换为纯文本的文件。 http://narod.ru/disk/6431540001/Test_rtf.rtf.html
我试过 unrtf、rtf2txt、rtf2html = 没有结果。他们无法转换 ru_cp1252。我也试过
unrtf 文件.rtf | iconv -f cp1252 -t UTF-8 没有结果。
我会对任何解决方案感到满意:shell/perl/python/ruby
如果您不想下载该文件,则有一部分 rtf 文件,正如我在带有 cat 的 zshell 中看到的那样:
java - 在java中使用CP1252编码解码Inputsteam
我通过 ExtJS 从发布请求中收到的 Inputstream 采用 CP1252 编码。我如何解码 Inputsteam 以便我可以使用 json 字符串并将其转换为适当的 java bean。
我通过使用 InputStreamReader 的 getEncoding() 方法找到了编码。
ExtJs 以以下格式发送数据:
需要将其转换为:
java - Excel 电子表格中的字符编码(以及用于解码的 Java 字符集)
我正在使用 JExcel 库来阅读 excel 电子表格。电子表格上的每个单元格都可能包含 44 种语言(英语、葡萄牙语、法语、中文等)中的任何一种的本地化字符串。今天我没有告诉 API 任何关于它应该使用的编码的信息。它处理中文还可以,但它总是搞砸葡萄牙语和德语。不知何故,默认编码(我的开发盒上的 MacRoman,生产上的 UTF-8)无法正确解释它从 excel 工作簿中提取的字符串。JExcel 解释文件字符编码的方式一定有问题。
话虽如此...
excel工作簿中的所有字符串是否都使用相同的字符集进行编码?
是否有工作簿元数据我可以问这个字符集是什么(我还没有找到)?
如果我通过 jchardet (http://jchardet.sourceforge.net/) 之类的东西运行所有单元格,是否能够预测整个工作簿的字符编码(这几乎取决于第一个问题是“是的,给定工作簿中的所有字符串都使用相同的字符集进行编码”)?
这么多问题,这么少时间。
python - cp1252 编码字符的二进制表示
我在哪里可以找到封装在 Windows 的 cp1252 字符库中的字符的二进制表示(例如 •、†、...等)?
java - 在 Java 中将字符串从 Windows 字符集转换为 UTF 8
所以我必须为从 .bat 文件调用的 Java 应用程序提供一些参数。这样做会使参数具有系统的字符集编码,这会使某些字符显示错误。我试过这个
还尝试了此列表中的其他一些http://docs.oracle.com/javase/1.4.2/docs/guide/intl/encoding.doc.html并且没有一个成功。我还能如何将字符串从 Windows 字符集编码为 Java 的 UTF 8?提前非常感谢!
问候,罗德里戈。
编辑:我在 .bat 中给出的参数是 Martín,输出(显示的 JLabel)显示了这个 Martín。
utf-8 - 在 Windows 中将 cp1252 批量转换为 utf-8
因此,我一直在尝试使用我在网上找到的提示和 trix 将大型 Java 源代码树从 cp1252 转换为 UTF-8,特别是在这里。问题是,我在 Windows 上;我不做VB;Cygwin 的 iconv 没有-o
切换。
我第一次尝试使用的行是:
这会{}.converted
在工作目录中创建一个文件,而第二个文件-exec
由于显而易见的原因而失败。
在 iconv 表达式周围加上引号:
导致以下错误:
尽管手动执行单个表达式效果很好。
我已经尝试过随机引用,但似乎没有任何效果,我错过了什么?为什么它不起作用..?
提前谢谢,拉斯
java - 如何检测Java中的字符集?
半年前,我遇到了烦人的问题。仍然无法修复它。问题在于 log4j-logging,其中默认字符集是 utf 8。
有时我会收到不同编码的消息,CP1252。(没有办法改变这一点)。因此,登录 utf8 会使文本不可读。我可以以某种方式修复编码,并且此文本将在日志中可读。
但是,如果我将该“编码修复”应用于正常消息,它将被搞砸。我需要知道是否真的需要这种转换。不幸的是,我没有想法。
encoding - 十六进制编辑 UTF-8 文件
我正在尝试使用 HEX 编辑器创建一个 UTF-8/no-BOM 文件。我想要的 UTF 字符是e2 82 ae
UTF-8 格式的 TUGRIK SIGN。
我用 N++ 创建了一个UTF-8/no BOM 文件,复制了 N++ 中的字符并保存了文件。瞧,在 HEX 编辑器中看起来不错,太棒了e2 82 ae
!
所以我尝试了另一种方式,将 3 个字节保存e2 82 ae
到带有 wxHexEdtior 的文件中。废话,N++ 出于某种原因认为该文件是ANSI(Latin1)编码的。
我完全不明白。会不会和windows -CP1252-编码有冲突?
另一个有趣的事情(我也完全不明白)是 wxHexEditor 显示了一些文件的反汇编。
N++ 创建文件的反汇编对 wxHexEditor 是可以的,但是 wxHexEditor 创建的文件反汇编无效。
如果有人能向我解释这种黑魔法,我会非常高兴。
pdf - CP1252 中标准 PDF 字体的 Adobe Font Metrics
我需要 14 种标准 PDF 字体的指标。
我从 Adobe 下载了以下内容,但它似乎使用 ISO-8859-1 编码,而不是 CP1252: https ://partners.adobe.com/public/developer/en/pdf/Core14_AFMs.zip
所以它缺少代码点 127 到 142(例如,省略号字符)。
我在哪里可以下载这些 Type1 字体的 CP1252 版本?谢谢。
bash - Cygwin终端不显示某些字符?
我正在运行一个股票 Cygwin 安装,并wget
添加了包。
如果我运行命令
我明白了;注意字符显示不正确
如果我只是下载文件,记事本中的一切看起来都很好。