问题标签 [windows-1252]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
279 浏览

winforms - 如何编码 System::String 以便它显示具有 Windows-1252 编码的文本?

我有一个带有 serialPort 组件的 Windows 窗体,我使用 DataReceived 事件处理程序来处理接收缓冲区中的数据。我使用返回 String^ 的 ReadExisting 方法,因为它是最可靠的方法,我可以收集接收缓冲区中的所有数据而不会丢失任何数据。像这样:

问题在于 ReadExisting() 方法返回的 String^ 值。如果我输入诸如“wêyÿØÿþÿý6”之类的字符,则仅显示十进制值小于127的字符,因此我从终端读取“w?y??????6”。

我想要的是将 ReadExisting() 方法返回的 String^ 值以 Windows-1252 编码格式编码,以便它可以识别具有 127-255 值的字符。我需要它是一个 String^ 变量,这样我就可以使用 StreamWriter 中的 Write() 方法将它写入我的文本文件中。

我试过搜索,发现与我想做的类似。所以这就是我所做的:

然后我写入String^ convertedSerialPort 和 StreamWriter。尽管如此,还是无济于事。输出还是一样的。127 以上的字符仍表示为“?”。这样做的正确方法应该是什么?也许我这样做的方式有问题。

0 投票
1 回答
525 浏览

java - 将 Windows-1252 文件转换为 UTF-8 文件

您好,我在这个简单的转换任务中遇到了一些问题。下面是我的代码(粗略但不那么复杂):

但是我得到与输入相同的输出,具有相同的编码格式。你看到无论如何都能提供帮助吗?

0 投票
2 回答
1943 浏览

java - 使用 windows-1252 读写文件

我正在尝试将包含一些德语字符的文件写入磁盘并使用Windows-1252编码读取它。我不明白为什么,但我的输出是这样的:

有什么想法吗?这是我的代码。你需要 spring-core 和 commons-io 来运行它。

0 投票
0 回答
123 浏览

linux - Windows 转 UTF-8 字符编码行为查询

一个关于在 UTF-8 下编译 Windows-1252 字符时的预期行为的简单查询。在 java 源代码上使用 ant 任务构建时,似乎会发生一些奇怪的字符编码。

例如,对于某些在 Windows 机器上通常编码为 \u2013 的字段字符,在 Linux 上转换为 \226。\226 的解释是什么?例如,它是否仍能在浏览器上正确呈现?

0 投票
1 回答
267 浏览

internet-explorer - 使用 XMLHttpRequest 覆盖 XML 文档中不正确的声明文本编码

我们的应用程序正在从具有不正确 XML 标头的源接收数据。尽管该帖子中的解决方法有效(插入 nginx 代理),但我们希望找到一个客户端解决方案,如果有的话。

那么,有没有办法拦截 XML 文档并强制将文档解释为 Windows 1251 而不是 UTF-8?XMLHttpRequest具有“overrideMimeType”属性,但没有“overrideEncoding”。

所有这些对 IE 来说都很重要,如果它遇到一个不可能的字符,它就完全无法解析文档。Chrome 和 Firefox 只显示问号字符,这很好。

0 投票
1 回答
2599 浏览

clojure - 翻译字符串的编码

我有一个采用 Windows-1252 编码的字符串,但需要转换为 UTF-8。

这适用于修复 UTF-8 文件的程序,该文件的字段包含以可引用打印的 Windows-1252 编码的俄语文本。这是解码quoted-printable的代码:

这是最终的代码:

它修复了(String. ... "Encoding")在所有连续运行的引用打印编码字符上使用的编码。原始函数试图解码对,因此它会跳过诸如的内容=3D,这是 . 的引用可打印实体=

0 投票
0 回答
198 浏览

php - Windows-1252?html实体的编码问题

我继承了一个数据库,该数据库在某些时候存在严重的字符集问题。我认为它最初是 Windows-1252,但已保存为 UTF-8,然后非 ASCII 字符已转换为十进制 HTML 实体。例子:

应该是:

应该是:

有谁知道这可以如何挽救?

注意请不要编辑这篇文章来改进格式,这样做你改变了实际数据。

0 投票
1 回答
3110 浏览

php - 如何将欧元 (€) 符号从 Windows-1252 转换为 UTF-8?

0 投票
0 回答
471 浏览

c++ - 如何使用 Rcpp 读取 Windows-1252 文件?

我想在将文件与 Rcpp 一起读入 Windows-1252 编码时强制输入格式。我需要这个,因为我在 Linux/Windows 环境之间切换并且文件始终采用 1252 编码。

我如何使其适应工作:

以上失败:

我也尝试过使用“Swedish_Sweden.1252”,这是我系统的默认设置,但无济于事。我已经尝试过#include <boost/locale.hpp>,但这似乎在 Rcpp (v 0.12.0)/BH boost (v. 1.58.0-1) 中不可用。

更新:

在深入研究之后,我不确定 RTools (v. 3.3) 中的 gcc (v. 4.6.3) 是否在语言环境支持下构建,这个 SO question指出了这种可能性。如果除了 "" 或 "C" 之外有任何参数可与 std::locale() 一起使用,知道会很有趣,我尝试了更多替代方案,但似乎没有任何效果。

后备解决方案

我并不完全满意,但似乎使用base::iconv()修复了字符的任何问题,无论原始格式如何,这要归功于from="WINDOWS-1252"强制以正确形式解释字符的参数,即如果我们想留在 Rcpp 我们可以简单做:

请注意,最好将函数包装在 R 中,而不是从 C++ 中获取函数然后从那里调用它,它既减少了代码,又将性能提高了 2 倍(通过微基准检查):

0 投票
1 回答
5055 浏览

javascript - Javascript 将 windows-1252 编码转换为 UTF-8

如何转换以下字符串:

使用 javascript 转换为 UTF-8,这样%E8会变成%C3%A8?

原因是这个角色似乎绊倒了decodeURIComponent

您可以通过将字符串放入http://meyerweb.com/eric/tools/dencoder/并查看控制台错误来测试它Uncaught URIError: URI malformed

我正在专门寻找可以解码整个 html 文档的东西,该文档声称被windows-1252编码为 UTF-8,这是我假设这个%E8字符来自的地方。

谢谢!