问题标签 [windows-1252]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

158 问题

0 投票

0 回答

279 浏览

winforms - 如何编码 System::String 以便它显示具有 Windows-1252 编码的文本？

我有一个带有 serialPort 组件的 Windows 窗体，我使用 DataReceived 事件处理程序来处理接收缓冲区中的数据。我使用返回 String^ 的 ReadExisting 方法，因为它是最可靠的方法，我可以收集接收缓冲区中的所有数据而不会丢失任何数据。像这样：

问题在于 ReadExisting() 方法返回的 String^ 值。如果我输入诸如“wêyÿØÿþÿý6”之类的字符，则仅显示十进制值小于127的字符，因此我从终端读取“w?y??????6”。

我想要的是将 ReadExisting() 方法返回的 String^ 值以 Windows-1252 编码格式编码，以便它可以识别具有 127-255 值的字符。我需要它是一个 String^ 变量，这样我就可以使用 StreamWriter 中的 Write() 方法将它写入我的文本文件中。

我试过搜索，发现这与我想做的类似。所以这就是我所做的：

然后我写入String^ convertedSerialPort 和 StreamWriter。尽管如此，还是无济于事。输出还是一样的。127 以上的字符仍表示为“？”。这样做的正确方法应该是什么？也许我这样做的方式有问题。

2015-02-05T08:12:55.783

0 投票

1 回答

525 浏览

java - 将 Windows-1252 文件转换为 UTF-8 文件

您好，我在这个简单的转换任务中遇到了一些问题。下面是我的代码（粗略但不那么复杂）：

但是我得到与输入相同的输出，具有相同的编码格式。你看到无论如何都能提供帮助吗？

java file text utf-8 windows-1252

2015-02-17T11:01:32.353

0 投票

2 回答

1943 浏览

java - 使用 windows-1252 读写文件

我正在尝试将包含一些德语字符的文件写入磁盘并使用Windows-1252编码读取它。我不明白为什么，但我的输出是这样的：

有什么想法吗？这是我的代码。你需要 spring-core 和 commons-io 来运行它。

java encoding windows-1252

2015-04-23T08:54:07.947

0 投票

0 回答

123 浏览

linux - Windows 转 UTF-8 字符编码行为查询

一个关于在 UTF-8 下编译 Windows-1252 字符时的预期行为的简单查询。在 java 源代码上使用 ant 任务构建时，似乎会发生一些奇怪的字符编码。

例如，对于某些在 Windows 机器上通常编码为 \u2013 的字段字符，在 Linux 上转换为 \226。\226 的解释是什么？例如，它是否仍能在浏览器上正确呈现？

linux windows utf-8 character-encoding windows-1252

2015-05-01T11:10:10.563

0 投票

1 回答

267 浏览

internet-explorer - 使用 XMLHttpRequest 覆盖 XML 文档中不正确的声明文本编码

我们的应用程序正在从具有不正确 XML 标头的源接收数据。尽管该帖子中的解决方法有效（插入 nginx 代理），但我们希望找到一个客户端解决方案，如果有的话。

那么，有没有办法拦截 XML 文档并强制将文档解释为 Windows 1251 而不是 UTF-8？XMLHttpRequest具有“overrideMimeType”属性，但没有“overrideEncoding”。

所有这些对 IE 来说都很重要，如果它遇到一个不可能的字符，它就完全无法解析文档。Chrome 和 Firefox 只显示问号字符，这很好。

internet-explorer character-encoding xmlhttprequest windows-1252

2015-05-04T02:51:05.950

0 投票

1 回答

2599 浏览

clojure - 翻译字符串的编码

我有一个采用 Windows-1252 编码的字符串，但需要转换为 UTF-8。

这适用于修复 UTF-8 文件的程序，该文件的字段包含以可引用打印的 Windows-1252 编码的俄语文本。这是解码quoted-printable的代码：

这是最终的代码：

它修复了(String. ... "Encoding")在所有连续运行的引用打印编码字符上使用的编码。原始函数试图解码对，因此它会跳过诸如的内容=3D，这是 . 的引用可打印实体=。

clojure character-encoding decode windows-1252

2015-05-13T03:57:14.050

0 投票

0 回答

198 浏览

php - Windows-1252？html实体的编码问题

我继承了一个数据库，该数据库在某些时候存在严重的字符集问题。我认为它最初是 Windows-1252，但已保存为 UTF-8，然后非 ASCII 字符已转换为十进制 HTML 实体。例子：

应该是：

和

应该是：

有谁知道这可以如何挽救？

注意请不要编辑这篇文章来改进格式，这样做你改变了实际数据。

php utf-8 character-encoding html-entities windows-1252

2015-05-26T23:47:17.257

0 投票

1 回答

3110 浏览

php - 如何将欧元 (€) 符号从 Windows-1252 转换为 UTF-8？

php encoding utf-8 windows-1252

2015-06-04T09:31:07.593

0 投票

0 回答

471 浏览

c++ - 如何使用 Rcpp 读取 Windows-1252 文件？

我想在将文件与 Rcpp 一起读入 Windows-1252 编码时强制输入格式。我需要这个，因为我在 Linux/Windows 环境之间切换并且文件始终采用 1252 编码。

我如何使其适应工作：

以上失败：

我也尝试过使用“Swedish_Sweden.1252”，这是我系统的默认设置，但无济于事。我已经尝试过#include <boost/locale.hpp>，但这似乎在 Rcpp (v 0.12.0)/BH boost (v. 1.58.0-1) 中不可用。

更新：

在深入研究之后，我不确定 RTools (v. 3.3) 中的 gcc (v. 4.6.3) 是否在语言环境支持下构建，这个 SO question指出了这种可能性。如果除了 "" 或 "C" 之外有任何参数可与 std::locale() 一起使用，知道会很有趣，我尝试了更多替代方案，但似乎没有任何效果。

后备解决方案

我并不完全满意，但似乎使用base::iconv()修复了字符的任何问题，无论原始格式如何，这要归功于from="WINDOWS-1252"强制以正确形式解释字符的参数，即如果我们想留在 Rcpp 我们可以简单做：

请注意，最好将函数包装在 R 中，而不是从 C++ 中获取函数然后从那里调用它，它既减少了代码，又将性能提高了 2 倍（通过微基准检查）：

c++locale rcpp windows-1252

2015-07-28T08:15:16.757

0 投票

1 回答

5055 浏览

javascript - Javascript 将 windows-1252 编码转换为 UTF-8

如何转换以下字符串：

使用 javascript 转换为 UTF-8，这样%E8会变成%C3%A8?

原因是这个角色似乎绊倒了decodeURIComponent

您可以通过将字符串放入http://meyerweb.com/eric/tools/dencoder/并查看控制台错误来测试它Uncaught URIError: URI malformed

我正在专门寻找可以解码整个 html 文档的东西，该文档声称被windows-1252编码为 UTF-8，这是我假设这个%E8字符来自的地方。

谢谢！

javascript encoding utf-8 windows-1252

2015-08-24T05:43:53.150

1 2 3 4 5 6 7 8 9 10

问题标签 [windows-1252]

这是最终的代码：

更新：

后备解决方案

Reference