问题标签 [windows-1252]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
winforms - 如何编码 System::String 以便它显示具有 Windows-1252 编码的文本?
我有一个带有 serialPort 组件的 Windows 窗体,我使用 DataReceived 事件处理程序来处理接收缓冲区中的数据。我使用返回 String^ 的 ReadExisting 方法,因为它是最可靠的方法,我可以收集接收缓冲区中的所有数据而不会丢失任何数据。像这样:
问题在于 ReadExisting() 方法返回的 String^ 值。如果我输入诸如“wêyÿØÿþÿý6”之类的字符,则仅显示十进制值小于127的字符,因此我从终端读取“w?y??????6”。
我想要的是将 ReadExisting() 方法返回的 String^ 值以 Windows-1252 编码格式编码,以便它可以识别具有 127-255 值的字符。我需要它是一个 String^ 变量,这样我就可以使用 StreamWriter 中的 Write() 方法将它写入我的文本文件中。
我试过搜索,发现这与我想做的类似。所以这就是我所做的:
然后我写入String^ converted
SerialPort 和 StreamWriter。尽管如此,还是无济于事。输出还是一样的。127 以上的字符仍表示为“?”。这样做的正确方法应该是什么?也许我这样做的方式有问题。
java - 将 Windows-1252 文件转换为 UTF-8 文件
您好,我在这个简单的转换任务中遇到了一些问题。下面是我的代码(粗略但不那么复杂):
但是我得到与输入相同的输出,具有相同的编码格式。你看到无论如何都能提供帮助吗?
java - 使用 windows-1252 读写文件
我正在尝试将包含一些德语字符的文件写入磁盘并使用Windows-1252
编码读取它。我不明白为什么,但我的输出是这样的:
有什么想法吗?这是我的代码。你需要 spring-core 和 commons-io 来运行它。
linux - Windows 转 UTF-8 字符编码行为查询
一个关于在 UTF-8 下编译 Windows-1252 字符时的预期行为的简单查询。在 java 源代码上使用 ant 任务构建时,似乎会发生一些奇怪的字符编码。
例如,对于某些在 Windows 机器上通常编码为 \u2013 的字段字符,在 Linux 上转换为 \226。\226 的解释是什么?例如,它是否仍能在浏览器上正确呈现?
internet-explorer - 使用 XMLHttpRequest 覆盖 XML 文档中不正确的声明文本编码
我们的应用程序正在从具有不正确 XML 标头的源接收数据。尽管该帖子中的解决方法有效(插入 nginx 代理),但我们希望找到一个客户端解决方案,如果有的话。
那么,有没有办法拦截 XML 文档并强制将文档解释为 Windows 1251 而不是 UTF-8?XMLHttpRequest具有“overrideMimeType”属性,但没有“overrideEncoding”。
所有这些对 IE 来说都很重要,如果它遇到一个不可能的字符,它就完全无法解析文档。Chrome 和 Firefox 只显示问号字符,这很好。
clojure - 翻译字符串的编码
我有一个采用 Windows-1252 编码的字符串,但需要转换为 UTF-8。
这适用于修复 UTF-8 文件的程序,该文件的字段包含以可引用打印的 Windows-1252 编码的俄语文本。这是解码quoted-printable的代码:
这是最终的代码:
它修复了(String. ... "Encoding")
在所有连续运行的引用打印编码字符上使用的编码。原始函数试图解码对,因此它会跳过诸如的内容=3D
,这是 . 的引用可打印实体=
。
php - Windows-1252?html实体的编码问题
我继承了一个数据库,该数据库在某些时候存在严重的字符集问题。我认为它最初是 Windows-1252,但已保存为 UTF-8,然后非 ASCII 字符已转换为十进制 HTML 实体。例子:
应该是:
和
应该是:
有谁知道这可以如何挽救?
注意请不要编辑这篇文章来改进格式,这样做你改变了实际数据。
c++ - 如何使用 Rcpp 读取 Windows-1252 文件?
我想在将文件与 Rcpp 一起读入 Windows-1252 编码时强制输入格式。我需要这个,因为我在 Linux/Windows 环境之间切换并且文件始终采用 1252 编码。
我如何使其适应工作:
以上失败:
我也尝试过使用“Swedish_Sweden.1252”,这是我系统的默认设置,但无济于事。我已经尝试过#include <boost/locale.hpp>
,但这似乎在 Rcpp (v 0.12.0)/BH boost (v. 1.58.0-1) 中不可用。
更新:
在深入研究之后,我不确定 RTools (v. 3.3) 中的 gcc (v. 4.6.3) 是否在语言环境支持下构建,这个 SO question指出了这种可能性。如果除了 "" 或 "C" 之外有任何参数可与 std::locale() 一起使用,知道会很有趣,我尝试了更多替代方案,但似乎没有任何效果。
后备解决方案
我并不完全满意,但似乎使用base::iconv()
修复了字符的任何问题,无论原始格式如何,这要归功于from="WINDOWS-1252"
强制以正确形式解释字符的参数,即如果我们想留在 Rcpp 我们可以简单做:
请注意,最好将函数包装在 R 中,而不是从 C++ 中获取函数然后从那里调用它,它既减少了代码,又将性能提高了 2 倍(通过微基准检查):
javascript - Javascript 将 windows-1252 编码转换为 UTF-8
如何转换以下字符串:
使用 javascript 转换为 UTF-8,这样%E8
会变成%C3%A8
?
原因是这个角色似乎绊倒了decodeURIComponent
您可以通过将字符串放入http://meyerweb.com/eric/tools/dencoder/并查看控制台错误来测试它Uncaught URIError: URI malformed
我正在专门寻找可以解码整个 html 文档的东西,该文档声称被windows-1252
编码为 UTF-8,这是我假设这个%E8
字符来自的地方。
谢谢!