问题标签 [cp1252]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1815 浏览

javascript - 转换为 8 位 cp1251 或 cp1252 的 blob

我需要使用 blob 将 utf 编码为 8 位 cp1251 或 cp1252 的解决方案

我设法更改了 包括 windows 1251 在内的https://github.com/b4stien/js-csv-encoding,但存在无法解决的问题:

不幸的是,noscript 不允许在关闭脚本的页面上加载外部 javascript。

因此,无法在书签中使用 js-csv-encoding 以及加载 jquery!禁用 noscript,尤其是在崩溃和幽灵之后,根本不安全。

因此,只剩下用原生 javascript 编写的小脚本版本。如果您找到另一种在关闭 noscript 的情况下运行 jquery 的方法,那么找到解决方案会更容易,尽管我怀疑它是否可能。

一个好的解决方案是 https://www.npmjs.com/package/windows-1251https://www.npmjs.com/package/windows-1252 但是,将两字节文本转码为通过这些脚本的单字节文本。例如:

已经有很多尝试使用 windows1251,例如这些:

使用 windows-1251 的编码或解码不会将脚本转换为 8 位格式。在 js-csv-encoding 中,csvContentEncoded 用于转码:

尝试使用类似的东西失败了。也许你需要一些技巧,只是把 windows-1251 不够,因为 js 存储在 utf8 中,那么很可能你需要在最后添加到 1251 的转换。部分代码:js-csv-encoding。

我还尝试使用 charcode 进行转换,不是保存到服务器而是保存到计算机,因此使用 urlencode .. 不是正确的解决方案,因为在这种情况下,我必须将文本编码为可读的文本。

当然,很难找到一个不超过 4000-5000 个字符的小书签的解决方案,而且我的知识还不够。如果有借助其他脚本的解决方案,例如通过值表重新编码,这也可以是一个解决方案。

0 投票
1 回答
353 浏览

windows-1252 - 编码和字符集有什么区别?cp1252和windows1252

编码字符集cp1252和windows1252有什么区别?还是一样?

0 投票
2 回答
1698 浏览

utf-8 - 对文件夹中的所有文件使用 iconv 将 cp1252 转换为 utf-8

我需要使用 iconv 将 cp1252 文件转换为 UTF-8,这对于一个文件来说效果很好,但是当我尝试多个文件时它不起作用。

我试试这个

它说

找不到文件 - '*.csv'

0 投票
0 回答
167 浏览

linux - Linux 文件大小、java.nio 和 CP1252 多字节字符集

我有一个 Cp1252 文件,我想将其读取为二进制文件。

ls -al 从终端显示其大小为 10 个字节。

然而,这个 java 片段报告了 18 个字节:

该文件包含 6 个 ascii 字符 + 4 个 Cp1252 字符。我的理解是 10 字节是文件系统上这个文件的正确大小。更多细节:尝试使用以下方式读取文件内容时:

我得到 18 个字节,因为每个 Cp1252 字符被加载为 3 个字节。在文件中我有不同的 Cp1252 字符,缓冲区显示它们都是相同的 - 这肯定是不正确的。

有两个问题困扰着我:

  1. 该文件在文件系统上实际占用多少字节。

  2. 假设它是 10 字节长,如何将其读取为“原始”

更新: 我使用一个小型 C 程序尝试了相同的操作,结果与预期一致:从文件中读取了 10 个字符,其中 4 个 Cp1252 的值都不同。

更新 2:

test.x10 包含 Cp1252 字符:aöaäaüaßbb

上面给出的 C 代码打印出来:97 246 97 228 97 252 97 223 98 98

Files.readAllBytes 读取:97 239 191 189 97 239 191 189 97 239 191 189 97 239 191 189 98 98

这是十六进制转储:

0 投票
1 回答
469 浏览

java - 默认 java file.encoding 是 Cp1252 但创建的文件是 ISO-8859-1

我检查了 jvm 中的默认文件编码:

但是当我使用 FileWriter 编写新文件时:

然后,我使用 cmd 重新检查编码文件:

为什么字符集不是 Cp1252 而不是 iso-8859-1?

0 投票
1 回答
650 浏览

ruby - 为什么 Ruby 无法将 CP-1252 转换为 UTF-8?

我有一个从 Excel 保存的 CSV 文件,它是 CP-1252/Windows-1252。我尝试了以下方法,但它仍然损坏。为什么?

结果

但是它在控制台中工作

我可以在 Notepad++ 中打开 CSV 文件Encoding > Character Sets > Western European > Windows-1252,看到正确的字符,然后Encoding > Convert to UTF-8. 但是,我希望 Ruby 处理很多文件。

类似:如何在 Rails 中解析 CSV 期间更改编码。但这并不能解释为什么会失败。

Ruby 2.4,参考:https ://ruby-doc.org/core-2.4.3/IO.html#method-c-read

0 投票
2 回答
234 浏览

python - Url 以 UTF-8 编码,但 Python 试图将其读取为 cp1256

我正在尝试运行此代码:

但是我在命令提示符下得到了这个输出:

我要读取的 url 是 UTF-8,但 python 正在尝试读取 cp1252。有没有办法让 python 使用 utf8.py 而不是 cp1252.py?

PS,我的一个朋友可以在他的 MAC 上完美地运行这段代码。这更像是Windows问题而不是python问题吗?

0 投票
1 回答
501 浏览

python - Python TypeError:使用“cp1252”编解码器编码失败

运行任何安装命令时出现此错误:

这种情况下的安装命令是

点安装 git+ https://github.com/coreylynch/pyFM

我究竟做错了什么?

我在 python 3.4.2、pip 10.0.1 和 Windows 10 上。

提前致谢。

0 投票
0 回答
27 浏览

java - 如何使正则表达式忽略 Cp1252 字符编码以外的字符

如果字符串中至少包含一个字母,我正在使用正则表达式进行匹配。但是当字符串包含特殊字符(不是常规的 Cp1252 编码)时,即使字符串具有其他字母,它也会给我不匹配的结果。这是我的代码

这是导致错误的字符串

将上面的字符串复制并粘贴到记事本中以查看特殊字符。

请让我知道如何过滤字符串中的这些特殊字符或任何解决方法以查找字符串是否包含字母。

0 投票
2 回答
164 浏览

java - 匕首输出java(char)134不起作用cp1252

通常我的程序应该将所有 CP1252 代码作为字符输出:

但输出是:(整个输出的片段!)

但是在https://en.wikipedia.org/wiki/Windows-1252中写到 134 是:†</p>

为什么不显示 † ?