问题标签 [cp1251]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1815 浏览

javascript - 转换为 8 位 cp1251 或 cp1252 的 blob

我需要使用 blob 将 utf 编码为 8 位 cp1251 或 cp1252 的解决方案

我设法更改了 包括 windows 1251 在内的https://github.com/b4stien/js-csv-encoding,但存在无法解决的问题:

不幸的是,noscript 不允许在关闭脚本的页面上加载外部 javascript。

因此,无法在书签中使用 js-csv-encoding 以及加载 jquery!禁用 noscript,尤其是在崩溃和幽灵之后,根本不安全。

因此,只剩下用原生 javascript 编写的小脚本版本。如果您找到另一种在关闭 noscript 的情况下运行 jquery 的方法,那么找到解决方案会更容易,尽管我怀疑它是否可能。

一个好的解决方案是 https://www.npmjs.com/package/windows-1251https://www.npmjs.com/package/windows-1252 但是,将两字节文本转码为通过这些脚本的单字节文本。例如:

已经有很多尝试使用 windows1251,例如这些:

使用 windows-1251 的编码或解码不会将脚本转换为 8 位格式。在 js-csv-encoding 中,csvContentEncoded 用于转码:

尝试使用类似的东西失败了。也许你需要一些技巧,只是把 windows-1251 不够,因为 js 存储在 utf8 中,那么很可能你需要在最后添加到 1251 的转换。部分代码:js-csv-encoding。

我还尝试使用 charcode 进行转换,不是保存到服务器而是保存到计算机,因此使用 urlencode .. 不是正确的解决方案,因为在这种情况下,我必须将文本编码为可读的文本。

当然,很难找到一个不超过 4000-5000 个字符的小书签的解决方案,而且我的知识还不够。如果有借助其他脚本的解决方案,例如通过值表重新编码,这也可以是一个解决方案。

0 投票
0 回答
110 浏览

swift - Alamofire请求中的字符集windows-1251?

帮助,我使用的服务器仅适用于字符集 windows-1251。但是 Alamofire 使用 utf8。我尝试更改标题,但这对我不起作用。如何将 Alamofire 与另一个字符集一起使用,而不是 utf8?

0 投票
4 回答
2549 浏览

python - 如何在 Python3 中将字符串从 cp1251 转换为 UTF-8?

一个非常简单的 Python 3.6 脚本需要帮助。

首先,它从使用 cp1251 编码的老式服务器下载 HTML 文件。

然后我需要将文件内容放入一个 UTF-8 编码的字符串中。

这是我正在做的事情:

这是错误:

我真的很感激任何帮助。

0 投票
1 回答
673 浏览

javascript - fs.readFileSync("./bank/"+client,'cp1251'); 正在抛出新的 ERR_INVALID_OPT_VALUE_ENCODING

我正在尝试从文件中读取(该文件是保加利亚语),并且使用 utf 8 它返回无意义的字符,所以我尝试了 cp1251 但它抛出:ERR_INVALID_OPT_VALUE_ENCODING。

0 投票
0 回答
3409 浏览

unicode - Visual Studio Code 无法在输出中编码西里尔字符

Visual Studio Code 中的输出无法解码西里尔字符:

Visual Studio Code 无法解码西里尔字符

相同的代码在PyCharm中运行良好:

相同的代码在 PyCharm 中运行良好

如何快速解决此问题?必须有一些简单的方法。

设置中的自动猜测编码不起作用,因为它用于文件,而不是输出。

编辑:问题是 VSCode 中的 Code Runner 扩展。禁用它或在终端中运行脚本可以完成这项工作。

0 投票
2 回答
221 浏览

perl - Perl - 在 cp1251 中复制到剪贴板

试图复制到 cp1251 中的剪贴板文本。

而不是西里尔字母“?” 粘贴在任何 Windows 应用程序中。如果我删除带有编码的行 - 西里尔字母会产生带有不同修饰符的“a'-s:

我想我错过了一些非常简单的东西,但我坚持下去了。有人可以帮我吗?

0 投票
1 回答
86 浏览

java - 当文件的名称可以采用不同的编码时,如何查找文件?

我有一堆名称用cp1251. 我还有一堆带有utf8编码名称的文件。我需要一种方法来用 Java 代码找到它们。此外,我无法使用convmvLinux 工具更改名称,因为有些旧系统也使用这些文件。

有没有办法在 Java 的文件或路径实用程序方法中传递编码?

如果我现在使用 Files.walk 并尝试查看文件名,它们就会被破坏并且看起来像一堆 ???????? 并且无法恢复(或者我找不到这样做的方法)。

代码:

将输出:

???...文件的真实名称是:тест файла с русскими символами.txt

系统语言环境是:

运行的JVM-Dfile.encoding=UTF-8

如果我这样做,ls | iconv -f "cp1251" -t "utf8"我会看到:

ls输出与 java 输出相同。

更新:@JosefZ 的建议链接也不起作用。

例子:

正如我们所看到的,它只是fffd- 所以名字被破坏了。

代码:

我的 Java 版本(在链接中建议它是 jvm 错误):java 版本“1.8.0_201”Java(TM) SE 运行时环境(构建 1.8.0_201-b09)Java HotSpot(TM) 64 位服务器 VM(构建 25.201 -b09,混合模式)

更新 2:@skomisa 建议无效。

代码:

结果:

如果我打印出我们可以看到的文件名的字节,那么如果我们这样做,path.getFileName()我们会得到一个破坏的名称。代码:

结果:

-17, -65, -67意味着?我认为

0 投票
1 回答
49 浏览

c# - C# 俄语 cp1251 编码/解码

我正在为俄语字母使用 ASCII 1251 表。所以我需要一个 C# 函数将 char 转换为 1251 十进制代码,反之亦然。

例如俄语“а”是 224,219 是“Ы”。

有什么方法可以不使用所有字母的硬编码值的字典吗?

0 投票
1 回答
58 浏览

mysql - 如何在 SELECT 语句中即时更改编码?

我有一个包含 cp1251_general_ci 排序规则的列的表。我不想更改列排序规则,但我想以 utf8 编码获取数据。

有没有办法以某种方式选择任何数据,使其看起来就像带有 utf8_general_ci 排序规则的数据?

即我需要这样的东西

0 投票
1 回答
155 浏览

pdf - 更改 pdf 文本编码

我有一个PDF文档(那是我的教科书),问题是虽然文本打印正常,但它是以一些随机字形的形式复制的。我发现,这是因为文本在 cp1251 上编码但试图解码为 cp1252(反之亦然 idk,但复制的字形属于 1252)。将文本从1252粘贴到解码器到1251我可以得到原始文本(图片相关)

在此处输入图像描述

为了解决我的文本搜索和复制问题,我只使用了 OCR,但也许有办法改变它在某些 pdf 标题中的编码?此外,我确实需要为学校研讨会复制一些插图,但 Inkscape 和 AI 仍然会在 1252 年输出这些字形。

在 Adob​​e Acrobat DC 中打开文字,我看到他在抱怨字体 1251 Times。在 Npp 我发现了这样的

通过用 1252 替换所有出现的 1251,我一无所获。这样做的正确方法是什么?有没有这样正确的方法?