问题标签 [cp1251]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - 转换为 8 位 cp1251 或 cp1252 的 blob
我需要使用 blob 将 utf 编码为 8 位 cp1251 或 cp1252 的解决方案
我设法更改了 包括 windows 1251 在内的https://github.com/b4stien/js-csv-encoding,但存在无法解决的问题:
不幸的是,noscript 不允许在关闭脚本的页面上加载外部 javascript。
因此,无法在书签中使用 js-csv-encoding 以及加载 jquery!禁用 noscript,尤其是在崩溃和幽灵之后,根本不安全。
因此,只剩下用原生 javascript 编写的小脚本版本。如果您找到另一种在关闭 noscript 的情况下运行 jquery 的方法,那么找到解决方案会更容易,尽管我怀疑它是否可能。
一个好的解决方案是 https://www.npmjs.com/package/windows-1251或https://www.npmjs.com/package/windows-1252 但是,将两字节文本转码为通过这些脚本的单字节文本。例如:
已经有很多尝试使用 windows1251,例如这些:
使用 windows-1251 的编码或解码不会将脚本转换为 8 位格式。在 js-csv-encoding 中,csvContentEncoded 用于转码:
尝试使用类似的东西失败了。也许你需要一些技巧,只是把 windows-1251 不够,因为 js 存储在 utf8 中,那么很可能你需要在最后添加到 1251 的转换。部分代码:js-csv-encoding。
我还尝试使用 charcode 进行转换,不是保存到服务器而是保存到计算机,因此使用 urlencode .. 不是正确的解决方案,因为在这种情况下,我必须将文本编码为可读的文本。
当然,很难找到一个不超过 4000-5000 个字符的小书签的解决方案,而且我的知识还不够。如果有借助其他脚本的解决方案,例如通过值表重新编码,这也可以是一个解决方案。
swift - Alamofire请求中的字符集windows-1251?
帮助,我使用的服务器仅适用于字符集 windows-1251。但是 Alamofire 使用 utf8。我尝试更改标题,但这对我不起作用。如何将 Alamofire 与另一个字符集一起使用,而不是 utf8?
python - 如何在 Python3 中将字符串从 cp1251 转换为 UTF-8?
一个非常简单的 Python 3.6 脚本需要帮助。
首先,它从使用 cp1251 编码的老式服务器下载 HTML 文件。
然后我需要将文件内容放入一个 UTF-8 编码的字符串中。
这是我正在做的事情:
这是错误:
我真的很感激任何帮助。
javascript - fs.readFileSync("./bank/"+client,'cp1251'); 正在抛出新的 ERR_INVALID_OPT_VALUE_ENCODING
我正在尝试从文件中读取(该文件是保加利亚语),并且使用 utf 8 它返回无意义的字符,所以我尝试了 cp1251 但它抛出:ERR_INVALID_OPT_VALUE_ENCODING。
unicode - Visual Studio Code 无法在输出中编码西里尔字符
Visual Studio Code 中的输出无法解码西里尔字符:
相同的代码在PyCharm中运行良好:
如何快速解决此问题?必须有一些简单的方法。
设置中的自动猜测编码不起作用,因为它用于文件,而不是输出。
编辑:问题是 VSCode 中的 Code Runner 扩展。禁用它或在终端中运行脚本可以完成这项工作。
perl - Perl - 在 cp1251 中复制到剪贴板
试图复制到 cp1251 中的剪贴板文本。
而不是西里尔字母“?” 粘贴在任何 Windows 应用程序中。如果我删除带有编码的行 - 西里尔字母会产生带有不同修饰符的“a'-s:
我想我错过了一些非常简单的东西,但我坚持下去了。有人可以帮我吗?
java - 当文件的名称可以采用不同的编码时,如何查找文件?
我有一堆名称用cp1251
. 我还有一堆带有utf8
编码名称的文件。我需要一种方法来用 Java 代码找到它们。此外,我无法使用convmv
Linux 工具更改名称,因为有些旧系统也使用这些文件。
有没有办法在 Java 的文件或路径实用程序方法中传递编码?
如果我现在使用 Files.walk 并尝试查看文件名,它们就会被破坏并且看起来像一堆 ???????? 并且无法恢复(或者我找不到这样做的方法)。
代码:
将输出:
???...文件的真实名称是:тест файла с русскими символами.txt
系统语言环境是:
运行的JVM-Dfile.encoding=UTF-8
如果我这样做,ls | iconv -f "cp1251" -t "utf8"
我会看到:
纯ls
输出与 java 输出相同。
更新:@JosefZ 的建议链接也不起作用。
例子:
正如我们所看到的,它只是fffd
- 所以名字被破坏了。
代码:
我的 Java 版本(在链接中建议它是 jvm 错误):java 版本“1.8.0_201”Java(TM) SE 运行时环境(构建 1.8.0_201-b09)Java HotSpot(TM) 64 位服务器 VM(构建 25.201 -b09,混合模式)
更新 2:@skomisa 建议无效。
代码:
结果:
如果我打印出我们可以看到的文件名的字节,那么如果我们这样做,path.getFileName()
我们会得到一个破坏的名称。代码:
结果:
-17, -65, -67
意味着?
我认为
c# - C# 俄语 cp1251 编码/解码
我正在为俄语字母使用 ASCII 1251 表。所以我需要一个 C# 函数将 char 转换为 1251 十进制代码,反之亦然。
例如俄语“а”是 224,219 是“Ы”。
有什么方法可以不使用所有字母的硬编码值的字典吗?
mysql - 如何在 SELECT 语句中即时更改编码?
我有一个包含 cp1251_general_ci 排序规则的列的表。我不想更改列排序规则,但我想以 utf8 编码获取数据。
有没有办法以某种方式选择任何数据,使其看起来就像带有 utf8_general_ci 排序规则的数据?
即我需要这样的东西
pdf - 更改 pdf 文本编码
我有一个PDF文档(那是我的教科书),问题是虽然文本打印正常,但它是以一些随机字形的形式复制的。我发现,这是因为文本在 cp1251 上编码但试图解码为 cp1252(反之亦然 idk,但复制的字形属于 1252)。将文本从1252粘贴到解码器到1251我可以得到原始文本(图片相关)
为了解决我的文本搜索和复制问题,我只使用了 OCR,但也许有办法改变它在某些 pdf 标题中的编码?此外,我确实需要为学校研讨会复制一些插图,但 Inkscape 和 AI 仍然会在 1252 年输出这些字形。
在 Adobe Acrobat DC 中打开文字,我看到他在抱怨字体 1251 Times。在 Npp 我发现了这样的
通过用 1252 替换所有出现的 1251,我一无所获。这样做的正确方法是什么?有没有这样正确的方法?