问题标签 [cp1252]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - CP1252 转 UTF-8 .DBF 文件 PHP
我有一个问题,我无法将我的字符串从 CP1252 转换为 UTF-8,我的字符串来自我的 PHP 函数读取的 .DBF (Windows) 文件
- 我的应用程序完全用 UTF8 编码
我的文件 .dbf 是用php-xbase加载的
或者
不工作我的字符串返回:
Ordures M‚nagŠres
我也尝试直接执行此操作,但结果相同:
Ordures M‚nagŠres
你有没有想过它可以来自哪里,从php-xbase知道使用iconv转换字符但没有效果我失去了字母的重音......
谢谢你的帮助,对不起我的英语不好
java - 每次我启动/重新启动 Eclipse 时,它都会将 Text File Encoding 更改为 Other: UTF-8 而不是 Default (Cp1252)
所以我一直在阅读并尝试我在网上找到的所有选项,但没有成功。问题:每次启动/重新启动 Eclipse(Neon 4.6.2)时,编码都会设置回Other: UTF-8(我希望它是默认的 Cp1252)。 截屏。
我已将编码设置eclipse.ini
为-Dfile.encoding=Cp1252
. 还尝试了该-Dclient.encoding.override=Cp1252
选项。没有帮助。还要在 eclipse->Window->Preferences 中将所有其他可能的编码设置为Cp1252。没有成功。信息:操作系统 Windows 10,Java JDK1.8.0_112
有人有想法么?我读到编码会受到我的 JVM 编码的影响?我在这里真的一无所知。
python - 在python中查找编码打开csv文件
我无法理解如何检测 csv 文件的正确编码。我创建了一个小的 csv 文件作为样本,用于测试、剪切和粘贴我要处理的原始文件之一中的一些行,并将该信息作为 CSV 保存在我的本地 excel 中。我的程序可以毫无问题地处理此文件或类似文件,但是当我尝试打开从另一台计算机发送给我的文件时,程序退出并出现错误。
打开文件的代码部分:
错误:
我的 locale.getpreferredencoding() 是 'cp1252'
我做了几次尝试来猜测编码:
它适用于我本地生成的 csv,但不适用于我发送的那些。
不适用于任何文件,但会产生不同的错误:
我也尝试添加newline=''
到 open() 但它没有任何区别。
根据stackoverflow的回答,我用记事本打开了文件,并在“另存为”中检查了编码,我的本地文件和我从电子邮件收到的文件都显示“ANSI”作为编码。
我是否需要自己弄清楚编码,或者python可以为我做到这一点?我的代码有问题吗?
我使用的是 Python 3.5,这些文件最有可能是在具有西班牙操作系统的计算机中创建的。
更新:我一直在做更多的测试。几乎所有 csv 文件都可以正常打开,并且程序运行正常,但是当我尝试打开它们时,有 2 个文件会导致错误。如果我使用 excel 或记事本,这些文件看起来很正常。我怀疑这些文件是在使用不常见的操作系统或语言的计算机上创建或保存的。
python - 如何使用 Python 将具有 cp1252 字符的 unicode 字符串转换为 UTF-8?
我通过一个 API 获取文本,该 API 返回带有 windows 编码撇号 (\x92) 的字符:
我正在尝试将此字符串转换为 UTF-8,以便它返回:“六月有三十天”
当我尝试解码或编码此 unicode 字符串时,它会引发错误:
如果我要将字符串初始化为纯文本然后对其进行解码,它可以工作:
我的问题是如何将我得到的 unicode 字符串转换为纯文本字符串以便我可以解码它?
java - IntelliJ 不断切换到 UTF8(我想设置 CP-1252)
我有一些使用 Windows-1252/CP-1252 编码的项目,我无法更改编码。问题是,无论我做什么,intelliJ 都会继续尝试以 UTF-8 格式读取这些文件,除非我手动将每个文件都放入编码列表中。
这需要大量的时间和精力,容易出错,而且根本不是解决方案。我已将整个项目和 IDE 编码设置为 CP-1252,但它一直尝试将文件读取为 UTF-8。
我不知道是什么原因造成的。我们使用 Subversion 提交文件并使用 maven 进行编译(使用 UTF-8 读取文件,除了使用 CP-1252 的超级 POM)。
知道如何解决问题吗?我看了其他帖子,但我还没有找到真正的解决方案。我目前正在使用最新的 IntelliJ 版本(2017.1.2)
java - 将字符串从 UTF-8 转换为 ANSI 并将其显示为 UTF-8
我想用Java
我能做的一件事来模仿Notepad++
。
如何使用记事本++
设定起点...
打开Notepad++
并单击:Encoding / Encode in UTF-8
,然后粘贴TEXT_1
:
获取 TEXT_2
单击:Encoding / Convert to ANSI
,然后单击:Encoding / Encode in UTF-8
。完毕。
如何用 Java 做到这一点
到目前为止,我有以下功能(部分工作):
使用此功能,我得到:
有什么想法让它工作吗?
如果可能的话,你能提供在函数内部工作的代码convert()
吗?谢谢。
python-2.7 - 无法使用 csv writer python 2.6 将 csv 从 utf-8 转换为 ansi
我正在尝试使用 utf-8 文本格式加载 .csv 文件,并将其写入带有管道分隔符的 cp1252(ansi) 格式。以下代码在 Python 3.6 中工作,但我需要它在 Python 2.6 中工作。但是,'open' 函数在 Python 2.6 中不允许使用编码关键字。
我尝试了几种解决方案:
- 没有定义编码。导致某些 unicode 字符出错
- 使用 io 库(io.open 而不是 open)。导致“类型错误:无法将 str 写入文本流中的文本”。
有谁知道 Python 2.X 中的正确解决方案?
python-3.x - 为什么我不能将 \xDF (ß) 解码为 UTF-8?
我有一个字节串b"\xDF"
。当我尝试将其解码为 UTF-8 时,会引发UnicodeDecodeError 。解码为 CP1252 工作正常。在这两个字符集中,0xDF 由字符“ß”表示。那么为什么会出现错误?
windows - 如何在 Windows 10 中强制 perl >=5.18 中的输出文件的代码集 cp1252?
我需要确保我使用 perl 脚本创建的输出文件具有代码集 cp1252 而不是 UTF-8,因为它将在 UNIX SQLplus 框架中使用,该框架在将德语“变音符号”插入数据库时无法正确处理列(我在 Windows 10 中使用草莓 perl v5.18,我无法在 UNIX SQL 环境中设置 NLS_LANG 或 chcp)。
使用这个小测试脚本,我可以重现输出文件“testfile1.txt”始终为 UTF-8 但“testfile2.txt”如预期的那样是 CP1252。即使文本中没有“特殊”字符,如何强制“testfile1.txt”的输出也为 CP1252?
perl - 如何判断是utf-8还是cp1252编码?
perl 中有没有办法确定字符串utf-8
的cp1252
编码是哪一个?