问题标签 [cp1252]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 如何将 UTF 字符串转换为 ANSI 并使用 JAVA-ANDROID 在 ExternalSD 中创建 ANSI 文本文件
我用java编写了一个android应用程序来获取用户答案并将它们保存在一个文件中。问题是这个文件保存在 utf-8 中。最终用户将在 IBM SPSS 中打开这些文件,这是一个只能读取 ANSI (windows-1252) 文件的 windows 应用程序。
如何在 ANSI 代码中创建文件以从 java-android 应用程序保存在 SD 卡中?
我想我知道要将字符串转换为 ANSI,我应该使用:
那是对的吗?
我保存文件的代码是这样的:
“textBody”是要转换为ANSI的String,“interviewFile”也是要保存为ANSI的文件。
谢谢您的帮助!!
java - 将 cp-1252 编码为 utf-8?
我正在尝试编写一个将在 linux 服务器上运行的 Java 应用程序,但它将使用 cp-1252 作为字符集来处理在旧版 Windows 机器上生成的文件。无论如何将这些文件编码为 utf-8 而不是生成的 cp-1252?
java - 如何让 Java 使用正确的字符集?
我们的服务器在 CentOS 上运行,我们的 Java 后端有时必须处理最初在 Windows 机器上(由我们的一个客户端)使用 CP-1252 生成的文件,但是在 95% 以上的用例中,我们正在处理UTF-8 文件。
我的问题:如果我们知道某些文件将始终是 UTF-8,而其他文件将始终是 CP-1252,是否可以在 Java 中指定用于读取每个文件的字符集?如果是这样的话:
- 我们需要在系统级别做任何事情来将 CP-1252 添加到 CentOS 吗?如果是这样,这涉及什么?
- 我们将使用哪些 Java 对象来对每个文件应用正确的编码?
提前致谢!
java - 如何将诸如“ç”之类的字符识别为字母?
我有一个包含一个句子的字节数组。我需要将这句话上的小写字母转换成大写字母。这是我所做的功能:
它可以很好地处理诸如“一杯水”之类的句子。问题是它必须适用于所有 ANSI 字符,包括 "ç,á,é,í,ó,ú" 等等。Character.isLetter 方法不适用于这些字母,因此它们不会转换为大写字母。
您知道如何将这些 ANSI 字符识别为 Java 中的字母吗?
编辑
如果有人想知道,我在回答后再次做了方法,现在看起来像这样:
java - 在 Java 中使用 Cp1250 创建文件
我正在尝试使用Cp1250字符集创建文件:
但是,当我使用juniversalchardet检测到实际字符集时,它显示WINDOWS-1252是Cp1252(根据javadoc)。
Enca( enca -L czech -g filename
) 检测ISO-8859-2。
我怎样才能准确设置Cp1250(或者,使用 java.nio API 名称windows-1250)?
谢谢
卡雷尔
html - 为什么 IE 中的向后导航会导致 html 属性值被包含在智能双引号中?
我的页面每次在所有浏览器中都能正常加载,除了在 IE 中,当我使用浏览器后退按钮时,它会将用于选项元素的值属性的双引号更改为智能双引号而不是直引号。
最初使用直双引号正确加载:
IE9 浏览器返回智能双引号:
然后当我在javascript中获取值时,它看起来像这样:““500””
为什么它在IE中这样做?为什么它只在向后导航时才这样做?
故障排除
定义以下内容没有帮助:
也没有将字符集添加到我的所有外部脚本中,因为上面的 html 选项元素是 jquery select 元素的一部分,该元素在呈现之前被修改:
更多信息:
这些字符来自 ANSI Windows 代码页 1252。
- 字符:代码点:WINDOWS-1252
- “:U+201C:93
- ” : U+201D : 94
java - 为什么 Eclipse 使用 Cp1252 编码?
抱歉,如果这是一个非常业余的问题!我知道 Eclipse 使用 Cp1252 作为其编码的默认值。
我最近创建了一个程序,使用哈希映射将输入的字母转换为盲文。为此,我不得不将编码方法更改为 UTF-8。
我对这两者都知之甚少,但我读过的所有内容都表明 UTF-8 可以表示 Unicode 中的每个字符,并且具有更大的可识别符号库。
那么为什么它不是 Eclipse 的首选编码风格呢?
java - Eclipse:在文本编辑器中使用 UTF-8 编码会使字符串无法正常工作,我该如何解决?
我在代码中有一些希腊语注释,当我输入一个希腊字母时,它显示“Save us UTF-8”
然后,如果我这样做并重新运行程序,以前显示的字符串将无法正常工作。
例如,我正在研究一种加密算法(Simplified Des),这就是我在文本编辑器中使用 Cp1252 编码作为输出得到的结果:
第一行是加密版本,第二行是解密版本这是我将编码更改为 UTF-8 时得到的
我不明白这里发生了什么,我以前从未见过这样的事情。有人能帮我吗?先感谢您
java - 为什么我的简化 DES 实现在 Cp1252 编码下工作正常,但在 UTF-8 下却不行?
我昨天问了以下问题,但由于我没有真正包含有关我的实际问题的任何细节,因此没有引起太多关注。
Eclipse:在文本编辑器中使用 UTF-8 编码会使字符串无法正常工作,我该如何解决?
我将尝试尽可能多地分析我的问题,以便让您清楚地了解正在发生的事情。
我有一个大学项目,我应该为教育目的实现简化的 DES 算法。该算法是一种加密算法,它使用 10 位密钥来加密 8 位数据。
在实现中,我想包括加密任何字符串。
所以我编写了 8 位加密的代码,它对各种输入都非常有效。为了包含字符串加密支持,我使用了该函数String.getBytes()
,将字符串的所有字节保存在一个变量中byte[] data
然后我遵循了这个逻辑:
对于解密,我遵循以下逻辑:
这是main
函数中的实际代码
通过使用默认编码 Cp1252。我尝试加密字符串并得到以下结果:
为了在每次加密和解密数据时查看实际位表示,我创建了以下函数以显示每个字符串的所有数据:
所以我得到了以下结果:
似乎一切都按预期工作。不过,为了在代码编辑器中支持希腊字母,我不得不将编码更改为 UTF-8。
再次运行所有内容后,我得到以下结果:
请注意解密文本的某些单词是如何正确显示的,例如NFO
和BOB
。在我看来,位操作似乎存在某种问题,好像 Eclipse 无法识别遵循 UTF-8 规则的位序列。
以下是二进制形式的结果:
现在我可以清楚地看到问题所在了。似乎 UTF-8 向字符串添加了更多字节。但是我不确定为什么。我的意思是初始文本似乎具有相同数量的字节,那么为什么在加密后添加这些字节,而在解密后添加更多字节呢?
我将不胜感激提供的任何帮助。先感谢您!
mysql - mysql to excel - 错误的字符集输出
服务器:RHEL 5.5、2.6.18-194.el5、MySQL 5.0.77
客户端:Win 7 Corporate x86、MS Excel 2010、MySQL ODBC 5.2w 驱动程序
在服务器上, mysql base test
,并且有一个 table rr
。每次 insert.sh 启动它都会截断test
。rr
并向其写入新值。我需要的是excel来获取这些数据。
因此,我使用 select 将 ODBC 驱动程序连接到基础,一切正常,值写入 excel 中的列,但仅当我不使用西里尔字母时(我真的需要使用它们)。当我这样做时,输出就像“ровалоÑÑŒ п”。我想这是 UTF-8 → CP1252。
所以,我的猜测是,excel 只使用 cp1252。我尝试删除 db 并使用 CHARACTER SET latin1 再次创建它(这是 cp 1252 的 mysql 名称,对吗?),然后对表做了同样的事情,但我仍然得到相同的输出。
我还将 MySQL 连接器中的字符集更改为 latin1,但仍然没有运气。有什么我想念的吗?