问题标签 [unicode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
text - 在字符集之间转换文本文件的最佳方法?
在字符集之间转换文本文件的最快、最简单的工具或方法是什么?
具体来说,我需要从 UTF-8 转换为 ISO-8859-15,反之亦然。
一切顺利:您最喜欢的脚本语言的单行代码、命令行工具或其他用于操作系统、网站等的实用程序。
迄今为止最好的解决方案:
在 Linux/UNIX/OS X/cygwin 上:
Troels Arvin建议的Gnu iconv最好用作过滤器。它似乎是普遍可用的。例子:
正如Ben所指出的,有一个使用 iconv 的在线转换器。
Cheekysoft建议的重新编码(手动)将就地转换一个或多个文件。例子:
这个使用较短的别名:
Recode 还支持可用于在不同行尾类型和编码之间进行转换的表面:
将换行从 LF (Unix) 转换为 CR-LF (DOS):
Base64 编码文件:
您也可以将它们组合起来。
将带有 Unix 行尾的 Base64 编码的 UTF8 文件转换为带有 Dos 行尾的 Base64 编码的 Latin 1 文件:
在带有Powershell ( Jay Bazuzi )的 Windows 上:
PS C:\> gc -en utf8 in.txt | Out-File -en ascii out.txt
(虽然不支持 ISO-8859-15;它说支持的字符集是 unicode、utf7、utf8、utf32、ascii、bigendianunicode、default 和 oem。)
编辑
你的意思是iso-8859-1支持吗?使用“字符串”可以做到这一点,反之亦然
注意:可能的枚举值为“Unknown, String, Unicode, Byte, BigEndianUnicode, UTF8, UTF7, Ascii”。
- CsCvt - Kalytta 的字符集转换器是另一个伟大的基于命令行的 Windows 转换工具。
java - Oracle 8.x 系列中如何以编程方式替换字符
由于我们的 Java 应用程序之一出现重复错误:
我需要在 Oracle 数据库中“修复”一些 Unicode 字符,最好是以编程方式。一旦确定,“搜索和替换”它的简单方法是什么?
java - Java 类名中的有效字符
Java 类名中哪些字符是有效的?还有哪些其他规则管理 Java 类名(例如,Java 类名不能以数字开头)?
java - 单元测试中的unicode字符串文字问题
我有一个 JUnit 测试,测试将字符串添加到 Dictionary 自定义类型。在 Linux/Windows 机器上,其他所有人都可以正常工作,但是,作为我商店中第一个使用 mac 的开发人员,这个单元测试对我来说失败了。违规行是使用 unicode 字符串文字的地方:
是否有一种独立于平台的方式来指定 unicode 字符串?我尝试将 Eclipse 中的文件编码更改为 UTF-8 而不是默认的 MacRoman,但测试仍然失败。
algorithm - 如何从字符串中删除这些符号(垃圾)?
想象一下我在 C# 中有字符串:“我没看到你……”
我想删除(替换为无等)这些“’”符号。
我该怎么做呢?
sql - 列数据类型中 BYTE 和 CHAR 的区别
在 Oracle 中,有什么区别:
和
sql-server - 迁移现有应用程序以接受 Unicode
我们正在将我们的应用程序升级到完全兼容 Unicode,因为我们最近获得了开箱即用的 Delphi 2009。我正在寻找任何有升级应用程序以接受 Unicode 字符的经验的人。具体回答以下任何问题。
- 我们需要将 VarChars 更改为 NVarchar,将 Char 更改为 NChar。这里有什么陷阱吗。
- 我们需要更新所有 sql 语句以在任何 sql 字符串前面包含 N。所以 Update tbl_Customer set Name = 'Smith' 必须变成 Update tbl_Customer set Name = N 'Smith' 。对于某些字段,有什么方法可以默认此设置。这似乎是非同寻常的,这仍然是必需的。
- 是否可以在 SQLServer 中设置任何默认值来简化此操作?
ps 我们还需要升级我们的Oracle代码
visual-studio-2008 - Visual Studio 2008 中的 Unicode 调试可视化工具
Visual Studio 2008 中是否有 unicode 调试可视化工具?我有一个 xml 文件,我很确定它是 unicode 格式的。当我在写字板中打开它时,它会正确显示日文字符。当我使用 File.ReadAllText (UTF8) 将文件读入字符串时,所有日文字符都在字符串可视化器中显示为块。如果我使用 xml 可视化工具,字符会正确显示。
xml - 非 unicode XML 表示
我有 xml,其中一些元素值是 unicode 字符。是否可以用 ANSI 编码来表示?
例如
到
我反序列化 XML,然后尝试使用 XmlTextWriter 指定默认编码(默认为 Windows-1252)对其进行序列化。所有的 unicode 字符都以问号结尾。我正在使用 VS 2008,C# 3.5
delphi - Delphi 2009 切换到 Unicode(/UTF16) 对可执行文件大小和内存占用有什么影响(如果有的话)?
这是“毫无疑问太愚蠢”部门的一个:
好吧,正如主题所说:有影响吗?如果有,多少钱?我的代码和 DFM 资源中的所有字符串文字现在是否会在已编译的二进制文件中占用两倍的空间?已编译应用程序的运行时内存使用情况如何?现在所有的字符串变量会占用两倍的 RAM 吗?我应该打扰吗?
我记得在早期的预发布网络广播中有人问过类似的问题,但我不记得答案了。而且由于试用期只有 14 天,我不会在我需要的第三方库更新之前自己尝试(预计大约一个月)。