问题标签 [character-set]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
text - 在字符集之间转换文本文件的最佳方法?
在字符集之间转换文本文件的最快、最简单的工具或方法是什么?
具体来说,我需要从 UTF-8 转换为 ISO-8859-15,反之亦然。
一切顺利:您最喜欢的脚本语言的单行代码、命令行工具或其他用于操作系统、网站等的实用程序。
迄今为止最好的解决方案:
在 Linux/UNIX/OS X/cygwin 上:
Troels Arvin建议的Gnu iconv最好用作过滤器。它似乎是普遍可用的。例子:
正如Ben所指出的,有一个使用 iconv 的在线转换器。
Cheekysoft建议的重新编码(手动)将就地转换一个或多个文件。例子:
这个使用较短的别名:
Recode 还支持可用于在不同行尾类型和编码之间进行转换的表面:
将换行从 LF (Unix) 转换为 CR-LF (DOS):
Base64 编码文件:
您也可以将它们组合起来。
将带有 Unix 行尾的 Base64 编码的 UTF8 文件转换为带有 Dos 行尾的 Base64 编码的 Latin 1 文件:
在带有Powershell ( Jay Bazuzi )的 Windows 上:
PS C:\> gc -en utf8 in.txt | Out-File -en ascii out.txt
(虽然不支持 ISO-8859-15;它说支持的字符集是 unicode、utf7、utf8、utf32、ascii、bigendianunicode、default 和 oem。)
编辑
你的意思是iso-8859-1支持吗?使用“字符串”可以做到这一点,反之亦然
注意:可能的枚举值为“Unknown, String, Unicode, Byte, BigEndianUnicode, UTF8, UTF7, Ascii”。
- CsCvt - Kalytta 的字符集转换器是另一个伟大的基于命令行的 Windows 转换工具。
mysql - 字符集和排序规则到底是什么意思?
我可以阅读MySQL文档,而且非常清楚。但是,如何决定使用哪个字符集?整理对哪些数据有影响?
我要求解释这两者以及如何选择它们。
php - 字符集问题
我有一个用 php 构建的小型 ajax 应用程序。
使用 phpMyAdmin,我将 mysql 数据库设置为 utf-8,并将包含 utf-8 数据的文本文件导入其中。
在将 character-set-server=utf8 和 default-character-set=utf8 添加到 my.cnf 文件后,这在带有 easyphp 的 Windows 机器上运行良好。
我现在尝试将其移至无法访问配置文件的生产服务器,并且不显示元音变音等字符。
是否可以在 php 代码(而不是配置文件)中设置一些东西来解决这个问题,或者我可以给 mysql 一些命令?
我尝试使用 phpMyAdmin ALTER DATABASE vweb_50
DEFAULT CHARACTER SET utf8 COLLATE utf8_bin 从 utf8_general_ci 尝试,但没有任何区别。
mysql - utf8_general_ci 和 utf8_unicode_ci 有什么区别?
utf8_general_ci
和之间utf8_unicode_ci
,在性能方面有什么区别吗?
oracle - Oracle 数据库字符集
您好,我如何更改或更改数据库的字符集以支持 nihongo 字符
vb.net - vb.net character set
According to MSDN vb.net uses this extended character set. In my experience it actually uses this:
- What am I missing? Why does it say it uses the one and uses the other?
- Am I doing something wrong?
- Is there some sort of conversion tool to the original character set?
sql-server - SQL Server:设置字符集(不是排序规则)
在 SQL Server 中创建表时如何设置字段的默认字符集?在 MySQL 中这样做:
请注意,我在这里设置了两次字符集。这是多余的,我添加了两种方式只是为了演示。
我设置排序规则也是为了证明排序规则是不同的。我不是在询问设置排序规则。大多数 关于 SQL Server 中的字符集和编码的问题都是用排序规则来回答的,这不是一回事。
visual-studio - 关于 Visual Studio 中的“字符集”选项
我对 Visual Studio 中的“字符集”选项有疑问。字符集选项包括:
- 没有设置
- 使用 Unicode 字符集
- 使用多字节字符集
我想知道字符集中三个选项有什么区别?
另外如果我选择其中的一些,会影响对英语以外的语言(如RTL语言)的支持吗?
java - 确定 ISO-8859-1 与 US-ASCII 字符集
我正在尝试确定是否使用
或者
我正在阅读有关字符集的所有信息,以确定我必须通过 java 代码以相同编码创建的示例文件的字符集。
当我的示例文件包含“欧洲”字母(挪威语:å ø æ)时,以下命令告诉我文件编码为“iso-8859-1”
但是,当我复制同一个示例文件并将其修改为包含不同的数据时,没有任何挪威语文本(比如说,我将“Bjørn”替换为“Bjorn”),然后相同的命令告诉我文件编码是“ us-ascii”。
这是什么意思?如果其中没有“欧洲”字符,ISO-8859-1 在实践中是否与 US-ASCII 相同?
我应该只使用字符集“ISO-8559-1”,一切都会好起来的吗?
database - 如何在 Firebird 中将字符集从 ISO8859_1 转换为 UTF8?
我在 Firebird 2.5 中有一个充满数据的数据库。我需要将字符集从 更改UTF-8
为ISO8859_1
,我尝试过:
但它不起作用。如何转换字符集?