问题标签 [utf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
565 浏览

sql-server - ASP.NET/SQLServer - 使用特殊字符保存文件名会​​转换保存的文件名...为​​什么?

我有一个奇怪的问题。我有一个存储文件的 ASP.NET 应用程序。我有一个表(SQL 2008 R2),我在其中存储用户上传的文件的文件信息。

有时,当我使用特殊字符存储来自国际用户的文件名时,该名称在存储在数据库表中时会被转换:示例原始文件名:Łinename.mov 存储的文件名:Linename.mov

当我检索文件名以构建我的路径/文件字符串时,名称不匹配并且找不到我的文件。

该表将文件名存储为 nvarchar,我认为这将允许 unicode 字符。

有任何想法吗?我宁愿存储原始文件名,而不是重命名服务器上的文件。

编辑:我认为问题在于所讨论的字符不在 UTF-8 字符集中。我通过保持简单来解决这个问题:我支持 UTF-8,如果文件在存储为 UTF-8 时被转换,那就是我的服务器文件名。

0 投票
2 回答
1122 浏览

c# - 如何在 c# 中将 UTF-16 字符存储为字符串?

如何打印 UTF-16 表示为 feff2031 的字符?

当我尝试以下操作时,我得到“?” 作为结果:

我想要的字符是“每百万”。有关详细信息,请参阅每千分之一

0 投票
4 回答
668 浏览

utf - 我应该为我的多语言 cms 使用 utf-8 或 utf-16 或 utf-32 吗?

除了字符存储方式的不同,还有什么语言utf-32可以显示而utf-8不能显示的特殊字符?

0 投票
2 回答
1575 浏览

mysql - How to save a Chinese character in MySQL

I am unable to save the character on mySQL 5.5. I have tried collation utf8mb4 and utf32. I have to store both Chinese and English characters in the same table.

0 投票
4 回答
10249 浏览

php - PHP str_word_count() 多字节安全吗?

我想str_word_count()在 UTF-8 字符串上使用。

这在 PHP 中安全吗?在我看来,它应该是(特别是考虑到没有mb_str_word_count())。

但是在 php.net 上,有很多人通过展示他们自己的“多字节兼容”版本的函数来搅浑水。

所以我想我想知道...

  1. 鉴于str_word_count仅计算由(空格)分隔的所有字符序列" ",它在多字节字符串上应该是安全的,即使它不一定知道字符序列,对吧?

  2. UTF-8 中是否有任何等效的“空格”字符,不是 ASCII " "(空格)?#

我猜这就是问题所在。

0 投票
2 回答
122 浏览

encoding - 重命名包含“©”字符的文件

我们在应用程序(在 Windows 上运行)中收到了文件列表作为输入。这些文件是使用脚本自动从数据库中提取的。

显然,有些名称包含特殊字符(如重音符号),这些字符在我们这边呈现为“©”。

如何以编程方式重命名这些文本文件(大约 900'000)以摆脱这个字符?我们不能更改源,也不能重新提取文件。问题是由于这个字符,我们系统中涉及的另一个程序不接受这些文件。

0 投票
2 回答
166 浏览

c - 以编码中性方式打印到终端

无论其编码如何(UTF-8、16、32),我都想在屏幕上打印一个字符串。该字符串以 char 数组表示,因此我需要忽略空字节并继续打印到标准输出;这让 printf 的家人和朋友无从谈起。

为此,我选择了上述解决方案,以使我能够打印所有 UTF 编码格式。我了解某些终端无法正确显示字符,但这不是我关心的问题,因为它是应用程序之外的可配置选项。

我的应用程序设置了要加载的消息目录(en_EN.UTF-8 等),但是我想避免必须根据当前选择的语言环境在代码中进行字符串转换。

在我让它上线之前,我可以对这种方法进行审查吗?

0 投票
2 回答
3569 浏览

c# - 将字符串转换为“InvariantCulture”

我有以下字符串

如果你仔细观察,你会发现它们是不同的!

为了比较像这样的2个字符串,我找到了这个解决方案:

所以我有2个问题

  1. W3C 处理字符的方式在不同的语言中是相同的 - 所以比较问题

  2. 如何在 C# 中将字符串转换为“InvariantCulture”

编辑:

链接可以更好地解释问题

提前致谢

0 投票
2 回答
946 浏览

c - 使用 C 等语言进行编程时的字符编码

在阅读了有关 C 的教程和书籍后,我正在努力将我对 UTF(作为罗马字母和各种其他字母/脚本的文本格式)的知识与 C 联系起来,作为一种在世界范围内使用的编程语言。

C 似乎采用 ASCII 字符。

所以如果我想用中文写一个输入/输出的程序,比如说,我该如何用C来实现呢?

0 投票
3 回答
3948 浏览

python - Python 将字符串保存到文件中。Unicode 错误

我正在使用 Python 中的电子表格 API 从 Google 电子表格中提取数据。我可以使用 for 循环在命令行上打印电子表格的每一行,但某些文本包含符号,例如摄氏度符号(小圆圈)。当我在命令行上打印这些行时,我想将它们写入文件。但是当我这样做时,我会得到不同的 unicode 错误。我尝试通过手动解决它,但有太多:

我该怎么做才不会出错?例如

UnicodeEncodeError:'ascii' 编解码器无法在位置 1394 编码字符 u'\xa0':序数不在范围内(128)