问题标签 [utf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
590 浏览

unicode - D 中原始字符类型的限制是什么?

我目前正在探索Digital Mars D语言的规范,并且在理解原始字符类型的完整性质时遇到了一些麻烦。《Learn to Tango With D 》一书同样模糊了该语言在该领域的能力和局限性。

网站上给出的类型如下:

由于我们知道大多数 Unicode 转换 (UTF) 格式编码表示具有可变位宽的字符,这是否意味着 D 中的 char 只能包含适合 8 位的值,或者它是否在机器的给它双字节字符时的物理内存?也许还有其他一些可能性,比如在重载变量时自动转换为下一个最合适的类型?

例如,我想在编辑器中使用 UTF-8 字符并输入 Chinese 。它会简单地摔倒,还是能够更“正确”地处理 Unicode 字符,就像在 C# 中一样?是否仍然需要提供胶水代码以允许使用 Unicode 支持的任何语言?

我希望您能提供有关这些类型如何在幕后工作的任何具体信息,以及有关处理其局限性的任何一般最佳实践建议。

0 投票
2 回答
951 浏览

string - Erlang 中的字符串 - 我应该检查哪些库和技术?

我正在开展一个需要国际化支持的项目。我想从 UTF 支持开始,我想知道在 Erlang 中处理 UTF 的最佳实践是什么?

从我目前的研究来看,Erlang 对于某些用例的内置字符串处理似乎存在一些问题(JSON 解析就是一个很好的例子)。

我一直在看Starling,最近(在某处)读到它可能会作为 UTF“标准”被纳入标准 Erlang 版本。这是真的?我应该看看其他库或方法吗?

从评论:

EEP(Erlang Enhancement Proposal)10个细节在Erlang中表示Unicode字符

0 投票
1 回答
671 浏览

c++ - 如何让 boost wdirectory_iterator 在 Mac 上返回 UTF32

directory_iterator按预期使用 Visual Studio 和 Xcode 返回 UTF8。

然而,wdirectory_iterator使用 Visual Studio 返回 UTF16,使用 Xcode 返回 UTF8,尽管返回 wchar_t 字符串。

我可以改变什么来让 wdirectory_iterator 返回 UTF32?

对我之前提出的问题的回答表明可能需要更改语言环境,但是根据“locale -a”,唯一可用的语言环境是

en_GB、en_GB.ISO8859-1、en_GB.ISO8859-15、en_GB.US-ASCII、en_GB.UTF-8 都是 8 位的,可能除了 en_GB

我尝试了 en_GB 以防它可能不是 8 位,但这会导致 boost::filesystem::exists 引发 boost::filesystem::wpath::to_external 转换异常。

0 投票
3 回答
351 浏览

javascript - 在 Firefox 和 IE 中使用特殊字符,浏览器的编码方式不同

我有一个多语言网站,允许用户输入文本来搜索表单字段,但文本在进入后端之前会通过 Javascript。

像“欢”这样的特殊字符在 Firefox 中得到了正确处理,但在任何版本的 IE 中都没有。

有人可以帮我理解发生了什么吗?

谢谢!

0 投票
5 回答
55599 浏览

css - ISO-8859-1 与 UTF-8?

应该使用什么以及何时使用?还是使用 UTF-8 总是更好?还是ISO-8859-1在特定条件下仍然具有重要性?

字符集是否与地理区域有关?


使用代码有什么好处@charset "utf-8";吗?

或者像这样<link type="text/css; charset=utf-8" rel="stylesheet" href=".." />

在 CSS 文件的顶部?

我为此找到了

如果Dreamweaver在您将嵌入样式添加到文档时添加了标签,则这是 Dreamweaver 中的错误。来自 W3C 常见问题解答:

“对于嵌入在文档中的样式声明,@charset 规则不是必需的,也不能使用。”

自 2.0 版(1998 年 5 月)以来,字符集规范是 CSS 的一部分,因此如果您在 CSS 文件中有字符集规范,而 Safari 无法处理它,那么这是 Safari 中的一个错误。

并以如下形式添加接受字符集

如果我使用 XHTML doctype,应该使用什么?

或者

0 投票
4 回答
8813 浏览

php - PHP MySQL数据库奇怪的字符

我正在尝试输出存储在 MySQL 数据库中的产品信息,但它正在写出一些奇怪的字符,例如内部带有问号的菱形。

我认为这可能是编码/UTF8 问题,但我已经指定了我想要的编码:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

这是正确的吗?我应该检查什么?

0 投票
1 回答
308 浏览

xml - xml utf-16 问题

我通过 http 请求接收 xml。格式是这样的 "<.?.xml .version=.\".1...0.\". .encoding=.\".utf-.1.6.\".?.>| 等

然后我收到一个错误:{“名称不能以'开头。' 字符,十六进制值 0x2E。第 1 行,位置 2。"}

像这样尝试将其转换为ascii,也不能解决问题。byte[] encodedString = Encoding.ASCII.GetBytes(strRequest);

我需要 utf8 格式,没有“点”。

谢谢

0 投票
2 回答
904 浏览

javascript - Silverlight 到 Javascript 互操作 UTF 编码/解码

如何获取两个警报,一个从 silverlight 调用,另一个从 javascript 调用,以相同的方式显示相同的数据。

例如。���� != ýÿýÿý

System.Windows.Browser.HtmlPage.Window.Alert(数据);

警报(参数);

Silverlight3 代码,向 javascript 函数发送数据:

javascript函数:

javascript库:

0 投票
1 回答
6286 浏览

vbscript - vbscript中的字符到UTF代码

我想从 VBScript 创建一个用于 Java 程序的 .properties 文件。我将在使用 ASCII 映射之外的字符的语言中使用一些字符串。因此,我需要将这些字符替换为其 UTF 代码。这对于 a 来说是 \u0061,对于 b 来说是 \u0062 等等。

有没有办法在 VBScript 中获取字符的 UTF 代码?

0 投票
1 回答
1458 浏览

sql-server - 在 Java 中创建一个文件,以便使用 BCP 和 UTF-16 加载到 SQLServer 2005 中的 nvarchar 字段中

我想使用 BCP 使用加载器控制文件加载到带有 nvarchar 字段的 SQL Server 2005 表中。据我了解,SQL Server 2005 仅支持 UTF-16(我相信它是 UTF-16 LE)。该文件正在由 Java 程序输出。我目前设置的方式如下:

  1. XML 格式的 BCP 加载程序文件(使用以下命令创建 bcp test_table format nul -c -x -T -f test_table.xml -S server:)

  2. 使用以下代码编写输出的 Java 程序:

    /li>
  3. 然后使用以下 bcp 命令:
    bcp test_table in from_java.txt -T -f test_table.xml -S server -error error.txt

我在表中得到的是ÿþá. 并不是áááááLittle Endian, BOM

我尝试了几种改变参数的不同排列:

  • 更改生成加载程序控制文件的方式(使用 -n 表示本机数据而不是 -c 表示字符数据...我认为这可能与它有关,但我没有看到插入的数据有任何改进)
  • 尝试了几种不同形式的 UTF-16 编码,包括没有 BOM 的大端和小端,但无济于事
  • 尝试在文件中手动输出 BOM,因为我在某处读到 Microsoft 真正喜欢使用 BOM 信息的地方
  • 考虑尝试将文件输出为 UCS-2(而不是 UTF-16),因为那是(显然)BCP 实际读取文件的内容
  • 在 bcp 导入上尝试了 -w ,这确实有效,但不能与加载器格式文件结合使用(有没有办法将任何魔法告诉 BCP 文件以 UTF-16 编码到格式文件中?)
  • 如果我在 windows-1252 中输出文件并在加载文件时将该代码页指定为 bcp 的选项,我可以让它工作-c 1252(但我不想这样做,因为我会丢失信息,因为 UTF-16 是与 1252 相比可以表示的超集)

有没有人设法让 bcp 使用 UTF-16 数据和加载器格式配置文件加载到 nvarchar 字段中?

提前致谢,

-詹姆士