问题标签 [utf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1170 浏览

c# - delphi vs c# post返回不同的字符串-utf问题?

我发布了两种形式 - 一种在 c# 中,另一种在 delphi 中。但结果字符串似乎有所不同:

c# 返回:¤@@1@@@@1@@@@1@@xśm˱Â0Đ...
delphi 返回:#$1E'@@1@@@@1@@@@1@@x'#$009C...

和 sice 都是压缩流我在尝试解压缩时遇到错误...... C# 是“正确的” - 即。提取物。我不是 delphi 专家 - 我只需要将一些代码从 c# 转换为 delphi。

c#代码:

德尔福代码:

-edit-我使用的是delphi 2010

0 投票
2 回答
19072 浏览

c++ - 将 UTF-16 转换为 UTF-8

我目前正在使用 VC++ 2008 MFC。由于 PostgreSQL 不支持 UTF-16(Windows 用于 Unicode 的编码),我需要在存储之前将字符串从 UTF-16 转换为 UTF-8。

这是我的代码片段。

和转换函数。

但是,在运行时,我在

ATLASSERT(cbUTF8 != 0 );

在尝试获取目标 UTF-8 缓冲区的大小时

  1. 我错过了什么?
  2. 如果我使用中文字符进行测试,如何验证生成的 UTF-8 字符串是否正确?
0 投票
3 回答
589 浏览

java - 如何确定文本编码

我知道 UTF 文件具有用于确定编码的 BOM,但是其他不知道如何猜测该编码的编码呢?

我是新的java程序员。我已经编写了使用 UTF BOM 猜测 UTF 编码的代码。但我对其他编码有疑问。我怎么猜他们。

任何人都可以帮助我吗?提前致谢。

0 投票
2 回答
21072 浏览

java - 序言中不能有内容

我正在尝试xml使用xslt. 我java.xml.transform用来在java中做到这一点。它工作正常,直到我碰到一些xml。它说以下错误。

所以我确保在 xml 声明之前没有字符。我什至使用解决方案 http://forums.sun.com/thread.jspa?messageID=10324562#10324562处理 BOM

仍然没有运气,它只发生在一个 xml 中。我什至在编辑器中打开了 xml 并将其保存在一个带utf-8编码的文件中。这真让我抓狂。任何想法?

更新:当您为xsl文件提供错误的路径并且发生文件未找到异常时,您会收到此错误。(这是我的情况。它可能会对某人有所帮助。感谢您的回复)

0 投票
1 回答
2640 浏览

php - 从 JSON.stringify 到真正的 unicode 字符的 Unicode 字符

我使用JSON.stringify()函数对 JS 对象进行字符串化,以便将 AJAX 发送到 PHP。

当 JSON.stringify 函数将 unicode 字符编码为格式\uxxxx(例如\u000a)时,就会出现问题。我的问题是如何将这些字符转换为 PHP 中的常规 unicode 字符?

0 投票
1 回答
432 浏览

php - 将 UTF8 编码的 JSONP 注入 Win 1255 编码的网页时出现问题

我正在开发作为 JS 片段嵌入网站的第三方服务,除其他外,它需要从我的 PHP 服务器获取一些 jsonp 数据,并在托管嵌入网站上显示 json 对象中包含的文本。

我正在使用 jQuery,所以我发出以下 .getJSON 请求:

在 PHP 端(server.php)我有:

这些在 FF 中完美运行,但在 IE 中,当嵌入网站使用不同于 utf8 的内容(特别是 Windows 1255(希伯来语)网页)编码时,在 IE 中失败,因为 file.json 中包含的文本显示为乱码。将网站的编码(在浏览器中,而不是源代码中)更改为 unicode “修复”了来自 ​​json 的显示文本的问题,同时当然会使页面的其余部分看起来像乱码......我有一个类似的问题使用 FF,在我将 header(...) 行添加到 php 脚本之前。

我应该怎么办?有谁知道为什么它在 FF 中运行良好而不在 IE 中运行良好?是否有额外的定义,例如 IE 特别需要的 header(...) ?

约束:我无法控制嵌入网站 file.json 必须以 utf8 编码(这就是我的数据库的工作方式)相同的代码需要能够处理 utf8 编码页面和非 utf8 页面

0 投票
1 回答
3939 浏览

encoding - 从 powershell 调用时,Iconv 正在转换为 UTF-16 而不是 UTF-8

我在尝试使用 powershell 脚本中的 iconv 将某些文件的编码从 ISO-8859-1 批量转换为 UTF-8 时遇到问题。

我有这个 bat 文件,可以正常工作:

我需要转换目录结构上的所有文件,所以我编写了另一个脚本,这次使用 powershell:

使用它的结果是将文件转换为 UTF-16。我不知道我做错了什么。

谁能帮我解决这个问题?powershell本身的编码可能是某种问题吗?

我正在使用 W7 和 WXP 以及 LibIconv 1.9.2

0 投票
4 回答
3322 浏览

delphi - Delphi:像 Python 一样编码字符串

我想像 Python 那样对字符串进行编码。

Python代码是这样的:

这很简单。

但是在 Delphi 中,我不明白如何编码,首先强制使用好的字符集(不管我们拥有哪台计算机)。

我尝试了这个测试代码来查看转换:

输入是:“árvíztűrő tükörfúrógép”,匈牙利口音测试短语。本地lc是1038(hun),新lc是1033。

但这每次都会产生 0 结果(相同的字符串),并且口音相同,我不会丢失不是英语语言的 ŐŰ。

我做错了什么?我如何做与 Python 一样的事情?

感谢您的每一个帮助、链接等:dd

0 投票
3 回答
152 浏览

unicode - 通过 UTF 等对 Unicode 字符进行编码需要什么?为什么我们不能简单地将它们存储为代码点的二进制文件?

Unicode 只是为每个字符分配一个整数。UTF-8 或其他用于将这些整数(“代码点”)编码为要存储在内存中的字节序列。我的问题是,为什么我们不能简单地将字符存储为其 Unicode 值的二进制表示(“代码点”)?因此,某些语言的字符需要多个字节来表示。将它们存储为代码点的二进制文件不是更容易吗?

0 投票
1 回答
188 浏览

c++ - 如何从文件中读取 UTF 符号,就好像它们是 UTF 代码一样?

所以我有一个文件 - html 文件有很多符号,比如&'""""</\>9()!@#+=-我需要将它们转换成可以从输出屏幕复制的形式,以便在传递给std::string str ("Here should be UTF simbols");如何做这样的事情之后(使用 C++ boost)