问题标签 [character-encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
24176 浏览

character-encoding - 如何在 yaml 文件中设置字符编码

我们正在为新的 Rails 2.2 i18n 系统使用简单的后端,我想知道在 yaml 文件中设置编码的正确语法。

换句话说,这个 xml 的 yaml 是什么:

0 投票
2 回答
486 浏览

c++ - 如何在 VC++ 中使用资源?

我正在使用 VC 9,我想为我的应用程序支持俄语。我什至创建了俄语资源字符串。但我的系统有俄语设置。如果不存在,则每个字符都显示垃圾(其代码页为 1251)。我还从俄罗斯资源文件中制作了 DLL。如果我从安装位置在应用程序中运行该 DLL,它工作正常。但是当我将计算机设置更改为英语并从应用程序运行该 DLL 时,对话框和消息框显示垃圾字符。但是应用程序不应该从 DLL 中读取,而不是从计算机语言设置中读取吗?在这里,我面临如何制作独立于语言的 DLL 的问题。有任何代码或设置吗?

0 投票
5 回答
30997 浏览

java - Java 应用程序:无法正确读取 iso-8859-1 编码文件

我有一个编码为 iso-8859-1 的文件,其中包含 ô 等字符。

我正在使用 java 代码读取此文件,例如:

然而 ô 字符总是乱码,通常打印为 ? .

我已经阅读了这个主题(并在途中学到了一点),例如

但仍然无法正常工作

有趣的是,这适用于我的本地电脑(xp),但不适用于我的 linux 机器。

我检查了我的 jdk 是否支持所需的字符集(它们是标准的,所以这并不奇怪)使用:

0 投票
16 回答
347418 浏览

java - Java:如何确定流的正确字符集编码

参考以下线程: Java App:无法正确读取 iso-8859-1 编码文件

以编程方式确定输入流/文件的正确字符集编码的最佳方法是什么?

我尝试过使用以下内容:

但是在我知道用 ISO8859_1 编码的文件上,上面的代码会产生 ASCII,这是不正确的,并且不允许我将文件的内容正确地呈现回控制台。

0 投票
10 回答
102484 浏览

php - 在 PHP 中检测文件编码

我有一个脚本,它将多个文件合并为一个,当其中一个文件具有 UTF8 编码时它会中断。我认为我应该utf8_decode()在读取文件时使用该功能,但我不知道如何判断哪些需要解码。

我的代码基本上是:

目前,在 UTF8 文件的开头,它会在输出中添加这些字符:

0 投票
11 回答
150647 浏览

excel - Microsoft Excel 在保存文件时使用什么字符集?

我有一个 Java 应用程序,它可以读取在 Excel 中创建的 CSV 文件(例如 2007)。有谁知道 MS Excel 使用什么字符集来保存这些文件?

我会猜到:

  • windows-1255 (CP1255)
  • ISO-8859-1
  • UTF8

但我无法使用这些字符集类型中的任何一种解码扩展字符(例如法语重音字母)。

0 投票
2 回答
1200 浏览

ruby-on-rails - 在我的 Rails 应用程序中适当地处理非 UTF8 内容

我有一个 Rails 应用程序,它允许用户使用 RSS 提要等从各种来源导入信息。我在数据库上的默认编码是 UTF8,我收到了很多关于非 UTF8 数据的异常,这些数据来自系统并在到达数据库后崩溃。

我要使用 is_utf8 适当地检测非 UTF8 数据?在保存完成之前属性上的方法,但我还没有想出一种方法来处理它。我已经看到 iconv 进行转换,但似乎需要能够确定我正在转换的编码类型。

有没有一种简单的方法来进行猜测转换,或者可能只是去掉非 UTF8 字符,然后保存到数据库中?

谢谢!

0 投票
7 回答
3518 浏览

unix - Unix 与 Windows 的字符渲染

我有一个在 FreeBSD 和 Windows 中打开时显示不同的文本文件。

在 FreeBSD 上:An·lisis e InvestigaciÛn

在 Windows 上:分析和调查

windows 的表示显然是正确的。关于如何在 bsd 中获得该结果的任何想法?

0 投票
3 回答
1680 浏览

c# - 从字节流返回的奇怪字符?

当试图在文本框中显示来自 HLDS(半条命专用服务器)的字节流时,它会显示奇怪的块状问号字符,如下所示:

这是字节流中的示例行(用 [?] 代替奇怪的字符):

这是我将字节流显示为字符串的方式:

字符出现在[CR][LF]通常应该出现的位置。为什么它显示奇怪的字符,我该怎么做才能删除奇怪的字符或纠正编码?

Jon Skeet 提供了正确的答案。日志返回 \n 换行符(不是 \r\n),并在每个流式传输的日志行末尾返回 \0。将 \n 替换为 Environment.NewLine 并将 \0 替换为 string.Empty 并且奇怪的字符消失了。谢谢乔恩。

0 投票
3 回答
4743 浏览

html - 我还应该使用 html 实体吗?为什么?

HTML 实体仍然有用还是我应该简单地创建 UTF-8 编码的 html 文档?请解释原因。