问题标签 [file-encodings]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
177 浏览

java - 在 Java 中将 UTF-8 字符串临时存储为 ISO-8859-1 是否安全?

我有一个名为 theProperties.properties 编码为 UTF-8 的属性文件:

我使用资源包来提取本地化字符串:

资源包假定所有字符串都在 ISO-8859-1 中,我的资源文件被编码为 UTF-8。我需要将字符串转换为 UTF-8

像这样包装资源包并从中拉出字符串是否安全:

这段代码是否存在不安全的情况?感觉它可能不安全但字符串是不可变的,这是否意味着下面的字节也是不可变的?

还有其他方法可以做到这一点,但这种方法更短,所以如果它是安全的,我更愿意使用它。


这是解决这个问题的另一种方法,但它有点长,从易于阅读的角度来看,我更喜欢上面的方法,因为这个解决方案只改变了 Control 类中的一行。

0 投票
2 回答
1032 浏览

r - 如何在 UTF-8 编码文件中写入和读取可打印的 ASCII 字符?

我想写入一个 UTF-8 编码的文件,其中包含 扩展 ASCII 表中拉丁大写连字 OE 的字符10001100Œ

当我用 office(encoding=utf-8) 打开文件时,我可以看到Œ我无法阅读的是 readBin?

0 投票
1 回答
270 浏览

webserver - 在网络服务器上设置 *.txt 文件的文件编码属性

gh-pages 正在 mobibaking 一个文本文件。. . 我们的 CI 构建服务器将一些构建工件复制到 gh-pages。

在本地,我可以看到文件编码是 UTF-8,如果我下载文件并打开它,它在文本编辑器中呈现得很好。

但是,在 Safari、Firefox 和 Chrome 中,特殊字符(勾号、复选标记等)正在被 mojibaked。如何指示使用正确的文件编码?

0 投票
1 回答
725 浏览

r - R中的UTF-8文件编码

我有一个.csv应该采用“UTF-8”编码的文件。我已经从 Sql Server Management Studio 中导出了它。但是,当将其导入到它时,R它会失败ÿ。我使用 read.csv2 并指定文件编码“UTF-8-BOM”。

Notepad++正确显示ÿ并说它是 UTF-8 编码。这是R编码的错误,还是ÿ实际上不是 UTF-8 编码方案的一部分?

我上传了一个tab delimited .txt在这里失败的小文件: https ://www.dropbox.com/s/i2d5yj8sv299bsu/TestData.txt

谢谢

0 投票
4 回答
5675 浏览

php - 转换文件编码

我有一个 PHP 应用程序,其文件编码是希腊 ISO (iso-8859-7)。我想将文件转换为 utf-8,但仅使用 utf-8 保存文件是不够的,因为希腊文本会出现乱码。是否有一种“自动”方法可以做到这一点,这样我就可以完全转换我的应用程序的编码,而不必遍历每个文件并重写文本?

0 投票
0 回答
253 浏览

java - 使用 gradle 生成的 MANIFEST.MF 文件中的 ^M 个字符

来自http://forums.gradle.org/gradle/topics/_m_in_manifest_mf_file_generated_through_gradle的交叉发帖

我在我的 gradle 项目中看到 jar 清单文件存在问题。我正在为我的构建中的 jar 生成清单文件 -

wheregetSCMRevision()getSCMBranch()是通过自定义插件公开的静态方法。

构建执行后,MANIFEST.MF 文件包含所有正确信息,但是,它似乎在每一行的末尾添加了一个或多个“^M”字符。因此,当我尝试使用包含在该项目的 jar 中的主类执行 java 命令时,java 错误为 - Error: Could not find or load main class。这可能是因为 jar 中有一个损坏的 MANIFEST.MF。一旦我打开 jar,删除 '^M' 字符并使用 'jar cf' 重建 jar,java 命令就可以工作了。

当我在 OSX (Mavericks) 和 Centos 6.3 上构建时,我可以看到这个错误。我正在使用 gradle 1.11

如果这与文件编码有关,是否有推荐的设置编码方式?对此还有其他可能的解决方案吗?

提前致谢,

布山


更新:似乎发生此问题是因为方法getSCMRevision()getSCMBranch()自定义插件中定义。如果我删除这些方法,则 MANIFEST.MF 文件不包含 ^M 字符。如果我将清单定义完全移动到自定义插件,我会看到问题。如果我在项目的 build.gradle 中定义所有内容,则看不到 ^M 字符。它们似乎只有在我从清单闭包中的自定义插件调用任何功能时才会出现。

有什么想法吗?

0 投票
3 回答
3485 浏览

android - TextView中的Android问号?

我在 Android 活动中的 TextView 中遇到重音字符问题。渲染显示问号而不是字符“è”和“à”。流程是:从网络资源获取一个midi文件->提取歌词->将歌词放入TextView。我不明白编码或字符集是否有问题。我尝试使用“UTF-8”或“ISO ...”对文件进行编码,但每次尝试都失败了。你能帮助我吗?

提前致谢。

0 投票
2 回答
837 浏览

c# - 通过 http 传输的二进制文件损坏

我正在执行以下操作以上传 .pptx 文件并将其保存在服务器的磁盘上。

当我尝试打开文件时,它说它已损坏,无法打开。

这是因为我的编码类型还是其他原因?

是否可以在 POST 中将任何任意文件作为二进制文件发送并使其一次性到达服务器?

这是我发送的邮递员预览:

如果我在 np++ 中打开源(非损坏)文件,我会看到编辑器选择在 ANSI 中对其进行编码。

我目前正在用 UTF8 对其进行编码,而且我似乎没有用 ANSI 编码的选项。

此外,在比较文件大小时,我丢失了一千字节的数据。

编辑:我当前的代码现在是这个

这会将一个空文件写入磁盘。

0 投票
0 回答
702 浏览

emacs - 粘贴到 emacs 时编码错误

我正在尝试将重音字符(例如:á、é、í)粘贴到 Emacs 中,但这是我得到的:

粘贴到 emacs 中的口音
当我粘贴到其他编辑器(如 Vim)时,它工作正常。我已经尝试将其放入我的init.el

但似乎没有帮助。有任何想法吗?

编辑:忘了提,我的操作系统是 Arch Linux,系统编码也是 UTF-8。

EDIT2:首先我认为这是一个编码问题,但我发现它实际上与evil-mode. 这只发生在我使用"+p邪恶时

0 投票
2 回答
367 浏览

vb.net - VB中的USB特殊字符(受病毒影响)目录数据

我一直在编写一个代码来删除我们今天面临的常见病毒,它只是将所有数据放入一个没有标题的特殊文件夹中。实际上它是chr(160)VB中的一个。当我获得目录列表时,它显示为空名称,但我无法更改其名称或查看其内容。

PS您可以通过创建一个名称为的文件夹来测试它Alt+0160