问题标签 [byte-order-mark]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
297 浏览

java - 向 Jrules BOM 包添加接口

我一直在搜索设置,我正在手动重新创建我在 Jrules BOM 项目中拥有的 Java 项目,但是我看不到实现自定义界面的方法。:(

0 投票
1 回答
1170 浏览

java - 使用 UTF-16 编码和 BOM 在 Ant 中编写文本文件

我需要在我的 ant 项目中生成一个文件,如下所示:

重点是:

  • 从 BOM 开始
  • 行尾 0D 0A
  • UTF-16 编码

这就是我目前所拥有的:

但是由于我使用的是 Windows,所以缺少 BOM 并且行尾不正确。

0 投票
2 回答
9863 浏览

html - 验证错误:在 UTF-8 文件中找到字节顺序标记

我在一个网站上工作,虽然在 Firefox 上显示它很好,但在 IE 上我遇到了很多问题。我使用了 w3c 验证器,但遇到了很多奇怪的错误。

这是网站的链接:http: //misenplacecatering.it/

我认为最相关的第一个验证错误是:

I've read other threads about this issue so I tried to open the file with different editors (I always use Vim, anyway), but I don't see any space or anything else before the doctype definition. I even used notepad++ and used an option to remove bom, but nothing.

Any suggestions?

Anyway,

0 投票
2 回答
619 浏览

php - 跨平台开发(PC、Mac、Linux)使用什么编码?

我们主要在 Windows 环境中开发我们的 PHP 应用程序,并将我们的文本源文件存储在 PC/ANSI中。

然而现在,一位使用 Mac 平台的开发人员加入了我们,我们在他的机器上创建“补丁”时遇到了问题。当他进行任何更改并执行以下操作时:

他生成了一个补丁文件,表明源代码文件的每一行都已被修改(显然不是这种情况)。

我尝试将测试 ANSI 文件保存为:

也:

对于所有这些情况,每当他进行更改并执行 svn diff > patchfile.patch 时,它会输出所有行,就好像所有行都已更改一样!

[我们也尝试对最后 3 个执行“svn diff -x -p > patchfile.patch” - 没有区别]

顺便说一句,使用最后两个选项生成的文件在我的 PC 机器上继续显示为 ANSI。两者似乎根本没有修改文件,并且在 DOS 提示符下执行“fc”(文件比较)并没有发现任何区别。

我应该使用什么编码进行跨平台开发?

0 投票
2 回答
1316 浏览

php - 删除 URL 中的 UTF-8 DOM - JS & PHP

我在 URL 中遇到“奇怪”字符的问题。

我正在使用 Uploadify 脚本在服务器上上传文件。当我尝试 onComplete 加载预览图像时遇到问题。

这是我的js:

问题在于:$('.image_container').html('<img src="<?=base_url()?>'+imageSrc+'"></img>');

我没有得到干净的图像 URL,但我得到了这个:%EF%BB%BF768f32dd43cc1f90b79c83cceed57eb2.png

文件名:768f32dd43cc1f90b79c83cceed57eb2.png

更新: 我用于读取图像的 PHP 文件:

编辑2:

Chrome 控制台截图:http: //imageshack.us/f/818/uploadifychromeconsole1.png/

问候,马里奥

0 投票
4 回答
14965 浏览

html - 没有 BOM 编码的错误 UTF-8

我使用 Notepad++ 将所有文件都转换为 UTF-8 而没有 BOM 编码。我对 BOM 不再有任何问题,但没有 BOM 编码的 UTF 根本不起作用,就好像我的网站是用 ANSI 编码的一样。所有特殊字符都显示为:Â、Ú 或 á。

这可能是什么原因,我该如何解决?

http://chusmix.com/?ciudad=Pilar

谢谢

0 投票
2 回答
1180 浏览

c++ - ICU 字节顺序标记 (BOM)

我正在使用 ICU 的 ustdio 函数将 UnicodeString 对象写入一系列编码的文件,但它似乎没有预先添加 BOM。

我的代码:

当我将 LE 更改为 BE 时,文件编码确实会交换,但是没有 BOM,十六进制编辑器中的输出文件是:

注意:如果我将代码页设置为“UTF-16”,则会有一个 BOM,但是一旦我手动指定字节序,它就会消失。

或者,有没有办法可以将 UnicodeString 写入带有 BOM 的文件?

0 投票
3 回答
4847 浏览

vim - 为什么 VIM 会忽略我文件的 BOM?

我需要一个我想确保用utf8编码的文件。

所以,我创建了文件

在 VIM 中,我输入元音变音符号:

我检查编码...

(VIM 回声encoding=latin1

然后我检查文件编码...

(VIM 回声fileencoding=

然后我写文件

并检查硬盘上文件的大小:

(大小为 5 个字节)这当然是预期的,3 个字节用于文本,2 个字节用于 \x0a \x0d。

好的,所以我现在将编码设置为

缓冲区变得很奇怪

我想这是我之前输入的 ascii 字符的十六进制表示。所以我重写了它们

书写、检查尺寸:

这次是 8 个字节。我想每个字符加上 \x0d \x0a 2 个字节是有意义的。

好的,所以我想确保下次打开文件时,它将使用 encodiung=utf8 打开。

11 个字节。对于 BOM (ef bb bf),这当然是 8 个(以前的)字节 + 3 个字节。

所以我

vim 并再次打开文件

并检查是否设置了编码:

但 VIM 坚持其encoding=latin1.

那么,为什么会这样。我本来希望 BOM 告诉 VIM 这是一个 UTF8 文件。

0 投票
0 回答
610 浏览

encoding - 当 NSData 里面有很多 BOM 时,有什么方法可以删除 BOM 部分?(Objective-c)

通常,如果文件在文件或数据的开头包含 BOM,则识别数据的编码是有用的。

但是如果你使用NSData的dataUsingEncoding方法,如果编码需要一个BOM,它会添加一个BOM。所以如果你多次使用这种方法并将这些数据附加在一起作为输出数据并将其写入文件,那么文件将包含几个BOM。并且除第一个之外的 BOM 将在数据部分中。

例如:

然后 str 将是:abc\ufeff123\ufeffqwe (虽然如果你 NSLog 它,它会说 abc123qwe,我认为这是因为 NSLog 已经完成了输出)。

但我希望 str 完全是 abc123qwe,有没有什么优雅的方法可以消除这些 BOM?或者我可以检查字符串并手动删除所有 BOM 吗?

0 投票
2 回答
8377 浏览

r - 在 R 中将 UTF-8 BOM 导出为 .csv

我正在通过 RJDBC 从 MySQL 数据库读取文件,它正确显示了 R 中的所有字母(例如,נווה שאנן)。然而,即使使用 write.csv 和 fileEncoding="UTF-8" 导出它,输出看起来像 <U+0436>.<U+043A>. <U+041B><U+043E><U+0437><U+0435><U+043D><U+0435><U+0446>保加利亚语、希伯来语、中文等(在这种情况下,这不是上面的字符串,而是保加利亚语的字符串)。ã,ç 等其他特殊字符也可以正常工作。

我怀疑这是因为 UTF-8 BOM 但我没有在网上找到解决方案

我的操作系统是德语 Windows7。

编辑:我试过

和(afaik)等价物write.csv(x, file="file.csv",fileEncoding="UTF-8",row.names=FALSE)