问题标签 [byte-order-mark]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
9716 浏览

python - 在 Python 中处理 UTF-8 数字

假设我正在读取一个包含 3 个逗号分隔数字的文件。该文件以未知编码保存,到目前为止,我正在处理 ANSI 和 UTF-8。如果文件是 UTF-8 格式并且有 1 行的值为 115,113,12,那么:

会抛出这个:

第一个数字总是被这些 '\xef\xbb\xbf' 字符弄乱。对于其余 2 个数字,转换工作正常。如果我手动将 '\xef\xbb\xbf' 替换为 '' 然后进行 int 转换,它将起作用。

对于任何类型的编码文件,是否有更好的方法来执行此操作?

0 投票
10 回答
86779 浏览

vb.net - 编写没有字节顺序标记 (BOM) 的文本文件?

我正在尝试使用带有 UTF8 编码的 VB.Net 创建一个没有 BOM 的文本文件。任何人都可以帮助我,如何做到这一点?
我可以使用 UTF8 编码编写文件,但是,如何从中删除字节顺序标记?

edit1:我试过这样的代码;

1.html 仅使用 UTF8 编码创建,2.html 使用 ANSI 编码格式创建。

简化的方法 - http://whatilearnttuday.blogspot.com/2011/10/write-text-files-without-byte-order.html

0 投票
4 回答
18819 浏览

python - 带有 BOM 的 UTF-8 HTML 和 CSS 文件(以及如何使用 Python 删除 BOM)

首先,一些背景知识:我正在使用 Python 开发一个 Web 应用程序。我所有的(文本)文件当前都以 UTF-8 格式存储在 BOM 中。这包括我所有的 HTML 模板和 CSS 文件。这些资源作为二进制数据(BOM 和所有)存储在我的数据库中。

当我从数据库中检索模板时,我使用template.decode('utf-8'). 当 HTML 到达浏览器时,BOM 出现在 HTTP 响应正文的开头。这会在 Chrome 中产生一个非常有趣的错误:

Extra <html> encountered. Migrating attributes back to the original <html> element and ignoring the tag.

Chrome 似乎会<html>在看到 BOM 并将其误认为内容时自动生成标签,从而使真正的<html>标签成为错误。

那么,使用 Python,从我的 UTF-8 编码模板中删除 BOM 的最佳方法是什么(如果它存在——我不能保证将来会这样做)?

对于 CSS 等其他基于文本的文件,主流浏览器会正确解释(或忽略)BOM 吗?它们作为纯二进制数据发送,没有.decode('utf-8').

注意:我使用的是 Python 2.5。

谢谢!

0 投票
1 回答
65417 浏览

c# - 创建没有 BOM 的文本文件

我尝试了这种方法但没有成功

我正在使用的代码:

结果:

在此处输入图像描述

无论如何,它都在编写 BOM ,并且特殊字符(如 Æ Ø Å)不正确:-/

我被困住了!

我的目标是使用UTF-8作为 Encoding 和8859-1作为 CharSet创建一个文件

这是很难完成还是我只是度过了糟糕的一天?

非常感谢所有帮助,谢谢!

0 投票
1 回答
2636 浏览

java - java:我可以在没有 BOM 的情况下将字符串转换为字节数组吗?

假设我有这个代码:

如果我在消息中显示字节数组,结果是:

如您所见,开头有一个 BOM。

我怎样才能:

  1. 从字符串生成一个缺少 BOM 的 UTF-16 字节数组?
  2. 从包含 UTF-16 字符但缺少 BOM 的字节数组转换回字符串?
0 投票
4 回答
6186 浏览

postgresql - 通过 psql 运行 SQL 脚本会产生 PgAdmin 中不会出现的语法错误

我有以下脚本来创建表:

它在 PgAdmin 的查询工具中运行良好。但是当我尝试使用 psql 从命令行运行它时:

我收到如下所示的语法错误。

为什么使用 psql 而不是 pgAdmin 会出现语法错误?

0 投票
8 回答
52718 浏览

php - PHP 文件中的 UTF-8 BOM 签名

0 投票
2 回答
3949 浏览

php - PHP Streaming CSV 总是添加 UTF-8 BOM

以下代码将“报告行”作为数组获取,并使用 fputcsv 将其转换为 CSV。一切都很好,除了不管我使用什么字符集,它都会在文件的开头放置一个 UTF-8 bom。这非常烦人,因为 A)我指定 iso 和 B)我们有很多用户使用将 UTF-8 bom 显示为垃圾字符的工具。

我什至尝试将结果写入字符串,剥离 UTF-8 BOM,然后将其回显并仍然得到它。问题可能出在 Apache 上吗?如果我将 fopen 更改为本地文件,它会在没有 UTF-8 BOM 的情况下正常写入。

0 投票
3 回答
6310 浏览

objective-c - 使用 BOM 创建一个 UTF-8 字符串

我正在使用 MD5 函数和 Base64 编码来生成用户密钥(用于登录到所用 API 的数据层)

我在javascript中编写了代码,这很好,但是在Objective C中我正在努力处理BOM

我的代码是:

使用上面的代码我进入内存:

替代文字
(来源:balexandre.com

女巫不是我真正需要的...

我什至尝试过

没有运气...

usingUTF8String不会像在 C# 中那样自动附加 BOM :-(

如何正确附加 BOM?

0 投票
2 回答
1242 浏览

saxparser - saxparser 忽略字节顺序标记

我们的 saxparser 不会忽略出现在文件开头的字节顺序标记。

如何让我的 sax 解析器忽略字节顺序标记?