问题标签 [utf-8]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
26107 浏览

ruby - 使用 Ruby 将 UTF8 转换为 ANSI

我有一个 Ruby 脚本,它在 Linux 机器中远程生成一个 UTF8 CSV 文件,然后通过 SFTP 将文件传输到 Windows 机器。

然后我需要用 Excel 打开这个文件,但是 Excel 没有 UTF8,所以我总是需要在能够将 UTF8 转换为 ANSI 的文本编辑器中打开文件。

我很想使用 Ruby 以编程方式执行此操作,并避免手动转换步骤。最简单的方法是什么?

PS:我尝试使用 iconv 但没有成功。

0 投票
6 回答
33647 浏览

windows - UTF-16 到 UTF-8 的转换(用于 Windows 中的脚本)

将 UTF-16 文件转换为 UTF-8 的最佳方法是什么?我需要在 cmd 脚本中使用它。

0 投票
3 回答
5860 浏览

java - 处理 UTF-8 编码

我们有一个在 Weblogic 服务器上运行的 Java 应用程序,它从 JMS 或 MQ 队列中提取 XML 消息并将其写入另一个 JMS 队列。应用程序不会以任何方式修改 XML 内容。我们使用 BEA 的 XMLObject 来读取消息并将消息写入队列。

XML 消息包含编码类型声明为 UTF-8。

当 XML 包含超出正常 ASCII 范围的字符(例如 £ 符号)时,我们会遇到问题。当从队列中读取消息时,我们可以看到 £ 符号是完整的,但是一旦我们将其写入目标队列, £ 符号就会丢失并被替换为 £。

我检查了操作系统级别设置(区域设置),一切似乎都很好。我还应该检查什么以确保不会发生这种情况?

0 投票
1 回答
2316 浏览

apache - UTF-8 URI 爆炸 Apache & mod_rewrite

我有带有 mod_rewrite 的 Apache,每当我输入一个带有重音字符的 URI 时,Apache 都会给我一个“找不到页面”错误。

URI 是:/places/tags/Café

我的页面编码是 UTF-8。我的数据库连接和表是 UTF-8。我的 Apache DefaultCharacterSet = UTF-8。是的,Apache 有语言包,但我相信它们用于页面内容,而不是 URI。

我们不希望将 url 编码成百分号和 html 实体,在我们的 1 亿行数据中,去除特殊字符目前是不切实际的。

任何帮助将不胜感激。

0 投票
3 回答
11184 浏览

python - UTF-8 latin-1 转换问题,python django

好的,所以我的问题是我有字符串 '\222\222\223\225',它在数据库中存储为 latin-1。我从 django 得到的(通过打印它)是以下字符串,'ââââ¢' 我认为它是它的 UTF 转换。现在我需要将字符串传递给执行此操作的函数:

我收到此错误:

chr() arg 不在范围内 (256)

如果我首先尝试将字符串编码为 latin-1,则会收到此错误:

'latin-1' 编解码器无法对位置 0-3 中的字符进行编码:序数不在范围内(256)

我已经阅读了很多关于字符编码如何工作的内容,但我缺少一些东西,因为我只是不明白!

0 投票
15 回答
182292 浏览

php - 一直到UTF-8

我正在设置一个新服务器并希望在我的 Web 应用程序中完全支持 UTF-8。我过去曾在现有服务器上尝试过此方法,但似乎总是不得不退回到 ISO-8859-1。

我到底需要在哪里设置编码/字符集?我知道我需要配置 Apache、MySQL 和 PHP 来执行此操作 — 是否有一些我可以遵循的标准清单,或者可能解决不匹配的位置?

这是一个新的 Linux 服务器,运行 MySQL 5、PHP、5 和 Apache 2。

0 投票
13 回答
92416 浏览

visual-studio - 将 Visual Studio 项目中的所有文件保存为 UTF-8

我想知道是否可以将 Visual Studio 2008 项目中的所有文件保存为特定的字符编码。我得到了一个混合编码的解决方案,我想让它们都一样(带有签名的 UTF-8)。

我知道如何保存单个文件,但是项目中的所有文件呢?

0 投票
5 回答
34773 浏览

c++ - 如何将 Unicode 字符串转换为 utf-8 或 utf-16 字符串?

如何将 Unicode 字符串转换为 utf-8 或 utf-16 字符串?我的 VS2005 项目使用 Unicode 字符集,而 cpp 中的 sqlite 提供

用于打开文件夹。如何将字符串、CString 或 wstring 转换为 UTF-8 或 UTF-16 字符集?

非常感谢!

0 投票
9 回答
57629 浏览

java - 如何在 Java 中将 UTF-8 转换为 US-Ascii

我们有一个系统,客户(主要是欧洲人)输入文本(UTF-8)必须分发到不同的系统,其中大多数接受 UTF-8,但现在我们还必须将文本分发到仅接受美国的美国系统-ASCII 7 位

所以现在我们需要将所有欧洲字符翻译成最近的 US-Ascii。是否有任何 Java 库可以帮助完成这项任务?

现在我们刚刚开始添加一个翻译表,其中 Å (瑞典语 AA)->A 等等,我们没有找到任何匹配输入字符的地方,我们将记录它并用问号替换并尝试在下一个版本中修复它,但它似乎效率很低,而且之前肯定有人做过类似的事情。

0 投票
3 回答
590 浏览

php - 如何在 PHP 中检查字符串在 UTF8 中是否只有国际字母和空格?

在 Python 中,我可以将其转换为 Unicode 并执行 '(?u)^[\w ]+$' 正则表达式搜索,但 PHP 似乎不理解国际 \w,或者是吗?