问题标签 [utf-8]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ruby - 使用 Ruby 将 UTF8 转换为 ANSI
我有一个 Ruby 脚本,它在 Linux 机器中远程生成一个 UTF8 CSV 文件,然后通过 SFTP 将文件传输到 Windows 机器。
然后我需要用 Excel 打开这个文件,但是 Excel 没有 UTF8,所以我总是需要在能够将 UTF8 转换为 ANSI 的文本编辑器中打开文件。
我很想使用 Ruby 以编程方式执行此操作,并避免手动转换步骤。最简单的方法是什么?
PS:我尝试使用 iconv 但没有成功。
windows - UTF-16 到 UTF-8 的转换(用于 Windows 中的脚本)
将 UTF-16 文件转换为 UTF-8 的最佳方法是什么?我需要在 cmd 脚本中使用它。
java - 处理 UTF-8 编码
我们有一个在 Weblogic 服务器上运行的 Java 应用程序,它从 JMS 或 MQ 队列中提取 XML 消息并将其写入另一个 JMS 队列。应用程序不会以任何方式修改 XML 内容。我们使用 BEA 的 XMLObject 来读取消息并将消息写入队列。
XML 消息包含编码类型声明为 UTF-8。
当 XML 包含超出正常 ASCII 范围的字符(例如 £ 符号)时,我们会遇到问题。当从队列中读取消息时,我们可以看到 £ 符号是完整的,但是一旦我们将其写入目标队列, £ 符号就会丢失并被替换为 £。
我检查了操作系统级别设置(区域设置),一切似乎都很好。我还应该检查什么以确保不会发生这种情况?
apache - UTF-8 URI 爆炸 Apache & mod_rewrite
我有带有 mod_rewrite 的 Apache,每当我输入一个带有重音字符的 URI 时,Apache 都会给我一个“找不到页面”错误。
URI 是:/places/tags/Café
我的页面编码是 UTF-8。我的数据库连接和表是 UTF-8。我的 Apache DefaultCharacterSet = UTF-8。是的,Apache 有语言包,但我相信它们用于页面内容,而不是 URI。
我们不希望将 url 编码成百分号和 html 实体,在我们的 1 亿行数据中,去除特殊字符目前是不切实际的。
任何帮助将不胜感激。
python - UTF-8 latin-1 转换问题,python django
好的,所以我的问题是我有字符串 '\222\222\223\225',它在数据库中存储为 latin-1。我从 django 得到的(通过打印它)是以下字符串,'ââââ¢' 我认为它是它的 UTF 转换。现在我需要将字符串传递给执行此操作的函数:
我收到此错误:
chr() arg 不在范围内 (256)
如果我首先尝试将字符串编码为 latin-1,则会收到此错误:
'latin-1' 编解码器无法对位置 0-3 中的字符进行编码:序数不在范围内(256)
我已经阅读了很多关于字符编码如何工作的内容,但我缺少一些东西,因为我只是不明白!
php - 一直到UTF-8
我正在设置一个新服务器并希望在我的 Web 应用程序中完全支持 UTF-8。我过去曾在现有服务器上尝试过此方法,但似乎总是不得不退回到 ISO-8859-1。
我到底需要在哪里设置编码/字符集?我知道我需要配置 Apache、MySQL 和 PHP 来执行此操作 — 是否有一些我可以遵循的标准清单,或者可能解决不匹配的位置?
这是一个新的 Linux 服务器,运行 MySQL 5、PHP、5 和 Apache 2。
visual-studio - 将 Visual Studio 项目中的所有文件保存为 UTF-8
我想知道是否可以将 Visual Studio 2008 项目中的所有文件保存为特定的字符编码。我得到了一个混合编码的解决方案,我想让它们都一样(带有签名的 UTF-8)。
我知道如何保存单个文件,但是项目中的所有文件呢?
c++ - 如何将 Unicode 字符串转换为 utf-8 或 utf-16 字符串?
如何将 Unicode 字符串转换为 utf-8 或 utf-16 字符串?我的 VS2005 项目使用 Unicode 字符集,而 cpp 中的 sqlite 提供
用于打开文件夹。如何将字符串、CString 或 wstring 转换为 UTF-8 或 UTF-16 字符集?
非常感谢!
java - 如何在 Java 中将 UTF-8 转换为 US-Ascii
我们有一个系统,客户(主要是欧洲人)输入文本(UTF-8)必须分发到不同的系统,其中大多数接受 UTF-8,但现在我们还必须将文本分发到仅接受美国的美国系统-ASCII 7 位
所以现在我们需要将所有欧洲字符翻译成最近的 US-Ascii。是否有任何 Java 库可以帮助完成这项任务?
现在我们刚刚开始添加一个翻译表,其中 Å (瑞典语 AA)->A 等等,我们没有找到任何匹配输入字符的地方,我们将记录它并用问号替换并尝试在下一个版本中修复它,但它似乎效率很低,而且之前肯定有人做过类似的事情。
php - 如何在 PHP 中检查字符串在 UTF8 中是否只有国际字母和空格?
在 Python 中,我可以将其转换为 Unicode 并执行 '(?u)^[\w ]+$' 正则表达式搜索,但 PHP 似乎不理解国际 \w,或者是吗?