问题标签 [utf-8]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
639 浏览

wordpress - 如何根除 Wordpress 博客中的神秘字符编码问题?

我正在尝试创建一个新的 Wordpress 博客。我在某些浏览器中看到有趣的字符,但在其他浏览器中没有看到单引号、双引号和省略号。我已经想到的事情:

  • 输出本身的 HTML 模板页面设置为 UTF-8
  • 管理页面是 UTF-8
  • 存储数据的 MySQL 数据库表是 UTF-8 编码的
  • 我正在输入常规键盘 (') 和 (") 的 (...),而不是从另一个应用程序粘贴。
  • 我正在使用 WordPress 开箱即用的 WSYWIG

看起来错误的浏览器(例如):Windows 的 Firefox、IE7 Windows 的浏览器(例如)看起来不错的浏览器:OS X 的 Firefox、OS X 的 Safari

我从这里去哪里?

0 投票
16 回答
45028 浏览

ruby-on-rails - 如何替换 Ruby 中的重音拉丁字符?

我有一个ActiveRecord模型,Foo它有一个name字段。我希望用户能够按名称搜索,但我希望搜索忽略大小写和任何重音符号。因此,我还存储了一个canonical_name要搜索的字段:

我需要填写“这里的东西”来替换重音字符。有什么比

而且,就此而言,由于我不在 Ruby 1.9 上,我不能将那些 Unicode 文字放入我的代码中。实际的正则表达式会看起来更丑陋。

0 投票
1 回答
2793 浏览

oracle - 将扩展 ASCII 导入 Oracle

我有一个导入包含一些字符串的二进制文件的过程。字符串可以包含扩展的 ASCII,例如 CHR(224)、'à'。该过程采用 RAW 并将 BCD 字节一一转换为字符串中的字符。

问题是扩展的 ASCII 字符正在丢失。我怀疑这是由于它们的值在 UTF8 中意味着其他东西。

我认为我需要的是一个接受 ASCII 字符索引并返回适当 UTF8 字符的函数。

更新:如果我碰巧知道传入文本的等效 Oracle 字符集,我可以将原始字节转换为 UTF8 吗?源文本将始终为单字节。

0 投票
3 回答
1625 浏览

macos - OS X 文件复制默认转换文本编码

我工作区中的所有 PHP 文件都以Unicode (UTF-8, no BOM)编码。我经常复制现有的源文件以用作新脚本的基础。总是(使用路径查找器或原始查找器),OS X 会将重复文件的编码转换为Western (Mac OS Roman)

复制文本文件时,有什么方法可以使 OS X 正常运行而不转换文本编码?或者让它对所有扩展名为 .php 的文件默认使用特定的文本编码(西方除外!)?

0 投票
3 回答
5788 浏览

c - 将 unicode 代码点转换为 UTF-8 的最简单方法

在 C 中将 Unicode 代码点转换为 UTF-8 字节序列的最简单方法是什么?想到的唯一方法是使用iconv从 UTF-32LE 代码页映射到 UTF-8,但这似乎有点矫枉过正。

0 投票
4 回答
581 浏览

sql-server - 我可以恢复错误存储在 varchar 字段中的国际字符吗?

我的客户有一个旧的 MS SQL 2000 数据库,它使用 varchar(50) 字段来存储名称。他试图使用这个数据库来捕获一些数据(通过网络表单)。一些表单填写者来自其他国家,当这些人中的一些人输入他们的名字时,varchar 字段变得疯狂。是否有可能以某种方式恢复数据?也许通过根据它在 ASCII/varchar 中解析的内容以及该人来自的国家/地区来猜测该字符应该是什么?部分数据:

姓名/国家/地区/名字或姓氏?
Jiřà / CZE / F
Torbjörn / FIN / F
Huszár / HUN / L
Jürgen / DEU / F
Müller / CHE / L
Bumbálková / CZE / L
Doležal / CZE / L
Loïc / DEU / L

顺便说一句,网络表单指定了这个内容类型:

0 投票
1 回答
1663 浏览

visual-studio-2008 - VS2008 Express:如何将所有文件默认保存为UTF-8?

有没有办法让 Visual Studio 2008 Express 默认将所有文件存储为 UTF-8?

谢谢你的时间。最好的祝福。

0 投票
11 回答
66075 浏览

.net - Outlook 自动清理我的换行符并搞砸了我的电子邮件格式

我正在使用 dotnet 框架发送电子邮件。这是我用来创建消息的模板:

在 Outlook 中收到邮件时,Outlook 告诉我“删除了此邮件中的额外换行符”。消息显示如下:

请注意 Outlook 如何错误地删除名称、EEOverageAmount 等后所需的换行符...

对于电子邮件收件人来说,获得格式正确的电子邮件很重要,我必须假设他们中的一些人使用 Outlook 2003。我也不能假设他们知道足以关闭自动清理功能以使邮件正确格式化。

我已经在其他邮件客户端中查看过这些消息并且它们显示正确

更多信息:

  • 我正在使用 UTF-8 BodyEncoding (msg.BodyEncoding = System.Text.Encoding.UTF8)
  • msg.Body 是从一个 UTF-8 编码的文本文件中读取的,每一行都以 crlf 结尾。

问题:如何更改消息的格式以避免此问题?

0 投票
4 回答
5788 浏览

unicode - HtmlEncode UTF-8

我在 asp-classic 中的 utf-8 字符串上使用 Server.HtmlEncode,它可以正常工作,直到字符串中有一些重音符号,例如 Rüstü Recber,它显示为 Rüstü Recber (Rüstà ;¼ 来源中的 Recber)。

我尝试将 Response.Charset 属性设置为 utf-8 但这没有任何区别。

0 投票
4 回答
10145 浏览

ruby-on-rails - 如何在 ruby​​ 中使用 utf8 的正则表达式

在 RoR 中,如何验证带有 utf8 代码的张贴表单的中文或日文单词。

在GBK代码中,它使用[\u4e00-\u9fa5]+来验证中文单词。在 PHP 中,它使用 /^[\x{4e00}-\x{9fa5}]+$/u 来处理 utf-8 页面。