问题标签 [utf-8]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
wordpress - 如何根除 Wordpress 博客中的神秘字符编码问题?
我正在尝试创建一个新的 Wordpress 博客。我在某些浏览器中看到有趣的字符,但在其他浏览器中没有看到单引号、双引号和省略号。我已经想到的事情:
- 输出本身的 HTML 模板页面设置为 UTF-8
- 管理页面是 UTF-8
- 存储数据的 MySQL 数据库表是 UTF-8 编码的
- 我正在输入常规键盘 (') 和 (") 的 (...),而不是从另一个应用程序粘贴。
- 我正在使用 WordPress 开箱即用的 WSYWIG
看起来错误的浏览器(例如):Windows 的 Firefox、IE7 Windows 的浏览器(例如)看起来不错的浏览器:OS X 的 Firefox、OS X 的 Safari
我从这里去哪里?
ruby-on-rails - 如何替换 Ruby 中的重音拉丁字符?
我有一个ActiveRecord
模型,Foo
它有一个name
字段。我希望用户能够按名称搜索,但我希望搜索忽略大小写和任何重音符号。因此,我还存储了一个canonical_name
要搜索的字段:
我需要填写“这里的东西”来替换重音字符。有什么比
而且,就此而言,由于我不在 Ruby 1.9 上,我不能将那些 Unicode 文字放入我的代码中。实际的正则表达式会看起来更丑陋。
oracle - 将扩展 ASCII 导入 Oracle
我有一个导入包含一些字符串的二进制文件的过程。字符串可以包含扩展的 ASCII,例如 CHR(224)、'à'。该过程采用 RAW 并将 BCD 字节一一转换为字符串中的字符。
问题是扩展的 ASCII 字符正在丢失。我怀疑这是由于它们的值在 UTF8 中意味着其他东西。
我认为我需要的是一个接受 ASCII 字符索引并返回适当 UTF8 字符的函数。
更新:如果我碰巧知道传入文本的等效 Oracle 字符集,我可以将原始字节转换为 UTF8 吗?源文本将始终为单字节。
macos - OS X 文件复制默认转换文本编码
我工作区中的所有 PHP 文件都以Unicode (UTF-8, no BOM)编码。我经常复制现有的源文件以用作新脚本的基础。总是(使用路径查找器或原始查找器),OS X 会将重复文件的编码转换为Western (Mac OS Roman)。
复制文本文件时,有什么方法可以使 OS X 正常运行而不转换文本编码?或者让它对所有扩展名为 .php 的文件默认使用特定的文本编码(西方除外!)?
c - 将 unicode 代码点转换为 UTF-8 的最简单方法
在 C 中将 Unicode 代码点转换为 UTF-8 字节序列的最简单方法是什么?想到的唯一方法是使用iconv
从 UTF-32LE 代码页映射到 UTF-8,但这似乎有点矫枉过正。
sql-server - 我可以恢复错误存储在 varchar 字段中的国际字符吗?
我的客户有一个旧的 MS SQL 2000 数据库,它使用 varchar(50) 字段来存储名称。他试图使用这个数据库来捕获一些数据(通过网络表单)。一些表单填写者来自其他国家,当这些人中的一些人输入他们的名字时,varchar 字段变得疯狂。是否有可能以某种方式恢复数据?也许通过根据它在 ASCII/varchar 中解析的内容以及该人来自的国家/地区来猜测该字符应该是什么?部分数据:
姓名/国家/地区/名字或姓氏?
Jiřà / CZE / F
Torbjörn / FIN / F
Huszár / HUN / L
Jürgen / DEU / F
Müller / CHE / L
Bumbálková / CZE / L
Doležal / CZE / L
Loïc / DEU / L
顺便说一句,网络表单指定了这个内容类型:
visual-studio-2008 - VS2008 Express:如何将所有文件默认保存为UTF-8?
有没有办法让 Visual Studio 2008 Express 默认将所有文件存储为 UTF-8?
谢谢你的时间。最好的祝福。
.net - Outlook 自动清理我的换行符并搞砸了我的电子邮件格式
我正在使用 dotnet 框架发送电子邮件。这是我用来创建消息的模板:
在 Outlook 中收到邮件时,Outlook 告诉我“删除了此邮件中的额外换行符”。消息显示如下:
请注意 Outlook 如何错误地删除名称、EEOverageAmount 等后所需的换行符...
对于电子邮件收件人来说,获得格式正确的电子邮件很重要,我必须假设他们中的一些人使用 Outlook 2003。我也不能假设他们知道足以关闭自动清理功能以使邮件正确格式化。
我已经在其他邮件客户端中查看过这些消息并且它们显示正确
更多信息:
- 我正在使用 UTF-8 BodyEncoding (msg.BodyEncoding = System.Text.Encoding.UTF8)
- msg.Body 是从一个 UTF-8 编码的文本文件中读取的,每一行都以 crlf 结尾。
问题:如何更改消息的格式以避免此问题?
unicode - HtmlEncode UTF-8
我在 asp-classic 中的 utf-8 字符串上使用 Server.HtmlEncode,它可以正常工作,直到字符串中有一些重音符号,例如 Rüstü Recber,它显示为 Rüstü Recber (Rüstà ;¼ 来源中的 Recber)。
我尝试将 Response.Charset 属性设置为 utf-8 但这没有任何区别。
ruby-on-rails - 如何在 ruby 中使用 utf8 的正则表达式
在 RoR 中,如何验证带有 utf8 代码的张贴表单的中文或日文单词。
在GBK代码中,它使用[\u4e00-\u9fa5]+来验证中文单词。在 PHP 中,它使用 /^[\x{4e00}-\x{9fa5}]+$/u 来处理 utf-8 页面。