问题标签 [utf8-decode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - UTF8实解码
可能是一个非常简单的问题,但我想知道如何将 utf8 字符解码为可读字符。
例如 :
进入
L'heure 至上
我尝试了以下方法:
例如,输出从未给我正确的字符
编辑:这是一个愚蠢的问题, html_entity_decode($string, ENT_COMPAT, "ISO-8859-15");
成功了
c# - C#、UTF-8 和编码字符
这是在黑暗中拍摄,如果这个问题听起来像疯子的胡言乱语,我提前道歉。
作为与第三方集成的一部分,我需要使用 C# 对一些字符串信息进行 UTF8 编码,以便我可以通过多部分形式将其发送到目标服务器。问题是他们拒绝了我的一些提交,可能是因为我没有正确编码他们的内容。
现在,我正试图弄清楚目标服务器如何接收或解释短划线或连字符 - 我无法通过查看它来判断它是什么?~@~S
(是的,这是一个 5 个字符的字符串并且不是您的浏览器出现故障)。Encoding.UTF8.GetBytes()
不幸的是,我对如何使用字节数组开始识别问题可能出在哪里没有足够透彻的了解。
如果有人可以提供任何提示或建议,我将不胜感激。到目前为止,我唯一的朋友是 MSDN,而且还不是很多。
更新 1:经过一番挖掘,我发现使用System.Web.HttpUtility.UrlEncode()
EM DASH 字符(“—”)进行编码会将其十六进制编码为“%e2%80%94”。
我目前正在HttpWebRequest
帖子中发送此信息,内容类型为“application/x-www-form-urlencoded”——这可能是导致问题的原因吗?如果是这样,编码一系列名称-值对的正确方法是什么,其值可能包含 Unicode 字符,以便期望 UTF-8 请求的服务器能够理解它?
php - 无法 str_replace 空间
我尝试从谷歌中提取数字字符串并清理它。
但是,我得到的数字有一个空格。我试图用针“”或“ ”替换它。或者utf8_encode,解码$content。它们都不起作用。
php - 在 PHP 中将 URLENCODED 数据转换为 UTF-8
我的数据库中有一个字符串,例如中华武魂
当我发布通过我的网站检索数据的请求时,我以格式将数据发送到服务器%E4%B8%AD%E5%8D%8E%E6%AD%A6%E9%AD%82
我必须采取哪些解码步骤才能将其恢复为可用形式?同时清理用户输入以确保他们不会尝试 SQL 注入攻击?(编码之前或之后的转义字符串?)
编辑:
...当我尝试在 SQL 语句中使用它时,它实际上有效。
我想是因为我在做一个echo
并且die();
没有指定 UTF-8 的标头(因此我猜这对我来说是拉丁语)
谢谢您的帮助!
c# - 如何完成对 UTF8 文件的随机读取
我的理解是,读取 UTF8 或 UTF16 编码文件不一定是随机的,因为偶尔会出现代理字节(例如在东方语言中使用)。
如何使用 .NET 跳转到文件中的大致位置,并从半随机位置读取 unicode 文本?
我是否要丢弃代理字节并等待分词继续阅读?如果是这样,在开始解码之前我应该等待什么有效的断字?
mysql - MySQL 将 UTF-8 更改为 ASCII-8BIT
我有这种情况。
电影名称:
使用这种编码:
然后我将它保存到数据库中。
然后我试图得到这部电影。
所有其他不包含特殊字符(如í
和)的电影作品û
。
这是我的 database.yaml 文件:
使用forced_encoding
.
我将 Rails 3.0.5.rc1 与 MySQL 14.14 一起使用。
任何人都知道问题可能是什么?
php - 如何转换这些奇怪的字符?(ë, Ã, ì, ù, Ã)
我的页面经常显示诸如 ë、Ã、ì、ù、à 之类的东西来代替普通字符。
我使用 utf8 作为标题页和 MySQL 编码。这是怎么发生的?
python - 如何使用 Python 2.6 解析 utf-8 编码的查询参数
我的网站上有一些可爱的(斯堪的纳维亚人?)用户抱怨我无法在 URL 中解析他的用户名,因此我在我的网站上的页面上没有向他显示任何结果。
我很确定浏览器将请求编码为 http://councilroom.com/player?player=G%C3%B6rling
我想让播放器字符串成为 Görling 而不是被转换为的 Görling。
我正在将 web.py 与 python 2.6 一起使用,并尝试按如下方式解析 URL
编辑:在 unutbu 的帮助下,我将其更改为
我认为 webpy 以某种方式错误地解析了 web.ctx 中的完整路径,但 QUERY_STRING 变量没有受到干扰。
iphone - 在字符串中显示非罗马字符
在我的应用程序中,我从远程主机收到如下字符串:“01 - \U00ab\U00d3\U00ba\U00d2\U00c2\U00b4\U00d5\U00b7\U00d5\U00e8\U00a4\U00d2\U00b9\U00b7\U00cd\ U00a7 - \U00c8\U00d4\U00c3\U00d4\U00be\U00c3\U00cd\U00d3\U00e4"
我知道这是泰语的字符串。当我使用 NSLog 的 UILabel 显示它时,它显示为:
01 - «ÓºÒ´շÕè¤Ò¹·Í§ - ÈÔÃԾà ÍÓä
有没有办法让字符串使用泰语字体正确显示?
谢谢,
c# - FileUpload 服务器控件和 unicode 字符
我正在使用 FileUpload 服务器控件从 MS Word 上传以前保存的 HTML 文档(作为网页;过滤)。字符集是 windows-1252。该文档具有智能引号(卷曲)以及常规引号。它也有一些空格(显然),当深入观察时,它们是普通 TAB 或 SPACE 以外的字符。
在 StreamReader 中捕获文件内容时,这些特殊字符将转换为问号。我假设它是因为默认编码是 UTF-8 并且文件是 Unicode。
我继续使用 Unicode 编码创建了 StreamReader,然后用正确的字符替换了所有不需要的字符(我实际上在 stackoverflow 中找到的代码)。这似乎有效....只是我无法将字符串转换回 UTF-8 以在 asp:literal 中显示它。代码在那里,它应该可以工作....但是输出(ConvertToASCII)是不可读的。
请看下面:
此外,正如我之前所说,还有一些更“透明”的字符似乎对应于单词 doc 具有编号缩进的位置,我不知道如何捕获它们的 unicode 值来替换它们......所以如果你有任何提示,请告诉我。
非常感谢提前!!