问题标签 [utf8-decode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1309 浏览

java - Java将字符流转换为人类“可读”的字符串

我有一堆看起来像这样的字符:

有时我有这样的混合:

第一个翻译成:

Комуникационна кабелна система

第二个是:

一般情况

我可以使用浏览器看到这一点并将它们放入正文中。

但是我怎样才能让java输出“真实”的字符呢?上面的编码叫什么?

我尝试了几件事,最后这个(没有用):

0 投票
3 回答
3383 浏览

perl - 如何对 URL 的西里尔字符进行编码然后对其进行解码?

我在一页上有一个表格:

输入字段之一“search_string”可用于发送西里尔字符,如果发生这种情况,URL 字符串如下所示:

如何将其解码回我发布到的页面上的原始字符串?

0 投票
3 回答
954 浏览

php - 我的脚本工作正常,但我对为什么必须使用 utf8_decode() 感到困惑

我对 utf8_decode() 的行为感到困惑,只想澄清一下。我希望没关系。

这是一个简单的 HTML 表单,我用它来捕获一些文本并将其保存到我的 MySQL 数据库(它使用 utf8_general_ci 排序规则):

如您所见,我已在适当的地方使用 charset=utf8 对此进行了编码。我们接受包含变音符号的文本(例如,ñ、ó 等)。最后,我们在所有文本输入上运行一个小脚本来检查变音符号并将它们更改为 HTML 实体(例如,ñ 变为 ñ)。

当我的脚本接收到输入时,我首先必须执行 utf8_decode($input) 然后运行我的小脚本来检查并根据需要更改变音符号。一切正常。我很好奇为什么我必须在这个输入上运行解码。我了解 utf8_decode 将以 UTF-8 编码的字符串转换为 ISO-8859-1。我想确保——即使一切正常(或者我认为) ——我没有做一些以后会赶上我的古怪事情。例如,我正在发送 ISO-8859-1 编码字符以存储在我的数据库中,该数据库设置为存储/提供 UTF-8 字符。我应该对我的变音符号到实体脚本返回的字符串执行类似运行 utf8_encode() 的操作吗?例如:

感谢任何人对此提供的任何见解。

0 投票
0 回答
73 浏览

django-testing - 如何从 Django 测试中获得非转义的 utf-8 输出?

将 Django 1.3 与 python 2.7 一起使用,测试用例如下:

给我输出:

我倒要看看:

终端支持 utf-8,并且 utf-8 在其他任何地方都以未转义的形式打印,仅对测试的输出进行转义。

  • 我试过做 self.fail(msg.encode('utf-8')) 但这会导致 UnicodeDecodeError。
  • 我试过设置 DEFAULT_CHARSET 和 TESTING_CHARSET,但它们没有效果。

我需要更改什么才能获得此输出?

0 投票
1 回答
5609 浏览

python - urllib:获取 utf-8 编码的站点源代码

我正在尝试获取某个网站的一部分。该脚本有效,但它是一个带有 á、é、í、ó、ú 等口音的网站。

当我使用 urllib 或 urllib2 获取站点时,站点源代码没有以 utf-8 编码,我希望它是这样的,因为 utf-8 支持这些重音符号。

我相信目标站点是用 utf-8 编码的,因为它包含以下元标记:

我的python脚本:

但是,我不断得到看起来像是没有用 utf-8 编码的结果。

例如:网站上的“Milán” = urllib2 获取后的“Mil\xe1n”

有什么建议么?

0 投票
1 回答
96 浏览

html - 保存值时的编码问题包含空格字符

我正在使用 rails 3.2.3 我想将一些 html 数据保存到我的数据库中。但它在保存时会被编码。所以当我试图显示这些 html 数据时,它显示为纯文本。想要将纯 html 标签保存到我的数据库中,而不是保存编码数据。我该如何解决这个...

感谢在advnc

0 投票
1 回答
7786 浏览

php - PHP - utf8_decode() 到错误的字符

尝试使用 Twitter 搜索 API。当我调用utf8_decode重新发布的推文时,我得到语音标记/引号显示为问号......

代码:

输出:

所有其他符号均正确显示。

我必须设置要使用的语言吗?如果您想知道我所做的原子查询或其他任何事情,请告诉我。

0 投票
2 回答
7481 浏览

c# - HttpWebRequest 的响应不显示 UTF-8 符号

我有从网站获取响应的简单代码,但有一个小问题。我正在尝试从俄罗斯网站和一个网站获得未知符号的响应,而从另一个网站获得正常文本。哪里可能有问题?

来自:www.kinopoisk.ru 的回复

������ �����...

回复来自:www.yandex.ru

Греция - Чехия。1:2...

0 投票
2 回答
259 浏览

php - PHP - 我需要任何 UTF-8 编码/解码吗?

好的,我正在向我在下面的函数中读取的 UTF-8 文件写入注释,以删除这些注释之间的文本。我的问题是,我需要什么不同的东西来为 UTF-8 文件成功地做到这一点吗?或者下面的代码会起作用吗?基本上,我想知道我是否需要utf8_decode和/或utf8_encode功能,或者iconv功能?

感谢您在有关字符串的 UTF-8 编码和解码方面的帮助,即使它们是注释字符串。

当我将 php 注释写入 UTF-8 文件时,我没有使用任何转换。我可以做??php 注释之间的字符串定义已经以 UTF-8 编码,但是在文件中似乎可以正常工作。任何帮助在这里表示赞赏。

0 投票
2 回答
1904 浏览

c# - 在 C# 中使用双引号对字符串进行 UTF-8 编码

解码是<?xml version=\"1.0\" encoding=\"UTF-8\"?>

结果有\" _\"\r\n