问题标签 [python-unicode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何在文件中写入俄语字符?
在我尝试输出俄语字符时在控制台中它给了我???????????????
谁知道为什么?
我尝试写入文件-在这种情况下是相同的情况。
例如
里面的文件是 - ???????????????????????????/
或者
另外记事本不允许我用俄语字母保存文件。我给这个:
此文件包含 Unicode 格式的字符,如果您将此文件保存为 ANSI 编码的文本文件,这些字符将会丢失。要保留 Unicode 信息,请单击下面的取消,然后从编码下拉列表中选择一个 Unicode 选项。继续?
如何调整我的系统,所以我不会有这个问题。
django - verbose_name 或 help_text 中的重音/特殊字符(例如,ñ)?
如何在 verbose_name 或 help_text 中使用带重音符号或特殊字符(如 ñ)的字母?
url-encoding - python url unquote后跟unicode解码
我有一个 unicode 字符串'%C3%A7%C3%B6asd+fjkls%25asd'
,我想解码这个字符串。
我用过urllib.unquote_plus(str)
,但效果不对。
- 预期的 :
çöasd+fjkls%asd
- 结果 :
çöasd fjkls%asd
双编码 utf-8 字符(%C3%A7
和%C3%B6
)解码错误。
我的python版本是linux发行版下的2.7。获得预期结果的最佳方法是什么?
python - Python Unicode 转换
如何在 Python 中进行以下转换?
django-models - Django表单的help_text中的Unicode/特殊字符?
我正在尝试将特殊字符(特别是 ndash)添加到模型字段的help_text
. 我在表单输出中使用它,所以我尝试了对 HTML 来说似乎很直观的方法:
然后我尝试了:
仍然没有运气。想法?
python - python 2.7中的base64编码unicode字符串
我有一个使用requests
模块从 web 服务检索到的 unicode 字符串,其中包含二进制文档的字节(PCL,碰巧)。其中一个字节的值为 248,尝试对其进行 base64 编码会导致以下错误:
我觉得这有点令人惊讶,因为 248 在无符号字节的范围内(并且可以保存在字节字符串中),但我真正的问题是:编码这个字符串的最佳或正确方法是什么?
我目前的解决方法是:
这似乎可以正常工作,并且结果byte_string
能够进行 base64 编码,但似乎应该有更好的方法。有没有?
python - python字节字符串编码和解码
我正在尝试将包含非 ascii 字符的传入字节字符串转换为有效的 utf-8 字符串,以便我可以将其转储为 json。
我希望 j 是 '\xc2\x80' 但我得到:
在我的情况下,'b' 来自 mysql 通过 google 协议缓冲区,并填充了一些 blob 数据。
有任何想法吗?
编辑:我有以太网帧作为 blob 存储在 mysql 表中(请大家保持话题,不要讨论为什么表中有数据包)。表排序规则是 utf-8,db 层(sqlalchemy,非 orm)正在抓取数据并创建将 blob 存储为 python 'str' 的结构(google 协议缓冲区)。在某些情况下,我直接使用协议缓冲区没有任何问题。在其他情况下,我需要通过 json 公开相同的数据。我注意到的是,当 json.dumps() 做它的事情时,'\x80' 可以替换为无效的 unicode char (\ufffd iirc)
python - Python - “ascii”编解码器无法解码字节
我真的很困惑。我试图编码,但错误说can't decode...
。
我知道如何避免字符串上带有“u”前缀的错误。我只是想知道为什么调用编码时错误是“无法解码”。Python 在幕后做什么?
python - 使用python和lxml忽略xml中的unicode?
我希望忽略我的 xml 中的 unicode。我愿意在处理输出时以某种方式改变它。
我的蟒蛇:
创建以下输出:
但是,如果我尝试重新添加,'-'join(target).replace('\n-','')
我会同时得到这个错误print
和outFile.write
:
我怎样才能忽略 unicode,以便我可以target
使用outFile.write
?
python - python - 如何在带有空格的python中将泰米尔语unicode值数组转换为泰米尔语字符串?
这是泰米尔语 unicode 代码点的列表
[u'\u0b9a', u'\u0b9f', u'\u0bcd', u'\u0b9f', u'\u0b9a', u'\u0baa', u'\u0bc8', u'\u0baf', u '\u0bbf', u'\u0bb2', u'\u0bcd', u'\u0ba8', u'\u0bc7', u'\u0bb1', u'\u0bcd', u'\u0bb1', u'\ u0bc1]
如何将其转换为可读字符串?