问题标签 [gbk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 Python 中将字符串编码为 gbk
我想看看不同的字符串在不同的编码中会是什么样子......
例如:
这些都让我得到了我想要的。
但我想看看某些字符串在 gbk、gb2312 或 gb18030 中的样子。
输出不应该是“asdf”以外的东西吗?
我有 python 2.7,我可以在 lib/encodings 中看到 gbk.py 和其他文件
我想知道我是否看到输出没有变化,因为这些字母在该编码中会显示相同,或者因为我需要以某种方式启用这些编码的使用(需要某种导入?)...
python - gbk和cp936有什么区别
因为我是简体中文用户,所以在其他编程工具中我的语言环境编码是“gbk”。但在 Python 中,它是 'cp936'。我发现'cp936'可能和'gbk'一样,因为'gbk'可以||不能解码也可以||不能在'cp936'中解码...... 那么,'gbk'有什么区别'和'cp936'?而且,更重要的是,为什么 Python 使用 'cp936' 而不是 'gbk'?
javascript - 如何使用纯 JavaScript 将 GBK 转换为 UTF8?
我想从其他网站加载一些内容是 GBK 编码的文本,但我的网站是 UTF8。
无论如何我可以将这些GBK文本转换为UTF8进行显示吗?
由于某些原因,我只能为此使用 JavaScript。
python - 在Python中打印一个包含汉字的列表
我的代码看起来像:
Eclipse 控制台中的输出很奇怪:
我的第一个问题是:为什么最后一行得到正确的输出,而其他的却没有?
我的第二个问题是:如何纠正错误的(使它们输出真实字符而不是以“x”开头的代码)?
感谢你们!!
python - 字符串“赵孟俯”的gbk编码
这是python激活模式下的代码:
为什么 GBK 字符串后面有反斜杠?
python - 如何比较python程序中的非英文(中文)字符?
在我的一个 python 程序(python 2.7)中,我需要处理一些汉字:
我有一个文件A.txt,它有两列:“name”和“score”,“name”列可以取一些中文字符串,score是一个1到10之间的整数值。A.txt是编码的在GBK中,这是一种汉字编码。
我将A.txt的每一行插入到我的mysql表tb_name_score中,它有三列:ID、NAME、SCORE,它的NAME列的编码是latin1_swedish_ci
现在,我有另一个文件名B.txt,它也有两列,“name”和“score”,我需要根据B.txt更新tb_name_score的SCORE列。b.txt 也是用GBK编码的
因此,我遍历 B.txt,读取一行并使用它的“名称”值与 tb_name_score.NAME 中的记录进行比较,如果它们相等,则更新 tb_name_score.SCORE。但是,虽然 B.txt 中该行的“name”列与 tb_name_score.NAME 中的值是相同的中文字符串,但“=”返回 false,我只是无法更新表。有人可以帮忙吗?谢谢!
javascript - 如何在 Titanium Mobile 中将 HTTP GET 数据的字符集从 GBK 转换为 UTF8?
中国的网站总是使用 gbk 字符集。我试图从一个站点获取数据:
但它回应:
python - python可以在一个字符串中处理多个中文编码吗?
输入字符串有中文单词,有的用UTF8编码,有的用GB2312编码。python可以用多种编码处理这样的字符串吗?
python - 使用 BCBio 的 GFF 解析器解析不正确
我正在尝试使用 BCBio 的 GFF 解析器,希望可以将它用于我的工具。我从 NCBI 的 RefSeq 数据库中获取了一个测试 .gbk 文件,并用它来解析为一个 .gff 文件。
我使用的代码(来自http://biopython.org/wiki/GFF_Parsing):
以下是部分结果:
问题在于第三和第四行:它从 .gbk 中获取完整的标头信息并将其作为一行放入,而应该跳过它。最后两行是正确的(输出文件的其余部分也是如此)。我尝试使用几个不同的 .gbk 文件,都产生相同的结果。
作为参考,这里是 .gbk 文件的开头:
有谁知道我该如何解决这个问题?
我使用以下行来过滤掉前两行错误的行:
这似乎适用于几个测试.gbk。但我仍然很好奇它为什么首先解析那些?
python - 如何在 Python 中比较 unicode 和 str
我的代码:
这两个是同一个汉字。但很明显,a == b
是False
。我该如何解决?请注意,我无法转换a
为,utf-8
因为我无权访问代码。我需要转换b
为正在使用的编码a
。
所以,我的问题是,我该怎么做才能将编码b
转换为的编码a
?