问题标签 [character-set]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
50 浏览

mysql - MYSQL:VIEW的DDL中的字符串几个小时后变成乱码

我最近修改了一个带有Workbench的VIEW的DDL,添加了一个带有中文字符串的过滤器。修改后的 DDL 可以成功保存并完美运行。但是,DDL 中的修改本身在几个小时后变成了乱码。character_set_database 和一些列的字符集原来是utf8(utf8_general_ci)。收到错误后,我将它们全部设为 utf8mb4,并使用默认排序规则(utf8mb4_0900_ai_ci)。更改字符集后,乱码符号确实发生了变化,但它们仍然是乱码。任何想法?

示例:
修改后的 DDL: where m. NAME未在 ('王晓明','张小英')
DDL 修改几小时后: where m. NAME不在 ('???D?','??\?')

环境:
MYSQL 8.0.13 Community Server - GPL
Windows 10 Professional 64bit(繁体中文;打字输出字符集:UNICODE)
Workbench 8.0.13

显示变量,如 '%char%'
结果:
character_set_client utf8mb4
character_set_connection utf8mb4
character_set_database utf8mb4
character_set_filesystem binary
character_set_results utf8mb4
character_set_server utf8mb4
character_set_system utf8
character_sets_dir C:\Program Files\MySQL\MySQL Server 8.0\share\charsets\

0 投票
3 回答
596 浏览

java - JAVA 到 EBCIDIC 的转换没有发生

我正在尝试从一个应用程序获取数据并在处理数据后将其发送到另一个(大型机)。

假设我正在获取“这是来自另一个应用程序”的数据,处理与“此数据已处理”相同的处理状态。最终消息应结合使用编码(Cp1047)到大型机应用程序来读取与

0024这是来自另一个应用程序001A此数据已处理


0024 的十进制值为 36(消息长度 + 4 是十六进制值长度)
001A 的十进制值为 26(处理的消息长度 + 4)

我的应用程序在 Java8 上运行并使用 websphere MQ。我需要将数据发送到从 Mainframe MQ 接收数据的应用程序。WebSphere MQ 中的远程队列将消息放入大型机 MQ 的本地队列。我的代码如下,使用 Cp1047 转换数据和编码,

接收方应用程序(大型机)决定哪个是原始消息和基于处理状态的 4 个字符的十六进制值。他们能够阅读大部分信息,但不是全部。例如,长度 805 的十六进制值为 325,但在大型机 mq 条目中为 315。由于长度不匹配,它们无法处理。

另一个样本数据:- OO25这是来自源001A的原始数据,已成功处理


0025 是 org msg length(33) + 4 的十六进制值,001A 是处理后的 msg 长度 (22) + 4 的十六进制值。这里 4 是十六进制值的长度。
我是否缺少任何转换为​​ ebcidic 的逻辑?

0 投票
2 回答
577 浏览

excel - Excel 的排序方式可以不同于其默认的美国字符集吗?

我的问题基本上与THIS ONE(它有一个我不能在这里使用的基于数据库的解决方案)相反。

我使用 SAP,它以这种方式对字符进行排序:

0-9,亚利桑那州,_

但我正在将数据下载到 Excel 并根据正确的 SAP 字符集排序顺序操作范围。

如何强制 Excel 以与 SAP 相同的方式排序,下划线排在最后。

在 Excel 的排序功能中尝试单个字符的自定义排序列表后,Excel 仍然/总是这样排序:

_,0-9,亚利桑那州

有没有办法让 Excel 像 SAP 一样排序?如果需要,我可以做 Excel 宏。

或者,如果有人知道如何在 SAP 界面中让原生 SAP 表像 Excel 一样排序,那也可以解决这个问题。

0 投票
1 回答
525 浏览

python - “é”来自哪个字符集?(Python:带“é”的文件名,如何使用 os.path.exists 、filecmp.cmp、shutil.move?)

来自什么字符集é?在 Windows 记事本中,在 ANSI 文本文件中包含此字符可以很好地保存。插入类似的东西,你会得到一个错误。é似乎在 Putty 的 ASCII 终端中工作正常(CP437 和 IBM437 是否相同?)而没有。

我可以看到这是 Unicode,而不是 ASCII。但什么是é?它不会给出我在记事本中使用 Unicode 时遇到的错误,但是SyntaxError: Non-ASCII character '\xc3' in file on line , but no encoding declared;在我添加 Python NLTK 所建议的“魔术注释”之前,Python 抛出了:SyntaxError: Non-ASCII character '\xc3' in file (Sentiment Analysis -NLP)

我添加了“魔术注释”并且没有收到该错误,但是 os.path.isfile() 说文件名é不存在。具有讽刺意味的是,该字符é位于Marc-André Lemburg错误链接到的 PEP 的作者中。

编辑:如果我打印文件的路径,重音 e 显示为,├⌐但我可以复制并粘贴é到命令提示符中。

EDIT2:见下文

编辑3:

0 投票
1 回答
466 浏览

dicom - 个别标签能否覆盖特定字符集中的字符集 (0008,0005)

如果我创建一个具有基本单字节特定字符集(如 (0008,0005) = ISO_IR 100)的 DICOM 对象,其中一个标签可以使用不同的 2 字节字符集吗?例如,患者姓名 (0010,0010) 可以用简体中文 (ISO 2022 IR 58) 编码吗?

0 投票
1 回答
3453 浏览

php - Laravel SQLSTATE [01000]:警告:1265 乌尔都语或阿拉伯字符列的数据被截断,RTL 表示从右到左

我陷入错误很多天,我想用乌尔都语或阿拉伯语在数据库中插入数据,我面临的问题很奇怪,插入查询改变了引发数据截断错误的变量的位置,我用过同样的工作在工作正常的寄存器 Quer 中,我已经设置了字符集等,每件事都很完美,但问题出在插入值期间。我正在发送 larave 抛出的错误查询。

# #

使用用户模型插入相同的字段,它正确插入了urdu或阿拉伯语文本,两个字符集相同,但插入查询中出现问题,移动了您可以看到上述查询的位置。我尝试过查询生成器和其他类型,但是没用。

0 投票
1 回答
773 浏览

encoding - 雪花:将字段编码转换为 UTF8

我有一个来自源的字段,它具有 HTML 编码字符,我必须以 UTF8 格式加载数据。例如:来自源的数据是VE-S&P Global Blue Coat Replacement 目标中的数据需要存储为VE-S&P Global Blue Coat Replacement”。

谁能指导我如何在 Snowflake 中将编码转换为 UTF8?

0 投票
1 回答
67 浏览

mysql - mysql8:使用introducer时服务器收到语句后应该翻译成什么字符集?

根据 MYSQL8 文档:

关于客户端连接的字符集和排序规则处理的几个问题可以根据系统变量来回答:

  • 离开客户端时的语句是什么字符集?
    服务器将 character_set_client 系统变量作为客户端发送语句的字符集。
  • 服务器收到语句后应该将它们翻译成什么字符集?

    为了确定这一点,服务器使用 character_set_connection 和 collat​​ion_connection 系统变量:

    服务器将客户端发送的语句从 character_set_client 转换为 character_set_connection。例外:对于具有引入者(例如 _utf8mb4 或 _latin2)的字符串文字,引入者确定字符集。请参阅第 10.3.8 节,“字符集介绍器”。

读完这段话,我一头雾水。文档是不是想告诉我们,如果使用introducer,introducer会替换character_set_connection编码?

select _gbk '中文';或者让我举一个具体的例子,执行和执行之间有什么区别select '中文';吗?介绍人如何_gbk影响服务器对语句的字符集转换?

我希望有人能帮我解释一下官方描述的含义和我的这个例子,非常感谢。

参考链接:charset-connection

0 投票
0 回答
23 浏览

java - ActiveMQ - 覆盖默认 CharacterSet

有没有办法覆盖默认 CharacterSet 并在 ActiveMQ 配置(xml)中或通过启动参数将其显式设置为 UTF-8?

0 投票
1 回答
38 浏览

mysql - mysql字符集的优先级是多少?

您可以检查 show create table 'table'、show create database 'database'、\s 与 db、table、system 的字符集。

如果情况如下,该表使用什么字符集?

如果客户端是utf8mb4,表是utf8mb4,作为utf8mb4使用是没有问题的。我可以忽略所有其他设置吗?