2

多年来,我用于研究的数据库已经从 SyBase 迁移到 MySQL,再从 PostgreSQL 迁移回 MySQL。

它做得非常仔细,因此数据不会因为各种编码问题而被破坏,但不幸的是,一堆记录确实被损坏了。

例如,其中一条记录说Jòzefina,但应该是Józefina

有谁知道我是否可以以编程方式解决这个特定的编码问题?

我的编码能力不是很强,但看起来我可以以某种方式将字节序列映射òó,等等。

我想知道是否有人知道ò对应于哪个编码ó,这样我就不必手动创建从损坏的文本到正确文本的编码映射表,而是自动创建。

4

1 回答 1

1

将排序规则更改为 unicode。做这个:

ALTER TABLE `t1` CONVERT TO CHARACTER SET utf8 COLLATE utf8_general_ci;

您的表使用的是 Windows-1252。如你看到的:

Dec 242
Hex F2
UTF-8 ò
Windows 1252 ò
于 2012-06-16T02:44:42.773 回答