0

我有一个表,其中一列的编码为 cp1252,排序规则为 latin_swedish_ci,我需要将其更改为 utf8_general_ci。

我想检查一下由于转换,我是否不会在其中一行中出现奇怪的字符。

此列存储域名,我不确定其中一行中是否有瑞典字符。

我一直在研究这个,但在更改集合之前我无法找到一种方法来检查数据的完整性。

到目前为止,我最好的猜测是编写一个脚本来检查是否有一列不包含任何英文字母字符,但我很确定有更好的方法来做到这一点。

任何帮助都会很棒!

更新

我发现多行有这样的垃圾:

ÜZìp;ìê+ØeÞ{/e¼ðP;

有没有办法在不检查每一行的情况下摆脱那些垃圾?

4

1 回答 1

1

典型的方法是尝试一下:

  • 用于SHOW CREATE TABLE创建结构相同的测试表
  • 用于使用INSERT INTO .. SELECT ..原始的主键和相关列填充测试表
  • 尝试转换,注意解决问题的必要步骤
  • 冲洗并重复
于 2013-06-14T13:40:49.707 回答