我有一个表,其中一列的编码为 cp1252,排序规则为 latin_swedish_ci,我需要将其更改为 utf8_general_ci。
我想检查一下由于转换,我是否不会在其中一行中出现奇怪的字符。
此列存储域名,我不确定其中一行中是否有瑞典字符。
我一直在研究这个,但在更改集合之前我无法找到一种方法来检查数据的完整性。
到目前为止,我最好的猜测是编写一个脚本来检查是否有一列不包含任何英文字母字符,但我很确定有更好的方法来做到这一点。
任何帮助都会很棒!
更新
我发现多行有这样的垃圾:
ÜZìp;ìê+ØeÞ{/e¼ðP;
有没有办法在不检查每一行的情况下摆脱那些垃圾?