我目前正在编写一个应用程序(App1),它从另一个应用程序(我们称之为App2)远程检索部分文本。全球有多个App2实例,它们都根据本地系统代码页解释其字符串。App2不支持 Unicode。
App1从App2检索文本,没有任何关于文本代码页的提示,但预计在稍后的时间点,将进行手动过程来选择代码页以正确解释文本。
以前自动确定文本代码页的尝试都失败了。
同时,在人工确定之前,这些数据必须存储在 MySQL 数据库中。
存储这些数据的最佳方式是什么?具体来说,什么CHARSET
和COLLATION
最适合在这里使用?
我相信如果字符对字段的字符集无效,MySQL 将不会容忍将字符插入字段。
如果我可以在插入数据库之前检测代码页并将数据转换为 unicode,那将是理想的,但我不知道如何能够一致且可靠地完成此操作。