我有一个文件。我不知道它是如何处理的。这可能是双重编码。我发现这个关于双重编码的链接几乎解决了我的问题:
http://www.spamusers.com/encoding.htm
它具有所有双重编码替换,例如:
À àÁ
 Â
不幸的是,我还有其他奇怪的角色,例如:
ú
ç
ö
你知道如何清理这些奇怪的字符吗?对于我知道的那些我刚刚制作了一个 bash 脚本并且我刚刚替换了它们。但我不知道如何识别其他人。我在 linux 上运行,所以如果你有一些魔法命令,我会喜欢的。