我正在尝试处理德语单词列表,但无法弄清楚文件的编码方式。'file' unix 命令说该文件是“非 ISO 扩展 ASCII 文本”。大多数单词都是 ascii 格式,但以下是例外:
ANDR\x82
ATTACH\x82
C\x82ZANNE
CH\x83TEAU
CONF\x82RENCIER
FABERG\x82
L\x82VI-STRAUSS
RH\x93NETAL
P\xF2ANGE
任何提示都会很棒。谢谢!
编辑:为了清楚起见,上面的十六进制代码是 C 十六进制字符串文字,因此将 \xXX 替换为文字十六进制值 XX。