我有这两个字符串:
%EC%E0%EC%E0+%EC%FB%EB%E0+%F0%E0%EC%F3
%D0%BC%D0%B0%D0%BC%D0%B0%20%D0%BC%D1%8B%D0%BB%D0%B0%20%D1%80%D0%B0%D0%BC%D1%83
这是一个分别在 cp-1251 和 utf-8 中的俄语 url 编码短语。我想在我的 utf-8 终端中使用 perl 以俄语查看它们。不幸的是,perl 模块 Encode::Detect(在 url 解码之后)无法检测到第一个示例的 cp-1251。相反,它提出了这个:“x-euc-tw”。
问题是,在这种情况下检测正确编码的正确方法是什么(指定语言环境参数,使用其他模块......)?