将外部来源的文本粘贴到纯文本编辑器(例如 TextMate 或 Sublime Text 2)时,一个常见问题是特殊字符也经常被粘贴。其中一些字符呈现良好,但根据来源,有些可能无法正确显示(通常显示为一个问号,周围有一个框)。
所以这实际上是2个问题:
给定一个特殊字符(例如,' 或 ♥),我能否确定用于从我的文本编辑器中显示该字符的 UTF-8 字符代码,和/或将这些字符转换为它们的字符代码?
对于那些作为垃圾进入的“额外特殊”字符,有没有办法弄清楚在源文本中使用什么编码来显示该字符,并且这些字符可以以某种方式转换为 UTF-8?