我有一个包含序列的大文本文件,例如
\u02BBUtthay\u0101n h\u01E3ng Ch\u0101t 考艾
但是,它们的渲染与上面完全相同。我如何转换它以便人们只看到 UTF-8?如果可能的话,我更愿意在命令行处理文件。
我有一个包含序列的大文本文件,例如
\u02BBUtthay\u0101n h\u01E3ng Ch\u0101t 考艾
但是,它们的渲染与上面完全相同。我如何转换它以便人们只看到 UTF-8?如果可能的话,我更愿意在命令行处理文件。
使用 printf 命令。
http://manpages.ubuntu.com/manpages/intrepid/man3/printf.3.html
如果需要,您也可以将其包装在 $() 中以用作变量。
例如,
echo $(printf '\u02BBUtthay\u0101n h\u01E3ng Ch\u0101t Khao Yai')
这输出:ʻUtthayān hǣng Chāt Khao Yai
希望有帮助。