我最近下载了一组视频,文件名应该是日文字符。相反,曾经上传它们的人搞砸了格式。
我得到的不是假名、平假名和汉字;
002òÅü¢âyâbâeâBâôâO(âuâïâ}).mp4
我想知道是否有办法解决这个不要求再次上传的问题?
我尝试将名称放入文本文件中,然后对该文件进行十六进制编辑以更改其编码,但这不起作用。
我最近下载了一组视频,文件名应该是日文字符。相反,曾经上传它们的人搞砸了格式。
我得到的不是假名、平假名和汉字;
002òÅü¢âyâbâeâBâôâO(âuâïâ}).mp4
我想知道是否有办法解决这个不要求再次上传的问题?
我尝试将名称放入文本文件中,然后对该文件进行十六进制编辑以更改其编码,但这不起作用。
我会使用 Python 的chardet库来帮助猜测编码。
>>> import chardet
>>> s='002òÅü¢âyâbâeâBâôâO(âuâïâ}).mp4'
>>> chardet.detect(s.encode('l1'))
{'encoding': 'ISO-8859-5', 'confidence': 0.536359806931924, 'language': 'Russian'}
>>> chardet.detect(s.encode('cp437'))
{'encoding': 'SHIFT_JIS', 'confidence': 0.99, 'language': 'Japanese'}
>>> chardet.detect(s.encode('cp850'))
{'encoding': 'SHIFT_JIS', 'confidence': 0.99, 'language': 'Japanese'}
可能不是 ISO-8859-1,更可能是 IBM 437 或 850。
>>> s.encode('cp850').decode('sjis')
'002撫⊃ペッティング(ブルマ).mp4'
>>> s.encode('cp437').decode('sjis')
'002撫○ペッティング(ブルマ).mp4'
可能是其中之一,但我无法阅读它们。