这是我第一次编码。我想从我的文档中自动获取所有文件 mime 格式。我遇到了一个问题,当文件名是德语字符(例如:ß)时,函数将无法读取文件。并返回错误
无法打开“Payload_documents\Bauplan_gro\303\237.pdf”(非法字节序列)
我怎么解决这个问题?或者我应该用德语重命名每个文件名?有没有办法从名称中按类型获取文件mime格式(如“。”之后)?而不是通过路径?然后我可能可以解决问题。
这是我的代码:
import magic
file_format = magic.from_file("Payload_documents\Bauplan_groß.pdf",mime = True)
print(file_format)