我有许多 Excel 电子表格要使用 Django 处理成 MYSQL。我保存为 CSV 并处理文件。我遇到的问题是字段中有各种十六进制字符。当它们出现时,我开始尝试在 python 中替换它们,但它变得不可行。
例如,一个字段中包含字符“”,当我将记录保存到 MYSQL 时,出现以下错误。
警告:不正确的字符串值:第 1 行的列 'description' 的 '\xC2A sim...'
我尝试将 MYSQL 中的字段类型更改为 ucf8_general_ci 但并没有解决问题。
我尝试通过下面的 reformat_content 函数运行我的字符串来玩 unhexlify,但这也没有什么区别。
def asciirepl(match):
# replace the hexadecimal characters with ascii characters
s = match.group()
return binascii.unhexlify(s[2:])
def reformat_content(data):
p = re.compile(r'\\x(\w{2})')
return p.sub(asciirepl, data)
关于如何在整个十六进制字符范围内解决这个问题的任何想法?
非常感谢
富有的