对于我的项目,一切都必须是 unicode。这是我处理所有事情的方式,所有字符串都传递给这个函数:
def unicodify(string):
if not isinstance(string, unicode):
return string.decode('utf8', errors='ignore')
return string
以下方法是生产代码的良好做法吗?如果不是,为什么以及如何建议解码为 unicode?errors='ignore' 实际上不适用于 ValueErrors 'invalid \x escape',但我不确定如何正确处理。
谢谢