我正在将数据dataframe
从 Excel 工作表加载到 pandas 中,并且我想转换的许多列中有很多非显示字符。
最普遍的是在收缩中使用撇号;例如doesn't
,结果为doesn’t
.
过去我使用过:
str.encode('ascii', errors='ignore').decode('utf-8')
但这需要我知道我需要修复哪些列。
在这种情况下,我有 103 列,每列都可能包含此类问题或其他类型的问题。
我正在寻找一种方法来替换整个dataframe
.
有没有一种快速简便的方法可以在整个过程中执行此操作,dataframe
而无需将每一列传递给函数?