我正在将一个包含一些文本的表格导入到熊猫数据框中。其中一个字符串包含文本“NF-κB” - 即“kappa”字符(表中的一些文本还包含 alpha 和 beta 等)。
当我在表格中阅读时:
pd.read_table('table_processed.txt', sep='\t')
kappa 字符被转换为 '\xce\xba',因此当在 iPython 中查看时,字符串的一部分现在读取为 'NF-\xce\xbaB'。
当字符串被视为数据帧的一部分时,有什么方法可以在导入期间维护字符串编码以维护 kappa 字符?
提前致谢