read_csv
我需要通过使用方法从文件中读取数据来创建数据框。但是,分隔符不是很规则:一些列由制表符 ( \t
) 分隔,其他列由空格分隔。此外,某些列可以由 2 个或 3 个或更多空格分隔,甚至可以由空格和制表符的组合分隔(例如 3 个空格、两个制表符,然后是 1 个空格)。
有没有办法告诉熊猫正确处理这些文件?
顺便说一句,如果我使用 Python,我没有这个问题。我用:
for line in file(file_name):
fld = line.split()
它工作完美。它不关心字段之间是否有 2 个或 3 个空格。即使是空格和制表符的组合也不会造成任何问题。熊猫也可以吗?