我有一个输入文件,我正在尝试读入 pandas 数据框。该文件以空格分隔,包括第一个值之前的空格。我已经尝试使用“\W+”正则表达式作为分隔符的 read_csv 和 read_table。
data = pd.io.parsers.read_csv('file.txt',names=header,sep="\W+")
他们读入了正确数量的列,但这些值本身完全是假的。有没有其他人经历过这个,或者我使用不正确
我还尝试逐行读取文件,从中创建一个系列row.split()
并将该系列附加到数据帧,但它似乎由于内存而崩溃。
是否有任何其他选项可以从文件创建数据框?
我正在使用 Pandas v0.11.0,Python 2.7