1

我有一个大的(无论如何我的经验水平)天体物理数据的文本文件,我正在尝试处理 python/pandas。作为 python 的菜鸟,它正在慢慢出现。是一个文本文件的示例,它是一个 145Mb 的总文件。当我尝试在 pandas 中阅读此内容时,我感到很困惑,因为我不知道该使用什么pd.read_table(example.txt)pd.read_csv(example.csv). 在任何一种情况下,我都无法在没有 ipython 吓坏的情况下调用特定列,例如这里。我知道我在做一些心不在焉的事情。谁能解释那可能是什么?我用较小的文件完成了同样的过程,效果很好,但这似乎限制了它的输出,或者根本不工作。

谢谢。

4

1 回答 1

1

看起来您的列由不同数量的空格分隔,因此您需要将其指定为分隔符。试试read_csv(example.csv, sep=r'\s+')\s+是“任意数量的空白”的正则表达式。此外,您应该从第一行的开头删除该#字符,因为这将作为一个额外的列读取并且会弄乱读取。

于 2013-05-16T03:38:18.020 回答