我有一个.txt
包含不同长度行的文件。每行是代表一个轨迹的系列点。由于每条轨迹都有自己的长度,因此行的长度都不同。也就是说,列数从一行到另一行不同。
AFAIK,genfromtxt()
Python 中的模块要求列数相同。
>>> import numpy as np
>>>
>>> data=np.genfromtxt('deer_1995.txt', skip_header=2)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Python27\lib\site-packages\numpy\lib\npyio.py", line 1638, in genfromtxt
raise ValueError(errmsg)
ValueError: Some errors were detected !
Line #4 (got 2352 columns instead of 1824)
Line #5 (got 2182 columns instead of 1824)
Line #6 (got 1412 columns instead of 1824)
Line #7 (got 1650 columns instead of 1824)
Line #8 (got 1688 columns instead of 1824)
Line #9 (got 1500 columns instead of 1824)
Line #10 (got 1208 columns instead of 1824)
它还可以通过filling_values
. 但是,我认为这会引起不必要的麻烦,我希望避免。
那么在不填写“缺失值”的情况下简单地导入此数据集的最佳(Pythonic)方法是什么?