嗨,我开始学习 pandas 来处理文本文件。到目前为止,我一直在使用 numpy loadtxt,但是我遇到了一些由非常旧的程序生成的文本文件(我无法替换)的问题:
[/home/Desktop/Flux_Calibration_Steps/stdWolf_wide_cr_f_a_bg] 1 4091 300.01 1.195 4240.778 7791.743 wolf wide
4330.00 1.3731E-13 20.000 88809.
4350.00 1.3480E-13 20.000 117447.
4370.00 1.5911E-13 20.000 162742.
4390.00 1.6972E-13 20.000 183740.
4510.00 1.8634E-13 20.000 863055.
4530.00 1.8641E-13 20.000 1056961.
4550.00 1.8308E-13 20.000 1215476.
4570.00 1.7654E-13 20.000 1352265.
[/home/Desktop/Flux_Calibration_Steps/stdF34_wide_cr_f_a_bg_] 1 4091 300.01 1.037 4241.941 7793.365 F34 broad
4400.00 2.8298E-13 50.000 1244259.
4450.00 2.6912E-13 50.000 1978971.
4500.00 2.5837E-13 50.000 3862673.
4550.00 2.4811E-13 50.000 5843749.
4600.00 2.3832E-13 50.000 7363710.
在这里,您拥有 4 列表格形式的数据。如您所见,有 2 行较长。这些代表来自不同来源的数据,代码一个接一个地堆叠。
我想从每个不同来源的第一列和第二列中提取数据。如果可能的话,我还想从标题行中获取数据。
但是我不知道这是“pythonish”的方式来做到这一点。我想知道是否有人会就如何在不进行循环的情况下识别每个“标题”行的索引提供和建议。
几个警告:
1) 列数在标题行和数据行中都是恒定的。但元素可能不同 2) 几个数据源的行数可能不同
感谢您的任何建议。