0

嗨,我开始学习 pandas 来处理文本文件。到目前为止,我一直在使用 numpy loadtxt,但是我遇到了一些由非常旧的程序生成的文本文件(我无法替换)的问题:

[/home/Desktop/Flux_Calibration_Steps/stdWolf_wide_cr_f_a_bg] 1 4091 300.01 1.195  4240.778  7791.743 wolf wide
 4330.00   1.3731E-13   20.000       88809.
 4350.00   1.3480E-13   20.000      117447.
 4370.00   1.5911E-13   20.000      162742.
 4390.00   1.6972E-13   20.000      183740.
 4510.00   1.8634E-13   20.000      863055.
 4530.00   1.8641E-13   20.000     1056961.
 4550.00   1.8308E-13   20.000     1215476.
 4570.00   1.7654E-13   20.000     1352265.
[/home/Desktop/Flux_Calibration_Steps/stdF34_wide_cr_f_a_bg_] 1 4091 300.01 1.037  4241.941  7793.365 F34 broad
 4400.00   2.8298E-13   50.000     1244259.
 4450.00   2.6912E-13   50.000     1978971.
 4500.00   2.5837E-13   50.000     3862673.
 4550.00   2.4811E-13   50.000     5843749.
 4600.00   2.3832E-13   50.000     7363710.

在这里,您拥有 4 列表格形式的数据。如您所见,有 2 行较长。这些代表来自不同来源的数据,代码一个接一个地堆叠。

我想从每个不同来源的第一列和第二列中提取数据。如果可能的话,我还想从标题行中获取数据。

但是我不知道这是“pythonish”的方式来做到这一点。我想知道是否有人会就如何在不进行循环的情况下识别每个“标题”行的索引提供和建议。

几个警告:

1) 列数在标题行和数据行中都是恒定的。但元素可能不同 2) 几个数据源的行数可能不同

感谢您的任何建议。

4

0 回答 0