我得到了一个相当大的 Excel 文件(5k 行),也是一个 CSV,我想把它做成一个 pandas 多级 DataFame。该文件的结构如下:
SampleID OtherInfo Measurements Error Notes
sample1 stuff more stuff
36 6
26 7
37 8
sample2 newstuff lots of stuff
25 6
27 7
其中测量次数是可变的(有时为零)。任何信息之间都没有完整的空白行,并且在具有其他(字符串)数据的行上,“测量”和“错误”列是空的;这可能会使解析变得更加困难(?)。有没有一种简单的方法可以自动进行这种转换?我最初的想法是先用 Python 解析文件,然后在循环中将内容输入 DataFrame 插槽,但我不知道如何实现它,或者它是否是最好的做法。
提前致谢!