我正在尝试编写一个 python 脚本来操作 excel 电子表格。
假设如果,我有样本数据:
Gene chrom strand TSS TES Name
NM_145215 chr5 + 135485168 135488045 Abhd11
NM_1190437 chr5 + 135485021 135488045 Abhd11
NM_1205181 chr14 + 54873803 54888844 Abhd4
NM_134076 chr14 + 54878906 54888844 Abhd4
NM_9594 chr2 + 31615464 31659747 Abl1
NM_1112703 chr2 + 31544075 31659747 Abl1
NM_207624 chr11 + 105829258 105851278 Abl1
NM_9598 chr11 + 105836521 105851278 Ace2
NM_1130513 chrX + 160577273 160626350 Ace2
NM_27286 chrX + 160578411 160626350 Ace2
对于那些相似的名称(第 6 列),我想检索 TSS 最少的整行。例如,对于前 2 行 - Abhd11 名称,我想将第二行保存在我的结果中,因为 TSS 135485021 < 135485168。对于所有具有相同名称的集合,依此类推。
任何想法和意见表示赞赏。