MUC20 17615 NP_689886.2 MET 01280 NP_001120972.1 体外;体内;酵母 2-杂交 15314156
SMURF2 06901 NP_073576.1 TFPI2 08962 NP_006519.1 酵母 2-杂交 15231748
ERBB2 01281 NP_004439.2 ERBB2 01281 NP_004439.2 体外;体内 10372802,1706616,12354693,11500516
ACPP 01378 NP_001127666.1 ERBB2 01281 NP_004439.2 体外;体内 11067847,10851066,9705354
PIK3R1 01381 NP_852664.1 ERBB2 01281 NP_004439.2 体内 1351056,16843263
PLCG1 01398 NP_002651.2 ERBB2 01281 NP_004439.2 体内 1676673,1683701
……
请帮助我。我的数据看起来像这样。我只想使用 python 解析蛋白质的配对名称(粗体)。成对的名字应该像下面这样存储。例如,MUC20 10 MET。和 SMURF2 10 TFPI2。在名称之间,应插入数字 10。
MUC20 10 满足
SMURF2 10 TFPI2
ERBB2 10 ERBB2
ACPP 10 ERBB2
我怎样才能像上面那样解析?
谢谢你。