我有一个格式为:
name = '>n263590 | AK138667 | mRNAlike lncRNA |'
所以当我想对它进行分区时,我使用了字符串:
name = name.partition(' |')[0]
我尝试对格式中的字符串使用相同的概念:
name2 = '>mm10_refGene_NM_147038 range=chr1:92479681-92480629'
我只想要以“NM”开头的区域,直到数字结尾
#i want the output to be name2 = 'NM_147038'
所以我尝试了
name2 = name2.partition('NM','range')|[0]
但它没有用
我想我知道一种使用正则表达式的方法,但它的内存效率不是很高。无论如何我可以使用分区工具来执行这个吗?