我有一个数据框,其中“ID”列的值如下:1234567_GSM00298873 1238416_GSM90473673 98377829
换句话说,有些行有 7 个数字,后跟“_”,然后是字母和数字;其他行只有数字
我想删除字母前面的数字和下划线,而不影响只有数字的行。我试过了
dataframe$ID <- gsub("*_", "", dataframe$ID)
但这只会删除下划线。所以我了解到 * 表示零或更多。是否有通配符和重复运算符,以便我可以告诉它找到“任何七次跟随-_”的模式?谢谢!