我正在尝试从 RNAseq 结果摘要文件中提取几个基因集的数据:
示例基因列表:
我正在使用 Excel 首先突出显示重复的基因,对摘要文件进行排序,然后复制我需要的数据。这很耗时,而且 Excel 在排序时总是“冻结”,尤其是对于大基因列表。
我想知道 R 是否可以做得更好。如果 R 可以成为更好的解决方案,有人可以提供代码吗?
我想我得到了解决方案,尽管我仍然需要一一处理这些列表。无论如何,它比 Excel 快。:)
# read the RNAseq result summary file
result <- read_excel("RNAseq_Result.xlsx")
# read the gene lists file
geneset <- read_excel("Gene set list.xlsx")
# read one specific list from the gene lists file
ListA <- geneset$ListA
#subsetting
ResultListA <- result[(result$Gene_name) %in% ListA, ]
#output file
write.csv(ResultListA, 'ResultListA.csv')