0

我正在尝试从 RNAseq 结果摘要文件中提取几个基因集的数据:

在此处输入图像描述

示例基因列表:

在此处输入图像描述

我正在使用 Excel 首先突出显示重复的基因,对摘要文件进行排序,然后复制我需要的数据。这很耗时,而且 Excel 在排序时总是“冻结”,尤其是对于大基因列表。

我想知道 R 是否可以做得更好。如果 R 可以成为更好的解决方案,有人可以提供代码吗?

4

1 回答 1

0

我想我得到了解决方案,尽管我仍然需要一一处理这些列表。无论如何,它比 Excel 快。:)

# read the RNAseq result summary file
result <- read_excel("RNAseq_Result.xlsx")

# read the gene lists file
geneset <- read_excel("Gene set list.xlsx")

# read one specific list from the gene lists file
ListA <- geneset$ListA

#subsetting
ResultListA <- result[(result$Gene_name) %in% ListA, ]

#output file
write.csv(ResultListA, 'ResultListA.csv')
于 2020-06-12T17:17:10.200 回答