我使用从https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1824下载的基因表达数据集“GSE1824” 。为了开始处理这些数据,我在 R studio 上加载了所需的包:
# load libraries
library(affy)
library(limma)
library(genefilter)
library(hgu133a.db)
library(GEOquery)
library(huex10stprobeset.db)
library(pd.huex.1.0.st.v2)
library(Biobase)
我成功加载并解压缩了 GSE1824_RAW.tar 中的 CEL 文件,并将 CEL 文件存储在我将称为“GEMusicAR3/Cel Files”的目录中。该目录仅包含以下 CEL 文件:
GSM31867_SKNMC.CEL
GSM31868_SiMa.CEL
GSM31869_CHP126.CEL
GSM31870_SHSY5Y.CEL
我使用以下方法设置主机目录:
> getwd()
"C:/Users/xxx/Documents"
> HostDir <- getwd()
为了处理 CEL 文件,我运行了以下命令:
setwd(HostDir)
setwd(paste0("GEMusicAR3/Cel Files",dataset,sep="")) # directory of CEL files
>abatch<-ReadAffy()
>eSet<-mas5(abatch)
background correction: mas
PM/MM correction : mas
expression values: mas
background correcting...done.
22283 ids to be processed
| |
|####################|
> log2(exprs(eSet))
Error in log2(exprs(eSet)) :
non-numeric argument to mathematical function
我无法找出错误的原因:
Error in log2(exprs(eSet)) :
non-numeric argument to mathematical function
直到最近,这段代码一直运行良好,没有任何错误。
在尝试发现错误的可能原因时,我获得了以下信息:
> eSet
ExpressionSet (storageMode: lockedEnvironment)
assayData: 22283 features, 4 samples
element names: exprs, se.exprs
protocolData
sampleNames: GSM31867_SKNMC.CEL GSM31868_SiMa.CEL GSM31869_CHP126.CEL GSM31870_SHSY5Y.CEL
varLabels: ScanDate
varMetadata: labelDescription
phenoData
sampleNames: GSM31867_SKNMC.CEL GSM31868_SiMa.CEL GSM31869_CHP126.CEL GSM31870_SHSY5Y.CEL
varLabels: sample
varMetadata: labelDescription
featureData: none
experimentData: use 'experimentData(object)'
Annotation: hgu133a
> exprs(eSet)
[[1]]
eSet
> class(eSet)
[1] "ExpressionSet"
attr(,"package")
[1] "Biobase"
> str(exprs(eSet))
List of 1
$ : symbol eSet
我将非常感谢有关错误可能原因的任何提示:
Error in log2(exprs(eSet)) :
non-numeric argument to mathematical function.
先感谢您。