0

我正在尝试从 GEO db 下载有关“乳腺癌细胞系时间序列基因表达谱”实验的所有条目。我正在使用 GEOquery R 包,我提交的查询如下:

> sql <- paste("SELECT DISTINCT gse.title,gse.gse", "FROM", 
               " gsm JOIN gse_gsm ON gsm.gsm=gse_gsm.gsm", 
               " JOIN gse ON gse_gsm.gse=gse.gse", 
               " JOIN gse_gpl ON gse_gpl.gse=gse.gse", 
               " JOIN gpl ON gse_gpl.gpl=gpl.gpl", "WHERE", 
               " gsm.molecule_ch1 like '%total RNA%' AND", 
               " gse.title LIKE '%breast cancer cell lines time series gene expression profiles%' AND",  
               " gpl.organism LIKE '%Homo sapiens%'",  sep = " ")

>rs <- dbGetQuery(con, sql)

现在,输出是 1 个数据集。它似乎太少而且太错误了,因为我们当然知道已经在乳腺癌细胞系上进行了很多时间序列实验。我想,我在我的 sql 查询中可能在“标题”中犯了一个错误。谁能帮我?

4

1 回答 1

1

您的查询查找子字符串 breast cancer cell lines time series gene expression profiles:单词必须完全按此顺序出现,中间没有任何内容。例如,您可以尝试拆分它(您可能需要进一步拆分它):

    gse.title LIKE '%breast cancer cell lines%'
AND gse.title LIKE '%time series%'
AND gse.title LIKE '%gene expression profiles%'

对于某些数据库,LIKE区分大小写:在这种情况下,ILIKE可能更可取。

于 2012-07-04T03:54:31.583 回答