问题标签 [bioconductor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
181 浏览

python - 如何生成唯一的随机列表

可能重复:
随机抽样基因列表

我想从 19.000 个基因的宇宙中创建 1000 个包含 1652 个基因的随机列表。我决定更换,因为宇宙没有那么大。唯一的条件是列表之间可以包含相似的基因(由于替换),但每个列表不能包含超过一次的基因。因此它将在单个列表中是唯一的。对此有何建议?

例如:宇宙 = 字母[1:26]

期望的输出:

我想避免这样的情况:

由于宇宙不是那么大,我不能设置 REPLACE = F。如果我设置 REPLACE = T,重复的元素会出现在列表中……这是我在分析中试图避免的。

提前致谢

E.

0 投票
1 回答
398 浏览

r - R通过包limma的read.ilmn读取注释列

limma包是用于读取微阵列以及最近的 RNA-seq 实验结果和进行其他过程(如归一化、拟合线性模型、查找最高差异表达基因、绘制图等)的最佳 - 甚至是最佳 - 包之一。

我在read.ilmn()读取 illumina 结果的函数中有一个小问题:假设有一些注释列 - 即 ENTREZ_GENE_ID、REFSEQ_ID 等。除了表达式列之外,还需要读取这些列 - 即 PROBE_ID、SYMBOL、AVG_Signal 和 Detection.Pval - 以供以后分析。

我试图将这些列的名称作为通知该命令也读取这些列的annotation参数other.columns传递read.ilmn(),导致read.ilmn(). 最后,我不得不通过read.table()命令分别读取这些列,并手动将它们与read.ilmn()结果合并。

有没有更好的方法来执行任务?

0 投票
1 回答
973 浏览

r - 用于基因表达的 Limma 软件包

我有以下格式的 rma 归一化矩阵:

其中不同的列对应于四种不同类型的启动子,并且四种启动子中的每一个都有一个生物复制,所以总共有 8 列。

我尝试使用 Limma 包来查找跨多个启动子(具有重复)的差异表达基因,但由于我是 r 新手并且无法完全理解它,所以我总是遇到错误。

这是我使用的代码:

其中 modified 是以上述格式输入的 rma 归一化数据矩阵。我收到以下错误:

lmfit(设计,t(M))中的错误:0(非NA)案例

0 投票
3 回答
3579 浏览

r - 使用 biomart 查找转录起始位点

biomaRt在 R 中使用来查询 ensembl 的hsapiens人类基因数据库。我正在使用该函数getBM来获取所有基因的名称、起始位置和终止位置,但我找不到用于检索 TSS(转录起始位点)的正确属性。可能是因为它被认为与 相同seqType= c("3utr", "5utr")

0 投票
2 回答
899 浏览

r - 如何获取每个探针的基因本体 (GO) 术语

我是 R/BioC 的新手。我正在尝试进行基于 GO 的基因聚类。输入需要是每行中的基因名称和 GO 术语。例子:

我尝试在 bioconductor 中使用注释:

但我只在单独的行中得到每个 GO 术语:

也许有一种更简单的方法可以获取每个基因的所有 GO 术语。不幸的是,我找不到它。

任何帮助是极大的赞赏。

谢谢R

0 投票
1 回答
374 浏览

r - R - XCMS 包错误

我有以下问题:

.C("NetCDFOpen", as.character(filename), ncid = integer(1), status = integer(1), 错误:C 符号名称 "NetCDFOpen" 不在包 "xcms" 的 DLL 中

你如何得到这个错误:

我不知道为什么这不起作用,尽管它应该。如需更多信息,请随时询问。免费的 .cdf 文件可以在TargetSearchData包中找到。

代码示例:

0 投票
2 回答
839 浏览

r - XCMS Package - Retention time

Is there a simple way to get the list/array of retention times from a xcmsRaw object?

Example Code:

So for example getting information from it :

or

0 投票
1 回答
1618 浏览

r - 修改 R 包的源代码

我想删除一行:

从生物导体包“DEXSeq”怎么做?

0 投票
1 回答
550 浏览

r - R中的samR问题

我在 Excel 中有 csv 格式的下表:

我一直在使用 SAM 来获取上调和下调基因的列表。为此,有一个 Excel 插件可以使用上述文件完成任务。我遇到的问题是我需要使用 R 来分析这些数据,因为有一个名为 SAMR 的包。我想用第一列中的名称获取上调和下调基因的列表,但根本没有成功。该手册可在此处获得:http ://cran.r-project.org/web/packages/samr/samr.pdf 我制作的小程序是:

当我把

我得到以下数据:

但我需要基因名称而不是基因列表中的基因 ID 和基因有什么帮助吗?谢谢

dput(m) 显示以下信息:

结构(列表(X.1 = 1:5, X1 = c(365.1, 556.1, 1048.3, 60.8, 129.1), X1.1 = c(293.4, 584.2, 763.1, 51.7, 107.2), X1.2 = c( 288.9, 567.8, 1074.9, 51.6, 230.4), X2 = c(394.5, 592.8, 852.3, 224, 175.5), X2.1 = c(312, 471.6, 826.1, 248.4, 250.5), X2.2 = c(381.6) , 513.1, 898.3, 150.7, 172.4)), .Names = c("X.1", "X1", "X1.1", "X1.2", "X2", "X2.1", "X2 .2"), class = "data.frame", row.names = c("1415670_at", "1415671_at", "1415672_at", "1415673_at", "1415674_a_at"))

0 投票
1 回答
131 浏览

r - data.frame 精简版

数据框:

数据是呈现的数据。问题:我想从重复的列中创建一行。例子 :