问题标签 [bioconductor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何生成唯一的随机列表
可能重复:
随机抽样基因列表
我想从 19.000 个基因的宇宙中创建 1000 个包含 1652 个基因的随机列表。我决定更换,因为宇宙没有那么大。唯一的条件是列表之间可以包含相似的基因(由于替换),但每个列表不能包含超过一次的基因。因此它将在单个列表中是唯一的。对此有何建议?
例如:宇宙 = 字母[1:26]
期望的输出:
我想避免这样的情况:
由于宇宙不是那么大,我不能设置 REPLACE = F。如果我设置 REPLACE = T,重复的元素会出现在列表中……这是我在分析中试图避免的。
提前致谢
E.
r - R通过包limma的read.ilmn读取注释列
limma包是用于读取微阵列以及最近的 RNA-seq 实验结果和进行其他过程(如归一化、拟合线性模型、查找最高差异表达基因、绘制图等)的最佳 - 甚至是最佳 - 包之一。
我在read.ilmn()
读取 illumina 结果的函数中有一个小问题:假设有一些注释列 - 即 ENTREZ_GENE_ID、REFSEQ_ID 等。除了表达式列之外,还需要读取这些列 - 即 PROBE_ID、SYMBOL、AVG_Signal 和 Detection.Pval - 以供以后分析。
我试图将这些列的名称作为通知该命令也读取这些列的annotation
参数other.columns
传递read.ilmn()
,导致read.ilmn()
. 最后,我不得不通过read.table()
命令分别读取这些列,并手动将它们与read.ilmn()
结果合并。
有没有更好的方法来执行任务?
r - 用于基因表达的 Limma 软件包
我有以下格式的 rma 归一化矩阵:
其中不同的列对应于四种不同类型的启动子,并且四种启动子中的每一个都有一个生物复制,所以总共有 8 列。
我尝试使用 Limma 包来查找跨多个启动子(具有重复)的差异表达基因,但由于我是 r 新手并且无法完全理解它,所以我总是遇到错误。
这是我使用的代码:
其中 modified 是以上述格式输入的 rma 归一化数据矩阵。我收到以下错误:
lmfit(设计,t(M))中的错误:0(非NA)案例
r - 使用 biomart 查找转录起始位点
我biomaRt
在 R 中使用来查询 ensembl 的hsapiens
人类基因数据库。我正在使用该函数getBM
来获取所有基因的名称、起始位置和终止位置,但我找不到用于检索 TSS(转录起始位点)的正确属性。可能是因为它被认为与 相同seqType= c("3utr", "5utr")
?
r - 如何获取每个探针的基因本体 (GO) 术语
我是 R/BioC 的新手。我正在尝试进行基于 GO 的基因聚类。输入需要是每行中的基因名称和 GO 术语。例子:
我尝试在 bioconductor 中使用注释:
但我只在单独的行中得到每个 GO 术语:
也许有一种更简单的方法可以获取每个基因的所有 GO 术语。不幸的是,我找不到它。
任何帮助是极大的赞赏。
谢谢R
r - R - XCMS 包错误
我有以下问题:
.C("NetCDFOpen", as.character(filename), ncid = integer(1), status = integer(1), 错误:C 符号名称 "NetCDFOpen" 不在包 "xcms" 的 DLL 中
你如何得到这个错误:
我不知道为什么这不起作用,尽管它应该。如需更多信息,请随时询问。免费的 .cdf 文件可以在TargetSearchData包中找到。
代码示例:
r - XCMS Package - Retention time
Is there a simple way to get the list/array of retention times from a xcmsRaw
object?
Example Code:
So for example getting information from it :
or
r - 修改 R 包的源代码
我想删除一行:
从生物导体包“DEXSeq”怎么做?
r - R中的samR问题
我在 Excel 中有 csv 格式的下表:
我一直在使用 SAM 来获取上调和下调基因的列表。为此,有一个 Excel 插件可以使用上述文件完成任务。我遇到的问题是我需要使用 R 来分析这些数据,因为有一个名为 SAMR 的包。我想用第一列中的名称获取上调和下调基因的列表,但根本没有成功。该手册可在此处获得:http ://cran.r-project.org/web/packages/samr/samr.pdf 我制作的小程序是:
当我把
我得到以下数据:
但我需要基因名称而不是基因列表中的基因 ID 和基因有什么帮助吗?谢谢
dput(m) 显示以下信息:
结构(列表(X.1 = 1:5, X1 = c(365.1, 556.1, 1048.3, 60.8, 129.1), X1.1 = c(293.4, 584.2, 763.1, 51.7, 107.2), X1.2 = c( 288.9, 567.8, 1074.9, 51.6, 230.4), X2 = c(394.5, 592.8, 852.3, 224, 175.5), X2.1 = c(312, 471.6, 826.1, 248.4, 250.5), X2.2 = c(381.6) , 513.1, 898.3, 150.7, 172.4)), .Names = c("X.1", "X1", "X1.1", "X1.2", "X2", "X2.1", "X2 .2"), class = "data.frame", row.names = c("1415670_at", "1415671_at", "1415672_at", "1415673_at", "1415674_a_at"))
r - data.frame 精简版
数据框:
数据是呈现的数据。问题:我想从重复的列中创建一行。例子 :