问题标签 [biomart]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 由于 getNodeSet {XML} 错误,biomaRt getBM 无法正常工作
我在 r 中运行以下代码,但它不起作用。getBM 似乎不适用于任何参数。难道我做错了什么?
我得到的错误是
Error in getNodeSet(html, path = "//div[@class='plain-box float-right archive-box']")[[1]] : subscript out of bounds
我在 r 版本 3.6.3 和 4.1 中都试过了
r - 无法将狗合奏 ID 转换为基因名称
我通常使用 biomaRt 将基因 ID 转换为符号。但是,这一次我(对于狗)拥有的集成 ID 与 biomart 数据集“clfamiliaris_gene_ensembl”的集成 ID 不匹配。
我还尝试使用 ensembl 门户网站,那里的狗数据集称为 ROS_Cfam_1.0。看起来我的基因与他们数据集中的基因不匹配。我的基因是这样的:
“ENSCAFG00000045440” “ENSCAFG00000000001” “ENSCAFG00000000002” “ENSCAFG00000041462” “ENSCAFG00000000005”
这是我的 biomart 代码:
它找不到我的价值观。我应该为狗使用不同的数据集吗?
r - 为什么我有不同数量的估计基因计数?
我正在分析大量 RNA seq 数据,并使用 Kallisto 将我的数据与转录组对齐。然后,我使用 tximport 将基因名称从 ensembl 分配给我的计数。我正在将我目前分析的结果与 4 年前运行的一些数据进行比较,我注意到在 4 年前的数据中,我最终得到了一个估计有约 50000 个基因的基因计数表,而现在我有大约一半。是否可以查看我使用的是哪个版本的基因注释?基因总量的差异是否可能是我正在使用的 Ensembl 数据集有更新?
我正在使用以下代码使用 Ensembl 数据集:
我还注意到 4 年前的估计基因计数包含数千个类似于 AC253536.2 的基因名称(它们都以 AC 开头),但我现在使用的版本没有输出任何这样的基因名称。有谁知道为什么这些被删除?
谢谢