问题标签 [genome]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
104 浏览

bioinformatics - 如何以某种自动方式(微阵列数据处理)将长基因名称更改为缩写?

是否有任何自动方法可以将长基因名称(如 Cadherin_3453)列表转换为其缩写,如 CDHRN_3453?Genomics, Bioinformatics 中是否有任何缩写名称约定?

对不起,这里没有代码

0 投票
2 回答
29 浏览

bioinformatics - 如何筛选基因组以进行组成研究?

我正在研究大约 2600 多个基因组,并希望研究不同群体之间的基因组、基因和基因间特征。对于代表很少的分类群,没有问题。如果分类群有多个基因组,我应该在什么基础上删除相似的基因组,以便从每个分类群中获得几个代表。我应该使用长度或 GC% 还是其他一些特征来删除基因组 - 比如如果两个基因组的 GC% 变异小于 1%,我将删除它。诸如此类的东西。请建议接受的方式,并解释原因。

在这种情况下如何筛选和去除相似的基因组?

0 投票
1 回答
775 浏览

r - R 基因组比对查看器

目前,我已经阅读了一个 genbank ptt 文件并使用它在 R 中使用 genoplotR 绘制基因组

我还阅读了其相应的排序 bam 文件并使用 rbamtools 制作了覆盖图

我现在想将这两个数字叠加在一张图上,这样我们就可以在 R 中拥有一个基本的基因组比对查看器。但是,我一直在尝试叠加这两个数字,以及匹配 x 轴上的相应位置。

任何帮助将不胜感激!

谢谢

0 投票
1 回答
359 浏览

c++ - Compiling issue with Recursive Decent parser (c++)

I am having compiling issues with my c++ program, it is a recursive decent parser, these are the rules:

I am still relatively new to C++, so i am not sure if i screwed up on something or it is my compiler. I am using VIM on genome/ubuntu terminal environment, these are the errors i am getting when i go to compile, it looks like a missing include header file but i am 100% sure i have included the header file:

my code:

Here is the header file

i want to see if the next thing is not a plus or minus token then push it back and just return what term returned. for example expr() if it IS a plus or minus, use what term returned for the left child and another call to Expr() for the right. I wrote the functions for them, but i am not too sophisticated with them, i added them on top, can someone please let me know if i am heading the right direction or not? and what i should fix?

I am getting these errors

0 投票
3 回答
7175 浏览

r - 将 SNP ID 映射到基因组坐标

我有几个SNP ID(即 rs16828074、rs17232800 等),我想从UCSC 基因组网站获取它们在 Hg19 基因组中的坐标。

我宁愿使用R来实现这个目标。怎么做?

0 投票
1 回答
149 浏览

search - 如何使用 blat 工具在基因组中搜索基因?

我需要使用 blat 工具。我需要找到基因组中某些基因的起始和结束位置。我从以下链接下载了该工具: http : //genome.ucsc.edu/FAQ/FAQblat.html,一个 blat 文件 + blatSrc.zip 文件。我不知道如何运行它。用户指南可在以下链接中找到: http ://genome.ucsc.edu/goldenPath/help/blatSpec.html

谁能告诉我我必须写哪个命令才能得到我的结果?

谢谢。

0 投票
1 回答
71 浏览

r - 从R中的数据集中减去大量指定行

我有两个非常大的基因列表,A 和 B。A 有两列:GeneID 和 p 值,而 B 只有一列 GeneID。B 中大约有 100,000 个基因,这些是 A 中基因的一个子集(这里大约有 700,000 个基因):

我不希望 B 中的基因再出现在 A 中。如何在将 p 值保留在 A 中的同时摆脱它们?到目前为止,我尝试了三种不同的方法:

  1. 我去掉了我的 p 值列,所以两个列表都只有 Entrez Gene ID。然后我使用了以下代码:new<-A[setdiff(rownames(A),rownames(B)),],但我得到了一组与预期完全不同的基因。它是来自 A 和 B 的基因的看似随机的混合,而不是 AB

  2. 我也试过:new<-A[!apply(A,1,FUN=function(y){any(apply(B,1,FUN=function(x){all(x==y)}))}),]

  3. 最后,我尝试通过 EntrezGeneID 进行合并,但这也没有用。

我被这个摧毁了,所以任何帮助将不胜感激。

0 投票
2 回答
1651 浏览

r - 如何使用 VariantAnnotation 包将变体调用格式 (VCF) 文件保存到 R 中的磁盘

我已经在网上搜索了这个没有太多运气。或多或少您总是从VariantAnnotation Package中获得示例。而且由于这个示例在我的计算机上运行良好,我不知道为什么我创建的 VCF 不能。

问题:我想确定选定基因中 SNP 的数量和位置。我有一个大型 VCF 文件(超过 5GB),其中包含有关几种小鼠品系所有染色体上所有 SNP 的信息。显然,如果我尝试在整个基因组规模上做任何事情,我的计算机就会死机,所以我首先确定了 1 号染色体上感兴趣基因的基因组位置。然后我使用 VariantAnnotation 包从VCF 文件:

上面的代码取自我编写的以应变为参数的函数。gnrng 指的是一个包含我感兴趣的基因的基因组位置的 GRanges 对象。

这工作正常,我得到了我的 vcf (dim: 21783 1) 但是当我尝试保存时它不起作用

我什至并行尝试,首先从包中执行示例,然后替换我的 VCF 文件:

这工作得很好,但如果我只用in1代替我的vcf,我会得到同样的错误。

我希望我说清楚了......任何帮助将不胜感激!提前致谢!

0 投票
1 回答
46 浏览

bioinformatics - 在进行成对序列比对时,序列文件的典型大小是多少?

在进行成对序列比对时,序列文件的典型大小是多少?我们可以对齐生物的整个基因组吗?

0 投票
2 回答
581 浏览

python - Python脚本使用一个文件中的坐标并从另一个文件中的匹配坐标中添加值

我在制表符分隔的床文件中有一组原始的基因组坐标(chrom、start、end)。我还有额外的制表符分隔的床文件,其中包含一些原始基因组坐标以及与这些坐标中的每一个相关的数值。这些坐标可以在床文件中多次显示,每次都具有不同的数值。我需要一个最终的床文件,其中包含每个原始基因组坐标以及与该特定坐标相关联的所有值的总和。我正在使用的文件示例如下。

原始文件:

其他床档:

需要的输出文件:

我需要编写一个 python 脚本来执行此操作,但我不确定最好的方法是什么。