问题标签 [genome]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
windows - 适用于 Windows/OSX/类 Unix 和二进制文件的 Gnome glib 状态
我试图了解 glib 关于 Windows、类 Unix(不是必需的 Linux)和 OSX 的当前情况。我正在分析是否可以将 glib 用于项目,并且我将需要所有这些操作系统工作。
我正在搜索 Windows 的二进制文件,我发现的最后一个非常旧(从 2010 年到 2011 年)。这是否意味着 Gnome glib 正在放弃 Windows 支持?
我需要知道最新的 glib 是否仍然适用于所有这些平台,以及它是否至少计划在不久的将来继续。
第二个问题是为每个平台查找二进制文件的最简单途径是什么。我是否需要为每个平台交叉编译自己?还是某处有预建?如果有二进制文件,请告诉我在哪里。正如我所说,对于 Windows,我发现它们非常古老。例如,对于 OSX 是通过 brew 吗?
提前致谢,
r - 如何将 data.frame 对象强制为 R 中的 Genomic Ranges 对象?
我在 R 中有几个床文件作为 data.frame 对象。现在我想按元素找到两个精益床文件之间的重叠。
为了澄清我的问题,我需要在第一床文件(已经在数据框对象中)中逐行进行测试,因此只取数据框的一行作为查询,然后将其提供给间隔树保存的间隔树第二床文件(但需要先强制 Granges 对象)。
我的数据看起来像:
这是我的代码如何在 bed.1 中迭代一组 GRanges 对象并调用 findOverlap() 函数来查找重叠的 GRanges 的位置。这段代码没有给我想要的结果。有人帮我吗??谢谢
python - django:尽管语法正确,但下拉菜单未显示在模板上
我已经成功配置了一种将文件上传到我正在制作的网站的方法。但是,我们希望在网站上包含一个下拉菜单。但是,我们希望以下拉菜单的形式包含“不匹配选择”:
models.py:用于下拉菜单
下拉菜单的forms.py:
'model=Mismatches' 链接到模型中的 Mismatches 类,'field' 提供选项。
下拉菜单的views.py
"template_name = 'list.html'" 链接名为 list.html 的 html 页面。“form_class”链接到“MismatchesForm”表单。
用于下拉菜单的 html
我们使用教程作为代码的模板,但它不会显示在我们的 html 页面上,即使我们使用 {{ form.mismatch}} 引用它,它链接到在我们的表单中设置为变量 'mismatch' “模型”,因此链接到 models.py 中给出的选项。
我们想知道 html 页面是否没有看到下拉菜单,因为它在 forms.py 中设置为一个类,但我们没有在应用内 urls.py 中引用一个类(有没有办法做到这一点?)...
java - 通过切割旧弦来构建新弦?(如果可以的话,Java 代码)
大家好,我正在尝试读取基因组序列并搜索出现的任何 10 个字符重复。我想到的解决方案分为三个步骤:
- 读取基因组序列,例如:GAAAAATTTTCCCCCACCCTTTTCCCC
- 将字符串切成十个连续的序列,例如第一个新生成的字符串是索引 0-9,下一个是 1-10,2-11,3-12...
- 将这些序列存储在 ArrayList 中
- 比较字符串
- 返回重复的序列以及它们重复的频率。
我遇到的麻烦是如何从旧的和更大的字符串生成一个新的字符串。假设我的基因组序列是 AAAAGGGGGAAAATTTCCCC,那么我的前十个字符序列将是 AAAAGGGGGA,下一个将是 AAAGGGGGAA。我将如何在java中做到这一点?
这是我到目前为止所拥有的:
python - 从基因组创建树状图
我想玩弄基因组数据:
鉴于上述基因组序列,我想根据这些生物体之间的相关程度创建一个树状图。我首先做的是计算每个物种的 a、c、t 和 g 的数量,然后我创建了一个数组,然后绘制了一个树状图:
物种 A 和 B 是同一生物体的变体,我希望它们都应该从根的共同进化枝分歧,物种 C 和 D 也是如此,它们应该从根的另一个共同进化枝分歧,然后物种 E 从根分歧主根,因为它与物种 A 到 D 无关。不幸的是,树状图结果与从一个共同进化枝发散的物种 A 和 E 混合在一起,然后是另一个进化枝中的物种 C、D 和 B(相当混乱)。
我读过关于基因组序列的层次聚类,但我观察到它只适用于二维系统,不幸的是我有 4 个维度,即 a、c、t 和 g。对此还有其他策略吗?谢谢您的帮助!
text-files - 在文本编辑器中打开大文本文件 (300GB)
我有 300 GB 的文本文件,其中包含基因组数据,我想打开它。我可以使用什么文本编辑器?
另外,我想比较两个相同大小“数百GB”的基因组数据文本文件“逐行”以提取新添加的序列。足够的方法是什么?
谢谢,
alignment - BAM 文件中的三个同名读取
我正在处理双端 BAM 文件,并提出了许多这样的警告:
我检查了 BAM 文件中的警告读取,发现所有警告读取都有三个同名读取。例如:
BAM 文件是使用 bwa 将 HiSeq 读取与参考基因组对齐,并使用 picard 去除冗余。使用 gatk 完成碱基重新排列。
我的困惑是:
1、为什么三个读同名却没有关系?
2、也许前两个被视为伴侣对,第三个被视为单读。那我可以忽略它吗?
大家可以帮帮我吗?非常感谢您的帮助!
apache-spark - 我无法运行 SparkBWA
我是学习基因组学中的出价数据工具的初学者,我不知道这个链接上的命令和错误详细信息是什么问题(它太长了,所以我不能在这里复制它)
alignment - 使用 BWA 创建输入 BAM 文件以进行下游分析
我有大肠杆菌的 Illumina 配对末端读数,用于创建草稿组装 (SPAdes)。我现在的任务是创建将与 Pilon 一起使用的输入 BAM 文件——它用于改进装配草图。
我决定使用此处的文档来使用 BWA:http: //bio-bwa.sourceforge.net/bwa.shtml#3
计划创建参考基因组的索引,创建比对,然后转换为 BAM 文件。
这是我用来索引参考的命令:
此命令输出以下文件:B055.amb B055.ann B055.bwt B055.pac B055.sa
下一步是生成对齐文件——为此我使用了以下命令:
运行第一个命令后,我收到以下输出:
最后一行让我有些恼火。有一个输出文件(B055_R1.sai),但它是空的。
我可以清楚地看到,在我的对齐命令中,没有引用以前创建的任何索引文件,但是当我查看文档时(http://bio-bwa.sourceforge.net/bwa.shtm),我看不到引用任何索引文件的选项。谷歌搜索一下,我找到了一个网站,该网站说我需要将我的参考 fasta 文件与索引文件放在同一目录中,我什至将我的草稿程序集 fasta 文件的名称从scaffolds.fasta 更改为 B055.fasta - 但是无济于事。我还解压缩了 fastq.gz 文件并将扩展名从 fastq 更改为 fq——所有这些都遇到了不成功的结果。这些可能仍然是问题,但在我看来,在最后一次 bwa aln 调用中引用索引文件是最紧迫的问题。
谁能给我指出正确的方向?我正在使用 BWA 版本:0.7.5a-r405(我还安装了最新版本(版本:0.7.12-r1039),没有任何改进),CentOS 6.7,具有 34 个内核和大量内存。
先感谢您。