问题标签 [bcftools]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
43 浏览

bash - 删除 2 个符号之间的文本部分

我有这种类型的文本文件(也是标题,以## 开头,但未显示)

我需要删除符号;;之间的所有部分,最后包含“_XX”。

所以输出是

等等等等

我尝试使用 bcftools

但它删除了人口名称,这也是需要的。

为了更好地解释:删除 ; 之间的所有字符(它们正在更改整数,而不是常量符号),以_XX结尾。应保存所有文件结构,并且不包含其他选项卡或新行。有没有办法在 bash 中做到这一点?我觉得

我试过这个:

但没有结果。

谢谢!

0 投票
1 回答
43 浏览

linux - 分别将 file1 的 1,2,5 列与 file2 的 1,2,3 列匹配,输出应该与文件 2 中的行匹配。第二个文件是压缩文件 .gz

文件 1

file2 压缩文件 .gz

输出

我试过了

但它不工作

0 投票
0 回答
25 浏览

xml - .bcfzip 文件仅在重新压缩后才由软件导入。文件内容保持不变

我正在测试两个软件之间的互操作性,并且需要从一个软件导出的文件以供其他软件读取。该文件由一些以 .zip 格式压缩的 xml 和 jpg 文件组成(程序生成的扩展名为 .bcf 和 .bcfzip)。就内容而言,一个生成的 xml 文件与另一个软件生成的 xml 文件具有相同的信息。尽管如此,当我将其扩展名从 .bcfzip 更改为 .bcf 以使其被其他软件读取时,它不起作用。如果我取出 xml 文件并在 .bcf 中再次压缩它们,它会完美导入。是否有任何元数据或压缩编码可能导致这种情况?

不幸的是,我无权访问生成这些文件的任何代码,因此我正在寻找方法来验证可能导致比较两个文件的原因。

0 投票
1 回答
191 浏览

python - conda 环境中的依赖关系 plot-vcfstats

我有一个 conda 环境,其中安装了包括 bcftools 在内的软件包。我正在使用bcftools stats为我的 VCF 文件生成一些统计信息。然后,我想使用同样来自 bcftools的 plot-vcfstats绘制生成的统计信息。但是,当我在我的 conda 环境中安装 bcftools 时,该命令结果依赖于某些未安装的软件包。我运行时得到的输出plot-vcfstats

matplotlib可以使用 conda 轻松安装,所以我这样做了,但随后出现以下错误:

但是,我找不到安装pdflatextectonic依赖项的简单方法,甚至可能需要更多依赖项。所以,我想知道是否有一种简单的方法来安装plot-vcfstats(或任何工具)的所有必需的依赖项,如果这一切都可以使用 conda。

编辑:我只是尝试安装pdflatextectonic通过:

这将错误更改为:

日志文件包含以下内容:

0 投票
0 回答
16 浏览

vcftools - 使用 bcftools 从 vcf 创建每个样本表

我有一个多样本 vcf 文件,我想在左列中获取一个 ID 表,其中包含它们具有备用等位基因的变体。它应该如下所示:

这是然后读入R

我尝试过以下组合:

bcftools query -f '[%SAMPLE\t] %CHROM:%POS:%REF:%ALT[%GT]\n' 但我不断在同一行上重叠样本 ID,我无法完全弄清楚 sytnax。

您的帮助将不胜感激

0 投票
1 回答
79 浏览

javascript - 如何将视图从 three.js 相机和场景转换为 bcf cameraview

我正在尝试从 ifc.js 查看器中创建一个 bcf 文件。ifc.js 查看器使用带相机和场景的 three.js webglrenderer。这是一个例子。

在此处输入图像描述 在此处输入图像描述 https://threejs.org/docs/#api/en/cameras/Camera https://threejs.org/docs/#api/en/scenes/Scene

如何使用 CameraUpVector、CameraDirection 和 CameraViewPoint 将此视图转换为 bcf 视图。 在此处输入图像描述

https://github.com/BuildingSMART/BCF-XML/tree/release_3_0/Documentation

0 投票
0 回答
36 浏览

variant - bcftools 合并的 vcf 文件将所有变体分配给一个样本

我为三个样本中的每一个都制作了一个 vcf 文件。然后我使用 bcftools 将它们组合起来,如下所示:

然后合并列表:

并将其编入索引:

生成的合并 vcf 似乎有三列,每个样本一列。当我在 IGV 中打开它时,所有变体都分配给样本 3a7a(见图)

在此处输入图像描述

但是当我在 GenomeBrowse 中打开它时,我看到它们正确分配给了三个样本中的每一个:

在此处输入图像描述

我想不通是怎么回事?我在这里上传了单个和合并的 vcf 文件。非常感谢任何帮助

https://1drv.ms/u/s!AvBi5ipmBYfrhr8MPIDUjjYIcMI-rw?e=f8imqR

0 投票
0 回答
9 浏览

bcftools - 如何运行 bcftools stats 以获得转换转换比率

我对 bcftools 和一般编码非常陌生,我有一个 txt 文件,其中包含我想要转换 - 转换比率的染色体和相应位置。目前我已经写了

这似乎有效,但是当我尝试运行 bcftools stats 后,我总是收到一条错误消息

0 投票
1 回答
25 浏览

bash - 对于每一行,用另一个字符替换第 2 次和第 3 次出现的字符,Bash

我正在尝试重新格式化参考图例文件以使其与 bcftools 兼容。

本质上,我需要从这个出发:

对此:

理想情况下使用 bash。

0 投票
1 回答
27 浏览

awk - 根据其他列的内容从 VCF 中提取变体位置

我有一个 vcf 文件,我正在尝试从这些列中提取信息:

但是,只有当 SAMPLE-1 列包含字符串 DeNovo(不是 DeNovoSV)并且 SAMPLE-1、SAMPLE-2 和 SAMPLE-3 都包含 PASS 时,我才想提取这些。

我试过使用 bcftools,见下文。

有没有办法使用 bcftools,或者将它与 awk 结合以获得我正在寻找的 vcf 文件格式的输出?

非常感谢