问题标签 [bcftools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
bash - 删除 2 个符号之间的文本部分
我有这种类型的文本文件(也是标题,以## 开头,但未显示)
我需要删除符号;;之间的所有部分,最后包含“_XX”。
所以输出是
等等等等
我尝试使用 bcftools
但它删除了人口名称,这也是需要的。
为了更好地解释:删除 ; 之间的所有字符(它们正在更改整数,而不是常量符号),以_XX结尾。应保存所有文件结构,并且不包含其他选项卡或新行。有没有办法在 bash 中做到这一点?我觉得
我试过这个:
但没有结果。
谢谢!
linux - 分别将 file1 的 1,2,5 列与 file2 的 1,2,3 列匹配,输出应该与文件 2 中的行匹配。第二个文件是压缩文件 .gz
文件 1
file2 压缩文件 .gz
输出
我试过了
但它不工作
xml - .bcfzip 文件仅在重新压缩后才由软件导入。文件内容保持不变
我正在测试两个软件之间的互操作性,并且需要从一个软件导出的文件以供其他软件读取。该文件由一些以 .zip 格式压缩的 xml 和 jpg 文件组成(程序生成的扩展名为 .bcf 和 .bcfzip)。就内容而言,一个生成的 xml 文件与另一个软件生成的 xml 文件具有相同的信息。尽管如此,当我将其扩展名从 .bcfzip 更改为 .bcf 以使其被其他软件读取时,它不起作用。如果我取出 xml 文件并在 .bcf 中再次压缩它们,它会完美导入。是否有任何元数据或压缩编码可能导致这种情况?
不幸的是,我无权访问生成这些文件的任何代码,因此我正在寻找方法来验证可能导致比较两个文件的原因。
python - conda 环境中的依赖关系 plot-vcfstats
我有一个 conda 环境,其中安装了包括 bcftools 在内的软件包。我正在使用bcftools stats为我的 VCF 文件生成一些统计信息。然后,我想使用同样来自 bcftools的 plot-vcfstats绘制生成的统计信息。但是,当我在我的 conda 环境中安装 bcftools 时,该命令结果依赖于某些未安装的软件包。我运行时得到的输出plot-vcfstats
:
matplotlib
可以使用 conda 轻松安装,所以我这样做了,但随后出现以下错误:
但是,我找不到安装pdflatex
和tectonic
依赖项的简单方法,甚至可能需要更多依赖项。所以,我想知道是否有一种简单的方法来安装plot-vcfstats
(或任何工具)的所有必需的依赖项,如果这一切都可以使用 conda。
编辑:我只是尝试安装pdflatex
并tectonic
通过:
这将错误更改为:
日志文件包含以下内容:
vcftools - 使用 bcftools 从 vcf 创建每个样本表
我有一个多样本 vcf 文件,我想在左列中获取一个 ID 表,其中包含它们具有备用等位基因的变体。它应该如下所示:
这是然后读入R
我尝试过以下组合:
bcftools query -f '[%SAMPLE\t] %CHROM:%POS:%REF:%ALT[%GT]\n'
但我不断在同一行上重叠样本 ID,我无法完全弄清楚 sytnax。
您的帮助将不胜感激
javascript - 如何将视图从 three.js 相机和场景转换为 bcf cameraview
我正在尝试从 ifc.js 查看器中创建一个 bcf 文件。ifc.js 查看器使用带相机和场景的 three.js webglrenderer。这是一个例子。
https://threejs.org/docs/#api/en/cameras/Camera https://threejs.org/docs/#api/en/scenes/Scene
如何使用 CameraUpVector、CameraDirection 和 CameraViewPoint 将此视图转换为 bcf 视图。
https://github.com/BuildingSMART/BCF-XML/tree/release_3_0/Documentation
variant - bcftools 合并的 vcf 文件将所有变体分配给一个样本
我为三个样本中的每一个都制作了一个 vcf 文件。然后我使用 bcftools 将它们组合起来,如下所示:
然后合并列表:
并将其编入索引:
生成的合并 vcf 似乎有三列,每个样本一列。当我在 IGV 中打开它时,所有变体都分配给样本 3a7a(见图)
但是当我在 GenomeBrowse 中打开它时,我看到它们正确分配给了三个样本中的每一个:
我想不通是怎么回事?我在这里上传了单个和合并的 vcf 文件。非常感谢任何帮助
bcftools - 如何运行 bcftools stats 以获得转换转换比率
我对 bcftools 和一般编码非常陌生,我有一个 txt 文件,其中包含我想要转换 - 转换比率的染色体和相应位置。目前我已经写了
这似乎有效,但是当我尝试运行 bcftools stats 后,我总是收到一条错误消息
bash - 对于每一行,用另一个字符替换第 2 次和第 3 次出现的字符,Bash
我正在尝试重新格式化参考图例文件以使其与 bcftools 兼容。
本质上,我需要从这个出发:
对此:
理想情况下使用 bash。
awk - 根据其他列的内容从 VCF 中提取变体位置
我有一个 vcf 文件,我正在尝试从这些列中提取信息:
但是,只有当 SAMPLE-1 列包含字符串 DeNovo(不是 DeNovoSV)并且 SAMPLE-1、SAMPLE-2 和 SAMPLE-3 都包含 PASS 时,我才想提取这些。
我试过使用 bcftools,见下文。
有没有办法使用 bcftools,或者将它与 awk 结合以获得我正在寻找的 vcf 文件格式的输出?
非常感谢