问题标签 [google-genomics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
858 浏览

google-cloud-storage - 如何使用 elasticluster、grid-engine-tools 和 google cloud 将文件列表压缩为单个 gzip 文件

首先,我要提前感谢大家的帮助,因为这将有助于清除readthedocs.io 指南中遗漏的细节。我需要将多个文件压缩到一个 gzip 中,但是,该指南仅显示如何将文件列表压缩为单个 gzip 文件。再次感谢任何帮助,因为此设置的资源和文档很少。(如果有一些额外的信息,请包括源链接)

设置好网格引擎后,我浏览了指南中的示例。

我是否正确假设没有使用grid-computing-tools将多个文件组合成一个 gzip 的脚本?

Elasticluster Grid Engine 设置上是否有任何解决方案可以将多个文件压缩为 1 个 gzip?

可以对网格引擎工具进行哪些更改以使其正常工作?

编辑

我们考虑集群的原因是我们确实希望同时发生多个操作,每个订单压缩文件,这将系统地发生,以便供应商可以为每个订单下载单个压缩文件。

0 投票
1 回答
42 浏览

google-genomics - 谷歌基因组学有多少对研究其他生物的人开放?

我想知道谷歌基因组学环境对于那些不从事人类基因组工作的人来说有多少足够灵活?我找不到一个明显的地方来回答这个问题,并且不想太深入,然后找出它仅适用于人类。有人知道吗?

0 投票
2 回答
182 浏览

google-cloud-storage - 谷歌基因组学工作永无止境

我们使用 Google Genomics ReadGroupSets 来存储我们的对齐数据(BAM 文件),它运行得非常好,直到昨天......

昨天(2016 年 8 月 29 日)我们的导入作业(方法:readgroupsets.import)开始处于“运行”状态,但直到现在还没有达到“完成”或错误消息。

还有其他人遇到同样的问题吗?

例如:作业运行 1 天,没有显示错误消息。

昨天我们在从 Google 存储中的对象获取“公共链接”时也遇到了临时问题,但现在这个问题还可以。

编辑:我还尝试使用 gcloud cli 触发导入作业,指向另一个数据集和另一个云项目,但这些作业仍处于“运行”状态。

编辑2 :我使用 Google Genomics 大约 3 个月,并成功导入了 400 多个比对。只有这周我遇到了问题。

编辑3:已解决。我所有的工作都顺利结束了。

0 投票
0 回答
175 浏览

r - 如何启用 R 中的“后期”版本包(包中更高的版本)- 功能/包“轨道”?

我尝试在 R 中使用函数/包“tracks”,但版本不兼容。首先,我认为这个功能是包“ggbio”的,但我安装了这个并没有运行。

我将使用此函数/包来合并两个图形,它们将具有相同的 y 比例。(一个在另一个之上的图表,以相同的比例 y)

为了启用,我试过了

没办法。我电脑中的 R 版本是 3.3.0(在 Windows 中)和 3.2.3(在 Linux-Ubuntu 中)。

有人曾经使用过这个功能/包,可以帮助我吗?

0 投票
2 回答
290 浏览

google-cloud-dataflow - 为什么 Google Pipeline VM 实例无限期挂起?

我正在使用 Dockerflow 通过 Google Cloud Platform 上的 Google Pipelines API 运行并行任务。我开始了一个并行运行 1389 个 VM 的单步任务,发现其中 233 个 VM 显然什么都不做,并且无限期地挂起。

我对串行控制台输出进行了抽查,并反复看到虚拟机运行到“获取控制器配置失败”错误。

当我尝试登录虚拟机时,我收到错误消息:“连接失败。我们无法连接到端口 22 上的虚拟机”。

我想知道为什么我的 VM 实例会挂起,以及是否可以采取一些措施来避免遇到这些问题。

我在下面包含了串行控制台输出的片段

0 投票
0 回答
55 浏览

google-bigquery - 无法再访问 silver-wall-555.TuteTable.hg19 表

我可以在周五(2 月 17 日)访问 silver-wall-555.TuteTable.hg19,但从 2 月 20 日起就无法访问它。它是否已从 Google BigQuery 中删除?Lot 的 os 示例基于 silver-wall-555.TuteTable.hg19。

0 投票
0 回答
94 浏览

google-bigquery - 数据工作室过滤器控制 - 有很长的选择列表(用于基因组数据)

我正在使用数据工作室和 bigQuery 来处理基因组数据。我提供的数据是与基因有关的疾病(报告包括 2 页,用于 2 次试验) https://datastudio.google.com/org//reporting/0B0ZHOVx9i6OrVGo2Rmp6VVlvZUU/page/B98E 当按基因过滤时(第 1 页 - 可以最高 20K)过滤器控件不是很有用,并且性能很差。

关于如何提高性能的任何想法(我试图将其分解为几个过滤器 - 第 2 页 - https://datastudio.google.com/org//reporting/0B0ZHOVx9i6OrVGo2Rmp6VVlvZUU/page/Bg9E - 这很有希望,直到我意识到我能够使用这种替代方法仅选择一个基因

请指教。我愿意编写代码或尝试任何可能给我带来优势的预建工具。非常感谢,埃拉兰

0 投票
1 回答
57 浏览

google-bigquery - 提取值限制为 10 或更少的 BigQuery 返回正确的结果,更改限制或添加提取返回 null

以下是基因组数据的问题: 我在大查询中对 pgp 数据使用以下查询:http: //googlegenomics.readthedocs.io/en/latest/use_cases/discover_public_data/pgp_public_data.html (为简单起见,使用了一个示例 ID : hu089792)

0 投票
1 回答
46 浏览

google-app-engine - googlegenomics:管道 api-examples/fastqc 示例的 dsub 错误

我试图遵循 googlegenomics/pipelines-api-examples 中给出的 fastqc 示例。但是,当我尝试使用我的 projectID 和 bucketID 重新生成示例时,出现错误:

我哪里错了?

0 投票
1 回答
30 浏览

google-bigquery - 谷歌基因组学 bigQuery 差异表数据描述

我想阅读基因组特定区域的所有调用。无论基因型如何(等于参考基因组或替代、编码或非编码区)。假设所有基因组都被测序。我应该查看以下哪些表格?

我正在使用 Google BigQuery 基因组学数据,需要解释以下文件扩展名之间的差异: *.genome_calls *.variants *.multisample_variants *.single_sample_genome_calls

非常感谢, 艾拉