问题标签 [google-genomics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
351 浏览

google-api - 谷歌基因组学 API

尝试使用 Google Genomics,请按照此处的说明进行操作:https ://developers.google.com/genomics/

尝试从 GoogleCloud 控制台设置 OAuth 客户端 ID(第 4 节:身份验证),步骤 c 告诉我:“在 APIs & auth 选项卡上,选择 APIs 并确保 Genomics API 设置为 ON”

...但我在列表中找不到 Genomics API。如何将 Genomics API “添加”到列表中?(我已获准参加 Google Genomics Preview)。

0 投票
2 回答
103 浏览

google-api - Google Genomics API 调用集搜索“未知字段名称:datasetIds”

我已经使用 Google Genomics API 大约一天了。我已经成功调用了许多 API,例如 Datasets.list、Datasets.get 甚至 Readsets.search,但我遇到了 Callsets.search 的问题。

我正在发出 POST 请求:

我的请求正文是:

但我得到的回应是:

根据文档:https://developers.google.com/genomics/v1beta/reference/callsets/search datasetIds 是一个完全有效的参数。

让我困惑的疯狂事情是这个相同的请求在readsets/search端点上工作得很好,但不是callsets/search端点?我几乎想知道这是否是 API 中的错误。任何人都可以帮忙吗?

0 投票
1 回答
1630 浏览

r - 如何在 R 中对基因组 VCF 文件运行 PCA、距离矩阵和其他数学程序?

我正在学习处理 VCF(变体调用文件)以生成图表和报告。这是 R 代码,由于我未知的原因而崩溃。请告知如何修复它并告诉适当的教程。

0 投票
2 回答
462 浏览

python - 如何在不使用 argparser 的情况下添加 client_secret?

我想测试谷歌基因组学。我有一个项目,我可以从api 开始运行main.py。但是这个文件隐藏在 oauth2client 的底层是如何生成凭据的:

有人可以解释一下代码是什么吗?我怎么能把它转换成没有 argparse 的东西?

我尝试了 google-api 文档的其他解决方案,但重点是我不明白正在做什么,所以我不明白我应该做什么。(我也不完全了解 OAuth2client) 这个答案表明 argparse 是强制性的。但是这种使用 google-api-python-client 的其他方式不要使用它......

0 投票
3 回答
363 浏览

google-bigquery - 谷歌云/BigQuery/基因组数据位置

我们公司的一些工作要求将云中的数据存储在美国。

对于 Google Cloud,我可以将存储桶位置指定为美国位置。https://cloud.google.com/storage/docs/bucket-locations

但是对于 BigQuery 和 Google Genomics,API 中没有这样的选项。有人知道这些服务的数据存储在哪些国家/地区吗?

0 投票
1 回答
535 浏览

multithreading - 使用 Elasticluster 在 Google Compute Engine 上指定并行环境

我最近使用 Elasticluster(http://googlegenomics.readthedocs.org/en/latest/use_cases/setup_gridengine_cluster_on_compute_engine/index.html)在 Compute Engine 上创建了一个 Grid Engine 集群。

我想知道在运行 Grid Engine 的 Compute Engine 虚拟机集群上运行共享内存多线程批处理作业的合适命令是什么。

换句话说,Grid Engine 并行环境的名称(即 pe_name)是什么。

假设我想在 1 个节点上运行一个请求 4 个 CPU 的作业,那么正确的 qsub 命令是什么。

到目前为止,我尝试了以下命令:

qsub -cwd -l h_vmem=800G -pe smp 6 run.sh 无法运行作业:作业被拒绝:请求的并行环境“smp”不存在。

qsub -cwd -l h_vmem=800G -pe omp 6 run.sh 无法运行作业:作业被拒绝:请求的并行环境“omp”不存在。

谢谢您的帮助!

0 投票
1 回答
112 浏览

google-cloud-datalab - 是否可以在 Cloud Datalab 中使用 Google apiclient 的发现模块?

我有一个简单的 python 脚本,它执行以下操作:

是否可以从 Datalab 执行此操作,还是我最好的选择是使用 requests 模块,然后以这种方式构造和发布 http 请求?

0 投票
2 回答
50 浏览

google-api - dockstore-tool-samtools-index 是否已经配置了 GATK/BAM/Chromwell?

只是想知道名称为 dockstore-tool-samtools-index 的 docker 映像是否可在此处“https://quay.io/repository/cancercollaboratory/dockstore-tool-samtools-index”获得并作为 Google 的输入Genomics API (pipelines.create) 包含基因组工具,例如 GATK/BWA 或 Cromwell。对此的任何帮助将不胜感激。

谢谢。

0 投票
6 回答
168 浏览

google-api - Google Genomics API - 内部服务器错误 + ReferenceID

我对 Google 基因组学 API 很陌生。我正在尝试创建注释。我同时使用了网络版本和 Python API 调用:

这是一个示例注释:

对于这两种情况,我都会收到以下错误:

有什么建议吗?

再来一个观察。

我们可以通过仅提交datasetIdname添加一个变体集;无需指定referenceId,但我们无法创建没有referenceId的注释。为什么?

顺便说一句,我如何为调用者设置 WRITE 权限?

调用者必须具有关联注释集的 WRITE 权限。

先感谢您!

0 投票
1 回答
71 浏览

linux - 如何在终端 Linux 中将列转换为行?但更复杂

如何在终端 Linux 中将列转换为行?但更复杂...以下是我的数据示例:

我想将其转换为以下内容:

列中的行ID_animal随相应等位基因发生变化。我该怎么做?但我将使用 55,000 次重复ID_animal。所以,我只想成为 55,000 行和(动物++ numberSNP_Name的列。ChrPosition

谢谢你。