问题标签 [ncbi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
410 浏览

ruby - 在哈希中,如何为同一个键添加两个值而不是覆盖?

基本上我有这些文件(来自NCBI的medline)。每个都与一个期刊标题相关联。每个都有 0、1 个或多个 genbank 标识号 (GBID)。我可以将每个文件的 GBID 数量与每个期刊名称相关联。我的问题是我可能有多个文件与同一期刊关联,我不知道如何将每个文件的 GBID 数添加到每个期刊的 GBID 总数中。

我当前的代码:jt 代表期刊标题,从文件中正确提取。GBID 会在遇到时添加到计数中。

...到目前为止,执行了第一次搜索,您可以将每个“pmid”视为一个文件,因此每个“获取”一次遍历所有文件...

我的结果:

基本上,我怎么才能说病毒学档案= 15,但是对于任何期刊标题?我尝试了一个哈希,但是第二个病毒学档案只是覆盖了第一个......有没有办法让两个键在哈希中添加它们的值?

完整代码:

0 投票
2 回答
247 浏览

ruby - 如何添加到哈希值而不是用新值覆盖它?

基本上我有这些文件(来自NCBI的medline)。每个都与一个期刊标题相关联。每个都有 0、1 个或多个 genbank 标识号 (GBID)。我可以将每个文件的 GBID 数量与每个期刊名称相关联。我的问题是我可能有多个文件与同一期刊关联,我不知道如何将每个文件的 GBID 数添加到每个期刊的 GBID 总数中。

我当前的代码:jt 代表期刊标题,从文件中正确提取。GBID 会在遇到时添加到计数中。

完整代码:

我的结果:

基本上,我怎么才能说病毒学档案= 15,但是对于任何期刊标题?我尝试了一个哈希,但是第二个病毒学档案只是覆盖了第一个......有没有办法让两个键在哈希中添加它们的值?

0 投票
1 回答
235 浏览

bioinformatics - 给定GI NCBI核苷酸数据库的blast

我有本地数据库驱动的网站,其中包含一些通过其 GI 编号唯一标识的序列。是否可以在给出 GI 的情况下直接链接到“NCBI 爆炸站点”。例如 GI 903049 的序列有这个链接:

http://www.ncbi.nlm.nih.gov/nuccore/903049

它链接到这个爆炸页面:

http://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE=Nucleotides&PROGRAM=blastn&QUERY=U22848.1&DATABASE=nr&MEGABLAST=on&BLAST_PROGRAMS=megaBlast&LINK_LOC=nuccore&PAGE_TYPE=BlastSearch

我想直接链接到这个网站而不必去NCBI。谢谢。

0 投票
2 回答
591 浏览

php - 通过属性名称获取 XML 值

可能的重复:
SimpleXML 中的属性值选择
SimpleXML:选择具有特定属性值的元素

我正在解析一个 XML 文档并寻找一个特定的 ID。ID 值在属性“pii”下的 ArticleId 元素中提供。原始 XML:

这是整个文档供参考:http ://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&id=12676398&retmode=xml&rettype=abstract

使用 simplexml_load_file(),我遍历文档以获取值。以下是我如何访问 ArticleId 元素:

问题是 ArticleId 中的属性是随机的。一些 ArticleId 元素在第二个元素中包含“pii”值(如下所示),其他记录在第二个元素中具有不同的属性(“doi”)。

变化:

我正在寻找“S0002...”ID,它在原始 XML 中由属性“pii”标识。

我应该如何检查/获取基于特定属性的值?

0 投票
2 回答
5548 浏览

python - 使用 biopython 从 entrez 获取基因序列

这就是我想做的。我有一个基因名称列表,例如:[ITGB1, RELA, NFKBIA]

在 biopython 和 entrez API 教程中查找帮助我想出了这个:

但这不断出错。我发现如果 id 是一个数字 id(尽管你必须将它变成一个字符串才能使用,'186972394' 所以:

这让我得到了我想要的信息,其中包括序列。

所以现在问题: 我如何搜索基因名称(因为我没有 id 编号)或轻松地将我的基因名称转换为 id 以获得我拥有的基因列表的序列。

谢谢,

0 投票
2 回答
2675 浏览

php - PHP Simplexml_Load_File 失败

我已经成功地获得了 xml 格式的 pubmed 结果页面并将内容写入本地文件“Publications.xml”。问题是当我使用 simplexml_load_file("Publications.xml") 时,它失败了。无法弄清楚为什么。

在最后但第二行,解析器失败,我收到消息“不能”。我已经仔细检查了 xml 文件,它看起来状态良好。

如果有人可以让我知道这个的任何解决方法,我将非常感激。这是上面 PHP 脚本尝试读取的 xml 文件的副本 ( http://pastebin.com/U0fEKmZL ):

0 投票
1 回答
587 浏览

python - Biopython 1.60 中的 Bio.Entrez 和蛋白质问题

我在使用 Bio.Entrez 搜索蛋白质时遇到问题。我正在这样做:

我也遇到了 einfo() 的问题,请查看:

为什么不支持蛋白质数据库?有人可以帮我解决这个问题吗?

0 投票
3 回答
2842 浏览

python - urllib2.HTTPError Python

我有一个带有 GI 编号的文件,想FASTA从 ncbi 获取序列。

该脚本运行良好,但在几个序列后我突然收到此错误消息。

当然我可以使用http://www.ncbi.nlm.nih.gov/sites/batchentrez,但我正在尝试创建一个管道并且想要一些自动化的东西。

如何防止 ncbi “踢我”

0 投票
5 回答
317 浏览

php - 从嵌入在html中的xml中提取xml

我试图获取这里提供的 xml http://www.ncbi.nlm.nih.gov/sra/ERX086768?report=FullXml但它有点棘手,因为他们没有提供任何支持。目的是将xml转换为php以便处理xml。

有人可以给个提示吗?

0 投票
1 回答
96 浏览

php - 从 ncbi 拉取 xml RSS 提要

所以我有这个搜索http://www.ncbi.nlm.nih.gov/pubmed/?term=Streptococcus+dysgalactiae+subspecies+equisimilis我想获取 rss 提要(不是手动),就像带有 xml 的字符串,但我想用 php 来做。我试图在 ncbi 上搜索一种方法,但我想我不太擅长它..

我必须在html中搜索href吗?或类似的东西在网站上获取 RSS 提要