问题标签 [pubmed]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
468 浏览

python - HTTPError 与示例 biopython 代码查询 pubmed

我想通过python查询pubmed。我找到了一个很好的生物学相关库来做到这一点:http: //biopython.org/DIST/docs/tutorial/Tutorial.html

我在这里找到了一些示例代码:http: //biopython.org/DIST/docs/tutorial/Tutorial.html#htoc116

当我更改电子邮件并运行此代码时,我收到以下错误:

问题的根源没有太多线索。我不知道它试图访问什么网址。当我搜索“pubmed entrez urllib2.HTTPError: HTTP Error 404: Not Found”时,我得到 8 个结果,其中没有一个是相关的(除了这个线程)。

0 投票
0 回答
169 浏览

bioinformatics - 为什么 pmid 2 pmcid 的 Pubmed entrez 工具会给出奇怪的结果

我正在为一个 Ruby 脚本编写一个 rspec,其中包括使用这个 api 从 PMid 转换为 PMCid。

像这样调用它可以正常工作:

但是我正在写一个规范并且想要一个失败的调用,比如当有人传入一个字符串而不是一个数字时。所以我尝试了这个

这将返回 599027 个 PMCid!

我刚刚检查了反向服务

蚂蚁电话

看起来不错。

有谁知道这是否是 PMid 到 PMCid 服务的正确(和记录)行为?

有趣的是,当我反向查找“foobar”返回的一些 PMCid 时,它们都显示匹配的 PMid 为零:

0 投票
1 回答
50 浏览

lucene - 不要使用 plucene::simple 索引所有字段

我正在寻找用于存储大量数据的 plucene,我对此很陌生。数据的每条记录都有一个唯一的 ID 和另外 3 个字段。这些字段有很多文本,但我只希望 id 可以搜索/索引,所以当我提供 id 时,我可以检索其他字段。一个简单的示例代码是这样的:

我正在尝试使用 plucene::simple 并且我有 2 个问题/问题:

  1. 我看不到不索引某些字段的选项。
  2. @results数组中我会得到'id1'. 我怎样才能找回例如抽象领域?

提前致谢

0 投票
2 回答
358 浏览

xml - Perl:从 XML 输出填充数组(通过 Eutils 的 PubMed UID)

我正在尝试从 PubMed 的 Eutils 生成的 XML 输出中构建一个 ID 数组。

这是 GitHub 上的代码。下面是具体的子程序。

解决这个问题的最佳方法是什么?

以下是 PubMed XML 结果的样子:

0 投票
1 回答
1747 浏览

python - 如何在 python 爬虫中访问具有多个页面的表单的 pubmed 数据

我正在尝试使用 python 抓取 pubmed 并获取一篇文章引用的所有论文的 pubmed ID。

例如这篇文章(ID:11825149) http://www.ncbi.nlm.nih.gov/pubmed/11825149 有一个页面链接到所有引用它的文章: http ://www.ncbi.nlm.nih.gov /pubmed?linkname=pubmed_pubmed_citedin&from_uid=11825149 问题是它有超过 200 个链接,但每页只显示 20 个。url 无法访问“下一页”链接。

有没有办法打开“发送到”选项或使用 python 查看下一页的内容?

我目前如何打开 pubmed 页面:

从中我可以提取第一页上链接引用的所有内容,但是如何从所有页面中提取它们?谢谢。

0 投票
1 回答
838 浏览

perl - 使用 Bio::DB::EUtilities 从 pubmed 访问摘要

我正在使用 Bio::DB::EUtilities 来查询具有给定 PMID(Pubmed Id)的 Pubmed DB。

有没有办法直接访问对象(例如抽象)而不是写入文件响应并使用 XML::Twig 左右?

0 投票
1 回答
2635 浏览

xml - 使用 Cheerio 抓取嵌套的 xml

我正在尝试使用cheerio 废弃一些PubMed 数据。以下脚本可以正常工作,但是当某些 xml 标记不存在时,它会生成错误排序的输出。

在此示例中,摘要在第一个标题下方输出,而不是第二个,因为第一篇文章不包含摘要。

0 投票
1 回答
2114 浏览

java - 使用 Entrez Utilities Web Service 访问已发布的摘要

我使用Entrez Utilities Web Service 库从我的 Java 应用程序访问 pubmed 文章(使用 pubmed 标识符)。Renaudgithub上的这篇文章中发布了如何使用此工具的完整工作示例。在大多数情况下一切正常,但是最近我发现了一个 pubmed id 导致库崩溃。

我使用的代码如下所示:

当我用这个函数调用这个函数时,id = 22363258我得到了一个根本没有信息的错误:

所以,我有两个问题:

  • 是什么原因?我能做些什么来解决它?
  • 是否有任何其他 java API 可用于访问 pubmed 摘要?我知道我可以解析 html 页面,但我真的不想这样做,因为它引入的问题多于解决的问题......
0 投票
1 回答
259 浏览

java - Java PubMed 阻止 url 请求

我有一些代码可以访问 PubMed 中的文章并解析每个 XML 中的一些信息。该程序在我的计算机上运行良好,但需要很多时间才能完成。因此,当我在 unix 机器上运行它时,特别是针对这类事情,我发出的每个请求都会被阻止。在机器认为它是病毒之前,每分钟可以发出多少个限制,但这不是问题,因为所有请求都被阻止。我查了一下,这只发生在 PubMed 网站上的请求中。

提前致谢

编辑:我使用 jsoup 进行连接。从我的程序中使用 ProcessBuilder 运行 wget 不会被阻塞,但是效率成为一个问题,因为 wget 的输出只能被读取,while(br.readline() != null)并且这会占用大量运行时间。

0 投票
1 回答
2836 浏览

python - biopython 有没有办法从已发表的文章中获取完整的摘要?

我目前有以下查询发布的代码:

此代码能够告诉我文章是否有摘要,但我找不到任何有关如何实际返回摘要的文档。可以使用 biopython 吗?如果不是还有其他方法吗?