问题标签 [pubmed]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - HTTPError 与示例 biopython 代码查询 pubmed
我想通过python查询pubmed。我找到了一个很好的生物学相关库来做到这一点:http: //biopython.org/DIST/docs/tutorial/Tutorial.html
我在这里找到了一些示例代码:http: //biopython.org/DIST/docs/tutorial/Tutorial.html#htoc116
当我更改电子邮件并运行此代码时,我收到以下错误:
问题的根源没有太多线索。我不知道它试图访问什么网址。当我搜索“pubmed entrez urllib2.HTTPError: HTTP Error 404: Not Found”时,我得到 8 个结果,其中没有一个是相关的(除了这个线程)。
lucene - 不要使用 plucene::simple 索引所有字段
我正在寻找用于存储大量数据的 plucene,我对此很陌生。数据的每条记录都有一个唯一的 ID 和另外 3 个字段。这些字段有很多文本,但我只希望 id 可以搜索/索引,所以当我提供 id 时,我可以检索其他字段。一个简单的示例代码是这样的:
我正在尝试使用 plucene::simple 并且我有 2 个问题/问题:
- 我看不到不索引某些字段的选项。
- 在
@results
数组中我会得到'id1'
. 我怎样才能找回例如抽象领域?
提前致谢
xml - Perl:从 XML 输出填充数组(通过 Eutils 的 PubMed UID)
我正在尝试从 PubMed 的 Eutils 生成的 XML 输出中构建一个 ID 数组。
这是 GitHub 上的代码。下面是具体的子程序。
解决这个问题的最佳方法是什么?
以下是 PubMed XML 结果的样子:
python - 如何在 python 爬虫中访问具有多个页面的表单的 pubmed 数据
我正在尝试使用 python 抓取 pubmed 并获取一篇文章引用的所有论文的 pubmed ID。
例如这篇文章(ID:11825149) http://www.ncbi.nlm.nih.gov/pubmed/11825149 有一个页面链接到所有引用它的文章: http ://www.ncbi.nlm.nih.gov /pubmed?linkname=pubmed_pubmed_citedin&from_uid=11825149 问题是它有超过 200 个链接,但每页只显示 20 个。url 无法访问“下一页”链接。
有没有办法打开“发送到”选项或使用 python 查看下一页的内容?
我目前如何打开 pubmed 页面:
从中我可以提取第一页上链接引用的所有内容,但是如何从所有页面中提取它们?谢谢。
perl - 使用 Bio::DB::EUtilities 从 pubmed 访问摘要
我正在使用 Bio::DB::EUtilities 来查询具有给定 PMID(Pubmed Id)的 Pubmed DB。
有没有办法直接访问对象(例如抽象)而不是写入文件响应并使用 XML::Twig 左右?
xml - 使用 Cheerio 抓取嵌套的 xml
我正在尝试使用cheerio 废弃一些PubMed 数据。以下脚本可以正常工作,但是当某些 xml 标记不存在时,它会生成错误排序的输出。
在此示例中,摘要在第一个标题下方输出,而不是第二个,因为第一篇文章不包含摘要。
java - 使用 Entrez Utilities Web Service 访问已发布的摘要
我使用Entrez Utilities Web Service 库从我的 Java 应用程序访问 pubmed 文章(使用 pubmed 标识符)。Renaud在github上的这篇文章中发布了如何使用此工具的完整工作示例。在大多数情况下一切正常,但是最近我发现了一个 pubmed id 导致库崩溃。
我使用的代码如下所示:
当我用这个函数调用这个函数时,id = 22363258
我得到了一个根本没有信息的错误:
所以,我有两个问题:
- 是什么原因?我能做些什么来解决它?
- 是否有任何其他 java API 可用于访问 pubmed 摘要?我知道我可以解析 html 页面,但我真的不想这样做,因为它引入的问题多于解决的问题......
java - Java PubMed 阻止 url 请求
我有一些代码可以访问 PubMed 中的文章并解析每个 XML 中的一些信息。该程序在我的计算机上运行良好,但需要很多时间才能完成。因此,当我在 unix 机器上运行它时,特别是针对这类事情,我发出的每个请求都会被阻止。在机器认为它是病毒之前,每分钟可以发出多少个限制,但这不是问题,因为所有请求都被阻止。我查了一下,这只发生在 PubMed 网站上的请求中。
提前致谢
编辑:我使用 jsoup 进行连接。从我的程序中使用 ProcessBuilder 运行 wget 不会被阻塞,但是效率成为一个问题,因为 wget 的输出只能被读取,while(br.readline() != null)
并且这会占用大量运行时间。
python - biopython 有没有办法从已发表的文章中获取完整的摘要?
我目前有以下查询发布的代码:
此代码能够告诉我文章是否有摘要,但我找不到任何有关如何实际返回摘要的文档。可以使用 biopython 吗?如果不是还有其他方法吗?