问题标签 [pubmed]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
656 浏览

r - R中的文本搜索

我正在尝试进行查询以在名为 RISmed 的 R 包中使用,该包将从 pubmed 数据库中搜索并下载相关的期刊文章信息。我想总是一起搜索两个单词,例如:

如果我使用上面的命令,它将分别搜索基因和测序,然后同时搜索基因和测序,这意味着如果在整个文本中存在基因和测序,我的命令会捕获它们,但我想以这样的方式搜索,它会考虑“基因测序”,两个词永远在一起。我该如何编写该查询?有人能帮帮我吗?

提前致谢 !

0 投票
1 回答
266 浏览

php - PHP:提高从 Entrez 数据库返回 Mesh 项的速度(Pubmed)

我想从 Pubmed 数据库的搜索结果中提取 Mesh 术语。我正在使用 php。

我制作了一个有效的脚本,但它非常慢。它打开每篇文章,解析 XML 并检索网格术语。“fopen”功能是缓慢的部分。

该脚本为每篇文章打开一个大的 xml 文件: http ://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&id=19616537&retmode=xml

有没有办法只检索网格术语,或者至少检索 xml 的一小部分?或者只加载文件的一半?

谢谢


更新:我得到了一些改进。使用 efetchretmode=text并将rettype=medline一个文件的下载量从 15 kb 减少到 4kb。我还捆绑了所有下载以减少请求量。

现在加载 500 个结果需要 4.8 秒。

我还是想快点。

有没有人有一些提示?

0 投票
0 回答
76 浏览

ruby - 用于动态系统的 Ruby 循环

我是新来的,但我的问题很难解释,所以我会尽可能简单。我必须制作一个搜索 PubMed 的程序。查询得到一堆链接到文章的 ID 号,这些文章附有信息,例如创建时间、创建者、关键字等。我必须按年份对它们进行排序,我可以做到。然后我还必须按年份对 mesh_headings(与文章相关的关键字)进行排序。这些都必须计算在内。所以它会输出类似:

我不知道如何按年份对 mesh_headings 进行排序。如果有任何想法,我很想听听。当我尝试在下面的代码中执行一个循环时,它会询问创建的年份是否有一个可以放入的数组,如果没有,它将创建一个并将其推入。它给了我一个 tIDENTIFER 错误。提前致谢

结尾

0 投票
1 回答
103 浏览

xml - R:xmlParse 错误地“添加”额外的“AND”到 URL 链接,解析失败

我正在尝试解析来自 NIH 的 pubmed 系统的 xml 输出。我已经生成了要解析的 URL,但 xmlParse() 函数似乎正在将额外的“ AND ”文本添加到包含运算符的 URL 中。

例如:

这会产生一个“NULL”IdList(结果应该在哪里):

检查 QueryTranslation 揭示了问题(请参阅:额外的 AND):

知道那里发生了什么吗?这发生在我构造的具有“AND”或“OR”等运算符的每个搜索字段或查询类型中。

一个干净的解析,找到 20 篇论文供参考:

0 投票
1 回答
594 浏览

python - 使用 python 过滤/访问 Bio Entrez pubmed pulls 中的日期

我有一个标准列表(论文发表时间的名称和日期范围),以获取已发表论文的列表。我正在使用 Biopython 的 Bio Entrez 从 Entrez 获取论文。

我可以按作者姓名查询并获取结果,但我不知道如何处理数据以获取其中的日期。这就是我所做的:

现在输出看起来像这样

我尝试查看使用 Efetch,它并不总是有我所理解的 xml 输出。我以为我可以通过解析xml来过滤日期

我收到错误:回溯(最后一次通话):

我觉得我错过了一些东西,我应该能够直接将它输入到查询中。我也不明白为什么这种方法不起作用,即使它似乎是一种更难的方法。有一个更好的方法吗?我尝试使用 xml.etree 来执行此操作,但我也遇到了类似的错误。

0 投票
1 回答
1154 浏览

xml - 如何 XSLT 转换 XML 嵌套属性元素并连接名称

我根本不熟悉 XML/XSLT。我只是想学习足够的知识来将此 XML 文件转换为我的 Access 数据库可以使用的东西。XML 数据以属性格式输出,Access 只喜欢元素格式。我已经完成了基本的转换,但我似乎无法对嵌套数据进行元素化。

我希望最终结果是所有元素。目前我的 XSLT 脚本正在尝试在子元素的名称中包含 parental name 属性,但这可能不是必需的。如果我可以在列表元素的名称中编号,那就太棒了。如“AuthorList1”、“AuthorList2”或“Author1”、“Author2”。

这是我正在处理的 XML 类型(缩写):

XML

我在 XSLT 方面已经取得了相当大的进展,但我还没有走到那一步。不断出现的一个问题是空元素(如引用)获得不允许的空名称。当我尝试使用“Item[@Type='List']”的匹配模式执行命令时,就会发生这种情况。此外,我似乎无法让列表的子节点(元素?)成为他们自己的元素。

XSLT

我希望这有某种意义。我真的不想成为这方面的专家,因为我怀疑我是否会在很长一段时间内再次处理 XML 转换。我将不胜感激即将到来的任何帮助。

0 投票
0 回答
48 浏览

xml - SOLR XML 导入结合多个子项

我正在尝试使用 DataImportHandler 将 XML 加载到 Solr 中,并且在获取数据时没有问题,但需要帮助转换格式。我已经尝试了所有我能想到的东西,并在谷歌上搜索了可能的解决方案,但我真的被困住了。源 XML 如下所示:

我想最终得到这样的结果:

我在想 DIH 的 ScriptTransformer 、 TemplateTransformer 和 Schema.xml 的“dynamicField”的某种组合可以解决问题,但我真的碰壁了。有没有其他人遇到过这样的问题?

非常感谢您提前。

0 投票
2 回答
6411 浏览

http-get - 如何使用 PubMed API 搜索具有确切标题的文章?

我正在尝试使用 PubMed API 搜索具有确切标题的文章。例如,我想搜索标题:The cost-effectiveness of mirtazapine versus paroxetine in treating people with depression in primary care.

我想要最多 1000 个 JSON 格式的结果,所以我知道我的 URL 的第一部分应该是这样的:

如何将标题搜索添加为 GET 参数?

我一直在使用 Pubmed高级搜索构造函数,这表明查询应该是这样的The cost-effectiveness of mirtazapine versus paroxetine in treating people with depression in primary care[Title]

但是,如果我尝试将其添加到 URLterm=中,PubMed 会尝试将标题分解为各种特殊查询:

如何将确切的标题指定为 GET 参数?

0 投票
2 回答
330 浏览

python - Parsing XML: Finding Interesting Elements Using ElementTree

I am using urllib and ElementTree to parse XML API calls from pubmed.

An example of this is:

I now have been able to use Element Tree to import the data to the object root from ET.fromstring. My issue now, is that I am having trouble finding interesting elements from this object.

I am referring to: https://docs.python.org/2/library/xml.etree.elementtree.html and my XML format looks like: http://eutils.ncbi.nlm.nih.gov/entrez/eutils/esummary.fcgi?db=pubmed&id=1757056

I have tried:

As well as

0 投票
1 回答
719 浏览

ftp - Pubmed DataSet - 用 Flume 连接 FTP

为了从 Pubmed DataSet [ncbi] 中检索数据,我使用 FireFTP 插件(在 firefox 中)检索 xml、pdf、txt 内容。[ http://www.ncbi.nlm.nih.gov/pmc/tools/ftp/] 我已经成功安装了 Apache Flume。

主要目标是——我需要将 FTP 与 Flume 连接并将最终结果数据集存储在 Cassandra 中。

谁能帮助我如何将 FTP 源与 Flume 连接。

非常感谢你。