“pubmed”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

656 浏览

r - R中的文本搜索

我正在尝试进行查询以在名为 RISmed 的 R 包中使用，该包将从 pubmed 数据库中搜索并下载相关的期刊文章信息。我想总是一起搜索两个单词，例如：

如果我使用上面的命令，它将分别搜索基因和测序，然后同时搜索基因和测序，这意味着如果在整个文本中存在基因和测序，我的命令会捕获它们，但我想以这样的方式搜索，它会考虑“基因测序”，两个词永远在一起。我该如何编写该查询？有人能帮帮我吗？

提前致谢！

r text mining pubmed

2015-03-22T20:11:07.400

0 投票

1 回答

266 浏览

php - PHP：提高从 Entrez 数据库返回 Mesh 项的速度（Pubmed）

我想从 Pubmed 数据库的搜索结果中提取 Mesh 术语。我正在使用 php。

我制作了一个有效的脚本，但它非常慢。它打开每篇文章，解析 XML 并检索网格术语。“fopen”功能是缓慢的部分。

该脚本为每篇文章打开一个大的 xml 文件： http ://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&id=19616537&retmode=xml

有没有办法只检索网格术语，或者至少检索 xml 的一小部分？或者只加载文件的一半？

谢谢

更新：我得到了一些改进。使用 efetchretmode=text并将rettype=medline一个文件的下载量从 15 kb 减少到 4kb。我还捆绑了所有下载以减少请求量。

现在加载 500 个结果需要 4.8 秒。

我还是想快点。

有没有人有一些提示？

php performance pubmed

2015-03-28T20:03:39.370

0 投票

0 回答

76 浏览

ruby - 用于动态系统的 Ruby 循环

我是新来的，但我的问题很难解释，所以我会尽可能简单。我必须制作一个搜索 PubMed 的程序。查询得到一堆链接到文章的 ID 号，这些文章附有信息，例如创建时间、创建者、关键字等。我必须按年份对它们进行排序，我可以做到。然后我还必须按年份对 mesh_headings（与文章相关的关键字）进行排序。这些都必须计算在内。所以它会输出类似：

我不知道如何按年份对 mesh_headings 进行排序。如果有任何想法，我很想听听。当我尝试在下面的代码中执行一个循环时，它会询问创建的年份是否有一个可以放入的数组，如果没有，它将创建一个并将其推入。它给了我一个 tIDENTIFER 错误。提前致谢

结尾

ruby for-loop pubmed

2015-04-09T15:18:12.617

0 投票

1 回答

103 浏览

xml - R：xmlParse 错误地“添加”额外的“AND”到 URL 链接，解析失败

我正在尝试解析来自 NIH 的 pubmed 系统的 xml 输出。我已经生成了要解析的 URL，但 xmlParse() 函数似乎正在将额外的“ AND ”文本添加到包含运算符的 URL 中。

例如：

这会产生一个“NULL”IdList（结果应该在哪里）：

检查 QueryTranslation 揭示了问题（请参阅：额外的 AND）：

知道那里发生了什么吗？这发生在我构造的具有“AND”或“OR”等运算符的每个搜索字段或查询类型中。

一个干净的解析，找到 20 篇论文供参考：

xml r xml-parsing pubmed

2015-04-28T04:08:36.603

0 投票

1 回答

594 浏览

python - 使用 python 过滤/访问 Bio Entrez pubmed pulls 中的日期

我有一个标准列表（论文发表时间的名称和日期范围），以获取已发表论文的列表。我正在使用 Biopython 的 Bio Entrez 从 Entrez 获取论文。

我可以按作者姓名查询并获取结果，但我不知道如何处理数据以获取其中的日期。这就是我所做的：

现在输出看起来像这样

我尝试查看使用 Efetch，它并不总是有我所理解的 xml 输出。我以为我可以通过解析xml来过滤日期

我收到错误：回溯（最后一次通话）：

我觉得我错过了一些东西，我应该能够直接将它输入到查询中。我也不明白为什么这种方法不起作用，即使它似乎是一种更难的方法。有一个更好的方法吗？我尝试使用 xml.etree 来执行此操作，但我也遇到了类似的错误。

python text pubmed

2015-06-01T17:48:33.977

0 投票

1 回答

1154 浏览

xml - 如何 XSLT 转换 XML 嵌套属性元素并连接名称

我根本不熟悉 XML/XSLT。我只是想学习足够的知识来将此 XML 文件转换为我的 Access 数据库可以使用的东西。XML 数据以属性格式输出，Access 只喜欢元素格式。我已经完成了基本的转换，但我似乎无法对嵌套数据进行元素化。

我希望最终结果是所有元素。目前我的 XSLT 脚本正在尝试在子元素的名称中包含 parental name 属性，但这可能不是必需的。如果我可以在列表元素的名称中编号，那就太棒了。如“AuthorList1”、“AuthorList2”或“Author1”、“Author2”。

这是我正在处理的 XML 类型（缩写）：

XML

我在 XSLT 方面已经取得了相当大的进展，但我还没有走到那一步。不断出现的一个问题是空元素（如引用）获得不允许的空名称。当我尝试使用“Item[@Type='List']”的匹配模式执行命令时，就会发生这种情况。此外，我似乎无法让列表的子节点（元素？）成为他们自己的元素。

XSLT

我希望这有某种意义。我真的不想成为这方面的专家，因为我怀疑我是否会在很长一段时间内再次处理 XML 转换。我将不胜感激即将到来的任何帮助。

xml xslt transformation pubmed

2015-06-11T16:44:11.437

0 投票

0 回答

48 浏览

xml - SOLR XML 导入结合多个子项

我正在尝试使用 DataImportHandler 将 XML 加载到 Solr 中，并且在获取数据时没有问题，但需要帮助转换格式。我已经尝试了所有我能想到的东西，并在谷歌上搜索了可能的解决方案，但我真的被困住了。源 XML 如下所示：

我想最终得到这样的结果：

我在想 DIH 的 ScriptTransformer 、 TemplateTransformer 和 Schema.xml 的“dynamicField”的某种组合可以解决问题，但我真的碰壁了。有没有其他人遇到过这样的问题？

非常感谢您提前。

xml solr dataimporthandler pubmed

2015-07-23T17:05:58.230

0 投票

2 回答

6411 浏览

http-get - 如何使用 PubMed API 搜索具有确切标题的文章？

我正在尝试使用 PubMed API 搜索具有确切标题的文章。例如，我想搜索标题：The cost-effectiveness of mirtazapine versus paroxetine in treating people with depression in primary care.

我想要最多 1000 个 JSON 格式的结果，所以我知道我的 URL 的第一部分应该是这样的：

如何将标题搜索添加为 GET 参数？

我一直在使用 Pubmed高级搜索构造函数，这表明查询应该是这样的The cost-effectiveness of mirtazapine versus paroxetine in treating people with depression in primary care[Title]。

但是，如果我尝试将其添加到 URLterm=中，PubMed 会尝试将标题分解为各种特殊查询：

如何将确切的标题指定为 GET 参数？

http-get pubmed

Richard

2015-08-17T13:27:37.643

0 投票

2 回答

330 浏览

python - Parsing XML: Finding Interesting Elements Using ElementTree

I am using urllib and ElementTree to parse XML API calls from pubmed.

An example of this is:

I now have been able to use Element Tree to import the data to the object root from ET.fromstring. My issue now, is that I am having trouble finding interesting elements from this object.

I am referring to: https://docs.python.org/2/library/xml.etree.elementtree.html and my XML format looks like: http://eutils.ncbi.nlm.nih.gov/entrez/eutils/esummary.fcgi?db=pubmed&id=1757056

I have tried:

As well as

python xml python-3.x xml-parsing pubmed

2015-08-25T14:17:29.243

0 投票

1 回答

719 浏览

ftp - Pubmed DataSet - 用 Flume 连接 FTP

为了从 Pubmed DataSet [ncbi] 中检索数据，我使用 FireFTP 插件（在 firefox 中）检索 xml、pdf、txt 内容。[ http://www.ncbi.nlm.nih.gov/pmc/tools/ftp/] 我已经成功安装了 Apache Flume。

主要目标是——我需要将 FTP 与 Flume 连接并将最终结果数据集存储在 Cassandra 中。

谁能帮助我如何将 FTP 源与 Flume 连接。

非常感谢你。

ftp flume flume-ng ncbi pubmed

2015-10-06T13:33:37.230

问题标签 [pubmed]

Reference