问题标签 [pubmed]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 将 PubMed 数据推送到 Kafka
在 PubMed 数据源中,我需要将输出推送到 Kafka 队列中。每个源都可以视为一个 Kafka 主题。(我知道 Kafka 中的概念,并使用 Python 探索了 Kafka)
我可以通过 FireFTP 查看 PubMed 数据。
任何人都可以帮助如何继续前进吗?
r - R包RISmed:使用EUtilsget或summary函数的不同结果
我使用 RISmed R 包的 EUtilsSummary 或 EUtilsGet 函数来查询 pubmed 中列出的论文,获得了不同的结果。在这两个函数中都使用了相同的查询。
如您所见,使用摘要功能在 pubmed 中统计了三篇论文。但是“获取函数”只会找到两个:
你对这种行为有什么想法或解释吗?第三篇论文(PubmedID:20301374)将被丢弃,尽管它定期在数据库中列出。
xml - 如何访问 XML 文件中不同名称的子节点(子节点)的值?
我正在尝试xmlValue
从 NCBI xml 文件中解析某些子节点。但是,对于某些 PM.ID,Root node <PubmedArticleSet>
具有不同的信息 wrt 已发布记录,PubmedBookArticle
并且PubmedArticle
. 我想传递一个条件,if(xmlName(fetch.pubmed) == PubmedBookArticle
提取某些值elseif (xmlName(fetch.pubmed) == PubmedArticle
提取其他值。最后,使用dataframe
与它们的 PMID 对应的两个值制作 a。看起来很简单,但(xmlName(fetch.pubmed)
会抛出错误no applicable method for 'xmlName' applied to an object of class "c('XMLInternalDocument', 'XMLAbstractDocument')"
任何帮助表示赞赏,谢谢
我的代码如下
如何在循环中获取上述代码,以便在每次搜索中满足条件时检索 PubmedArticle 和 PubmedBookArticle 中的值?
ncbi - 如何从 pubmed 数据 ncbi 下载所有抽象数据
我想下载所有已发布的数据摘要。有谁知道我如何可以轻松下载所有已发表的文章摘要?
我得到了数据的来源:ftp: //ftp.ncbi.nlm.nih.gov/pub/pmc/af/12/
无论如何要下载所有这些tar文件..
提前致谢。
python - Pubmed eutils esearch 的排序选项?
我正在使用 BioPython 通过 eutils API 查询 Pubmed 数据库。esearch
端点有一个排序选项,但 API 文档没有列出该值的所有选项。
http://www.ncbi.nlm.nih.gov/books/NBK25499/#_chapter4_ESearch_
示例调用:
我知道的价值观适用于sort_method
:
- '发布日期'
- '关联'
- “第一作者”
- “最后一位作者”
- '标题'
- '杂志'
但是,我不确定如何指定默认排序顺序,即“最近”;实际上,这似乎是按 Pubmed ID 值排序的。'recent'、'most recent'、'pmid'、'id' 和 'default' 都给出了 OutputMessage “未知排序模式......”。
还有其他人知道如何明确指定默认顺序吗?
api - 如何通过 API/OAI/FTP 从开放存取期刊中获取出版物关键字?PubMed 或 DOAJ 或任何其他平台?
是否有已知的 API 或任何方法来获取DOAJ.org或PMC 开放访问子集中所有出版物的“作者列出的关键字” ?
我尝试了PMC 开放访问子集的 ftp,但 XML 文件只有 ID、摘要、标题、作者和附属机构作为任何文章的元数据。我希望大量获取每个出版物中列出的关键字。
此外,我看到几乎没有相同的线程,但仍然没有找到我正在寻找的答案。于是发了新帖。
非常感谢任何帮助。
谢谢,
阿斯米
python - 如何从 efetch(Biopython,Entrez)中提取摘要?
我是 python 新手,想使用 bio 包中的 entrez 系统从 pubmed 中提取摘要。我得到了 esearch 来给我我的 UID(存储在 中my_list_ges
),我也可以使用 efetch 下载一个条目。但是,现在结果是字典列表,条目看起来像字典,但我无法访问它们:
结果是一个类型错误:
我KeyError
在尝试'Abstract'
从第一条记录中检索时得到一个:
这很奇怪,因为在搜索结果中,我可以通过字典轻松访问我的 UID
记录[0]的结构是:
download - 按日期(从-到)下载所有 pubmed id 的列表
我需要自动化 PubMed 文章收集。我只找到了通过术语查询下载 PubMed 文章和通过pmid下载 PubMed 文章的示例。(一篇文章)但我正在考虑的是按日期(从到)或全部下载 PubMed ID 的列表,就像在 OAI 中一样。
ruby - 如何从 Pubmed 下载全文?
我正在做一个需要使用 Genia 语料库的项目。根据文献,Genia Corpus 是通过在 Medline/Pubmed 上搜索 3 个 Mesh 术语:“转录因子”、“血细胞”和“人类”提取的文章制成的。我想从 Pubmed 提取 Genia 语料库中的文章的全文文章(可免费获得)。我尝试了很多方法,但我无法找到以文本或 XML 或 Pdf 格式下载全文的方法。
使用 NCBI 提供的 Entrez 工具:
我试过使用这里提到的方法 - http://www.hpa-bioinformatics.org.uk/bioruby-api/classes/Bio/NCBI/REST/EFetch/Methods.html#M002197
它使用像这样的 Ruby gem Bio 来获取给定 PubMed ID 的信息 - Bio::NCBI::REST::EFetch.pubmed(15496913)
但是,它不会返回 PMID 的全文。
在内部,它会发出这样的调用 - http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pubmed&id=1372388&retmode=text&rettype=medline
但是,Ruby gem 和上述调用都不会返回全文。
在进一步的 Internet 搜索中,我发现 PubMed 的 rettype 和 retmode 允许值没有获取全文的选项,如此处的表中所述 - http://www.ncbi.nlm.nih.gov/书籍/NBK25499/table/chapter4.T._valid_values_of__retmode_and/?report=objectonly
我在网上看到的所有例子和其他脚本都只是提取摘要。作者等,他们都没有讨论提取全文。
这是我发现的另一个链接,它使用 Python 包 Bio,但仅访问有关作者的信息 - https://www.biostars.org/p/172296/
如何使用 NCBI 提供的 Entrez utils 下载文本或 XML 或 Pdf 格式的文章全文?或者是否已经有可用的脚本或网络爬虫可供我使用?
database - 作者姓名消歧数据
我正在研究作者姓名消歧问题。我想做一些实验。我想对引文记录进行聚类。我需要训练数据和测试数据,其中每个出版物记录的真实作者都可用。有许多书目数据库,如 DBLP、Medline 和 Pubmed 等。我对测试阶段感到困惑。将 DBLP 分为训练和测试是否是一种好习惯?DBLP 引文记录是手动添加的吗?我可以保证每条引文记录都分配给 DBLP 中的真实作者吗?对培训和测试数据库有什么建议吗?注意:在文献中,我注意到在一些论文中,他们使用 Pubmed 进行培训,使用 DBLP 进行测试,尽管第一个用于医学出版物,第二个用于计算机。