问题标签 [pubmed]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
html - 用硒刮
我想从网站上抓取一些动态数据。
在网站上,顶部有几个链接,分别标有“1”、“2”、“3”和“下一步”。如果按下数字标记的链接,它会将一些数据动态加载到内容 div 中。如果按下“下一个”,它将转到标签为“4”、“5”、“6”、“下一个”的页面,并显示第 4 页的数据。
我想从内容 div 中为所有按下的链接抓取数据(我不知道有多少,它一次只显示 3 个和“下一个”)。
内容 div 中的数据在多个页面上统一布局(只是文本更改)。
我已经尝试捕获 ajax 请求,认为我可以获取一次原始请求,并且只需要更改像“pagenum”post 参数或加载新页面的东西,但事实证明他们用 asp 做了一些时髦的东西有一些非常长的十六进制字符串 post 参数,每个请求都会改变。我相信我最终可以让它发挥作用,但它会非常肮脏,如果最小的事情发生变化,它将毫无用处。
我的想法是我可以使用 selenium 之类的东西来单击超链接并为我加载页面,将内容 div 中的信息发回。问题是我不知道我需要按多少次“下一步”按钮,所以我不能编写脚本按 X 次。这是硒可以处理的事情吗?如果是这样,你能给我指一个关于使用 selenium 像这样刮擦的教程吗?因为我见过的大多数教程都集中在使用它进行测试(我知道这是它的预期目的)。
pdf - PubMed 文章的全文 PDF
在从事一个项目时,我需要下载和处理 PubMed 摘要的全文文章,是否有任何实现的代码或工具允许用户输入一组 PubMed id 并下载相同的免费全文文章。非常感谢任何类型的帮助或提示。
java - 用 Java 下载 Pubmed Abstracts
有没有人有一个程序的实现,可以下载带有标题、作者、日期和内容的已发布摘要,以在给定 MESH 术语的情况下分隔纯文本文件?
bioinformatics - PUBMED作者/文章数据库
我正在寻找一种从 pubmed 或任何其他来源下载作者和相关文章数据库的方法。我似乎无法在 ncbi FTP 站点上的任何地方找到它。
有谁知道是否有这样的数据库可用?
c# - 缓慢第一次调用 C# Web 服务
我正在尝试访问此处提供的 PubMed 网络服务:
http://www.ncbi.nlm.nih.gov/entrez/eutils/soap/v2.0/DOC/esoap_help.html
我用 Java 编写代码来访问 Web 服务,返回时间不到 1 秒。我用 C# 编写代码来访问相同的 Web 服务,初始调用的返回时间大约为 12 秒,然后所有后续调用的返回时间不到 1 秒。
我尝试以两种方式在 C# 中写入 Web 服务 - 都作为控制台应用程序。首先是标准的“右键单击引用并执行'添加服务引用'”,它将向 app.config 添加信息,您可以使调用变得轻松而轻松。第二个是使用 wsdl.exe 创建一个 dll 并尽可能“直接”访问 Web 服务(无向导)。两种方式都提供相同的结果。我将发布两个各自的代码片段。
1)(来自添加服务参考向导)
(在代码中)
2)(从命令行)
(将 dll 添加到控制台应用程序)
经过大量搜索,我发现您应该能够使用 sgen 来创建 XML 序列化器。我跑了:
这创建了一个 dll myProxyClassPubMed.XmlSerializers.dll,然后我将其添加为第二种连接类型中的引用。
我还弄乱了应用程序构建区域中的“生成序列化程序集”选项,但没有发现任何改进。
我想通过 ASP.NET 页面进行这些 Web 服务调用,因此第一次调用的十二秒返回时间是不可接受的。
我考虑过在 BioStar 上发布这个,但它的参与度不如这个论坛。如果在这里找不到答案,我可能会这样做。
有任何想法吗?
bioinformatics - 转换 pmc-id -> pmid
是否可以通过 ncbi api 将 pmc-ids (pubmed central ids) 转换为 pmids (pubmed ids)?你可以通过网络表单来做,但我想使用一个程序——当然我总是可以写一个屏幕刮板......谢谢
python - pyparsing 一种查询格式到另一种
我很茫然。我一直试图让这个工作好几天了。但是我对此无能为力,所以我想我会在这里咨询你们,看看是否有人能够帮助我!
我正在使用 pyparsing 试图将一种查询格式解析为另一种格式。这不是一个简单的转变,但实际上需要一些大脑:)
当前查询如下:
并且使用 pyparsing 我已经能够获得以下结构:
但现在,我不知所措。我需要将上述输出格式化为 lucene 搜索查询。以下是有关所需转换的简短示例:
但我被困在那里。我还需要能够使用特殊词 AND 和 OR。
所以最后的查询可能是:网格术语:“乳房肿瘤”和预防
谁能帮助我并给我一些关于如何解决这个问题的提示?任何形式的帮助将不胜感激。
由于我使用的是pyparsing,所以我很喜欢python。我已经粘贴了下面的代码,这样你就可以玩它而不必从 0 开始!
非常感谢你的帮忙!
mysql - 解析 PubMed XML 以提交到 mySQL 数据库 (XML::Twig)
我是 XML::Twig 的新手,我正在尝试解析 PubMed XML 2.0 最终摘要以放入 mySQL 数据库。我已经做到了这一点:
但是 Perl 似乎因为某种原因而停滞不前。我这样做对吗?我正在尝试使用 twig_roots 来减少解析量,因为我只对几个字段感兴趣(这些是大文件)。
以下是 XML 的示例:
谢谢!
python - 无法让 entrez 使用 biopython 返回网格项
快速提问——第一次使用 biopython,我只是想根据教程快速完成一些事情。
我似乎无法Entrez.efetch()
返回给定文章的网格术语,唯一的方法似乎是我正在做的事情,即:
其中 pmids 是pubmed ID的列表
这将返回以下内容:http: //pastie.org/5459700
我尝试根据http://www.ncbi.nlm.nih.gov/books/NBK25499/调整 rettype 和 retmode 参数,但没有成功。有什么明显的我失踪了吗?