“pubmed”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

3736 浏览

html - 用硒刮

我想从网站上抓取一些动态数据。

在网站上，顶部有几个链接，分别标有“1”、“2”、“3”和“下一步”。如果按下数字标记的链接，它会将一些数据动态加载到内容 div 中。如果按下“下一个”，它将转到标签为“4”、“5”、“6”、“下一个”的页面，并显示第 4 页的数据。

我想从内容 div 中为所有按下的链接抓取数据（我不知道有多少，它一次只显示 3 个和“下一个”）。

内容 div 中的数据在多个页面上统一布局（只是文本更改）。

我已经尝试捕获 ajax 请求，认为我可以获取一次原始请求，并且只需要更改像“pagenum”post 参数或加载新页面的东西，但事实证明他们用 asp 做了一些时髦的东西有一些非常长的十六进制字符串 post 参数，每个请求都会改变。我相信我最终可以让它发挥作用，但它会非常肮脏，如果最小的事情发生变化，它将毫无用处。

我的想法是我可以使用 selenium 之类的东西来单击超链接并为我加载页面，将内容 div 中的信息发回。问题是我不知道我需要按多少次“下一步”按钮，所以我不能编写脚本按 X 次。这是硒可以处理的事情吗？如果是这样，你能给我指一个关于使用 selenium 像这样刮擦的教程吗？因为我见过的大多数教程都集中在使用它进行测试（我知道这是它的预期目的）。

2010-08-02T23:35:20.483

0 投票

2 回答

4553 浏览

pdf - PubMed 文章的全文 PDF

在从事一个项目时，我需要下载和处理 PubMed 摘要的全文文章，是否有任何实现的代码或工具允许用户输入一组 PubMed id 并下载相同的免费全文文章。非常感谢任何类型的帮助或提示。

pdf nlp text-mining pubmed

2011-01-14T16:20:52.727

0 投票

4 回答

3844 浏览

java - 用 Java 下载 Pubmed Abstracts

有没有人有一个程序的实现，可以下载带有标题、作者、日期和内容的已发布摘要，以在给定 MESH 术语的情况下分隔纯文本文件？

java pubmed

2011-03-23T18:53:42.127

0 投票

1 回答

339 浏览

bioinformatics - PUBMED作者/文章数据库

我正在寻找一种从 pubmed 或任何其他来源下载作者和相关文章数据库的方法。我似乎无法在 ncbi FTP 站点上的任何地方找到它。

有谁知道是否有这样的数据库可用？

bioinformatics pubmed

2011-07-28T17:54:12.537

0 投票

1 回答

94 浏览

url - 将页码传递给 Pubmed

我正在开展一个从 pubmed 检索记录的项目，并且运行良好，我遇到的问题是我需要通过 url 精确地从 pubmed 中检索与某个术语相对应的页码。

网址：http ://www.ncbi.nlm.nih.gov/pubmed/?term= heart 如果我想检索接下来的 20 条记录，将返回前 20 条记录，我该怎么办？

我不能在网址中精确检索哪个页面吗？？？

即，http: //www.ncbi.nlm.nih.gov/pubmed/?term=heart&page=2 // 或类似的东西！

请帮忙！

url search parameters pubmed

2011-09-07T08:53:32.033

0 投票

1 回答

1616 浏览

c# - 缓慢第一次调用 C# Web 服务

我正在尝试访问此处提供的 PubMed 网络服务：

http://www.ncbi.nlm.nih.gov/entrez/eutils/soap/v2.0/DOC/esoap_help.html

我用 Java 编写代码来访问 Web 服务，返回时间不到 1 秒。我用 C# 编写代码来访问相同的 Web 服务，初始调用的返回时间大约为 12 秒，然后所有后续调用的返回时间不到 1 秒。

我尝试以两种方式在 C# 中写入 Web 服务 - 都作为控制台应用程序。首先是标准的“右键单击引用并执行'添加服务引用'”，它将向 app.config 添加信息，您可以使调用变得轻松而轻松。第二个是使用 wsdl.exe 创建一个 dll 并尽可能“直接”访问 Web 服务（无向导）。两种方式都提供相同的结果。我将发布两个各自的代码片段。

1)（来自添加服务参考向导）

（在代码中）

2）（从命令行）

（将 dll 添加到控制台应用程序）

经过大量搜索，我发现您应该能够使用 sgen 来创建 XML 序列化器。我跑了：

这创建了一个 dll myProxyClassPubMed.XmlSerializers.dll，然后我将其添加为第二种连接类型中的引用。

我还弄乱了应用程序构建区域中的“生成序列化程序集”选项，但没有发现任何改进。

我想通过 ASP.NET 页面进行这些 Web 服务调用，因此第一次调用的十二秒返回时间是不可接受的。

我考虑过在 BioStar 上发布这个，但它的参与度不如这个论坛。如果在这里找不到答案，我可能会这样做。

有任何想法吗？

c#web-services serialization pubmed

2012-01-23T16:29:05.387

0 投票

1 回答

777 浏览

bioinformatics - 转换 pmc-id -> pmid

是否可以通过 ncbi api 将 pmc-ids (pubmed central ids) 转换为 pmids (pubmed ids)？你可以通过网络表单来做，但我想使用一个程序——当然我总是可以写一个屏幕刮板......谢谢

bioinformatics ncbi pubmed

2012-02-10T14:18:10.483

0 投票

1 回答

496 浏览

python - pyparsing 一种查询格式到另一种

我很茫然。我一直试图让这个工作好几天了。但是我对此无能为力，所以我想我会在这里咨询你们，看看是否有人能够帮助我！

我正在使用 pyparsing 试图将一种查询格式解析为另一种格式。这不是一个简单的转变，但实际上需要一些大脑:)

当前查询如下：

并且使用 pyparsing 我已经能够获得以下结构：

但现在，我不知所措。我需要将上述输出格式化为 lucene 搜索查询。以下是有关所需转换的简短示例：

但我被困在那里。我还需要能够使用特殊词 AND 和 OR。

所以最后的查询可能是：网格术语：“乳房肿瘤”和预防

谁能帮助我并给我一些关于如何解决这个问题的提示？任何形式的帮助将不胜感激。

由于我使用的是pyparsing，所以我很喜欢python。我已经粘贴了下面的代码，这样你就可以玩它而不必从 0 开始！

非常感谢你的帮忙！

python lucene pyparsing pubmed

2012-04-11T20:14:13.723

0 投票

2 回答

1202 浏览

mysql - 解析 PubMed XML 以提交到 mySQL 数据库 (XML::Twig)

我是 XML::Twig 的新手，我正在尝试解析 PubMed XML 2.0 最终摘要以放入 mySQL 数据库。我已经做到了这一点：

但是 Perl 似乎因为某种原因而停滞不前。我这样做对吗？我正在尝试使用 twig_roots 来减少解析量，因为我只对几个字段感兴趣（这些是大文件）。

以下是 XML 的示例：

谢谢！

mysql perl xml-parsing xml-twig pubmed

2012-05-31T16:27:36.133

0 投票

2 回答

1550 浏览

python - 无法让 entrez 使用 biopython 返回网格项

快速提问——第一次使用 biopython，我只是想根据教程快速完成一些事情。

我似乎无法Entrez.efetch()返回给定文章的网格术语，唯一的方法似乎是我正在做的事情，即：

其中 pmids 是pubmed ID的列表

这将返回以下内容：http: //pastie.org/5459700

我尝试根据http://www.ncbi.nlm.nih.gov/books/NBK25499/调整 rettype 和 retmode 参数，但没有成功。有什么明显的我失踪了吗？

python biopython pubmed

2012-11-30T19:57:34.753

问题标签 [pubmed]

Reference