问题标签 [pubchem]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 有人用过pubchemdb吗?有没有类似的API?
更新:答案中的链接既有趣又有用,但不幸的是没有解决对 java API 的需求,所以我仍然期待任何输入。
我正在建立一个化合物数据库。我需要所有同义词(IUPAC 和通用名称)以及每个同义词的安全数据。
我将使用 PubChem (http://pubchem.ncbi.nlm.nih.gov/) 上免费提供的数据
有一种简单的方法可以通过简单的 HTTP 获取来查询每个化合物。例如,要获取甘油数据,URL 是:
以下 URL 将返回一个易于解析的格式:
但它只会响应非常基本的信息,缺乏安全数据和几个常用名称。
有一个用于 JAVA 的公共领域 API,看起来非常完整,由 Scripps 的一个小组开发(引用)。代码在这里。
不幸的是,这个 API 没有很好的文档记录,并且由于所涉及的数据的复杂性而很难遵循。对于我收集的信息,pubchemdb 正在使用PubChem Power User Gateway (PUG) XML API
有没有人使用过这个 API(或任何其他可用的 API)?我将不胜感激有关如何开始使用它的简短描述或教程。
database - 如何将 Pubchem(NCBI) 提供的数据中提到的所有 IUPAC 名称提取到文本文件中?
我想从 Pubchem 数据库中提到的所有 IUPAC 名称中构建一定长度的前缀和后缀列表,这样我就可以在我的项目中进一步使用它们作为一个功能。所以我想要文本文件中的所有 IUPAC 化学名称或我可以提取这些列表的某种格式。
mysql - PubChem 数据库导入 mysql
我想下载pubchem 物质数据库并将所有信息放入 MySQL 数据库。这可能吗,如果可以,怎么办?
是否有自动更新数据库的脚本?
java - 如何使用 httpClient 在 Java 中过滤部分 xml 文件
我目前正在做一个项目,我必须从代谢物数据库 PubChem 请求数据。我正在使用 Apache 的 HttpClient。我正在执行以下操作:
问题是这段代码流式传输整个 XML 文件:
等等
我想要的是我可以请求,例如,PubChem ID,它将粘贴与该 ID 对应的值。我发现这可以使用本机 Java 方法完成,但我需要为此使用 HttpClient。使用本机 Java,可以这样完成:
(注:这段代码是用 Groovy 编写的,但经过一些调整后它也可以在 Java 中运行)
所以,如果有人可以帮助我,那就太好了:)
pubchem - 将 Pubchem 化合物数据库导入 Oracle
有谁知道将所有数据从 pubchem 复合数据库轻松导入到 oracle 数据库(11g)的方法?
我没有找到任何解决我的问题的解决方案
ruby - CAS注册表到R中的Pubchem cid标识符转换
许多化学家面临的一个恼人问题是将化合物的 CAS 登记号(存储在一些不易访问的商业数据库中)转换为 Pubchem 标识符(公开可用)。Pubchem 支持两者之间的转换,但只能通过他们的手动 Web 界面,而不是他们的官方 PUG REST 编程界面。
这里给出了一个基于电子实用程序接口的 Ruby 解决方案:http: //depth-first.com/articles/2007/09/13/hacking-pubchem-convert-cas-numbers-into-pubchem-cids-与红宝石/
有人知道这将如何转化为 R 吗?
编辑:根据下面的答案,最优雅的解决方案是:
干杯,汤姆
python - 从 PubChem FTP 数据生成分子的二维图像
与其爬取 PubChem 的网站,我更愿意从 PubChem ftp 站点本地生成图像:
ftp://ftp.ncbi.nih.gov/pubchem/specifications/
唯一的问题是我仅限于 OSX 和 Linux,而且我似乎无法找到一种以编程方式生成他们网站上的 2d 图像的方法。看这个例子:
https://pubchem.ncbi.nlm.nih.gov/compound/6#section=Top
在“2D 结构”标题下,我们有这张图片:
https://pubchem.ncbi.nlm.nih.gov/image/imgsrv.fcgi?cid=6&t=l
这就是我想要生成的。
json - R:解析从 Pubchem 导出的 JSON/XML 复合属性
我想使用 JSON(或 XML)导出工具解析 R 中 Pubchem 中给出的给定化合物的所有化学性质。
示例:ALPHA-IONONE,pubchem 化合物 ID 5282108
https://pubchem.ncbi.nlm.nih.gov/compound/5282108
或者
会给我一个嵌套列表树,但是我如何从这个相当复杂的嵌套列表列表到一个不错的数据框或数据框列表?
在这种情况下,我所追求的是一切
3.1 计算描述符
3.2 其他标识符
3.3 同义词
4.1 计算属性
在数据框的单行中,每个元素在单独的命名列中,每个元素(例如多个同义词)用“|”粘贴在一起 作为分隔符。例如,在这种情况下,类似
具有多个项目的字段,例如存款人提供的同义词可以用“|”粘贴在一起,例如值可以是 ALPHA-IONONE|Iraldeine|...
其次,我还想将第 4.2.2 节 Kovats Retention Index 作为数据框导入
(第 4.3.1 节 GC-MS 也不错,但由于它只显示 3 个顶峰,所以现在有点没用,所以我会跳过它)
有人知道如何以优雅的方式实现这一目标吗?
PS 请注意,对于任何给定的查询,并非所有这些字段都必须存在。
二维结构和一些性质也可以从
和 3D 结构
数据也可以导出为 XML,使用
https://pubchem.ncbi.nlm.nih.gov/rest/pug_view/data/compound/5282108/XML/?response_type=display
如果这会更容易
注意:也尝试使用 R package rpubchem
,但似乎只导入了少量可用信息:
java - 从 pubchem 中提取与单同位素质量匹配的 sdf 文件
我正在尝试以 sdf 格式从 pubchem 数据库中提取与某个精确质量匹配的化合物的化学结构,并且在该精确质量的 10ppm 范围内(精确质量-cmpndmass/精确质量)* 10 ^ 6。有没有办法使用与 pubchem 交互的 python 或 java 编程语言来实现这一点。
r - 看似简单的 rpubchem 交互功能会产生错误
以下 R 代码行以斜体显示错误。这似乎是一个 rpubchem 错误,除非我在做一些愚蠢的事情:
输出:
有人知道这里发生了什么吗?