2

更新:答案中的链接既有趣又有用,但不幸的是没有解决对 java API 的需求,所以我仍然期待任何输入。

我正在建立一个化合物数据库。我需要所有同义词(IUPAC 和通用名称)以及每个同义词的安全数据。
我将使用 PubChem (http://pubchem.ncbi.nlm.nih.gov/) 上免费提供的数据

有一种简单的方法可以通过简单的 HTTP 获取来查询每个化合物。例如,要获取甘油数据,URL 是:

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753

以下 URL 将返回一个易于解析的格式:

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753&disopt=DisplaySDF

但它只会响应非常基本的信息,缺乏安全数据和几个常用名称。

有一个用于 JAVA 的公共领域 API,看起来非常完整,由 Scripps 的一个小组开发(引用)。代码在这里

不幸的是,这个 API 没有很好的文档记录,并且由于所涉及的数据的复杂性而很难遵循。对于我收集的信息,pubchemdb 正在使用PubChem Power User Gateway (PUG) XML API

有没有人使用过这个 API(或任何其他可用的 API)?我将不胜感激有关如何开始使用它的简短描述或教程。

4

1 回答 1

2

Cactvs化学信息学工具包(免费供学术/教育使用)具有完整的 PubChem 集成。使用脚本环境,您可以轻松地执行类似的操作

cactvs>ens 创建 753

ens0

cactvs>ens 获取 ens0 E_NAMESET

丙烷-1,2,3-三醇甘油 8043-29-6 29796-42-7 30049-52-6 37228-54-9 75398-78-6 78630-16-7 8013-25-0 175385-78-1 25618-55-7 64333-26-2 56-81-5 {Tegin M} LS-1377 G8773_SIGMA 15523_RIEDEL {Glycerin, natural} NCGC00090950-03 191612_ALDRICH 15524_RIEDEL {Glycerol solution} L-glycerol 49767_FLUKA {Biodiesel impurity} 49770_FLUKA 49771_FLUKA NCGC00090950- 01 49927_FLUKA Glycerol-Gelatine G7757_SIAL GOL D-glycerol G9012_SIAL {Polyhydric alcohols} c0066 MOON {NSC 9230} G2025_SIGMA ZINC00895048 49781_FLUKA {Concentrated glycerin} {Concentrated glycerin (JP15)} D00028 {Glycerin (JP15/USP)} 44892U_SUPELCO {Glycerin, concentrated ( JAN)} CRY 49782_FLUKA NCGC00090950-02 G6279_SIAL W252506_ALDRICH G7893_SIAL {甘油,浓缩} 33224_RIEDEL Bulbold Cristal G9281_SIGMA Glycerol-1,2,3-3H G1901_SIGMA G7043_SIGMA 1,2,2,三羟基丙烷3-三羟基丙醇甘油 G2289_SIAL G9406_SIGMA {Glycerol-[2-3H]} CHEBI:17754 Glyzerin Oelsuess InChI=1/C3H8O3/c4-1-3(6)2-5/h3-6H,1-2H {90 工业甘油} Dagralax {甘油,无水} {甘油,合成} Glycerine Glyceritol {Glycyl alcohol} Glyrol Glysanin NSC9230 Ophthalgan Osmoglyn Propanetriol {Synthetic glycerin} {Synthetic glycerine} Trihydroxypropane Vitrosupos {WLN: Q1YQ1Q} Glycerol-1,3-14C {4-01- 00-02751(Beilstein 手册参考)} AI3-00091 {BRN 0635685} {CCRIS 2295} {Caswell No. 469} {Citifluor AF 2} {Clyzerin, wasserfrei [德语]} {EINECS 200-289-5} {EPA Pesticide化学代码 063507} {FEMA No. 2525} {Glicerina [DCIT]} {Glicerol [INN-Spanish]} {甘油(雾)} {甘油 [JAN]} {甘油雾} {甘油雾} Glycerinum {Glycerolum [INN-拉丁语]} Grocolene {HSDB 492} IFP {合并因子} 1,2,3-丙三醇 C00116 Optim {丙三醇 (VAN)} {1,2,3-丙三醇,均聚物} {甘油聚合物} {甘油,聚合物} {HL 80} {PGL 300} {PGL 500} {PGL 700} 聚甘油 聚甘油 聚甘油{Unigly G 2} {Unigly G 6} G5516_SIGMA MolMap_000024

仙人掌>

这隐藏了所有 PUG 的丑陋 - 但无论如何,我敢说 PUG据可查。该工具包远远超出了简单的数据下载 - 如果您愿意,您甚至可以像本地 SD 文件一样打开和查询 PubChem。

不过,PubChem 不包含安全数据。并且安全数据取决于国家/地区,受到严格监管,您应该非常小心,不要承担责任。让法律人员检查您的方法!

于 2011-05-10T16:44:45.617 回答