问题标签 [chemistry]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
146 浏览

python - 用正则表达式隔离字母后的第一个数字

我正在尝试解析以 unicode 格式提供给我的化学式C7H19N3

我希望隔离字母后第一个数字的位置,即7在索引 1 处并且1在索引 3 处。这是我想在数字前面插入“子”

我的第一次尝试让我循环尝试仅隔离第一个数字的位置,但无济于事。

我认为正则表达式可以做到这一点,虽然我很迷茫。

我的最终目标是输出公式Csub7Hsub19Nsub3,以便我的文本编辑器可以正确格式化它。

0 投票
2 回答
140 浏览

sparql - DBPedia 查询缺少某些化合物

我正在运行此查询以从DBPedia 公共 SPARQL 端点获取所有化合物的列表。

我正在使用offset参数分批下载 50000 个(2 个文件)。

不知何故,即使页面存在于

它具有我正在寻找的属性?

0 投票
3 回答
1790 浏览

python - 蛋白质结构和网格的蒙特卡罗模拟

我正在处理蛋白质结构的蒙特卡洛模拟脚本。在蒙特卡洛脚本编写之前,我从未做过。我将大规模扩展该计划。根据蛋白质 xyz 坐标,我必须定义盒子大小。这个盒子将被分成大小为 0.5 A 的网格。根据距离和角度标准,我必须根据玻尔兹曼概率分布分配点。

3-D 框中的蛋白质结构,显示网格

我的程序应该通过 0.5 A 的网格在每个方向上移动并生成随机点并检查距离和角度的情况。如果满足放置点的条件,则根据玻尔兹曼概率分布丢弃该点。

这是我生成随机点的代码

我完全震惊于从蛋白质结构的 xyz 坐标生成盒子大小以及如何定义大小为 0.5 的网格。如何检查框中的每个点。
任何帮助都将是可观的。

0 投票
1 回答
997 浏览

r - 计算 R 中一组化合物的多样性指数(相异指数)

我想计算给定矩阵的多样性指数。

我有一个数据集矩阵(xmatrix.RData),它是一个 986 * 881 矩阵,表示 986 个化合物和 881 个指纹描述符。

计算多样性指数的公式在:
http ://r.789695.n4.nabble.com/file/n4677766/Diversity_Index_Formula.pdf

0 投票
1 回答
6897 浏览

math - 用已知比重将磅转换为加仑

我在一个做液体储存的终端工作。我需要编写一个可以计算出磅和加仑的计算器。

对于卡车,他们会在满载时进入秤进行称重,清空液体,然后再回到空的秤上。该秤以磅为单位。NET 是来自卡车的液体量。

两个问题:

Q1) -----

如果液体是 2-乙基己醇,知道如何将其转换为加仑:

a) 45000 磅产品(净重) b) 比重为 0.833 (20 °C) c) 水的重量 8.3378 每加仑

计算结果是 8.3378*.833 = 6.9453817 磅/加仑吗?是这样,那我只是简单地乘以 45000*6.9453817 来得到加仑吗?

Q2) --------

在我计算出加仑数之后。然后我需要弄清楚如何做体积校正因子。例如,在 72 华氏度时,它需要多少加仑的体积?使用上面的示例在 60 度时,它需要 6.945 加仑。我应该倍增 6.945*VCF。获得 VCF 的公式是什么?

0 投票
1 回答
860 浏览

r - 将与给定 CAS 编号相关的数据从 NIST webbook 网站导入 R

我想使用提供的 API 从 R 中的 NIST webbook 网站检索与给定 CAS 注册号(Chemical Abstracts Service nr)相关的信息。

例如对于 cas nr。“19431-79-9”(Caryophylladienol II), http: //webbook.nist.gov/cgi/cbook.cgi?ID=19431-79-9&Units=SI&Mask=2000#Gas-Chrom 我得到了

然后,我想从原始输出的以下位中提取以下变量和列表:

关于如何最好地进行后一种解析的任何想法?理想情况下,这应该全部封装到一个函数中,该函数将 CAS nrs 列表作为输入,使用 NIST webbook 中的信息对其进行注释,并将它们写入文本文件。但没必要把它弄得如此完美——任何能让我开始的事情都会有帮助!

编辑:我一直在尝试使用 XML 包中的 htmlTreeParse 解析 html 文件,但我不太成功。任何对该功能有更多经验的人都可以帮助我吗?

编辑:我已经找到了在 Mathematica 中导入数据的解决方案,请参阅https://mathematica.stackexchange.com/questions/37091/look-up-info-associated-with-a-given-cas-chemical-identifier-来自-the-nist-webbo。如果有人有能力将该代码移植到 R,请告诉我!

0 投票
1 回答
1260 浏览

excel - 在 Excel 中使用 VBA 宏从 NCI 化学标识符解析器中检索化学结构的图像

根据本网站给出的代码(见下文),我想调整一些 VBA Excel 宏,以使用http://cactus.nci.nih.gov/chemical上的 NCI 化学标识符解析器将化学名称转换为 Excel 中的化学结构/结构体

特别是,我想扩展代码以具有一个附加函数来返回结构的图像(GIF),应该从中检索结构的图像

然后应将其保存在调用公式的位置的 Excel 工作表中(可能还调整行的大小以适合返回的图像)。有没有想过如何做到这一点?

任何建议将不胜感激!

干杯,汤姆

0 投票
2 回答
877 浏览

python - 从 pdb 文件中获取残留物的属性

我有一个 pdb 文件,我想使用 python 解析 pdb,我想在 pdb 中找到以下残基:

我试过使用 pybel

但是,我只能看到几个属性。

如何从 pdb 中找到这 3 个属性?我可以使用 python 中可用的任何模块来获取这些属性。

0 投票
0 回答
213 浏览

arrays - 最速下降算法的问题

我正在尝试编写一个程序,使用最速下降算法最小化二维 400 原子系统的总能量。我的程序的总体思路如下:

  1. 获取原子坐标 (x, y)
  2. 随机选择一个原子
  3. 计算作用在该原子上的力的 x 和 y 分量
  4. 计算 x 和 y 位置的变化,dx 和 dy
  5. 生成新坐标(x+dx, y+dy)并更新数组
  6. 重复步骤 2-5,直到每个原子上的力变为 ~0

由于原子 210 上的初始力的大小很大,因此它是系统接近收敛的良好标志。我还没有修复代码,以便在力在某个容差范围内时停止迭代。话虽如此,我的代码在原子 210 上打印了力的 x 分量,以便我可以查看力是否趋于 0。

当我运行我的代码时,坐标数组似乎没有更新(上面的第 5 步)。我不确定是在这个网站还是物理网站上发布我的问题,但是,我相信我的问题涉及在 Fortran 77 中更新数组的一些技术性。如果这超出了本网站的范围,我很抱歉。我只是不知道该转向哪里。感谢大家提供的任何帮助。如果我的注释不清楚或者是否有人需要更多信息,请告诉我。这是代码。

0 投票
2 回答
288 浏览

r - 从R中的.sdf文件中提取唯一字段的正则表达式

我正在寻找 R 中的正则表达式来提取 .sdf 化学数据文件中给出的字段。在这种情况下,字段由 < > 分隔,并在行首跟在“>”之后。例如,在

它必须返回

(它们可能会出现多次,所以我只需要unique()那些)有什么想法吗?

干杯,汤姆