问题标签 [cheminformatics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
631 浏览

python - 如何使用 ChemDraw/Python 从 InChI 创建 .cdx 文件?

我想用 Python 从 InChI 创建一个 ChemDraw .cdx 文件。这个答案给出了一个解决方案cdx --> InChI

下面的最小示例cdx_to_inchi工作正常,但我不知道如何inchi_to_cdx开始工作。

0 投票
1 回答
187 浏览

bioinformatics - 我可以仅使用 PDB 文件进行 PCA(在 python3.x 中使用 MDAnalysis)吗?

我可能有比代码相关的更多技术问题。我尝试仅使用 PDB 文件执行 PCA(使用 MDAnalysis 包)——这个 pdb 文件包含 100 个对齐的结构(当然,它们是相同的——这意味着相同类型和数量的原子;它是在 PyMol 中完成的)。

我使用我之前制作的带有标准轨迹的 PCA 代码,但它返回错误“ No covariance information can be collect from asingle track frame ”。

因此,我的假设是 PCA 不能仅使用 PDB 文件完成,或者可以,但我没有正确的 pdb 输入。我想知道是否有人曾经尝试过这样的事情或者对 MDAnalysis 有很好的经验并且可以给我任何建议(我是计算化学的新手)。

我认为,代码并不是那么需要,但是我附上它:

0 投票
2 回答
1080 浏览

python - 如何使用 Python 从 Excel 表中提取 OLE 对象?

我想使用 Python 将 OLE 对象从 Excel 表中提取到 Windows 剪贴板中。

这篇文章没有进一步帮助,因为它是针对 VBA 的。而这篇文章仍然没有得到答复。

假设给定的 Excel 表(带有 ChemDraw 或 ChemSketch OLE 对象):

在此处输入图像描述

有一些 Python 模块可以处理 Excel 文件,openpyxl例如xlrd. 该模块win32clipboard可以将数据放入剪贴板。

我的问题:

  1. 我看不到如何将嵌入的 OLE 对象放入剪贴板。大概,openpyxlxlrd在一起win32clipboard不适合这个?
  2. 有一个 Python 模块oletools可能可以做到,但我不明白它是如何工作的。 https://pypi.org/project/oletools/

从这个页面:

oleobj:从 OLE 文件中提取嵌入对象。

这似乎正是我正在寻找的,但是,我找不到任何 MCVE。而且不幸的是,文档oleobj基本上简化为:“阅读源代码并找出自己”。我将不胜感激提示和帮助。

到目前为止我的代码:

0 投票
2 回答
3007 浏览

rdkit - RDKit:如何检查分子是否完全匹配?

我正在使用 RDKit 并尝试检查分子是否完全匹配。使用Chem.MolFromSmiles()表达式后m == p显然不会导致预期的结果。当然,我可以检查是否p是 的子结构m以及是否m是 的子结构p。但对我来说,这看起来太复杂了。我在 RDKit 文档中找不到或忽略了完全匹配的代码示例。我该如何正确地做到这一点?谢谢你的提示。

代码:

0 投票
1 回答
57 浏览

bioinformatics - 生物模型的实现

我需要使用 biopython 或任何合适的编程语言来实现生物学模型(它应用了活细胞中细胞器的功能)。我是这个领域的初学者。

什么是适合这个问题的编程语言?谁能帮我 ?我该如何开始?

0 投票
1 回答
300 浏览

python - 生成小配体的构象异构体但保留正确的芳香性

我正在尝试为许多小分子配体生成构象异构体,以最终与之对接。我使用 RDkit 的EmbedMultipleConfs函数生成了conformers。然而,当随后目视检查 PyMol 中的构象异构体时,我注意到 RDKit 没有为芳香部分保留正确的角度。例如,在一个带有苯基的配体中,它没有保持该基团的平面性,而是将随机角度分配给该苯基,就好像它是环己烷一样。

仅加载分子时,芳香性似乎没有问题。

有没有办法来解决这个问题?

在此处输入图像描述

生成conformers的部分代码:

0 投票
2 回答
2996 浏览

python - 使用 rdkit 或其他 python 模块将 SMILES 转换为化学名称或 IUPAC 名称

有没有办法使用 RDKit 或其他 python 模块将 SMILES 转换为化学名称或 IUPAC 名称?

我在其他帖子中找不到非常有用的东西。

非常感谢!

0 投票
2 回答
115 浏览

python - 选择将线绘制在图形的“边缘”上(并循环),而不是跨过图形

所以,我有一个键的二面角图。y 轴仅从 0 到 360,x 轴是帧(想想时间步长)。如果值高于 360,我需要绘图“循环”回零,并绘制两点之间的最短距离(如果需要越过图形的边缘并“循环”返回而不是穿过图形)。
两个地块:d5 和 d3

d3 的图看起来不错,但实际上需要跳过图的边缘而不是越过它。

d5 的情节有一个严重的问题,对于一个小的旋转有一个巨大的跳跃只是因为它恰好在零度以下。

我希望这两个图都朝向底部(朝向零)绘制并重新出现在图的顶部,从而有效地选择数据点之间的最短距离。我不希望涉及翻译绘图以删除这些伪影的解决方案(它有效,我已经做到了,但是您会丢失有关角度真实值的信息)。可以绘制“低于零”的解决方案(因此 y 轴从 300 到 360|0 到 200 到 300)也很棒。使用其他库的解决方案非常好。如果需要,我可以提供数据集。

我想要它做的例子(绿线) 我想要它做的例子(绿线)

我试图找到类似的解决方案无济于事。关于周期性边界的问题使用 numpy 数据集掩码来隐藏某些跳跃,但它们具有连续的功能(我的是“跳跃”)。

谢谢你的帮助,我真的很感激。

数据集(使它们比图表上的小一点,只保留跳过):

D3:

最小工作示例:

0 投票
3 回答
1346 浏览

font-size - RDKit:如何更改原子标签字体大小?

使用 RDKit 绘制结构时,原子标签字体大小和环大小没有很好的比例。标签太小或太大或未对齐。

不幸的是,有关这方面的文档很少。我发现了这个: https ://rdkit.org/docs/source/rdkit.Chem.Draw.MolDrawing.html 但我不知道这是否相关以及我将如何将它们放在一起。我缺少简单实用的代码示例。

我也尝试过Draw.MolToQPixmap,但是我经历了原子标签未对齐的情况,到目前为止,我了解到原因是难以使这个跨平台保持一致并且Draw.MolToPixmap使用旧的绘图代码。我应该使用 egDraw.MolToImage代替。但是有类似Draw.MolToFile的字体大小简直太小了。我不确定这是否也是一个跨平台问题(我在 Win10 上)。因此,解决方案是简单地设置字体大小,但是如何设置呢?

我知道有一个 RDKit 邮件列表,到目前为止我已经问过这个问题而没有答案。在 SO 上,可能有更广泛的受众,我可以附上图片进行说明。

代码:

结果:(使用Draw.MolToFile,对齐没问题,但原子标签太小)

在此处输入图像描述

结果:(对于小图片,使用Draw.MolToQPixmap、未对齐和/或字体太大)

在此处输入图像描述

在此处输入图像描述

编辑:(在@Oliver Scott 的建议下)

我用相同的字体大小得到了 3 倍的相同输出。我一定是某个地方的愚蠢错误或误解。

代码:

结果:

在此处输入图像描述

0 投票
1 回答
41 浏览

r - 正态分布总体,在 R 中计算出现负读数或零读数的概率

在 R 中,您如何计算出现负读数或零读数的概率?μ 和 σ 给出。