cost 87 ms
分组 dataframe 并使用 Python/Dask/multiprocessing 以并行方式对结果矩阵执行操作? - Grouping a dataframe and performing operations on the resulting matrix in a parallelized manner using Python/Dask/multiprocessing?

我正在做一个项目,我需要根据分子的 ID 对数据库中的分子进行分组,并对生成的矩阵执行操作。 我正在使用 Python,我想通过并行处理来提高性能。 我目前正在从 SDF 文件加载分子并将它们存储在 Pandas dataframe 中。每个分子都有一个 ID、一个唯一的 Pose ID 和一个唯 ...

RDKit:Atom 索引到 *.mol 文件 - RDKit: Atom Indices to *.mol file

问题:如何将原子索引转换为mol文件? 目标:将原子之间的最短路径转换为 mol 文件。 我有一个初始 mol 文件,正在使用 RDKit 对其进行分析。 我正在使用它们的索引获得两个原子之间的最短路径。 图中显示了示例,其中突出显示了最短路径。 来自 RDKit 的特定函数: GetShortes ...

如何更改 SMILES 格式中虚拟原子的表示 - How to change representation of dummy atoms in SMILES format

您好,我想执行使用微笑代码对相同分子结构进行分组的任务。 然而,即使具有相同的结构,也很难将它们分组,因为虚拟原子的表示方式不同。 我正在使用 RDKIT 程序,我已经尝试更改几个选项但还没有找到解决方案。 我想请求你的帮助。 (rdkit 版本 2022.3.4) 微笑示例:(结构相同但微笑代码 ...

如何通过与另一列字符串进行比较来对具有真值和假值的一列字符串进行分类 - How can I classify a column of strings with true and false values by comparing with another column of strings

所以我有一列列为“化合物”的字符串作文(栏目标题) ZrMo3 Gd(CuS)3 Ba2DyInTe5 我还有另一列包含元素周期表中的字符串金属元素,我将该列称为“金属” 元素(列标题) 李是钠目的是检查“化合物”中的每个字符串与“金属”中列出的每个字符串,如果存在任何来自金属的字符串,那么它 ...

使用 IDNUMBER 从 SDF 文件中提取复合数据并写入新文件 - Extract compound data from SDF file using IDNUMBER and write to a new file

我对 awk 还是很陌生,并且一直在尝试使用 bash 脚本和 awk 根据单独的文本文件中的代码列表过滤文件。 虽然周围有一些类似的问题,但我一直无法调整它们的实现。 我的第一个文件idnumber.txt如下所示: 我试图从中过滤分子块的文件具有如下条目: 该文件以这种方式重复,以-ISIS- ...

给定 2 个字符串(DNA 序列),它会返回一个布尔值,以显示 str1 中是否存在与 str2 的片段配对的长度 >=5 的连续子片段 - Given 2 strings, (DNA sequences), it retrns a bool to show if a contigus sub-fragm of length >=5 exists in str1 that pairs to a fragment of str2

给定 2 个字符串,每个字符串都包含一个 DNA 序列,function 返回一个布尔值,以显示 string1 中是否存在长度为 5 或以上的连续子片段,该子片段可以与 str2 的片段配对。 这是我尝试使用我创建的函数“complement”和“reverese_complement”但它没有给 ...

用于化学的 NetworkX:如何检查较小的分子图 A 是否是较大分子图 B 的有效子图? - NetworkX for chemistry: how to check if a smaller molecular graph A is a valid subgraph of a larger molecular graph B?

我试图通过 Python 使用图论来验证分子片段是否是较大分子的有效子结构。 让我们看一个神经递质血清素的例子: 在这种情况下,我们正在处理血清素,上面的代码可能会将 plot 转换为如下分子图(请注意,我们使用的符号会自动忽略氢原子): 代码中考虑的 4 个分子片段也可以绘制成图形,如下所示: ...

用于辅助技术的表示化学键的标记 - Marking signs denoting chemical bonds for assistive technologies

我有时在文本中有不同的化学公式,而像 H 2 SO 4这样的公式没有问题(因为没有视力障碍的人和使用屏幕阅读器的人都以相同的方式阅读它),问题开始于常规化学公式使用屏幕阅读器无法正确读取的一些符号(不,我无法避免使用这些符号,我不能使用带有替代文本等的图像)。 例子: H 2 C=CH 2 — 等 ...

使用 RDKit 查找分子亚结构的相对 position - Finding the relative position of molecular substructures with RDKit

我有一组脂肪酸分子(SMILES 格式),我想在其中找到 C=C 双键的位置。 Position 含义:计算双键距离第一个碳(羧基的碳)有多少个碳。 例如,对于下面的分子,答案是 5 和 7。(图中的数字表示 RDKit 原子索引) 通过直接在微笑字符串上进行简单的正则表达式搜索,解决方案就足 ...


 
粤ICP备18138465号  © 2020-2023 STACKOOM.COM