在包含单独原子的列表中转动一串化学元素

Question

我正在尝试从包含化学式的字符串创建一个列表，如下例所示：

structuralFormula1 = 'OCaOSeOO'

在列表中，我希望将所有化学原子彼此分开，如下所示：

structuralFormula1_list = ['O', 'Ca', 'O', 'Se', 'O', 'O']

我不知道如何开始解决这个问题。 任何提示将不胜感激：提前致谢:)

Answer 1

使用re.findall ：

>>> import re
>>> ex = 'OCaOSeOO'
>>> re.findall('[A-Z][a-z]?', ex)
['O', 'Ca', 'O', 'Se', 'O', 'O']

正则表达式解释：

[AZ] : 匹配大写字母
[az] : 匹配小写字母
[AZ][az] : 匹配大写字母后跟小写字母
[AZ][az]? : 匹配大写字母后跟 0 个或多个小写字母

>>> import re
>>> ex = 'OCaOSeOO'
>>> re.findall('[A-Z]', ex)
['O', 'C', 'O', 'S', 'O', 'O']
>>> re.findall('[A-Z][a-z]', ex)
['Ca', 'Se']
>>> re.findall('[A-Z][a-z]?', ex)
['O', 'Ca', 'O', 'Se', 'O', 'O']
>>>

Answer 2

使用re.findall

import re
re.findall('.[^A-Z]*', 'OCaOSeOO')

Output：

['O', 'Ca', 'O', 'Se', 'O', 'O']

Answer 3

你可以用re.split来重新分割：

import re
structuralFormula1 = 'OCaOSeOO'
print(re.split(r'(?<!^)(?=[A-Z])', structuralFormula1))

它在每个 position 分裂

前面没有字符串的开头： (?<!^) => 这避免了前导空匹配
后跟一个大写字母： (?=[AZ])

Output：

['O', 'Ca', 'O', 'Se', 'O', 'O']

在包含单独原子的列表中转动一串化学元素

问题描述

3 个解决方案

解决方案1
2 已采纳 2021-11-26 10:43:48

解决方案2
1 2021-11-26 10:45:20

解决方案3
0 2021-11-26 10:42:33

在包含单独原子的列表中转动一串化学元素

问题描述

3 个解决方案

解决方案1 2 已采纳 2021-11-26 10:43:48

解决方案2 1 2021-11-26 10:45:20

解决方案3 0 2021-11-26 10:42:33

解决方案1
2 已采纳 2021-11-26 10:43:48

解决方案2
1 2021-11-26 10:45:20

解决方案3
0 2021-11-26 10:42:33