在包含單獨原子的列表中轉動一串化學元素

Question

我正在嘗試從包含化學式的字符串創建一個列表，如下例所示：

structuralFormula1 = 'OCaOSeOO'

在列表中，我希望將所有化學原子彼此分開，如下所示：

structuralFormula1_list = ['O', 'Ca', 'O', 'Se', 'O', 'O']

我不知道如何開始解決這個問題。 任何提示將不勝感激：提前致謝:)

Answer 1

使用re.findall ：

>>> import re
>>> ex = 'OCaOSeOO'
>>> re.findall('[A-Z][a-z]?', ex)
['O', 'Ca', 'O', 'Se', 'O', 'O']

正則表達式解釋：

[AZ] : 匹配大寫字母
[az] : 匹配小寫字母
[AZ][az] : 匹配大寫字母后跟小寫字母
[AZ][az]? : 匹配大寫字母后跟 0 個或多個小寫字母

>>> import re
>>> ex = 'OCaOSeOO'
>>> re.findall('[A-Z]', ex)
['O', 'C', 'O', 'S', 'O', 'O']
>>> re.findall('[A-Z][a-z]', ex)
['Ca', 'Se']
>>> re.findall('[A-Z][a-z]?', ex)
['O', 'Ca', 'O', 'Se', 'O', 'O']
>>>

Answer 2

使用re.findall

import re
re.findall('.[^A-Z]*', 'OCaOSeOO')

Output：

['O', 'Ca', 'O', 'Se', 'O', 'O']

Answer 3

你可以用re.split來重新分割：

import re
structuralFormula1 = 'OCaOSeOO'
print(re.split(r'(?<!^)(?=[A-Z])', structuralFormula1))

它在每個 position 分裂

前面沒有字符串的開頭： (?<!^) => 這避免了前導空匹配
后跟一個大寫字母： (?=[AZ])

Output：

['O', 'Ca', 'O', 'Se', 'O', 'O']

在包含單獨原子的列表中轉動一串化學元素

問題描述

3 個解決方案

解決方案1
2 已采納 2021-11-26 10:43:48

解決方案2
1 2021-11-26 10:45:20

解決方案3
0 2021-11-26 10:42:33

在包含單獨原子的列表中轉動一串化學元素

問題描述

3 個解決方案

解決方案1 2 已采納 2021-11-26 10:43:48

解決方案2 1 2021-11-26 10:45:20

解決方案3 0 2021-11-26 10:42:33

解決方案1
2 已采納 2021-11-26 10:43:48

解決方案2
1 2021-11-26 10:45:20

解決方案3
0 2021-11-26 10:42:33