将字符串从 pandas dataframe 转换为列表 - python

Question

我有一个 pandas dataframe 它也有一个列结构：

  sequences
-------------
[(1838, 2038)]
[]
[]
[(809, 1090)]

我需要逐行循环，所以我也构建了循环：

for index, row in df.iterrows():
    true_anom_seq = json.loads(row['sequences'])

我想做的是创建一个像[[1838, 2038], [], [], [809, 1090]]这样的嵌套循环，这样我就可以遍历它。 问题是我写的代码给了我错误：

JSONDecodeError: Expecting value: line 1 column 2 (char 1)

我还尝试打印row['sequences'][0]并且它给了我[ ，所以它将它作为字符串读取。

如何将此字符串转换为列表？

Answer 1

使用 ast.literal_eval 将字符串转换为 list/dict/...：

from ast import literal_eval

>>> literal_eval('[1,2,3]')
[1,2,3]

Answer 2

import pandas as pd
import re
col = {'index': [1,2,3,4], 'sequence':['[(1838, 2038)]', '[]', '[]', '[(809, 1090)]']}
new_sequence = []
new_df = pd.DataFrame(col)
for index, row in new_df.iterrows():
    one_item = []
    true_anom_seq = re.findall(r'\d+', row['sequence'])
    for match in true_anom_seq:
        one_item.append(match)
    new_sequence.append(one_item)
print(new_sequence)

Answer 3

无需遍历 dataframe 本身，也无需使用正则表达式。 只需将 literal_eval function 应用于sequence列中的每一行并将其包装为列表：

from ast import literal_eval
import pandas as pd

col = {'index': [1,2,3,4], 'sequence':['[(1838, 2038)]', '[]', '[]', '[(809, 1090)]']}
new_sequence = []
new_df = pd.DataFrame(col)

list(new_df.sequence.apply(literal_eval))
[[(1838, 2038)], [], [], [(809, 1090)]]

将字符串从 pandas dataframe 转换为列表 - python

问题描述

3 个解决方案

解决方案1
1 2022-01-14 15:39:52

解决方案2
1 已采纳 2022-01-14 15:43:28

解决方案3
1 2022-01-14 18:10:08

将字符串从 pandas dataframe 转换为列表 - python

问题描述

3 个解决方案

解决方案1 1 2022-01-14 15:39:52

解决方案2 1 已采纳 2022-01-14 15:43:28

解决方案3 1 2022-01-14 18:10:08

解决方案1
1 2022-01-14 15:39:52

解决方案2
1 已采纳 2022-01-14 15:43:28

解决方案3
1 2022-01-14 18:10:08