从 DataFrame 列中提取字符串数据以分隔列

Question

我有一个如下所示的数据框列：

df['out_column']

0         Out 0: 0.024 Out 1: 0.005 
1         Out 0: 0.024 Out 1: 0.009 
2         Out 0: 0.024 Out 1: 0.009 
3         Out 0: 0.024 Out 1: 0.01 
4         Out 0: 0.024 Out 1: 0.011           
5         Out 0: 0.017 Out 1: 0.018 
6         Out 0: 0.146 Out 1: 0.081 
7         Out 0: 0.001 Out 1: 0.002 
8         Out 0: 0.022 Out 1: 0.009 
9         Out 0: 0.012 Out 1: 0.008

如何将该列上的数据分开以创建到具有Out 0:和Out 1:前面的值的其他列？ 预期结果是：

          col1   col2
0         0.024  0.005 
1         0.024  0.009 
2         0.024  0.009 
3         0.024  0.01 
4         0.024  0.011           
5         0.017  0.018 
6         0.146  0.081 
7         0.001  0.002 
8         0.022  0.009 
9         0.012  0.008

Answer 1

您可以使用extractall ：

df[['col1', 'col2']] = df['out_column'].str.extractall(
    pat=r'.*?\s+\d+:\s+([\d.]+)').unstack(-1)

OUTPUT：

                   out_column   col1   col2
0  Out 0: 0.024 Out 1: 0.005   0.024  0.005
1  Out 0: 0.024 Out 1: 0.009   0.024  0.009
2  Out 0: 0.024 Out 1: 0.009   0.024  0.009
3   Out 0: 0.024 Out 1: 0.01   0.024   0.01
4   Out 0: 0.024 Out 1: 0.011  0.024  0.011
5  Out 0: 0.017 Out 1: 0.018   0.017  0.018
6  Out 0: 0.146 Out 1: 0.081   0.146  0.081
7  Out 0: 0.001 Out 1: 0.002   0.001  0.002
8  Out 0: 0.022 Out 1: 0.009   0.022  0.009
9   Out 0: 0.012 Out 1: 0.008  0.012  0.008

注意：如果需要，请使用df = df.drop('out_columns', 1) 。

Answer 2

使用带有Out 1和Out 2的常规模式，您可以执行str.extract并使用. 几次*

print(df['out_column'].str.extract('Out 0: (.*) Out 1: (.*)'))
       0      1
0  0.024  0.005
1  0.024  0.009
2  0.024  0.009
3  0.024   0.01

从 DataFrame 列中提取字符串数据以分隔列

问题描述

2 个解决方案

解决方案1
2 2021-06-02 20:13:44

解决方案2
1 已采纳 2021-06-02 20:17:47

从 DataFrame 列中提取字符串数据以分隔列

问题描述

2 个解决方案

解决方案1 2 2021-06-02 20:13:44

解决方案2 1 已采纳 2021-06-02 20:17:47

解决方案1
2 2021-06-02 20:13:44

解决方案2
1 已采纳 2021-06-02 20:17:47