从字符串中提取元素作为列Pandas

Question

我有一个数据集，如下所示

clean.list_raw_id.head(3)
0    {5177, 5178}
1    {2653, 2655}
2          {2793}

我想添加一个值为5177、2653和2793的列

我如何在python中做到这一点

我正在尝试在列上使用apply，但无法正常工作

我能够使用以下代码提取元素

[e.strip('{}') for e in clean.list_raw_id[1].split('},{')]

Answer 1

将pd.Series.str与apply一起apply 。 给定df ：

          data
0  {5177,5178}
1  {2653,2655}
2       {2793}

df.data = df.data.str.findall("\d+").apply(lambda x:x[0])
print(df)
   data
0  5177
1  2653
2  2793

Answer 2

使用Series.str.extract获得第一个数值：

df.data = df.data.str.extract("(\d+)")
print (df)
   data
0  5177
1  2653
2  2793

Answer 3

df = pd.DataFrame(data={'vals': [{5177, 5178}, {2653, 2655}, {2793}]})

df['new_col'] = df['vals'].apply(lambda x: list(x)[0])

回报

           vals  new_col
0  {5177, 5178}     5177
1  {2653, 2655}     2653
2        {2793}     2793

从字符串中提取元素作为列Pandas

问题描述

3 个解决方案

解决方案1
1 2019-02-26 08:56:01

解决方案2
1 已采纳 2019-02-26 08:59:50

解决方案3
0 2019-02-26 08:55:00

从字符串中提取元素作为列Pandas

问题描述

3 个解决方案

解决方案1 1 2019-02-26 08:56:01

解决方案2 1 已采纳 2019-02-26 08:59:50

解决方案3 0 2019-02-26 08:55:00

解决方案1
1 2019-02-26 08:56:01

解决方案2
1 已采纳 2019-02-26 08:59:50

解决方案3
0 2019-02-26 08:55:00