使用Pandas从数据框的所有项中删除字符串

Question

我有一个像这样的数据帧df ：

dic = {'A':['pap','cdf\nsdc','ert','dgx','kll\nsrw','sdq'],
      'B':[1,4,6,2,5,6],
      'C':['123\n12','34','55','321\n88','09','45']}
df = pd.DataFrame(dic)

我的目标是从所有列中删除由\\n形成的字符串以及在它之前的任何内容： abc\\ndef ---> def

我能够通过使用以下代码行来实现我的目标：

for index,row in df.iterrows():
    df['A'][index]=row['A'].split('\n')[-1]
    df['C'][index]=row['C'].split('\n')[-1]

但是，我希望有一种更智能，更紧凑的方式来实现这样的结果。 你能否建议一种比我更优雅的方式（也许一些oneliner）？

注意： B列是浮动的！

Answer 1

你可以在cols上使用str.split ，如果你有一个更复杂的例子，那么你需要根据dtype过滤感兴趣的cols：

In [135]:
df['A'] = df['A'].str.split('\n').str[-1]
df['C'] = df['C'].str.split('\n').str[-1]
df

Out[135]:
     A  B   C
0  pap  1  12
1  sdc  4  34
2  ert  6  55
3  dgx  2  88
4  srw  5  09
5  sdq  6  45

动态方法：

In [142]:
str_cols = df.select_dtypes([np.object]).columns
str_cols

Out[142]:
Index(['A', 'C'], dtype='object')

In [143]:    
for col in str_cols:
    df[col] = df[col].str.split('\n').str[-1]

df

Out[143]:
     A  B   C
0  pap  1  12
1  sdc  4  34
2  ert  6  55
3  dgx  2  88
4  srw  5  09
5  sdq  6  45

使用Pandas从数据框的所有项中删除字符串

问题描述

1 个解决方案

解决方案1
4 已采纳 2016-12-14 14:20:18

使用Pandas从数据框的所有项中删除字符串

问题描述

1 个解决方案

解决方案1 4 已采纳 2016-12-14 14:20:18

解决方案1
4 已采纳 2016-12-14 14:20:18