Python：在数据框中用相同的值填充特定列并删除无用的行

Question

假设我有这个数据框：

data3 = ['ID','ID','','','','','']
data4 = [12,34,465,678,896,'','']
data5 = [8798,67,2313,'','','','']
data6 = [56,67,'','','','','']

df2 = pd.DataFrame(list(zip(data3,data4,data5,data6)),columns = ['Name','Data1','Data2','Data3'])
print(df2)

  Name Data1 Data2 Data3
0   ID    12  8798    56
1   ID    34    67    67
2        465  2313
3        678
4        896
5
6

我想用我们可以找到的始终相同的值填充“名称”列，并且对于所有有值的行，并在没有任何内容的地方删除无用的行。 所以我想得到这个结果：

  Name Data1 Data2 Data3
0   ID    12   8798   56
1   ID    34   67     67
2   ID    465  2313
3   ID    678
4   ID    896

任何人都有一个想法可以有效地做到这一点？

谢谢

Answer 1

如果为空字符串，则使用DataFrame.replace ，而不是NaN s，然后使用DataFrame.dropna并通过ffill最后向前填充Name列中的缺失值：

df2 = df2.replace('', np.nan)

df2 = df2.dropna(how='all')
df2['Name'] = df2['Name'].ffill()
print(df2)
  Name  Data1   Data2  Data3
0   ID   12.0  8798.0   56.0
1   ID   34.0    67.0   67.0
2   ID  465.0  2313.0    NaN
3   ID  678.0     NaN    NaN
4   ID  896.0     NaN    NaN

Answer 2

您可以将df.replace 、 df.replace isna()与all一起使用以在所有行中删除Nan并使用ffill()填充Nan ：

In [2731]: df2 = df2.replace('', np.nan)
In [2756]: df2 = df2[~df2.isna().all(1)]
In [2733]: df2.Name = df2.Name.ffill()

In [2758]: df2
Out[2758]: 
  Name  Data1   Data2  Data3
0   ID   12.0  8798.0   56.0
1   ID   34.0    67.0   67.0
2   ID  465.0  2313.0    NaN
3   ID  678.0     NaN    NaN
4   ID  896.0     NaN    NaN

Python：在数据框中用相同的值填充特定列并删除无用的行

问题描述

2 个解决方案

解决方案1
2 已采纳 2020-10-28 10:08:31

解决方案2
1 2020-10-28 10:08:57

Python：在数据框中用相同的值填充特定列并删除无用的行

问题描述

2 个解决方案

解决方案1 2 已采纳 2020-10-28 10:08:31

解决方案2 1 2020-10-28 10:08:57

解决方案1
2 已采纳 2020-10-28 10:08:31

解决方案2
1 2020-10-28 10:08:57