![](/img/trans.png)
[英]Remove all rows that contains the IDs in column1 that have at least one specific value on another specific column2 in a Python Dataframe
[英]Python : Fill a specific column with the same value in a Dataframe and remove the rows useless
假设我有这个数据框:
data3 = ['ID','ID','','','','','']
data4 = [12,34,465,678,896,'','']
data5 = [8798,67,2313,'','','','']
data6 = [56,67,'','','','','']
df2 = pd.DataFrame(list(zip(data3,data4,data5,data6)),columns = ['Name','Data1','Data2','Data3'])
print(df2)
Name Data1 Data2 Data3
0 ID 12 8798 56
1 ID 34 67 67
2 465 2313
3 678
4 896
5
6
我想用我们可以找到的始终相同的值填充“名称”列,并且对于所有有值的行,并在没有任何内容的地方删除无用的行。 所以我想得到这个结果:
Name Data1 Data2 Data3
0 ID 12 8798 56
1 ID 34 67 67
2 ID 465 2313
3 ID 678
4 ID 896
任何人都有一个想法可以有效地做到这一点?
谢谢
如果为空字符串,则使用DataFrame.replace
,而不是NaN
s,然后使用DataFrame.dropna
并通过ffill
最后向前填充Name
列中的缺失值:
df2 = df2.replace('', np.nan)
df2 = df2.dropna(how='all')
df2['Name'] = df2['Name'].ffill()
print(df2)
Name Data1 Data2 Data3
0 ID 12.0 8798.0 56.0
1 ID 34.0 67.0 67.0
2 ID 465.0 2313.0 NaN
3 ID 678.0 NaN NaN
4 ID 896.0 NaN NaN
您可以将df.replace
、 df.replace
isna()
与all
一起使用以在所有行中删除Nan
并使用ffill()
填充Nan
:
In [2731]: df2 = df2.replace('', np.nan)
In [2756]: df2 = df2[~df2.isna().all(1)]
In [2733]: df2.Name = df2.Name.ffill()
In [2758]: df2
Out[2758]:
Name Data1 Data2 Data3
0 ID 12.0 8798.0 56.0
1 ID 34.0 67.0 67.0
2 ID 465.0 2313.0 NaN
3 ID 678.0 NaN NaN
4 ID 896.0 NaN NaN
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.