![](/img/trans.png)
[英]Remove all rows that contains the IDs in column1 that have at least one specific value on another specific column2 in a Python Dataframe
[英]Python : Fill a specific column with the same value in a Dataframe and remove the rows useless
假設我有這個數據框:
data3 = ['ID','ID','','','','','']
data4 = [12,34,465,678,896,'','']
data5 = [8798,67,2313,'','','','']
data6 = [56,67,'','','','','']
df2 = pd.DataFrame(list(zip(data3,data4,data5,data6)),columns = ['Name','Data1','Data2','Data3'])
print(df2)
Name Data1 Data2 Data3
0 ID 12 8798 56
1 ID 34 67 67
2 465 2313
3 678
4 896
5
6
我想用我們可以找到的始終相同的值填充“名稱”列,並且對於所有有值的行,並在沒有任何內容的地方刪除無用的行。 所以我想得到這個結果:
Name Data1 Data2 Data3
0 ID 12 8798 56
1 ID 34 67 67
2 ID 465 2313
3 ID 678
4 ID 896
任何人都有一個想法可以有效地做到這一點?
謝謝
如果為空字符串,則使用DataFrame.replace
,而不是NaN
s,然后使用DataFrame.dropna
並通過ffill
最后向前填充Name
列中的缺失值:
df2 = df2.replace('', np.nan)
df2 = df2.dropna(how='all')
df2['Name'] = df2['Name'].ffill()
print(df2)
Name Data1 Data2 Data3
0 ID 12.0 8798.0 56.0
1 ID 34.0 67.0 67.0
2 ID 465.0 2313.0 NaN
3 ID 678.0 NaN NaN
4 ID 896.0 NaN NaN
您可以將df.replace
、 df.replace
isna()
與all
一起使用以在所有行中刪除Nan
並使用ffill()
填充Nan
:
In [2731]: df2 = df2.replace('', np.nan)
In [2756]: df2 = df2[~df2.isna().all(1)]
In [2733]: df2.Name = df2.Name.ffill()
In [2758]: df2
Out[2758]:
Name Data1 Data2 Data3
0 ID 12.0 8798.0 56.0
1 ID 34.0 67.0 67.0
2 ID 465.0 2313.0 NaN
3 ID 678.0 NaN NaN
4 ID 896.0 NaN NaN
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.