重新格式化奇怪的 Dataframe

Question

名稱	地方	pers_data
鈉	鈉	楠
史密斯約翰	紐約	sjohn@gmail.com
鈉	楠	0987 4567
鈉	鈉	0653 6734
維克斯蒂德	SA	0986 5332
鈉	鈉	vickie@hotmail.com

我想刪除 NaN 值並重新格式化文件，如下所示：

名稱	地方	pers_data	其他	other_2
史密斯約翰	紐約	sjohn@gmail.com	0987 4567	0653 6734
維克斯蒂德	SA	vickie@hotmail.com	0986 5332

有人可以幫我嗎，我嘗試了一些東西，但什么都不懂，我想真正了解自己在做什么。

Answer 1

這是pivot的變體：

idx = df['Name'].notna().cumsum()
out = (df
   .assign(col=df.groupby(idx).cumcount(),
           Name=df['Name'].groupby(idx).ffill(),
           place=df['place'].groupby(idx).ffill()
          )
   .pivot(index=['Name', 'place'], columns='col', values='pers_data')
   .add_prefix('other_').rename(columns={'other_0': 'pers_data'})
   .reset_index().rename_axis(columns=None)
   .dropna(how='all')
)

output：

         Name place        pers_data             other_1    other_2
1  Smith John    NY  sjohn@gmail.com           0987 4567  0653 6734
2   Vic Stied    SA        0986 5332  vickie@hotmail.com        NaN

Answer 2

df1.loc[~df1.isna().all(axis=1)].fillna(method='ffill')\
    .groupby(['Name','place']).agg(','.join)\
    .pers_data.str.split(',',expand=True).add_prefix('other_')\
    .rename(columns={'other_0':'pers_data'}).reset_index()
        
                Name place        pers_data             other_1    other_2
        0  Smith John    NY  sjohn@gmail.com           0987 4567  0653 6734
        1   Vic Stied    SA        0986 5332  vickie@hotmail.com       None

重新格式化奇怪的 Dataframe

問題描述

2 個解決方案

解決方案1
4 2022-08-26 09:40:04

解決方案2
0 2022-11-14 05:43:11

重新格式化奇怪的 Dataframe

問題描述

2 個解決方案

解決方案1 4 2022-08-26 09:40:04

解決方案2 0 2022-11-14 05:43:11

解決方案1
4 2022-08-26 09:40:04

解決方案2
0 2022-11-14 05:43:11