繁体   English   中英

如何根据条件在 Pandas 中创建新列

[英]How Create new column in Pandas based on condition

快速愚蠢的问题-我确定之前有人问过这个问题,但无法提交详细信息。 我有一个数据框 df_students 如下 -

Student ID, Subjects ,  MArks_Received, Marks
222         English     3               90
222         Maths       3               80
222         Science     3               70
223         English     2               90
223         Maths       2               80
224         Maths       2               80

我正在寻找基于主题和接收条件的以下输出,如果每个学生的行数不匹配,则必须添加额外的 Colum (PENDING) 或 Received。

Student ID, Subjects ,  Expected_Rows, Marks, State
222         English     3               90    Received  
222         Maths       3               80    Received
222         Science     3               70    Received
223         English     2               90    Received
223         Maths       2               80    Received
224         Maths       2               80    PENDING

由于我有 "224" 的 Expected_Rows 2 ,但只收到了 1 ,我应该将其标记为“Pending”。

我能够汇总如下总分,但无法弄清楚如何添加状态。 任何帮助都值得赞赏。

聚合数据框

df_aggregate = df_students.groupby(['Student ', 'Marks'])['Marks'].agg(sum).reset_index()

有很多方法,请参阅下面是否有帮助:

添加一个新列'count' ,然后'State'基于:

df['Count'] = df.groupby('Student ID')['Student ID'].transform('count')
df['State'] = np.where(df['Count'] != df['MArks_Received'], 'PENDING','Received')

如果您不想添加新列,请使用以下内容:

df['State'] = np.where(df.groupby('Student ID')['Student ID'].transform('count') != df['MArks_Received'], 'PENDING','Received')

它考虑'Student ID'的计数与'Expected Rows'不匹配'Expected Rows'

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM