[英]Pandas dataframe conditional mean
我試圖找到給定數據集的懷孕期間吸煙的女性每天吸煙的平均數量。 目前,我正在嘗試
mean = data.groupby(['male', 'cigs']).mean()
print(mean)
這給了我每天吸每支煙的平均家庭收入(即每天 0 支、每天 2 支、每天 8 支等)。 我如何得到它,所以它是吸煙 >= 1 的人的平均家庭收入?
另外,這是我在堆棧上的第一篇文章,所以如果沒有足夠的細節,請原諒我。
我假設“ cigs ”是指每天抽的香煙數量。 您可以首先根據 cigs >=1 過濾數據,然后應用您正在執行的操作。
data_on_people_who_smoke = data[data.cigs >= 1]
mean = data_on_people_who_smoke.groupby(['male', 'cigs']).mean()
print(mean)
mean = data[data['cigs']>1]['income'].mean()
print (mean)
這為您提供了抽至少 1 支煙的所有受訪者收入的平均值。 不要按性別或香煙分組。 先過濾,取平均值。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.