簡體   English   中英

Pandas 數據框條件均值

[英]Pandas dataframe conditional mean

我試圖找到給定數據集的懷孕期間吸煙的女性每天吸煙的平均數量。 目前,我正在嘗試

mean = data.groupby(['male', 'cigs']).mean()
print(mean)

這給了我每天吸每支煙的平均家庭收入(即每天 0 支、每天 2 支、每天 8 支等)。 我如何得到它,所以它是吸煙 >= 1 的人的平均家庭收入?

另外,這是我在堆棧上的第一篇文章,所以如果沒有足夠的細節,請原諒我。

我假設“ cigs ”是指每天抽的香煙數量。 您可以首先根據 cigs >=1 過濾數據,然后應用您正在執行的操作。

data_on_people_who_smoke = data[data.cigs >= 1]
mean = data_on_people_who_smoke.groupby(['male', 'cigs']).mean()
print(mean)
mean = data[data['cigs']>1]['income'].mean()
print (mean)

這為您提供了抽至少 1 支煙的所有受訪者收入的平均值。 不要按性別或香煙分組。 先過濾,取平均值。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM