[英]Irregular binning of python pandas dataframe
我開始接觸python熊貓。
下面的玩具問題說明了我在相關練習中遇到的問題。
我對數據框進行了排序,以便它以升序顯示列的值(在本例中為學生的考試成績):
df_sorted =
variable test_score
1 52.0
1 53.0
4 54.0
6 64.0
6 64.0
6 64.0
5 71.0
10 73.0
15 75.0
4 77.0
但是,我現在想通過2列(此處為“變量”和“ test_score”)對數據幀進行裝箱,但是對於從數據幀開始到結束的每個X條目。 這也將使我創建包含相等數量條目的垃圾箱(對於在相關練習中進行繪圖非常有用)。
因此,如果我每3行bin的輸出將如下所示:
df_sorted_binned =
variable test_score
2 53.0
6 64.0
10 73.0
4 77.0
誰能看到我可以輕松做到這一點?
多謝!
只需對一個虛擬變量進行groupby
該變量的值為groupby
,等等。這可以通過下限除法獲得:
>>> d.groupby(np.arange(len(d))//3).mean()
variable test_score
0 2 53
1 6 64
2 10 73
3 4 77
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.