簡體   English   中英

python熊貓數據框的不規則合並

[英]Irregular binning of python pandas dataframe

我開始接觸python熊貓。

下面的玩具問題說明了我在相關練習中遇到的問題。

我對數據框進行了排序,以便它以升序顯示列的值(在本例中為學生的考試成績):

df_sorted = 
     variable    test_score
     1           52.0
     1           53.0
     4           54.0
     6           64.0
     6           64.0
     6           64.0
     5           71.0
     10          73.0
     15          75.0
     4           77.0

但是,我現在想通過2列(此處為“變量”和“ test_score”)對數據幀進行裝箱,但是對於從數據幀開始到結束的每個X條目。 這也將使我創建包含相等數量條目的垃圾箱(對於在相關練習中進行繪圖非常有用)。

因此,如果我每3行bin的輸出將如下所示:

df_sorted_binned = 
     variable    test_score
     2           53.0
     6           64.0
     10          73.0
     4           77.0

誰能看到我可以輕松做到這一點?

多謝!

只需對一個虛擬變量進行groupby該變量的值為groupby ,等等。這可以通過下限除法獲得:

>>> d.groupby(np.arange(len(d))//3).mean()
   variable  test_score
0         2          53
1         6          64
2        10          73
3         4          77

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM