[英]Stacked Histograms of Grouped Data In pandas
假設我有一個數據框(df),其中包含很多值,包括X和Y兩列。我想創建一個堆疊的直方圖,其中每個bin是X中的分類值(例如A和B),並且每個bin內都是按Y中的值堆疊(例如a,b,c,...)。
我可以運行df.groupby([“ X”,“ Y”])。size()來獲得如下所示的輸出,但是如何從中獲得堆疊的直方圖呢?
A a 14
b 41
c 4
d 2
e 2
f 15
g 1
h 3
B a 18
b 37
c 1
d 3
e 1
f 17
g 2
所以,我想我已經解決了。 首先需要使用來堆疊數據; .unstack(等級= -1)
這將使它變成一個n×m的類似數組的結構,其中n是X個條目的數量,m是Y個條目的數量。 通過此表單,您可以按照此處提供的大綱進行操作: http : //pandas.pydata.org/pandas-docs/stable/visualization.html
因此,總的命令將是:
df.groupby(["X","Y"]).size().unstack(level=-1).plot(kind='bar',stacked=True)
有點兒笨拙的樣子!
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.