[英]2D histogram colour by “label fraction” of data in each bin
接下來是在這里找到的帖子: 2D直方圖,每個分格中的標准偏差都帶有顏色
我想用標簽值低於Python中某個閾值的點的分數為2D網格中的每個bin着色。
請注意,在此數據集中,每個點的連續標簽值介於0-1之間。
例如,這是我制作的直方圖,其中顏色表示每個倉中所有點的標簽值的標准偏差:
這樣做的方式是通過使用
scipy.stats.binned_statistic_2d()
(請參閱: https : //docs.scipy.org/doc/scipy/reference/generated/scipy.stats.binned_statistic_2d.html )
..並將統計參數設置為“ std”
但是,是否有一種方法可以更改這種圖,以使着色表示每個容器中點的分數,例如標簽值低於0.5?
可能唯一的方法是明確定義某種網格並計算分數,但是我不確定做到這一點的最佳方法,因此,對此問題的任何幫助將不勝感激!
也許使用scipy.stats.binned_statistic_2d或numpy.histogram2d並能夠將每個bin中的原始數據值作為多維數組返回,將有助於快速明確地計算分數。
低於閾值的數組中的元素比例可以計算為
fraction = lambda a, threshold: len(a[a<threshold])/len(a)
因此,您可以致電
scipy.stats.binned_statistic_2d(x, y, values, statistic=lambda a: fraction(a, 0.5))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.