簡體   English   中英

通過每個倉中數據的“標簽分數”對二維直方圖進行顏色顯示

[英]2D histogram colour by “label fraction” of data in each bin

接下來是在這里找到的帖子: 2D直方圖,每個分格中的標准偏差都帶有顏色

我想用標簽值低於Python中某個閾值的點的分數為2D網格中的每個bin着色。

請注意,在此數據集中,每個點的連續標簽值介於0-1之間。

例如,這是我制作的直方圖,其中顏色表示每個倉中所有點的標簽值的標准偏差:

在此處輸入圖片說明

這樣做的方式是通過使用

scipy.stats.binned_statistic_2d()

(請參閱: https : //docs.scipy.org/doc/scipy/reference/generated/scipy.stats.binned_statistic_2d.html

..並將統計參數設置為“ std”

但是,是否有一種方法可以更改這種圖,以使着色表示每個容器中點的分數,例如標簽值低於0.5?

可能唯一的方法是明確定義某種網格並計算分數,但是我不確定做到這一點的最佳方法,因此,對此問題的任何幫助將不勝感激!

也許使用scipy.stats.binned_statistic_2d或numpy.histogram2d並能夠將每個bin中的原始數據值作為多維數組返回,將有助於快速明確地計算分數。

低於閾值的數組中的元素比例可以計算為

fraction = lambda a, threshold: len(a[a<threshold])/len(a)

因此,您可以致電

scipy.stats.binned_statistic_2d(x, y, values, statistic=lambda a: fraction(a, 0.5)) 

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM