簡體   English   中英

如何用Python中的2D散點圖數據創建熱圖?

[英]How can one create a heatmap from a 2D scatterplot data in Python?

如何使用Python中的2D散點圖數據創建熱圖,其中散點圖中的每個(x,y)點都具有與之關聯的z值? z值將是用於為熱圖着色的值。


例如,在R中,我可以使用:

# This example is from http://knowledge-forlife.com/r-creating-heatmap-scatterplot-data/
#I'm just setting the seed so you can see the same example on your computer
set.seed(1)

#Our X data
x <- runif(150)

#Our Y data
y <- runif(150)

#Our Z data
z <- c(rnorm(mean=1,100),rnorm(mean=20,50))

#Store the length of our data
N <- length(x)

# View the scatterplot
plot(x, y)

#Here is the interpolation to give the heatmap effect. 
#Use xo and yo to set the output grid you want to use.
#xo and yo are used to change the resolution of the interpolation
#Here, I have included a somewhat standard protocol for these parameters
s <- interp(x,y,z,xo=seq(min(x),max(x),length=N),
            yo=seq(min(x),max(x),length=N),duplicate="mean")

#Here's where the fun happens
#Note you can add your typical plotting paramaters here, such as xlab or ylab
image.plot(s,xlim=c(0,1),ylim=c(0,1),zlim=c(-2,25))

散點圖(此散點圖中的每個(x,y)點都具有與之關聯的z值; z值在散點圖中不可見):

在此處輸入圖片說明

對應的熱圖(顏色代表z值):

在此處輸入圖片說明

請注意,此問題與使用散點數據集在MatPlotLib中生成熱圖不同,其中,熱圖中的顏色表示(x,y)點的密度)。

我接受了Gerges Dib的建議。 這是代碼,是從3D高斯分布中采樣(x,y,z)點的代碼:

import numpy as np
import scipy.interpolate
from scipy.stats import multivariate_normal
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()

# Sample from 3D Gaussian distribution
np.random.seed(0)
number_of_samples = 20
x = np.random.rand(number_of_samples)
y = np.random.rand(number_of_samples)
xy = np.column_stack([x.flat, y.flat]) # Create a (N, 2) array of (x, y) pairs.
mu = np.array([0.0, 0.0])
sigma = np.array([.95, 2.5])
covariance = np.diag(sigma**2)
z = multivariate_normal.pdf(xy, mean=mu, cov=covariance)

plt.scatter(x, y)
plt.savefig('scatterplot.png', dpi=300)

plt.tricontourf(x, y, z)
plt.savefig('tricontourf.png', dpi=300)

# Interpolate and generate heatmap:
grid_x, grid_y = np.mgrid[x.min():x.max():1000j, y.min():y.max():1000j]
for method in ['nearest','linear','cubic'] :
    plt.figure()
    grid_z = scipy.interpolate.griddata(xy,z,(grid_x, grid_y), method=method)
    # [pcolormesh with missing values?](https://stackoverflow.com/a/31687006/395857)
    import numpy.ma as ma
    plt.pcolormesh(grid_x, grid_y, ma.masked_invalid(grid_z), cmap='RdBu', vmin=np.nanmin(grid_z), vmax=np.nanmax(grid_z))
    plt.title('{0} interpolation'.format(method))
    plt.colorbar()
    plt.savefig('heatmap_interpolation_{0}.png'.format(method), dpi=300)
    plt.clf()
    plt.close()

scatterplot.png:

在此處輸入圖片說明

tricontourf.png:

在此處輸入圖片說明

heatmap_interpolation_nearest.png

在此處輸入圖片說明

heatmap_interpolation_linear.png:

在此處輸入圖片說明

heatmap_interpolation_cubic.png:

在此處輸入圖片說明

這是將代碼轉換為python的代碼,使用numpy進行矢量操作,使用matplotlib進行繪圖:

import numpy as np
from matplotlib import pyplot

x = np.random.uniform(size=150)
y = np.random.uniform(size=150)
z = np.concatenate([np.random.randn(100)+1, np.random.randn(50)+20])

pyplot.plot(x, y, 'ok')
pyplot.tricontourf(x, y, z)
pyplot.show()

此處的一個區別是,我沒有使用插值將x和y放置在網格上,而是使用了matplotlibtricontourf ,它使用了三角鑲嵌。 如果需要將數據放在矩形網格上,則可以使用scipy.interpolate.griddata ,它的工作原理與R中的interp函數非常相似。然后,要繪制常規網格,可以使用pyplot.pcolormesh

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM