[英]How do I draw a histogram for a normal distribution using python matplotlib?
我的问题是 - 使用 NumPy 函数 np.random.randn 为 100,000 点的正态分布生成数据 x。 然后 plot 一个直方图。
我的计算是 -
x = sp.norm.pdf(np.random.randn(100000))
plt.hist(x, bins = 20, facecolor='blue', alpha=0.5)
有什么问题,因为我无法获得正态分布的直方图吗?
要从标准正态分布中获取 N 个随机样本,您可以使用np.random.randn(N)
或 scipy 的stats.norm.rvs(size=N)
。 然后这些样本可用于创建直方图。
要绘制曲线,可以使用stats.norm.pdf(y)
,其中y
是一系列后续 x 值。 这样的pdf
是归一化的,即 plot 下的面积为 1。直方图的总面积是样本数乘以 bin 的宽度(每个样本正好落在一个 bin 中)。 因此,将 pdf 乘以该因子会将其缩放到直方图的高度。
stats.norm.pdf(np.random.randn(N))
的结果将是 N 个随机样本的概率列表。 大多数样本最终会接近曲线的中心(在y = 0
处),其中 pdf 的高度约为0.40
。 这解释了该最大值附近的高峰值。
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
N = 100000
# x = np.random.randn(N)
x = stats.norm.rvs(size=N)
num_bins = 20
plt.hist(x, bins=num_bins, facecolor='blue', alpha=0.5)
y = np.linspace(-4, 4, 1000)
bin_width = (x.max() - x.min()) / num_bins
plt.plot(y, stats.norm.pdf(y) * N * bin_width)
plt.show()
'import numpy as np
import seaborn as sns
N = 1000
x = np.random.randn(N)
sns.histplot(x,bins=20,kde=True,color='red')'
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.