繁体   English   中英

为 Pandas Dataframe Boxplot() 设置 y 轴比例,3 个偏差?

[英]Set y-axis scale for pandas Dataframe Boxplot(), 3 Deviations?

我正在尝试每月制作一个单独的箱线图区域,其中包含按行业分组(并标记)的不同箱线图,然后让 Y 轴使用我指定的比例。

在完美的世界中,这将是动态的,我可以将轴设置为与总体平均值相差一定数量的标准差。 我可以接受另一种类型的动态设置 y 轴,但我希望它成为所有创建的“每月”分组箱线图的标准。 我不知道处理这个问题的最佳方法是什么并且对智慧持开放态度 - 我所知道的是现在使用的数字太大了,图表才有意义。

我已经尝试了各种代码,并且在轴的缩放方面运气为零,下面的代码与我可以得出的图形非常接近。

这是一些虚拟数据的链接: https : //drive.google.com/open?id=0B4xdnV0LFZI1MmlFcTBweW82V0k

对于我使用 Python 3.5 的代码:

import pandas as pd
import numpy as np
import matplotlib
import matplotlib.pyplot as plt
matplotlib.use('TkAgg')
import pylab    
df =  pd.read_csv('Query_Final_2.csv')
df['Ship_Date'] = pd.to_datetime(df['Ship_Date'], errors = 'coerce')
df1 = (df.groupby('Industry'))
print(
df1.boxplot(column='Gross_Margin',layout=(1,9), figsize=(20,10), whis=[5,95])
,pylab.show()
)

这是带有解决方案的代码的清理版本:

import pandas as pd
import matplotlib.pyplot as plt

df =  pd.read_csv('Query_Final_2.csv')
df['Ship_Date'] = pd.to_datetime(df['Ship_Date'], errors = 'coerce')
df1 = df.groupby('Industry')

axes = df1.boxplot(column='Gross_Margin',layout=(1,9), figsize=(20,10),
                   whis=[5,95], return_type='axes')
for ax in axes.values():
    ax.set_ylim(-2.5, 2.5)

plt.show()

关键是将子图作为轴对象返回并单独设置限制。

为均值和标准差建立变量后,请使用:

plt.ylim(ymin, ymax)

设置y轴。

谢谢@Padraig,请注意,如果您使用 plt 作为没有子图的图形,您可以使用:

plt.ylim(ymin, ymax)

但是,如果您想调整一个子图的 Y 轴,则此方法有效(@AlexG)

ax.set_ylim(ymin, ymax)

例如,如果您的子图是 ax2,并且您希望 Y 轴从 0.5 到 1.0,您的代码将如下所示:

ax2.set_ylim(0.5, 1.0)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM