[英]How can I plot separate Pandas DataFrames as subplots?
我有几个 Pandas DataFrames 共享相同的值范围,但具有不同的列和索引。 调用df.plot()
时,我得到单独的绘图图像。 我真正想要的是将它们全部与子情节放在同一个情节中,但不幸的是,我未能提出解决方案,并且非常感谢一些帮助。
您可以使用 matplotlib 手动创建子图,然后使用ax
关键字在特定子图上绘制数据帧。 例如对于 4 个子图 (2x2):
import matplotlib.pyplot as plt
fig, axes = plt.subplots(nrows=2, ncols=2)
df1.plot(ax=axes[0,0])
df2.plot(ax=axes[0,1])
...
这里axes
是一个包含不同子图轴的数组,您可以通过索引axes
来访问一个。
如果你想要一个共享的 x 轴,那么你可以提供sharex=True
给plt.subplots
。
你可以看到例如在演示 joris 答案的文档中。 同样从文档中,您还可以在 pandas plot
函数中设置subplots=True
和layout=(,)
:
df.plot(subplots=True, layout=(1,2))
你也可以使用fig.add_subplot()
如在后所描述这需要副区格参数,如221,222,223,224,等等这里。 可以在这个 ipython notebook 中看到关于 pandas 数据框的很好的绘图示例,包括子图。
您可以使用熟悉的Matplotlib风格调用一个figure
和subplot
,但你只需指定当前使用轴plt.gca()
一个例子:
plt.figure(1)
plt.subplot(2,2,1)
df.A.plot() #no need to specify for first axis
plt.subplot(2,2,2)
df.B.plot(ax=plt.gca())
plt.subplot(2,2,3)
df.C.plot(ax=plt.gca())
等等...
您可以使用 matplotlib 绘制多个 pandas 数据帧的多个子图,并使用一个简单的技巧来制作所有数据帧的列表。 然后使用 for 循环绘制子图。
工作代码:
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
# dataframe sample data
df1 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df2 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df3 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df4 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df5 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df6 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
#define number of rows and columns for subplots
nrow=3
ncol=2
# make a list of all dataframes
df_list = [df1 ,df2, df3, df4, df5, df6]
fig, axes = plt.subplots(nrow, ncol)
# plot counter
count=0
for r in range(nrow):
for c in range(ncol):
df_list[count].plot(ax=axes[r,c])
count+=1
使用此代码,您可以在任何配置中绘制子图。 您需要定义的行数nrow
和列数ncol
。 此外,您需要制作要绘制的数据框df_list
列表。
你可以使用这个:
fig = plt.figure()
ax = fig.add_subplot(221)
plt.plot(x,y)
ax = fig.add_subplot(222)
plt.plot(x,z)
...
plt.show()
基于上面的@joris 响应,如果您已经建立了对子图的引用,您也可以使用该引用。 例如,
ax1 = plt.subplot2grid((50,100), (0, 0), colspan=20, rowspan=10)
...
df.plot.barh(ax=ax1, stacked=True)
假设:
cat
可能重叠,但所有数据帧可能不包含cat
所有值hue='cat'
由于正在迭代数据帧,因此不能保证每个绘图的颜色映射相同
'cat'
值创建自定义颜色图import pandas as pd
import numpy as np # used for random data
import random # used for random data
import matplotlib.pyplot as plt
from matplotlib.patches import Patch # for custom legend
import seaborn as sns
import math import ceil # determine correct number of subplot
# synthetic data
df_dict = dict()
for i in range(1, 7):
np.random.seed(i)
random.seed(i)
data_length = 100
data = {'cat': [random.choice(['A', 'B', 'C']) for _ in range(data_length)],
'x': np.random.rand(data_length),
'y': np.random.rand(data_length)}
df_dict[i] = pd.DataFrame(data)
# display(df_dict[1].head())
cat x y
0 A 0.417022 0.326645
1 C 0.720324 0.527058
2 A 0.000114 0.885942
3 B 0.302333 0.357270
4 A 0.146756 0.908535
# create color mapping based on all unique values of cat
unique_cat = {cat for v in df_dict.values() for cat in v.cat.unique()} # get unique cats
colors = sns.color_palette('husl', n_colors=len(unique_cat)) # get a number of colors
cmap = dict(zip(unique_cat, colors)) # zip values to colors
# iterate through dictionary and plot
col_nums = 3 # how many plots per row
row_nums = math.ceil(len(df_dict) / col_nums) # how many rows of plots
plt.figure(figsize=(10, 5)) # change the figure size as needed
for i, (k, v) in enumerate(df_dict.items(), 1):
plt.subplot(row_nums, col_nums, i) # create subplots
p = sns.scatterplot(data=v, x='x', y='y', hue='cat', palette=cmap)
p.legend_.remove() # remove the individual plot legends
plt.title(f'DataFrame: {k}')
plt.tight_layout()
# create legend from cmap
patches = [Patch(color=v, label=k) for k, v in cmap.items()]
# place legend outside of plot; change the right bbox value to move the legend up or down
plt.legend(handles=patches, bbox_to_anchor=(1.06, 1.2), loc='center left', borderaxespad=0)
plt.show()
这是一个工作的熊猫子图示例,其中模式是数据框的列名。
dpi=200
figure_size=(20, 10)
fig, ax = plt.subplots(len(modes), 1, sharex="all", sharey="all", dpi=dpi)
for i in range(len(modes)):
ax[i] = pivot_df.loc[:, modes[i]].plot.bar(figsize=(figure_size[0], figure_size[1]*len(modes)),
ax=ax[i], title=modes[i], color=my_colors[i])
ax[i].legend()
fig.suptitle(name)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.