[英]Label Points in Seaborn lmplot (python) with multiple plots
我正在尝试向lmplot中的每个数据点添加标签。 我想用索引标记每个数据点。 现在,我的代码如下:
p1=sns.lmplot(x="target", y="source", col="color", hue="color",
data=ddf, col_wrap=2, ci=None, palette="muted",
scatter_kws={"s": 50, "alpha": 1})
def label_point(x, y, val, ax):
a = pd.concat({'x': x, 'y': y, 'val': val}, axis=1)
for i, point in a.iterrows():
ax.text(point['x']+.02, point['y'], str(point['val']))
label_point(ddf.target, ddf.source, ddf.chip, plt.gca())
这会将所有标签绘制到最后一个图上。
我尝试使用label_point(ddf.target, ddf.source, ddf.chip, plt.gcf())
而不是使用整个图形而不是当前轴,但是会引发错误。
ValueError: Image size of 163205x147206 pixels is too large.
It must be less than 2^16 in each direction.
问题是,如果将整个数据集传递给标签功能,标签功能应如何知道要标记哪个图?
例如,您可以使用pandas的.groupby
遍历唯一的颜色,并为每个颜色创建一个seaborn.regplot
。 这样就很容易分别标记每个轴。
import matplotlib.pyplot as plt
import numpy as np; np.random.seed(42)
import pandas as pd
import seaborn as sns
def label_point(df, ax):
for i, point in df.iterrows():
ax.annotate("{:.1f}".format(point['val']), xy = (point['x'], point['y']),
xytext=(2,-2), textcoords="offset points")
df = pd.DataFrame({"x": np.sort(np.random.rand(50)),
"y": np.cumsum(np.random.randn(50)),
"val" : np.random.randint(10,31, size=50),
"color" : np.random.randint(0,3,size=50 )})
colors = ["crimson", "indigo", "limegreen"]
fig, axes = plt.subplots(2,2, sharex=True, sharey=True)
for (c, grp), ax in zip(df.groupby("color"), axes.flat):
sns.regplot(x="x", y="y", data=grp, color=colors[c], ax=ax,
scatter_kws={"s": 25, "alpha": 1})
label_point(grp, ax)
axes.flatten()[-1].remove()
plt.show()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.