[英]Correlation between two dataframes
有人问过类似的问题,但我没有看到清晰的答案。 原谅我再问一次。 我有两个数据帧,我只想要第一个数据帧与第二个数据帧中的每一列的相关性。 这是完全符合我要求的代码:
df1=pd.DataFrame( {'Y':np.random.randn(10) } )
df2=pd.DataFrame( {'X1':np.random.randn(10), 'X2':np.random.randn(10) ,'X3':np.random.randn(10) } )
for col in df2:
print df1['Y'].corr(df2[col])
但似乎我不应该在数据帧中循环。 我希望这么简单
df1.corr(df2)
应该完成工作。 有没有循环执行此功能的明确方法?
您可以使用corrwith
:
>>> df2.corrwith(df1.Y)
X1 0.051002
X2 -0.339775
X3 0.076935
dtype: float64
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.