繁体   English   中英

如何确定线性回归中的x或y变量何时发散?

[英]How to determine when x or y variable in linear regression diverges?

我正在为其他人建立交易算法。

我正在数据框的两列上运行线性回归。 数量和价格。

DF:

   Volume     Price
0  12.952941  8.534815
1  12.972921  8.544813

这就是我进行线性回归的方式

from scipy.stats import linregress

lr = linregress( df['Volume'],df['Price'])

要求之一是确定何时价格从价格偏离或上升。

有什么办法吗? 我不确定如何确定这一点。

先感谢您。

我认为您应该使用相关性来做您描述的事情。

总之,相关性用于描述问题中两个变量(例如数量和价格)之间的关系。 因此,每当您关联变量时,都会返回-1和+1之间的数字。

通常,如果变量之间具有正相关关系(通常> 0.6),则表示当交易量增加时,价格也会增加。 另一方面,负相关(精确地接近-1的值),当变量增大时,另一个减小。

通常,只要发现相关性接近零,就可以说相关性很弱或没有相关性。

此外,还有一些规则可以应用相关性。 通常,当您具有非高斯分布时,应使用Spearman相关。 具有高斯分布,可以使用Pearson相关。 要了解您的分布是否为高斯分布,可以使用Kolmogorov–Smirnov检验或Shapiro–Wilk检验。

还有另一个细节。 在计算相关性时,您必须验证p值 ,该p值可量化有效的相关性概率。 通常,p值<0.05通常是可以接受的。 否则,您将无法得出有关关联结果的任何信息。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM