[英]Why is the linear regression wrong when I switch X and Y of a random variable Z(X, Y)?
[英]How to determine when x or y variable in linear regression diverges?
我正在為其他人建立交易算法。
我正在數據框的兩列上運行線性回歸。 數量和價格。
DF:
Volume Price
0 12.952941 8.534815
1 12.972921 8.544813
這就是我進行線性回歸的方式
from scipy.stats import linregress
lr = linregress( df['Volume'],df['Price'])
要求之一是確定何時價格從價格偏離或上升。
有什么辦法嗎? 我不確定如何確定這一點。
先感謝您。
我認為您應該使用相關性來做您描述的事情。
總之,相關性用於描述問題中兩個變量(例如數量和價格)之間的關系。 因此,每當您關聯變量時,都會返回-1和+1之間的數字。
通常,如果變量之間具有正相關關系(通常> 0.6),則表示當交易量增加時,價格也會增加。 另一方面,負相關(精確地接近-1的值),當變量增大時,另一個減小。
通常,只要發現相關性接近零,就可以說相關性很弱或沒有相關性。
此外,還有一些規則可以應用相關性。 通常,當您具有非高斯分布時,應使用Spearman相關。 具有高斯分布,可以使用Pearson相關。 要了解您的分布是否為高斯分布,可以使用Kolmogorov–Smirnov檢驗或Shapiro–Wilk檢驗。
還有另一個細節。 在計算相關性時,您必須驗證p值 ,該p值可量化有效的相關性概率。 通常,p值<0.05通常是可以接受的。 否則,您將無法得出有關關聯結果的任何信息。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.