簡體   English   中英

計算和可視化兩個無序序列中的變量之間的相關性

[英]Calculating and visualizing correlation between 2 variables which are in an unordered series

作為我最后一年研究工作的一部分,我試圖計算和可視化兩個不在有序序列中的變量之間的相關性。 在如下數據集中,

DateAndTime           Demand    Temperature
2015-01-02 18:00:00    2081         41
2015-01-02 19:00:00    2370         42
2015-01-02 20:00:00    2048         42
2015-01-02 21:00:00    1806         42
2015-01-02 22:00:00    1818         41
2015-01-02 23:00:00    1918         40
2015-01-03 00:00:00    1685         40
2015-01-03 01:00:00    1263         38
2015-01-03 02:00:00     969         38
2015-01-03 03:00:00     763         37
2015-01-03 04:00:00     622         36

由於日期和需求之間是有序序列,因此計算和可視化日期和需求之間的相關性非常簡單,並且可以使用散點圖輕松地顯示其相關性。 但是,如果我要計算溫度和需求之間的相關性,則得到的散點圖就沒有多大意義,因為它沒有任何數學順序。 應該使用哪種方法以更有意義的方式可視化這兩個變量之間的相關性。 我為此使用了基本的Python框架,例如Matplotlib,Statsmodels和Sklearn。

好的,這樣的想法是繪制兩個列,一個列在x軸上,另一個列在y軸上,並嘗試繪制一條模擬其行為的線。 Numpy具有計算線的功能,因此

import numpy as np
import matplotlib.pyplot as plt

x = [4,2,1,5]
y = [2,4,6,3]

fit = np.polyfit(x,y,1)
fit_line = np.poly1d(fit)

plt.figure()
plt.plot(x,y,'rx')
plt.plot(x,fit_line(x),'--b')
plt.show()

在此處輸入圖片說明

如果我們將回歸線設為y = a*x + b ,則可以獲得系數a和b,從而

a = fit[0]
b = fit[1]

哪個返回

a = -0.8000000000000005
b = 6.150000000000002

只需使用您的x和y

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM