簡體   English   中英

查找兩個不同數據框中兩個列之間的相關性

[英]Find correlation between two columns in two different dataframes

我有兩個數據框,每個數據框都有一個ID列,每個ID都有一個帶時間戳的日期列和一個Value列。 現在,我想以這種方式找到每個數據集的值之間的相關性:數據集1包含患有特定疾病的人的所有值,而數據集2中有DIDN未感染疾病的人的值。 現在,使用corr函數:

    corr = df1['val'].corr(df2['val'])

我的結果是0.1472,並且非常低(太多),這意味着它們之間沒有任何相關性。 我在某件事上錯了嗎? 如何計算相關性? 有沒有一種方法可以找到一種價值(也許是一條線),在該價值之后人們會患上疾病? 我想使用機器學習技術(SVM)進行嘗試,但是首先擁有類似我之前解釋的部分會很好。 我怎樣才能做到這一點? 謝謝

可能您的相關性較低是由於觀測值的索引或順序

您是否嘗試過通過ID進行左聯接?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM