簡體   English   中英

日期、時間、分類變量和數值變量之間的相關性

[英]Correlation between date, time, categorical and numeric variables

我有一個非常大的數據集,其中包含所有類型的變量:日期、時間、分類和數值變量。 它是一個引用就業記錄的數據集。 我想知道它們之間是否存在相關變量。 我知道要制作一個正常的相關矩陣,我應該只使用標准化的數字變量,但事實並非如此。 還有其他選擇嗎?

唯一的方法是采取個別方法進行相關性分析。 時間變量可以被視為連續變量(至少在一些轉換之后)。 所以應該可以使用Pearson Product-Moment Correlation 對於分類數據,應區分名義數據和順序數據,其中順序數據顯示某種等級。 此處,可以應用Spearman 的秩相關肯德爾秩相關,為此數據必須至少是有序的。 名義數據應該通過列聯表等進行分析,也許還有一些更高級的相關性措施,如Tetrachoric Correlation ,以實際獲得某種相關系數 [...]。

我會熟悉不同的關聯方法、它們的用例和替代方案。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM